CN114934056A - 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗 - Google Patents

一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗 Download PDF

Info

Publication number
CN114934056A
CN114934056A CN202210724687.8A CN202210724687A CN114934056A CN 114934056 A CN114934056 A CN 114934056A CN 202210724687 A CN202210724687 A CN 202210724687A CN 114934056 A CN114934056 A CN 114934056A
Authority
CN
China
Prior art keywords
leu
cov
sars
val
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210724687.8A
Other languages
English (en)
Other versions
CN114934056B (zh
Inventor
岑山
王静
张永欣
马铃
董翊洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renjing Suzhou Biotechnology Co ltd
Original Assignee
Renjing Suzhou Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renjing Suzhou Biotechnology Co ltd filed Critical Renjing Suzhou Biotechnology Co ltd
Priority to CN202210724687.8A priority Critical patent/CN114934056B/zh
Publication of CN114934056A publication Critical patent/CN114934056A/zh
Application granted granted Critical
Publication of CN114934056B publication Critical patent/CN114934056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/08Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite containing oxygen, e.g. ethers, acetals, ketones, quinones, aldehydes, peroxides
    • A61K47/10Alcohols; Phenols; Salts thereof, e.g. glycerol; Polyethylene glycols [PEG]; Poloxamers; PEG/POE alkyl ethers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/08Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite containing oxygen, e.g. ethers, acetals, ketones, quinones, aldehydes, peroxides
    • A61K47/14Esters of carboxylic acids, e.g. fatty acid monoglycerides, medium-chain triglycerides, parabens or PEG fatty acid esters
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/24Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite containing atoms other than carbon, hydrogen, oxygen, halogen, nitrogen or sulfur, e.g. cyclomethicone or phospholipids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/06Organic compounds, e.g. natural or synthetic hydrocarbons, polyolefins, mineral oil, petrolatum or ozokerite
    • A61K47/28Steroids, e.g. cholesterol, bile acids or glycyrrhetinic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/10Dispersions; Emulsions
    • A61K9/127Liposomes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Virology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Dispersion Chemistry (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明公开了一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗。本发明提供了一种RNA分子,包括编码SARS‑CoV‑2的抗原性多肽或者免疫原性片段的核酸序列;其中,所述抗原性多肽或所述免疫原性片段选自SARS‑CoV‑2的S蛋白或其变体、SARS‑CoV‑2的受体结合结构域或其变体;所述SARS‑CoV‑2的S蛋白的变体与所述SARS‑CoV‑2的S蛋白的原始序列相比,存在如下突变位点:K983P和V984P。本发明所提供的RNA疫苗能够有效的诱导冠状病毒抗原特异性免疫应答,产生针对SARS‑CoV‑2病毒的中和抗体滴度,本发明对于预防或治疗冠状病毒感染,特别是预防或治疗SARS‑CoV‑2Omicron变异病毒的感染具有重要意义。

Description

一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗
技术领域
本发明涉及生物技术领域,具体涉及一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗。
背景技术
2019新型冠状病毒(SARS-CoV-2)是以前从未在人体中发现的冠状病毒新毒株,该病毒为第七个可以感染人的冠状病毒(CoV)。人感染SARS-CoV-2的潜伏期一般为 1~14天,感染后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等。在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡。
新冠病毒是正义单链RNA((+)ssRNA)包膜病毒,编码4种结构蛋白:刺突蛋白 (S)、包膜蛋白(E)、膜蛋白(M)和核壳蛋白(N)。S蛋白分为S1和S2两个子结构域,S1结构域负责识别病毒特异性受体并结合至宿主细胞,S2具有跨膜结构域,负责膜融合。SARS-CoV-2Omicron变异病毒株于2021年11月在南非被首次报告,后已传播至少159个国家和地区,成为全球主要流行的病毒变异株,而基于早期流行株研发的新冠疫苗针对SARS-CoV-2Omicron变异病毒株的中和能力均存在显著下降。
目前上市和在研的新型冠状病毒疫苗主要包括mRNA疫苗、灭活疫苗、腺病毒载体疫苗、DNA疫苗、重组蛋白疫苗等。mRNA疫苗是将体外转录的mRNA递送至细胞,翻译产生蛋白,进而激发机体的特异免疫应答。mRNA疫苗不同于其他的核酸疫苗,不需要入核仅在细胞质中完成表达,因此没有造成宿主基因组插入突变的风险。此外, mRNA的快速、简易制备方法和低成本也是作为疫苗的优势之一,大大缩短了应对突发感染性疾病的反应时间,降低了防控成本。
发明内容
本发明的目的是提供一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗。
鉴于S蛋白在宿主细胞识别和进入以及宿主免疫系统诱导病毒中和抗体中的重要性,本发明将SARS-CoV-2的S蛋白用于疫苗开发。S蛋白的融合前构象对建立有效的免疫系统至关重要,因此为开发更有针对性的mRNA疫苗,本发明选取了Omicron 病毒株的S蛋白以及在此基础上进行的特定脯氨酸位点的替代变体,分别得到 Omicron S,Omicron S-2P(K983P,V984P)和Omicron S-6P(F814P,A889P,A896P,A939P,K983P,V984P)的抗原序列。
第一方面,本发明提供一种RNA分子。
本发明提供的RNA分子,包括编码SARS-CoV-2的抗原性多肽或者免疫原性片段的核酸序列(如可为开放阅读框);其中,所述抗原性多肽或所述免疫原性片段选自 SARS-CoV-2的S蛋白或其变体、SARS-CoV-2的受体结合结构域(RBD)或其变体。
所述SARS-CoV-2的S蛋白的变体与所述SARS-CoV-2的S蛋白的原始序列相比,存在如下突变位点:K983P和V984P。以K983P为例,表示将所述SARS-CoV-2的S蛋白的原始序列的第983位(对应SEQ ID No.1的第983位)的氨基酸残基由K突变为 P。其余突变位点表示法同理。
进一步地,所述SARS-CoV-2是SARS-CoV-2Omicron变异病毒株。
在本发明的一些案例中,所述SARS-CoV-2的S蛋白的变体与所述SARS-CoV-2的 S蛋白的原始序列相比,还存在如下突变位点中的全部或部分:F814P、A889P、A896P、 A939P。
在所述抗原性多肽或者所述免疫原性片段中,可包含一个或多个免疫原性表位。例如,至少2个,至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,至少10个或更多个免疫原性表位。
进一步地,所述抗原性多肽或者所述免疫原性片段可为如下任一:
(A1)SARS-CoV-2Omicron变异病毒株的S蛋白;
(A2)SARS-CoV-2Omicron变异病毒株的S蛋白变体Omicron S-2P,其氨基酸序列与所述SARS-CoV-2Omicron变异病毒株的S蛋白的原始序列相比,仅存在K983P 和V984P两个突变位点;
(A3)SARS-CoV-2Omicron变异病毒株的S蛋白变体Omicron S-6P,其氨基酸序列与所述SARS-CoV-2Omicron变异病毒株的S蛋白的原始序列相比,仅存在F814P、 A889P、A896P、A939P、K983P和V984P六个突变位点。
在(A2)-(A3)中,所述SARS-CoV-2Omicron变异病毒株的S蛋白变体的突变位置相对应的原始序列为含有信号肽的序列(如SEQ ID No.1)。
(A4)SEQ ID No.1的第17-1270位或SEQ ID No.2的第17-1270位或SEQ ID No.3的第17-1270位所示多肽;
(A5)与(A4)所限定的氨基酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性的多肽。
相应地,编码所述抗原性多肽或者所述免疫原性片段的RNA序列为如下任一:
(B1)将SEQ ID No.4的第49-3810位或SEQ ID No.5的第49-3810位或SEQ ID No.6的第49-3810位核苷酸中的T替换为U后所得核苷酸序列;
(B2)与(B1)所限定的核苷酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性。
其中,SEQ ID No.1的第17-1270位所示多肽为不含信号肽的SARS-CoV-2 Omicron变异病毒株的S蛋白的原始序列(由SEQ ID No.4的第49-3810位编码得到);SEQ ID No.2的第17-1270位所示多肽为不含信号肽的Omicron S-2P(由SEQ ID No.5 的第49-3810位编码得到);SEQ ID No.3的第17-1270位所示多肽为不含信号肽的 Omicron S-6P(由SEQ IDNo.6的第49-3810位编码得到)。
在一些实施方案中,编码所述抗原性多肽或者所述免疫原性片段的核酸序列还包含用于编码分泌信号肽的核酸序列。
进一步地,编码所述分泌信号肽的核酸序列位于编码所述抗原性多肽或者所述免疫原性片段的核酸序列的5’端。
进一步地,所述分泌信号肽可为如下任一:
(C1)SARS-CoV-2(如SARS-CoV-2Omicron变异病毒株)的S蛋白的分泌信号肽;
(C2)SEQ ID No.1的第1-16位或SEQ ID No.2的第1-16位或SEQ ID No.3的第1-16位所示多肽;
(C3)与(C2)所限定的氨基酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性的多肽。
相应地,编码所述分泌信号肽的RNA序列可选自如下任一:
(D1)将SEQ ID No.4的第1-48位或SEQ ID No.5的第1-48位或SEQ ID No.6 的第1-48位核苷酸中的T替换为U后所得核苷酸序列;
(D2)与(D1)所限定的核苷酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性。
在一些实施方案中,所述RNA分子可为mRNA、环状RNA(cRNA)或自复制RNA(saRNA)。其中,所述RNA分子适合多肽的细胞内表达。
在一些实施方案中,所述RNA分子为经过修饰的RNA分子。进一步地,所述修饰是通过用修饰的尿苷残基取代一些或全部尿苷残基。更进一步地,所述修饰的尿苷可以是N1-甲基-假尿苷。
在一些实施方案中,所述RNA分子还可包括一个或多个能够促进稳定性和/或翻译效率的结构元件。进一步地,所述结构元件可包括:5’帽、5’UTR、3’UTR和/ 或polyA尾。
更进一步地,所述5’帽可以是或包含cap1结构;更加具体地,所述5’帽是 m7G(5’)ppp(5’)(2’-OMeA)pG。
更进一步地,所述5'-UTR可以是人β-珠蛋白mRNA的5'-UTR序列;所述5'-UTR 可以具有Kozak序列。更加具体地,所述5’UTR可包含或为SEQ ID No.7所示核苷酸序列,或与SEQID No.7所示核苷酸序列具有至少99%、98%、97%、96%、95%、90%、 85%或80%同源性的核苷酸序列。
更进一步地,所述3'-UTR可以是人β-珠蛋白mRNA的两个重复的3'-UTR。更加具体地,所述3’UTR可以包含或为SEQ ID No.8所示核苷酸序列,或与SEQ ID No.8 所示核苷酸序列具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性的核苷酸序列。
更进一步地,所述polyA尾可以包含至少50、至少60或至少100个腺嘌呤核糖核苷酸;更加具体地,所述polyA尾可以包含或为SEQ ID No.9所示核苷酸序列,或由SEQ IDNo.9所示核苷酸序列组成。
在本发明的具体实施方式中,所述RNA分子的序列为如下任一:
(E1)SEQ ID No.10或SEQ ID No.11SEQ ID No.12;
(E2)与(E1)所限定的核苷酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性。
第二方面,本发明要求保护如下任一生物材料:
(F1)能够转录得到前文第一方面所述RNA分子的DNA分子;
(F2)含有(F1)中所述DNA分子的表达盒或重组载体或重组菌或重组细胞系。
第三方面,本发明要求保护一种用于预防和/或治疗新冠病毒感染的组合物。
本发明要求保护的组合物包含前文第一方面所述的RNA分子。
在一些实施方案中,所述组合物可配制为或待配制为液体、固体或其组合。进一步地,所述组合物配制为或待配制为用于注射或其他给药方式。更进一步地,所述组合物配制为或待配制为用于肌肉内注射。
进一步地,所述组合物可为将所述RNA分子与蛋白和/或脂质复合而成的RNA-颗粒。
更进一步地,所述组合物可为将所述RNA分子负载于脂质纳米颗粒中后得到。所述脂质纳米颗粒可为如下任一:
(G1)包含可电离的阳离子脂质、磷脂、胆固醇和聚乙二醇(PEG)-脂质,或者由这四者组合而成。
(G2)包含十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基) 辛酸酯)、二肉豆蔻酰甘油-聚乙二醇2000、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱和胆固醇,或者由这四者组合而成。
其中,十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基)辛酸酯)即为SM-102;二肉豆蔻酰甘油-聚乙二醇2000即为DMG-PEG2000;1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱即为DSPC。
在一些实施方案中,所述脂质纳米颗粒中包载的所述RNA分子的量在200μg/mL 以上(如350μg/mL-640μg/mL)。
在一些实施方案中,SM-102、DSPC、胆固醇和DMG-PEG2000以274.64:61.12:115.14:29.11的质量比混合。
在一些实施方案中,将所述RNA分子配制为或待配制为胶体。进一步地,所述 RNA配制为颗粒,在形成的胶体分散相中存在50%或更多、75%或更多或者85%或更多的RNA。更进一步地,所述颗粒通过使溶于水相中的RNA暴露于溶于有机相中的脂质形成,其中所述有机相可包含乙醇。或者,所述颗粒通过使溶于水相中的RNA暴露于分散于水相中的脂质形成,其中所述分散于水相中的脂质形成脂质体。
在一些实施方案中,所述RNA分子可以1μg-100μg每剂量的范围的量存在于所述组合物中。
第四方面,本发明要求保护前文第一方面所述RNA分子或前文第二方面所述生物材料或前文第三方面所述组合物在制备用于预防和/或治疗新冠病毒感染药物中的用途。所述药物可为疫苗(如RNA疫苗)。
进一步地,所述药物可包含一种或多种药学上可接受的载剂、稀释剂和/或赋形剂。
第五方面,本发明要求保护一种用于预防和/或治疗新冠病毒感染的药物。
本发明要求保护的用于预防和/或治疗新冠病毒感染的药物,其有效成分包括或为前文第一方面所述的RNA分子。
进一步地,所述药物还可包含一种或多种药学上可接受的载体、稀释剂和/或赋形剂。
在一些实施方案中,所述药物用于在受试者中诱导针对冠状病毒的免疫应答;进一步地,所述针对冠状病毒的免疫应答为针对冠状病毒抗原的特异性免疫应答。
在一些实施方案中,所述药物用于冠状病毒感染的治疗和/或预防。
在第四和第五方面中,所述冠状病毒为β冠状病毒。所述冠状病毒为沙贝病毒(sarbecovirus)。所述冠状病毒为SARS-CoV-2,进一步地所述冠状病毒为 SARS-CoV-2Omicron变异病毒株。
在一些实施方案中,当所述RNA分子、所述组合物或所述药物给予人源细胞时,实现能够被检测的所述抗原性多肽或者所述免疫原性片段的表达;进一步地,所述表达持续至少24小时或更长的时间段。
在一些实施方案中,施用所述RNA分子、所述组合物或所述药物能够在所述受试者中产生免疫效果,所述免疫效果包括产生SARS-CoV-2中和抗体和/或T细胞应答;进一步地,所述T细胞应答为TH1型T细胞应答;更进一步地,所述TH1型T细胞应答为CD4+和/或CD8+T细胞应答。
在一些实施方案中,施用所述RNA分子、所述组合物或所述药物在所述受试者中产生免疫应答,所述免疫应答包括产生针对SARS-CoV-2刺突蛋白的S1亚基的结合抗体滴度;进一步地,所述免疫应答包括产生针对SARS-CoV-2病毒的中和抗体滴度。
在一些实施方案中,将所述RNA分子、所述组合物或所述药物施用给所述受试者之后7天,所述受试者(如小鼠)的血清显示针对所述抗原性多肽或者所述免疫原性片段的抗体的产生。
在一些实施方案中,将所述RNA分子、所述组合物或所述药物施用给所述受试者之后14天,所述受试者(如小鼠)的血清显示病毒中和活性。
进一步地,所述受试者为哺乳动物;更进一步地,所述受试者为小鼠;更加具体地,所述受试者为人类。
第六方面,本发明要求保护一种制备用于预防和/或治疗新冠病毒感染RNA疫苗的方法。
本发明要求保护的制备用于预防和/或治疗新冠病毒感染RNA疫苗的方法,可包括将前文第一方面所述的RNA分子负载于脂质纳米颗粒中的步骤。
所述脂质纳米颗粒可为如下任一:
(G1)包含可电离的阳离子脂质、磷脂、胆固醇和聚乙二醇(PEG)-脂质,或者由这四者组合而成。
(G2)包含十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基) 辛酸酯)、二肉豆蔻酰甘油-聚乙二醇2000、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱和胆固醇,或者由这四者组合而成。
其中,十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基)辛酸酯)即为SM-102;二肉豆蔻酰甘油-聚乙二醇2000即为DMG-PEG2000;1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱即为DSPC。
在一些实施方案中,所述脂质纳米颗粒中包载的所述RNA分子的量在200μg/mL 以上(如350μg/mL-640μg/mL)。
在一些实施方案中,SM-102、DSPC、胆固醇和DMG-PEG2000以274.64:61.12:115.14:29.11的质量比混合。
本发明还要求保护在受试者中诱导针对冠状病毒的免疫应答,进一步地针对冠状病毒抗原的特异性免疫应答的方法。在另一方面,本发明还要求保护用于冠状病毒感染的治疗或预防性治疗的方法。所述方法包括向受试者施用本文所述的RNA分子、所述组合物或所述药物。所述受试者为哺乳动物,进一步地所述受试者为小鼠,更进一步地所述受试者为人类。在本发明所述方法的一些实施方案中,所述冠状病毒为β冠状病毒,或所述冠状病毒为沙贝病毒,或所述冠状病毒为SARS-CoV-2,进一步地所述冠状病毒为SARS-CoV-2Omicron变异病毒株。
实验证明,本发明所提供的RNA疫苗能够有效的诱导冠状病毒抗原特异性免疫应答,产生针对SARS-CoV-2病毒的中和抗体滴度。假病毒实验显示Omicron S组, Omicron S-2P组,Omicron S-6P组28天免疫血清对SARS-CoV-2假型病毒中和抗体几何平均效价分别为895,4300,5760。真病毒实验显示:Omicron S组,Omicron S-2P 组,Omicron S-6P组28天免疫血清对SARS-CoV-2流行株、南非株、印度株和奥米克戎株均具有中和活性,其中以对奥米克戎株的中和活性(NT50)最高,分别为512、 768和512。本发明对于预防或治疗冠状病毒感染,特别是预防或治疗SARS-CoV-2 Omicron变异病毒的感染具有重要意义。
附图说明
图1为LNP-mRNA在293T细胞中的表达。阴性对照为LNP(未包载mRNA脂质颗粒的对照)。
图2为mRNA疫苗免疫小鼠血清IgG抗体检测。
图3为免疫后28天各组mRNA疫苗诱导的体液免疫应答。
图4为ELISpot检测免疫小鼠脾细胞分泌IFN-γ水平。
图5为ELISpot检测免疫小鼠脾细胞分泌IL-2水平。
图6为mRNA疫苗免疫小鼠血清针对Omicron假型病毒的中和抗体检测。
具体实施方式
除非另外指出,否则本发明实验将采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和合成生物学等等的常规技术,其在本领域技术范围内。这样的技术在文献中有充分的解释:“Molecular Cloning:A Laboratory Manual,”第二版(Sambrook等人,1989);“Oligonucleotide Synthesis”(M.J.Gait 编,1984);“Animal Cell Culture”(R.I.Freshney编,1987);“Methods in Enzymology”(Academic Press,Inc.);“CurrentProtocols in Molecular Biology”(F.M.Ausubel等人编,1987,以及定期更新);“PCR:ThePolymerase Chain Reaction,”(Mullis等人编,1994);Singleton等人,Dictionary ofMicrobiology and Molecular Biology第二版,J.Wiley&Sons(New York,N.Y.1994)和March’s Advanced Organic Chemistry Reactions,Mechanisms and Structure第四版,John Wiley&Sons(New York,N.Y.1992),为本领域技术人员提供了本申请中使用的许多术语的通用指南。
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常理解的相同的含义。为了本发明的目的,下文定义了下述术语。
冠词“一个/一种”和“该/所述”在本文中用于指一个/一种;超过一个/一种即至少一个/一种。替代(例如“或”)的使用应理解为意指替代方案中任一、两者或其任何组合。术语“和/或”应理解为意指替代方案中任一或两者。
如本文使用的,术语“约”或“大约”是指与参考数量、水平、值、数量、频率、百分比、尺度、大小、量、重量或长度相比较,改变多达15%、10%、9%、8%、 7%、6%、5%、4%、3%、2%或1%的数量、水平、值、数量、频率、百分比、尺度、大小、量、重量或长度。
在本说明书全文,除非上下文另有要求,否则术语“包含”,“包括”、“含有”和“具有”应理解为暗示包括所述步骤或要素或者步骤组或要素组,但不排除任何其他步骤或要素或者步骤组或要素组。在特定实施方式中,术语“包含”,“包括”、“含有”和“具有”同义使用。
“由……组成”意指包括但限于在短语“由……组成”中的任何。因此,短语“由……组成”是指示所列出的要素是需要的或强制性的,并且没有其他要素是可以存在的。
“基本上由……组成”意指包括在短语“基本上由……组成”中列出的任何要素,并且限于不干扰或贡献于所列出的要素的公开内容中指定的活动或动作的其他要素。因此,短语“基本上由……组成”是指示所列出的要素是需要的或强制性的,但没有其他要素是任选的,并且取决于它们是否影响所列出的要素的活动或动作而可以存在或不存在。
在本说明书全文,提到“一个实施方案”、“一些实施方案”、“一个具体的实施方案”等类似表述意指与所述实施方式结合描述的特定特征、结构或特性被包括在本发明的至少一个实施方式中。因此,前述短语在本说明书全文的各个地方的出现不一定全部指相同实施方式。此外,特定特征、结构或特性可以以任何合适方式在一个或多个实施方式中组合。
如本文所用的,“突变体”和“变体”是指保留与原始序列的生物学活性相同或基本上相同的生物学活性的分子。该突变体或变体可以来自相同或不同的物种,或者可以是基于天然的分子或现有的分子的合成序列。在一些实施方式中,术语“突变体”和“变体”是指多肽具有的氨基酸序列与对应的野生型多肽至少相差一个氨基酸。例如,突变体和变体可以包含保守氨基酸取代:即用具有相似性质的氨基酸取代原有的对应氨基酸。保守取代可以是极性对极性氨基酸,如甘氨酸(G,Gly)、丝氨酸(S,Ser)、苏氨酸(T,Thr)、酪氨酸(Y,Tyr)、半胱氨酸(C,Cys)、天冬酰胺(N,Asn)和谷氨酰胺(Q,Gln);非极性对非极性氨基酸,如丙氨酸(A, Ala)、缬氨酸(V,Val)、色氨酸(W,Trp)、亮氨酸(L,Leu)、脯氨酸(P,Pro)、甲硫氨酸(Μ,Met)、苯丙氨酸(F,Phe);酸性对酸性氨基酸,如天冬氨酸(D, Asp)、谷氨酸(E,Glu);碱性对碱性氨基酸,如精氨酸(R,Arg)、组氨酸(H, His)、赖氨酸(K,Lys);带电荷氨基酸对带电荷氨基酸,如天冬氨酸(D,Asp)、谷氨酸(E,Glu)、组氨酸(H,His)、赖氨酸(K,Lys)和精氨酸(R,Arg));疏水对疏水性氨基酸,如丙氨酸(A,Ala)、亮氨酸(U,Leu)、异亮氨酸(I,Ile)、缬氨酸(V,Val)、脯氨酸(P,Pro)、苯丙氨酸(F,Phe)、色氨酸(W,Trp)和甲硫氨酸(M,Met)。在一些其他实施方式中,突变体或变体也可以包含非保守性取代。
在一些实施方式中,突变体或变体多肽可以具有约1、2、3、4、5、6、7、8、 9、10、15、20、30、40、50、60、70、80、90、100个或更多个或前述数值中的任意两者构成的范围的氨基酸的置换、添加、插入或缺失。与未改变的多肽相比,突变体或变体可以具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%或前述数值中的任意两者构成的范围的活性。
多核苷酸或多肽与另一个多核苷酸或多肽具有一定的“序列同一性”或“相同性”百分比,意味着当比对两条序列时,该百分比的碱基或氨基酸相同并且在相同的相对位置。确定两个氨基酸序列或两个核苷酸序列的百分比相同性可以包括比对和比较两个序列中相应位置处的氨基酸残基或核苷酸。如果两个序列中的所有位置被相同的氨基酸残基或核苷酸占据,那么所述序列被认为是100%相同的。序列相同性可以以多种不同方式确定,例如,可以使用各种方法和计算机程序(例如, BLAST、T-COFFEE、MUSCLE、MAFFT等)对序列进行比对。
本发明一般包括受试者的免疫治疗,包括施用RNA,即疫苗RNA,其编码氨基酸即疫苗抗原,包含SARS-CoV-2S蛋白或其免疫原性片段或变体。因此,疫苗抗原包含SARS-CoV-2S蛋白的表位,用于在受试者中诱导针对冠状病毒S蛋白,特别是SARS-CoV-2S蛋白的免疫应答。施用编码疫苗抗原的RNA以提供抗原(在通过适当的靶细胞表达多核苷酸之后),用于诱导,即刺激、引发和/或扩大免疫应答,例如,抗体和/或免疫效应细胞,其靶向靶抗原(冠状病毒S蛋白,特别是SARS-CoV -2S蛋白)或其加工产物。根据本公开诱导的免疫应答是B细胞介导的免疫应答,即抗体介导的免疫应答,特别是抗SARS-CoV-2免疫应答。
本文描述的疫苗包含作为有效成分的单链RNA,其可以在进入接受者细胞后翻译为相应的蛋白。除了编码抗原序列的野生型、突变型或密码子优化的序列,RNA 还可以包含一个或多个结构元件,这些结构元件针对RNA在稳定性和翻译效率方面的最大效力进行优化(5'帽、5'UTR、3'UTR、polyA尾)。CleanCap形成的 m7G(5’)ppp(5’)(2’-OMeA)pG可以用作RNA药物物质5'-端的特定加帽结构。作为5'-UTR序列,可以使用人β-珠蛋白mRNA的5'-UTR序列,任选地具有优化的“Kozak序列”以提高翻译效率。3'-UTR可以是人β-珠蛋白mRNA的两个重复的 3'-UTR。此外,可以使用长度为50-120个核苷酸的polyA尾序列。
此外,可以将分泌信号肽(sec)以sec翻译为N末端标签的方式融合至抗原编码区。在一个实施方案中,sec对应于S蛋白的分泌信号肽。
本文描述的疫苗RNA可以与蛋白和/或脂质复合,以产生用于施用的RNA-颗粒。如果使用不同RNA的组合,可以将RNA一起或分别与蛋白和/或脂质复合以产生用于施用的RNA-颗粒。
在一方面,本发明涉及一种组合物或药物制品(medical preparation),其包含编码氨基酸序列的RNA,所述氨基酸序列包含SARS-CoV-2S蛋白或其免疫原性片段或变体。
在一个实施方案中,包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列能够形成多聚体复合物,特别是三聚体复合物。为此,包含SARS-CoV-2S 蛋白或其免疫原性片段或变体的氨基酸序列可以包含允许形成多聚体复合物的结构域,特别是包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列的三聚体复合物。在一个实施方案中,允许形成多聚体复合物的结构域包含三聚结构域,例如,本文描述的三聚结构域。
在一个实施方案中,包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列由编码序列编码,与野生型编码序列相比,所述编码序列是密码子优化的和 /或G/C含量增加,其中所述密码子优化和/或G/C含量增加不改变编码的氨基酸序列的序列。
在一个实施方案中,(ⅰ)编码SARS-CoV-2S蛋白或其免疫原性片段或变体的 RNA包含SEQ ID No.4、SEQ ID No.5或SEQ ID No.6的核苷酸49-3810的核苷酸序列(T替换为U),与SEQ ID No.4、SEQ ID No.5或SEQ ID No.6的核苷酸49-3810 的核苷酸序列(T替换为U)具有至少99%、98%、97%、96%、95%、90%、85%或80%相同性的核苷酸序列。(ⅱ)SARS-CoV-2S蛋白或其免疫原性片段或变体包含SEQ ID No.1、SEQ ID No.2或SEQ ID No.3的氨基酸17-1270的氨基酸序列,与SEQ ID No.1、 SEQ ID No.2或SEQ ID No.3的氨基酸17-1270的氨基酸序列具有至少99%、98%、 97%、96%、95%、90%、85%或80%相同性的氨基酸序列。
在一个实施方案中,所述RNA还包含用于编码分泌信号肽的RNA序列。
在一个实施方案中,所述分泌信号肽融合,通过N-末端融合至SARS-CoV-2S 蛋白或其免疫原性片段或变体。
在一个实施方案中,(ⅰ)编码所述分泌信号肽的RNA包含SEQ ID No.4、SEQ IDNo.5或SEQ ID No.6的核苷酸1-48的核苷酸序列(T替换为U),与SEQ ID No.4、 SEQ IDNo.5或SEQ ID No.6的核苷酸1-48的核苷酸序列(T替换为U)具有至少 99%、98%、97%、96%、95%、90%、85%或80%相同性的核苷酸序列。(ⅱ)所述分泌信号肽包含SEQ IDNo.1、SEQ ID No.2或SEQ ID No.3的氨基酸1-16的氨基酸序列,与SEQ ID No.1、SEQ IDNo.2或SEQ ID No.3的氨基酸1-16的氨基酸序列具有至少99%、98%、97%、96%、95%、90%、85%或80%相同性的氨基酸序列。
在一个实施方案中,所述RNA是修饰的RNA,特别是稳定的mRNA。在一个实施方案中,所述RNA包含修饰的核苷,以代替尿苷。在一个实施方案中,所述修饰的核苷是N1-甲基-假尿苷(m1ψ)。
在一个实施方案中,编码包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列的RNA包含5’UTR,其包含SEQ ID No.7的核苷酸序列,或与SEQ ID No.7 的核苷酸序列具有至少99%、98%、97%、96%、95%、90%、85%或80%相同性的核苷酸序列。
在一个实施方案中,编码包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列的RNA包含3’UTR,其包含SEQ ID No.8的核苷酸序列,或与SEQ ID No.8 的核苷酸序列具有至少99%、98%、97%、96%、95%、90%、85%或80%相同性的核苷酸序列。
在一个实施方案中,编码包含SARS-CoV-2S蛋白或其免疫原性片段或变体的氨基酸序列的RNA包含polyA尾序列。在一个实施方案中,所述polyA尾序列包含至少100个核苷酸。在一个实施方案中,所述polyA尾序列包含SEQ ID No.9的核苷酸序列,或由SEQ IDNo.9的核苷酸序列组成。
在一个实施方案中,所述RNA或组合物配制为或待配制为液体、固体或其组合。在一个实施方案中,所述RNA或组合物配制为或待配制为用于注射。在一个实施方案中,所述RNA或组合物配制为或待配制为用于肌肉内注射。
在一个实施方案中,所述RNA配制为或待配制为颗粒。在一个实施方案中,所述颗粒为脂质纳米颗粒(LNP)。
在一个实施方案中,所述LNP颗粒包含十七烷-9-基8-((2-羟乙基)(6-氧代 -6-((癸氧基)己基)氨基)辛酸酯)(heptadecan-9-yl 8-((2-hydroxyethyl)(6-oxo-6-(undecyloxy)hexyl)amino)octanoate)、二肉豆蔻酰甘油-聚乙二醇2000(1,2-Dimyristoyl-sn-glycero-3-methoxypolyethylene glycol)、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(1,2-Distearoyl-sn-glycero-3 -phosphocholine)和胆固醇。
在一个实施方案中,所述RNA配制为或待配制为胶体。在一个实施方案中,所述RNA配制为或待配制为颗粒,形成胶体的分散相。在一个实施方案中,所述分散相中存在50%或更多、75%或更多或者85%或更多的RNA。在一个实施方案中,所述 RNA配制或待配制为包含RNA和脂质的颗粒。在一个实施方案中,所述颗粒通过使溶于水相中的RNA暴露于溶于有机相中的脂质形成。在一个实施方案中,所述有机相包含乙醇。在一个实施方案中,所述颗粒通过使溶于水相中的RNA暴露于分散于水相中的脂质形成。在一个实施方案中,所述分散于水相中的脂质形成脂质体。
在一个实施方案中,所述RNA为mRNA、环状RNA(cRNA)和自复制RNA(saRNA)。
在一个实施方案中,所述组合物或药物制品为药物组合物。在一个实施方案中,所述组合物或药物制品为疫苗。在一个实施方案中,所述药物组合物进一步包含一种或多种药学上可接受的载体、稀释剂和/或赋形剂。
在一方面,本发明涉及本文描述的组合物或药物制品,其用于制药用途。在一个实施方案中,所述制药用途包括在受试者中诱导针对冠状病毒的免疫应答。在一个实施方案中,所述制药用途包括冠状病毒感染的治疗或预防性治疗。
在一个实施方案中,所述冠状病毒为β冠状病毒。在一个实施方案中,所述冠状病毒为沙贝病毒(sarbecovirus)。在一个实施方案中,所述冠状病毒为SARS-CoV -2。
在一方面,本发明涉及一种在受试者中诱导针对冠状病毒的免疫应答的方法,所述方法包括向受试者施用包含编码氨基酸序列的RNA的组合物,所述氨基酸序列包含SARS-CoV-2S蛋白或其免疫原性片段或变体。
在一个实施方案中,所述方法为针对冠状病毒进行疫苗接种的方法。在一个实施方案中,所述方法为用于冠状病毒感染的治疗或预防性治疗的方法。
在一个实施方案中,所述受试者为小鼠。在一个实施方案中,所述冠状病毒为β冠状病毒。在一个实施方案中,所述冠状病毒为沙贝病毒(sarbecovirus)。在一个实施方案中,所述冠状病毒为SARS-CoV-2。
在一方面,本发明涉及本文描述的组合物或药物制品,其用于本文描述的方法。
其中,本公开证实包含脂质纳米颗粒包裹的mRNA的组合物可以在根据方案(包括施用至少一个剂量的疫苗组合物)向小鼠施用之后7天内实现血清中针对表位的可检测的抗体滴度,所述mRNA编码SARS-CoV-2多肽(例如,SARS-CoV-2的S蛋白)的至少一部分(例如,是或包含表位)。
本公开记录了其中mRNA内的核苷酸经修饰的组合物(例如,包含脂质纳米颗粒包裹的mRNA的组合物,所述mRNA编码SARS-CoV-2多肽(例如,SARS-CoV-2的 S蛋白)的至少一部分(例如,是或包含表位))和/或涉及这类组合物的方法,其特征在于:不存在内在佐剂作用,或者与具有未修饰的其他可比组合物(或方法) 相比减少的内在佐剂作用。可选地或额外地,在一些实施方案中,这类组合物(或方法)诱导抗体应答和/或CD4+T细胞应答。在涉及修饰的核苷酸的一些实施方案中,这类修饰的核苷酸可以存在于例如3’UTR序列、抗原编码序列和/或5’UTR 序列中。在一些实施方案中,修饰的核苷酸是或包括一个或多个修饰的尿嘧啶残基。
其中,本公开记录了提供的组合物(例如,包含脂质纳米颗粒包裹的mRNA的组合物,所述mRNA编码SARS-CoV-2的多肽(例如,SARS-CoV-2的S蛋白)的至少一部分(例如,是或包含表位))和/或方法,其特征在于:编码的多肽(例如, SARS-CoV-2的蛋白(如S蛋白))。在一些实施方案中,所述多肽持续表达。例如,在一些实施方案中,这类组合物和/或方法的特征在于,当给予人源细胞时,它们实现可检测的多肽表达,并且在一些实施方案中,这种表达持续至少24小时或更长的时间段。
阅读本公开的本领域技术人员会进一步理解它描述了各种mRNA构建体,其包含全长SARS-CoV-2刺突蛋白的核酸序列(例如,包括其中这样的编码的SARS-CoV -2刺突蛋白可以包含至少一个或多个氨基酸取代的实施方案,例如,如本文描述的脯氨酸取代,和/或其中mRNA序列针对受试者(例如,哺乳动物,例如,人)进行密码子优化的实施方案)。更进一步,阅读本公开的这样的普通技术人员会理解它描述了包含编码全长SARS-CoV-2刺突蛋白的核酸序列的某些mRNA构建体的特定特征和/或优点。不希望受任何特定理论的束缚。在一些实施方案中,阅读本公开的普通技术人员会理解提供的编码全长SARS-CoV-2S蛋白的mRNA构建体,可以对于用作或用于免疫原性组合物(例如,疫苗)实现如本文描述的免疫效果(例如,产生SARS-CoV-2中和抗体,和/或T细胞应答(例如,CD4+和/或CD8+T细胞应答)) 特别有用和/或有效。
在一些实施方案中,本公开提供包含编码全长SARS-CoV-2S蛋白(例如,具有一个或多个氨基酸取代的全长SARS-CoV-2S蛋白)的RNA(例如,mRNA),所述RNA适合多肽的细胞内表达。在一些实施方案中,这样的RNA可以配制于脂质纳米颗粒(例如,本文描述的脂质纳米颗粒)中。
在一些实施方案中,本文提供的免疫原性组合物可以包含SARS-CoV-2多肽或其变体的多个(例如,至少2个或更多个,包括,例如,至少3个,至少4个,至少5个,至少6个,至少7个,至少8个,至少9个,至少10个等)免疫原性表位。在一些这样的实施方案中,这样的多个免疫原性表位可以由单一RNA(例如, mRNA)编码。不希望受任何特定理论的束缚,在一些实施方案中,当考虑SARS-CoV -2变体的遗传多样性时,提供的多表位免疫原性组合物(包括,例如,编码全长 SARS-CoV-2刺突蛋白的组合物)可以特别用于提供针对多种病毒变体的保护和/或可以提供更大的机会来开发多样化和/或稳健的中和抗体和/或T细胞应答,特别是特别稳健的TH1型T细胞(例如,CD4+和/或CD8+T细胞)应答。
在一些实施方案中,本公开记录了提供的组合物和/或方法的特征在于它们用单一施用实现一种或多种特定治疗结果(例如,如本文描述的有效免疫应答和/或编码的SARS-CoV-2S蛋白的可检测表达)。
在一些实施方案中,免疫应答可以包括产生针对SARS-CoV-2刺突蛋白的S1 亚基的结合抗体滴度。在一些实施方案中,免疫应答可以包括产生针对SARS-CoV- 2病毒的中和抗体滴度。
在一些实施方案中,中和抗体滴度是(例如,已建立为)相对于适当对照(例如,未疫苗接种的对照小鼠)所观察到的足以减少或阻断病毒与疫苗接种的小鼠血清结合的滴度。
实施例
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、新型冠状病毒mRNA疫苗的制备
一、S蛋白基因合成和载体构建
1、S蛋白基因合成及优化
本实施例中新型冠状病毒mRNA疫苗的目标抗原为Omicron变异病毒株的S蛋白全长(如SEQ ID No.1所示),并在此基础上进行不同位点的组合突变,分别获得Omicron S-2P(K983P、V984P)和Omicron S-6P(F814P、A889P、A896P、A939P、 K983P、V984P)。根据氨基酸序列,反推编码的核苷酸,由基因合成公司经过人源密码子优化及相关酶切位点排除后进行合成。
SEQ ID No.1为N端融合有分泌信号肽的Omicron变异病毒株的S蛋白原始序列。其中,第1-16位为分泌信号肽,第17-1270位为Omicron变异病毒株的S蛋白原始序列。
SEQ ID No.2为N端融合有分泌信号肽的Omicron变异病毒株的S蛋白变体Omicron S-2P(K983P、V984P)序列。其中,第1-16位为分泌信号肽,第17-1270 位为Omicron变异病毒株的S蛋白变体Omicron S-2P序列,与SEQ ID No.1相比,具有K983P和V984P这两个突变位点。以K983P为例,表示将SEQ ID No.1的第983 位的氨基酸残基由K突变为P。其余突变位点表示法同理。
SEQ ID No.3为N端融合有分泌信号肽的Omicron变异病毒株的S蛋白变体Omicron S-6P(F814P、A889P、A896P、A939P、K983P、V984P)序列。其中,第1-16 位为分泌信号肽,第17-1270位为Omicron变异病毒株的S蛋白变体Omicron S-6P 序列,与SEQ ID No.1相比,具有F814P、A889P、A896P、A939P、K983P和V984P这六个突变位点。
SEQ ID No.4为经过人源密码子优化的SEQ ID No.1对应的编码核苷酸序列。SEQID No.5为经过人源密码子优化的SEQ ID No.2对应的编码核苷酸序列。SEQ ID No.6 为经过人源密码子优化的SEQ ID No.3对应的编码核苷酸序列。
2、重组载体构建
将合成的序列[自5’端到3’端依次为:5’端带有XbaI的T7启动子(SEQ ID No.13)、5’UTR(SEQ ID No.7)、S蛋白或其变体的编码核苷酸序列(两端分别带有酶切位点BamHI和AscI的SEQ ID No.4、SEQ ID No.5和SEQ ID No.6)、3’UTR(SEQ ID No.8)及polyA尾(5’端带有EcoRI,3’端带有SapI及NotI的SEQ ID No.9)] 进行XbaI和NotI双酶切,与经过XbaI和NotI酶切的pUC57-GW-Kan(金维智,载体全序列如SEQ ID No.14所示)载体骨架片段进行连接反应,构建重组质粒。利用卡那抗生素进行单克隆平板初筛后,小提质粒并通过BamHI和AscI限制性内切酶酶切法和DNA测序进行阳性克隆验证。
重组质粒pUC57-S的结构描述为:在pUC57-GW-Kan(金维智)载体的酶切位点XbaI和NotI之间克隆入合成序列[自5’端到3’端依次包括:T7启动子(SEQ ID No.13)、 5’UTR(SEQ ID No.7)、S蛋白编码核酸(SEQ ID No.4)、3’UTR(SEQ ID No.8) 及polyA尾(SEQ IDNo.9)]的重组质粒。
重组质粒pUC57-S-2P的结构描述为:在pUC57-GW-Kan(金维智)载体的酶切位点XbaI和NotI之间克隆入合成序列[自5’端到3’端依次包括:T7启动子(SEQ ID No.13)、5’UTR(SEQ ID No.7)、S蛋白变体2P编码核酸(SEQ ID No.5)、3’UTR (SEQ ID No.8)及polyA尾(SEQ ID No.9)]的重组质粒。
重组质粒pUC57-S-6P的结构描述为:在pUC57-GW-Kan(金维智)载体的酶切位点XbaI和NotI之间克隆入合成序列[自5’端到3’端依次包括:T7启动子(SEQ ID No.13)、5’UTR(SEQ ID No.7)、S蛋白变体6P编码核酸(SEQ ID No.6)、3’UTR (SEQ ID No.8)及polyA尾(SEQ ID No.9)]的重组质粒。
二、mRNA的制备
1、质粒线性化
步骤一构建的重组质粒pUC57-S、pUC57-S-2P和pUC57-S-6P,包含T7启动子、 5’UTR(SEQ ID No.7)、目的基因(即SEQ ID No.4、SEQ ID No.5和SEQ ID No.6)、 3’UTR(SEQID No.8)以及polyA尾序列(SEQ ID No.9),在polyA尾序列最后一个A后面有一个SapⅠ酶切位点。用限制性内切酶SapⅠ线性化含有目的基因的质粒,反应体系如表1所示,37℃酶切3h。
表1、质粒线性化酶切体系
10×Cutsmart缓冲液 5μL
SapI酶(10000U/mL) 1μL
质粒 10μg
ddH<sub>2</sub>O 补齐至50μL
取2μL酶切产物进行1%琼脂糖凝胶电泳,检测质粒的线性化情况。利用PCR 产物回收试剂盒(康维世纪)纯化线性化质粒。
2、体外转录
以步骤1获得的线性化重组质粒为模板进行体外转录,利用高产量T7 RNA转录试剂盒进行体外转录。高产量T7 RNA转录试剂盒,产品名称为High Yield T7 RNA SynthesisKit,上海兆维科技发展有限公司,产品目录号为ON-040;5×Reaction Buffer、100mM ATPSolution、100mM CTP Solution、100mM GTP Solution、Enzyme mix、DNase I、AmmoniumAcetate Stop Solution、Lithium Chloride(LiCl) Precipitation Solution均为高产量T7 RNA转录试剂盒中的组件。100mMΨUTP Solution,全称为N1-Me-pUTP,100mM,上海兆维科技发展有限公司,产品目录号为 R5-027。按如下体系(表2)加入各组分(以20μL反应体系为例),混匀后37℃反应3h。
表2、体外转录体系
5×Reaction Buffer 4μL
ATP(100mM) 2μL
ΨTP(100mM) 2μL
CTP(100mM) 2μL
GTP(100mM) 2μL
Enzyme mix 1μL
线性化DNA模板 500ng-1μg
CleanCap AG(100mM) 1μL
无核酸酶H<sub>2</sub>O 补齐至20μL
其中,CleanCap AG为m7G(5’)ppp(5’)(2’-OMeA)pG,货号为ON-134,上海兆维。
转录反应结束后,加入1μL DNase I,37℃反应15min,加入15μL AmmoniumAcetate Stop Solution,混匀。
3、RNA纯化
向步骤2的体外转录反应体系中加入1/3体积的7.5M Lithium Chloride(LiCl)Precipitation Solution(使其终浓度为2.5M),-20℃放置30min。12000g离心 15min,RNA沉淀在底部,弃掉上清。加入1mL 70%乙醇清洗RNA,12000g离心5min,弃掉上清。晾干后加入50μL无RNA酶的水溶解沉淀,并使用紫外分光光度计进行 mRNA定量,得到加帽的体外转录mRNA。其中,对应于Omicron S蛋白的体外转录mRNA 的具体序列如SEQ ID No.10所示;对应于Omicron S-2P突变蛋白的体外转录mRNA 的具体序列如SEQ ID No.11所示;对应于Omicron S-6P突变蛋白的体外转录mRNA 的具体序列如SEQ ID No.12所示。
三、脂质纳米颗粒(LNP)包载
将步骤二得到的三种mRNA原液分别分散于20mM醋酸溶液(pH 5.0),得到mRNA 浓度为200μg/mL的RNA溶液。设置注射泵流速(mRNA溶液的流速为9ml/min,脂质混合物的流速为3ml/min),同时启动注射泵,使mRNA溶液与脂质混合物(配方见表 3)按3:1的体积比进行混合。然后用278mM蔗糖水溶液进行10倍稀释,经过超滤管 (Millipore,UFC910096)离心浓缩后进行三次溶液置换(置换液:含2mM醋酸和 250mM蔗糖,余量为水)。
将上述得到的溶液,加入1/24体积的Tris水溶液(500mM,pH 7.0),得到LNP 包载的mRNA溶液。LNP即脂质纳米颗粒。
用Ribogreen RNA定量试剂盒(Invitrogen,R11490)测定LNP包载的mRNA浓度。游离RNA直接取样测定,总RNA用终浓度为1%Triton X-100裂解后测定,计算三种LNP包载的mRNA浓度分别为350μg/mL,500μg/mL和640μg/mL,包封率均在90%以上。用马尔文ZetaSizer粒径仪测量LNP包载的mRNA的粒径,三种LNP包载的mRNA均为60nm左右。实验同时设置没有包载任何物质的LNP作为对照。
表3、脂质混合物配方
物料名称 母液浓度 用量
SM-102 25mg/mL 274.64μL
DSPC 25mg/mL 61.12μL
胆固醇 25mg/mL 115.14μL
DMG-PEG2000 25mg/mL 29.11μL
无水乙醇 520μL
四、S目标抗原的表达鉴定
将293T细胞接种到六孔板中,24h后在细胞培养基中加入2μg步骤三获得的 LNP包载的mRNA(按LNP包载的mRNA中mRNA的质量计算),进行细胞内表达。24h 后收集细胞,每孔细胞沉淀加入100μL 1×蛋白上样缓冲液于100℃金属浴中裂解变性30min。蛋白样品储存于-20℃或者-80℃。通过免疫印迹检测S蛋白的表达:取8μL蛋白裂解液进行10%SDS-PAGE电泳,分离蛋白样品。使用PVDF膜75V恒压湿法转膜1.2h后,5%脱脂牛奶室温封闭1h。先后与一抗(抗SARS-CoV-2S蛋白兔抗(义翘神州,货号40591-T62,1:1000)和二抗(山羊抗兔,1:5000)进行孵育,最后ECL显色。结果如图1所示,Omicron S、Omicron S-2P和Omicron S-6P三个mRNA疫苗在细胞水平均能检测到S蛋白的表达,大小约为110-150KD,与预期一致。
实施例2、不同新型冠状病毒mRNA疫苗在小鼠模型上的免疫学评价
一、疫苗体液免疫反应检测
20只SPF级雌性BALB/c小鼠(6-8周龄),随机分成4组,每组5只。根据表4 所示分组情况对小鼠进行mRNA疫苗的免疫,免疫途径为肌肉注射。
表4、疫苗体液免疫反应检测小鼠分组情况
候选疫苗 剂量 免疫方式 小鼠数量
Omicron S 5μg 肌肉注射 5
Omicron S-2P 5μg 肌肉注射 5
Omicron S-6P 5μg 肌肉注射 5
LNP 5μg 肌肉注射 5
注:候选疫苗Omicron S、Omicron S-2P和Omicron S-6P分别为实施例1制备得到的LNP包载的Omicron S mRNA、Omicron S-2P mRNA和Omicron S-6P mRNA。LNP 为没有包载任何物质的空载LNP。“剂量”一栏均是以LNP包载的mRNA中mRNA的质量计算。
初次免疫时每只小鼠后大腿内侧注射50μL体积的5μg mRNA(以LNP包载的mRNA 中mRNA的质量计算),初次免疫后第14天加强免疫一次,剂量同初次免疫。眼眶取血时间分别为初次免疫后第7天,第14天,第21天和第28天。血样先置37℃灭活 1小时,4℃静置2小时,然后3000rpm离心10分钟分离血清,使用ELISA试剂盒 (义翘神州,货号KIT022)检测血清中的针对新型冠状病毒Omicron株S1蛋白的IgG 抗体滴度(图2)。
小鼠肌肉注射LNP包载的mRNA后第7天即可产生血清IgG抗体,其中Omicron S 组的抗体几何平均滴度(GMT)为31251,Omicron S-2P组的抗体几何平均滴度为3356,OmicronS-6P组的抗体几何平均滴度为40272。从免疫后第7天至免疫后第28天,血清抗体水平逐渐升高。对免疫后第28天3组RNA疫苗注射诱导的血清IgG总抗体滴度进行比较分析,如图3结果显示各组之间均无显著性差异(ns,P≥0.05)。
二、疫苗细胞免疫反应检测
免疫后28天处死小鼠,取脾置于70μm细胞尼龙滤网上,在2ml RPMI-1640完全培养基中充分研磨制成细胞悬液,计数后用培养基进行稀释,按每孔105或5×104个细胞接种到ELISpot板中,加入S蛋白重叠肽库(义翘神州,PP003)刺激培养20 小时,阳性对照孔加入佛波酯(PMA)和Ionomycin(离子霉素)阳性刺激剂,阴性对照孔不加刺激剂。使用不同抗体预包被的ELISpot板分别检测免疫小鼠的脾细胞经特异性肽刺激后表达IFN-γ和IL-2的水平。
各组mRNA疫苗免疫小鼠后诱导的细胞免疫水平如图4和图5所示,其中LNP组为注射未包载mRNA脂质颗粒的对照组。结果显示Omicron S、Omicron S-2P和Omicron S-6P均可诱导其免疫小鼠产生明显的细胞免疫反应,三组疫苗之间没有显著性差异。
三、疫苗中和抗体检测
1、假型病毒的方法和结果
在稳定过表达SARS-CoV-2主要受体ACE2的Hela-ACE2细胞系(记载于“Liu X, WeiL,Xu F,Zhao F,Huang Y,Fan Z,Mei S,Hu Y,Zhai L,Guo J,Zheng A,Cen S,Liang C,GuoF.SARS-CoV-2spike protein-induced cell fusion activates the cGAS-STINGpathway and the interferon response.Sci Signal.2022Apr 12;15(729):eabg8744.doi:10.1126/scisignal.abg8744.Epub 2022Apr 12.PMID: 35412852.”一文,公众可从申请人处获得,仅可用于重复本发明实验使用,不得他用)中检测免疫小鼠血清(步骤一得到的初次免疫后第28天的小鼠血清)针对 SARS-CoV-2Omicron毒株假病毒的中和活性。假型病毒是以慢病毒为核心,萤火虫荧光素酶报告基因的BA.2株(诺唯赞,货号DD1796-02的产品“SARS-Cov2-Fluc BA.2”)。将待检测的血清用DMEM培养基进行2倍系列稀释,共稀释8个梯度,从1:128 起稀释至1:16384。在P2实验室中用DMEM培养基将假病毒稀释至1×104TCID50/mL。取各梯度的血清与稀释好的病毒液混合,37℃,5%CO2温箱中孵育1小时。将孵育好的病毒血清混合物按每孔100μl加入到预先接种的Hela-ACE2细胞板中,置于37℃, 5%CO2温箱中培养。48小时后,测定萤火虫荧光素酶活性,计算假病毒感染性,以抑制50%荧光素酶活性的血清最高稀释度的倒数为终点效价。结果如图6所示,Omicron S组,Omicron S-2P组,Omicron S-6P组28天免疫血清对假型病毒中和抗体几何平均效价分别为895,4300,5760。
2、对新冠病毒活毒的中和能力
在Vero-E6细胞上检测免疫小鼠血清(步骤一得到的初次免疫后第28天的小鼠血清)针对SARS-CoV-2的4个毒株(流行株,即新冠原始毒株GD108)、南非株、印度株和奥米克戎株)的中和抗体效价。将待检测的血清56℃灭活30分钟。用DMEM 培养基进行2倍系列稀释,从1:8开始稀释。在P3实验室中根据病毒的原始滴度,用DMEM培养基将病毒稀释至工作浓度。取稀释好的病毒液等倍体积与各稀释梯度的血清混合,37℃,5%CO2温箱中孵育1小时。将孵育好的病毒血清混合物按每孔100μl 加入到悬浮Vero-E6细胞板中,置于37℃,5%CO2温箱中培养,每天观察CPE,5天后判定最终结果。以抑制50%细胞病变的血清最高稀释度的倒数为终点效价。该实验是在中国医学科学院医学生物学研究所的P3实验室进行的。
各疫苗免疫血清针对流行株(GD108)、南非株、印度株和奥米克戎株的中和效价如表5所示。
表5、疫苗的广谱中和活性(NT50)
流行株 南非株 印度株 奥米克戎株
LNP 32 <8 24 <8
Omicron S 128 96 64 512
Omicron S-2P 64 16 32 768
Omicron S-6P 256 96 32 512
综上所述,Omicron S、Omicron S-2P和Omicron S-6P三个mRNA疫苗均具有良好的免疫原性,可诱导小鼠产生高水平的血清IgG抗体和特异性细胞免疫反应,并且产生的中和抗体对多种毒株具有交叉保护作用。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
<110> 仁景(苏州)生物科技有限公司
<120> 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗
<130> GNCLN221808
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 1270
<212> PRT
<213> Artificial sequence
<400> 1
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Val Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp His Lys Asn Asn
130 135 140
Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn
145 150 155 160
Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly
165 170 175
Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile
180 185 190
Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Ile Val Arg
195 200 205
Glu Pro Glu Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Asp
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Leu
355 360 365
Ala Pro Phe Phe Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Ser Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Asn Lys Pro Cys Asn Gly Val
465 470 475 480
Ala Gly Phe Asn Cys Tyr Phe Pro Leu Arg Ser Tyr Ser Phe Arg Pro
485 490 495
Thr Tyr Gly Val Gly His Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Lys
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Lys Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Lys Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Tyr Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Lys Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn His Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Lys Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Phe Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1145 1150 1155
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1160 1165 1170
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1175 1180 1185
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1190 1195 1200
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile
1205 1210 1215
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys
1220 1225 1230
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1250 1255 1260
Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 2
<211> 1270
<212> PRT
<213> Artificial sequence
<400> 2
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Val Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp His Lys Asn Asn
130 135 140
Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn
145 150 155 160
Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly
165 170 175
Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile
180 185 190
Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Ile Val Arg
195 200 205
Glu Pro Glu Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Asp
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Leu
355 360 365
Ala Pro Phe Phe Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Ser Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Asn Lys Pro Cys Asn Gly Val
465 470 475 480
Ala Gly Phe Asn Cys Tyr Phe Pro Leu Arg Ser Tyr Ser Phe Arg Pro
485 490 495
Thr Tyr Gly Val Gly His Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Lys
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Lys Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Lys Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Tyr Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Phe Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Lys Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn His Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Lys Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Phe Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1145 1150 1155
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1160 1165 1170
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1175 1180 1185
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1190 1195 1200
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile
1205 1210 1215
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys
1220 1225 1230
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1250 1255 1260
Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 3
<211> 1270
<212> PRT
<213> Artificial sequence
<400> 3
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Val Ile Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp Asn Pro
65 70 75 80
Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Ile Glu Lys Ser
85 90 95
Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser Lys Thr
100 105 110
Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile Lys Val
115 120 125
Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Asp His Lys Asn Asn
130 135 140
Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr Ser Ser Ala Asn Asn
145 150 155 160
Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu Met Asp Leu Glu Gly
165 170 175
Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe Val Phe Lys Asn Ile
180 185 190
Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr Pro Ile Ile Val Arg
195 200 205
Glu Pro Glu Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu Pro Leu Val
210 215 220
Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr Leu Leu Ala
225 230 235 240
Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser Gly Trp Thr
245 250 255
Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro Arg Thr Phe
260 265 270
Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala Val Asp Cys
275 280 285
Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys Ser Phe Thr
290 295 300
Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Gln Pro Thr
305 310 315 320
Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro Phe Asp
325 330 335
Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala Trp Asn Arg
340 345 350
Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr Asn Leu
355 360 365
Ala Pro Phe Phe Thr Phe Lys Cys Tyr Gly Val Ser Pro Thr Lys Leu
370 375 380
Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe Val Ile Arg
385 390 395 400
Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Asn Ile Ala
405 410 415
Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys Val Ile Ala
420 425 430
Trp Asn Ser Asn Lys Leu Asp Ser Lys Val Ser Gly Asn Tyr Asn Tyr
435 440 445
Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe Glu Arg Asp
450 455 460
Ile Ser Thr Glu Ile Tyr Gln Ala Gly Asn Lys Pro Cys Asn Gly Val
465 470 475 480
Ala Gly Phe Asn Cys Tyr Phe Pro Leu Arg Ser Tyr Ser Phe Arg Pro
485 490 495
Thr Tyr Gly Val Gly His Gln Pro Tyr Arg Val Val Val Leu Ser Phe
500 505 510
Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys Lys Ser Thr
515 520 525
Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn Gly Leu Lys
530 535 540
Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu Pro Phe Gln
545 550 555 560
Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val Arg Asp Pro
565 570 575
Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe Gly Gly Val
580 585 590
Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val Ala Val Leu
595 600 605
Tyr Gln Gly Val Asn Cys Thr Glu Val Pro Val Ala Ile His Ala Asp
610 615 620
Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser Asn Val Phe
625 630 635 640
Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu Tyr Val Asn Asn Ser
645 650 655
Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr Gln
660 665 670
Thr Gln Thr Lys Ser His Arg Arg Ala Arg Ser Val Ala Ser Gln Ser
675 680 685
Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser Val Ala Tyr
690 695 700
Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile Ser Val Thr
705 710 715 720
Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val Asp Cys Thr
725 730 735
Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu Leu Leu Gln
740 745 750
Tyr Gly Ser Phe Cys Thr Gln Leu Lys Arg Ala Leu Thr Gly Ile Ala
755 760 765
Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln Val Lys Gln
770 775 780
Ile Tyr Lys Thr Pro Pro Ile Lys Tyr Phe Gly Gly Phe Asn Phe Ser
785 790 795 800
Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser Pro Ile Glu
805 810 815
Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Ile Lys
820 825 830
Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp Leu Ile Cys
835 840 845
Ala Gln Lys Phe Lys Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp
850 855 860
Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly Thr Ile Thr
865 870 875 880
Ser Gly Trp Thr Phe Gly Ala Gly Pro Ala Leu Gln Ile Pro Phe Pro
885 890 895
Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val
900 905 910
Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn Ser Ala Ile
915 920 925
Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Pro Ser Ala Leu Gly Lys
930 935 940
Leu Gln Asp Val Val Asn His Asn Ala Gln Ala Leu Asn Thr Leu Val
945 950 955 960
Lys Gln Leu Ser Ser Lys Phe Gly Ala Ile Ser Ser Val Leu Asn Asp
965 970 975
Ile Phe Ser Arg Leu Asp Pro Pro Glu Ala Glu Val Gln Ile Asp Arg
980 985 990
Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln
995 1000 1005
Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
1010 1015 1020
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp
1025 1030 1035
Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ser Ala
1040 1045 1050
Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ala Gln
1055 1060 1065
Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His Asp Gly Lys
1070 1075 1080
Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn Gly Thr His
1085 1090 1095
Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln Ile Ile Thr
1100 1105 1110
Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly
1115 1120 1125
Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp
1130 1135 1140
Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser
1145 1150 1155
Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val
1160 1165 1170
Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys
1175 1180 1185
Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
1190 1195 1200
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu Gly Phe Ile
1205 1210 1215
Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met Leu Cys Cys
1220 1225 1230
Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys Ser Cys Gly
1235 1240 1245
Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
1250 1255 1260
Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 4
<211> 3816
<212> DNA
<213> Artificial sequence
<400> 4
atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc aatgcgtgaa cctgaccaca 60
agaacacagc tgccccccgc ctacaccaac agcttcacaa gaggcgtgta ctaccccgac 120
aaggtgttca gaagcagcgt cctccacagc acccaagacc tgttcctgcc tttcttcagc 180
aacgtgacct ggttccacgt gatcagcggc accaacggca ccaagagatt cgacaacccc 240
gtgctgccct tcaacgacgg cgtgtacttc gctagcatcg aaaagagcaa catcatcaga 300
ggctggatct tcggcaccac cctcgattcc aagacccaaa gcctgctgat cgtcaacaac 360
gccaccaacg tggtgatcaa ggtgtgcgag tttcagttct gcaacgaccc cttcctggac 420
cacaagaaca acaagagctg gatggagagc gagttcagag tgtacagcag cgccaacaac 480
tgcaccttcg agtacgtgag ccaacccttc ctgatggacc tggagggcaa gcaaggcaac 540
ttcaaaaacc tgagagagtt cgtgttcaag aacatcgacg gctacttcaa gatctacagc 600
aagcacaccc ccatcatcgt gagagagccc gaggacctgc cccaaggctt cagcgccctg 660
gagcccctgg tggacctgcc catcggcatc aacatcacaa gatttcagac cctgctggcc 720
ctgcacagat cctacctgac acctggggac agcagcagcg gctggaccgc tggcgccgct 780
gcctactacg tgggctacct gcagcctaga accttcctgc tgaagtacaa cgagaacggc 840
acaatcaccg atgccgtcga ctgcgccctg gaccccctga gcgagaccaa gtgcaccctc 900
aagagcttca cagtggagaa gggcatctat cagacaagca acttcagagt gcagcccacc 960
gagagcatcg tgagattccc caacatcacc aacctgtgcc ccttcgacga ggtgttcaac 1020
gccacaagat tcgctagcgt gtacgcttgg aacagaaaga gaatcagcaa ctgcgtggcc 1080
gactacagcg tgctgtacaa cctggccccc ttcttcacct tcaagtgcta cggggtcagc 1140
cccaccaagc tgaacgacct gtgcttcacc aacgtgtacg ccgacagctt cgtgatcaga 1200
ggcgacgagg tgagacagat cgcccccggg cagaccggca acatcgccga ctacaactac 1260
aagctgcccg acgacttcac cggctgcgtg atcgcctgga acagcaacaa gctggattcc 1320
aaggtgtccg gcaactacaa ctacctgtac agactgttca gaaagagcaa cctgaagccc 1380
ttcgagagag acatcagcac cgagatctac caagccggca acaagccctg caacggcgtg 1440
gccggcttca actgctactt ccccctcaga agctacagct tcagacccac ctacggcgtg 1500
ggccatcagc cctacagagt ggtcgtgctg agcttcgagc tgctgcacgc ccccgccaca 1560
gtgtgcggcc ccaaaaagag caccaacctg gtgaagaaca agtgcgtgaa cttcaacttc 1620
aacggcctga agggcaccgg cgtgctgacc gagagcaaca agaagttcct cccctttcag 1680
cagttcggca gagacatcgc cgacaccacc gacgccgtga gagaccctca gaccctggag 1740
atcctggaca tcacaccttg cagcttcggc ggcgtgagcg tgatcacccc cggcaccaac 1800
acaagcaacc aagtggccgt gctgtaccaa ggcgtgaact gcaccgaggt gcccgtggcc 1860
atccacgccg atcagctgac ccccacctgg cgggtgtaca gcaccggcag caacgtgttt 1920
cagacaagag ccggctgcct gatcggcgcc gagtacgtga acaacagcta cgagtgcgac 1980
atccccatcg gcgccggcat ctgcgctagc tatcagacac agaccaagag ccaccggaga 2040
gctagaagcg tggctagcca aagcatcatc gcctacacca tgagcctggg cgccgagaac 2100
agcgtggcct acagcaacaa cagcatcgcc atccccacca acttcaccat cagcgtgacc 2160
accgagatcc tgcctgtgag catgaccaag acaagcgtgg actgcaccat gtacatctgc 2220
ggcgacagca ccgagtgcag caacctgctc ctgcagtacg gcagcttctg cacacagctg 2280
aagagagccc tgaccggcat cgccgtggag caagacaaga acacccaaga ggtgttcgcc 2340
caagtgaagc agatctacaa gacccccccc atcaagtact tcggcggctt caacttcagc 2400
caaatcctgc ccgatcctag caagcctagc aagagaagct tcatcgagga cctgctgttc 2460
aacaaggtga ccctggccga cgccggcttc atcaagcagt acggcgactg cctgggcgat 2520
attgccgcta gagacctgat ctgcgctcag aagttcaagg gcctgaccgt gctgcccccc 2580
ctgctgaccg acgagatgat cgctcagtac acaagcgccc tgctcgctgg caccatcacc 2640
tccggctgga cctttggggc tggcgccgct ctgcagatcc ccttcgccat gcagatggcc 2700
tacagattca acggcatcgg cgtgacacag aacgtgctgt acgagaatca gaagctgatc 2760
gccaatcagt tcaacagcgc catcggcaag atccaagaca gcctgagcag caccgctagc 2820
gccctgggca agctgcaaga cgtggtgaac cacaacgccc aagccctgaa caccctggtg 2880
aagcagctga gcagcaagtt cggcgccatc agcagcgtgc tcaacgacat cttcagcaga 2940
ctggacaagg tggaggccga ggtgcaaatc gacagactga ttaccggcag actgcagagc 3000
ctgcagacct acgtgacaca gcagctgatc agagccgccg agatcagagc tagcgccaac 3060
ctggccgcca ccaagatgag cgagtgcgtg ctggggcaga gcaagagagt ggacttctgc 3120
ggcaagggct accacctgat gagcttccct cagagcgccc cccacggcgt ggtgttcctg 3180
cacgtgacct acgtgcccgc ccaagagaag aacttcacca ccgcccctgc tatctgccac 3240
gacggcaagg cccacttccc tagagagggc gtgttcgtga gcaacggcac ccactggttc 3300
gtgacacaga gaaacttcta cgagcctcag atcatcacca ccgacaacac cttcgtgagc 3360
ggcaactgcg acgtggtgat cggcattgtg aacaacaccg tgtacgaccc cctgcagccc 3420
gagctggaca gcttcaagga ggagctggac aagtacttta agaaccacac aagccccgac 3480
gtggacctgg gggacattag cgggatcaac gctagcgtgg tgaacattca gaaggagatt 3540
gacagactga acgaggtggc caagaacctg aacgagagcc tgatcgacct gcaagagctg 3600
ggcaagtacg agcagtacat caagtggccc tggtacatct ggctgggctt catcgccggc 3660
ctgatcgcca tcgtgatggt gaccatcatg ctgtgctgca tgacaagctg ctgctcctgt 3720
ctcaagggct gctgcagctg cgggagctgc tgcaagttcg acgaggacga cagcgagccc 3780
gtgctgaagg gcgtgaagct gcactacacc tgatga 3816
<210> 5
<211> 3816
<212> DNA
<213> Artificial sequence
<400> 5
atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc aatgcgtgaa cctgaccaca 60
agaacacagc tgccccccgc ctacaccaac agcttcacaa gaggcgtgta ctaccccgac 120
aaggtgttca gaagcagcgt cctccacagc acccaagacc tgttcctgcc tttcttcagc 180
aacgtgacct ggttccacgt gatcagcggc accaacggca ccaagagatt cgacaacccc 240
gtgctgccct tcaacgacgg cgtgtacttc gctagcatcg aaaagagcaa catcatcaga 300
ggctggatct tcggcaccac cctcgattcc aagacccaaa gcctgctgat cgtcaacaac 360
gccaccaacg tggtgatcaa ggtgtgcgag tttcagttct gcaacgaccc cttcctggac 420
cacaagaaca acaagagctg gatggagagc gagttcagag tgtacagcag cgccaacaac 480
tgcaccttcg agtacgtgag ccaacccttc ctgatggacc tggagggcaa gcaaggcaac 540
ttcaaaaacc tgagagagtt cgtgttcaag aacatcgacg gctacttcaa gatctacagc 600
aagcacaccc ccatcatcgt gagagagccc gaggacctgc cccaaggctt cagcgccctg 660
gagcccctgg tggacctgcc catcggcatc aacatcacaa gatttcagac cctgctggcc 720
ctgcacagat cctacctgac acctggggac agcagcagcg gctggaccgc tggcgccgct 780
gcctactacg tgggctacct gcagcctaga accttcctgc tgaagtacaa cgagaacggc 840
acaatcaccg atgccgtcga ctgcgccctg gaccccctga gcgagaccaa gtgcaccctc 900
aagagcttca cagtggagaa gggcatctat cagacaagca acttcagagt gcagcccacc 960
gagagcatcg tgagattccc caacatcacc aacctgtgcc ccttcgacga ggtgttcaac 1020
gccacaagat tcgctagcgt gtacgcttgg aacagaaaga gaatcagcaa ctgcgtggcc 1080
gactacagcg tgctgtacaa cctggccccc ttcttcacct tcaagtgcta cggggtcagc 1140
cccaccaagc tgaacgacct gtgcttcacc aacgtgtacg ccgacagctt cgtgatcaga 1200
ggcgacgagg tgagacagat cgcccccggg cagaccggca acatcgccga ctacaactac 1260
aagctgcccg acgacttcac cggctgcgtg atcgcctgga acagcaacaa gctggattcc 1320
aaggtgtccg gcaactacaa ctacctgtac agactgttca gaaagagcaa cctgaagccc 1380
ttcgagagag acatcagcac cgagatctac caagccggca acaagccctg caacggcgtg 1440
gccggcttca actgctactt ccccctcaga agctacagct tcagacccac ctacggcgtg 1500
ggccatcagc cctacagagt ggtcgtgctg agcttcgagc tgctgcacgc ccccgccaca 1560
gtgtgcggcc ccaaaaagag caccaacctg gtgaagaaca agtgcgtgaa cttcaacttc 1620
aacggcctga agggcaccgg cgtgctgacc gagagcaaca agaagttcct cccctttcag 1680
cagttcggca gagacatcgc cgacaccacc gacgccgtga gagaccctca gaccctggag 1740
atcctggaca tcacaccttg cagcttcggc ggcgtgagcg tgatcacccc cggcaccaac 1800
acaagcaacc aagtggccgt gctgtaccaa ggcgtgaact gcaccgaggt gcccgtggcc 1860
atccacgccg atcagctgac ccccacctgg cgggtgtaca gcaccggcag caacgtgttt 1920
cagacaagag ccggctgcct gatcggcgcc gagtacgtga acaacagcta cgagtgcgac 1980
atccccatcg gcgccggcat ctgcgctagc tatcagacac agaccaagag ccaccggaga 2040
gctagaagcg tggctagcca aagcatcatc gcctacacca tgagcctggg cgccgagaac 2100
agcgtggcct acagcaacaa cagcatcgcc atccccacca acttcaccat cagcgtgacc 2160
accgagatcc tgcctgtgag catgaccaag acaagcgtgg actgcaccat gtacatctgc 2220
ggcgacagca ccgagtgcag caacctgctc ctgcagtacg gcagcttctg cacacagctg 2280
aagagagccc tgaccggcat cgccgtggag caagacaaga acacccaaga ggtgttcgcc 2340
caagtgaagc agatctacaa gacccccccc atcaagtact tcggcggctt caacttcagc 2400
caaatcctgc ccgatcctag caagcctagc aagagaagct tcatcgagga cctgctgttc 2460
aacaaggtga ccctggccga cgccggcttc atcaagcagt acggcgactg cctgggcgat 2520
attgccgcta gagacctgat ctgcgctcag aagttcaagg gcctgaccgt gctgcccccc 2580
ctgctgaccg acgagatgat cgctcagtac acaagcgccc tgctcgctgg caccatcacc 2640
tccggctgga cctttggggc tggcgccgct ctgcagatcc ccttcgccat gcagatggcc 2700
tacagattca acggcatcgg cgtgacacag aacgtgctgt acgagaatca gaagctgatc 2760
gccaatcagt tcaacagcgc catcggcaag atccaagaca gcctgagcag caccgctagc 2820
gccctgggca agctgcaaga cgtggtgaac cacaacgccc aagccctgaa caccctggtg 2880
aagcagctga gcagcaagtt cggcgccatc agcagcgtgc tcaacgacat cttcagcaga 2940
ctggaccccc ccgaggccga ggtgcaaatc gacagactga ttaccggcag actgcagagc 3000
ctgcagacct acgtgacaca gcagctgatc agagccgccg agatcagagc tagcgccaac 3060
ctggccgcca ccaagatgag cgagtgcgtg ctggggcaga gcaagagagt ggacttctgc 3120
ggcaagggct accacctgat gagcttccct cagagcgccc cccacggcgt ggtgttcctg 3180
cacgtgacct acgtgcccgc ccaagagaag aacttcacca ccgcccctgc tatctgccac 3240
gacggcaagg cccacttccc tagagagggc gtgttcgtga gcaacggcac ccactggttc 3300
gtgacacaga gaaacttcta cgagcctcag atcatcacca ccgacaacac cttcgtgagc 3360
ggcaactgcg acgtggtgat cggcattgtg aacaacaccg tgtacgaccc cctgcagccc 3420
gagctggaca gcttcaagga ggagctggac aagtacttta agaaccacac aagccccgac 3480
gtggacctgg gggacattag cgggatcaac gctagcgtgg tgaacattca gaaggagatt 3540
gacagactga acgaggtggc caagaacctg aacgagagcc tgatcgacct gcaagagctg 3600
ggcaagtacg agcagtacat caagtggccc tggtacatct ggctgggctt catcgccggc 3660
ctgatcgcca tcgtgatggt gaccatcatg ctgtgctgca tgacaagctg ctgctcctgt 3720
ctcaagggct gctgcagctg cgggagctgc tgcaagttcg acgaggacga cagcgagccc 3780
gtgctgaagg gcgtgaagct gcactacacc tgatga 3816
<210> 6
<211> 3816
<212> DNA
<213> Artificial sequence
<400> 6
atgttcgtgt tcctggtgct gctgcccctg gtgagcagcc aatgcgtgaa cctgaccaca 60
agaacacagc tgccccccgc ctacaccaac agcttcacaa gaggcgtgta ctaccccgac 120
aaggtgttca gaagctccgt cctccacagc acccaagacc tgttcctccc cttcttcagc 180
aacgtgacct ggttccacgt gatcagcggc accaacggca ccaagagatt cgacaacccc 240
gtgctgccct tcaacgacgg cgtgtacttc gctagcatcg aaaagagcaa catcatcaga 300
ggctggatct tcggcaccac cctggacagc aagacacaga gcctgctgat cgtcaacaac 360
gccaccaacg tggtgatcaa ggtgtgcgag tttcagttct gcaacgaccc cttcctggac 420
cacaagaaca acaagagctg gatggagagc gagttcagag tgtacagcag cgccaacaac 480
tgcaccttcg agtacgtgag ccaacccttc ctgatggacc tggagggcaa gcaaggcaac 540
ttcaaaaacc tgagagagtt cgtgttcaag aacatcgacg gctacttcaa gatctacagc 600
aagcacaccc ccatcatcgt gagagagccc gaggacctgc cccaaggctt cagcgccctg 660
gagcccctgg tggacctgcc catcggcatc aacatcacaa gatttcagac actcctcgcc 720
ctgcaccgga gctacctcac ccctggggat agcagcagcg gctggaccgc cggcgctgcc 780
gcctactacg tgggctacct gcagcctaga accttcctgc tgaagtacaa cgagaacggc 840
accatcacag acgccgtcga ctgtgccctg gaccccctga gcgagaccaa gtgcaccctg 900
aagtccttca ccgtggagaa gggcatctat cagacaagca acttcagagt gcagcccacc 960
gagagcatcg tgagattccc caacatcacc aacctgtgcc ccttcgacga ggtgttcaac 1020
gccacaagat tcgctagcgt gtacgcttgg aaccggaaga gaatcagcaa ctgcgtggcc 1080
gactacagcg tgctgtacaa cctggccccc ttcttcacct tcaagtgtta cggggtgagc 1140
cccaccaagc tgaacgacct gtgcttcacc aacgtgtacg ccgacagctt cgtgatcaga 1200
ggcgacgagg tgagacagat cgcccccggg cagaccggca acatcgccga ctacaactac 1260
aagctgcccg acgacttcac cggctgcgtg atcgcctgga acagcaataa gctcgacagc 1320
aaggtgagcg gcaactacaa ctacctgtac agactgttca gaaagagcaa cctgaagccc 1380
ttcgagagag acatcagcac cgagatctac caagccggca acaagccctg caacggcgtg 1440
gccggcttca actgctactt ccccctcaga agctacagct tcagacccac ctacggcgtg 1500
ggccatcagc cctacagagt ggtcgtgctg agcttcgagc tgctgcacgc ccccgccacc 1560
gtgtgcggcc ccaaaaagag caccaacctg gtgaagaaca agtgcgtgaa cttcaacttc 1620
aacggcctga agggcaccgg cgtgctgacc gagagcaaca agaagttcct gccttttcag 1680
cagttcggca gagacatcgc cgacaccacc gacgccgtga gagaccctca gaccctggag 1740
atcctggaca tcaccccctg ttccttcggc ggcgtgagcg tgatcacccc cggcaccaac 1800
acaagcaacc aagtggccgt gctgtaccaa ggcgtgaact gcaccgaggt gcccgtggcc 1860
atccacgccg atcagctgac ccccacctgg agagtgtata gcaccggcag caacgtgttt 1920
cagacaagag ccggctgcct gatcggcgcc gagtacgtga acaacagcta cgagtgcgac 1980
atccccatcg gcgccggcat ctgcgctagc tatcagacac agaccaagag ccaccggaga 2040
gctagaagcg tggctagcca aagcatcatc gcctacacca tgagcctggg cgccgagaac 2100
agcgtggcct acagcaacaa cagcatcgcc atccccacca acttcaccat cagcgtgacc 2160
accgaaatcc tgcccgtgtc catgaccaag acaagcgtgg actgcaccat gtacatctgc 2220
ggcgacagca ccgagtgcag caacctgctc ctgcagtacg gcagcttctg cacacagctg 2280
aagagagccc tgaccggcat cgccgtggag caagacaaga acacccaaga ggtgttcgcc 2340
caagtgaagc agatctacaa gacccccccc atcaagtact tcggcggctt caacttcagc 2400
caaatcctgc ccgaccctag caagcctagc aagagaagcc ccatcgagga cctgctgttc 2460
aacaaggtga ccctggccga cgccggcttc atcaagcagt acggcgactg cctcggcgac 2520
atcgctgcta gagacctgat ctgcgctcag aagttcaagg gcctgaccgt gctgcccccc 2580
ctgctgaccg acgagatgat tgctcagtac acaagcgccc tgctggccgg gacaatcaca 2640
agcgggtgga cctttggcgc tggccccgcc ctgcagatcc ccttccccat gcagatggcc 2700
tacagattca acggcatcgg cgtgacacag aacgtgctgt acgagaatca gaagctgatc 2760
gccaatcagt tcaacagcgc catcggcaag atccaagaca gcctgagcag cacccctagc 2820
gccctgggca agctgcaaga cgtggtgaac cacaacgccc aagccctgaa caccctggtg 2880
aagcagctga gcagcaagtt cggcgccatc agcagcgtcc tgaatgacat cttcagcaga 2940
ctggaccccc ccgaggccga ggtgcaaatc gacagactga tcaccggcag actgcagagc 3000
ctgcagacct acgtgacaca gcagctgatc agagccgccg agatcagagc tagcgccaac 3060
ctggccgcca ccaagatgag cgagtgcgtg ctggggcaga gcaagagagt ggacttctgc 3120
ggcaagggct accacctgat gagcttccct cagagcgccc cccacggcgt ggtgttcctg 3180
cacgtgacct acgtgcccgc ccaagagaag aacttcacca ccgcccctgc catctgccac 3240
gacggcaagg cccacttccc tagagagggc gtgttcgtga gcaacggcac ccactggttc 3300
gtgacacaga gaaacttcta cgagcctcag atcatcacca ccgacaacac cttcgtgagc 3360
ggcaattgcg acgtggtgat cggcatcgtg aacaacaccg tgtacgaccc cctgcagccc 3420
gagctggaca gcttcaagga ggagctggac aagtacttca agaaccacac aagccccgac 3480
gtggacctcg gggatatcag cggcatcaac gctagcgtgg tgaacattca gaaggagatc 3540
gatagactga atgaagtggc caagaacctg aacgagagcc tgatcgacct gcaagagctg 3600
ggcaagtacg agcagtacat caagtggccc tggtacatct ggctgggctt catcgccggc 3660
ctgatcgcca tcgtgatggt gaccatcatg ctgtgctgca tgacaagctg ctgcagctgc 3720
ctgaagggct gctgctcctg cggcagctgc tgcaagttcg acgaggacga cagcgagccc 3780
gtgctgaagg gcgtgaagct gcactacacc tgatga 3816
<210> 7
<211> 50
<212> DNA
<213> Artificial sequence
<400> 7
acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc 50
<210> 8
<211> 214
<212> DNA
<213> Artificial sequence
<400> 8
gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60
taaactgggg gatattatga agggccttga gcatctggat tctgcctgct cgctttcttg 120
ctgtccaatt tctattaaag gttcctttgt tccctaagtc caactactaa actgggggat 180
attatgaagg gccttgagca tctggattct gcct 214
<210> 9
<211> 120
<212> DNA
<213> Artificial sequence
<400> 9
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120
<210> 10
<211> 4229
<212> RNA
<213> Artificial sequence
<400> 10
aggacauuug cuucugacac aacuguguuc acuagcaacc ucaaacagac accggauccg 60
ccaccauguu cguguuccug gugcugcugc cccuggugag cagccaaugc gugaaccuga 120
ccacaagaac acagcugccc cccgccuaca ccaacagcuu cacaagaggc guguacuacc 180
ccgacaaggu guucagaagc agcguccucc acagcaccca agaccuguuc cugccuuucu 240
ucagcaacgu gaccugguuc cacgugauca gcggcaccaa cggcaccaag agauucgaca 300
accccgugcu gcccuucaac gacggcgugu acuucgcuag caucgaaaag agcaacauca 360
ucagaggcug gaucuucggc accacccucg auuccaagac ccaaagccug cugaucguca 420
acaacgccac caacguggug aucaaggugu gcgaguuuca guucugcaac gaccccuucc 480
uggaccacaa gaacaacaag agcuggaugg agagcgaguu cagaguguac agcagcgcca 540
acaacugcac cuucgaguac gugagccaac ccuuccugau ggaccuggag ggcaagcaag 600
gcaacuucaa aaaccugaga gaguucgugu ucaagaacau cgacggcuac uucaagaucu 660
acagcaagca cacccccauc aucgugagag agcccgagga ccugccccaa ggcuucagcg 720
cccuggagcc ccugguggac cugcccaucg gcaucaacau cacaagauuu cagacccugc 780
uggcccugca cagauccuac cugacaccug gggacagcag cagcggcugg accgcuggcg 840
ccgcugccua cuacgugggc uaccugcagc cuagaaccuu ccugcugaag uacaacgaga 900
acggcacaau caccgaugcc gucgacugcg cccuggaccc ccugagcgag accaagugca 960
cccucaagag cuucacagug gagaagggca ucuaucagac aagcaacuuc agagugcagc 1020
ccaccgagag caucgugaga uuccccaaca ucaccaaccu gugccccuuc gacgaggugu 1080
ucaacgccac aagauucgcu agcguguacg cuuggaacag aaagagaauc agcaacugcg 1140
uggccgacua cagcgugcug uacaaccugg cccccuucuu caccuucaag ugcuacgggg 1200
ucagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac agcuucguga 1260
ucagaggcga cgaggugaga cagaucgccc ccgggcagac cggcaacauc gccgacuaca 1320
acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc aacaagcugg 1380
auuccaaggu guccggcaac uacaacuacc uguacagacu guucagaaag agcaaccuga 1440
agcccuucga gagagacauc agcaccgaga ucuaccaagc cggcaacaag cccugcaacg 1500
gcguggccgg cuucaacugc uacuuccccc ucagaagcua cagcuucaga cccaccuacg 1560
gcgugggcca ucagcccuac agaguggucg ugcugagcuu cgagcugcug cacgcccccg 1620
ccacagugug cggccccaaa aagagcacca accuggugaa gaacaagugc gugaacuuca 1680
acuucaacgg ccugaagggc accggcgugc ugaccgagag caacaagaag uuccuccccu 1740
uucagcaguu cggcagagac aucgccgaca ccaccgacgc cgugagagac ccucagaccc 1800
uggagauccu ggacaucaca ccuugcagcu ucggcggcgu gagcgugauc acccccggca 1860
ccaacacaag caaccaagug gccgugcugu accaaggcgu gaacugcacc gaggugcccg 1920
uggccaucca cgccgaucag cugaccccca ccuggcgggu guacagcacc ggcagcaacg 1980
uguuucagac aagagccggc ugccugaucg gcgccgagua cgugaacaac agcuacgagu 2040
gcgacauccc caucggcgcc ggcaucugcg cuagcuauca gacacagacc aagagccacc 2100
ggagagcuag aagcguggcu agccaaagca ucaucgccua caccaugagc cugggcgccg 2160
agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc accaucagcg 2220
ugaccaccga gauccugccu gugagcauga ccaagacaag cguggacugc accauguaca 2280
ucugcggcga cagcaccgag ugcagcaacc ugcuccugca guacggcagc uucugcacac 2340
agcugaagag agcccugacc ggcaucgccg uggagcaaga caagaacacc caagaggugu 2400
ucgcccaagu gaagcagauc uacaagaccc cccccaucaa guacuucggc ggcuucaacu 2460
ucagccaaau ccugcccgau ccuagcaagc cuagcaagag aagcuucauc gaggaccugc 2520
uguucaacaa ggugacccug gccgacgccg gcuucaucaa gcaguacggc gacugccugg 2580
gcgauauugc cgcuagagac cugaucugcg cucagaaguu caagggccug accgugcugc 2640
ccccccugcu gaccgacgag augaucgcuc aguacacaag cgcccugcuc gcuggcacca 2700
ucaccuccgg cuggaccuuu ggggcuggcg ccgcucugca gauccccuuc gccaugcaga 2760
uggccuacag auucaacggc aucggcguga cacagaacgu gcuguacgag aaucagaagc 2820
ugaucgccaa ucaguucaac agcgccaucg gcaagaucca agacagccug agcagcaccg 2880
cuagcgcccu gggcaagcug caagacgugg ugaaccacaa cgcccaagcc cugaacaccc 2940
uggugaagca gcugagcagc aaguucggcg ccaucagcag cgugcucaac gacaucuuca 3000
gcagacugga caagguggag gccgaggugc aaaucgacag acugauuacc ggcagacugc 3060
agagccugca gaccuacgug acacagcagc ugaucagagc cgccgagauc agagcuagcg 3120
ccaaccuggc cgccaccaag augagcgagu gcgugcuggg gcagagcaag agaguggacu 3180
ucugcggcaa gggcuaccac cugaugagcu ucccucagag cgccccccac ggcguggugu 3240
uccugcacgu gaccuacgug cccgcccaag agaagaacuu caccaccgcc ccugcuaucu 3300
gccacgacgg caaggcccac uucccuagag agggcguguu cgugagcaac ggcacccacu 3360
gguucgugac acagagaaac uucuacgagc cucagaucau caccaccgac aacaccuucg 3420
ugagcggcaa cugcgacgug gugaucggca uugugaacaa caccguguac gacccccugc 3480
agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuuuaagaac cacacaagcc 3540
ccgacgugga ccugggggac auuagcggga ucaacgcuag cguggugaac auucagaagg 3600
agauugacag acugaacgag guggccaaga accugaacga gagccugauc gaccugcaag 3660
agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug ggcuucaucg 3720
ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugaca agcugcugcu 3780
ccugucucaa gggcugcugc agcugcggga gcugcugcaa guucgacgag gacgacagcg 3840
agcccgugcu gaagggcgug aagcugcacu acaccugaug aggcgcgccg cucgcuuucu 3900
ugcuguccaa uuucuauuaa agguuccuuu guucccuaag uccaacuacu aaacuggggg 3960
auauuaugaa gggccuugag caucuggauu cugccugcuc gcuuucuugc uguccaauuu 4020
cuauuaaagg uuccuuuguu cccuaagucc aacuacuaaa cugggggaua uuaugaaggg 4080
ccuugagcau cuggauucug ccugaauuca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4140
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4229
<210> 11
<211> 4229
<212> RNA
<213> Artificial sequence
<400> 11
aggacauuug cuucugacac aacuguguuc acuagcaacc ucaaacagac accggauccg 60
ccaccauguu cguguuccug gugcugcugc cccuggugag cagccaaugc gugaaccuga 120
ccacaagaac acagcugccc cccgccuaca ccaacagcuu cacaagaggc guguacuacc 180
ccgacaaggu guucagaagc agcguccucc acagcaccca agaccuguuc cugccuuucu 240
ucagcaacgu gaccugguuc cacgugauca gcggcaccaa cggcaccaag agauucgaca 300
accccgugcu gcccuucaac gacggcgugu acuucgcuag caucgaaaag agcaacauca 360
ucagaggcug gaucuucggc accacccucg auuccaagac ccaaagccug cugaucguca 420
acaacgccac caacguggug aucaaggugu gcgaguuuca guucugcaac gaccccuucc 480
uggaccacaa gaacaacaag agcuggaugg agagcgaguu cagaguguac agcagcgcca 540
acaacugcac cuucgaguac gugagccaac ccuuccugau ggaccuggag ggcaagcaag 600
gcaacuucaa aaaccugaga gaguucgugu ucaagaacau cgacggcuac uucaagaucu 660
acagcaagca cacccccauc aucgugagag agcccgagga ccugccccaa ggcuucagcg 720
cccuggagcc ccugguggac cugcccaucg gcaucaacau cacaagauuu cagacccugc 780
uggcccugca cagauccuac cugacaccug gggacagcag cagcggcugg accgcuggcg 840
ccgcugccua cuacgugggc uaccugcagc cuagaaccuu ccugcugaag uacaacgaga 900
acggcacaau caccgaugcc gucgacugcg cccuggaccc ccugagcgag accaagugca 960
cccucaagag cuucacagug gagaagggca ucuaucagac aagcaacuuc agagugcagc 1020
ccaccgagag caucgugaga uuccccaaca ucaccaaccu gugccccuuc gacgaggugu 1080
ucaacgccac aagauucgcu agcguguacg cuuggaacag aaagagaauc agcaacugcg 1140
uggccgacua cagcgugcug uacaaccugg cccccuucuu caccuucaag ugcuacgggg 1200
ucagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac agcuucguga 1260
ucagaggcga cgaggugaga cagaucgccc ccgggcagac cggcaacauc gccgacuaca 1320
acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc aacaagcugg 1380
auuccaaggu guccggcaac uacaacuacc uguacagacu guucagaaag agcaaccuga 1440
agcccuucga gagagacauc agcaccgaga ucuaccaagc cggcaacaag cccugcaacg 1500
gcguggccgg cuucaacugc uacuuccccc ucagaagcua cagcuucaga cccaccuacg 1560
gcgugggcca ucagcccuac agaguggucg ugcugagcuu cgagcugcug cacgcccccg 1620
ccacagugug cggccccaaa aagagcacca accuggugaa gaacaagugc gugaacuuca 1680
acuucaacgg ccugaagggc accggcgugc ugaccgagag caacaagaag uuccuccccu 1740
uucagcaguu cggcagagac aucgccgaca ccaccgacgc cgugagagac ccucagaccc 1800
uggagauccu ggacaucaca ccuugcagcu ucggcggcgu gagcgugauc acccccggca 1860
ccaacacaag caaccaagug gccgugcugu accaaggcgu gaacugcacc gaggugcccg 1920
uggccaucca cgccgaucag cugaccccca ccuggcgggu guacagcacc ggcagcaacg 1980
uguuucagac aagagccggc ugccugaucg gcgccgagua cgugaacaac agcuacgagu 2040
gcgacauccc caucggcgcc ggcaucugcg cuagcuauca gacacagacc aagagccacc 2100
ggagagcuag aagcguggcu agccaaagca ucaucgccua caccaugagc cugggcgccg 2160
agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc accaucagcg 2220
ugaccaccga gauccugccu gugagcauga ccaagacaag cguggacugc accauguaca 2280
ucugcggcga cagcaccgag ugcagcaacc ugcuccugca guacggcagc uucugcacac 2340
agcugaagag agcccugacc ggcaucgccg uggagcaaga caagaacacc caagaggugu 2400
ucgcccaagu gaagcagauc uacaagaccc cccccaucaa guacuucggc ggcuucaacu 2460
ucagccaaau ccugcccgau ccuagcaagc cuagcaagag aagcuucauc gaggaccugc 2520
uguucaacaa ggugacccug gccgacgccg gcuucaucaa gcaguacggc gacugccugg 2580
gcgauauugc cgcuagagac cugaucugcg cucagaaguu caagggccug accgugcugc 2640
ccccccugcu gaccgacgag augaucgcuc aguacacaag cgcccugcuc gcuggcacca 2700
ucaccuccgg cuggaccuuu ggggcuggcg ccgcucugca gauccccuuc gccaugcaga 2760
uggccuacag auucaacggc aucggcguga cacagaacgu gcuguacgag aaucagaagc 2820
ugaucgccaa ucaguucaac agcgccaucg gcaagaucca agacagccug agcagcaccg 2880
cuagcgcccu gggcaagcug caagacgugg ugaaccacaa cgcccaagcc cugaacaccc 2940
uggugaagca gcugagcagc aaguucggcg ccaucagcag cgugcucaac gacaucuuca 3000
gcagacugga cccccccgag gccgaggugc aaaucgacag acugauuacc ggcagacugc 3060
agagccugca gaccuacgug acacagcagc ugaucagagc cgccgagauc agagcuagcg 3120
ccaaccuggc cgccaccaag augagcgagu gcgugcuggg gcagagcaag agaguggacu 3180
ucugcggcaa gggcuaccac cugaugagcu ucccucagag cgccccccac ggcguggugu 3240
uccugcacgu gaccuacgug cccgcccaag agaagaacuu caccaccgcc ccugcuaucu 3300
gccacgacgg caaggcccac uucccuagag agggcguguu cgugagcaac ggcacccacu 3360
gguucgugac acagagaaac uucuacgagc cucagaucau caccaccgac aacaccuucg 3420
ugagcggcaa cugcgacgug gugaucggca uugugaacaa caccguguac gacccccugc 3480
agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuuuaagaac cacacaagcc 3540
ccgacgugga ccugggggac auuagcggga ucaacgcuag cguggugaac auucagaagg 3600
agauugacag acugaacgag guggccaaga accugaacga gagccugauc gaccugcaag 3660
agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug ggcuucaucg 3720
ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugaca agcugcugcu 3780
ccugucucaa gggcugcugc agcugcggga gcugcugcaa guucgacgag gacgacagcg 3840
agcccgugcu gaagggcgug aagcugcacu acaccugaug aggcgcgccg cucgcuuucu 3900
ugcuguccaa uuucuauuaa agguuccuuu guucccuaag uccaacuacu aaacuggggg 3960
auauuaugaa gggccuugag caucuggauu cugccugcuc gcuuucuugc uguccaauuu 4020
cuauuaaagg uuccuuuguu cccuaagucc aacuacuaaa cugggggaua uuaugaaggg 4080
ccuugagcau cuggauucug ccugaauuca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4140
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4229
<210> 12
<211> 4229
<212> RNA
<213> Artificial sequence
<400> 12
aggacauuug cuucugacac aacuguguuc acuagcaacc ucaaacagac accggauccg 60
ccaccauguu cguguuccug gugcugcugc cccuggugag cagccaaugc gugaaccuga 120
ccacaagaac acagcugccc cccgccuaca ccaacagcuu cacaagaggc guguacuacc 180
ccgacaaggu guucagaagc uccguccucc acagcaccca agaccuguuc cuccccuucu 240
ucagcaacgu gaccugguuc cacgugauca gcggcaccaa cggcaccaag agauucgaca 300
accccgugcu gcccuucaac gacggcgugu acuucgcuag caucgaaaag agcaacauca 360
ucagaggcug gaucuucggc accacccugg acagcaagac acagagccug cugaucguca 420
acaacgccac caacguggug aucaaggugu gcgaguuuca guucugcaac gaccccuucc 480
uggaccacaa gaacaacaag agcuggaugg agagcgaguu cagaguguac agcagcgcca 540
acaacugcac cuucgaguac gugagccaac ccuuccugau ggaccuggag ggcaagcaag 600
gcaacuucaa aaaccugaga gaguucgugu ucaagaacau cgacggcuac uucaagaucu 660
acagcaagca cacccccauc aucgugagag agcccgagga ccugccccaa ggcuucagcg 720
cccuggagcc ccugguggac cugcccaucg gcaucaacau cacaagauuu cagacacucc 780
ucgcccugca ccggagcuac cucaccccug gggauagcag cagcggcugg accgccggcg 840
cugccgccua cuacgugggc uaccugcagc cuagaaccuu ccugcugaag uacaacgaga 900
acggcaccau cacagacgcc gucgacugug cccuggaccc ccugagcgag accaagugca 960
cccugaaguc cuucaccgug gagaagggca ucuaucagac aagcaacuuc agagugcagc 1020
ccaccgagag caucgugaga uuccccaaca ucaccaaccu gugccccuuc gacgaggugu 1080
ucaacgccac aagauucgcu agcguguacg cuuggaaccg gaagagaauc agcaacugcg 1140
uggccgacua cagcgugcug uacaaccugg cccccuucuu caccuucaag uguuacgggg 1200
ugagccccac caagcugaac gaccugugcu ucaccaacgu guacgccgac agcuucguga 1260
ucagaggcga cgaggugaga cagaucgccc ccgggcagac cggcaacauc gccgacuaca 1320
acuacaagcu gcccgacgac uucaccggcu gcgugaucgc cuggaacagc aauaagcucg 1380
acagcaaggu gagcggcaac uacaacuacc uguacagacu guucagaaag agcaaccuga 1440
agcccuucga gagagacauc agcaccgaga ucuaccaagc cggcaacaag cccugcaacg 1500
gcguggccgg cuucaacugc uacuuccccc ucagaagcua cagcuucaga cccaccuacg 1560
gcgugggcca ucagcccuac agaguggucg ugcugagcuu cgagcugcug cacgcccccg 1620
ccaccgugug cggccccaaa aagagcacca accuggugaa gaacaagugc gugaacuuca 1680
acuucaacgg ccugaagggc accggcgugc ugaccgagag caacaagaag uuccugccuu 1740
uucagcaguu cggcagagac aucgccgaca ccaccgacgc cgugagagac ccucagaccc 1800
uggagauccu ggacaucacc cccuguuccu ucggcggcgu gagcgugauc acccccggca 1860
ccaacacaag caaccaagug gccgugcugu accaaggcgu gaacugcacc gaggugcccg 1920
uggccaucca cgccgaucag cugaccccca ccuggagagu guauagcacc ggcagcaacg 1980
uguuucagac aagagccggc ugccugaucg gcgccgagua cgugaacaac agcuacgagu 2040
gcgacauccc caucggcgcc ggcaucugcg cuagcuauca gacacagacc aagagccacc 2100
ggagagcuag aagcguggcu agccaaagca ucaucgccua caccaugagc cugggcgccg 2160
agaacagcgu ggccuacagc aacaacagca ucgccauccc caccaacuuc accaucagcg 2220
ugaccaccga aauccugccc guguccauga ccaagacaag cguggacugc accauguaca 2280
ucugcggcga cagcaccgag ugcagcaacc ugcuccugca guacggcagc uucugcacac 2340
agcugaagag agcccugacc ggcaucgccg uggagcaaga caagaacacc caagaggugu 2400
ucgcccaagu gaagcagauc uacaagaccc cccccaucaa guacuucggc ggcuucaacu 2460
ucagccaaau ccugcccgac ccuagcaagc cuagcaagag aagccccauc gaggaccugc 2520
uguucaacaa ggugacccug gccgacgccg gcuucaucaa gcaguacggc gacugccucg 2580
gcgacaucgc ugcuagagac cugaucugcg cucagaaguu caagggccug accgugcugc 2640
ccccccugcu gaccgacgag augauugcuc aguacacaag cgcccugcug gccgggacaa 2700
ucacaagcgg guggaccuuu ggcgcuggcc ccgcccugca gauccccuuc cccaugcaga 2760
uggccuacag auucaacggc aucggcguga cacagaacgu gcuguacgag aaucagaagc 2820
ugaucgccaa ucaguucaac agcgccaucg gcaagaucca agacagccug agcagcaccc 2880
cuagcgcccu gggcaagcug caagacgugg ugaaccacaa cgcccaagcc cugaacaccc 2940
uggugaagca gcugagcagc aaguucggcg ccaucagcag cguccugaau gacaucuuca 3000
gcagacugga cccccccgag gccgaggugc aaaucgacag acugaucacc ggcagacugc 3060
agagccugca gaccuacgug acacagcagc ugaucagagc cgccgagauc agagcuagcg 3120
ccaaccuggc cgccaccaag augagcgagu gcgugcuggg gcagagcaag agaguggacu 3180
ucugcggcaa gggcuaccac cugaugagcu ucccucagag cgccccccac ggcguggugu 3240
uccugcacgu gaccuacgug cccgcccaag agaagaacuu caccaccgcc ccugccaucu 3300
gccacgacgg caaggcccac uucccuagag agggcguguu cgugagcaac ggcacccacu 3360
gguucgugac acagagaaac uucuacgagc cucagaucau caccaccgac aacaccuucg 3420
ugagcggcaa uugcgacgug gugaucggca ucgugaacaa caccguguac gacccccugc 3480
agcccgagcu ggacagcuuc aaggaggagc uggacaagua cuucaagaac cacacaagcc 3540
ccgacgugga ccucggggau aucagcggca ucaacgcuag cguggugaac auucagaagg 3600
agaucgauag acugaaugaa guggccaaga accugaacga gagccugauc gaccugcaag 3660
agcugggcaa guacgagcag uacaucaagu ggcccuggua caucuggcug ggcuucaucg 3720
ccggccugau cgccaucgug auggugacca ucaugcugug cugcaugaca agcugcugca 3780
gcugccugaa gggcugcugc uccugcggca gcugcugcaa guucgacgag gacgacagcg 3840
agcccgugcu gaagggcgug aagcugcacu acaccugaug aggcgcgccg cucgcuuucu 3900
ugcuguccaa uuucuauuaa agguuccuuu guucccuaag uccaacuacu aaacuggggg 3960
auauuaugaa gggccuugag caucuggauu cugccugcuc gcuuucuugc uguccaauuu 4020
cuauuaaagg uuccuuuguu cccuaagucc aacuacuaaa cugggggaua uuaugaaggg 4080
ccuugagcau cuggauucug ccugaauuca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4140
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4200
aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4229
<210> 13
<211> 20
<212> DNA
<213> Artificial sequence
<400> 13
taatacgact cactataagg 20
<210> 14
<211> 2640
<212> DNA
<213> Artificial sequence
<400> 14
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagactgtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggattctag 420
agcggccgca tcccaatggc gcgccgagct tggctcgagc atggtcatag ctgtttcctg 480
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 540
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 600
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 660
gaggcggttt gcgtattggg cgctgttccg cttcctcgct cactgactcg ctgcgctcgg 720
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 780
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 840
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 900
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 960
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 1020
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 1080
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 1140
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 1200
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 1260
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 1320
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 1380
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 1440
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 1500
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 1560
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 1620
acagttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 1680
caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 1740
tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 1800
aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 1860
cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 1920
gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 1980
attgcgcctg agcgaaacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 2040
tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 2100
gatattcttc taatacctgg aatgctgttt tcccagggat cgcagtggtg agtaaccatg 2160
catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 2220
agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 2280
gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 2340
cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 2400
gcggcctaga gcaagacgtt tcccgttgaa tatggctcat actcttcctt tttcaatatt 2460
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 2520
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag 2580
aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg cccttttgtc 2640

Claims (16)

1.RNA分子,其特征在于:所述RNA分子包括编码SARS-CoV-2的抗原性多肽或者免疫原性片段的核酸序列;其中,所述抗原性多肽或所述免疫原性片段选自SARS-CoV-2的S蛋白或其变体、SARS-CoV-2的受体结合结构域或其变体;
所述SARS-CoV-2的S蛋白的变体与所述SARS-CoV-2的S蛋白的原始序列相比,存在如下突变位点:K983P和V984P;
进一步地,所述SARS-CoV-2是SARS-CoV-2 Omicron变异病毒株。
2.根据权利要求1所述的RNA分子,其特征在于:所述SARS-CoV-2的S蛋白的变体与所述SARS-CoV-2的S蛋白的原始序列相比,还存在如下突变位点中的全部或部分:F814P、A889P、A896P、A939P。
3.根据权利要求1或2所述的RNA分子,其特征在于:所述抗原性多肽或者所述免疫原性片段为如下任一:
(A1)SARS-CoV-2 Omicron变异病毒株的S蛋白;
(A2)SARS-CoV-2 Omicron变异病毒株的S蛋白变体Omicron S-2P,其氨基酸序列与所述SARS-CoV-2 Omicron变异病毒株的S蛋白的原始序列相比,仅存在K983P和V984P两个突变位点;
(A3)SARS-CoV-2 Omicron变异病毒株的S蛋白变体Omicron S-6P,其氨基酸序列与所述SARS-CoV-2 Omicron变异病毒株的S蛋白的原始序列相比,仅存在F814P、A889P、A896P、A939P、K983P和V984P六个突变位点;
(A4)SEQ ID No.1的第17-1270位或SEQ ID No.2的第17-1270位或SEQ ID No.3的第17-1270位所示多肽;
(A5)与(A4)所限定的氨基酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性的多肽。
4.根据权利要求1-3中任一所述的RNA分子,其特征在于:所述编码SARS-CoV-2的抗原性多肽或者免疫原性片段的核酸序列为如下任一:
(B1)将SEQ ID No.4的第49-3810位或SEQ ID No.5的第49-3810位或SEQ ID No.6的第49-3810位核苷酸中的T替换为U后所得核苷酸序列;
(B2)与(B1)所限定的核苷酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性。
5.根据权利要求1-4中任一所述的RNA分子,其特征在于:所述RNA分子还包含用于编码分泌信号肽的核酸序列;
进一步地,编码所述分泌信号肽的核酸序列位于编码所述抗原性多肽或者所述免疫原性片段的核酸序列的5’端;和/或
进一步地,所述分泌信号肽为如下任一:
(C1)SARS-CoV-2的S蛋白的分泌信号肽;
(C2)SEQ ID No.1的第1-16位或SEQ ID No.2的第1-16位或SEQ ID No.3的第1-16位所示多肽;
(C3)与(C2)所限定的氨基酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性的多肽。
6.根据权利要求5所述的RNA分子,其特征在于:编码所述分泌信号肽的核酸序列为如下任一:
(D1)将SEQ ID No.4的第1-48位或SEQ ID No.5的第1-48位或SEQ ID No.6的第1-48位核苷酸中的T替换为U后所得核苷酸序列;
(D2)与(D1)所限定的核苷酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性。
7.根据权利要求1-6中任一所述的RNA分子,其特征在于:所述RNA分子为mRNA、环状RNA或自复制RNA。
8.根据权利要求1-7中任一所述的RNA分子,其特征在于:所述RNA分子为经过修饰的RNA分子;
进一步地,所述修饰是通过用修饰的尿苷残基取代一些或全部原始尿苷残基;
更进一步地,所述修饰的尿苷为N1-甲基-假尿苷;
和/或
所述RNA分子还包括一个或多个能够促进稳定性和/或翻译效率的结构元件;
进一步地,所述结构元件包括:5’帽、5’UTR、3’UTR和/或polyA尾;
更进一步地,所述5’帽是或包含cap1结构;更加具体地,所述5’帽是m7G(5’)ppp(5’)(2’-OMeA)pG;和/或
更进一步地,所述5'-UTR是人β-珠蛋白mRNA的5'-UTR序列;和/或,所述5'-UTR具有Kozak序列;更加具体地,所述5’UTR包含或为SEQ ID No.7所示核苷酸序列,或与SEQ IDNo.7所示核苷酸序列具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性的核苷酸序列;和/或
更进一步地,所述3'-UTR是人β-珠蛋白mRNA的两个重复的3'-UTR;更加具体地,所述3’UTR包含或为SEQ ID No.8所示核苷酸序列,或与SEQ ID No.8所示核苷酸序列具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性的核苷酸序列;和/或
更进一步地,所述polyA尾包含至少50、至少60或至少100个腺嘌呤核糖核苷酸;更加具体地,所述polyA尾包含或为SEQ ID No.9所示核苷酸序列,或由SEQ ID No.9所示核苷酸序列组成。
9.根据权利要求1-8中任一所述的RNA分子,其特征在于:所述RNA分子的序列为如下任一:
(E1)SEQ ID No.10或SEQ ID No.11SEQ ID No.12;
(E2)与(E1)所限定的核苷酸序列相比具有至少99%、98%、97%、96%、95%、90%、85%或80%同源性。
10.如下任一生物材料:
(F1)能够转录得到权利要求1-9中任一所述RNA分子的DNA分子;
(F2)含有(F2)中所述DNA分子的表达盒或重组载体或重组菌或重组细胞系。
11.用于预防和/或治疗新冠病毒感染的组合物,其包含权利要求1-9中任一所述的RNA分子。
12.根据权利要求11所述的组合物,其特征在于:所述组合物为将所述RNA分子与蛋白和/或脂质复合而成的RNA-颗粒;
进一步地,所述组合物为将所述RNA分子负载于脂质纳米颗粒中后得到;所述脂质纳米颗粒为如下任一:
(G1)包含可电离的阳离子脂质、磷脂、胆固醇和聚乙二醇-脂质;
(G2)包含十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基)辛酸酯)、二肉豆蔻酰甘油-聚乙二醇2000、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱和胆固醇。
13.权利要求1-9中任一所述RNA分子或权利要求10所述生物材料或权利要求11或12所述组合物在制备用于预防和/或治疗新冠病毒感染的药物中的用途。
14.一种用于预防和/或治疗新冠病毒感染的药物,其有效成分包括权利要求1-7中任一所述的RNA分子。
15.根据权利要求13所述的用途或权利要求14所述的药物,其特征在于:所述冠状病毒为β冠状病毒;和/或
所述冠状病毒为沙贝病毒;和/或
所述冠状病毒为SARS-CoV-2;
进一步地,所述冠状病毒为SARS-CoV-2Omicron变异病毒株。
16.一种制备用于预防和/或治疗新冠病毒感染的RNA疫苗的方法,包括将权利要求1-9中任一所述RNA分子负载于脂质纳米颗粒中的步骤;
所述脂质纳米颗粒为如下任一:
(G1)包含可电离的阳离子脂质、磷脂、胆固醇和聚乙二醇-脂质;
(G2)包含十七烷-9-基8-((2-羟乙基)(6-氧代-6-((癸氧基)己基)氨基)辛酸酯)、二肉豆蔻酰甘油-聚乙二醇2000、1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱和胆固醇。
CN202210724687.8A 2022-06-24 2022-06-24 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗 Active CN114934056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210724687.8A CN114934056B (zh) 2022-06-24 2022-06-24 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210724687.8A CN114934056B (zh) 2022-06-24 2022-06-24 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗

Publications (2)

Publication Number Publication Date
CN114934056A true CN114934056A (zh) 2022-08-23
CN114934056B CN114934056B (zh) 2023-10-20

Family

ID=82868674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210724687.8A Active CN114934056B (zh) 2022-06-24 2022-06-24 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗

Country Status (1)

Country Link
CN (1) CN114934056B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024021817A1 (zh) * 2022-07-27 2024-02-01 珠海丽凡达生物技术有限公司 新型冠状病毒疫苗及其制备方法和应用

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113325177A (zh) * 2021-06-04 2021-08-31 博奥赛斯(重庆)生物科技有限公司 一种包含新型冠状病毒突变抗原的中和抗体检测试剂盒及其应用
WO2021178971A1 (en) * 2020-03-06 2021-09-10 The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. Vaccines against sars-cov-2 and other coronaviruses
CN113521269A (zh) * 2020-04-22 2021-10-22 生物技术Rna制药有限公司 冠状病毒疫苗
CN114096675A (zh) * 2020-02-14 2022-02-25 艾天穆股份有限公司 冠状病毒免疫原性组合物和其用途
CN114480442A (zh) * 2020-10-27 2022-05-13 深圳吉诺因生物科技有限公司 一种mRNA及包含其的新型冠状病毒mRNA疫苗
CN114752631A (zh) * 2022-06-15 2022-07-15 中国人民解放军军事科学院军事医学研究院 Rna及包含其的新型冠状病毒疫苗和制备方法
WO2022234283A1 (en) * 2021-05-07 2022-11-10 Astrazeneca Uk Limited Compositions and methods for inducing an immune response
CN115335390A (zh) * 2022-01-10 2022-11-11 广州市锐博生物科技有限公司 基于SARS-CoV-2的S蛋白的疫苗和组合物
WO2023064907A1 (en) * 2021-10-15 2023-04-20 Yale University Compositions and methods for vaccination against pathogenic coronavirus species and variants
WO2023081936A2 (en) * 2021-11-08 2023-05-11 Gritstone Bio, Inc. Sars-cov-2 vaccines
CN116410992A (zh) * 2023-03-10 2023-07-11 北京新合睿恩生物医疗科技有限公司 预防和/或治疗新型冠状病毒的mRNA、疫苗及其制备方法和应用
CN116426543A (zh) * 2021-12-30 2023-07-14 珠海丽凡达生物技术有限公司 一种新型冠状病毒疫苗及其制备方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114096675A (zh) * 2020-02-14 2022-02-25 艾天穆股份有限公司 冠状病毒免疫原性组合物和其用途
WO2021178971A1 (en) * 2020-03-06 2021-09-10 The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. Vaccines against sars-cov-2 and other coronaviruses
CN113521269A (zh) * 2020-04-22 2021-10-22 生物技术Rna制药有限公司 冠状病毒疫苗
CN114480442A (zh) * 2020-10-27 2022-05-13 深圳吉诺因生物科技有限公司 一种mRNA及包含其的新型冠状病毒mRNA疫苗
WO2022234283A1 (en) * 2021-05-07 2022-11-10 Astrazeneca Uk Limited Compositions and methods for inducing an immune response
CN113325177A (zh) * 2021-06-04 2021-08-31 博奥赛斯(重庆)生物科技有限公司 一种包含新型冠状病毒突变抗原的中和抗体检测试剂盒及其应用
WO2023064907A1 (en) * 2021-10-15 2023-04-20 Yale University Compositions and methods for vaccination against pathogenic coronavirus species and variants
WO2023081936A2 (en) * 2021-11-08 2023-05-11 Gritstone Bio, Inc. Sars-cov-2 vaccines
CN116426543A (zh) * 2021-12-30 2023-07-14 珠海丽凡达生物技术有限公司 一种新型冠状病毒疫苗及其制备方法
CN115335390A (zh) * 2022-01-10 2022-11-11 广州市锐博生物科技有限公司 基于SARS-CoV-2的S蛋白的疫苗和组合物
CN114752631A (zh) * 2022-06-15 2022-07-15 中国人民解放军军事科学院军事医学研究院 Rna及包含其的新型冠状病毒疫苗和制备方法
CN116410992A (zh) * 2023-03-10 2023-07-11 北京新合睿恩生物医疗科技有限公司 预防和/或治疗新型冠状病毒的mRNA、疫苗及其制备方法和应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
SHAHZAIB AHAMAD等: "Structural stability predictions and molecular dynamics simulations of RBD and HR1 mutations associated with SARS-CoV-2 spike glycoprotein", J BIOMOL STRUCT DYN, vol. 40, pages 6697 - 6709 *
XIAOMAN LIU等: "SARS-CoV-2 spike protein-induced cell fusion activates the cGAS-STING pathway and the interferon response", SCIENCE SIGNALING, vol. 15, pages 1 - 14 *
XUPING XIE等: "Neutralization of SARS-CoV-2 Omicron sublineages by 4 doses of the original mRNA vaccine", CELL REPORTS, vol. 41, pages 1 - 10 *
刘宏等: "SARS-CoV-2奥密克戎变异株的研究进展", 中国比较医学杂志, vol. 32, no. 06, pages 122 - 127 *
杨安纳等: "Omicron株新型冠状病毒灭活疫苗(Vero细胞)原液特异性鉴别试验RT-PCR法的建立及验证", 中国生物制品学杂志, vol. 35, pages 700 - 705 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024021817A1 (zh) * 2022-07-27 2024-02-01 珠海丽凡达生物技术有限公司 新型冠状病毒疫苗及其制备方法和应用

Also Published As

Publication number Publication date
CN114934056B (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
ES2805045T3 (es) Vectores lentivirales
CN111218459A (zh) 一种以人复制缺陷腺病毒为载体的重组新型冠状病毒疫苗
CN108371710B (zh) 猫传染性鼻结膜炎和猫泛白细胞减少症二联疫苗及制备方法
Gómez et al. Transient expression of VP2 in Nicotiana benthamiana and its use as a plant-based vaccine against infectious bursal disease virus
KR20150134423A (ko) 식물에서 인플루엔자 바이러스-유사 입자 생산
CN116322760A (zh) 冠状病毒抗原组合物及其用途
US20230340535A1 (en) Novel vesicular stomatitis virus and virus rescue system
CN110981968B (zh) 含有狂犬病病毒g蛋白的融合蛋白及其制备方法、应用和疫苗
CN114934056B (zh) 一种基于新型冠状病毒奥密克戎突变株的mRNA疫苗
Perez et al. A single dose of an MVA vaccine expressing a prefusion-stabilized SARS-CoV-2 spike protein neutralizes variants of concern and protects mice from a lethal SARS-CoV-2 infection
CN110951699A (zh) 表达犬瘟热病毒结构蛋白的重组狂犬病病毒及其应用
Mbewana et al. Chimaeric Rift Valley fever virus‐like particle vaccine candidate production in Nicotiana benthamiana
KR20160013824A (ko) 신규 이소프렌 신타아제 및 이를 이용한 이소프렌의 제조방법
US11384365B2 (en) EHV with inactivated UL18 and/or UL8
CN117244048A (zh) 一种禽流感病毒mRNA疫苗及其制备方法和应用
CN110295190A (zh) 用汉逊酵母表达系统产生hpv45 l1蛋白的方法
CN110592133A (zh) 用汉逊酵母表达系统产生hpv31 l1蛋白的方法
CN116457461A (zh) 重组hvt及其用途
CN108060141B (zh) Vp2基因和np基因重组腺病毒及其应用
KR20030074593A (ko) 토끼 출혈병 백신 및 항원
US11033616B2 (en) Recombinant viral vector systems expressing exogenous feline paramyxovirus genes and vaccines made therefrom
CN104726416B (zh) 提供流感病毒异源保护的病毒样颗粒及其方法和应用
CN113234692B (zh) 一种包含狂犬病毒糖蛋白的感染性克隆及应用
CN110305807B (zh) 用汉逊酵母表达系统产生hpv33 l1蛋白的方法
WO2023202711A1 (zh) 一种基于新型冠状病毒的mRNA疫苗

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant