CN112546211A - 基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法 - Google Patents

基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法 Download PDF

Info

Publication number
CN112546211A
CN112546211A CN202011149802.0A CN202011149802A CN112546211A CN 112546211 A CN112546211 A CN 112546211A CN 202011149802 A CN202011149802 A CN 202011149802A CN 112546211 A CN112546211 A CN 112546211A
Authority
CN
China
Prior art keywords
mrna
spike
jcxh
gene
plasmid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011149802.0A
Other languages
English (en)
Inventor
王子豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiachen Xihai Hangzhou Biotechnology Co ltd
Original Assignee
Jiachen Xihai Hangzhou Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiachen Xihai Hangzhou Biotechnology Co ltd filed Critical Jiachen Xihai Hangzhou Biotechnology Co ltd
Priority to CN202011149802.0A priority Critical patent/CN112546211A/zh
Publication of CN112546211A publication Critical patent/CN112546211A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P11/00Drugs for disorders of the respiratory system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/16Antivirals for RNA viruses for influenza or rhinoviruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/54Medicinal preparations containing antigens or antibodies characterised by the route of administration
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/575Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/70Multivalent vaccine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Virology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Communicable Diseases (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Pulmonology (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Epidemiology (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本发明公开了一种基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法,联合疫苗包括:脂质体包裹的mRNA‑Spike和脂质体包裹的mRNA‑HA二者混合的联合疫苗,脂质体包裹的mRNA‑RBD‑HA的联合疫苗;mRNA根据α病毒家族中委内瑞拉马脑脊髓炎病毒TC83的基因组设计而成;mRNA‑Spike包含了新冠肺炎的刺突Spike蛋白基因,mRNA‑HA包含了流感的血凝素蛋白基因,mRNA‑Spike包含了新冠肺炎的刺突Spike蛋白基因和流感的血凝素蛋白基因;本发明通过使用一条mRNA能够同时表达冠状病毒和流感病毒的抗原,具有强免疫原性,既能减轻病人痛苦,又能够达到注射单种病毒疫苗的免疫效果。

Description

基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备 方法
技术领域
本发明涉及医药领域,特别是一种基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法。
背景技术
冠状病毒是一个大型病毒家族,可引起普通感冒乃至中东呼吸综合征(MERS)、严重急性呼吸综合征(SARS)、COVID19 等严重疾病。感染的常见体征有呼吸道症状、发热、咳嗽、气短和呼吸困难等。在较严重病例中,感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡。冠状病毒是一种在动物与人类之间传播的人畜共患病毒。详细调查结果显示,严重急性呼吸综合征冠状病毒是从果子狸传到人,中东呼吸综合征冠状病毒是从单峰骆驼传到人。除此之外,还有一些已知的冠状病毒在动物中传播,但尚未感染人类。新型冠状病毒SARS-CoV-2是以前从未在人类中发现的一种新冠状病毒毒株。
SARS-CoV-2引起的严重的传染性疾病COVID19。SARS-CoV-2具有好传染性高致死率的特点,截止2020年8月,在全球范围内SARS-CoV-2已经引起2100多万人感染,77万多人死亡和可能高达21万亿美元的损失。据现有数据预测,以新冠病毒为代表的冠状病毒很有可能成为一个长期存在、年度流行的病毒。有效的疫苗是应对冠状病毒感染的最佳手段。
流感是一种由流感病毒(通常是流感A或B亚型)引起的传染性急性呼吸道疾病。流感可导致轻度到重度疾病,也可造成潜在疾病发作或继发细菌感染。某些人很容易患严重流感并发症,如孕妇、老人、小孩以及一些患有慢性疾病的人。每年流感都会造成约300万至500万件重症感染,其中约25万至50万人死亡。免疫接种是预防流感病毒感染的最好干预途径。
按现有的数据和流行病规律预测,冠状病毒和流感病毒的流行时间窗口会有很大程度的重合。因而开发同时针对冠状病毒和流感病毒的联合疫苗将会在免疫接种方案和成本上提供极大的方便和优势。
传统灭活疫苗、重组蛋白疫苗生产周期长,工艺复杂无法应对突发性大规模流行病的大规模接种需要。mRNA则是一种应对爆发性疫情的快速反应疫苗开发平台。近年来Moderna和BioNTech公司开发的mRNA(信使核糖核酸)疫苗启动临床试验,提供了mRNA疫苗的安全性和有效性的前期数据。mRNA疫苗是利用线性化的质粒DNA为模板,在体外进行酶转录反应合成的,该合成策略避免了活细胞培养生产方式,需要考虑的安全性以及复杂的生产工艺等问题。mRNA疫苗平台具有安全,有效,生产周期短,工艺简洁的特点,因而特别适合应对爆发性疫情。
市场至今未出现能够同时表达冠状病毒和流感病毒的抗原的疫苗,需要针对不同的病毒注射两次,增加病人痛苦。
市场需要一种能够同时防疫冠状病毒和流感病毒的联合疫苗,既能减轻病人痛苦,又能够达到注射单种病毒疫苗的免疫效果;本发明解决这样的问题。
发明内容
为解决现有技术的不足,本发明的目的在于提供一种基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法,通过使用一条mRNA能够同时表达冠状病毒和流感病毒的抗原,具有强免疫原性,既能减轻病人痛苦,又能够达到注射单种病毒疫苗的免疫效果。
为了实现上述目标,本发明采用如下的技术方案:
基于mRNA的针对冠状病毒和流感病毒的联合疫苗,包括:脂质体包裹的mRNA-Spike,脂质体包裹的mRNA-HA; mRNA根据α病毒的基因组设计而成;mRNA-Spike包含了新冠肺炎的刺突Spike蛋白基因,mRNA-HA包含了流感的血凝素蛋白基因。
基于mRNA的针对冠状病毒和流感病毒的联合疫苗,包括:脂质体包裹的mRNA-RBD-HA;mRNA根据α病毒的基因组设计而成;mRNA-Spike包含了新冠肺炎的刺突Spike蛋白基因和流感的血凝素蛋白基因。
前述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗,mRNA包括:常规mRNA或自复制mRNA。
前述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗,自复制mRNA利用线性化的质粒DNA为模板,在体外进行酶转录反应合成。
基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,包括如下步骤:
步骤一,制备mRNA-Spike制剂的步骤包括:
步骤a,合成Spike基因片段:
查询Spike氨基酸序列,根据人偏好密码子表进行密码子优化得到优化后的序列,在优化后的序列的上游加入启动子和 ApaI酶切位点GGGCCC,下游加入NotI酶切位点GCGGCCGC,将设计好的序列通过合成获得;
步骤b,构建TC-83自复制载体:
根据α病毒家族的基因组设计自复制mRNA序列,所述自复制mRNA序列包含可编码α病毒自复制组件的基因,缺乏制造具有传染性的α病毒颗粒的结构蛋白的基因,将自复制mRNA序列构建到的质粒中做为模板扩增,将设计好的序列通过合成获得;
步骤c,制备重组质粒JCXH-103:
将上游携带ApaI、下游携带NotI的Spike基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒JCXH-103;
步骤d,JCXH-103质粒用限制性内切酶切线性化;
步骤e,将线性化的JCXH-103质粒进行体外转录反应,再对模板DNA进行降解,最后将7-甲基化鸟苷酸帽结构加至转录的mRNA的5’端;
步骤f,mRNA与脂类混合,mRNA包裹进入LNP内,得到mRNA-LNP复合物,通过浓缩及换液至制剂溶液中。
步骤二,制备mRNA-HA制剂的步骤包括:
步骤A,合成Flu基因片段;
步骤B,构建TC-83自复制载体;
步骤C,将上游携带ApaI、下游携带NotI的HA基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒JCXH-104;
步骤D,JCXH-104质粒用限制性内切酶切线性化;
步骤E,将线性化后JCXH-104质粒先开始体外转录反应,再对模板DNA进行降解,最后将7-甲基化鸟苷酸帽结构加至转录的mRNA的5’端;
步骤F,mRNA与脂类混合,将mRNA包裹进入LNP内,得到mRNA-LNP复合物,通过浓缩及换液至制剂溶液中;
步骤三,将mRNA-Spike制剂与mRNA-HA制剂混合得到联合疫苗。
基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,包括如下步骤:
步骤一,合成RBD-HA基因片段;
步骤二,构建TC-83自复制载体;
步骤三,将上游携带ApaI、下游携带NotI的HA基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒JCXH-105;
步骤四,将JCXH-105质粒用限制性内切酶切线性化;
步骤五,将线性化后的JCXH-105质粒进行体外转录反应,再对模板DNA进行降解,最后将7-甲基化鸟苷酸帽结构加至转录的mRNA的5’端;
步骤六,mRNA与脂类混合,使得mRNA包裹进入LNP内,得到mRNA-LNP复合物,通过浓缩及换液至制剂溶液中,得到联合疫苗。
前述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,限制性内切酶为BspQI酶。
前述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,线性化后的JCXH-103质粒、JCXH-104质粒、 JCXH-105质粒使用T7 RNA聚合酶开始体外转录反应,使用Turbo DNase酶对模板DNA进行降解,使用加帽酶将7-甲基化鸟苷酸帽结构加至转录的mRNA的5’端。
前述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,脂类包括:PEG2000,胆固醇,二硬脂酰基磷脂酰胆碱,阳离子脂类DLinDMA。
前述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,mRNA与脂类混合采用Nanoassemblr混合器进行混合。
本发明的有益之处在于:
本发明通过使用一条mRNA能够同时表达冠状病毒和流感病毒的抗原,具有强免疫原性,既能减轻病人痛苦,又能够达到注射单种病毒疫苗的免疫效果;
基于自复制mRNA疫苗在动物实验中有很强的免疫原性,能够以自身为模板复制出自身的序列,因此相比常规mRNA疫苗需要的接种剂量更少,并且自复制时所诱导的免疫反应形成的佐剂效应,能够诱导出更强的的免疫应答,进一步增强体液和细胞免疫反应;
自复制mRNA是利用线性化的质粒DNA为模板,在体外进行酶转录反应合成的,该合成策略避免了活细胞培养生产方式,需要考虑的安全性以及复杂的生产工艺等问题;
本发明的工艺简单,只需要体外转录及脂质体包裹就能制备mRNA疫苗;
mRNA是一个通用性疫苗平台,可以根据毒株的年度或季节性变异选择新的抗原序列,在不改变工艺流程的情况下快速开发新的疫苗。
附图说明
图1A是本发明的mRNA-Spike质粒结构图谱,含有卡那霉素抗性基因(Kan)、T7启动子基因、nsp基因、Spike基因、 polyA基因;B是本发明的mRNA-HA质粒结构图谱,含有卡那霉素抗性基因(Kan)、T7启动子基因、nsp基因、HA基因、 polyA基因;C是本发明的mRNA-RBD-HA质粒结构图谱,含有卡那霉素抗性基因(Kan)、T7启动子基因、nsp基因、RBD 基因、HA基因、polyA基因;
图2是本发明的mRNA-Spike体外转录后的电泳结果图;A为mRNA-Spike体外转录后大小,B为mRNA-HA体外转录后大小,C为mRNA-RBD-HA体外转录后大小,M为RNA ladder;
图3是本发明通过Western检测,A是mRNA-Spike在体外转染BHK细胞后Spike蛋白表达图,B是mRNA-Spike制剂与mRNA-HA制剂混合得到联合疫苗在体外转染BHK细胞后Spike和HA蛋白表达图,C是mRNA-RBD-HA在体外转染 BHK细胞后RBD和HA蛋白表达图;
图4是本发明通过ELISA检测,mRNA-Spike免疫小鼠后所诱导的Spike抗体滴度结果图。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
基于mRNA的针对冠状病毒和流感病毒的联合疫苗一,包括:脂质体包裹的mRNA-Spike,脂质体包裹的mRNA-HA; mRNA根据α病毒家族的基因组设计而成;mRNA-Spike包含了新冠肺炎的刺突Spike蛋白基因,mRNA-HA包含了流感的血凝素Hemagglutinin蛋白基因。
基于α病毒家族的Spike高表达新冠mRNA疫苗,为mRNA-Spike。
基于α病毒家族的HA高表达流感mRNA疫苗,为mRNA-HA。
基于mRNA的针对冠状病毒和流感病毒的联合疫苗二,包括:脂质体包裹的mRNA-RBD-HA;mRNA根据α病毒家族的基因组设计而成;mRNA-Spike包含了新冠肺炎的刺突Spike蛋白基因和流感的血凝素Hemagglutinin蛋白基因。
基于α病毒家族的Spike-RBD高表达新冠mRNA疫苗,为mRNA-RBD-HA。
作为一种实施例,α病毒家族的病毒包括:委内瑞拉马脑脊髓炎病毒(TC83Venezuelan Equine Encephalitis Virus,VEEV),辛德毕斯病毒(Sin-dbis virus)、屈曲病毒(Chikungunya virus)、东方马脑脊髓炎病毒(Eastern equine encephali-tisvirus)、西方马脑脊髓炎病毒(Western equineencephalitis virus)、马雅鲁病毒(Mayarovirus)、生里基森林病毒(Semliki forest virus)、委内瑞拉马脑脊髓炎病毒(Venezuelan equine encephalitisvirus)等;作为一种优选,选用委内瑞拉马脑脊髓炎病毒(TC83 Venezuelan Equine Encephalitis Virus,VEEV)。需要说明的是:此处的α病毒家族的病毒并非穷举,只要是设计得到的mRNA 能够同时表达新冠肺炎的刺突Spike蛋白基因和血凝素Hemagglutinin蛋白基因的病毒都在本发明的保护范围内。
作为一种实施例,mRNA包括:常规mRNA或自复制mRNA。现有的mRNA疫苗平台技术有两个主要路线,一个是基于常规mRNA,另一个是基于自复制mRNA;这两个路线都可以应用于本发明。其中基于自复制mRNA疫苗在接种到动物体内后,能够以自身为模板复制出自身的序列,因此相比常规mRNA疫苗需要的接种剂量更少,并且自复制时所诱导的免疫反应形成的佐剂效应,能够诱导出更强的的免疫应答,进一步增强体液和细胞免疫反应;所以作为一种优选,选用自复制,自复制mRNA利用线性化的质粒DNA为模板,在体外进行酶转录反应合成。
基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法一,包括如下步骤:
步骤一,制备mRNA-Spike的步骤包括:
步骤a,合成Spike基因片段;
查询Spike氨基酸序列,然后根据人偏好密码子表进行密码子优化得到优化后的序列,再在其上游加入启动子和ApaI 酶切位点(GGGCCC),下游加入NotI酶切位点(GCGGCCGC),将设计好的序列通过合成直接获得,基因序列为序列表中SEQ ID NO.1所示;
步骤b,构建TC-83自复制载体;
自复制mRNA是根据α病毒家族中委内瑞拉马脑脊髓炎病毒(TC83 VenezuelanEquine Encephalitis Virus,VEEV)的基因组进行设计的,其包含了可编码α病毒自复制组件的基因,但是缺乏编码用于制造具有传染性的α病毒颗粒的结构蛋白,并且构建到的质粒中做为模板来扩增,将设计好的序列通过合成直接获得,基因序列为序列表中SEQ ID NO.2所示
步骤c,重组质粒JCXH-103的制备方法如下:
将上游携带ApaI、下游携带NotI的Spike基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒 JCXH-103(见图1),基因序列为序列表中SEQ ID NO.3所示;
步骤d,JCXH-103质粒用BspQI酶切线性化;
步骤e,线性化后JCXH-103质粒第一步使用T7 RNA聚合酶开始的体外转录反应(IVT),第二步使用Turbo DNase 酶对模板DNA进行降解,第三步使用加帽酶(Vacciniacapping enzyme)将7-甲基化鸟苷酸帽结构(7-methylguanylate cap structure,称为Cap0)加至转录的mRNA的5’端(见图2)。
步骤f,mRNA与脂类(组成包括1,2-dimyristoyl-rac-glycero-3-methoxypolyethylene glycol-2000(DMG-PEG2000)、胆固醇、二硬脂酰基磷脂酰胆碱(DSPC)以及阳离子脂类DLinDMA通过Nanoassemblr混合器进行快速的混合,从而引起脂类的沉淀及在电荷作用mRNA包裹进入LNP内。mRNA-LNP复合物随后通过浓缩及换液至制剂溶液中。
步骤二,制备mRNA-HA的步骤包括:
步骤A,合成Flu基因片段;
查询Flu氨基酸序列,然后根据人偏好密码子表进行密码子优化得到优化后的序列,再在其上游加入启动子和ApaI酶切位点(GGGCCC),下游加入NotI酶切位点(GCGGCCGC),将设计好的序列通过合成直接获得,基因序列为序列表中SEQ ID NO.4所示;
步骤B,构建TC-83自复制载体;
自复制mRNA是根据α病毒家族中委内瑞拉马脑脊髓炎病毒(TC83 VenezuelanEquine Encephalitis Virus,VEEV)的基因组进行设计的,其包含了可编码α病毒自复制组件的基因,但是缺乏编码用于制造具有传染性的α病毒颗粒的结构蛋白,并且构建到的质粒中做为模板来扩增,将设计好的序列通过合成直接获得,基因序列为序列表中SEQ ID NO.2所示
步骤C,重组质粒JCXH-104的制备方法如下:
将上游携带ApaI、下游携带NotI的HA基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒JCXH-104 (见图1),基因序列为序列表中SEQ ID NO.5所示;
步骤D,JCXH-104质粒用BspQI酶切线性化;
步骤E,线性化后JCXH-104质粒第一步使用T7 RNA聚合酶开始的体外转录反应(IVT),第二步使用Turbo DNase 酶对模板DNA进行降解,第三步使用加帽酶(Vacciniacapping enzyme)将7-甲基化鸟苷酸帽结构(7-methylguanylate cap structure,称为Cap0)加至转录的mRNA的5’端(见图2)。
步骤F,mRNA与脂类(组成包括1,2-dimyristoyl-rac-glycero-3-methoxypolyethylene glycol-2000(DMG-PEG2000)、胆固醇、二硬脂酰基磷脂酰胆碱(DSPC)以及阳离子脂类通过Nanoassemblr混合器进行快速的混合,从而引起脂类的沉淀及在电荷作用mRNA包裹进入LNP内。mRNA-LNP复合物随后通过浓缩及换液至制剂溶液中。
步骤三,将mRNA-Spike制剂与mRNA-HA制剂混合得到联合疫苗;作为一种优选,mRNA-Spike制剂与mRNA-HA 制剂1:1摩尔比混合。
基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法二,包括如下步骤:
步骤一,合成RBD-HA基因片段;
查询RBD-HA氨基酸序列,然后根据人偏好密码子表进行密码子优化得到优化后的序列,再在其上游加入启动子和ApaI 酶切位点(GGGCCC),下游加入NotI酶切位点(GCGGCCGC),将设计好的序列通过合成直接获得,基因序列为序列表中SEQ ID NO.6所示;
步骤二,构建TC-83自复制载体;
自复制mRNA是根据α病毒家族中委内瑞拉马脑脊髓炎病毒(TC83 VenezuelanEquine Encephalitis Virus,VEEV)的基因组进行设计的,其包含了可编码α病毒自复制组件的基因,但是缺乏编码用于制造具有传染性的α病毒颗粒的结构蛋白,并且构建到的质粒中做为模板来扩增,将设计好的序列通过合成直接获得,基因序列为序列表中SEQ ID NO.2所示
步骤三,重组质粒JCXH-105的制备方法如下:
将上游携带ApaI、下游携带NotI的RBD-HA基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒 JCXH-105(见图1),基因序列为序列表中SEQ ID NO.7所示;
步骤四,JCXH-105质粒用BspQI酶切线性化;
步骤五,线性化后JCXH-105质粒第一步使用T7 RNA聚合酶开始的体外转录反应(IVT),第二步使用Turbo DNase 酶对模板DNA进行降解,第三步使用加帽酶(Vacciniacapping enzyme)将7-甲基化鸟苷酸帽结构(7-methylguanylate cap structure,称为Cap0)加至转录的mRNA的5’端(见图2)。
步骤六,mRNA与脂类(组成包括1,2-dimyristoyl-rac-glycero-3-methoxypolyethylene glycol-2000(DMG-PEG2000)、胆固醇、二硬脂酰基磷脂酰胆碱(DSPC)以及阳离子脂类通过Nanoassemblr混合器进行快速的混合,从而引起脂类的沉淀及在电荷作用mRNA包裹进入LNP内。mRNA-LNP复合物随后通过浓缩及换液至制剂溶液中。
基于α病毒家族中委内瑞拉马脑脊髓炎病毒(TC83 Venezuelan EquineEncephalitis Virus,VEEV)的新冠流感HA高表达mRNA-Spike和mRNA-HA的应用方法采用疫苗的初免-加强给药应用方式;疫苗的初免-加强给药使用混合的mRNA-Spike, mRNA-HA疫苗或者mRNA-RBD-HA单独给药。
疫苗的给药方式为首次注射和至少两次加强注射,加强注射的次数根据患者需要确定。
需要说明的是:mRNA-Spike、mRNA-HA和mRNA-RBD-HA体外转录mRNA产物,且说明书已经详细描述了体外转录及脂质体包裹的全部过程,任何公司或个人,按照说明书上的步骤均能制备的体外转录脂质体包裹的mRNA疫苗。
以下用实验验证本发明的有益效果;
按照以下实施例制备mRNA疫苗。
实验一,
疫苗mRNA-Spike的制备及在细胞中表达情况验证实验;
1,Spike基因片段合成
从NCBI上查询Spike蛋白基因,然后根据人密码子进行相应优化,并在上游加入ApaⅠ酶切位点和启 动子,下游加入NotⅠ酶切位点,最后通过合成直接获得DNA序列(以公司提供克隆质粒pUC57-Spike的 形式获得),(序列如序列表序列1所示)。
2,构建TC-83自复制载体
自复制mRNA是根据α病毒家族中委内瑞拉马脑脊髓炎病毒(TC83 VenezuelanEquine Encephalitis Virus,VEEV)的基因组进行设计的,其包含了可编码α病毒自复制组件的基因,但是缺乏编码用于制造具有传染性的α病毒颗粒的结构蛋白,并且构建到的质粒中做为模板来扩增,将设计好的序列通过合成直接获得,(序列如序列表序列2所示)。
3,重组质粒JCXH-103的制备方法如下,
pUC57-Spike和TC-83自复制载体用Apa和Not双酶切,酶切体系20μL:pUC57-Spike或TC-83自复制载体<1μg,ApaI 1μL,NotI 1μL,10×CutSmart Buffer 2μL,ddH2O将体系补足20μL。25℃水浴1h酶切质粒,然后37℃水浴1h酶切质粒,载体片段需加0.5μL CIP,37℃水浴30min去磷酸化。将酶切混合物与6×Loading Buffer混合,电泳(1%琼脂糖,94V)并胶回收相应长度的片段(pUC57-Spike回收片段Spike基因片段,长度为3897bp;TC-83自复制载体回收片段,长度约9.5Kb),以30μL Elution Buffer洗脱。
分别取Spike基因片段与TC-83自复制载体片段按照连接体系:载体50ng,插入片段摩尔数:载体片段摩尔数=5:1,T4 Ligase 1μL,10×Ligase Buffer 5μL,ddH2O将体系补足10μl,22℃连接1h。将连接产物按体积1:10与大肠杆菌DH5α的感受态细胞轻柔混匀,冰浴30min,42℃热击45s,冰浴3min,加入预热的SOB肉汤500μL,混匀后于37℃,180rpm培养1h,涂布于 LK平板(LB-Kan平板:含50μg/mL Kan的LB平板),37℃培养16-20h。
PCR筛选:以煮沸法提取的细菌质粒为模板,扩增目的条带Spike,上游引物F:5’-TATGGCCATGACTACTCTAGCTA-3’,下游引物R:5’-GGGAAACGCCTGGTATCTTT-3’,反应循环条件为:94℃3min→(94℃1min,47℃30s,72℃3min)×30 个循环→72℃10min→4℃;电泳观察PCR结果(电泳条件:1%琼脂糖凝胶;90V,上样量:5μl PCR产物),预期结果:Spike 片段约4300bp。
酶切验证:PCR筛选验证的阳性菌提取质粒,按照上述酶切体系以Apa和INot进I行酶切,将酶切混合物与6×Loading Buffer混合进行电泳(1%琼脂糖,94V)。
测序验证:提取PCR及酶切验证符合预期的质粒送测序公司测序。将测序验证后完全正确的携带阳性质粒的大肠杆菌保存于-80℃。
4,JCXH-103质粒用BspQI酶切线性化及回收方法如下,
JCXH-103质粒10μg,BspQI 1μL,10×NEBuffer 3.1 5μL,ddH2O将体系补足50μL,50℃水浴1h酶切质粒。将酶切混合物与6×Loading Buffer混合,电泳(1%琼脂糖,94V)并胶回收相应长度的片段(JCXH-102质粒用,长度约13Kb),以 30μL Elution Buffer洗脱。
5,线性化后JCXH-102质粒使用T7 RNA聚合酶开始的体外转录反应(IVT),TurboDNase酶对模板DNA进行降解,和加帽酶(Vaccinia capping enzyme)将7-甲基化鸟苷酸帽结构(7-methylguanylate cap structure,称为Cap 0)加至转录的 mRNA的5’端,具体方法如下。
10X Reaction Buffer 2μL,NTP每种0.5mM,线性化JCXH-102 1μg,T7 RNAPolymerase 2μL,补水至20μL,30 ℃反应1小时后加入,1μL TURBOTMDNase,10X CappingBuffer 4μL,GTP(10mM)2μL,SAM(2mM)2μL, Vaccinia Capping Enzyme 2μL,总体积补水至总体积40μL,30℃反应1小时。后补水至200μL再加入7.5M氯化锂120 μL混匀后,-20℃静置30分钟后,14000g 4℃离心30分钟,弃上清后用70%酒精清洗沉淀,14000g 4℃离心5分钟,弃上清后风干5分钟,溶解在40μL水内。用分光光度计定量后,取400ng和10μLNorthernMax-Gly Sample Loading Dye 混合,50℃孵育30分钟后,用NorthernMax-GlyGel Prep/Running缓冲液电泳(1%琼脂糖,70V)。电泳图片见图2。
6,mRNA-Spike与脂类包裹步骤如下。
,mRNA与脂类(摩尔组成包括1,2-dimyristoyl-rac-glycero-3-methoxypolyethylene glycol-2000(DMG-PEG2000)、胆固醇、二硬脂酰基磷脂酰胆碱(DSPC)以及阳离子脂类,溶解在酒精内)通过Nanoassemblr混合器进行快速的混合,从而引起脂类的沉淀及在电荷作用mRNA包裹进入LNP内。mRNA-LNP复合物随后通过浓缩及换液至制剂溶液中。
7,Western blot检测mRNA-Spike在细胞中的表达情况。将购于上海细胞中心的BHK-21细胞传代培养,待细胞数量足够,胰酶消化至细胞培养6孔板每孔,铺板37℃CO2培养箱过夜。第二天将脂质体包裹的mRNA-Spike转染到铺好BHK-21 细胞中,培养72h后,将细胞裂解收集蛋白样品。具体方法:
1)细胞培养及铺板:将复苏好的BHK-21细胞接种在75cm2的培养瓶中,培养基为DMEM高糖培养基+5%的双抗+10%胎牛血清,待细胞在瓶底的汇集度达到80%以上,用胰酶将细胞消化下来,并计数。在6孔细胞培养板中铺入适宜数量的细胞,37℃CO2培养箱过夜。
2)脂质体mRNA转染BHK-21细胞:吸干铺好的6孔板中的培养基,用PBS缓冲液清洗一遍,将脂质体包裹的mRNA与1mL Opti-MEM培养基混合,加至清洗好的6孔板中,37℃CO2培养箱6h后补充1mL含有20%胎牛血清的DMEM高糖培养基。37℃CO2培养箱,培养72h。
3)蛋白样品的处理:在72小时后的BHK-21细胞中加入200μL细胞裂解液及1%的PMSF,冰上放置5分钟,离心机14000g离心5分钟,将上清转移至新的离心管,加入5×SDS 95℃金属浴12分钟。放在-20℃备用。
4)Western blot检测:
电泳:聚丙稀酰胺分离胶浓度为6%,蛋白上样量20μL,积层胶电泳条件150V,10min,分离胶电泳条件为200V, 30min。
电转:使用硝酸纤维素膜膜,在100V电压下转膜1小时。
封闭:使用1X PBST配制5%BSA作为封闭液,4℃封闭过夜。
一抗孵育:使用封闭液将SARA-Cov-2(2019-nCov)spike抗体以1:500进行稀释,在室温下孵育2小时。用1X PBST 洗3次,每次5分钟。
二抗孵育:使用封闭液稀释二抗,稀释比为1:10000,在室温下孵育1小时。用1XPBST洗3次,每次5分钟。
显影:显影液A液:B液=1:1,在成像系统中进行显影。
实验结果见图片3A,3A是mRNA-Spike在体外转染BHK细胞后Spike蛋白表达图;
由图可知mRNA-Spike在体外转染BHK细胞后Spike蛋白表达情况较好。
8,mRNA-Spike免疫小鼠诱导的抗Spike抗体滴度检测
6~8周龄的BALB/c雌鼠适应性喂养3天后,2只为对照组注射PBS,4只为0.2μg组,2只为0.5μg组,5只为1μg 组,分别肌肉免疫mRNA-Spike疫苗,注射0.2μg,0.5μg和1μg剂量。35天后,再加强注射0.2μg,0.5μg和1μg剂量。 70天后,取血检测针对spike抗体滴度。
抗体滴度检测方法为ELISA具体操作如下,96孔酶标板每孔包被50ng Spike RBD结构域蛋白室温过夜,第二天用PBST 清洗3遍,用5%牛奶封闭,37度1小时后,PBST清洗3遍,加入对应稀释比例的小鼠血清,37度1小时后,PBST清洗 3遍,加入抗小鼠igg重链轻链HRP,37度1小时后,PBST清洗3遍,最后加入显色液显色。
实验结果如图4所示;为小鼠血清中抗Spike抗体滴度。
1#mock~2#mock表示不给疫苗也不造模的空白对照组;1#0.5μg~2#0.5μg分别表示给药剂量为0.5μg的5只小鼠;1#0.2 μg~4#0.2μg分别表示给药剂量为0.2μg的4只小鼠;1#1.0μg~5#1.0μg分别表示给药剂量为1.0μg的5只小鼠。
由此可知mRNA-Spike能够很好的实现在细胞中表达。
实验二:
疫苗mRNA-HA的制备及在细胞中表达情况验证实验
1,HA基因片段合成
从NCBI上查询流感HA蛋白基因,然后根据人密码子进行相应优化,并在上游加入ApaⅠ酶切位点,下游加入NotⅠ酶切位点,最后通过合成直接获得DNA序列(以公司提供克隆质粒pUC57-HA的形式获得),(序列如序列表序列4所示)。
2,构建TC-83自复制载体
同实施例1-2
3,重组质粒JCXH-104的制备方法如下
此步同实施例1-3,其中Spike换为HA,酶切长度为825bp,PCR筛选片段大小为1228bp。
4,JCXH-104质粒用BspQI酶切线性化及回收方法如下
此步同实施例1-4,其中JCXH-103换为JCXH-104。
5,线性化后JCXH-104质粒使用T7 RNA聚合酶开始的体外转录反应(IVT),TurboDNase酶对模板DNA进行降解,和加帽酶(Vaccinia capping enzyme)将7-甲基化鸟苷酸帽结构(7-methylguanylate cap structure,称为Cap 0)加至转录的 mRNA的5’端,具体方法如下。
同实施例1-5,其中JCXH-103换为JCXH-104。
6,mRNA-HA与脂类包裹步骤如下。
此步同实施例1-6,其中Spike换为HA。
7,Western blot检测mRNA-Spike制剂与mRNA-HA制剂混合得到联合疫苗在细胞中的表达情况。
此步同实施例1-7。一抗为抗HA抗体或抗SARA-Cov-2(2019-nCov)spike抗体。
实验结果如图3B所示,B是mRNA-Spike制剂与mRNA-HA制剂混合得到联合疫苗在体外转染BHK细胞后Spike和 HA蛋白表达图;
由图3B可知mRNA-Spike制剂与mRNA-HA制剂混合得到联合疫苗在细胞中具有很好的表达。
实验三:疫苗mRNA-RBD-HA的制备及在细胞中表达情况验证实验
1,Spike-RBD-HA基因片段合成
从NCBI上查询流感Spike-RBD-HA蛋白基因,然后根据人密码子进行相应优化,并在上游加入ApaⅠ酶切位点,下游加入NotⅠ酶切位点,最后通过合成直接获得DNA序列(以公司提供克隆质粒pUC57-Spike-RBD-HA的形式获得),(序列如序列表序列6所示)。
2,构建TC-83自复制载体
同实施例1-2
3,重组质粒JCXH-105的制备方法如下
此步同实施例1-3,其中Spike换为RBD-HA,酶切长度为2642bp,PCR筛选片段大小为3045bp。
4,JCXH-105质粒用BspQI酶切线性化及回收方法如下
此步同实施例1-4,其中JCXH-103换为JCXH-105。
5,线性化后JCXH-105质粒使用T7 RNA聚合酶开始的体外转录反应(IVT),TurboDNase酶对模板DNA进行降解,和加帽酶(Vaccinia capping enzyme)将7-甲基化鸟苷酸帽结构(7-methylguanylate cap structure,称为Cap 0)加至转录的 mRNA的5’端,具体方法如下。
同实施例1-5,其中JCXH-103换为JCXH-105。
6,mRNA-HA与脂类包裹步骤如下。
此步同实施例1-6,其中Spike换为RBD-HA。
7,Western blot检测mRNA在细胞中的表达情况。
此步同实施例1-7。其中Spike换为RBD-HA,一抗为抗HA抗体或抗SARA-Cov-2(2019-nCov)spike抗体。
实验结果如图3C所示,C是mRNA-RBD-HA在体外转染BHK细胞后RBD和HA蛋白表达图;
由图可知mRNA-RBD-HA在体外转染BHK细胞后RBD和HA蛋白具有很好的表达情况。
从实验一到三可知,运用本发明的方法得到的联合疫苗能够很好的细胞中表达,能够与单独使用单种病毒疫苗的效果基本持平。
本发明通过使用一条mRNA能够同时表达冠状病毒和流感病毒的抗原,具有强免疫原性,既能减轻病人痛苦,又能够达到注射单种病毒疫苗的免疫效果,具有良好的应用前景。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
序列表
<110> 嘉晨西海(杭州)生物技术有限公司
<120> 一种基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法
<141> 2020-10-26
<160> 9
<170> SIPOSequenceListing 1.0
<210> 1
<211> 3894
<212> DNA
<213> Artificial Sequence
<400> 1
ctataactct ctacggctaa cctgaatgga ctacgacata gtctagtccg ccaagatgtt 60
cgtgttcctc gtgctgctgc ccctggtgtc tagccagtgc gtgaacctga ccaccagaac 120
ccagctgcct ccagcctaca ccaacagctt caccagggga gtgtactacc ccgacaaggt 180
gttccggagc agcgtgctgc atagcaccca ggacctgttc ctgcccttct tcagcaacgt 240
gacttggttc cacgccatcc acgtcagcgg aaccaacggc accaagcgct ttgacaaccc 300
agtgctgccc ttcaacgacg gagtgtactt cgccagcacc gagaagtcca acatcatccg 360
gggttggatc ttcggcacca cactggacag caagacccag agcctgctga tcgtgaacaa 420
cgccaccaac gtcgtgatca aggtctgcga gttccagttt tgcaacgacc ccttcctggg 480
cgtgtactac cacaagaaca acaagtcttg gatggagagc gagttccggg tgtacagcag 540
cgccaacaat tgcaccttcg agtacgtgtc ccagcccttc ctgatggacc tggaaggcaa 600
gcagggcaac ttcaagaacc tgcgggagtt cgtgttcaag aacatcgacg gctacttcaa 660
gatctacagc aagcacaccc ccatcaacct cgtgagagac ctgccacagg gcttcagcgc 720
tctggaacct ctggtggatc tgccaatcgg catcaacatc acccggttcc agaccctgct 780
ggctctgcac agaagctacc tgaccccagg cgattcttct agcggctgga cagcaggagc 840
cgccgcttat tacgtgggct atctgcagcc ccggaccttc ctgctgaagt acaacgagaa 900
cggcaccatc accgacgcag tggattgcgc tctggatcct ctgagcgaga ccaagtgcac 960
cctgaagtcc ttcaccgtgg agaagggcat ctaccagacc agcaacttcc gggtgcagcc 1020
tacagagagc atcgtgcggt tccctaacat caccaacctc tgccccttcg gcgaggtgtt 1080
caacgccacc agattcgcca gcgtctacgc ctggaaccgg aagcggatca gcaattgcgt 1140
ggccgactac agcgtgctgt acaacagcgc cagcttcagc accttcaagt gctacggcgt 1200
gtcccctacc aagctgaacg atctgtgctt caccaacgtg tacgccgaca gcttcgtgat 1260
caggggcgac gaagtgcgac agatcgcccc aggacagaca ggaaagatcg ccgattacaa 1320
ctacaagctg cccgacgact tcaccggttg cgtgatcgct tggaacagca acaacctgga 1380
cagcaaggtc ggcggcaact acaactacct gtaccggctg ttccggaagt ccaacctgaa 1440
gcccttcgag cgggacatca gcacagagat ctaccaggcc ggcagcacac cttgtaacgg 1500
cgtggagggc ttcaactgct acttccctct gcagagctac ggcttccagc ctacaaacgg 1560
cgtgggatac cagccttaca gggtggtggt gctgagcttc gaactgctgc acgctccagc 1620
caccgtctgc ggacctaaaa agagcaccaa cctggtgaag aacaagtgcg tgaatttcaa 1680
cttcaacggc ctgaccggaa ccggcgtgct gaccgagagc aacaagaagt tcctgccctt 1740
ccagcagttc ggcagagaca tcgcagacac cacagacgcc gtgagagatc ctcagaccct 1800
ggagatcctg gacatcaccc cttgcagctt tggcggagtg tccgtgatca ccccaggaac 1860
caacaccagc aatcaggtgg ccgtgctgta ccaggacgtg aattgcaccg aggtgccagt 1920
ggccattcac gcagatcagc tgacccctac ctggagagtg tacagcaccg gaagcaacgt 1980
gttccagacc agggcaggtt gcctgatcgg agccgagcac gtgaacaaca gctacgagtg 2040
cgatatccct atcggcgccg gcatttgcgc ctcttaccag acccagacca acagccctag 2100
gagagccaga agcgtggcct ctcagagcat catcgcctac accatgagcc tgggagccga 2160
gaacagcgtg gcctacagca acaacagcat cgccatcccc accaacttca ccatcagcgt 2220
gaccaccgag attctgcccg tgtctatgac caagaccagc gtcgactgca ccatgtacat 2280
ctgcggcgac agcaccgagt gctctaacct gctgctgcag tacggctcct tttgcaccca 2340
gctgaacagg gctctgacag gcatcgcagt ggagcaggac aagaacaccc aggaggtctt 2400
cgcccaggtc aagcagatct acaagacccc ccctatcaag gacttcggcg gctttaactt 2460
cagccagatc ctgcccgatc ccagcaagcc tagcaagcgg agcttcatcg aggacctgct 2520
gttcaacaag gtcaccctgg ccgacgcagg cttcatcaag cagtacggcg attgcctggg 2580
cgacattgcc gccagagacc tgatttgcgc ccagaagttc aacggcctga cagtgctgcc 2640
tcctctgctg accgacgaga tgatcgccca gtatacaagc gctctgctgg caggaaccat 2700
caccagcggt tggacctttg gagccggagc cgctctgcag atcccttttg ccatgcagat 2760
ggcctaccgc ttcaacggaa tcggcgtgac ccagaacgtg ctctacgaga accagaagct 2820
gatcgccaac cagttcaaca gcgccatcgg caagatccag gacagcctga gcagcacagc 2880
tagcgctctg ggcaagctgc aggatgtggt gaaccagaac gcccaggctc tgaacaccct 2940
ggtgaagcag ctgagcagca acttcggagc catcagcagc gtgctgaacg acatcctgag 3000
caggctggac aaggtggaag ccgaagtgca gatcgacagg ctgatcaccg gcagactgca 3060
gtctctgcag acctacgtga cccagcagct gatcagagcc gccgagatca gagctagcgc 3120
taatctggcc gccaccaaga tgagcgagtg cgtgctggga cagagcaaga gagtggactt 3180
ctgcggcaag ggctaccacc tgatgagctt tcctcagagc gctcctcacg gagtggtgtt 3240
tctgcacgtg acctacgtgc cagcccagga gaagaacttc accacagccc cagccatttg 3300
ccacgacgga aaggcccact tccccagaga aggcgtgttc gtgtccaacg gcacccattg 3360
gttcgtgacc cagcggaact tctacgagcc ccagatcatc accaccgaca acaccttcgt 3420
gagcggcaat tgcgacgtgg tcatcggcat cgtgaacaac accgtgtacg accccctgca 3480
gccagagctg gactccttca aggaggagct ggacaagtac ttcaagaacc acaccagccc 3540
agacgtggac ctgggagata tcagcggcat caacgccagc gtggtgaaca tccagaagga 3600
gatcgacagg ctgaacgagg tggccaagaa cctgaacgag agcctgatcg acctgcagga 3660
gctgggcaag tacgagcagt acatcaagtg gccttggtac atttggctgg gcttcatcgc 3720
cggcctgatc gcaatcgtca tggtgaccat catgctctgt tgcatgacca gttgctgcag 3780
ctgcctgaag ggttgctgca gttgcgggag ttgctgcaag ttcgacgagg acgacagcga 3840
gccagtgctg aaaggcgtga agctgcacta cacatgataa ggcgcgccca ccca 3894
<210> 2
<211> 9636
<212> DNA
<213> Artificial Sequence
<400> 2
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggctgttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gtaaggcgcg cccacccagc ggccgcatac agcagcaatt ggcaagctgc ttacatagaa 7620
ctcgcggcga ttggcatgcc gccttaaaat ttttatttta tttttctttt cttttccgaa 7680
tcggattttg tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7740
aaaagaagag ctagggataa cagggtaatt gagcaaaagg ccagcaaaag gccaggaacc 7800
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 7860
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 7920
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 7980
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 8040
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 8100
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 8160
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 8220
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 8280
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 8340
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 8400
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 8460
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 8520
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 8580
acagttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 8640
caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 8700
tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 8760
aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 8820
cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 8880
gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 8940
attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 9000
tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 9060
gatattcttc taatacctgg aatgctgttt tcccagggat cgcagtggtg agtaaccatg 9120
catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 9180
agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 9240
gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 9300
cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 9360
gcggcctaga gcaagacgtt tcccgttgaa tatggctcat actcttcctt tttcaatatt 9420
attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga 9480
aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag 9540
aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc 9600
tagggataac agggtaatta atacgactca ctatag 9636
<210> 3
<211> 13458
<212> DNA
<213> Artificial Sequence
<400> 3
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggctgttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgttcgtg ttcctcgtgc tgctgcccct ggtgtctagc cagtgcgtga acctgaccac 7620
cagaacccag ctgcctccag cctacaccaa cagcttcacc aggggagtgt actaccccga 7680
caaggtgttc cggagcagcg tgctgcatag cacccaggac ctgttcctgc ccttcttcag 7740
caacgtgact tggttccacg ccatccacgt cagcggaacc aacggcacca agcgctttga 7800
caacccagtg ctgcccttca acgacggagt gtacttcgcc agcaccgaga agtccaacat 7860
catccggggt tggatcttcg gcaccacact ggacagcaag acccagagcc tgctgatcgt 7920
gaacaacgcc accaacgtcg tgatcaaggt ctgcgagttc cagttttgca acgacccctt 7980
cctgggcgtg tactaccaca agaacaacaa gtcttggatg gagagcgagt tccgggtgta 8040
cagcagcgcc aacaattgca ccttcgagta cgtgtcccag cccttcctga tggacctgga 8100
aggcaagcag ggcaacttca agaacctgcg ggagttcgtg ttcaagaaca tcgacggcta 8160
cttcaagatc tacagcaagc acacccccat caacctcgtg agagacctgc cacagggctt 8220
cagcgctctg gaacctctgg tggatctgcc aatcggcatc aacatcaccc ggttccagac 8280
cctgctggct ctgcacagaa gctacctgac cccaggcgat tcttctagcg gctggacagc 8340
aggagccgcc gcttattacg tgggctatct gcagccccgg accttcctgc tgaagtacaa 8400
cgagaacggc accatcaccg acgcagtgga ttgcgctctg gatcctctga gcgagaccaa 8460
gtgcaccctg aagtccttca ccgtggagaa gggcatctac cagaccagca acttccgggt 8520
gcagcctaca gagagcatcg tgcggttccc taacatcacc aacctctgcc ccttcggcga 8580
ggtgttcaac gccaccagat tcgccagcgt ctacgcctgg aaccggaagc ggatcagcaa 8640
ttgcgtggcc gactacagcg tgctgtacaa cagcgccagc ttcagcacct tcaagtgcta 8700
cggcgtgtcc cctaccaagc tgaacgatct gtgcttcacc aacgtgtacg ccgacagctt 8760
cgtgatcagg ggcgacgaag tgcgacagat cgccccagga cagacaggaa agatcgccga 8820
ttacaactac aagctgcccg acgacttcac cggttgcgtg atcgcttgga acagcaacaa 8880
cctggacagc aaggtcggcg gcaactacaa ctacctgtac cggctgttcc ggaagtccaa 8940
cctgaagccc ttcgagcggg acatcagcac agagatctac caggccggca gcacaccttg 9000
taacggcgtg gagggcttca actgctactt ccctctgcag agctacggct tccagcctac 9060
aaacggcgtg ggataccagc cttacagggt ggtggtgctg agcttcgaac tgctgcacgc 9120
tccagccacc gtctgcggac ctaaaaagag caccaacctg gtgaagaaca agtgcgtgaa 9180
tttcaacttc aacggcctga ccggaaccgg cgtgctgacc gagagcaaca agaagttcct 9240
gcccttccag cagttcggca gagacatcgc agacaccaca gacgccgtga gagatcctca 9300
gaccctggag atcctggaca tcaccccttg cagctttggc ggagtgtccg tgatcacccc 9360
aggaaccaac accagcaatc aggtggccgt gctgtaccag gacgtgaatt gcaccgaggt 9420
gccagtggcc attcacgcag atcagctgac ccctacctgg agagtgtaca gcaccggaag 9480
caacgtgttc cagaccaggg caggttgcct gatcggagcc gagcacgtga acaacagcta 9540
cgagtgcgat atccctatcg gcgccggcat ttgcgcctct taccagaccc agaccaacag 9600
ccctaggaga gccagaagcg tggcctctca gagcatcatc gcctacacca tgagcctggg 9660
agccgagaac agcgtggcct acagcaacaa cagcatcgcc atccccacca acttcaccat 9720
cagcgtgacc accgagattc tgcccgtgtc tatgaccaag accagcgtcg actgcaccat 9780
gtacatctgc ggcgacagca ccgagtgctc taacctgctg ctgcagtacg gctccttttg 9840
cacccagctg aacagggctc tgacaggcat cgcagtggag caggacaaga acacccagga 9900
ggtcttcgcc caggtcaagc agatctacaa gaccccccct atcaaggact tcggcggctt 9960
taacttcagc cagatcctgc ccgatcccag caagcctagc aagcggagct tcatcgagga 10020
cctgctgttc aacaaggtca ccctggccga cgcaggcttc atcaagcagt acggcgattg 10080
cctgggcgac attgccgcca gagacctgat ttgcgcccag aagttcaacg gcctgacagt 10140
gctgcctcct ctgctgaccg acgagatgat cgcccagtat acaagcgctc tgctggcagg 10200
aaccatcacc agcggttgga cctttggagc cggagccgct ctgcagatcc cttttgccat 10260
gcagatggcc taccgcttca acggaatcgg cgtgacccag aacgtgctct acgagaacca 10320
gaagctgatc gccaaccagt tcaacagcgc catcggcaag atccaggaca gcctgagcag 10380
cacagctagc gctctgggca agctgcagga tgtggtgaac cagaacgccc aggctctgaa 10440
caccctggtg aagcagctga gcagcaactt cggagccatc agcagcgtgc tgaacgacat 10500
cctgagcagg ctggacaagg tggaagccga agtgcagatc gacaggctga tcaccggcag 10560
actgcagtct ctgcagacct acgtgaccca gcagctgatc agagccgccg agatcagagc 10620
tagcgctaat ctggccgcca ccaagatgag cgagtgcgtg ctgggacaga gcaagagagt 10680
ggacttctgc ggcaagggct accacctgat gagctttcct cagagcgctc ctcacggagt 10740
ggtgtttctg cacgtgacct acgtgccagc ccaggagaag aacttcacca cagccccagc 10800
catttgccac gacggaaagg cccacttccc cagagaaggc gtgttcgtgt ccaacggcac 10860
ccattggttc gtgacccagc ggaacttcta cgagccccag atcatcacca ccgacaacac 10920
cttcgtgagc ggcaattgcg acgtggtcat cggcatcgtg aacaacaccg tgtacgaccc 10980
cctgcagcca gagctggact ccttcaagga ggagctggac aagtacttca agaaccacac 11040
cagcccagac gtggacctgg gagatatcag cggcatcaac gccagcgtgg tgaacatcca 11100
gaaggagatc gacaggctga acgaggtggc caagaacctg aacgagagcc tgatcgacct 11160
gcaggagctg ggcaagtacg agcagtacat caagtggcct tggtacattt ggctgggctt 11220
catcgccggc ctgatcgcaa tcgtcatggt gaccatcatg ctctgttgca tgaccagttg 11280
ctgcagctgc ctgaagggtt gctgcagttg cgggagttgc tgcaagttcg acgaggacga 11340
cagcgagcca gtgctgaaag gcgtgaagct gcactacaca tgataaggcg cgcccaccca 11400
gcggccgcat acagcagcaa ttggcaagct gcttacatag aactcgcggc gattggcatg 11460
ccgccttaaa atttttattt tatttttctt ttcttttccg aatcggattt tgtttttaat 11520
atttcaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaag agctagggat 11580
aacagggtaa ttgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc 11640
tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc 11700
agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc 11760
tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt 11820
cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg 11880
ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat 11940
ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag 12000
ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt 12060
ggtggcctaa ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc 12120
cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta 12180
gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag 12240
atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga 12300
ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa 12360
gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttag aaaaactcat 12420
cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca tatttttgaa 12480
aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg atggcaagat 12540
cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt aatttcccct 12600
cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa tccggtgaga 12660
atggcaaaag tttatgcatt tctttccaga cttgttcaac aggccagcca ttacgctcgt 12720
catcaaaatc actcgcatca accaaaccgt tattcattcg tgattgcgcc tgagcgagac 12780
gaaatacgcg atcgctgtta aaaggacaat tacaaacagg aatcgaatgc aaccggcgca 12840
ggaacactgc cagcgcatca acaatatttt cacctgaatc aggatattct tctaatacct 12900
ggaatgctgt tttcccaggg atcgcagtgg tgagtaacca tgcatcatca ggagtacgga 12960
taaaatgctt gatggtcgga agaggcataa attccgtcag ccagtttagt ctgaccatct 13020
catctgtaac atcattggca acgctacctt tgccatgttt cagaaacaac tctggcgcat 13080
cgggcttccc atacaatcga tagattgtcg cacctgattg cccgacatta tcgcgagccc 13140
atttataccc atataaatca gcatccatgt tggaatttaa tcgcggccta gagcaagacg 13200
tttcccgttg aatatggctc atactcttcc tttttcaata ttattgaagc atttatcagg 13260
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 13320
ttccgcgcac atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga 13380
cattaaccta taaaaatagg cgtatcacga ggccctttcg tctagggata acagggtaat 13440
taatacgact cactatag 13458
<210> 4
<211> 1792
<212> DNA
<213> Artificial Sequence
<400> 4
agaggggccc ctataactct ctacggctaa cctgaatgga ctacgacata gtctagtccg 60
ccaagatgaa ggccatcctg gtggtgctgc tgtacacctt caccaccgcc aacgccgaca 120
ccctgtgcat cggctaccac gccaacaaca gcaccgacac cgtggacacc gtgctggaga 180
agaacgtgac cgtgacccac agcgtgaacc tgctggagga caagcacaac ggcaagctgt 240
gcaagctgag aggcgtggcc cccctgcacc tgggcaagtg caacatcgcc ggctggatcc 300
tgggcaaccc cgagtgcgag agcctgagca ccgccagaag ctggagctac atcgtggaga 360
ccagcaacag cgacaacggc acctgctacc ccggcgactt catcaactac gaggagctga 420
gagagcagct gagcagcgtg agcagcttcg agagattcga gatcttcccc aagaccagca 480
gctggcccaa ccacgacagc gacaagggcg tgaccgccgc ctgcccccac gccggcgcca 540
agagcttcta caagaacctg atctggctgg tgaagaaggg caacagctac cccaagctga 600
accagaccta catcaacgac aagggcaagg aggtgctggt gctgtggggc atccaccacc 660
cccccaccat cgccgcccag gagagcctgt accagaacgc cgacgcctac gtgttcgtgg 720
gcaccagcag atacagcaag aagttcaagc ccgagatcgc caccagaccc aaggtgagag 780
accaggaggg cagaatgaac tactactgga ccctggtgga gcccggcgat aaaatcacct 840
tcgaggccac cggcaacctg gtggtgccca gatacgcctt caccatggag agagacgccg 900
gcagcggcat catcatcagc gacacccccg tgcacgactg caacaccacc tgccagaccc 960
ccgagggcgc catcaacacc agcctgccct tccagaacgt gcaccccatc accatcggca 1020
agtgccccaa gtacgtcaag agcaccaagc tgagactggc caccggcctg agaaacgtgc 1080
ccagcatcca gagcgtctca ctgttcggcg ccatcgccgg cttcatcgag ggcggctgga 1140
ccggcatggt gggctggtac ggctaccacc accagaacga gcagggcagc ggctacgccg 1200
ccgacctcaa gagcacccag aacgccatcg ataagatcac caacaaggtg aacagcgtga 1260
tcgagaagat gaacacccag ttcaccgccg tgggcaagga gttcaaccac ctggagaaga 1320
gaatcgagaa cctgaacaag aaggtggacg acggcttcct ggacatctgg acctacaacg 1380
ccgagctgct ggtgctgctg gagaacgaga gaaccctgga ctaccacgac agcaacgtga 1440
agaacctgta cgagaaggtg agaaaccagc tgaagaacaa cgccaaggag atcggcaacg 1500
gctgcttcga gttctaccac aagtgcgaca acacctgcat ggagagcgtg aagaacggca 1560
cctacgacta ccccaagtac agcgaggagg ccaagctgaa cagagagaag atcgacggcg 1620
tgaagctgga gagcaccaga atctaccaga tcctggccat ctacagcacc gtggccagca 1680
gcctggtgct ggtggtgagc ctgggcgcca tcagcttctg gatgtgcagc aacggcagcc 1740
tgcagtgcag aatctgcatc tgataaggcg cgcccaccca gcggccgcat ac 1792
<210> 5
<211> 11269
<212> DNA
<213> Artificial Sequence
<400> 5
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggctgttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgaaggcc atcctggtgg tgctgctgta caccttcacc accgccaacg ccgacaccct 7620
gtgcatcggc taccacgcca acaacagcac cgacaccgtg gacaccgtgc tggagaagaa 7680
cgtgaccgtg acccacagcg tgaacctgct ggaggacaag cacaacggca agctgtgcaa 7740
gctgagaggc gtggcccccc tgcacctggg caagtgcaac atcgccggct ggatcctggg 7800
caaccccgag tgcgagagcc tgagcaccgc cagaagctgg agctacatcg tggagaccag 7860
caacagcgac aacggcacct gctaccccgg cgacttcatc aactacgagg agctgagaga 7920
gcagctgagc agcgtgagca gcttcgagag attcgagatc ttccccaaga ccagcagctg 7980
gcccaaccac gacagcgaca agggcgtgac cgccgcctgc ccccacgccg gcgccaagag 8040
cttctacaag aacctgatct ggctggtgaa gaagggcaac agctacccca agctgaacca 8100
gacctacatc aacgacaagg gcaaggaggt gctggtgctg tggggcatcc accacccccc 8160
caccatcgcc gcccaggaga gcctgtacca gaacgccgac gcctacgtgt tcgtgggcac 8220
cagcagatac agcaagaagt tcaagcccga gatcgccacc agacccaagg tgagagacca 8280
ggagggcaga atgaactact actggaccct ggtggagccc ggcgataaaa tcaccttcga 8340
ggccaccggc aacctggtgg tgcccagata cgccttcacc atggagagag acgccggcag 8400
cggcatcatc atcagcgaca cccccgtgca cgactgcaac accacctgcc agacccccga 8460
gggcgccatc aacaccagcc tgcccttcca gaacgtgcac cccatcacca tcggcaagtg 8520
ccccaagtac gtcaagagca ccaagctgag actggccacc ggcctgagaa acgtgcccag 8580
catccagagc gtctcactgt tcggcgccat cgccggcttc atcgagggcg gctggaccgg 8640
catggtgggc tggtacggct accaccacca gaacgagcag ggcagcggct acgccgccga 8700
cctcaagagc acccagaacg ccatcgataa gatcaccaac aaggtgaaca gcgtgatcga 8760
gaagatgaac acccagttca ccgccgtggg caaggagttc aaccacctgg agaagagaat 8820
cgagaacctg aacaagaagg tggacgacgg cttcctggac atctggacct acaacgccga 8880
gctgctggtg ctgctggaga acgagagaac cctggactac cacgacagca acgtgaagaa 8940
cctgtacgag aaggtgagaa accagctgaa gaacaacgcc aaggagatcg gcaacggctg 9000
cttcgagttc taccacaagt gcgacaacac ctgcatggag agcgtgaaga acggcaccta 9060
cgactacccc aagtacagcg aggaggccaa gctgaacaga gagaagatcg acggcgtgaa 9120
gctggagagc accagaatct accagatcct ggccatctac agcaccgtgg ccagcagcct 9180
ggtgctggtg gtgagcctgg gcgccatcag cttctggatg tgcagcaacg gcagcctgca 9240
gtgcagaatc tgcatctgat aaggcgcgcc cacccagcgg ccgcatacag cagcaattgg 9300
caagctgctt acatagaact cgcggcgatt ggcatgccgc cttaaaattt ttattttatt 9360
tttcttttct tttccgaatc ggattttgtt tttaatattt caaaaaaaaa aaaaaaaaaa 9420
aaaaaaaaaa aaaaaaaaaa aagaagagct agggataaca gggtaattga gcaaaaggcc 9480
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 9540
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 9600
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 9660
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 9720
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 9780
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 9840
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 9900
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 9960
gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 10020
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 10080
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 10140
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 10200
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 10260
atgagtaaac ttggtctgac agttagaaaa actcatcgag catcaaatga aactgcaatt 10320
tattcatatc aggattatca ataccatatt tttgaaaaag ccgtttctgt aatgaaggag 10380
aaaactcacc gaggcagttc cataggatgg caagatcctg gtatcggtct gcgattccga 10440
ctcgtccaac atcaatacaa cctattaatt tcccctcgtc aaaaataagg ttatcaagtg 10500
agaaatcacc atgagtgacg actgaatccg gtgagaatgg caaaagttta tgcatttctt 10560
tccagacttg ttcaacaggc cagccattac gctcgtcatc aaaatcactc gcatcaacca 10620
aaccgttatt cattcgtgat tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag 10680
gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa 10740
tattttcacc tgaatcagga tattcttcta atacctggaa tgctgttttc ccagggatcg 10800
cagtggtgag taaccatgca tcatcaggag tacggataaa atgcttgatg gtcggaagag 10860
gcataaattc cgtcagccag tttagtctga ccatctcatc tgtaacatca ttggcaacgc 10920
tacctttgcc atgtttcaga aacaactctg gcgcatcggg cttcccatac aatcgataga 10980
ttgtcgcacc tgattgcccg acattatcgc gagcccattt atacccatat aaatcagcat 11040
ccatgttgga atttaatcgc ggcctagagc aagacgtttc ccgttgaata tggctcatac 11100
tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 11160
tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 11220
tgccacctga cgttagggat aacagggtaa ttaatacgac tcactatag 11269
<210> 6
<211> 2661
<212> DNA
<213> Artificial Sequence
<400> 6
agaggggccc ctataactct ctacggctaa cctgaatgga ctacgacata gtctagtccg 60
ccaagatgcc catggggtct ctgcaaccgc tggccacctt gtacctgctg gggatgctgg 120
tcgcttccgt gctagcctct agacgggtgc agcctacaga gagcatcgtg cggttcccta 180
acatcaccaa cctctgcccc ttcggcgagg tgttcaacgc caccagattc gccagcgtct 240
acgcctggaa ccggaagcgg atcagcaatt gcgtggccga ctacagcgtg ctgtacaaca 300
gcgccagctt cagcaccttc aagtgctacg gcgtgtcccc taccaagctg aacgatctgt 360
gcttcaccaa cgtgtacgcc gacagcttcg tgatcagggg cgacgaagtg cgacagatcg 420
ccccaggaca gacaggaaag atcgccgatt acaactacaa gctgcccgac gacttcaccg 480
gttgcgtgat cgcttggaac agcaacaacc tggacagcaa ggtcggcggc aactacaact 540
acctgtaccg gctgttccgg aagtccaacc tgaagccctt cgagcgggac atcagcacag 600
agatctacca ggccggcagc acaccttgta acggcgtgga gggcttcaac tgctacttcc 660
ctctgcagag ctacggcttc cagcctacaa acggcgtggg ataccagcct tacagggtgg 720
tggtgctgag cttcgaactg ctgcacgctc cagccaccgt ctgcggacct aaaaagagca 780
ccaacctggt gaagaacaag tgcgtgaatt tctgaagcgg cccaatgatc cgaccagcaa 840
aactcgatgt acttccgagg aactgatgtg cataagcccc tataactctc tacggctaac 900
ctgaatggac tacgacatag tctagtccgc caagatgaag gccatcctgg tggtgctgct 960
gtacaccttc accaccgcca acgccgacac cctgtgcatc ggctaccacg ccaacaacag 1020
caccgacacc gtggacaccg tgctggagaa gaacgtgacc gtgacccaca gcgtgaacct 1080
gctggaggac aagcacaacg gcaagctgtg caagctgaga ggcgtggccc ccctgcacct 1140
gggcaagtgc aacatcgccg gctggatcct gggcaacccc gagtgcgaga gcctgagcac 1200
cgccagaagc tggagctaca tcgtggagac cagcaacagc gacaacggca cctgctaccc 1260
cggcgacttc atcaactacg aggagctgag agagcagctg agcagcgtga gcagcttcga 1320
gagattcgag atcttcccca agaccagcag ctggcccaac cacgacagcg acaagggcgt 1380
gaccgccgcc tgcccccacg ccggcgccaa gagcttctac aagaacctga tctggctggt 1440
gaagaagggc aacagctacc ccaagctgaa ccagacctac atcaacgaca agggcaagga 1500
ggtgctggtg ctgtggggca tccaccaccc ccccaccatc gccgcccagg agagcctgta 1560
ccagaacgcc gacgcctacg tgttcgtggg caccagcaga tacagcaaga agttcaagcc 1620
cgagatcgcc accagaccca aggtgagaga ccaggagggc agaatgaact actactggac 1680
cctggtggag cccggcgata aaatcacctt cgaggccacc ggcaacctgg tggtgcccag 1740
atacgccttc accatggaga gagacgccgg cagcggcatc atcatcagcg acacccccgt 1800
gcacgactgc aacaccacct gccagacccc cgagggcgcc atcaacacca gcctgccctt 1860
ccagaacgtg caccccatca ccatcggcaa gtgccccaag tacgtcaaga gcaccaagct 1920
gagactggcc accggcctga gaaacgtgcc cagcatccag agcgtctcac tgttcggcgc 1980
catcgccggc ttcatcgagg gcggctggac cggcatggtg ggctggtacg gctaccacca 2040
ccagaacgag cagggcagcg gctacgccgc cgacctcaag agcacccaga acgccatcga 2100
taagatcacc aacaaggtga acagcgtgat cgagaagatg aacacccagt tcaccgccgt 2160
gggcaaggag ttcaaccacc tggagaagag aatcgagaac ctgaacaaga aggtggacga 2220
cggcttcctg gacatctgga cctacaacgc cgagctgctg gtgctgctgg agaacgagag 2280
aaccctggac taccacgaca gcaacgtgaa gaacctgtac gagaaggtga gaaaccagct 2340
gaagaacaac gccaaggaga tcggcaacgg ctgcttcgag ttctaccaca agtgcgacaa 2400
cacctgcatg gagagcgtga agaacggcac ctacgactac cccaagtaca gcgaggaggc 2460
caagctgaac agagagaaga tcgacggcgt gaagctggag agcaccagaa tctaccagat 2520
cctggccatc tacagcaccg tggccagcag cctggtgctg gtggtgagcc tgggcgccat 2580
cagcttctgg atgtgcagca acggcagcct gcagtgcaga atctgcatct gataaggcgc 2640
gcccacccag cggccgcata c 2661
<210> 7
<211> 12138
<212> DNA
<213> Artificial Sequence
<400> 7
atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggctgttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgcccatg gggtctctgc aaccgctggc caccttgtac ctgctgggga tgctggtcgc 7620
ttccgtgcta gcctctagac gggtgcagcc tacagagagc atcgtgcggt tccctaacat 7680
caccaacctc tgccccttcg gcgaggtgtt caacgccacc agattcgcca gcgtctacgc 7740
ctggaaccgg aagcggatca gcaattgcgt ggccgactac agcgtgctgt acaacagcgc 7800
cagcttcagc accttcaagt gctacggcgt gtcccctacc aagctgaacg atctgtgctt 7860
caccaacgtg tacgccgaca gcttcgtgat caggggcgac gaagtgcgac agatcgcccc 7920
aggacagaca ggaaagatcg ccgattacaa ctacaagctg cccgacgact tcaccggttg 7980
cgtgatcgct tggaacagca acaacctgga cagcaaggtc ggcggcaact acaactacct 8040
gtaccggctg ttccggaagt ccaacctgaa gcccttcgag cgggacatca gcacagagat 8100
ctaccaggcc ggcagcacac cttgtaacgg cgtggagggc ttcaactgct acttccctct 8160
gcagagctac ggcttccagc ctacaaacgg cgtgggatac cagccttaca gggtggtggt 8220
gctgagcttc gaactgctgc acgctccagc caccgtctgc ggacctaaaa agagcaccaa 8280
cctggtgaag aacaagtgcg tgaatttctg aagcggccca atgatccgac cagcaaaact 8340
cgatgtactt ccgaggaact gatgtgcata agcccctata actctctacg gctaacctga 8400
atggactacg acatagtcta gtccgccaag atgaaggcca tcctggtggt gctgctgtac 8460
accttcacca ccgccaacgc cgacaccctg tgcatcggct accacgccaa caacagcacc 8520
gacaccgtgg acaccgtgct ggagaagaac gtgaccgtga cccacagcgt gaacctgctg 8580
gaggacaagc acaacggcaa gctgtgcaag ctgagaggcg tggcccccct gcacctgggc 8640
aagtgcaaca tcgccggctg gatcctgggc aaccccgagt gcgagagcct gagcaccgcc 8700
agaagctgga gctacatcgt ggagaccagc aacagcgaca acggcacctg ctaccccggc 8760
gacttcatca actacgagga gctgagagag cagctgagca gcgtgagcag cttcgagaga 8820
ttcgagatct tccccaagac cagcagctgg cccaaccacg acagcgacaa gggcgtgacc 8880
gccgcctgcc cccacgccgg cgccaagagc ttctacaaga acctgatctg gctggtgaag 8940
aagggcaaca gctaccccaa gctgaaccag acctacatca acgacaaggg caaggaggtg 9000
ctggtgctgt ggggcatcca ccaccccccc accatcgccg cccaggagag cctgtaccag 9060
aacgccgacg cctacgtgtt cgtgggcacc agcagataca gcaagaagtt caagcccgag 9120
atcgccacca gacccaaggt gagagaccag gagggcagaa tgaactacta ctggaccctg 9180
gtggagcccg gcgataaaat caccttcgag gccaccggca acctggtggt gcccagatac 9240
gccttcacca tggagagaga cgccggcagc ggcatcatca tcagcgacac ccccgtgcac 9300
gactgcaaca ccacctgcca gacccccgag ggcgccatca acaccagcct gcccttccag 9360
aacgtgcacc ccatcaccat cggcaagtgc cccaagtacg tcaagagcac caagctgaga 9420
ctggccaccg gcctgagaaa cgtgcccagc atccagagcg tctcactgtt cggcgccatc 9480
gccggcttca tcgagggcgg ctggaccggc atggtgggct ggtacggcta ccaccaccag 9540
aacgagcagg gcagcggcta cgccgccgac ctcaagagca cccagaacgc catcgataag 9600
atcaccaaca aggtgaacag cgtgatcgag aagatgaaca cccagttcac cgccgtgggc 9660
aaggagttca accacctgga gaagagaatc gagaacctga acaagaaggt ggacgacggc 9720
ttcctggaca tctggaccta caacgccgag ctgctggtgc tgctggagaa cgagagaacc 9780
ctggactacc acgacagcaa cgtgaagaac ctgtacgaga aggtgagaaa ccagctgaag 9840
aacaacgcca aggagatcgg caacggctgc ttcgagttct accacaagtg cgacaacacc 9900
tgcatggaga gcgtgaagaa cggcacctac gactacccca agtacagcga ggaggccaag 9960
ctgaacagag agaagatcga cggcgtgaag ctggagagca ccagaatcta ccagatcctg 10020
gccatctaca gcaccgtggc cagcagcctg gtgctggtgg tgagcctggg cgccatcagc 10080
ttctggatgt gcagcaacgg cagcctgcag tgcagaatct gcatctgata aggcgcgccc 10140
acccagcggc cgcatacagc agcaattggc aagctgctta catagaactc gcggcgattg 10200
gcatgccgcc ttaaaatttt tattttattt ttcttttctt ttccgaatcg gattttgttt 10260
ttaatatttc aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa agaagagcta 10320
gggataacag ggtaattgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 10380
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 10440
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 10500
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 10560
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 10620
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 10680
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 10740
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 10800
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 10860
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 10920
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 10980
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 11040
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 11100
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttagaaaaa 11160
ctcatcgagc atcaaatgaa actgcaattt attcatatca ggattatcaa taccatattt 11220
ttgaaaaagc cgtttctgta atgaaggaga aaactcaccg aggcagttcc ataggatggc 11280
aagatcctgg tatcggtctg cgattccgac tcgtccaaca tcaatacaac ctattaattt 11340
cccctcgtca aaaataaggt tatcaagtga gaaatcacca tgagtgacga ctgaatccgg 11400
tgagaatggc aaaagtttat gcatttcttt ccagacttgt tcaacaggcc agccattacg 11460
ctcgtcatca aaatcactcg catcaaccaa accgttattc attcgtgatt gcgcctgagc 11520
gagacgaaat acgcgatcgc tgttaaaagg acaattacaa acaggaatcg aatgcaaccg 11580
gcgcaggaac actgccagcg catcaacaat attttcacct gaatcaggat attcttctaa 11640
tacctggaat gctgttttcc cagggatcgc agtggtgagt aaccatgcat catcaggagt 11700
acggataaaa tgcttgatgg tcggaagagg cataaattcc gtcagccagt ttagtctgac 11760
catctcatct gtaacatcat tggcaacgct acctttgcca tgtttcagaa acaactctgg 11820
cgcatcgggc ttcccataca atcgatagat tgtcgcacct gattgcccga cattatcgcg 11880
agcccattta tacccatata aatcagcatc catgttggaa tttaatcgcg gcctagagca 11940
agacgtttcc cgttgaatat ggctcatact cttccttttt caatattatt gaagcattta 12000
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 12060
aggggttccg cgcacatttc cccgaaaagt gccacctgac gttagggata acagggtaat 12120
taatacgact cactatag 12138
<210> 8
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 8
tatggccatg actactctag cta 23
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 9
gggaaacgcc tggtatcttt 20

Claims (10)

1.基于mRNA的针对冠状病毒和流感病毒的联合疫苗,其特征在于,包括:脂质体包裹的mRNA-Spike,脂质体包裹的mRNA-HA;所述mRNA根据α病毒的基因组设计而成;所述mRNA-Spike包含了新冠肺炎的刺突Spike蛋白基因,所述mRNA-HA包含了流感的血凝素蛋白基因。
2.基于mRNA的针对冠状病毒和流感病毒的联合疫苗,其特征在于,包括:脂质体包裹的mRNA-RBD-HA;所述mRNA根据α病毒的基因组设计而成;所述mRNA-Spike包含了新冠肺炎的刺突Spike蛋白基因和流感的血凝素蛋白基因。
3.根据权利要求1或2所述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗,其特征在于,所述mRNA包括:常规mRNA或自复制mRNA。
4.根据权利要求3所述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗,其特征在于,所述自复制mRNA利用线性化的质粒DNA为模板,在体外进行酶转录反应合成。
5.基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,其特征在于,包括如下步骤:
步骤一,制备mRNA-Spike制剂的步骤包括:
步骤a,合成Spike基因片段:
查询Spike氨基酸序列,根据人偏好密码子表进行密码子优化得到优化后的序列,在优化后的序列的上游加入启动子和ApaI酶切位点GGGCCC,下游加入NotI酶切位点GCGGCCGC,将设计好的序列通过合成获得;
步骤b,构建TC-83自复制载体:
根据α病毒家族的基因组设计自复制mRNA序列,所述自复制mRNA序列包含可编码α病毒自复制组件的基因,缺乏制造具有传染性的α病毒颗粒的结构蛋白的基因,将自复制mRNA序列构建到的质粒中做为模板扩增,将设计好的序列通过合成获得;
步骤c,制备重组质粒JCXH-103:
将上游携带ApaI、下游携带NotI的Spike基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒JCXH-103;
步骤d,JCXH-103质粒用限制性内切酶切线性化;
步骤e,将线性化的JCXH-103质粒进行体外转录反应,再对模板DNA进行降解,最后将7-甲基化鸟苷酸帽结构加至转录的mRNA的5’端;
步骤f,mRNA与脂类混合,mRNA包裹进入LNP内,得到mRNA-LNP复合物,通过浓缩及换液至制剂溶液中。
步骤二,制备mRNA-HA制剂的步骤包括:
步骤A,合成Flu基因片段;
步骤B,构建TC-83自复制载体;
步骤C,将上游携带ApaI、下游携带NotI的HA基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒JCXH-104;
步骤D,JCXH-104质粒用限制性内切酶切线性化;
步骤E,将线性化后JCXH-104质粒先开始体外转录反应,再对模板DNA进行降解,最后将7-甲基化鸟苷酸帽结构加至转录的mRNA的5’端;
步骤F,mRNA与脂类混合,将mRNA包裹进入LNP内,得到mRNA-LNP复合物,通过浓缩及换液至制剂溶液中;
步骤三,将mRNA-Spike制剂与mRNA-HA制剂混合得到联合疫苗。
6.基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,其特征在于,包括如下步骤:
步骤一,合成RBD-HA基因片段;
步骤二,构建TC-83自复制载体;
步骤三,将上游携带ApaI、下游携带NotI的HA基因插入TC-83复制载体的ApaI和NotⅠ酶切位点之间,得到重组质粒JCXH-105;
步骤四,将JCXH-105质粒用限制性内切酶切线性化;
步骤五,将线性化后的JCXH-105质粒进行体外转录反应,再对模板DNA进行降解,最后将7-甲基化鸟苷酸帽结构加至转录的mRNA的5’端;
步骤六,mRNA与脂类混合,使得mRNA包裹进入LNP内,得到mRNA-LNP复合物,通过浓缩及换液至制剂溶液中,得到联合疫苗。
7.根据权利要求5或6所述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,其特征在于,所述限制性内切酶为BspQI酶。
8.根据权利要求5或6所述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,其特征在于,线性化后的JCXH-103质粒、JCXH-104质粒、JCXH-105质粒使用T7 RNA聚合酶开始体外转录反应,使用Turbo DNase酶对模板DNA进行降解,使用加帽酶将7-甲基化鸟苷酸帽结构加至转录的mRNA的5’端。
9.根据权利要求5或6所述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,其特征在于,所述脂类包括:PEG2000,胆固醇,二硬脂酰基磷脂酰胆碱,阳离子脂类DLinDMA。
10.根据权利要求5或6所述的基于mRNA的针对冠状病毒和流感病毒的联合疫苗的制备方法,其特征在于,所述mRNA与脂类混合采用Nanoassemblr混合器进行混合。
CN202011149802.0A 2020-10-23 2020-10-23 基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法 Pending CN112546211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011149802.0A CN112546211A (zh) 2020-10-23 2020-10-23 基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011149802.0A CN112546211A (zh) 2020-10-23 2020-10-23 基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法

Publications (1)

Publication Number Publication Date
CN112546211A true CN112546211A (zh) 2021-03-26

Family

ID=75042837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011149802.0A Pending CN112546211A (zh) 2020-10-23 2020-10-23 基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法

Country Status (1)

Country Link
CN (1) CN112546211A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113509542A (zh) * 2021-04-20 2021-10-19 嘉晨西海(杭州)生物技术有限公司 一种基于mRNA的表达白介素12针对肿瘤的药物及其制备方法
CN113730566A (zh) * 2021-11-08 2021-12-03 天津中逸安健生物科技有限公司 一种流感新冠联合疫苗及其制备方法
CN114470182A (zh) * 2022-02-11 2022-05-13 贵州大学 一种禽腺病毒血清4型mRNA疫苗及其制备方法和应用
WO2022221440A1 (en) * 2021-04-14 2022-10-20 Modernatx, Inc. Influenza-coronavirus combination vaccines
WO2022235663A1 (en) * 2021-05-05 2022-11-10 Novavax, Inc. Coronavirus and influenza compositions and methods for using them
US11576961B2 (en) 2017-03-15 2023-02-14 Modernatx, Inc. Broad spectrum influenza virus vaccine
WO2023047419A1 (en) * 2021-09-24 2023-03-30 Bharat Biotech International Limited A vaccine for coronavirus and influenza virus, and method for preparation thereof
US11696946B2 (en) 2016-11-11 2023-07-11 Modernatx, Inc. Influenza vaccine
CN116606867A (zh) * 2023-04-28 2023-08-18 北京启辰生生物科技有限公司 一种提高新冠全长S蛋白mRNA完整性的制备方法及用途
WO2024013625A1 (en) * 2022-07-10 2024-01-18 Pfizer Inc. Self-amplifying rna encoding an influenza virus antigen
WO2024008192A3 (zh) * 2022-07-08 2024-02-29 嘉晨西海(杭州)生物技术有限公司 经修饰的自复制mRNA
WO2024086575A1 (en) * 2022-10-17 2024-04-25 BioNTech SE Combination vaccines against coronavirus infection, influenza infection, and/or rsv infection

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10806784B1 (en) * 2018-11-27 2020-10-20 King Abdulaziz University Composition and method for treating MERS

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10806784B1 (en) * 2018-11-27 2020-10-20 King Abdulaziz University Composition and method for treating MERS

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DILETTA MAGINI1: "Self-Amplifying mRNA Vaccines Expressing Multiple Conserved Influenza Antigens Confer Protection against Homologous and Heterosubtypic Viral Challenge", 《PLOS》 *
JESSE H. ERASMUS: "An Alphavirus-derived replicon RNA vaccine induces SARS-CoV-2 neutralizing antibody and T cell responses in mice and nonhuman primates", 《SCI.TRANSL.MED.》 *
SANDRA LAZZARO: "CD8 T-cell priming upon mRNA vaccination is restricted to bone-marrow-derived antigen-presenting cells and may involve antigen transfer from myocytes", 《IMMUNOLOGY》 *
环球网: "俄罗斯正研制流感病毒与新冠病毒联合疫苗,具双重功效", 《环球网》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11696946B2 (en) 2016-11-11 2023-07-11 Modernatx, Inc. Influenza vaccine
US11576961B2 (en) 2017-03-15 2023-02-14 Modernatx, Inc. Broad spectrum influenza virus vaccine
WO2022221440A1 (en) * 2021-04-14 2022-10-20 Modernatx, Inc. Influenza-coronavirus combination vaccines
CN113509542A (zh) * 2021-04-20 2021-10-19 嘉晨西海(杭州)生物技术有限公司 一种基于mRNA的表达白介素12针对肿瘤的药物及其制备方法
WO2022235663A1 (en) * 2021-05-05 2022-11-10 Novavax, Inc. Coronavirus and influenza compositions and methods for using them
WO2023047419A1 (en) * 2021-09-24 2023-03-30 Bharat Biotech International Limited A vaccine for coronavirus and influenza virus, and method for preparation thereof
CN113730566A (zh) * 2021-11-08 2021-12-03 天津中逸安健生物科技有限公司 一种流感新冠联合疫苗及其制备方法
CN113730566B (zh) * 2021-11-08 2022-03-01 天津中逸安健生物科技有限公司 一种流感新冠联合疫苗及其制备方法
CN114470182A (zh) * 2022-02-11 2022-05-13 贵州大学 一种禽腺病毒血清4型mRNA疫苗及其制备方法和应用
WO2024008192A3 (zh) * 2022-07-08 2024-02-29 嘉晨西海(杭州)生物技术有限公司 经修饰的自复制mRNA
WO2024013625A1 (en) * 2022-07-10 2024-01-18 Pfizer Inc. Self-amplifying rna encoding an influenza virus antigen
WO2024086575A1 (en) * 2022-10-17 2024-04-25 BioNTech SE Combination vaccines against coronavirus infection, influenza infection, and/or rsv infection
CN116606867A (zh) * 2023-04-28 2023-08-18 北京启辰生生物科技有限公司 一种提高新冠全长S蛋白mRNA完整性的制备方法及用途
CN116606867B (zh) * 2023-04-28 2024-01-26 北京启辰生生物科技有限公司 一种提高新冠全长S蛋白mRNA完整性的制备方法及用途

Similar Documents

Publication Publication Date Title
CN112546211A (zh) 基于mRNA的针对冠状病毒和流感病毒的联合疫苗及其制备方法
CN112226445B (zh) 编码SARS-CoV-2病毒刺突蛋白的核酸及其的应用
AU2020205228B2 (en) Gene therapies for lysosomal disorders
AU2020260491B2 (en) Gene therapies for lysosomal disorders
AU2020260476B2 (en) Gene therapies for lysosomal disorders
KR20210086645A (ko) Aav 삼중-플라스미드 시스템
KR101850162B1 (ko) 형질전환용 플라스미드
KR20180069081A (ko) 심장 이상 및 기타 병리 이상의 치료를 위한 복수의 생물학적으로 활성화된 폴리펩티드를 단일 벡터로부터 발현하기 위한 조성물 및 방법
KR20220006527A (ko) 리소좀 장애에 대한 유전자 요법
CN117222415A (zh) 多顺反子rna疫苗及其用途
CN107630029B (zh) 一种产朊假丝酵母游离型表达载体及其构建方法与应用
CN113754781B (zh) 基于mRNA的针对冠状病毒的疫苗及其制备方法
CN113509542A (zh) 一种基于mRNA的表达白介素12针对肿瘤的药物及其制备方法
CN109576269B (zh) 一种含mar核心片段的动物细胞表达载体
CN112553240A (zh) 重组表达载体系统、重组工程菌及其制备方法和用途
KR20230051529A (ko) 리소좀 장애에 대한 유전자 요법
TW202233830A (zh) 使用下一代工程化t細胞療法治療癌症之組合物及方法
RU2720519C1 (ru) Генотерапевтический ДНК-вектор на основе генотерапевтического ДНК-вектора VTvaf17, несущий целевой ген, выбранный из группы генов IFNB1, IFNA14, IFNA2, IL12A, IL12B для повышения уровня экспрессии этих целевых генов, способ его получения и применения, штамм Escherichia coli SCS110-AF/VTvaf17-IFNB1, или Escherichia coli SCS110-AF/VTvaf17-IFNA14, или Escherichia coli SCS110-AF/VTvaf17-IFNA2, или Escherichia coli SCS110-AF/VTvaf17-IL12A, или Escherichia coli SCS110-AF/VTvaf17-IL12B, несущий генотерапевтический ДНК-вектор, способ его получения, способ производства в промышленных масштабах генотерапевтического ДНК-вектора
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination