CN117222415A - 多顺反子rna疫苗及其用途 - Google Patents

多顺反子rna疫苗及其用途 Download PDF

Info

Publication number
CN117222415A
CN117222415A CN202180089244.XA CN202180089244A CN117222415A CN 117222415 A CN117222415 A CN 117222415A CN 202180089244 A CN202180089244 A CN 202180089244A CN 117222415 A CN117222415 A CN 117222415A
Authority
CN
China
Prior art keywords
nucleotide sequence
sequence encoding
operably linked
antigen
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180089244.XA
Other languages
English (en)
Inventor
P·艾伦
I·德索萨
Y·文
S·贝蒂
C·常
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seqirus Co
Original Assignee
Seqirus Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seqirus Co filed Critical Seqirus Co
Publication of CN117222415A publication Critical patent/CN117222415A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/145Orthomyxoviridae, e.g. influenza virus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • A61P31/16Antivirals for RNA viruses for influenza or rhinoviruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/11Orthomyxoviridae, e.g. influenza virus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/165Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/572Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/575Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/16011Orthomyxoviridae
    • C12N2760/16111Influenzavirus A, i.e. influenza A virus
    • C12N2760/16134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/36011Togaviridae
    • C12N2770/36111Alphavirus, e.g. Sindbis virus, VEE, EEE, WEE, Semliki
    • C12N2770/36141Use of virus, viral particle or viral elements as a vector
    • C12N2770/36143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Communicable Diseases (AREA)
  • Pulmonology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Oncology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicinal Preparation (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开涉及多顺反子RNA疫苗及其用途。本公开还涉及多顺反子常规mRNA疫苗及其用途。本公开进一步涉及多顺反子自我复制RNA疫苗及其用途。

Description

多顺反子RNA疫苗及其用途
相关申请资料
本申请要求2020年12月2日提交的题为“多顺反子自我复制RNA及其用途(Multicistronic self-replicating RNA and uses thereof)”的美国专利申请号63/120,362的优先权,其全部内容通过引用并入本文。
序列表
本申请与电子形式的序列表一起提交。序列表的全部内容通过引用并入本文。
技术领域
本公开涉及多顺反子RNA疫苗及其用途。本公开还涉及多顺反子常规mRNA疫苗及其用途。本公开进一步涉及多顺反子自我复制RNA疫苗及其用途。
背景技术
呼吸道病毒感染对人类健康和生命构成重大威胁。已知诸如由流感病毒和严重急性呼吸综合征冠状病毒(SARS-CoV)引起的那些感染导致全球大流行,世界各地数百万人死亡。最近,SAR-CoV-2引起了正在全球范围内进行的严重传染性冠状病毒疾病2019(COVID-19)的大流行。
目前,用抗病毒剂或其它药物治疗诸如流感的感染。然而,目前对于大多数呼吸道病毒感染没有特异性和有效的治疗。对于可用于某些呼吸道病毒感染的那些特异性治疗,例如抗COVID-19的mRNA疫苗,可以进行进一步改进以增加其功效。
病毒疫苗,诸如流感疫苗,依赖于通过中和病毒体或阻断病毒进入细胞而防止感染的抗体的诱导。体液免疫应答靶向病毒表面蛋白,然而由于这些表面蛋白在每种毒株内是保守的,抗体介导的针对具有血清学上不同的表面蛋白的毒株的保护是不充分的。此外,许多病毒的表面蛋白能够快速突变。这意味着大多数疫苗必须是多价的,即包括来自预计在给定时期内最流行的毒株的抗原。
为了增强对流感病毒表面蛋白的免疫应答(例如,抗体应答),在疫苗制剂中包括各种佐剂和免疫增强剂。然而,安全性和有效性问题仍然存在。
目前,基于鸡蛋的制造工艺是生产流感疫苗的最常见方式。该工艺需要大量的时间来优化病毒在鸡蛋中的生长,也需要资源(即,鸡蛋)来生产足够量的疫苗,特别是在大流行期间。此外,考虑到所需的长研制时间,在可获得疫苗之前进行疫苗株选择,使得难以对病毒的变化作出响应。流感疫苗也已经使用基于细胞的制造工艺生产,涉及用培养的哺乳动物细胞(例如,Madin-Darby犬肾细胞,或MDCK细胞)代替鸡蛋,和基于病毒的平台,涉及重组病毒(例如,编码流感抗原的杆状病毒)。
仍然需要研制特异性和有效的病毒疫苗,其可以比目前基于鸡蛋的技术更快速地生产,用于治疗或预防呼吸道病毒感染,诸如流感和COVID-19。基于核酸的疫苗比目前基于鸡蛋的制造平台具有明显的优势,尽管仍存在一些挑战。例如,mRNA的固有不稳定性质导致大多数基于RNA的疫苗在产生强、持久的免疫应答所需的剂量和持续时间下提供抗原的能力有限。因此,对于本领域技术人员显而易见的是,本领域需要用于将外源核酸递送至受试者的改进手段。本领域还需要在受试者的靶细胞内具有增强的稳定性和改进的抗原表达的mRNA疫苗。
发明内容
本公开的发明人已经鉴定了具有改进的活性并且允许多于一种抗原的有效表达的RNA(即,多顺反子RNA)。本公开基于发明人对具有改进活性的自我复制RNA的鉴定。特别地,本发明人已经鉴定了允许有效表达多于一种抗原并且不导致不需要的融合蛋白形成的自我复制RNA。
发明人的发现为多顺反子RNA提供了基础。本发明人的发现也为多顺反子自我复制RNA提供了基础。此外,本发明人的发现为多顺反子常规(即非自我复制)RNA提供了基础。本发明人的发现还为治疗或预防受试者中的疾病或疾患(例如,由呼吸道病毒感染诸如流感、SARS-COV-2感染、COVID-19或ARDS引起的疾病)或延缓其进展的方法提供了基础。
因此,本公开提供了一种多核苷酸,其包含:a)编码目的第一多肽的第一核苷酸序列;和b)编码目的第二多肽的第二核苷酸序列,其与选自由亚基因组(SG)启动子和内部核糖体进入位点(IRES)组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码目的第一多肽的第一核苷酸序列;和b)编码目的第二多肽的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开还提供了一种多核苷酸,其包含:a)编码目的第一抗原的第一核苷酸序列;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸是RNA或DNA。例如,多核苷酸是RNA。在一个实例中,多核苷酸是DNA。
在一个实例中,RNA是信使RNA(mRNA)。在一个实例中,mRNA是常规mRNA(cRNA)或自我复制mRNA。
因此,本公开提供了一种RNA,其包含:a)编码目的第一抗原的第一核苷酸序列;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,RNA以5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开还提供了一种cRNA,其包含:a)编码目的第一抗原的第一核苷酸序列;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,cRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开还提供了一种自我复制mRNA,其包含:a)编码目的第一抗原的第一核苷酸序列;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,自我复制mRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,编码目的第一抗原的第一核苷酸序列与调节元件可操作地连接。例如,调节元件可操作地连接到第一核苷酸序列的5'端。在一个实例中,调节元件选自由以下组成的组:Kozak共有序列、IRES、SG启动子及其组合。例如,调节元件是Kozak共有序列。例如,调节元件是IRES。例如,调节元件是SG启动子。
在一个实例中,Kozak共有序列包含或由SEQ ID NO:38中所列的序列组成。在一个实例中,Kozak共有序列由SEQ ID NO:38中所列的序列组成。在一个实例中,Kozak共有序列包含SEQ ID NO:38中所列的序列。例如,Kozak共有序列是ACCATGG。
在一个实例中,Kozak共有序列包含或由SEQ ID NO:39中所列的序列组成。在一个实例中,Kozak共有序列由SEQ ID NO:39中所列的序列组成。在一个实例中,Kozak共有序列包含SEQ ID NO:39中所列的序列。例如,Kozak共有序列是ACCATG。
本公开提供了一种多核苷酸,其包含:a)编码目的第一抗原的第一核苷酸序列,其与选自由Kozak共有序列、IRES、SG启动子及其组合组成的组的调节元件可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与选自由Kozak共有序列、IRES、SG启动子及其组合组成的组的调节元件可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种RNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与选自由Kozak共有序列、IRES、SG启动子及其组合组成的组的调节元件可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,RNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与选自由Kozak共有序列、IRES、SG启动子及其组合组成的组的调节元件可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种cRNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与选自由Kozak共有序列、IRES、SG启动子及其组合组成的组的调节元件可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,cRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与选自由Kozak共有序列、IRES、SG启动子及其组合组成的组的调节元件可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种自我复制mRNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与选自由Kozak共有序列、IRES、SG启动子及其组合组成的组的调节元件可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,自我复制mRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与选自由Kozak共有序列、IRES、SG启动子及其组合组成的组的调节元件可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,编码目的第一抗原的第一核苷酸序列与Kozak共有序列可操作地连接。
在一个实例中,编码目的第一抗原的第一核苷酸序列与Kozak共有序列和SG启动子可操作地连接。例如,Kozak共有序列可操作地连接至SG启动子的5'端,该SG启动子可操作地连接至编码目的第一抗原的第一核苷酸序列的5'端。
在一个实例中,编码目的第一抗原的第一核苷酸序列与Kozak共有序列和IRES可操作地连接。例如,Kozak共有序列可操作地连接至IRES的5'端,该IRES可操作地连接至编码目的第一抗原的第一核苷酸序列的5'端。
在一个实例中,编码目的第一抗原的第一核苷酸序列与SG启动子可操作地连接。
在一个实例中,编码目的第一抗原的第一核苷酸序列与IRES可操作地连接。
本公开提供了一种多核苷酸,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种多核苷酸,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种多核苷酸,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种多核苷酸,其包含:a)编码目的第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种多核苷酸,其包含:a)编码目的第一抗原的第一核苷酸序列,其与IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种RNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,RNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种RNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,RNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种RNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,RNA按从5'至3'的顺序包含:a)码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种RNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,RNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种RNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,RNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种cRNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,cRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种cRNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,cRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种cRNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,cRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与Kozak共有序列和IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种cRNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,cRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种cRNA,其包含:a)编码目的第一抗原的第一核苷酸序列,其与IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,cRNA按从5'至3'的顺序包含:a)编码目的第一抗原的第一核苷酸序列,其与IRES可操作地连接;和b)编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了多顺反子自我复制RNA,其包含:a)编码第一抗原的第一核苷酸序列,其与亚基因组(SG)启动子可操作地连接;和b)编码第二抗原的第二核苷酸序列,其与选自由SG启动子和内部核糖体进入位点(IRES)组成的组的调节元件可操作地连接;
在一个实例中,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;和b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多核苷酸是双顺反子RNA。例如,多核苷酸是双顺反子cRNA。在一个实例中,cRNA是双顺反子cRNA。在另一实例中,多核苷酸是双顺反子自我复制mRNA。例如,自我复制RNA是双顺反子自我复制RNA。
在一个实例中,编码第二抗原的第二核苷酸序列与IRES可操作地连接。
在一个实例中,编码第二抗原的第二核苷酸序列与SG启动子可操作地连接。
在一个实例中,多核苷酸是多顺反子RNA。例如,多核苷酸是多顺反子cRNA。例如,cRNA是多顺反子cRNA。在另一实例中,多核苷酸是多顺反子自我复制mRNA。例如,自我复制RNA是多顺反子自我复制mRNA。
在一个实例中,多核苷酸包含一个或多个附加的核苷酸序列,其中每个序列编码附加的目的抗原,该附加的目的抗原与选自由SG启动子和IRES组成的组的调节元件可操作地连接,其中一个或多个核苷酸序列位于第二核苷酸序列的3'处。例如,多核苷酸包含至少三个核苷酸序列,或至少四个核苷酸序列,或至少五个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子RNA包含一个或多个附加的核苷酸序列,其中每个序列编码附加的目的抗原,该附加的目的抗原与选自由SG启动子和IRES组成的组的调节元件可操作地连接,其中一个或多个核苷酸序列位于第二核苷酸序列的3'处。例如,多顺反子RNA包含至少三个核苷酸序列,或至少四个核苷酸序列,或至少五个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子cRNA包含一个或多个附加的核苷酸序列,其中每个序列编码附加的目的抗原,该附加的目的抗原与选自由SG启动子和IRES组成的组的调节元件可操作地连接,其中一个或多个核苷酸序列位于第二核苷酸序列的3'处。例如,多顺反子cRNA包含至少三个核苷酸序列,或至少四个核苷酸序列,或至少五个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子自我复制RNA包含一个或多个附加的核苷酸序列,其中每个核苷酸序列编码附加的抗原,该附加的抗原与选自由SG启动子和IRES组成的组的调节元件可操作地连接,并且其中编码附加的抗原的一个或多个核苷酸序列位于编码第二抗原的第二核苷酸序列的3'处。例如,多顺反子自我复制RNA包含至少三个核苷酸序列,或至少四个核苷酸序列,或至少五个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多核苷酸包含至少三个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子RNA包含至少三个核苷酸序列,其中每个核苷酸序列编码抗原。例如,RNA是三顺反子RNA。
在一个实例中,多顺反子cRNA包含至少三个核苷酸序列,其中每个核苷酸序列编码抗原。例如,cRNA是三顺反子RNA。
在一个实例中,多顺反子自我复制RNA包含至少三个核苷酸序列,其中每个核苷酸序列编码抗原。例如,自我复制RNA是三顺反子自我复制RNA。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。
在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。
在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。
在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。
在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。
在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;和c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接。
在一个实例中,多核苷酸包含至少四个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子RNA包含至少四个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子cRNA包含至少四个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子自我复制RNA包含至少四个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子自我复制RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多顺反子自我复制RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;和d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接。
在一个实例中,多核苷酸包含至少五个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子RNA包含至少五个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子cRNA包含至少五个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多顺反子自我复制RNA包含至少五个核苷酸序列,其中每个核苷酸序列编码抗原。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES或SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES或SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES或SG启动子可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子自我复制RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子自我复制RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在进一步的实例中,多顺反子自我复制RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与SG启动子可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。在进一步的实例中,多顺反子自我复制RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与SG启动子可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多核苷酸按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与SG启动子可操作地连接。在另一实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与SG启动子可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多核苷酸按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子RNA按从5'至3'的顺序包含:a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子cRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制mRNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,多顺反子自我复制RNA按从5'至3'的顺序包含a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;b)编码第二抗原的第二核苷酸序列,其与IRES可操作地连接;c)编码第三抗原的第三核苷酸序列,其与IRES可操作地连接;d)编码第四抗原的第四核苷酸序列,其与IRES可操作地连接;和e)编码第五抗原的第五核苷酸序列,其与IRES可操作地连接。
在一个实例中,SG启动子是天然SG启动子。例如,天然SG启动子是指其所衍生和/或基于的RNA病毒(例如,甲病毒)的天然启动子。在一个实例中,天然SG启动子是天然甲病毒SG启动子。
在一个实例中,SG启动子是最小SG启动子或延伸的SG启动子。
在一个实例中,SG启动子是最小SG启动子。在一个实例中,天然SG启动子是最小SG启动子。例如,最小SG启动子是转录起始所需的最小序列。在一个实例中,最小天然SG启动子长度为49个核苷酸。在一个实例中,最小SG启动子长度为49个核苷酸。在一个实例中,最小天然SG启动子由包含或由SEQ ID NO:1中所列的序列组成的序列编码。在一个实例中,最小SG启动子由包含或由SEQ ID NO:1中所列的序列组成的序列编码。
在一个实例中,SG启动子是延伸的SG启动子。在一个实例中,天然SG启动子是延伸的SG启动子。例如,延伸的SG启动子在5'端延伸,其中核苷酸存在于编码RNA病毒(例如,甲病毒)的非结构蛋白(例如,NSP4)的序列中。在一个实例中,延伸的SG启动子在5'端延伸,其中核苷酸存在于编码甲病毒NSP4的序列中。将核苷酸添加到SG启动子序列的5'端不干扰非结构蛋白和病毒复制酶,例如甲病毒NSP4,的表达。
令人惊讶的是,本发明人发现添加至SG启动子的5'端以增强表达的核苷酸数目是有限的。例如,本发明人发现在5'端延伸了52个核苷酸的SG启动子不起作用,该核苷酸存在于编码非结构蛋白(例如甲病毒NSP4)的序列中。特别地,当使用在5'端延伸了52个核苷酸的SG启动子,该核苷酸存在于编码非结构蛋白的序列中时,没有检测到抗原表达。因此,在一个实例中,SG启动子在5'端延伸了51个或更少的核苷酸,该核苷酸存在于编码非结构蛋白(例如甲病毒NSP4)的序列中。在一个实例中,延伸的SG启动子是在5'端延伸了不超过51个核苷酸的最小SG启动子,该核苷酸存在于编码非结构蛋白(例如甲病毒NSP4)的序列中。在一个实例中,延伸的SG启动子由包含或由SEQ ID NO:1中所列的序列组成的序列编码,该序列在5'端延伸了不超过51个核苷酸,该核苷酸存在于编码非结构蛋白(例如甲病毒NSP4)的序列中。例如,延伸的SG启动子长度不超过100个核苷酸。在一个实例中,延伸的SG启动子由包含或由SEQ ID NO:15的核苷酸2至101组成的序列编码。
在一个实例中,SG启动子在5'端延伸了约5个核苷酸至约20个核苷酸,例如延伸约5个核苷酸,或约10个核苷酸,或约12个,或约15个核苷酸,或约20个核苷酸,该核苷酸存在于编码非结构蛋白(例如甲病毒NSP4)的序列中。在另一实例中,SG启动子在5'端延伸了约20至约35个核苷酸,例如延伸约25个核苷酸或约27个核苷酸,或约30个核苷酸,或约35个核苷酸,该核苷酸存在于编码非结构蛋白(例如甲病毒NSP4)的序列中。
在一个实例中,SG启动子在5'端延伸了约12个核苷酸,该核苷酸存在于编码非结构蛋白(例如甲病毒NSP4)的序列中。在一个实例中,延伸的SG启动子由SEQ ID NO:1中所列的序列编码,该序列在5'端延伸了12个核苷酸,该核苷酸存在于编码非结构蛋白(例如甲病毒属NSP4)的序列中。例如,延伸的SG启动子长度不超过61个核苷酸。在一个实例中,延伸的SG启动子由包含或由SEQ ID NO:15的核苷酸41至101组成的序列编码。在另一实例中,延伸的SG启动子由包含或由SEQ ID NO:2中所列的序列组成的序列编码。
在一个实例中,SG启动子在5'端延伸了约31个核苷酸,该核苷酸存在于编码非结构蛋白(例如甲病毒NSP4)的序列中。在一个实例中,延伸的SG启动子由SEQ ID NO:1中所列的序列编码,该序列在5'端延伸了31个核苷酸,该核苷酸存在于编码非结构蛋白(例如甲病毒属NSP4)的序列中。例如,延伸的SG启动子长度不超过80个核苷酸。在一个实例中,延伸的SG启动子由包含或由SEQ ID NO:15的核苷酸22至101组成的序列编码。在另一实例中,延伸的SG启动子由包含或由SEQ ID NO:3中所列的序列组成的序列编码。
在一个实例中,延伸的SG启动子包含对应于SEQ ID NO:15的核苷酸66至75的重复序列。例如,延伸的SG启动子通过包含SEQ ID NO:15的核苷酸50至75和SEQ ID NO:15的核苷酸66至101的序列编码。例如,延伸的SG启动子由SEQ ID NO:47中所列的序列编码。
在一个实例中,IRES是衍生自脑心肌炎病毒(EMCV)的野生型IRES。例如,野生型EMCV IRES包含SEQ ID NO:4中所列的序列。
在一个实例中,第一和/或第二核苷酸序列和/或一个或多个附加的核苷酸序列是密码子优化的。
在一个实例中,修饰第一和/或第二核苷酸序列和/或一个或多个附加的核苷酸序列的G/C含量。
在一个实例中,与未修饰序列的G/C含量相比,第一和/或第二核苷酸序列和/或一个或多个附加的核苷酸序列的G/C含量增加至少5%。例如,与未修饰序列的G/C含量相比,第一和/或第二核苷酸序列和/或一个或多个附加的核苷酸序列的G/C含量增加至少10%,或15%,或20%,或25%,或30%,或35%,或40%。
在一个实例中,多核苷酸包含至少一个化学修饰的核苷酸。
在一个实例中,化学修饰的核苷酸选自由以下组成的组:N6,2'-O-二甲基-腺苷(m6Am)、5-甲基尿苷(m5U)、N4-乙酰胞苷(ac4C)、2-硫代胞苷(s2C)、2-硫代尿苷(s2U)、5-甲基胞苷(m5C)、N6-甲基腺苷(m6a)、假尿苷(ψ)、1-甲基假尿苷(m1ψ)及其组合。例如,化学修饰的核苷酸是N6,2'-O-二甲基-腺苷(m6Am)。例如,化学修饰的核苷酸是5-甲基尿苷(m5U)。例如,化学修饰的核苷酸是N4-乙酰胞苷(ac4C)。例如,化学修饰的核苷酸是2-硫代胞苷(s2C)。例如,化学修饰的核苷酸是2-硫代尿苷(s2U)。例如,化学修饰的核苷酸是5-甲基胞苷(m5C)。例如,化学修饰的核苷酸是N6-甲基腺苷(m6a)。例如,化学修饰的核苷酸是假尿苷(ψ)。例如,化学修饰的核苷酸是1-甲基假尿苷(m1ψ)。
在一个实例中,第一核苷酸序列包含触珠蛋白(HP)、纤维蛋白原β链(FGB)、触珠蛋白相关蛋白(HPR)、白蛋白(ALB)、补体成分3(C3)、纤维蛋白原α链(FGA)、α6胶原(Col6A)、α-1-抗胰蛋白酶(SERPINA1)、α-1-抗胰凝乳蛋白酶(SERPINA3)的5'-UTR、其片段和/或变体。
在一个实例中,5'UTR是委内瑞拉马脑炎病毒(Venezuelan equine encephalitisvirus,VEEV)或其修饰形式的5'UTR。例如,5'UTR包含SEQ ID NO:45中所列的序列。
在一个实例中,5'-UTR、其片段和/或变体的长度在40和2000个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在40和100个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在100和250个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在250和500个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在500和750个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在750和1000个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在1000和1250个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在1250和1500个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在1500和1750个核苷酸之间。例如,5'-UTR、其片段和/或变体的长度在1750和2000个核苷酸之间。
在一个实例中,5'-UTR、其片段和/或变体包含与SEQ ID NO:40至54中任一个所列的核苷酸序列至少90%相同的核苷酸序列。例如,5'-UTR、其片段和/或变体包含与SEQ IDNO:40至54中任一个所列的核苷酸序列90%,或91%,或92%,或93%,或94%,或95%,或96%,或97%,或98%,或99%相同的核苷酸序列。
在一个实例中,多核苷酸包含两个或更多个5'-UTR、其片段和/或变体的组合。在一个实例中,两个或更多个5'-UTR是相同的。在一个实例中,两个或更多个5'-UTR是不同的。
在一个实例中,包含5'UTR的核苷酸序列包含至少一个微小RNA结合位点、富含AU的元件(ARE)、富含GC的元件、茎环及其组合。在一个实例中,核苷酸序列包含微小RNA结合位点。在一个实例中,核苷酸序列包含富含AU的元件(ARE)。在一个实例中,核苷酸包含富含GC的元件。在一个实例中,核苷酸序列包含茎环。例如,茎环为组蛋白茎环。
在一个实例中,多核苷酸进一步包含包含3'UTR的核苷酸序列。在一个实例中,包含3'UTR的核苷酸序列位于第二个或一个或多个附加的核苷酸序列的3'处。例如,包含3'UTR的核苷酸序列位于第二核苷酸序列的3'处。在一个实例中,3'UTR包含花生四烯酸5-脂氧合酶(ALOX5)、αI胶原(COL1A1)、酪氨酸羟化酶(TH)基因、分裂的氨基末端增强子(AES)、人线粒体12S rRNA(mtRNR1)的3'-UTR、其片段和/或变体。
在一个实例中,3'UTR是辛德毕斯病毒(Sindbis virus,SINV)或其修饰形式的3'UTR。例如,3'UTR包含SEQ ID NO:46中所列的序列。
在一个实例中,3'UTR、其片段和/或变体的长度在40和400个核苷酸之间。例如,3'-UTR的长度在40和50,或50和60,或60和70,或70和80,或80和90,或90和100,或100和125,或125和150,或150和175,或175和200,或200和225,或225和250,或250和275,或275和300,或300和325,或325和350,或350和375,或375和400个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在40和50个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在50和60个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在60和70个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在70和80个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在80和90个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在90和100个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在100和125个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在125和150个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在150和175个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在175和200个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在200和225个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在225和250个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在250和275个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在275和300个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在300和325个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在325和350个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在350和375个核苷酸之间。例如,3'-UTR、其片段和/或变体的长度在375和400个核苷酸之间。
在一个实例中,多核苷酸包含两个或更多个3'-UTR、其片段和/或变体的组合。在一个实例中,两个或更多个3'-UTR是相同的。在一个实例中,两个或更多个3'-UTR是不同的。
在一个实例中,包含3'UTR、其片段和/或变体的核苷酸序列包含至少一个微小RNA结合位点、富含AU的元件(ARE)、富含GC的元件、三股螺旋、茎环、一个或多个终止密码子及其组合。在一个实例中,核苷酸序列包含微小RNA结合位点。在一个实例中,核苷酸序列包含富含AU的元件(ARE)。在一个实例中,核苷酸序列包含富含GC的元件。在一个实例中,核苷酸序列包含三股螺旋。在一个实例中,核苷酸序列包含茎环。例如,茎环为组蛋白茎环。在一个实例中,核苷酸序列包含一个或多个终止密码子。例如,一个或多个终止密码子位于3'-UTR的5'端。
在一个实例中,多核苷酸包含核苷酸序列,该核苷酸序列包含位于包含3'UTR的核苷酸序列的3'端的一个或多个3'加尾序列。在一个实例中,一个或多个3'加尾序列选自由以下组成的组:poly-A序列、聚腺苷酸化信号、G-四链体、poly-C序列、茎环及其组合。例如,3'加尾序列包含poly-A序列。在一个实例中,3'加尾序列包含聚腺苷酸化信号。在一个实例中,3'加尾序列包含G-四链体。在一个实例中,3'加尾序列包含poly-C序列。在一个实例中,3'加尾序列包含茎环。例如,茎环为组蛋白茎环。在一个实例中,3'加尾序列包含poly-A序列和G-四链体。在一个实例中,3'加尾序列包含茎环(例如组蛋白茎环)和poly-A序列。
在一个实例中,一个或多个3'加尾序列包含一个或多个poly-A序列,各自包含10至300个连续腺苷核苷酸。例如,poly-A序列各自包含10至20,或20至30,或30至40,或40至50,或50至60,或60至70,或70至80,或80至90,或90至100,或100至125,或125至150,或150至175,或175至200,或200至225,或225至250,或250至275,或275至300个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含10至20个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含20至30个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含30至40个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含36个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含40至50个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含50至60个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含60至70个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含70至80个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含80至90个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含90至100个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含100至125个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含125至150个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含150至175个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含175至200个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含200至225个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含225至250个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含250至275个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含275至300个连续腺苷核苷酸。
在一个实例中,一个或多个poly-A序列各自包含10,或20,或30,或40,或50,或60,或70,或80,或90,或100,或125,或150,或175,或200,或225,或250,或275,或300个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含10个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含20个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含30个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含40个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含50个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含60个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含70个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含80个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含90个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含100个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含125个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含150个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含175个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含200个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含225个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含250个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含275个连续腺苷核苷酸。例如,一个或多个poly-A序列各自包含300个连续腺苷核苷酸。
在一个实例中,poly-A序列包含36个连续腺苷核苷酸。例如,poly-A序列包含SEQID NO:48中所列的序列。
在一个实例中,一个或多个poly-A序列被中断接头分离。例如,3'加尾序列按从5'至3'的顺序包含:包含连续腺苷核苷酸的polyA序列、中断接头,和包含连续腺苷核苷酸的另一poly-A序列。
在一个实例中,中断接头的长度为10至50,或50至100,或100至150个核苷酸。例如,中断接头的长度为10至50个核苷酸。例如,中断接头的长度为50至100个核苷酸。例如,中断接头的长度为100至150个核苷酸。
在一个实例中,中断接头的长度为1,或2,或3,或4,或5,或6,或7,或8,或9,或10,或11,或12,或13,或14,或15,或16,或17,或18,或19,或20,或25,或30,或35,或40,或45,或50,或55,或60,或65,或70,或75,或80,或85,或90,或95,或100,或110,或120,或130,或140,或150个核苷酸。例如,中断接头的长度为1个核苷酸。例如,中断接头的长度为2个核苷酸。例如,中断接头的长度为3个核苷酸。例如,中断接头的长度为4个核苷酸。例如,中断接头的长度为5个核苷酸。例如,中断接头的长度为6个核苷酸。例如,中断接头的长度为7个核苷酸。例如,中断接头的长度为8个核苷酸。例如,中断接头的长度为9个核苷酸。例如,中断接头的长度为10个核苷酸。例如,中断接头的长度为11个核苷酸。例如,中断接头的长度为12个核苷酸。例如,中断接头的长度为13个核苷酸。例如,中断接头的长度为14个核苷酸。例如,中断接头的长度为15个核苷酸。例如,中断接头的长度为16个核苷酸。例如,中断接头的长度为17个核苷酸。例如,中断接头的长度为18个核苷酸。例如,中断接头的长度为19个核苷酸。例如,中断接头的长度为20个核苷酸。例如,中断接头的长度为25个核苷酸。例如,中断接头的长度为30个核苷酸。例如,中断接头的长度为35个核苷酸。例如,中断接头的长度为40个核苷酸。例如,中断接头的长度为45个核苷酸。例如,中断接头的长度为50个核苷酸。例如,中断接头的长度为55个核苷酸。例如,中断接头的长度为60个核苷酸。例如,中断接头的长度为65个核苷酸。例如,中断接头的长度为70个核苷酸。例如,中断接头的长度为75个核苷酸。例如,中断接头的长度为80个核苷酸。例如,中断接头的长度为85个核苷酸。例如,中断接头的长度为90个核苷酸。例如,中断接头的长度为95个核苷酸。例如,中断接头的长度为100个核苷酸。例如,中断接头的长度为110个核苷酸。例如,中断接头的长度为120个核苷酸。例如,中断接头的长度为130个核苷酸。例如,中断接头的长度为140个核苷酸。例如,中断接头的长度为150个核苷酸。
在一个实例中,中断接头的长度为10个核苷酸。在一个实例中,中断接头包含或由SEQ ID NO:40中所列的核苷酸序列组成。例如,中断接头包含或其核苷酸序列GCAUAUGACU组成。
在一个实例中,3'加尾序列按从5'至3'的顺序包含:包含30个连续腺苷核苷酸的poly-A序列、10个核苷酸的中断接头,和包含70个连续腺苷核苷酸的另一poly-A序列。
在一个实例中,3'加尾序列按从5'至3'的顺序包含:包含30个连续腺苷核苷酸的poly-A序列、包含或由SEQ ID NO:40中所列的核苷酸序列组成的中断接头,和包含70个连续腺苷核苷酸的另一poly-A序列。
在一个实例中,多核苷酸按从5'至3'的顺序包含:
a)5'-UTR、其片段和/或变体;
b)调节元件,其选自由以下组成的组:Kozak共有序列、IRES、SG启动子及其组合;
c)编码目的第一多肽的第一核苷酸序列;
d)编码目的第二多肽的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;
e)3'-UTR、其片段和/或变体;和
f)一个或多个3'加尾序列,其选自由以下组成的组:poly-A序列、聚腺苷酸化信号、G-四链体、poly-C序列、茎环及其组合。
在一个实例中,RNA按从5'至3'的顺序包含:
a)5'-UTR、其片段和/或变体;
b)调节元件,其选自由以下组成的组:Kozak共有序列、IRES、SG启动子及其组合;
c)编码目的第一多肽的第一核苷酸序列;
d)编码目的第二多肽的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;
e)3'-UTR、其片段和/或变体;和
f)一个或多个3'加尾序列,其选自由以下组成的组:poly-A序列、聚腺苷酸化信号、G-四链体、poly-C序列、茎环及其组合。
在一个实例中,cRNA按从5'至3'的顺序包含:
a)5'-UTR、其片段和/或变体;
b)调节元件,其选自由以下组成的组:Kozak共有序列、IRES、SG启动子及其组合;
c)编码目的第一多肽的第一核苷酸序列;
d)编码目的第二多肽的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;
e)3'-UTR、其片段和/或变体;和
f)一个或多个3'加尾序列,其选自由以下组成的组:poly-A序列、聚腺苷酸化信号、G-四链体、poly-C序列、茎环及其组合。
在一个实例中,sa-mRNA按从5'至3'的顺序包含:
a)5'-UTR、其片段和/或变体;
b)调节元件,其选自由以下组成的组:Kozak共有序列、IRES、SG启动子及其组合;
c)编码目的第一多肽的第一核苷酸序列;
d)编码目的第二多肽的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;
e)3'-UTR、其片段和/或变体;和
f)一个或多个3'加尾序列,其选自由以下组成的组:poly-A序列、聚腺苷酸化信号、G-四链体、poly-C序列、茎环及其组合。
在一个实例中,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含:
a)编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与最小SG启动子可操作地连接;或
b)编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与延伸的SG启动子可操作地连接;或
c)编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与野生型EMCV IRES可操作地连接。
在一个实例中,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含:编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与最小SG启动子可操作地连接。
例如,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含:编码第一抗原的第一核苷酸序列,其与包含SEQ ID NO:1中所列的序列的最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与包含SEQ ID NO:1中所列的序列的最小SG启动子可操作地连接。
在一个实例中,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含:编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与延伸的SG启动子可操作地连接。
在一个实例中,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含:编码第一抗原的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与由SEQ ID NO:2中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含:编码第一抗原的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与由SEQ ID NO:3中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含:编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与野生型EMCV IRES可操作地连接。
在一个实例中,本公开的多顺反子自我复制RNA按从5'至3'的顺序包含:编码第一抗原的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与由SEQ ID NO:4中所列的序列编码的野生型EMCV IRES可操作地连接。
在一个实例中,RNA进一步包含5'末端帽结构。
在一个实例中,5'末端帽结构是内源帽或其类似物。例如,5'末端帽结构是内源帽。例如,5'末端帽结构是内源帽的类似物。
在一个实例中,5'末端帽结构包含鸟嘌呤或其鸟嘌呤类似物。例如,5'末端帽结构包含鸟嘌呤。例如,5'末端帽结构包含鸟嘌呤的鸟嘌呤类似物。
在一个实例中,5'末端帽结构选自由以下组成的组:抗反向帽类似物(ARCA)、N7,2'-0-二甲基-鸟苷(mCAP)、肌苷、N1-甲基-鸟苷、2'氟-鸟苷、7-脱氮-鸟苷、8-氧代-鸟苷、2-氨基-鸟苷、LNA-鸟苷、2-叠氮基-鸟苷、N6,2'-O-二甲基腺苷、7-甲基鸟苷(m7G)、帽1和帽2。例如,5'末端帽结构是抗反向帽类似物(ARCA)。例如,5'末端帽结构是N7,2'-0-二甲基-鸟苷(mCAP)。例如,5'末端帽结构是肌苷。例如,5'末端帽结构是N1-甲基-鸟苷。例如,5'末端帽结构是2'氟-鸟苷。例如,5'末端帽结构是7-脱氮-鸟苷。例如,5'末端帽结构是8-氧代-鸟苷。例如,5'末端帽结构是2-氨基-鸟苷。例如,5'末端帽结构是LNA-鸟苷。例如,5'末端帽结构是2-叠氮基-鸟苷。例如,5'末端帽结构是N6,2'-O-二甲基腺苷。例如,5'末端帽结构是7-甲基鸟苷(m7G)。例如,5'末端帽结构是帽1。例如,5'末端帽结构是帽2。
在一个实例中,5'末端帽结构通过5'-5'-三磷酸键或5'-5'硫代磷酸酯键连接至RNA的5'端。例如,5'末端帽结构通过5'-5'-三磷酸键连接至RNA的5'端。例如,5'末端帽结构通过5'-5'硫代磷酸酯键连接至RNA的5'端。
在一个实例中,抗原以基本相同的水平表达。例如,抗原具有在彼此的约10%,或约5%或约1%内的表达水平。在另一实例中,抗原以不同水平表达。例如,抗原具有大于彼此的约10%,或约15%或约20%的表达水平。确定表达水平的方法是本领域已知的和/或在本文中描述。
在一个实例中,自我复制RNA来自甲病毒。例如,甲病毒选自由以下组成的组:塞姆利基森林病毒(Semliki Forest virus,SFV)、辛德毕斯病毒(SIN)和委内瑞拉马脑炎病毒(VEE)及其组合。
在一个实例中,自我复制RNA来自塞姆利基森林病毒(SFV)。
在一个实例中,自我复制RNA来自辛德毕斯病毒(SIN)。
在一个实例中,自我复制RNA来自委内瑞拉马脑炎病毒(VEE)。
在一个实例中,抗原是病毒抗原。例如,病毒抗原来自呼吸道病毒。在一个实例中,呼吸病毒选自由以下组成的组:流感病毒、呼吸道合胞病毒(respiratory syncytialvirus)、副流感病毒、偏肺病毒(metapneumovirus)、鼻病毒(rhinovirus)、冠状病毒、腺病毒和博卡病毒。
在一个实例中,病毒抗原来自流感病毒。
在一个实例中,病毒抗原来自呼吸道合胞病毒。
在一个实例中,病毒抗原来自副流感病毒。
在一个实例中,病毒抗原来自偏肺病毒。
在一个实例中,病毒抗原来自鼻病毒。
在一个实例中,病毒抗原来自冠状病毒。
在一个实例中,病毒抗原来自腺病毒。
在一个实例中,病毒抗原来自博卡病毒。
在一个实例中,抗原是来自流感病毒或冠状病毒的病毒抗原。
在一个实例中,抗原来自流感病毒的单株(即单价)或来自多株(即多价)。例如,自我复制RNA包括来自一种或多种(例如,1或2或3种)流感病毒株的抗原。
在一个实例中,第一和第二流感病毒抗原来自流感病毒的不同毒株。例如,第一和第二抗原来自甲型、乙型和/或丙型流感病毒株。
在一个实例中,抗原来自甲型流感病毒株。例如,抗原是甲型流感病毒血凝素(HA)蛋白、神经氨酸苷酶(NA)蛋白、基质(M)蛋白、核蛋白(NP)、非结构(NS)蛋白或其免疫原性片段或变体。在一个实例中,抗原是甲型流感血凝素(HA)亚型H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15或H16和/或甲型流感神经氨酸苷酶(NA)亚型N1、N2、N3、N4、N5、N6、N7、N8或N9和/或甲型流感基质(M)蛋白亚型M1或M2和/或甲型流感非结构(NS)蛋白亚型NS1或NS2。
在一个实例中,流感病毒抗原来自流感病毒的不同亚型。例如,不同的血凝素亚型和/或不同的神经氨酸苷酶亚型和/或基质蛋白亚型,和/或核蛋白亚型和/或非结构蛋白亚型。
本领域技术人员将意识到流感病毒的大流行株通常是H1、H2、H3、H5、H6、H7或H9亚型甲型流感病毒株。例如,H1N1、H2N2、H3N2、H5N1、H5N3、H6N1、H7N2、H7N3、H7N7、H7N9和H9N2毒株。
在一个实例中,抗原来自具有相同血凝素亚型的甲型流感病毒株。在另一实例中,抗原是具有不同血凝素亚型的甲型流感病毒株。在一个实例中,抗原是H1、H2、H3、H5、H6、H7或H9亚型甲型流感病毒株。例如,抗原是H1血凝素,或H2血凝素,或H3血凝素,或H5血凝素,或H6血凝素,或H7血凝素或H9血凝素。例如,抗原是H5亚型甲型流感病毒株(即,H5血凝素)。在一个实例中,H5血凝素是A/火鸡/土耳其(Turkey)/1/2005病毒株。例如,H5血凝素由SEQID NO:5中所列的序列编码。在一个实例中,H3血凝素是A/特拉华州(Delaware)/39/2019病毒株。例如,H3血凝素由SEQ ID NO:54中所列的序列编码。
在一个实例中,抗原是具有相同神经氨酸苷酶亚型的甲型流感病毒株。在另一实例中,抗原是具有不同神经氨酸苷酶亚型的甲型流感病毒株。在一个实例中,抗原是N1、N2、N3、N7或N9亚型甲型流感病毒株。例如,抗原是N1神经氨酸苷酶,或N2神经氨酸苷酶,或N3神经氨酸苷酶,或N7神经氨酸苷酶,或N9神经氨酸苷酶。例如,抗原是N1神经氨酸苷酶亚型甲型流感病毒株。在一个实例中,N1神经氨酸苷酶是A/火鸡/土耳其/1/2005毒株。例如,N1神经氨酸苷酶由SEQ ID NO:6中所列的序列编码。在一个实例中,N2神经氨酸苷酶是A/特拉华州/39/2019病毒株。例如,N2神经氨酸苷酶由SEQ ID NO:55中所列的序列编码。
在一个实例中,抗原是H5血凝素蛋白和/或N1神经氨酸苷酶蛋白。例如,第一抗原是H5血凝素亚型甲型流感病毒株,并且第二抗原是N1神经氨酸苷酶亚型甲型流感病毒株。在一个实施例中,第一抗原是由SEQ ID NO:5中所列的序列编码的H5血凝素亚型甲型流感病毒株,并且第二抗原是由SEQ ID NO:6中所列的序列编码的N1神经氨酸苷酶亚型甲型流感病毒株。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列;或
b)编码N1神经氨酸苷酶蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码N1神经氨酸苷酶蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码N1神经氨酸苷酶蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码H5血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列;或
b)编码N1神经氨酸苷酶蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码N1神经氨酸苷酶蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码N1神经氨酸苷酶蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码H5血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列;或
b)编码N1神经氨酸苷酶蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码N1神经氨酸苷酶蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码N1神经氨酸苷酶蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码H5血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列;或
b)编码N1神经氨酸苷酶蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与SG启动子可操作地连接;和编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与由SEQ ID NO:2中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与由SEQ ID NO:3中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与由SEQ ID NO:4中所列的序列编码的IRES可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按5'至3'的顺序包含编码N1神经氨酸苷酶蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码N1神经氨酸苷酶蛋白的第一核苷酸序列,其与SG启动子可操作地连接;和编码H5血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码N1神经氨酸苷酶蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码H5血凝素蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码N1神经氨酸苷酶蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码H5血凝素蛋白的第二核苷酸序列,其与由SEQ ID NO:2中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码N1神经氨酸苷酶蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码H5血凝素蛋白的第二核苷酸序列,其与由SEQ ID NO:3中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码N1神经氨酸苷酶的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码H5血凝素蛋白的第二核苷酸序列,其与由SEQ ID NO:4中所列的序列编码的IRES可操作地连接。
在一个实例中,抗原是甲型流感病毒血凝素(HA)蛋白和基质(M)蛋白。例如,抗原是H5血凝素蛋白和/或M1基质蛋白。在一个实例中,M1神经氨酸苷酶是A/波多黎各(PuertoRico)/8/1934(PR8-X)毒株。在另一实例中,M1神经氨酸苷酶是A/加利福尼亚(California)/07/09毒株。在一个实例中,抗原是由SEQ ID NO:5中所列的序列编码的H5血凝素亚型甲型流感病毒株和由SEQ ID NO:16或SEQ ID NO:29中所列的序列编码的M1基质蛋白亚型甲型流感病毒株。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列;或
b)编码M1基质蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码M1基质蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列;或
b)编码M1基质蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码M1基质蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列;或
b)编码M1基质蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码M1基质蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列;或
b)编码M1基质蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与SG启动子可操作地连接;和编码M1基质蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码M1基质蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,抗原是甲型流感病毒血凝素(HA)蛋白、神经氨酸苷酶(NA)蛋白和基质(M)蛋白。例如,抗原是H5血凝素蛋白和/或N1神经氨酸苷酶蛋白和/或M1基质蛋白。在一个实施例中,抗原是由SEQ ID NO:5中所列的序列编码的H5血凝素亚型甲型流感病毒株、由SEQ ID NO:6中所列的序列编码的N1神经氨酸苷酶亚型甲型流感病毒株和由SEQ ID NO:16或SEQ ID NO:29中所列的序列编码的M1基质蛋白亚型甲型流感病毒株。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列;和编码M1基质蛋白的第三核苷酸序列;或
b)编码M1基质蛋白的第一核苷酸序列、编码N1神经氨酸苷酶蛋白的第二核苷酸序列;和编码H5血凝素蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列和编码M1基质蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码M1基质蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列和编码H5血凝素蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码H5血凝素蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列;和编码M1基质蛋白的第三核苷酸序列;或
b)编码M1基质蛋白的第一核苷酸序列、编码N1神经氨酸苷酶蛋白的第二核苷酸序列;和编码H5血凝素蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列和编码M1基质蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码M1基质蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列和编码H5血凝素蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码H5血凝素蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列;和编码M1基质蛋白的第三核苷酸序列;或
b)编码M1基质蛋白的第一核苷酸序列、编码N1神经氨酸苷酶蛋白的第二核苷酸序列;和编码H5血凝素蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列和编码M1基质蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码M1基质蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列和编码H5血凝素蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码H5血凝素蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列;和编码M1基质蛋白的第三核苷酸序列;或
b)编码M1基质蛋白的第一核苷酸序列、编码N1神经氨酸苷酶蛋白的第二核苷酸序列;和编码H5血凝素蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列和编码M1基质蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码M1基质蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;
b)编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
c)编码M1基质蛋白的第三核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;编码N1神经氨酸苷酶蛋白的第二核苷酸序列和编码H5血凝素蛋白的第三核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码H5血凝素蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码M1基质蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;
b)编码N1神经氨酸苷酶蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
c)编码H5血凝素蛋白的第三核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,抗原是甲型流感病毒HA蛋白、NA蛋白和M蛋白。例如,抗原是H5血凝素蛋白和/或N1神经氨酸苷酶蛋白和/或M1基质蛋白和/或M2基质蛋白。在一个实例中,抗原是由SEQ ID NO:5中所列的序列编码的H5血凝素亚型甲型流感病毒毒株、由SEQ ID NO:6中所列的序列编码的N1神经氨酸苷酶亚型甲型流感病毒毒株、由SEQ ID NO:16或SEQ ID NO:29中所列的序列编码的M1基质蛋白亚型甲型流感病毒株和由SEQ ID NO:17中所列的序列编码的M2基质蛋白亚型甲型流感病毒株。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;编码M2基质蛋白的第二核苷酸序列;编码N1神经氨酸苷酶蛋白的第三核苷酸序列和编码H5血凝素蛋白的第四核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码M2基质蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;编码N1神经氨酸苷酶蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码H5血凝素蛋白的第四核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;编码M2基质蛋白的第二核苷酸序列;编码N1神经氨酸苷酶蛋白的第三核苷酸序列和编码H5血凝素蛋白的第四核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码M2基质蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;编码N1神经氨酸苷酶蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码H5血凝素蛋白的第四核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;编码M2基质蛋白的第二核苷酸序列;编码N1神经氨酸苷酶蛋白的第三核苷酸序列和编码H5血凝素蛋白的第四核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码M2基质蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;编码N1神经氨酸苷酶蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码H5血凝素蛋白的第四核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;编码M2基质蛋白的第二核苷酸序列;编码N1神经氨酸苷酶蛋白的第三核苷酸序列和编码H5血凝素蛋白的第四核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码M2基质蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;编码N1神经氨酸苷酶蛋白的第三核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接;和编码H5血凝素蛋白的第四核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码M1基质蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;
b)编码M2基质蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
c)编码N1神经氨酸苷酶蛋白的第三核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
d)编码H5血凝素蛋白的第四核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,抗原是甲型流感病毒HA蛋白和NS蛋白。例如,抗原是H5血凝素蛋白和/或NS1非结构蛋白。在一个实例中,抗原是由SEQ ID NO:5中所列的序列编码的H5血凝素亚型甲型流感病毒株和由SEQ ID NO:18中所列的序列编码的NS1非结构蛋白亚型甲型流感病毒株。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码NS1非结构蛋白的第二核苷酸序列;或
b)编码NS1非结构蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码NS1非结构蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码NS1非结构蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码NS1非结构蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码NS1非结构蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码H5血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码NS1非结构蛋白的第二核苷酸序列;或
b)编码NS1非结构蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码NS1非结构蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码NS1非结构蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供一种RNA,其中该RNA按从5'至3'的顺序包含编码NS1非结构蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供一种RNA,其中该RNA按从5'至3'的顺序包含编码NS1非结构蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码H5血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码NS1非结构蛋白的第二核苷酸序列;或
b)编码NS1非结构蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码NS1非结构蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码NS1非结构蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码NS1非结构蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码NS1非结构蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码H5血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列;和编码NS1非结构蛋白的第二核苷酸序列;或
b)编码NS1非结构蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列;和编码NS1非结构蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H5血凝素蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码NS1非结构蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码H5血凝素蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码NS1非结构蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码NS1非结构蛋白的第一核苷酸序列;和编码H5血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码NS1非结构蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码H5血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码NS1非结构蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码H5血凝素蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,抗原是甲型流感病毒M蛋白和NP。例如,抗原是M1基质蛋白和/或NP蛋白。在一个实例中,NP蛋白是A/加利福尼亚/07/09毒株。在一个实施例中,抗原是由SEQID NO:16或SEQ ID NO:29中所列的序列编码的M1基质蛋白亚型甲型流感病毒株和由SEQID NO:28中所列的序列编码的NP核蛋白。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按5'至3'的顺序包含:
a)编码M1基质蛋白的第一核苷酸序列;和编码NP核蛋白的第二核苷酸序列;或
b)编码NP核蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;和编码NP核蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码NP核蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含:
a)编码M1基质蛋白的第一核苷酸序列;和编码NP核蛋白的第二核苷酸序列;或
b)编码NP核蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;和编码NP核蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码NP核蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码M1基质蛋白的第一核苷酸序列;和编码NP核蛋白的第二核苷酸序列;或
b)编码NP核蛋白的第一核苷酸序列;和编码M1基质蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列;和编码NP核蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码M1基质蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码NP核蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码M1基质蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码NP核蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码M1基质蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码NP核蛋白的第二核苷酸序列,其与由SEQ ID NO:2中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按5'至3'的顺序包含:
c)编码H3血凝素蛋白的第一核苷酸序列;和编码N2神经氨酸苷酶蛋白的第二核苷酸序列;或
d)编码N2神经氨酸苷酶蛋白的第一核苷酸序列;和编码H3血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H3血凝素蛋白的第一核苷酸序列;和编码N2神经氨酸苷酶蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码H3血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N2神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码N2神经氨酸苷酶蛋白的第一核苷酸序列;和编码H3血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码N2神经氨酸苷酶蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码H3血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含:
c)编码H3血凝素蛋白的第一核苷酸序列;和编码N2神经氨酸苷酶蛋白的第二核苷酸序列;或
d)编码N2神经氨酸苷酶蛋白的第一核苷酸序列;和编码H3血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H3血凝素蛋白的第一核苷酸序列;和编码N2神经氨酸苷酶蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码H3血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N2神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码N2神经氨酸苷酶蛋白的第一核苷酸序列;和编码H3血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码N2神经氨酸苷酶蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码H3血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含:
c)编码H3血凝素蛋白的第一核苷酸序列;和编码N2神经氨酸苷酶蛋白的第二核苷酸序列;或
d)编码N2神经氨酸苷酶蛋白的第一核苷酸序列;和编码H3血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H3血凝素蛋白的第一核苷酸序列;和编码N2神经氨酸苷酶蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码H3血凝素蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码N2神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码N2神经氨酸苷酶蛋白的第一核苷酸序列;和编码H3血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码N2神经氨酸苷酶蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码H3血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
c)编码H3血凝素蛋白的第一核苷酸序列;和编码N2神经氨酸苷酶蛋白的第二核苷酸序列;或
d)编码N2神经氨酸苷酶蛋白的第一核苷酸序列;和编码H3血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码H3血凝素蛋白的第一核苷酸序列;和编码N2神经氨酸苷酶蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中所述RNA按从5'至3'的顺序包含编码H3血凝素蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码N2神经氨酸苷酶蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
c)编码H3血凝素蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
d)编码N2神经氨酸苷酶蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码N2神经氨酸苷酶蛋白的第一核苷酸序列;和编码H3血凝素蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码N2神经氨酸苷酶蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码H3血凝素蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
c)编码N2神经氨酸苷酶蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
d)编码H3血凝素蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,抗原是乙型流感病毒株。本领域技术人员将意识到,乙型流感病毒不分成亚型,而是分类为两种谱系,即B/山形(Yamagata)和B/维多利亚(Victoria)。
在一个实例中,抗原是B/山形乙型流感病毒株。例如,乙型流感病毒株是B/新加坡(Singapore)/INFTT 16 0610/16(By)病毒株。在另一实例中,抗原是B/维多利亚乙型流感病毒株。在一个实例中,抗原是相同谱系的乙型流感病毒株。在另一实例中,抗原是不同谱系的乙型流感病毒株。
在一个实例中,抗原是乙型流感病毒Hyam蛋白和/或Nyam蛋白。例如,抗原是乙型流感病毒Hyam蛋白。在另一实例中,抗原是乙型流感病毒Nyam蛋白。在进一步的实例中,抗原是乙型流感病毒Hyam和Nyam蛋白。在一个实施例中,抗原是由SEQ ID NO:56中所列的序列编码的Hyam亚型乙型流感病毒株和由SEQ ID NO:57中所列的序列编码的Nyam亚型乙型流感病毒株。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按5'至3'的顺序包含:
e)编码Hyam蛋白的第一核苷酸序列;和编码Nyam蛋白的第二核苷酸序列;或
f)编码Nyam蛋白的第一核苷酸序列;和编码Hyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码Hyam蛋白的第一核苷酸序列;和编码Nyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码Hyam蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码Nyam蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码Nyam蛋白的第一核苷酸序列;和编码Hyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码Nyam蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码Hyam蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含:
e)编码Hyam蛋白的第一核苷酸序列;和编码Nyam蛋白的第二核苷酸序列;或
f)编码Nyam蛋白的第一核苷酸序列;和编码Hyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码Hyam蛋白的第一核苷酸序列;和编码Nyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码Hyam蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码Nyam蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码Nyam蛋白的第一核苷酸序列;和编码Hyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码Nyam蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码Hyam蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含:
e)编码Hyam蛋白的第一核苷酸序列;和编码Nyam蛋白的第二核苷酸序列;或
f)编码Nyam蛋白的第一核苷酸序列;和编码Hyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码Hyam蛋白的第一核苷酸序列;和编码Nyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码Hyam蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码Nyam蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码Nyam蛋白的第一核苷酸序列;和编码Hyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码Nyam蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;编码Hyam蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
e)编码Hyam蛋白的第一核苷酸序列;和编码Nyam蛋白的第二核苷酸序列;或
f)编码Nyam蛋白的第一核苷酸序列;和编码Hyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码Hyam蛋白的第一核苷酸序列;和编码Nyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码Hyam蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码Nyam蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
e)编码Hyam蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
f)编码Nyam蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码Nyam蛋白的第一核苷酸序列;和编码Hyam蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码Nyam蛋白的第一核苷酸序列,其与SG启动子可操作地连接;编码Hyam蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
e)编码Nyam蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
f)编码Hyam蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,抗原是来自冠状病毒的病毒抗原。
在一个实例中,抗原是α冠状病毒(alphacoronavirus)、β冠状病毒(betacoronavirus)、γ冠状病毒(gammacoronavirus)和/或δ冠状病毒(deltacoronavirus)株。
在一个实例中,抗原是α冠状病毒。例如,α冠状病毒选自由以下组成的组:α冠状病毒1、人冠状病毒229E(HCoV 229E)、人冠状病毒NL63(HCoV NL63)、长翼蝠冠状病毒1型(Miniopterus bat coronavirus 1)、长翼蝠冠状病毒HKU8、猪流行性腹泻病毒(Porcineepidemic diarrhea virus)、菊头蝠冠状病毒HKU2(Rhinolophus bat coronavirus HKU2)和黄蝠冠状病毒512(Scotophilus bat coronavirus 512)。
在一个实例中,抗原是β冠状病毒。例如,β冠状病毒选自由以下组成的组:β冠状病毒1(牛冠状病毒、人冠状病毒OC43)、刺猬冠状病毒1、人冠状病毒HKU1(HCoV HKU1)、中东呼吸综合征相关冠状病毒(MERS-CoV)、鼠冠状病毒、伏翼蝙(Pipistrellus bat)冠状病毒HKU5、果蝠(Rousettus bat)冠状病毒HKU9、严重急性呼吸综合征相关冠状病毒(SARS-CoV、SARS-CoV-2)和扁颅蝠(Tylonycteris bat)冠状病毒HKU4。在一个实例中,抗原衍生自选自由以下组成的组的β冠状病毒:中东呼吸综合征相关冠状病毒(MERS-CoV)和严重急性呼吸综合征相关冠状病毒(SARS-CoV或SARS-CoV-2)。例如,抗原来自MERS-CoV。在另一实例中,抗原来自SARS-CoV。在进一步的实例中,抗原来自SARS-CoV-2。例如,冠状病毒是SARS-CoV-2。
在一个实例中,抗原是γ冠状病毒。例如,γ冠状病毒选自由以下组成的组:鸟类冠状病毒和白鲸冠状病毒SW1。
在一个实例中,抗原是δ冠状病毒。例如,δ冠状病毒选自由以下组成的组:夜莺冠状病毒HKU11和猪冠状病毒HKU15。
在一个实例中,抗原是冠状病毒的刺突(S)蛋白和/或核壳体(N)蛋白。例如,抗原是SARS-CoV-2N蛋白和/或S蛋白。在一个实例中,抗原是SARS-CoV-2N蛋白和/或来自SARS-CoV-2株2019-nCoV/USA-WA1/2020的S蛋白。
在一个实例中,抗原是SARS-CoV-2N蛋白。例如,抗原是SARS-CoV-2N蛋白,并且由SEQ ID NO:7中所列的序列编码。
在另一实例中,抗原是SARS-CoV-2S蛋白。例如,抗原是SARS-CoV-2刺突蛋白,并且由SEQ ID NO:8中所列的序列编码。
在另一实例中,S蛋白是突变体S蛋白。
在一个实例中,在受体结合结构域中突变体S蛋白包含突变。例如,突变选自由以下组成的组:S438F、N439K、N440K、L441I、K444R、V445A、V445I、G446V、G446S、N450K、L452R、L452P、L455F、K458N、N460T、D467V、I468F、I468T、I468V、E471O、I472V、A475V、G476S、S477G、S477I、S477N、S477R、T478I、P479L、P479L、P479S、N481D、N481H、V483F、V483A、E484D、E484K、E484K、E484O、G485S、Y489H、Y489D、Y489F、Y489C、Y489N、F490L、F490S、P491R、Q493L、S494P、Y495N、T500N、N501S和Y505H、Y508H。在一个实例中,在受体结合结构域中突变体S蛋白包含选自由以下组成的组的突变:N439K、N439L、L452R、S477N、T478I、V483A和E484D。
在一个实例中,在受体结合结构域中突变体S蛋白包含突变。例如,突变选自由以下组成的组:R346K、K417N、K417T、S438F、N439K、N440K、L441I、K444R、V445A、V445I、G446V、G446S、N450K、L452R、L452P、L455F、K458N、N460T、D467V、I468F、I468T、I468V、E471O、I472V、A475V、G476S、S477G、S477I、S477N、S477R、T478I、T478K、P479L、P479S、N481D、N481H、V483F、V483A、E484D、E484K、E484K、E484O、G485S、Y489H、Y489D、Y489F、Y489C、Y489N、F490L、F490S、P491R、Q493L、S494P、Y495N、T500N、N501S、N501Y、Y505H和Y508H。在一个实例中,在受体结合结构域中突变体S蛋白包含选自由以下组成的组的突变:R346K、K417N、K417T、N439K、N439L、L452R、S477N、T478I、V483A、E484D、E484K和N501Y。
在一个实例中,突变体S蛋白包含选自由以下组成的组的突变:P337S、F338L、F338C、G339D、E340K、V341I、A344S、T345S、R346K、A348S、A348T、W353R、N354D、N354K、N354S、S359N、D364Y、V367F、S373L、V382L、P384L、P384S、T385A、T393P、V395I、F400C、R403K、R403S、D405V、R408I、Q414E、Q414K、Q414P、Q414R、T415S、K417R、K417N、I418V、Y421S、Y423C、Y423F、Y423S、D427Y、R509K、V510L、V511E、V512L、L518I、H519O、A520S、A520V、P521R、P521S、A522P、A522S和D614G。
在一个实例中,突变体S蛋白包含选自由以下组成的组的突变:L18F、D80A、T95I、Y144S、Y145N、D215G、P337S、F338L、F338C、G339D、E340K、V341I、A344S、T345S、R346K、A348S、A348T、W353R、N354D、N354K、N354S、S359N、D364Y、V367F、S373L、V382L、P384L、P384S、T385A、T393P、V395I、F400C、R403K、R403S、D405V、R408I、Q414E、Q414K、Q414P、Q414R、T415S、K417N、K417T、K417R、I418V、Y421S、Y423C、Y423F、Y423S、D427Y、S438F、N439K、N440K、L441I、K444R、V445A、V445I、G446V、G446S、N450K、L452R、L452P、L455F、K458N、N460T、D467V、I468F、I468T、I468V、E471O、I472V、A475V、G476S、S477G、S477I、S477N、S477R、T478I、T478K、P479L、P479S、N481D、N481H、V483F、V483A、E484D、E484K、E484K、E484O、G485S、Y489H、Y489D、Y489F、Y489C、Y489N、F490L、F490S、P491R、Q493L、S494P、Y495N、T500N、N501S、N501Y、Y505H、Y508H、R509K、V510L、V511E、V512L、L518I、H519O、A520S、A520V、P521R、P521S、A522P、A522S、A570D、D614G、P680H、P681H、A701V、T716I和D950N。
在一个实例中,突变体S蛋白:(i)在S1/S2边界处缺少弗林蛋白酶切割位点并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和/或(ii)在S2'位点处缺少弗林蛋白酶切割位点;和/或(iii)包含在对应于SEQ IDNO:37的核苷酸614的残基处的D变为G的突变;和/或(iv)包含在对应于SEQ ID NO:37的核苷酸986和987的残基之间插入两个脯氨酸残基。
在一个实例中,S蛋白在S1/S2边界处缺少弗林蛋白酶切割位点,并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变。例如,突变S蛋白由SEQ ID NO:9中所列的序列编码。
在一个实例中,S蛋白在S2'位点处缺少弗林蛋白酶切割位点。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变。例如,突变S蛋白由SEQ ID NO:36中所列的序列编码。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸986和987的残基之间插入两个脯氨酸残基。
在一个实例中,S蛋白(i)在S1/S2边界处缺少弗林蛋白酶切割位点,并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)在S2'位点处缺少弗林蛋白酶切割位点。例如,突变S蛋白由SEQ ID NO:34中所列的序列编码。
在一个实例中,S蛋白(i)在S1/S2边界处缺少弗林蛋白酶切割位点,并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变。例如,突变S蛋白由SEQ ID NO:33中所列的序列编码。
在一个实例中,S蛋白(i)在S1/S2边界处缺少弗林蛋白酶切割位点,并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)包含在对应于SEQ ID NO:37的核苷酸986和987的残基之间插入两个脯氨酸残基。例如,突变S蛋白由SEQ ID NO:32中所列的序列编码。
在一个实例中,S蛋白(i)在S1/S2边界处缺少弗林蛋白酶切割位点,并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)在S2'位点处缺少弗林蛋白酶切割位点;以及(iii)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变。例如,突变S蛋白由SEQ ID NO:35中所列的序列编码。
在一个实例中,S蛋白(i)在S1/S2边界处缺少弗林蛋白酶切割位点,并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)在S2'位点处缺少弗林蛋白酶切割位点;以及(iii)包含在对应于SEQ ID NO:37的核苷酸986和987的残基之间插入两个脯氨酸残基。
在一个实例中,S蛋白(i)在S2'位点处缺少弗林蛋白酶切割位点;和(ii)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变。
在一个实例中,S蛋白(i)在S2'位点处缺少弗林蛋白酶切割位点;和(ii)包含在对应于SEQ ID NO:37的核苷酸986和987的残基之间插入两个脯氨酸残基。
在一个实例中,S蛋白(i)在S2'位点处缺少弗林蛋白酶切割位点;和(ii)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变;以及(iii)包含在对应于SEQ IDNO:37的核苷酸986和987的残基之间插入两个脯氨酸残基。
在一个实例中,S蛋白(i)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变;和(ii)包含在对应于SEQ ID NO:37的核苷酸986和987的残基之间插入两个脯氨酸残基。
在一个实例中,S蛋白(i)在S1/S2边界处缺少弗林蛋白酶切割位点,并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)在S2'位点处缺少弗林蛋白酶切割位点;和(iii)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变;以及(iv)包含在对应于SEQ ID NO:37的核苷酸986和987的残基之间插入两个脯氨酸残基。
在一个实例中,突变体S蛋白包含(i)在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;和/或(ii)对应于SEQ ID NO:37的核苷酸69和70的两个残基的缺失;和/或(iii)在对应于SEQ ID NO:37的核苷酸681的残基处的P变为H的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变,和对应于SEQ ID NO:37的核苷酸69和70的两个残基的缺失,以及在对应于SEQ ID NO:37的核苷酸681的残基处的P变为H的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸681的残基处的P变为H的突变。
在一个实例中,突变体S蛋白包含(i)在对应于SEQ ID NO:37的核苷酸417的残基处的K变为N的突变;和/或(ii)在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变;和/或(iii)在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸417的残基处的K变为N的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸417的残基处的K变为N的突变,和在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变,以及在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变。
在一个实例中,突变体S蛋白包含(i)在对应于SEQ ID NO:37的核苷酸417的残基处的K变为T的突变;和/或(ii)在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变;和/或(iii)在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸417的残基处的K变为T的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸417的残基处的K变为T的突变,和在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变,以及在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变。
在一个实例中,突变体S蛋白包含(i)在对应于SEQ ID NO:37的核苷酸95的残基处的T变为I的突变;和/或(ii)在对应于SEQ ID NO:37的核苷酸144的残基处的Y变为S的突变;和/或(iii)在对应于SEQ ID NO:37的核苷酸145的残基处的Y变为N的突变;和/或(iv)在对应于SEQ ID NO:37的核苷酸346的残基处的R变为K的突变;和/或(v)在对应于SEQ IDNO:37的核苷酸484的残基处的E变为K的突变;和/或(vi)在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;和/或(vii)在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变;和/或(viii)在对应于SEQ ID NO:37的核苷酸681的残基处的P变为H的突变;和/或(ix)在对应于SEQ ID NO:37的核苷酸950的残基处的D变为N的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸95的残基处的T变为I的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸144的残基处的Y变为S的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸145的残基处的Y变为N的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸346的残基处的R变为K的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸950的残基处的D变为N的突变。
在一个实例中,突变体S蛋白包含(i)在对应于SEQ ID NO:37的核苷酸95的残基处的T变为I的突变;和(ii)在对应于SEQ ID NO:37的核苷酸144的残基处的Y变为S的突变;和(iii)在对应于SEQ ID NO:37的核苷酸145的残基处的Y变为N的突变;和(iv)在对应于SEQID NO:37的核苷酸346的残基处的R变为K的突变;和(v)在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变;和(vi)在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;和(vii)在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变;(viii)在对应于SEQ ID NO:37的核苷酸681的残基处的P变为H的突变;(ix)在对应于SEQ ID NO:37的核苷酸950的残基处的D变为N的突变。
在一个实例中,突变体S蛋白包含(i)在对应于SEQ ID NO:37的核苷酸478的残基处的T变为K的突变;和/或(ii)在对应于SEQ ID NO:37的核苷酸681的残基处的P变为R的突变;和/或(iii)在对应于SEQ ID NO:37的核苷酸452的残基处的L变为R的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸478的残基处的T变为K的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸681的残基处的P变为R的突变。
在一个实例中,突变体S蛋白包含在对应于SEQ ID NO:37的核苷酸452的残基处的L变为R的突变。
在一个实例中,突变体S蛋白包含(i)在对应于SEQ ID NO:37的核苷酸478的残基处的T变为K的突变;和(ii)在对应于SEQ ID NO:37的核苷酸681的残基处的P变为R的突变;以及(iii)在对应于SEQ ID NO:37的核苷酸452的残基处的L变为R的突变。
在一个实例中,S蛋白包含对应于SEQ ID NO:37的核苷酸69和70的两个残基的缺失。
在一个实例中,S蛋白包含对应于SEQ ID NO:37的核苷酸144的一个残基的缺失。
在一个实例中,S蛋白(i)包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)包含对应于SEQ ID NO:37的核苷酸69和70的两个残基的缺失;和(iii)包含对应于SEQ ID NO:37的核苷酸144的一个残基的缺失;和(iv)包含在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;以及(v)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变。例如,突变S蛋白由SEQ ID NO:58中所列的序列编码。
在一个实例中,S蛋白包含对应于SEQ ID NO:37的核苷酸242至244的三个残基的缺失。
在一个实例中,S蛋白(i)包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)包含对应于SEQ ID NO:37的核苷酸242至244的三个残基的缺失;和(iii)包含在对应于SEQ ID NO:37的核苷酸417的残基处的K变为N的突变;和(iv)包含在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变;和(v)包含在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;以及(vi)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变。例如,突变S蛋白由SEQ ID NO:59中所列的序列编码。
在一个实例中,S蛋白(i)包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)包含对应于SEQ ID NO:37的核苷酸69和70的两个残基的缺失;和(iii)包含对应于SEQ ID NO:37的核苷酸242至244的三个残基的缺失,和(iv)包含在对应于SEQ ID NO:37的核苷酸417的残基处的K变为N的突变;和(v)包含在对应于SEQ IDNO:37的核苷酸484的残基处的E变为K的突变;和(vi)包含在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;以及(vii)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变。例如,突变S蛋白由SEQ ID NO:60中所列的序列编码。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸570的残基处的A变为D的突变。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸680的残基处的P变为H的突变。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸716的残基处的T变为I的突变。
在一个实例中,S蛋白(i)包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)包含对应于SEQ ID NO:37的核苷酸69和70的两个残基的缺失;和(iii)包含对应于SEQ ID NO:37的核苷酸144的一个残基的缺失;和(iv)包含在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;和(v)包含在对应于SEQ ID NO:37的核苷酸570的残基处的A变为D的突变;和(vi)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变;和(vii)包含在对应于SEQ ID NO:37的核苷酸680的残基处的P变为H的突变;以及(viii)包含在对应于SEQ ID NO:37的核苷酸716的残基处的T变为I的突变。例如,突变S蛋白由SEQ ID NO:61中所列的序列编码。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸18的残基处的L变为F的突变。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸80的残基处的D变为A的突变。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸215的残基处的D变为G的突变。
在一个实例中,S蛋白包含在对应于SEQ ID NO:37的核苷酸701的残基处的A变为V的突变。
在一个实例中,S蛋白(i)包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和(ii)包含在对应于SEQ ID NO:37的核苷酸18的残基处的L变为F的突变;和(iii)包含在对应于SEQ ID NO:37的核苷酸80的残基处的D变为A的突变;和(iv)包含在对应于SEQ ID NO:37的核苷酸215的残基处的D变为G的突变;和(v)包含对应于SEQID NO:37的核苷酸242至244的三个残基的缺失;和(vi)包含在对应于SEQ ID NO:37的核苷酸417的残基处的K变为N的突变;和(vii)包含在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变;和(viii)包含在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;和(ix)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变;以及(x)包含在对应于SEQ ID NO:37的核苷酸701的残基处的A变为V的突变。例如,突变S蛋白由SEQ ID NO:62中所列的序列编码。
在一个实例中,突变体S蛋白:(i)在S1/S2边界处缺少弗林蛋白酶切割位点并且包含在对应于SEQ ID NO:37的核苷酸682至685的残基处的RRAR变为QQAA的突变;和/或(ii)在S2'位点处缺少弗林蛋白酶切割位点;和/或(iii)包含在对应于SEQ ID NO:37的核苷酸614的残基处的D变为G的突变;和/或(iv)包含在对应于SEQ ID NO:37的核苷酸986和987的残基之间插入两个脯氨酸残基;和/或(v)包含在对应于SEQ ID NO:37的核苷酸501的残基处的N变为Y的突变;和/或(vi)包含对应于SEQ ID NO:37的核苷酸69和70的两个残基的缺失;和/或(vii)包含对应于SEQ ID NO:37的核苷酸144的一个残基的缺失;和/或(viii)包含对应于SEQ ID NO:37的核苷酸242至244的三个残基的缺失;和/或(ix)包含在对应于SEQID NO:37的核苷酸417的残基处的K变为N的突变;和/或(x)包含在对应于SEQ ID NO:37的核苷酸484的残基处的E变为K的突变;和/或(xi)包含在对应于SEQ ID NO:37的核苷酸570的残基处的A变为D的突变;和/或(xii)包含在对应于SEQ ID NO:37的核苷酸680的残基处的P变为H的突变;和/或(xiii)包含在对应于SEQ ID NO:37的核苷酸716的残基处的T变为I的突变;和/或(xix)包含在对应于SEQ ID NO:37的核苷酸18的残基处的L变为F的突变;和/或(xx);和/或包含在对应于SEQ ID NO:37的核苷酸80的残基处的D变为A的突变;和/或(xxi)包含在对应于SEQ ID NO:37的核苷酸215的残基处的D变为G的突变;和/或(xxii)包含在对应于SEQ ID NO:37的核苷酸701的残基处的A变为V的突变。
在一个实例中,突变体S蛋白由SEQ ID NO:9或SEQ ID NO:32至36中任一个所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:9或SEQ ID NO:32至36或SEQ ID NO:58至62中任一个所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:9中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:32中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:33中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:34中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:35中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:36中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:58中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:59中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:60中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:61中所列的序列编码。
在一个实例中,突变体S蛋白由SEQ ID NO:62中所列的序列编码。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按5'至3'的顺序包含:
a)编码S蛋白的第一核苷酸序列;和编码N蛋白的第二核苷酸序列;或
b)编码N蛋白的第一核苷酸序列;和编码S蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码S蛋白的第一核苷酸序列;和编码N蛋白的第二核苷酸序列。
在一个实例中,本公开提供一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码S蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码N蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码N蛋白的第一核苷酸序列;和编码S蛋白的第二核苷酸序列。
在一个实例中,本公开提供一种多核苷酸,其中该多核苷酸按从5'至3'的顺序包含编码N蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码S蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含:
a)编码S蛋白的第一核苷酸序列;和编码N蛋白的第二核苷酸序列;或
b)编码N蛋白的第一核苷酸序列;和编码S蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码S蛋白的第一核苷酸序列;和编码N蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码S蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码N蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码N蛋白的第一核苷酸序列;和编码S蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种RNA,其中该RNA按从5'至3'的顺序包含编码N蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码S蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含:
a)编码S蛋白的第一核苷酸序列;和编码N蛋白的第二核苷酸序列;或
b)编码N蛋白的第一核苷酸序列;和编码S蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码S蛋白的第一核苷酸序列;和编码N蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码S蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码N蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码N蛋白的第一核苷酸序列;和编码S蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种cRNA,其中该cRNA按从5'至3'的顺序包含编码N蛋白的第一核苷酸序列,其与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合;和编码S蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码S蛋白的第一核苷酸序列;和编码N蛋白的第二核苷酸序列;或
b)编码N蛋白的第一核苷酸序列;和编码S蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码S蛋白的第一核苷酸序列;和编码N蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码S蛋白的第一核苷酸序列,其与SG启动子可操作地连接;和编码N蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该分子按从5'至3'的顺序包含:
a)编码S蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码S蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N蛋白的第二核苷酸序列,其与由SEQ ID NO:2中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码S蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N蛋白的第二核苷酸序列,其与由SEQ ID NO:3中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该分子按从5'至3'的顺序包含:
a)编码突变的S蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码突变的S蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N蛋白的第二核苷酸序列,其与由SEQ ID NO:2中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码突变的S蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N蛋白的第二核苷酸序列,其与由SEQ ID NO:3中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码S蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码N蛋白的第二核苷酸序列,其与由SEQ ID NO:4中所列的序列编码的IRES可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码N蛋白的第一核苷酸序列;和编码S蛋白的第二核苷酸序列。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含编码N蛋白的第一核苷酸序列,其与SG启动子可操作地连接;和编码S蛋白的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该分子按从5'至3'的顺序包含:
a)编码N蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码S蛋白的第二核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码N蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码S蛋白的第二核苷酸序列,其与由SEQ ID NO:2中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码N蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码S蛋白的第二核苷酸序列,其与由SEQ ID NO:3中所列的序列编码的延伸的SG启动子可操作地连接。
在一个实例中,本公开提供了一种多顺反子自我复制RNA,其中该RNA按从5'至3'的顺序包含:
a)编码N蛋白的第一核苷酸序列,其与由SEQ ID NO:1中所列的序列编码的最小SG启动子可操作地连接;和
b)编码S蛋白的第二核苷酸序列,其与由SEQ ID NO:4中所列的序列编码的IRES可操作地连接。
在一个实例中,本公开提供了由SEQ ID NO:10至14或SEQ ID NO:19至27或SEQ IDNO:30至31中任一个所列的序列编码的多顺反子自我复制RNA。在一个实例中,本公开提供了由SEQ ID NO:10至14或SEQ ID NO:19至27或SEQ ID NO:30至31或SEQ ID NO:49至53中任一个所列的序列编码的多顺反子自我复制RNA。例如,本公开提供了由SEQ ID NO:10至14或SEQ ID NO:19至27中任一个所列的序列编码的多顺反子自我复制RNA。在另一实例中,本公开提供了由SEQ ID NO:30至31中任一个所列的序列编码的多顺反子自我复制RNA。在另一实例中,本公开提供了由SEQ ID NO:49至53中任一个所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:10(F548)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:11(F549)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:12(F556)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:13(F557)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:14(F602)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:19(F554)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:20(F568)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:21(F569)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:22(F570)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:23(F576)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:24(F584)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:25(F590)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:26(F616)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:27(F620)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:30(Co18)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:31(Co19)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:49(F631)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:50(F632)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:51(F629)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:52(F695)中所列的序列编码的多顺反子自我复制RNA。
在一个实例中,本公开提供了由SEQ ID NO:53(703)中所列的序列编码的多顺反子自我复制RNA。
本公开提供了包含本公开的多核苷酸的免疫原性组合物。本公开还提供了包含本公开的RNA的免疫原性组合物。例如,本公开提供了包含本公开的cRNA的免疫原性组合物。本公开还提供了包含本公开的自我复制RNA的免疫原性组合物。例如,当施用时,本公开的组合物能够在受试者中诱导免疫应答。例如,组合物的施用诱导体液和/或细胞介导的免疫应答。在一个实例中,组合物在受试者中诱导体液免疫应答。例如,体液免疫应答是抗体介导的免疫应答。在另一实例中,组合物诱导细胞介导的免疫应答。例如,细胞介导的免疫应答包括抗原特异性细胞毒性T细胞的活化。
在一个实例中,本公开的免疫原性组合物包含多个多核苷酸,其中每个多核苷酸编码不同的多肽抗原序列。在另一实例中,本公开的免疫原性组合物包含多个RNA,其中每个RNA编码不同的多肽抗原序列。在进一步的实例中,本公开的免疫原性组合物包含多个cRNA,其中每个cRNA编码不同的多肽抗原序列。在一个实例中,免疫原性组合物包含多个多顺反子自我复制RNA,其中每个多顺反子自我复制RNA编码不同的多肽抗原序列。例如,不同的多肽抗原序列来自相同的病毒(例如,编码来自相同甲型流感病毒株的抗原)。在一个实例中,不同的多肽抗原序列来自不同的病毒。例如,这些序列编码不同的甲型流感病毒株。
本公开还提供了包含本公开的免疫原性组合物和药学上可接受的载体的药物组合物。适用于本公开的药学上可接受的载体对于本领域技术人员将是显而易见的和/或在本文中描述。
在一个实例中,药物组合物进一步包含脂质纳米颗粒(LNP)、聚合物微粒和水包油乳液。例如,多核苷酸、RNA、cRNA或自我复制RNA被包封、结合或吸附在LNP、聚合物微粒和水包油乳液上。在一个实例中,多核苷酸被包封、结合或吸附在LNP、聚合物微粒和水包油乳液上。在另一实例中,RNA被包封、结合或吸附在LNP、聚合物微粒和水包油乳液上。例如,cRNA被包封、结合或吸附在LNP、聚合物微粒和水包油乳液上。例如,自我复制RNA被包封、结合或吸附在LNP、聚合物微粒和水包油乳液上。
在一个实例中,药物组合物进一步包含LNP。例如,多核苷酸被包封在LNP中。在另一实例中,RNA被包封在LNP中。例如,cRNA被包封在LNP中。例如,自我复制RNA被包封在LNP中。例如,多核苷酸与LNP结合。在另一实例中,RNA与LNP结合。例如,cRNA与LNP结合。在另一实例中,自我复制RNA与LNP结合。例如,多核苷酸被吸附在LNP上。在另一实例中,RNA被吸附在LNP上。例如,cRNA被吸附在LNP上。在另一实例中,自我复制RNA被吸附在LNP上。
在一个实例中,LNP包含PEG-脂质、结构脂质和/或中性脂质。例如,LNP包含PEG-脂质、结构脂质和中性脂质。在另一实例中,LNP包含PEG-脂质、结构脂质或中性脂质。
在一个实例中,LNP进一步包含阳离子脂质。在另一实例中,LNP不包含阳离子脂质。
在一个实例中,药物组合物进一步包含聚合物微粒。例如,多核苷酸被包封在聚合物微粒中。在另一实例中,RNA被包封在聚合物微粒中。例如,cRNA被包封在聚合物微粒中。例如,自我复制RNA被包封在聚合物微粒中。例如,多核苷酸与聚合物微粒结合。在另一实例中,RNA与聚合物微粒结合。例如,cRNA与聚合物微粒结合。在另一实例中,自我复制RNA与聚合物微粒结合。例如,多核苷酸被吸附在聚合物微粒上。在另一实例中,RNA被吸附在聚合物微粒上。例如,cRNA被吸附在聚合物微粒上。在另一实例中,自我复制RNA被吸附在聚合物微粒上。
在一个实例中,药物组合物进一步包含水包油乳液。例如,多核苷酸被包封在水包油乳液中。在另一实例中,RNA被包封在水包油乳液中。例如,cRNA被包封在水包油乳液中。例如,自我复制RNA被包封在水包油乳液中。例如,多核苷酸与水包油乳液结合。在另一实例中,RNA与水包油乳液结合。例如,cRNA与水包油乳液结合。在另一实例中,自我复制RNA与水包油乳液结合。在另一实例中,自我复制RNA被吸附在水包油乳液上。在另一实例中,自我复制RNA被重悬于水包油乳液中。
本公开还提供用作疫苗的本公开的免疫原性组合物或药物组合物。
在一个实例中,多核苷酸是DNA。在一个实例中,本公开提供编码本公开的cRNA疫苗的DNA。在一个实例中,本公开提供了编码本公开的自我复制RNA疫苗的DNA。
在一个实例中,DNA是质粒。
本公开还提供用于治疗或预防呼吸道病毒感染或延缓其进展的本公开的免疫原性组合物或药物组合物。例如,本公开提供用于治疗呼吸道病毒感染的本公开的免疫原性组合物或药物组合物。在一个实例中,本公开提供用于预防呼吸道病毒感染的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于延缓呼吸道病毒感染的进展的本公开的免疫原性组合物或药物组合物。例如,本公开的免疫原性组合物或药物组合物用于治疗或预防流感、流感病毒感染、细支气管炎、肺炎、喉炎、SARS-CoV-2感染、COVID-19和/或ARDS,或延缓其进展。在一个实例中,本公开的免疫原性组合物或药物组合物用于治疗或预防流感、流感病毒感染、SARS-CoV-2感染、COVID和/或ARDS,或延缓其进展。
在一个实例中,本公开提供用于治疗或预防流感或延缓其进展的本公开的免疫原性组合物或药物组合物。例如,本公开提供用于治疗流感的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于预防流感的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于延缓流感的进展的本公开的免疫原性组合物或药物组合物。
在一个实例中,本公开提供用于治疗或预防流感病毒感染或延缓其进展的本公开的免疫原性组合物或药物组合物。例如,本公开提供用于治疗流感病毒感染的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于预防流感病毒感染的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于延缓流感病毒感染的进展的本公开的免疫原性组合物或药物组合物。
在一个实例中,本公开提供用于治疗或预防COVID-19或延缓其进展的本公开的免疫原性组合物或药物组合物。例如,本公开提供用于治疗COVID-19的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于预防COVID-19的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于延缓COVID-19的进展的本公开的免疫原性组合物或药物组合物。
在一个实例中,本公开提供了用于治疗或预防SARS-CoV-2感染或延缓其进展的本公开的免疫原性组合物或药物组合物。例如,本公开提供了用于治疗SARS-CoV-2感染的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供了用于预防SARS-CoV-2感染的本公开的免疫原性组合物或药物组合物。在另一个实例中,本公开提供了用于延缓SARS-CoV-2感染的进展的本公开的免疫原性组合物或药物组合物。
在一个实例中,本公开提供用于治疗或预防ARDS或延缓其进展的本公开的免疫原性组合物或药物组合物。例如,本公开提供用于治疗ARDS的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于预防ARDS的本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供用于延缓ARDS的进展的本公开的免疫原性组合物或药物组合物。
本公开提供了治疗或预防受试者中的疾病或病症或延缓其进展的方法,该方法包含向有此需要的受试者施用本公开的免疫原性组合物或药物组合物。在一个实例中,本公开提供治疗受试者中的疾病或病症的方法,该方法包含向有此需要的受试者施用本公开的免疫原性组合物或药物组合物。在另一实例中,本公开提供预防受试者中的疾病或病症的方法,该方法包含向有此需要的受试者施用本公开的免疫原性组合物或药物组合物。在进一步的实例中,本公开提供延缓受试者中疾病或病症的进展的方法,该方法包含向有此需要的受试者施用本公开的免疫原性组合物或药物组合物。
在一个实例中,本公开提供了本公开的多核苷酸在制造用于治疗或预防有此需要的受试者中的疾病或病症或延缓其进展的药物中的用途。例如,本公开提供了本公开的多核苷酸在制造用于治疗有此需要的受试者中的疾病或病症的药物中的用途。在另一实例中,本公开提供了本公开的多核苷酸在制造用于预防有此需要的受试者中的疾病或病症的药物中的用途。在进一步的实例中,本公开提供了本公开的多核苷酸在制造用于延缓有此需要的受试者中的疾病或病症的进展的药物中的用途。
在一个实例中,本公开提供了本公开的RNA在制造用于治疗或预防有此需要的受试者中的疾病或病症或延缓其进展的药物中的用途。例如,本公开提供了本公开的RNA在制造用于治疗有此需要的受试者中的疾病或病症的药物中的用途。在另一实例中,本公开提供了本公开的RNA在制造用于预防有此需要的受试者中的疾病或病症的药物中的用途。在进一步的实例中,本公开提供了本公开的RNA在制造用于延缓有此需要的受试者中的疾病或病症的进展的药物中的用途。
在一个实例中,本公开提供了本公开的cRNA在制造用于治疗或预防有此需要的受试者中的疾病或病症或延缓其进展的药物中的用途。例如,本公开提供了本公开的cRNA在制造用于治疗有此需要的受试者中的疾病或病症的药物中的用途。在另一个实例中,本公开提供了本公开的cRNA在制造用于预防有此需要的受试者中的疾病或病症的药物中的用途。在进一步的实例中,本公开提供了本公开的cRNA在制造用于延缓有此需要的受试者中的疾病或病症的进展的药物中的用途。
在一个实例中,本公开提供了本公开的自我复制RNA在制造用于治疗或预防有此需要的受试者中的疾病或病症或延缓其进展的药物中的用途。例如,本公开提供了本公开的自我复制RNA在制造用于治疗有此需要的受试者中的疾病或病症的药物中的用途。在另一实例中,本公开提供了本公开的自我复制RNA在制造用于预防有此需要的受试者中的疾病或病症的药物中的用途。在进一步的实例中,本公开提供了本公开的自我复制RNA在制造用于延缓有此需要的受试者中的疾病或病症的进展的药物中的用途。
在一个实例中,受试者患有疾病或病症。在一个实例中,受试者已被诊断为患有疾病或病症。在一个实例中,受试者正在接受疾病或病症的治疗。
在一个实例中,该疾病或病症是呼吸道病毒感染。例如,呼吸道病毒感染选自由以下组成的组:流感、流感病毒感染、细支气管炎、肺炎、喉炎、SARS-CoV-2感染、COVID-19和ARDS。在一个实例中,该疾病或病症是流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS。在一个实例中,该疾病或病症是流感。在另一实例中,该疾病或病症是流感病毒感染。在另一实例中,该疾病或病症是细支气管炎。在进一步的实例中,该疾病或病症是肺炎。在一个实例中,该疾病或病症是喉炎。在另一实例中,该疾病或病症是SARS-CoV-2感染。在另一实例中,该疾病或病症是COVID-19。在另一实例中,该疾病或病症是ARDS。在一个实例中,ARDS与流感、流感病毒感染、SARS-CoV-2感染和/或COVID-19相关联。
在本文所描述的任何方法的一个实例中,在受试者患流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS之前或之后施用本公开的自我复制RNA。在本文所描述的任何方法的一个实例中,在受试者患流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS之前施用本公开的自我复制RNA。在本文所描述的任何方法的一个实例中,在受试者患流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS之后施用本公开的自我复制RNA。
在本文所描述的任何方法的一个实例中,在检测到呼吸道病毒感染之后施用本公开的自我复制RNA。例如,在受试者中检测到流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS之后施用本公开的自我复制RNA。在本文所描述的任何方法的一个实例中,在受试者中检测到流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS之后施用本公开的自我复制RNA。在本文所述的任何方法的进一步的实例中,在检测到流感病毒感染之后施用本公开的自我复制RNA。在本文所描述的任何方法的一个实例中,在检测到流感病毒感染之后但在患流感之前施用本公开的自我复制RNA。在本文所描述的任何方法的另一实例中,在检测到SARS-CoV-2感染之后施用本公开的自我复制RNA。在一个实例中,在检测到SARS-CoV-2之后但在患COVID-19之前施用本公开的自我复制RNA。在本文所描述的任何方法的进一步的实例中,在检测到COVID-19之后施用本公开的自我复制RNA。在本文所描述的任何方法的一个实例中,在检测到COVID-19之后但在患ARDS之前施用本公开的自我复制RNA。在本文所描述的任何方法的另一实例中,在检测到ARDS之后施用本公开的自我复制RNA。
在一个实例中,受试者处于患流感、COVID-19或ARDS的风险中。例如,受试者处于患流感的风险中。在另一实例中,受试者处于患COVID-19的风险中。在进一步的实例中,受试者处于患ARDS的风险中。
在一个实例中,本公开的组合物以足以降低流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS的一种或多种症状的严重性或预防其发作的量施用。流感、流感病毒感染,SARS-CoV-2感染、COVID-19和/或ARDS的症状对于本领域技术人员将是显而易见的和/或在本文中描述。
本公开提供了在受试者中诱导免疫应答的方法,其包含向有此需要的受试者施用本公开的自我复制RNA、免疫原性组合物或药物组合物。
本公开还提供了本公开的自我复制RNA、免疫原性组合物或药物组合物在制造用于在有此需要的受试者中诱导免疫应答的药物中的用途。
在一个实例中,本公开的自我复制RNA、免疫原性组合物或药物组合物诱导体液和/或细胞介导的免疫应答。在一个实例中,组合物在受试者中诱导体液免疫应答。例如,体液免疫应答是抗体介导的免疫应答。例如,中和抗体的产生。在另一实例中,组合物诱导细胞介导的免疫应答。例如,细胞介导的免疫应答包括抗原特异性细胞毒性T细胞的活化。例如,T细胞是CD4 T细胞和/或CD8 T细胞。在一个实例中,T细胞是CD4 T细胞。在另一实例中,T细胞是CD8 T细胞。在另一实例中,T细胞是CD4和CD8 T细胞。
在一个实例中,施用本公开的自我复制RNA、免疫原性组合物或药物组合物诱导CD4 T细胞介导的免疫应答。
在一个实例中,施用本公开的自我复制RNA、免疫原性组合物或药物组合物诱导CD8 T细胞介导的免疫应答。
在一个实例中,施用本公开的自我复制RNA、免疫原性组合物或药物组合物诱导CD4和CD8 T细胞介导的免疫应答。
本公开还提供了编码本公开的自我复制RNA的多核苷酸。例如,多核苷酸是重组DNA。在一个实例中,重组DNA是质粒。在一个实例中,质粒包含SEQ ID NO:10至14或SEQ IDNO:19至27或SEQ ID NO:30至31中任一个所列的序列。
本公开还提供了一种试剂盒,其包含任选地在递送系统和/或药学上可接受的载体或稀释剂中的至少一种本公开的自我复制RNA、包装有用于治疗或预防受试者中的疾病或疾患(例如流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS)或延缓其进展的说明书。
本公开还提供了一种试剂盒,其包含任选地在递送系统和/或药学上可接受的载体或稀释剂中的至少一种本公开的自我复制RNA、包装有向患有或处于患有疾病或疾患(例如流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS)的风险的受试者施用RNA的说明书。
在一个实例中,本公开的自我复制RNA、免疫原性组合物或药物组合物在小瓶中提供。在另一实例中,本公开的自我复制RNA、免疫原性组合物或药物组合物在注射器中提供。
附图说明
图1(A)是使用衍生自A/火鸡/土耳其/1/2005的HA和NA亚型制备的自我复制RNA的示意图。(B)和(C)绘示了构建体中5'-帽驱动的抗原表达。
图2绘示了通过平均荧光强度(MFI)分析确定的未配制的RNA构建体(A)F548(B)F549(C)F602(D)F616(E)F556(F)F557(G)F568(H)F569(I)F576(J)F620(K)F584(L)F590中目的H5和N1基因的基因表达模式。
图3绘示了通过平均荧光强度分析确定的配制在脂质纳米颗粒中的RNA的第一和第二目的基因的基因表达模式。(A)H5和N1抗原在F556和F548构建体中的表达。(B)H5和N1抗原在F557和F549构建体中的表达。(C)与单独表达H5抗原的对照构建体F500.3相比,H5抗原在F556、F602和F616构建体中的表达。(D)与单独表达N1抗原的对照构建体F543相比,在F556、F602和F616构建体中表达N1抗原。(E)H5、N1和M1抗原在F554构建体中的表达。(F)H5、N1和M1抗原在F584构建体中的表达。(G)H5、N1、M1和M2抗原在F590构建体中的表达。
图4绘示了在(A)短型和(B)长型微量中和测定中来自用自我复制RNA免疫的小鼠的微量中和滴度。
图5绘示了用自我复制RNA免疫的小鼠的血凝素滴度。
图6绘示了抗原特异性CD4和CD8 T细胞应答。(A)F548、F549、F556和F557中的H5和N1抗原特异性CD8 T细胞应答。(B)F556、F557、F602和F616中的H5和N1抗原特异性CD8 T细胞应答。(C)F548、F549、F556和F557中的H5和N1抗原特异性CD4 T细胞应答。(D)F556、F557、F602和F616中的H5和N1抗原特异性CD4 T细胞应答。
图7绘示了(A)通过微量中和测定评估的抗体应答和(B)ACE2结合的抑制。
图8绘示了抗原特异性CD4和CD8 T细胞应答。(A)用Pep Mix 1(白色条)和Pep Mix2(黑色条)的S特异性CD4 T细胞应答。(B)用Pep Mix 1(白色条)和Pep Mix2(黑色条)的S特异性CD8 T细胞应答。(C)N特异性CD4 T细胞应答和(D)N特异性CD8 T细胞应答。
图9是示出由Co18诱导的抗原特异性T细胞的一系列图示。示出了(A)S1-特异性CD4 T细胞、(B)S1-特异性CD8 T细胞、(C)S2-特异性CD4 T细胞、(D)S2-特异性CD8 T细胞和(E)N-特异性CD4 T细胞诱导的净(抗原特异性)%细胞因子产生CD4和CD8 T细胞。
图10是示出(A)净抗原特异性CD4+应答%的一系列图示;(B)净抗原特异性CD8+应答%;以及(C)抗原特异性CD4应答和(D)抗原特异性CD8应答的归一化频率。
序列表注释
SEQ ID NO:1 甲病毒天然亚基因组启动子的核苷酸序列
SEQ ID NO:2 延伸的亚基因组启动子(v2)的核苷酸序列
SEQ ID NO:3 延伸的亚基因组启动子(v3)的核苷酸序列
SEQ ID NO:4 野生型EMCV IRES的核苷酸序列
SEQ ID NO:5 甲型流感病毒H5血凝素亚型的核苷酸序列(A/火鸡/土耳其/1/2005)
SEQ ID NO:6 甲型流感病毒N1神经氨酸苷酶亚型的核苷酸序列(A/火鸡/土耳其/1/2005)
SEQ ID NO:7 SARS-CoV-2核壳体(N)蛋白全长wt的核苷酸序列
SEQ ID NO:8 SARS-CoV-2刺突(S)蛋白全长wt(可切割)的核苷酸序列
SEQ ID NO:9 SARS-CoV-2突变刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为QQAA的突变)
SEQ ID NO:10 构建体F548的核苷酸序列
SEQ ID NO:11 构建体F549的核苷酸序列
SEQ ID NO:12 构建体F556的核苷酸序列
SEQ ID NO:13 构建体F557的核苷酸序列
SEQ ID NO:14 构建体F602的核苷酸序列
SEQ ID NO:15 延伸的亚基因组启动子(v4)的核苷酸序列
SEQ ID NO:16 甲型流感病毒M1基质蛋白(PR8-X)的核苷酸序列
SEQ ID NO:17 甲型流感病毒M2基质蛋白的核苷酸序列
SEQ ID NO:18 甲型流感病毒NS1非结构蛋白的核苷酸序列(A/加利福尼亚/09)
SEQ ID NO:19构建体F554的核苷酸序列
SEQ ID NO:20构建体F568的核苷酸序列
SEQ ID NO:21构建体F569的核苷酸序列
SEQ ID NO:22构建体F570的核苷酸序列
SEQ ID NO:23构建体F576的核苷酸序列
SEQ ID NO:24构建体F584的核苷酸序列
SEQ ID NO:25构建体F590的核苷酸序列
SEQ ID NO:26构建体F616的核苷酸序列
SEQ ID NO:27构建体F620的核苷酸序列
SEQ ID NO:28流感病毒核蛋白的核苷酸序列(A/加利福尼亚/09)
SEQ ID NO:29甲型流感病毒M1基质蛋白的核苷酸序列(A/加利福尼亚/09)
SEQ ID NO:30构建体Co18的核苷酸序列
SEQ ID NO:31构建体Co19的核苷酸序列
SEQ ID NO:32SARS-CoV-2刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为
QQAA的突变和986P/987P突变)
SEQ ID NO:33SARS-CoV-2刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为
QQAA的突变和D614G突变)
SEQ ID NO:34SARS-CoV-2刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为
QQAA的突变和S2'突变)
SEQ ID NO:35SARS-CoV-2刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为
QQAA的突变和D614G突变和S2'突变)
SEQ ID NO:36SARS-CoV-2刺突(S)蛋白可切割的核苷酸序列(D614G突变)
SEQ ID NO:37SARS-CoV-2S蛋白全长wt的氨基酸序列
SEQ ID NO:38Kozak共有序列的核苷酸序列
SEQ ID NO:39Kozak共有序列的核苷酸序列
SEQ ID NO:40中断接头的核苷酸序列
SEQ ID NO:41富含GC的元件的核苷酸序列
SEQ ID NO:42富含GC的元件的核苷酸序列
SEQ ID NO:43富含GC的元件的核苷酸序列
SEQ ID NO:44组蛋白茎环的核苷酸序列
SEQ ID NO:45VEEV的5'UTR的核苷酸序列
SEQ ID NO:46SINV的3'UTR的核苷酸序列
SEQ ID NO:47延伸的亚基因组启动子的核苷酸序列
SEQ ID NO:48poly-A序列
SEQ ID NO:49构建体631的核苷酸序列
SEQ ID NO:50构建体632的核苷酸序列
SEQ ID NO:51构建体629的核苷酸序列
SEQ ID NO:52构建体695的核苷酸序列
SEQ ID NO:53构建体703的核苷酸序列
SEQ ID NO:54甲型流感病毒H3蛋白的核苷酸序列(A/特拉华州/39/2019)
SEQ ID NO:55甲型流感病毒N2蛋白的核苷酸序列(A/特拉华州/39/2019)
SEQ ID NO:56乙型流感病毒Hyam的核苷酸序列(B/新加坡/INFTT 16 0610/16(By))SEQ ID NO:57乙型流感病毒Nyam的核苷酸序列(B/新加坡/INFTT 16 0610/16(By))SEQ ID NO:58SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR→QQAA;Δ69-70;ΔY144;
N501Y;D614G)
SEQ ID NO:59SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR→QQAA;Δ242-244;
K417N;E484K;N501Y;D614G)
SEQ ID NO:60SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR→QQAA;Δ69-70;
Δ242-244;K417N;E484K;N501Y;D614G)
SEQ ID NO:61SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR→QQAA;Δ69-70;ΔY144;
N501Y;A570D;D614G;P680H;T716I)
SEQ ID NO:62SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR→QQAA;L18F;D80A;
D215G;Δ242-244;K417N;E484K;N501Y;D614G;A701V)。
具体实施方式
概要
在本说明书通篇中,除非另有明确说明或上下文另有要求,提及单个步骤、物质组合物、步骤组或物质组合物组应理解为涵盖这些步骤、物质组合物、步骤组或物质组合物组中的一个和多个(即一个或多个)。
本领域技术人员将理解,除了具体描述的那些之外,本公开容许变化和修改。应理解,本公开包括所有此类变化和修改。本公开还包括本说明书中单独或共同提及或指示的所有步骤、特征、组合物和化合物,以及所述步骤或特征的任何和所有组合或任何两个或更多个。
本公开的范围不受本文所描述的特定实例的限制,这些实例仅用于举例说明的目的。功能上等同的产品、组合物和方法显然在本公开的范围内。
除非另有明确说明,在此本公开的任何实例应被视为加以必要的变通而应用于本公开任何其它实例。换言之,本公开的任何特定实例可以与本公开的任何其它特定实例组合(除非相互排斥)。
公开特定特征或特征组或方法或方法步骤的本公开的任何实例将被用来提供对放弃特定特征或特征组或方法或方法步骤的明确支持。
除非另有明确定义,本文使用的所有技术和科学术语应被视为具有本领域普通技术人员通常理解的相同含义(例如,在细胞培养、分子遗传学、免疫学、免疫组织化学、蛋白质化学和生物化学方面)。
除非另有指示,本公开中所使用的重组蛋白、细胞培养和免疫学技术是本领域技术人员所熟知的标准程序。这些技术在整个文献中被描述和解释,其来源诸如:J.Perbal,《分子克隆的实用手册(A Practical Guide to Molecular Cloning)》,约翰·威利父子出版公司(John Wiley and Sons)(1984);J.Sambrook等人,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,冷泉港实验室出版社(Cold SpringHarbour Laboratory Press)(1989);T.A.Brown(编辑),《基本分子生物学:实用方法(Essential Molecular Biology:A Practical Approach)》,第1和2卷,IRL出版社(1991);D.M.Glover和B.D.Hames(编辑),《DNA克隆:实用方法(DNA Cloning:A PracticalApproach)》,第1至4卷,IRL出版社(1995和1996);和F.M.Ausubel等人(编辑),《即分子生物学实验指南(Current Protocols in Molecular Biology)》,格林出版联合公司(GreenePub.Associates)和美国威力出版公司(Wiley-Interscience)(1988,包括到目前为止的所有更新),Ed Harlow和David Lane(编辑)《抗体:实验室手册(Antibodies:A LaboratoryManual)》,冷泉港实验室,(1988);以及J.E.Coligan等人(编辑)《即免疫学实验指南(Current Protocols in Immunology)》,约翰·威利父子出版公司(John Wiley&Sons)(包括到目前为止的所有更新)。
术语“和/或”,例如“X和/或Y”应理解为意指“X和Y”或“X或Y”,并且应被视为提供对两种含义或任一种含义的明确支持。
在整个说明书中,词语“包含(comprise)”或其变体诸如“包含(comprises)”或“包含(comprising)”应理解为意指包括所陈述的元件、整体或步骤,或元件、整体或步骤的组,但不排除任何其它元件、整体或步骤,或元件、整体或步骤的组。
如本文所用,术语“衍生自”应被视为指示可以从特定来源获得指定整体,但不必直接从该来源获得。类似地,术语“基于”应被视为指示特定的整体可以从特定的来源发展或使用,尽管不一定直接来自该来源。
选定定义
如本文所用,关于多核苷酸、RNA、cRNA和/或自我复制RNA的术语“多顺反子(multicistronic)”(也称为“多顺反子(polycistronic)”)是指编码两种或更多种多肽的RNA。该术语涵盖“双顺反子(bicistronic)”(或“双顺反子(dicistronic)”;即,编码两种多肽)和“三顺反子”(即,编码三种多肽)分子。“双顺反子”意指能够编码来自核酸不同区域的两种不同多肽的单一核酸。
如本文所用,术语“常规mRNA”或“cRNA”或“非扩增RNA”是指允许表达异源RNA和蛋白质但不能在宿主细胞中扩增的RNA的构建体。
如本文所用,术语“自我复制RNA”是指基于RNA病毒的构建体,其已被工程化以允许异源mRNA和蛋白质的表达。自我复制RNA(例如,以裸RNA的形式)可以在宿主细胞中扩增,导致所需基因产物在宿主细胞中表达。
本文所用的术语“裸”是指基本上不含其它大分子诸如脂质、聚合物和蛋白质的核酸。“裸”核酸,诸如自我复制RNA,不与其它大分子一起配制以提高细胞摄取。因此,裸核酸不被包封、吸收或结合在脂质纳米颗粒(LNP)、脂质体、聚合物微粒或水包油乳液中。
如本文所用,术语“核苷酸序列”或“核酸序列”应理解为意指共价连接至磷酸二酯主链的一系列连续核苷酸(或碱基)。按照惯例,除非另有说明,否则序列从5'端至3'端呈现。为了便于清楚地描述核酸,特定的序列组分被称为例如“第一核苷酸序列”和“第二核苷酸序列”。应理解,除非另有说明,否则第一和第二序列可以以任何期望的顺序或取向出现,并且词语“第一”、“第二”等不旨在表示特定的顺序或取向。
如本文所用,术语“抗原”是指含有一个或多个表位的分子或结构,该表位诱导、引发、增加或加强细胞和/或体液免疫应答。抗原可以包括例如来自病原体诸如病毒、细菌、真菌、原生动物、植物或来自肿瘤的蛋白质和肽。
如本文所用,术语“与……可操作地连接”意指相对于核酸定位亚基因组启动子或调节元件(例如,IRES),使得核酸的表达受元件控制或调节。例如,亚基因组启动子可以例如通过另一调节元件,诸如内部核糖体进入位点(IRES),与许多核酸可操作地连接。
如本文所用,术语“亚基因组启动子”(也称为‘接合区’启动子)是指指导调节蛋白表达的异源核苷酸序列表达的启动子。
如本文所用,术语“内部核糖体进入位点”或“IRES”是指核糖体或其组分,例如核糖体的40S亚基,能够结合的mRNA内的核苷酸序列。IRES不必包含诱导mRNA翻译的核酸(例如,起始密码子;AUG)。
术语“多肽”或“多肽链”应理解为意指通过肽键连接的一系列连续氨基酸。例如,蛋白质应被视为包括单个多肽链,即通过肽键连接的一系列连续氨基酸或彼此共价或非共价连接的一系列多肽链(即多肽复合物)。该系列多肽链可以使用合适的化学或二硫键共价连接。非共价键的实例包括氢键、离子键、范德华力和疏水相互作用。
术语“重组”应理解为意指人工遗传重组的产物。
如本文所用,关于表达水平的术语“基本上相同”意指第一和第二抗原(至少)具有彼此约10%或更小的表达水平。
如本文所用,术语“疾病”、“疾患”或“病症”是指破坏或干扰正常功能,并且不限于任何特定病症,并且将包括疾病或疾患。
如本文所用,“处于患疾病或病症的风险”的受试者可以具有或可以不具有可检测的疾病或疾病症状,并且在根据本公开的治疗之前可以显示或可以不显示可检测的疾病或疾病症状。“处于风险中”表示受试者具有一种或多种风险因素,该风险因素是与疾病或病症的发展相关的可测量参数,如本领域中已知和/或本文所描述的。
本文所用的术语“治疗(treating)”、“治疗(treat)”或“治疗(treatment)”包括施用本文所描述的RNA或组合物,从而减少或消除特定疾病或病症的至少一种症状。
如本文所用,术语“预防(preventing)”、“预防(prevent)”或“预防(prevention)”包括对个体中特定疾病或病症的发生或复发提供预防措施。个体可能易患该疾病或处于患该疾病的风险中,但尚未被诊断患有该疾病。
如本文所用,短语“延缓……的进展”包括减少或减缓个体中疾病或病症和/或疾病或病症的至少一种症状的进展。
“有效量”是指在必要的剂量和时间段内至少有效实现所期望的结果的量。例如,期望的结果可以是治疗或预防性结果。可以在一次或多次施用中提供有效量。在本公开的一些实例中,术语“有效量”意指实现如上文所描述的疾病或病症的治疗所必需的量。在本公开的一些实例中,术语“有效量”意指实现与上文所描述的疾病或病症相关联的改变所必需的量。有效量可以根据待治疗的疾病或病症或待改变的因素以及根据体重、年龄、种族背景、性别、健康和/或身体状况和与待治疗的哺乳动物相关的其它因素而变化。通常,有效量将落入可以由执业医师通过常规试验和实验确定的相对宽的范围(例如“剂量”范围)内。因此,该术语不应被解释为将本公开限于特定量,例如RNA的重量或数量。有效量可以以单剂量或在治疗期间重复一次或几次的剂量施用。
“治疗有效量”至少是实现特定疾病或病症的可测量改善所需的最小浓度。本文的治疗有效量可以根据诸如患者的疾病状态、年龄、性别和体重以及本公开的RNA在个体中引发所期望的应答的能力等因素而变化。治疗有效量也是其中RNA的任何毒性或有害作用被治疗有益作用所抵消的量。
如本文所用,术语“预防有效量”应被视为意指足以预防或抑制或延缓如本文所描述的疾病或疾患的一种或多种可检测症状的发作的本公开的RNA的量。
如本文所用,术语“受试者”应被视为意指任何动物,包括人,例如哺乳动物。示范性受试者包括但不限于人和非人灵长类。例如,受试者是人。
如本文所用,术语“脂质纳米颗粒”或“LNP”应理解为是指具有至少一个纳米量级的尺寸(例如,1至1,000nm)并且包含本文所描述的任何配方的化合物的基于脂质的颗粒。在实施例中,将LNP配制成用于将多核苷酸递送至所期望的靶标诸如细胞、组织、器官、肿瘤等的组合物。例如,脂质纳米颗粒或LNP任何脂质组合物,包括,可以选自,但不限于,脂质体或囊泡,其中水性体积被两亲性脂质双层(例如,单;单层或多;多层)包封,胶束状脂质纳米颗粒具有非水性核心和固体脂质纳米颗粒,其中固体脂质纳米颗粒缺乏脂质双层。
多核苷酸
如本文所用,术语“多核苷酸”是指通过一个核苷酸的磷酰基与相邻核苷酸中糖的羟基之间的一系列酯键化学键合的核苷酸分子链。在一个实例中,多核苷酸是DNA。在一个实例中,多核苷酸是RNA,例如mRNA。例如,mRNA是常规mRNA(cRNA)或自我复制RNA。
如本文所用,术语“片段”是指本文所公开的参考核苷酸序列或多肽的核苷酸序列或多肽的一部分,其维持全长核苷酸序列或多肽的确定活性。
如本文所用,术语“变体”是指与未修饰的序列相比具有一个或多个取代、插入、缺失和/或其它修饰的核苷酸序列。对于本领域技术人员显而易见的是,本文所描述的任何变体将具有相同或类似的编码蛋白的表达。例如,变体是功能变体。对核苷酸序列和/或多肽的示范性修饰对于本领域技术人员是显而易见的和/或在本文中描述。
在一个实例中,修饰是核苷酸序列的一个或多个核苷酸的化学修饰。例如,多核苷酸的至少一个天然存在的核苷酸被化学修饰的核苷酸(例如假尿苷(ψ)和1-甲基假尿苷(m1ψ))替代。
在一个实例中,修饰包含增加核苷酸序列的G/C含量。
在一个实例中,修饰包含核苷酸序列的密码子优化。
在一个实例中,取代是保守取代。技术人员将理解,关于多肽的保守替代涉及用具有类似生化特性(例如电荷、疏水性和大小)的不同氨基酸替代多肽中的氨基酸。在一个实例中,取代是非保守取代。
如本文所用,术语“编码(encode)”、“编码(encodes)”或“编码(encoding)”是指能够翻译为多肽的多核苷酸区域。
本公开的多核苷酸包括DNA和RNA(例如mRNA)。
脱氧核糖核酸(DNA)
在一个实例中,多核苷酸是DNA(例如DNA载体)。
对于本领域技术人员显而易见的是,本公开的DNA还在3'UTR的3'端包含内切核酸酶限制性位点。技术人员将理解,内切核酸酶限制性位点允许插入一个或多个核苷酸序列(例如,编码目的抗原、其片段和/或变体)而不破坏DNA的剩余部分。
如本文所用,术语“限制性内切核酸酶位点”是指结合限制性内切核酸酶的DNA序列。通常,限制性内切核酸酶位点是被限制性内切核酸酶识别和切割的短序列(例如大约4至8个碱基对)。
如本文所用,术语“限制性酶”或“限制性内切酶”是指在细菌和一些病毒中天然存在的一类酶。限制性内切核酸酶特异性结合并且在限制性内切核酸酶位点内或附近的特定位点切割双链DNA。示范性限制性内切核酸酶包括例如BciVI(Bful)、Bcul(Spel)、EcoRI、Aatll、AgeI(BshTI)、Apal、BamHI、BglII、Blpl(Bpu1102I)、BsrGI(Bsp1407)、Clal(Bsu15I)、EcoRI、EcoRV(Eco32I)、Eam1104I(EarI)、Hindlll、Kpnl、Mlul、Ncol、Ndel、Nhel、Notl、Nsil、Mph1103I、Pstl、Pvul、Pvull、SacI、SalI、ScaI、SpeI、Xbal、Xhol、Sacll(Cfr42I)和Xbal。
在一个实例中,本公开提供可转录的多核苷酸,其包含编码目的第一抗原的第一核苷酸序列;和编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。例如,多核苷酸是包含第一和第二核苷酸序列和任选的编码一种或多种目的抗原的一种或多种核苷酸序列的DNA质粒。
在一个实例中,DNA包含包含位于3'UTR的3'的限制性内切核酸酶位点的核苷酸序列。位于3'UTR的3'的限制性内切核酸酶位点的存在允许产生线性化的DNA。DNA的线性化确保体外转录的DNA明确终止以产生mRNA。
核糖核酸(RNA)
在一个实例中,多核苷酸是mRNA,其按从5'至3'的顺序包含编码目的第一抗原的第一核苷酸序列;和编码目的第二抗原的第二核苷酸序列,其与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开的mRNA涵盖非复制mRNA(也称为常规mRNA(cRNA)或非扩增)和自我复制RNA(也称为自我扩增RNA或sa-mRNA)。
常规(非复制)RNA
本公开提供了多顺反子cRNA。
技术人员将理解,本公开的cRNA按从5'至3'的顺序包含:5'帽结构、5'-UTR、其片段和/或变体、编码目的第一抗原的第一核苷酸序列、编码目的第二抗原的第二核苷酸序列、3'-UTR和3'加尾序列(例如聚腺苷酸化信号或一个或多个poly-A尾)。本公开的cRNA可以进一步包含与目的第一抗原可操作地连接的翻译内部核糖体进入位点(例如Kozak共有序列或IRES)。
自我复制RNA
本公开提供了多顺反子自我复制RNA(也称为复制子)。
技术人员将理解,本公开的自我复制RNA是基于RNA病毒的基因组RNA的。RNA应为正(+)链,使得其在递送至细胞后可以直接翻译而不需要干预复制步骤(例如逆转录)。RNA的翻译导致结合形成复制酶复合物(即,RNA依赖性RNA聚合酶)的非结构蛋白(NSP)的产生。然后复合物扩增原始RNA,产生反义和有义转录物,导致产生随后可以被翻译和转录的多个子代RNA,增强总蛋白质表达。
在一个实例中,本公开的自我复制RNA包含RNA病毒的非结构蛋白、5'和3'非翻译区(UTR)和天然亚基因组启动子。
在一个实例中,自我复制RNA包含RNA病毒的一种或多种非结构蛋白。例如,RNA包含至少一种或多种选自由以下组成的组的基因:病毒复制酶(或病毒聚合酶)、病毒蛋白酶、病毒解旋酶和其它非结构病毒蛋白。例如,自我复制RNA包含病毒复制酶(或病毒聚合酶)。
在另一实例中,自我复制RNA包含RNA病毒的5'-和3'-端UTR。对于本领域技术人员显而易见的是,术语5'和3'UTR也涵盖术语5'和3'保守序列元件(CSE)。在一个实例中,自我复制RNA包含5'-和3'-端CSE。
本公开的自我复制RNA不能诱导感染性病毒颗粒的产生。例如,本公开的自我复制RNA不包含编码产生病毒颗粒所必需的结构蛋白的病毒基因。
在一个实例中,自我复制RNA衍生自或基于甲病毒。合适的甲病毒对于本领域技术人员是显而易见的和/或在本文中描述。
在另一实例中,自我复制RNA衍生自或基于除甲病毒之外的病毒,例如正链RNA病毒。适用于本公开的合适的正链RNA病毒对于本领域技术人员而言是显而易见的,并且包括例如小核糖核酸病毒、黄病毒、风疹病毒、瘟病毒、肝炎病毒、杯状病毒或冠状病毒。
甲病毒
在一个实例中,本公开的自我复制RNA衍生自(或基于)甲病毒。
甲病毒是披膜病毒(Togaviridae)科中唯一的属,并且是具有正义单链RNA基因组的包膜病毒。本领域技术人员将理解甲病毒基因组包含两个开放阅读框(ORF),非结构的和结构的。第一个ORF编码病毒RNA转录和复制所必需的四种非结构蛋白(NSP1、NSP2、NSP3和NSP4)。第二种编码三个结构蛋白:核心核壳体蛋白C,和包膜蛋白P62和E1,它们作为异质二聚体相关联。病毒膜锚定的表面糖蛋白负责受体识别和通过膜融合进入靶细胞。
在一个实例中,本公开的自我复制RNA包含病毒复制酶(或病毒聚合酶)。例如,病毒复制酶是甲病毒复制酶,诸如甲病毒蛋白NSP4。
在一个实例中,本公开的自我复制RNA不编码一种或多种甲病毒结构蛋白(例如衣壳和/或包膜糖蛋白)。例如,自我复制RNA不能产生含RNA的甲病毒病毒体(即感染性病毒颗粒)。
在一个实例中,自我复制RNA包含天然甲病毒SG启动子。例如,天然甲病毒SG启动子是最小SG启动子(即,转录起始所需的最小序列)并且包含SEQ ID NO:1中所列的序列。
本领域技术人员知道适用于本公开的甲病毒。示范性甲病毒包括但不限于委内瑞拉马脑炎病毒(VEE;例如:特立尼达驴(Trinidad donkey)、TC83CR)、塞姆利基森林病毒(SFV)、辛德毕斯病毒(SIN)、罗斯河病毒(Ross River virus)、西部马脑炎病毒、东部马脑炎病毒、基孔肯雅病毒(Chikungunya virus)、S.A.AR86病毒、沼泽地(Everglades)病毒、穆坎布(Mucambo)病毒、巴马森林(Barmah Forest)病毒、米德尔堡(Middelburg)病毒、Pixuna病毒、阿尼昂尼昂病毒(O'nyong-nyong)病毒、盖塔(Getah)病毒、鹭山(Sagiyama)病毒、比巴鲁(Bebaru)病毒、马雅罗(Mayaro)病毒、乌纳(Una)病毒、奥拉(Aura)病毒、瓦塔罗阿(Whataroa)病毒、Banbanki病毒、孜拉加奇(Kyzylagach)病毒、高地J病毒(Highlands Jvirus)、摩根堡(Fort Morgan)病毒、恩杜茂(Ndumu)病毒和Buggy Creek病毒。术语甲病毒还可以包括嵌合甲病毒(例如,如Perri等人,(2003)《病毒学杂志(J.Virol.)》77(19):10394-403),其含有来自一种以上甲病毒的基因组序列。
调节元件
本公开提供了一种多核苷酸,其包含编码目的第一抗原的第一核苷酸序列和编码目的序列抗原的第二核苷酸序列,该第二核苷酸序列与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
本公开提供了一种RNA(例如,cRNA或自我复制RNA),其包含编码目的第一抗原的第一核苷酸序列和编码目的序列抗原的第二核苷酸序列,该第二核苷酸序列与选自由SG启动子和IRES组成的组的调节元件可操作地连接。
在一个实例中,目的第一抗原与选自由Kozak共有序列、IRES、SG启动子及其组合的调节元件可操作地连接。
本公开提供了自我复制RNA,其包含编码第一抗原的第一核苷酸序列,其与亚基因组(SG)启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与选自由SG启动子和内部核糖体进入位点(IRES)组成的组的调节元件启动子可操作地连接。
Kozak共有序列
如本文所用,术语“Kozak共有序列”是指在真核生物基因中鉴定的核苷酸序列,其通过含有被核糖体识别的起始密码子(也称为翻译起始密码子)而促进基因翻译。
示范性Kozak共有序列是本领域已知的和/或在本文所描述的。在一个实例中,Kozak共有序列在SEQ ID NO:38中列出。在另一实例中,Kozak共有序列在SEQ ID NO:39中列出。在一个实例中,Kozak共有序列是ACCATGG。在另一实例中,Kozak共有序列是ACCATG。
亚基因组启动子
适用于本公开的SG启动子(也称为‘接合区’启动子)对于本领域技术人员将是显而易见的和/或在本文中描述。
在一个实例中,SG启动子衍生自或基于甲病毒SG启动子。例如,SG启动子是天然甲病毒SG启动子。在一个实例中,天然SG启动子是最小SG启动子。例如,最小SG启动子是转录起始所需的最小序列。在一个实例中,天然SG启动子是延伸的SG启动子。例如,延伸的SG启动子是在5'端延伸的最小SG启动子,其中核苷酸存在于编码RNA病毒(例如甲病毒)的非结构蛋白(例如NSP4)的序列中。在一个实例中,延伸的SG启动子是在5'端延伸的最小SG启动子,其中核苷酸存在于编码甲病毒NSP4的序列中。
在一个实例中,本公开的多核苷酸包含来自任何甲病毒的SG启动子。例如,本公开的RNA(例如,cRNA或自我复制RNA)包含来自任何甲病毒的SG启动子。
在一个实例中,自我复制RNA包含来自任何甲病毒的SG启动子。
本公开的多核苷酸包含编码两种或更多种目的抗原的两种或更多种核苷酸序列。在一个实例中,两个或更多个核苷酸序列各自与SG启动子可操作地连接。当两个或更多个SG启动子存在于本公开的RNA中时,该启动子可以相同或不同。例如,两个或多个SG启动子衍生自相同的甲病毒。在另一实例中,两个或更多个SG启动子衍生自不同的甲病毒。
当两个或更多个SG启动子存在于本公开的自我复制RNA中时,启动子可以相同或不同。例如,两个或多个SG启动子衍生自相同的甲病毒。在另一实例中,两个或更多个SG启动子衍生自不同的甲病毒。
内部核糖体进入位点(IRES)
适用于本公开的IRES对于本领域技术人员而言是显而易见的和/或在本文中描述。
在一个实例中,IRES衍生自脑心肌炎病毒(EMCV)。例如,IRES是来自EMCV的野生型IRES。
在一个实例中,IRES衍生自成纤维细胞生长因子1A(FGF1A)IRES。
另外,已经描述了合成的IRES元件,其可以根据本领域已知的方法设计以模拟天然存在的IRES元件的功能(参见Chappell,SA等人《美国国家科学院院刊(Proc.NatlAcad.Sci.USA)》(2000)97(4):1536-41)。
5'非翻译区(5'-UTR)
本公开提供了包含第一核苷酸序列的多核苷酸,该第一核苷酸序列包含5'-非翻译区(5'-UTR)。
如本文所用,术语“5'-非翻译区”或“5'-UTR”是指位于翻译起始序列(AUG)的5'端的mRNA的非编码区。
示范性5'-UTR包括例如触珠蛋白(HP)、纤维蛋白原β链(FGB)、触珠蛋白相关蛋白(HPR)、白蛋白(ALB)、补体成分3(C3)、纤维蛋白原α链(FGA)、α6胶原(Col6A)、α-1-抗胰蛋白酶(SERPINA1)、α-1-抗胰凝乳蛋白酶(SERPINA3)的5'-UTR、其片段和/或变体。
在一个实例中,5'UTR是委内瑞拉马脑炎病毒(Venezuelan equine encephalitisvirus,VEEV)或其修饰形式的5'UTR。例如,5'UTR包含SEQ ID NO:45中所列的序列。
在一个实例中,5'UTR包含至少一个微小RNA结合位点、富含AU的元件(ARE)、富含GC的元件、茎环及其组合。
微小RNA结合位点
如本文所用,术语“微小RNA结合位点”是指多核苷酸内(例如DNA或RNA转录物内)与miRNA的全部或一个区域具有足够互补性以与微小RNA(miRNA)相互作用、相关联或结合的序列。
如本文所用,术语“微小RNA”或“miRNA”是指19至25个核苷酸长的非编码RNA,其结合多核苷酸的5'-UTR并且下调基因表达(例如通过抑制翻译)。在本公开的5'UTR中存在微小RNA结合位点可以起到抑制5'-UTR翻译的作用。
用于本公开的合适的miRNA结合位点对于本领域技术人员是显而易见的和/或在本文中描述。
在一个实例中,miRNA结合位点包含组织特异性微小RNA或调节生物过程的那些的结合位点。例如,肝脏的miRNA(miR-122)、肌肉的miRNA(miR-133、miR-206、miR-208)、内皮细胞的miRNA(miR-17-92、miR-126)、骨髓细胞的miRNA(miR-142-3p、miR-142-5p、miR-16、miR-21、miR-223、miR-24、miR-27)、脂肪组织的miRNA(let-7、miR-30c)、心脏的miRNA(miR-id、miR-149)、肾脏的miRNA(miR-192、miR-194、miR-204)和肺上皮细胞的miRNA(let-7、miR-133、miR-126)。例如,调节生物过程诸如血管生成的微小RNA(miR-132)。在美国专利申请US14/043,927中公开了另外的例示miRNA和miRNA结合位点。
富含AU的元件(ARE)
如本文所用,术语“富含AU的元件(ARE)”或“多个富含AU的元件(ARE)”是指包含腺苷(A)和尿苷(U)的区段的核苷酸序列的区域。示范性ARE包括例如来自细胞质myc(c-myc)、成肌细胞决定蛋白1(myoD)、c-Jun、肌细胞生成素、粒细胞-巨噬细胞集落刺激因子(GM-CSF)和肿瘤坏死因子α(TNF-α)或其组合的ARE。
在一个实例中,ARE包含人抗原R或“HuR”(也称为Elavl1)特异性结合位点。已知HuR结合ARE增加mRNA的稳定性。
富含GC的元件
如本文所用,术语“富含GC的元件”是指与腺嘌呤(A)和胸腺嘧啶(T)/尿嘧啶(U)相比具有大量鸟嘌呤(G)和/或胞嘧啶(C)的核苷酸序列。多核苷酸(例如mRNA)中富含GC的元件的存在可以稳定mRNA。
在一个实例中,富含GC的元件包含长度为3,或4,或5,或6,或7,或8,或9,或10,或11,或12,或13,或14,或15,或16,或17,或18,或19,或20,或21,或22,或23,或24,或25,或26,或27,或28,或29,或30个核苷酸的序列。
在一个实例中,富含GC的元件包含在30%和40%,或40%和50%,或50%和60%,或60%和70%之间的胞嘧啶。例如,富含GC的元件包含在30%和40%之间的胞嘧啶。例如,富含GC的元件包含在40%和50%之间的胞嘧啶。例如,富含GC的元件包含在50%和60%之间的胞嘧啶。例如,富含GC的元件包含在60%和70%之间的胞嘧啶。
在一个实例中,富含GC的元件包含30%,或40%,或50%,或60%,或70%的胞嘧啶。例如,富含GC的元件包含30%的胞嘧啶。例如,富含GC的元件包含40%的胞嘧啶。例如,富含GC的元件包含50%的胞嘧啶。例如,富含GC的元件包含60%的胞嘧啶。例如,富含GC的元件包含60%的胞嘧啶。例如,富含GC的元件包含70%的胞嘧啶。
在一个实例中,富含GC的元件是至少50%的胞嘧啶。
在一个实例中,富含GC的元件是至少60%的胞嘧啶。
在一个实例中,富含GC的元件是至少70%的胞嘧啶。
在一个实例中,富含GC的元件包含核苷酸序列CCCCGGCGCC。在另一实例中,富含GC的元件包含核苷酸序列CCCCGGC。在进一步的实例中,富含GC的元件包含核苷酸序列GCGCCCCGCGGCGCCCCGCG。
在一个实例中,富含GC的元件包含SEQ ID NO:41至43中所列的核苷酸序列。在一个实例中,富含GC的元件包含SEQ ID NO:41中所列的核苷酸序列。在另一实例中,富含GC的元件包含SEQ ID NO:42中所列的核苷酸序列。在进一步的实例中,富含GC的元件包含SEQID NO:43中所列的核苷酸序列。
茎环
如本文所用,术语“茎环”是指包含两个相邻的完全或部分反向互补序列的分子内碱基配对以形成茎环的核苷酸序列。茎环可以存在于单链DNA中,或更常见地,存在于RNA中。茎环也可以称为发夹或发夹环,其通常由连续序列内的茎和末端环组成,其中该茎由通过短序列分离的两个相邻的完全或部分反向互补序列形成,该短序列将环构建成茎-环结构。
配对茎环的稳定性由长度、其含有的错配或凸起的数目和配对区域的核苷酸组成决定。
在一个实例中,茎环的环长度在3和10个核苷酸之间。例如,茎环的环长度在3和8,或3和7,或3和6,或4和5个核苷酸之间。
在一个实例中,茎环的环长度为4个核苷酸。
在一个实例中,茎环为组蛋白茎环。例如,组蛋白茎环包含或由SEQ ID NO:44中设定的核苷酸序列组成。
3'非翻译区(3'-UTR)
本公开提供了包含3'-非翻译区(3'-UTR)的多核苷酸。
如本文所用,术语“3'-UTR”是指位于翻译终止密码子(即终止密码子)3'端的mRNA区域。
示范性3'-UTR包括例如花生四烯酸5-脂氧合酶(ALOX5)、αI胶原(COL1A1)、酪氨酸羟化酶(TH)基因、分裂的氨基末端增强子(AES)、人线粒体12S rRNA(mtRNR1)的3'-UTR、其片段和/或变体。
在一个实例中,3'UTR是辛德毕斯病毒(Sindbis virus,SINV)或其修饰形式的3'UTR。例如,3'UTR包含SEQ ID NO:46中所列的序列。
在一个实例中,3'-UTR包含或由衍生自白蛋白基因的3'-UTR的核苷酸序列组成。在一个实例中,3'-UTR包含或由衍生自脊椎动物α-珠蛋白基因的3'-UTR的核苷酸序列组成。例如,3'-UTR包含或由衍生自哺乳动物α-珠蛋白基因的3'-UTR的核苷酸序列组成。例如,3'-UTR包含或由衍生自人α-珠蛋白基因的3'-UTR的核苷酸序列组成。
在一个实例中,本公开的3'-UTR进一步包含至少一个微小RNA结合位点、富含AU的元件(ARE)、富含GC的元件、三股螺旋、茎环、一个或多个终止密码子或其组合。
终止密码子
如本文所用,术语“终止密码子”是指mRNA内的三核苷酸序列,其通过核糖体发出蛋白质合成停止的信号。
在一个实例中,本公开的多核苷酸在3'-UTR的5'端包含至少一个终止密码子。例如,终止密码子选自UAG、UAA和UGA。
在一个实例中,多核苷酸包含两个连续的终止密码子,其包含序列UGAUGA。
在一个实例中,多核苷酸包含两个连续的终止密码子,其包含序列UAAUAG。
3'加尾序列
本公开的多核苷酸包含位于3'UTR的3'端的一个或多个3'加尾序列。
如本文所描述的,术语“3'加尾序列”或“多个3'加尾序列”是指诱导非编码核苷酸添加至mRNA的3'端的核苷酸序列(例如聚腺苷酸化信号)或位于mRNA的3'端的核苷酸序列(例如poly-A序列)。技术人员将理解mRNA中的3'加尾序列和/或3'加尾序列的产物起稳定mRNA和/或预防mRNA降解的作用。
如本文所用,关于本公开的poly-A或poly-C序列的术语“中断接头”是指连接并且中断poly-A或poly-C序列中的一段连续腺苷或胞嘧啶核苷酸的单个核苷酸或核苷酸序列。例如,poly-A序列中的中断接头是单个核苷酸或由除了腺苷核苷酸以外的核苷酸组成或包含除了腺苷核苷酸以外的核苷酸的核苷酸序列。例如,poly-C序列中的中断接头是单个核苷酸或由除了胞嘧啶核苷酸以外的核苷酸组成或包含除了胞嘧啶核苷酸以外的核苷酸的核苷酸序列。
在一个实例中,一个或多个3'加尾序列选自由以下组成的组:poly-A序列、聚腺苷酸化信号、G-四链体、poly-C序列、茎环及其组合。
poly-A序列
如本文所用,术语“polyA序列”是指位于mRNA的3'端的腺嘌呤(A)的核苷酸序列。在本公开的上下文中,polyA序列可以位于mRNA或DNA(例如,用作通过载体转录生成mRNA的模板的DNA质粒)内。
用于本公开的合适的poly-A序列对于本领域技术人员是显而易见的和/或在本文中描述。在一个实例中,poly-A序列包含任何长度(例如10至300)的连续(即一个接一个)腺苷核苷酸。在一个实例中,poly-A序列包含被一个或多个中断接头分离的连续腺苷核苷酸。在一个实例中,poly-A序列包含连续腺苷核苷酸而没有中断接头。
聚腺苷酸化信号
如本文所用,术语“聚腺苷酸化信号”是指诱导聚腺苷酸化的核苷酸序列。聚腺苷酸化通常被理解为将polyA序列添加至RNA(例如添加至成熟前mRNA以生成成熟mRNA)。聚腺苷酸化信号可以位于待聚腺苷酸化的多核苷酸(例如mRNA)的3'端的核苷酸序列内。
用于本公开的合适的聚腺苷酸化信号对于本领域技术人员是显而易见的和/或在本文中描述。
在一个实例中,聚腺苷酸化信号包含由腺嘌呤和尿嘧啶/胸腺嘧啶核苷酸组成的六聚体。在一个实例中,六聚体序列包含或由AAUAAA组成。
在一个实例中,3'加尾序列包含聚腺苷酸化信号但不包含polyA序列。
G-四链体
如本文所用,术语“G-四链体”或“G4”是指富含鸟嘌呤残基的核苷酸序列,其形成四链二级结构。例如,G-四链体是由DNA和RNA中富含G的序列形成的四个鸟嘌呤核苷酸的环状氢键合阵列。
在一个实例中,3'加尾序列包含polyA序列和G-四链体。例如,3'加尾序列包含与G-四链体连接以产生polyA-G四重峰的polyA序列。
poly-C序列
如本文所用,术语“poly-C序列”是指位于mRNA的3'端的胞嘧啶(C)的核苷酸序列。在本公开的上下文中,polyC序列可以位于mRNA或DNA(例如,用作通过载体转录生成mRNA的模板的DNA质粒)内。
用于本公开的合适的poly-C序列对于本领域技术人员将是显而易见的和/或在本文中描述。
在一个实例中,一个或多个3'加尾序列包含一个或多个poly-C序列,各自包含10至300个连续胞嘧啶核苷酸。例如,一个或多个多poly-C序列各自包含10至20,或20至30,或30至40,或40至50,或50至60,或60至70,或70至80,或80至90,或90至100,或100至125,或125至150,或150至175,或175至200,或200至225,或225至250,或250至275,或275至300个连续胞嘧啶核苷酸。例如,一个或多个poly-C序列各自包含10,或20,或30,或40,或50,或60,或70,或80,或90,或100,或125,或150,或175,或200,或225,或250,或275,或300个连续胞嘧啶核苷酸。
在一个实例中,一个或多个poly-C序列被中断接头分离。例如,包含一个或多个3'加尾序列的第四核苷酸序列以5'至3'的顺序包含:连续胞嘧啶核苷酸、中断接头,和另外的连续胞嘧啶核苷酸。
在一个实例中,中断接头的长度为10至50,或50至100,或100至150个核苷酸。例如,中断接头的长度为1,或2,或3,或4,或5,或6,或7,或8,或9,或10,或11,或12,或13,或14,或15,或16,或17,或18,或19,或20,或25,或30,或35,或40,或45,或50,或55,或60,或65,或70,或75,或80,或85,或90,或95,或100,或110,或120,或130,或140,或150个核苷酸。
5'帽结构
在一个实例中,本公开提供了包含5'末端帽结构的mRNA。
如本文所用,术语“5'帽结构”是指在参与核输出并且结合mRNA帽结合蛋白(CBP)的mRNA的5'末端的结构。已知5'帽结构通过CBP与poly(A)结合蛋白相关联形成成熟mRNA来稳定mRNA。因此,与没有5'帽结构的mRNA相比,本公开的mRNA中5'帽结构的存在可以进一步增加mRNA的稳定性。
示范性5'帽结构包括,例如,抗反向帽类似物(ARCA)、N7,2'-0-二甲基-鸟苷(mCAP)、肌苷、N1-甲基-鸟苷、2'氟-鸟苷、7-脱氮-鸟苷、8-氧代-鸟苷、2-氨基-鸟苷、LNA-鸟苷、2-叠氮基-鸟苷、N6,2'-O-二甲基腺苷、7-甲基鸟苷(m7G)、帽1和帽2。
典型地,内源mRNA通过与mRNA的5'末端核苷酸附接的(5)'-ppp-(5)'-三磷酸键被鸟苷5'加帽。然后可以将鸟苷帽甲基化为7-甲基鸟苷(m7G),生成7mG(5')ppp(5')N,pN2p(帽0结构),其中N代表mRNA的第一和第二个5′末端核苷酸。帽0结构可以进一步2'-O-甲基化以产生7mG(5')ppp(5')NlmpNp(帽1)和/或7mG(5')-ppp(5')NlmpN2mp(帽2)。
在一个实例中,本公开的多核苷酸包含内源帽。
如本文所用,术语“内源帽”是指在细胞中合成的5'帽。例如,内源帽是天然5'帽或野生型5'帽。例如,内源帽是帽0、帽1或帽2结构。
在一个实例中,本公开的多核苷酸包含内源帽的类似物(也称为帽类似物)。
如本文所用,术语“其类似物”在内源帽或“帽类似物”的上下文中是指合成的5'帽。帽类似物可以用于在体外转录反应中产生5'加帽的mRNA。帽类似物可以是化学(即非酶促)或酶促合成的和/或连接至核苷酸(例如mRNA的5'末端核苷酸)。示范性帽类似物是可商购的并且包括例如3"-O-Me-m7G(5')ppp(5')G、G(5')ppp(5')A、G(5')ppp(5')G、m7G(5')ppp(5')A、m7G(5')ppp(5')G(新英格兰生物实验室(New England BioLabs))。在一个实例中,帽类似物是N7,3'-O-二甲基-鸟苷-5'-三磷酸-5'-鸟苷(即抗反向帽类似物(ARCA))。
在一个实例中,5'帽结构是不可水解的帽结构。不可水解的帽结构可以预防mRNA去帽并且增加mRNA的半衰期。
在一个实例中,不可水解的帽结构包含选自由以下组成的组的修饰的核苷酸:α-硫代-鸟苷核苷酸、α-甲基-膦酸酯、硒代-磷酸酯及其组合。在一个实例中,修饰的核苷酸通过α-硫代磷酸酯键连接到mRNA的5'端。将修饰的核苷酸连接到mRNA的5'端的方法对于本领域技术人员是显而易见的。例如,使用牛痘加帽酶(新英格兰生物实验室)。
修饰
在一个实例中,本公开的多核苷酸包含一个或多个修饰。通常,将修饰引入多核苷酸(例如mRNA)中以增加多核苷酸的翻译效率和/或稳定性。对多核苷酸的合适修饰对于本领域技术人员是显而易见的和/或在本文中描述。
在一个实例中,修饰包含5'-UTR和/或其片段的第一核苷酸序列。修饰包含5'-UTR和/或其片段的第一核苷酸序列产生5'-UTR和/或其片段的变体。
在一个实例中,多核苷酸的一个或多个核苷酸序列是密码子优化的。密码子优化的方法对于本领域技术人员是显而易见的和/或在本文中描述。例如,用于多核苷酸密码子优化的工具包括例如GeneArt GeneOptimizer
在一个实例中,修饰多核苷酸以增加多核苷酸中鸟嘌呤(G)和/或胞嘧啶(C)的量。多核苷酸中G/C的量(即G/C含量)可以影响多核苷酸的稳定性。因此,包含增加量的G/C核苷酸的多核苷酸比含有大量腺嘌呤(A)和胸腺嘧啶(T)或尿嘧啶(U)核苷酸的多核苷酸在功能上更稳定。G/C含量通过用G或C核苷酸取代A或T核苷酸而增加。
在一个实例中,G/C含量在编码目的第一和/或第二抗原的第一和/或第二核苷酸序列中增加。在一个实例中,G/C含量在编码目的第一和/或第二抗原的第一和/或第二核苷酸序列和/或编码一种或多种目的抗原的一种或多种附加的核苷酸序列中增加。在第一和/或第二和/或一个或多个核苷酸序列中的修饰利用了用编码相同氨基酸或编码类似化学成分的氨基酸(例如保守氨基酸取代)的替代密码子取代含有较不有利的核苷酸组合(就mRNA稳定性而言)的密码子的能力。例如,通过用含有编码相同氨基酸的G或C核苷酸的密码子取代含有A或T核苷酸的密码子来增加G/C含量。例如,通过用含有编码类似化学成分的氨基酸的G或C核苷酸的密码子取代含有A或T核苷酸的密码子来增加G/C含量。
在一个实例中,G/C含量在不编码目的抗原的多核苷酸的一个或多个核苷酸序列中增加。例如,G/C含量在5'-UTR、其片段和/或变体中增加。例如,G/C含量在3'-UTR、其片段和/或变体中增加。
在一个实例中,多核苷酸包含至少一个化学修饰的核苷酸。
如本文所用,术语“化学修饰”或“化学修饰的”在核苷酸的上下文中是指天然存在的核苷酸(即A、T、C、G、U),与天然存在的核苷酸相比,其通过替代、插入或去除单个或几个原子或原子团而被修饰。在一个实例中,多核苷酸的至少一个天然存在的核苷酸被化学修饰的核苷酸替代。在一个实例中,多核苷酸的天然存在的核苷酸的至少10%,或20%,或30%,或40%,或50%,或60%,或70%,或80%,或90%,或100%被化学修饰的核苷酸替代。用于本公开的合适的化学修饰的核苷酸对于本领域技术人员是显而易见的和/或在本文中描述。示范性化学修饰的核苷酸包括例如N6,2'-O-二甲基-腺苷(m6Am)、5-甲基尿苷(m5U)、N4-乙酰胞苷(ac4C)、2-硫代胞苷(s2C)、2-硫代尿苷(s2U)、5-甲基胞苷(m5C)、N6-甲基腺苷(m6a)、假尿苷(ψ)和1-甲基假尿苷(m1ψ)。
抗原
本公开的多核苷酸包含编码目的第一和第二抗原(例如病原性抗原)的第一和第二核苷酸序列。例如,目的抗原是抗原多肽、其片段和/或变体,其可以在受试者中诱导免疫应答。
本公开的cRNA包含编码目的第一和第二抗原(例如病原性抗原)的第一和第二核苷酸序列。例如,目的抗原是抗原多肽、其片段和/或变体,其可以在受试者中诱导免疫应答。
本公开的自我复制RNA包含编码抗原(例如病原性抗原)的异源序列(例如第一和第二核苷酸序列)。例如,抗原可以在受试者中诱导免疫应答。
适用于本文所描述的多核苷酸的抗原性多肽、其片段和/或变体对于本领域技术人员是显而易见的,并且例如包括衍生自任何病原体的蛋白质和肽。例如,抗原是病毒、细菌、真菌或原生动物。
适用于本文所描述的自我复制RNA的抗原对于本领域技术人员是显而易见的,并且例如包括衍生自任何病原体的蛋白质和肽。例如,抗原是病毒、细菌、真菌或原生动物。
病毒抗原
在一个实例中,本公开的抗原是病毒抗原。
可以由多核苷酸、cRNA或自我复制RNA编码的病毒抗原对于本领域技术人员而言是显而易见的,并且包括例如来自以下的蛋白质和肽:正粘病毒(Orthomyxovirus)(例如甲型流感、B和C)、副粘病毒科(Paramyxoviridae)病毒(肺炎病毒(Pneumovirus)(例如呼吸道合胞病毒(RSV)、牛呼吸道合胞病毒、小鼠肺炎病毒和火鸡鼻气管炎病毒)、1至4型副粘病毒(PIV)、流行性腮腺炎、仙台病毒、猿病毒5))、牛副流感病毒、尼帕病毒(Nipahvirus)、亨尼巴病毒(Henipavirus)和新城疫病毒(Newcastledisease virus))、痘病毒科(Poxviridae)(例如天花病毒(Variola vera),包括但不限于,大天花和小天花、偏肺病毒(Metapneumoviruses),诸如人偏肺病毒(hMPV)和禽偏肺病毒(aMPV))、麻疹病毒(Morbillivirus)(例如麻疹)、小核糖核酸病毒(Picornavirus)(例如,肠道病毒、鼻病毒、嗜肝病毒(Heparnavirus)、双埃柯病毒(Parechovirus)、心病毒和口蹄疫病毒(Aphthovirus))、肠道病毒(例如,脊髓灰质炎病毒1、2或3型、柯萨奇A病毒1至22和24型、柯萨奇B病毒1至6型、艾柯病毒(ECHO)病毒1至9、11至27和29至34型和肠道病毒68至71型)、布尼亚病毒(Bunyavirus)(例如,加利福尼亚脑炎病毒)、白蛉病毒(Phlebovirus)(例如裂谷热病毒(Rift Valley Fever virus))、内罗病毒(Nairovirus)(例如,克里米亚-刚果出血热病毒(Crimean-Congo hemorrhagic fever virus))、肝病毒(Heparnavirus)(例如,甲肝病毒(HAV))、披膜病毒(Togavirus)(例如,风疹病毒、甲病毒或动脉炎病毒)、虫媒病毒(Flavivirus)(例如,蜱传脑炎(TBE)病毒、登革热(1、2、3或4型)病毒、黄热病毒、日本脑炎病毒、科萨努尔森林病毒、西尼罗脑炎病毒、圣路易斯脑炎病毒、俄罗斯春夏脑炎病毒、波瓦桑脑炎病毒)、瘟病毒(例如,牛病毒性腹泻(BVDV)、典型猪热病病毒(CSFV)或边界病(BDV))、嗜肝DNA病毒(Hepadnavirus)(例如乙型肝炎病毒、丙型肝炎病毒)、弹状病毒(例如狂犬病毒(Lyssavirus)(狂犬病病毒(Rabies virus))和水泡病毒(VSV))、杯状病毒科(例如诺沃克病毒,和诺瓦克样病毒(例如,夏威夷病毒和雪山病毒));冠状病毒(例如严重急性呼吸综合征(SARS)冠状病毒(SARS-CoV)、SARS冠状病毒2(SARS-CoV-2)、中东呼吸综合征(MERS)冠状病毒(MERS-CoV)、禽传染性支气管炎(IBV)、小鼠肝炎病毒(MHV)和猪传染性胃肠炎病毒(TGEV))、逆转录病毒(例如致癌病毒、慢病毒或泡沫病毒)、呼肠孤病毒(例如正呼肠孤病毒、轮状病毒、环状病毒或科罗拉多壁虱热病毒(Coltivirus))、细小病毒(例如细小病毒B19)、丁型肝炎病毒(HDV)、戊型肝炎病毒(HEV)、人疱疹病毒(例如,单纯疱疹病毒(HSV)、水痘带状疱疹病毒(VZV)、艾普斯登-巴尔病毒(EBV)、巨细胞病毒(CMV)、人疱疹病毒6(HHV6)、人疱疹病毒7(HHV7)和人疱疹病毒8(HHV8))、乳多空病毒(Papovavirus)(例如,乳头瘤病毒和多瘤病毒)、腺病毒和沙粒病毒。
在一个实例中,本公开的第一和/或第二抗原是来自呼吸道病毒的病毒抗原。可以由自我复制RNA编码的呼吸病毒抗原对于本领域技术人员是显而易见的,并且包括例如来自以下的蛋白质和肽:正粘病毒(例如甲型流感、B和C)、副粘病毒科病毒(肺炎病毒(例如呼吸道合胞病毒(RSV)、牛呼吸道合胞病毒、小鼠肺炎病毒和火鸡鼻气管炎病毒)、副粘病毒(PIV)和偏肺病毒诸如人偏肺病毒(hMPV)和禽偏肺病毒(aMPV))、小核糖核酸病毒(例如鼻病毒)和冠状病毒(例如,严重急性呼吸综合征(SARS)冠状病毒(SARS-CoV)、SARS冠状病毒2(SARS-CoV-2)、中东呼吸综合征(MERS)冠状病毒(MERS-CoV)、禽传染性支气管炎(IBV)、小鼠肝炎病毒(MHV))。
在一个实例中,本公开的第一和/或第二抗原是来自流感病毒的病毒抗原。
在另一实例中,本公开的第一和/或第二抗原是来自冠状病毒的病毒抗原。
细菌抗原
在一个实例中,本公开的抗原是细菌抗原。
可以由多核苷酸、cRNA或自我复制RNA编码的细菌抗原对于本领域技术人员是显而易见的,并且包括例如来自以下的蛋白质和肽:脑膜炎奈瑟氏球菌(Neisseriameningitides)、肺炎链球菌(Streptococcus pneumoniae)、酿脓链球菌(Streptococcuspyogenes)、卡他莫拉菌(Moraxella catarrhalis)、百日咳博代氏杆菌(Bordetellapertussis)、伯克霍尔德氏菌属(Burkholderia sp.)(例如,鼻疽伯克霍尔德氏菌(Burkholderia mallei)、类鼻疽伯克霍尔德氏菌(Burkholderia pseudomallei)和洋葱伯克霍尔德氏菌(Burkholderia cepacia))、金黄色葡萄球菌(Staphylococcus aureus)、流感嗜血杆菌(Haemophilus influenzae)、破伤风梭菌(Clostridium tetani)(破伤风)、产气荚膜梭菌(Clostridium perfringens)、肉毒梭菌(Clostridium botulinums)、白喉棒状杆菌(Cornynebacterium diphtheriae)(白喉)、铜绿假单胞菌(Pseudomonasaeruginosa)、嗜肺军团菌(Legionella pneumophila)、伯纳特氏立克次氏体(Coxiellaburnetii)、布氏杆菌属(Brucella sp.)(例如,流产布氏杆菌(B.abortus)、犬布氏杆菌(B.canis)、羊布氏杆菌(B.melitensis)、木鼠布氏杆菌(B.neotomae)、绵羊布氏杆菌(B.ovis)、猪布氏杆菌(B.suis)和鳍种布氏杆菌(B.pinnipediae))、弗朗西斯氏菌属(Francisella sp.)(例如,新凶手弗朗西斯菌(F.novicida)、蜃楼弗朗西斯菌(F.philomiragia)和土拉热弗朗西斯菌(F.tularensis))、无乳链球菌(Streptococcusagalactiae)、淋病奈瑟氏球菌(Neiserria gonorrhoeae)、沙眼衣原体(Chlamydiatrachomatis)、梅毒螺旋体(Treponema pallidum)(梅毒)、杜克雷嗜血杆菌(Haemophilusducreyi)、粪肠球菌(Enterococcus faecalis)、屎肠球菌(Enterococcus faecium)、幽门螺杆菌(Helicobacter pylori)、腐生葡萄球菌(Staphylococcus saprophyticus)、小肠结肠炎耶尔森菌(Yersinia enterocolitica)、大肠杆菌(E.coli)、炭疽芽孢杆菌(Bacillusanthracis)(炭疽)、鼠疫耶尔森菌(Yersinia pestis)(鼠疫)、结核分枝杆菌(Mycobacterium tuberculosis)、立克次氏体(Rickettsia)、李斯特菌(Listeria)、肺炎衣原体(Chlamydia pneumoniae)、霍乱弧菌(Vibrio cholerae)、伤寒沙门氏菌(Salmonellatyphi)(伤寒)、伯氏疏螺旋体(Borrelia burgdorfer)、卟啉单胞菌属(Porphyromonassp)、克雷伯菌属(Klebsiella sp.)。
真菌抗原
在一个实例中,本公开的抗原是真菌抗原。
可以由多核苷酸、cRNA或自我复制RNA编码的真菌抗原对于本领域技术人员是显而易见的,并且包括例如来自以下的蛋白质和肽:皮肤癣菌(Dermatophytes)(包括絮状表皮癣菌(Epidermophyton floccusum)、奥杜安氏小孢子菌(Microsporum audouini)、犬小孢子菌(Microsporum canis)、扭曲小孢子菌(Microsporum distortum)、马类小孢子菌(Microsporum equinum)、石膏小孢子菌(Microsporum gypsum)、矮小孢子菌(Microsporumnanum)、同心发癣菌(Trichophyton concentricum)、马发癣菌(Trichophyton equinum)、鸡发癣菌(Trichophyton gallinae)、石膏样发癣菌(Trichophyton gypseum)、蜱发癣菌(Trichophyton megnini)、须毛癣菌(Trichophyton mentagrophytes)、quinckeanum发癣菌、红色发癣菌(Trichophyton rubrum)、许兰黄癣菌(Trichophyton schoenleini)、断发毛癣菌(Trichophyton tonsurans)、疣状发癣菌(Trichophyton verrucosum)、疣状发癣菌白色变种(var.album)、盘状变种(var.discoides)、赭色变种(var.ochraceum)、紫色发癣菌(Trichophyton violaceum)和/或蜂窝状发癣菌(Trichophyton faviforme)、烟曲霉(Aspergillus fumigatus)、黄曲霉(Aspergillus flavus)、黑曲霉(Aspergillus niger)、构巢曲霉(Aspergillus nidulans)、土曲霉(Aspergillus terreus)、萨氏曲霉(Aspergillus sydowi)、黄曲霉(Aspergillus flavatus)、灰绿曲霉(Aspergillusglaucus)、芽生裂殖菌(Blastoschizomyces capitatus)、白色念珠菌(Candidaalbicans)、念珠菌烯醇化酶(Candida enolase)、热带念珠菌(Candida tropicalis)、光滑念珠菌(Candida glabrata)、克鲁斯念珠菌(Candida krusei)、近平滑念珠菌(Candidaparapsilosis)、类星形念珠菌(Candida stellatoidea)、克鲁斯念珠菌(Candida kusei)、Candida parakwsei、葡萄牙念珠菌(Candida lusitaniae)、伪热带念珠菌(Candidapseudotropicalis)、吉利蒙念珠菌(Candida guilliermondi)、卡氏枝孢霉(Cladosporiumcarrionii)、粗球孢子菌(Coccidioides immitis)、皮炎芽生菌(Blastomycesdermatidis)、新型隐球菌(Cryptococcus neoformans)、棒状地丝菌(Geotrichumclavatum)、荚膜组织胞浆菌(Histoplasma capsulatum)、肺炎克雷伯氏菌(Klebsiellapneumoniae)、小孢子虫(Microsporidia)、脑胞内原虫属(Encephalitozoon spp.)、肠间隔微孢子虫(Septata intestinalis)和比氏肠胞虫(Enterocytozoon bieneusi)。
原生动物抗原
在一个实例中,本公开的抗原是原生动物抗原。
可以由多核苷酸、cRNA或自我复制RNA编码的原生动物抗原对于本领域技术人员是显而易见的,并且包括例如来自以下的蛋白质和肽:组织溶解阿米巴(Entamoebahistolytica)、篮氏贾第鞭毛虫(Giardia lambli)、小隐孢子虫(Cryptosporidiumparvum)、卡耶塔环孢子球虫(Cyclospora cayatanensis)和弓形虫(Toxoplasma)。
产生方法
用于产生本公开的多核苷酸、cRNA和/或自我复制RNA的合适方法对于本领域技术人员是显而易见的和/或在本文中描述。
在一个实例中,多核苷酸是DNA。例如,多核苷酸是质粒DNA。
在一个实例中,使用质粒DNA产生cRNA。在一个实例中,使用质粒DNA产生自我复制RNA。技术人员将理解质粒DNA相对稳定。简言之,用编码本公开的自我复制RNA的DNA质粒转化感受态细菌细胞(例如大肠杆菌)细胞。分离单个细菌菌落,并且在大肠杆菌培养物中扩增所得质粒DNA。
在一个实例中,在发酵后分离质粒DNA。例如,使用可商购的试剂盒(例如MaxiprepDNA试剂盒)或本领域技术人员已知的其它常规方法分离质粒DNA。分离后,通过限制性消化(即,使用限制性酶)将质粒DNA线性化。使用本领域已知的方法去除限制性酶,包括例如苯酚/氯仿提取和乙醇沉淀。
在一个实例中,mRNA通过使用RNA聚合酶(例如,T7 RNA聚合酶)从线性化DNA模板体外转录来制备。体外转录后,通过DNase消化去除DNA模板。技术人员将理解,进行合成mRNA加帽以校正mRNA加工并且有助于mRNA的稳定。在一个实例中,mRNA是酶促5'-加帽的。例如,5'帽是帽0结构或帽1结构。在一个实例中,5'帽是帽0结构,例如,5'-帽(即,帽0)由经由5'–5'三磷酸桥连接至mRNA的其余部分的反向7-甲基鸟苷组成。在一个实例中,5'帽是帽1结构,例如,5'-帽(即,帽1)由具有起始核苷酸的2'O位置的附加甲基化的帽0组成。
在一个实例中,纯化mRNA。纯化mRNA的各种方法对于本领域技术人员是显而易见的。例如,使用氯化锂(LiCl)沉淀纯化mRNA。在另一实例中,使用切向流过滤(TFF)纯化mRNA。纯化后,将mRNA重悬于例如无核酸酶的水中。
组合物
本公开提供了包含本公开的多核苷酸的免疫原性组合物。
本公开还提供了包含本公开的cRNA的免疫原性组合物。
本公开进一步提供了包含本公开的自我复制RNA的免疫原性组合物。
本公开还提供了包含本公开的免疫原性组合物和药学上可接受的载体的药物组合物。
对于本领域技术人员显而易见和/或本文所描述的是,本公开的多核苷酸、cRNA和/或自我复制RNA可作为裸RNA存在或与脂质、聚合物或促进进入细胞的其它递送系统组合存在。
递送系统
在一个实例中,本公开的药物组合物进一步包含LNP、聚合物微粒和水包油乳液。例如,多核苷酸、cRNA和/或自我复制RNA被包封、结合或吸附在LNP、聚合物微粒和水包油乳液上。
脂质纳米颗粒
在一个实例中,本公开的药物组合物进一步包含LNP。
显而易见的是,术语“脂质纳米颗粒”或“LNP”是指任何脂质组合物,包括但不限于脂质体或囊泡,其中水性体积被两亲性脂质双层(例如,单;单层或多;多层)包封,胶束状脂质纳米颗粒具有非水性核心和固体脂质纳米颗粒,其中固体脂质纳米颗粒缺乏脂质双层。
适用于本公开的脂质纳米颗粒对于本领域技术人员将是显而易见的和/或在本文中描述。脂质可以具有阴离子、阳离子或两性离子亲水头部基团。
在一个实例中,脂质纳米颗粒包含PEG-脂质、固醇结构脂质和/或中性脂质。在一个实例中,脂质纳米颗粒进一步包含阳离子脂质。在一个实例中,脂质纳米颗粒不包含阳离子脂质。
在一个实例中,LNP包含PEG-脂质。例如,PEG-脂质选自由以下组成的组:PEG-c-DMG、PEG-DMG、PEG-DLPE、PEG-DMPE、PEG-DPPC、PEG-DSPE脂质及其组合。
在一个实例中,LNP包含结构脂质。例如,结构脂质选自由以下组成的组:胆固醇、粪甾醇、谷甾醇、菜油甾醇、豆甾醇、菜子甾醇、麦角甾醇、番茄碱、番茄素、乌索酸和α-生育酚及其组合。
在一个实例中,LNP包含中性脂质。用于本公开的示范性磷脂(阴离子或两性离子的)包括例如磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰丝氨酸和磷脂酰甘油。例如,中性脂质选自由以下组成的组:1,2-二硬脂酰-sn-丙三基-3-磷酸胆碱(DSPC)、1,2-二油酰基-sn-丙三基-3-磷酸乙醇胺(DOPE)、1,2-二亚油酰基-sn-丙三基-3-磷酸胆碱(DLPC)、1,2-二肉豆蔻酰基-sn-丙三基-磷酸胆碱(DMPC)、1,2-二油酰基-sn-丙三基-3-磷酸胆碱(DOPC)、1,2-二棕榈酰基-sn-丙三基-3-磷酸胆碱(DPPC)、1,2-二十一酰基-sn-丙三基-磷酸胆碱(DUPC)、1-棕榈酰基-2-油酰基-sn-丙三基-3-磷酸胆碱(POPC)、1,2-二-O-十八碳烯基-sn-丙三基-3-磷酸胆碱(18:0二醚PC)、1-油酰-2-胆固醇琥珀酸单酰基-sn-丙三基-3-磷酸胆碱(OChemsPC)、1-十六烷基-sn-丙三基-3-磷酸胆碱(C16 Lyso PC)、1,2-二亚麻酰基-sn-丙三基-3-磷酸胆碱、1,2-二花生四烯-sn-丙三基-3-磷酸胆碱、1,2-二二十二碳六烯酰-sn-丙三基-3-磷酸胆碱、1,2-二植烷酰-sn-丙三基-3-磷酸乙醇胺(ME 16.0PE)、1,2-二硬脂酰基-sn-丙三基-3-磷酸乙醇胺(DSPE)、1,2-二亚油酰基-sn-丙三基-3-磷酸乙醇胺、1,2-二亚麻酰基-sn-丙三基-3-磷酸乙醇胺、1,2-二花生四烯-sn-丙三基-3-磷酸乙醇胺、1,2-二二十二碳六烯酰-sn-丙三基-3-磷酸乙醇胺、1,2-二油酰基-sn-丙三基-3-磷酸-rac-(1-丙三醇)钠盐(DOPG),和鞘磷脂及其组合。
在一个实例中,LNP包含阳离子脂质。示范性阳离子脂质包括但不限于二油酰基三甲基铵丙烷(DOTAP)、l,2-二硬脂酰氧基-N,N-二甲基-3-氨基丙烷(DSDMA)、1,2-二油酰氧基-N,N-二甲基-3-氨基丙烷(DODMA)、1,2-二亚油烯基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二亚油烯基氧基-N,N-二甲基-3-氨基丙烷(DLenDMA)、2,5-双((9z,12z)-十八-9,12,二烯-1-氧基)苄基-4-(二甲基氨基)丁酸酯(LKY750)。在一个实例中,磷脂是2,5-双((9z,12z)-十八-9,12,二烯-1-氧基)苄基-4-(二甲基氨基)丁酸酯(LKY750)。示范性两性离子脂质包括但不限于酰基两性离子脂质和醚两性离子脂质,诸如二棕榈酰磷脂酰胆碱(DPPC)、二油酰磷脂酰胆碱(DOPC)和十二烷基磷酸胆碱。脂质可以是饱和或不饱和的。
聚合物微粒
在一个实例中,本公开的药物组合物进一步包含聚合物微粒。
本领域技术人员将意识到各种聚合物可以形成微粒以包封或吸附本公开的多核苷酸、cRNA和/或自我复制RNA。显然,使用基本上无毒的聚合物意味着颗粒是安全的,而使用可生物降解的聚合物意味着颗粒在递送后可以被代谢以避免长期存留。有用的聚合物也是可灭菌的,以有助于药物级制剂的制备。
示范性无毒并且可生物降解的聚合物包括但不限于聚(α-羟基酸)、聚羟基丁酸、聚内酯(包括聚己内酯)、聚二烷酮、聚戊内酯、聚原酸酯、聚酐、聚氰基丙烯酸酯、酪氨酸衍生的聚碳酸酯、聚乙烯基吡咯烷酮或聚酯酰胺及其组合。
水包油阳离子乳液
在一个实例中,本公开的药物组合物进一步包含水包油阳离子乳液。
用于水包油乳液的合适的油对于本领域技术人员是显而易见的和/或在本文中描述。例如,乳液包含一种或多种衍生自例如动物(例如鱼)或植物来源(例如坚果、种子、谷物)的油。本领域技术人员将认识到优先使用生物相容的和生物可降解的油。示范性动物油(即,鱼油)包括鳕鱼肝油、鲨鱼肝油和鲸油。示范性植物油包括花生油、椰子油、橄榄油、大豆油、霍霍巴油、红花油、棉籽油、葵花籽油、芝麻籽油、玉米油。
除了油之外,水包油乳液还包含阳离子脂质以促进乳液的形成和稳定。合适的阳离子脂质对于本领域技术人员是显而易见的和/或在本文中描述。示范性阳离子脂质包括但不限于,限于:l,2-二油酰氧基-3-(三甲铵基)丙烷(DOTAP)、3'-[N-(N',N'-二甲氨基乙烷)-氨基甲酰基]胆固醇(DC胆固醇)、二甲基双十八烷基-铵(DDA)、l,2-二肉豆蔻酰基-3-三甲基-铵丙烷(DMTAP)、二棕榈酰基[C16:0]三甲基铵丙烷(DPTAP)和二硬脂酰基三甲基铵丙烷(DSTAP)。
在一些实例中,水包油乳液还包含非离子表面活性剂和/或两性离子表面活性剂。本领域技术人员将知道适用于本公开的表面活性剂。示范性表面活性剂包括但不限于:聚氧乙烯脱水山梨糖醇酯表面活性剂(例如聚山梨醇酯20和聚山梨醇酯80)和环氧乙烷(EO)、环氧丙烷(PO)和/或环氧丁烷(BO)的共聚物。
药学上可接受的载体
合适地,在用于向受试者施用本公开的cRNA和/或自我复制RNA的组合物或方法中,cRNA和/或自我复制RNA与本领域中理解的药学上可接受的载体组合。因此,本公开的一个实例提供了一种组合物(例如,药物组合物),其包含与药学上可接受的载体组合的本公开的自我复制RNA(和任何递送系统)。本公开的另一实例提供了一种组合物(例如,药物组合物),其包含与药学上可接受的载体组合的本公开的cRNA(和任何递送系统)。
一般而言,“载体”意指可以安全施用于任何受试者,例如人,的固体或液体填充剂、粘合剂、稀释剂、包封物质、乳化剂、润湿剂、溶剂、悬浮剂、包衣或润滑剂。根据具体的施用途径,可以使用本领域已知的多种可接受的载体,如例如在《雷明顿药物科学(Remington's Pharmaceutical Sciences)》(美国新泽西州麦克出版公司(MackPublishing Co.N.J.USA),1991)中所描述的。
本公开的cRNA和/或自我复制RNA可用于肠胃外、局部、口服或局部施用、肌内施用、气雾剂施用或透皮施用,用于预防性或治疗性治疗。在一个实例中,将自我复制RNA肠胃外施用,诸如肌内、皮下或静脉内施用。例如,肌内施用自我复制RNA。在另一实例中,将cRNA肠胃外施用,诸如肌内、皮下或静脉内施用。例如,肌内施用cRNA。
待施用的cRNA和/或自我复制RNA的制剂将根据施用途径和所选择的制剂(例如,溶液、乳液、胶囊)而变化。可以在生理学上可接受的载体中制备待施用的包含cRNA和/或自我复制RNA的合适的药物组合物。对于溶液或乳液,合适的载体包括例如水性溶液或醇/水性溶液、乳液或悬浮液,包括盐水和缓冲介质。肠胃外媒介物可以包括氯化钠溶液、林格氏右旋糖、右旋糖和氯化钠、乳酸盐林格氏或固定油。本领域技术人员已知多种合适的水性载体,包括水、缓冲水、缓冲盐水、多元醇(例如甘油、丙二醇、液体聚乙二醇)、右旋糖溶液和甘氨酸。静脉内媒介物可以包括各种添加剂、防腐剂,或流体、营养物或电解质补充剂(通常参见《雷明顿药物科学》,第16版,麦克编辑,1980)。组合物可以任选地含有接近生理条件所需的药学上可接受的辅助物质,诸如pH调节剂和缓冲剂以及毒性调节剂,例如乙酸钠、氯化钠、氯化钾、氯化钙和乳酸钠。cRNA和/或自我复制RNA可以储存在液体阶段或可以冻干储存并且在使用前根据本领域已知的冻干和重构技术在合适的载体中重构。
活性成分在所选介质中的最佳浓度可以根据本领域技术人员已知的程序凭经验确定,并且将取决于所期望的最终药物制剂。
在配制时,本公开的组合物将以与剂量制剂相容的方式并且以此类治疗/预防有效的量施用。用于施用本公开的cRNA和/或自我复制RNA的剂量范围是足够大以产生所期望的效果的那些。例如,该组合物包含有效量的自我复制RNA。在一个实例中,组合物包含治疗有效量的自我复制RNA。在另一实例中,组合物包含预防有效量的自我复制RNA。在一个实例中,组合物包含有效量的cRNA。在一个实例中,组合物包含治疗有效量的cRNA。在另一实例中,组合物包含预防有效量的cRNA。
剂量不应大到引起不良副作用。通常,剂量将随患者的年龄、状况、性别和疾病程度而变化,并且可以由本领域技术人员确定。在任何并发症的情况下,可以由个体医生调节剂量。
剂量可以从约0.1mg/kg至约300mg/kg不等,例如从约0.2mg/kg至约200mg/kg,诸如从约0.5mg/kg至约20mg/kg,每天一次或多次剂量施用,持续一天或几天。
在一些实例中,cRNA和/或自我复制RNA以高于后续(维持剂量)的初始(或负载)剂量施用。例如,以在约10mg/kg至约30mg/kg之间的初始剂量施用cRNA和/或自我复制RNA。然后以在约0.0001mg/kg至约10mg/kg之间的维持剂量施用cRNA和/或自我复制RNA。维持剂量可以每7至35天,诸如每7或14或28天施用。
在一些实例中,使用剂量递增方案,其中cRNA和/或自我复制RNA最初以比后续剂量中使用的剂量更低的剂量施用。该剂量方案在受试者最初遭受不良事件的情况下是有用的。
在受试者对治疗没有充分响应的情况下,可以在一周内施用多剂量。替代地,或另外,可以施用增加的剂量。
受试者可以用本公开的cRNA和/或自我复制RNA再治疗。受试者可以用cRNA和/或自我复制RNA再治疗,通过给予多于一次暴露或一组剂量,诸如至少约两次暴露结合蛋白,例如约2至60次暴露,并且更特别地约2至40次暴露,最特别地约2至20次暴露。
在一个实例中,当疾病的体征或症状复发时,可以给予任何再治疗。
在另一实例中,可以以限定的间隔给予任何再治疗。例如,后续暴露可以以各种间隔施用,诸如例如约24至28周或48至56周或更长。例如,此类暴露以约24至26周或约38至42周或约50至54周的间隔施用。
在受试者对治疗没有充分响应的情况下,可以在一周内施用多剂量。替代地,或另外,可以施用增加的剂量。
在另一实例中,对于经历不良反应的受试者,初始(或负载)剂量可以在一周内分开数天或连续数天。
根据本公开的方法的cRNA和/或自我复制RNA的施用可以是连续的或间歇的,这取决于例如接受者的生理状况、施用的目的是治疗性的还是预防性的,以及技术实践者已知的其它因素。cRNA和/或自我复制RNA的施用可以在预选的时间段内基本上是连续的,或者可以是一系列间隔的剂量,例如在病症发展期间或之后。
筛选测定
选择本公开的cRNA和/或自我复制RNA的合适方法是本领域技术人员可获得的。可以进行测定以评估RNA的效率和功效,包括例如血清学和免疫应答。
抗原表达
在一个实例中,评估自我复制RNA的(至少)目的第一和第二基因的表达。在另一实例中,评估cRNA的(至少)目的第一和第二基因的表达。
例如,使用针对目的基因的抗体检测抗原表达。在一个实例中,通过例如荧光激活细胞分选术(FACS)测量抗原表达阳性的细胞数目。在另一实例中,使用例如FACS确定平均荧光强度(MFI)。在进一步的实例中,计算每单位质量RNA的特异性效力值或成功转染的概率。
微量中和测定
在一个实例中,评估自我复制RNA(裸的和/或配制的)的抗体应答。在一个实例中,评估cRNA(裸的和/或配制的)的抗体应答。例如,使用微量中和测定评估cRNA和/或自我复制RNA。进行微量中和测定的方法对于本领域技术人员是显而易见的。在一个实例中,微量中和测定是短形式测定。例如,进行基于病毒荧光灶的微量中和测定。在另一实例中,微量中和测定是长形式测定。
血凝抑制(HAI)测定
在一个实例中,评估自我复制RNA(裸的和/或配制的)的抗体应答。在一个实例中,评估cRNA(裸的和/或配制的)的抗体应答。例如,使用血凝抑制(HAI)测定评估cRNA和/或自我复制RNA。进行HAI测定的方法对于本领域技术人员是显而易见的和/或描述于例如WHO(2011)《流感实验室诊断和病毒学监测手册(Manual for the laboratory diagnosis andvirological surveillance of influenza)》:WHO出版社,世界卫生组织。
抗原特异性T细胞应答
在一个实例中,评估自我复制RNA诱导抗原特异性T细胞应答的能力。在一个实例中,评估cRNA诱导抗原特异性T细胞应答的能力。评估抗原特异性T细胞应答的诱导的方法对于本领域技术人员是显而易见的和/或在本文中描述。
例如,对脾培养物进行抗原特异性T细胞检测。简言之,在T细胞培养基中建立脾细胞培养物,并且用抗原肽刺激或不刺激细胞培养物。在一个实例中,使用流式细胞术确定抗原特异性T细胞应答。
中和测定
可以在体外筛选本公开的自我复制RNA,以确定其结合SARS-CoV-2S蛋白RBD和中和S蛋白RBD与ACE2的结合的能力。合适的测定对于本领域技术人员是显而易见的,并且包括例如Vero微量中和测定、sVNT测定或假病毒中和测定(使用例如HEK-293T细胞或HeLa-ACE2细胞)。
在一个实例中,中和测定是Vero微量中和测定。简言之,SARS-Cov-2野生型病毒在Vero细胞(即,从非洲绿猴提取的肾上皮细胞分离的Vero谱系)中传代。将连续两倍稀释的测试蛋白与100TCID50(即,中等组织培养感染剂量)的SARS-CoV-2一起孵育1小时,并且在Vero细胞中评估残余病毒感染性;例如在第5天读取病毒细胞病变效应。使用如先前所描述的Reed/Muench方法计算中和抗体滴度(Houser等人,2016;Subbarao等人,2004)。
在一个实例中,中和测定是替代中和测试(sVNT)。简言之,用碳酸盐-碳酸氢盐包被缓冲液(例如pH 9.6)中的hACE2蛋白包被板的孔。将与测试蛋白预孵育的HRP缀合的SARS-CoV-2和HRP缀合的SARS-CoV-RBD以不同浓度添加到hACE2中,并且在室温下孵育例如1小时。通过洗涤去除未结合的HRP缀合的抗原。在HRP与显色底物例如3,3',5,5'-四甲基联苯胺(TMB)的酶促反应中产生比色信号。在一个实例中,获取450nm和570nm处的吸光度读数。
在一个实例中,中和是假病毒中和测定。简言之,通过将SARS-2-COV-2刺突质粒与病毒骨架质粒(例如,pDR-NLΔenv FLUC)一起共转染到例如HEK-293T细胞中来产生用SARS-2-刺突蛋白假型化的HIV报道病毒。转染后收获假病毒并且通过过滤澄清。通过在Hela-hACE2细胞中有限稀释感染来计算病毒储备滴度,报告为相对荧光素酶单位感染剂量(RLU),测量荧光素酶活性作为病毒感染的读数。
治疗或预防方法
本公开提供了使用本公开的免疫原性组合物或药物组合物作为疫苗的方法。
本公开还提供了治疗或预防受试者的疾病或病症的方法,包含施用本公开的免疫原性组合物或药物组合物。例如,该疾病或病症是呼吸道病毒感染,诸如流感或COVID-19。在一个实例中,该疾病或病症是ARDS。
流感
流感,也称为“流行性感冒”,是由流感病毒引起的感染性疾病。症状可以是轻度至重度的,并且最常见的症状包括高热、流涕、喉咙痛、肌肉和关节疼痛、头痛、咳嗽和感觉疲劳。症状通常在暴露于病毒两天后开始,并且最多持续不到一周。流感的并发症可以包括病毒性肺炎、继发性细菌性肺炎、鼻窦感染和先前健康问题诸如哮喘或心力衰竭的恶化。病毒性肺炎也可以导致急性呼吸窘迫综合征(ARDS)。
对于本领域技术人员显而易见的是,目前有四种流感病毒-A、B、C和D。甲型流感病毒是最常见的感染人、动物和鸟类的流行性感冒病毒,而乙型流感病毒感染主要发生在人中。丙型流感病毒的感染不会在人或哺乳动物中引起任何严重症状,并且丁型流感迄今为止仅感染猪和牛。
因此,在本公开的一些实例中,受试者具有流感病毒感染。在一个实例中,受试者患流感。特别地,流感与ARDS相关联。在一个实例中,本公开的方法可以用于治疗或预防患有流感病毒感染的受试者的ARDS。在一个实例中,本公开的方法可以用于治疗或预防患有流感的受试者中的ARDS。
冠状病毒疾病2019(COVID-19)
本公开提供了例如治疗或预防COVID-19的方法。
本公开还提供了例如治疗或预防SARS-CoV-2感染的方法。在本公开的一些实例中,受试者具有SARS-CoV-2感染,但没有临床诊断的COVID-19。
COVID-19是由SARS-CoV-2引起的传染病。导致了持续的大流行。常见的症状包括发烧、咳嗽、疲劳、呼吸短促以及嗅觉和味觉丧失。虽然大多数病例产生轻度症状,但一些进展为ARDS。从暴露至症状发作的时间通常为约5天,但可以在2至14天的范围内。目前没有针对COVID-19的疫苗或特异性抗病毒治疗,并且管理涉及该症状的治疗、支持性护理、隔离和实验措施。
因此,在一些实例中,受试者具有SARS-CoV-2感染。在一个实例中,受试者具有COVID-19,例如,重度COVID-19。特别地,重度COVID-19经常导致ARDS。本公开的方法可以用于治疗或预防患有重度COVID-19的受试者的ARDS。
急性呼吸窘迫综合征(ARDS)
本公开提供例如治疗或预防受试者的ARDS的方法。
ARDS是危及生命的病症,其特征在于双肺浸润、严重低氧血症和肺泡-毛细血管膜屏障破坏(即肺血管渗漏),导致非心源性肺水肿。目前没有有效的药理学疗法。
感染性病因包括流感和冠状病毒感染是ARDS的主要原因。因此,在本公开的一个实例中,ARDS与流感或冠状病毒感染相关联。例如,ARDS与流感相关联。在另一实例中,ARDS与冠状病毒感染诸如SARS-COV感染相关联。在一个实例中,ARDS与SARS-CoV-2感染相关联。
根据所述柏林定义对ARDS进行分类,该分类包括:
(1)临床损伤或呼吸道症状发作1周内表现;
(2)急性低氧性呼吸衰竭,在至少5cm的连续气道正压(CPAP)或呼气末正压(PEEP)下通过300mmHg或更小的PaO2/FiO2比率确定,其中PaO2是动脉血中的氧分压,并且FiO2是吸入氧的级分;
(3)肺射线照片上的双侧不透明,未通过积液、实变或肺不张充分解释;并且
(4)水肿/呼吸衰竭未完全由心力衰竭或液体过剩解释。
在一个实例中,受试者具有或患有ARDS(即,受试者满足ARDS的柏林定义)。例如,受试者需要治疗(即,需要治疗)。
在一个实例中,受试者具有或患有与ARDS相关联的症状。与ARDS相关联的症状和鉴定处于患ARDS风险中的受试者的方法对于本领域技术人员将是显而易见的和/或在本文中描述。例如,受试者具有一种或多种或所有以下症状:
a)呼吸频率为每分钟大于30次呼吸;
b)室内空气的氧饱和度(SpO2)为93%或更低;
c)动脉氧分压与吸入氧级分比率(PaO2/FiO2)小于300mmHg;
d)SpO2/FiO2比率为小于218;并且
e)射线照相的肺浸润量大于50%。
目前,ARDS被分类为轻度、中度或重度,伴有相关联的死亡率增加。ARDS的严重性可以根据柏林定义分类如下:
(i)轻度ARDS:在至少5cm CPAP或PEEP上200至300mmHg的PaO2/FiO2
(ii)中度ARDS:在至少5cm PEEP上100至200mmHg的PaO2/FiO2;和
(iii)重度ARDS:在至少5cm PEEP上的小于或等于100mmHg的PaO2/FiO2
在一个实例中,ARDS是轻度ARDS。在另一实例中,ARDS是中度ARDS。在另一实例中,ARDS是重度ARDS。
除了治疗现有的ARDS之外,本公开的方法还可以用于预防ARDS发作。因此,在一个实例中,受试者不具有ARDS。
试剂盒
本公开的另一实例提供了含有本公开的自我复制RNA的试剂盒,其用于治疗或预防如上所描述的疾病或疾患。
本公开的另一实例提供了含有本公开的cRNA的试剂盒,其用于治疗或预防如上所描述的疾病或疾患。
在一个实例中,试剂盒包含(a)包含任选地在递送系统中的自我复制RNA和/或药学上可接受的载体或稀释剂的容器;和(b)具有用于治疗或预防受试者中的疾病或疾患(例如,流感、COVID-19或ARDS)的说明书的包装插页。
在一个实例中,该试剂盒包含(a)包含任选地在递送系统中的cRNA和/或药学上可接受的载体或稀释剂的容器;和(b)具有用于治疗或预防受试者中的疾病或疾患(例如,流感、COVID-19或ARDS)的说明书的包装插页。
根据本公开的该实例,包装插页在容器上或与容器相关联。合适的容器包括,例如,瓶子、小瓶、注射器等。该容器可以由各种材料诸如玻璃或塑料形成。容器容纳或含有对本公开的疾病或疾患有效的组合物并且可以具有无菌接入端口(例如,容器可以是静脉内溶液袋或具有可被皮下注射针刺穿的塞子的小瓶)。组合物中的至少一种活性剂是自我复制RNA和/或cRNA。标签或包装插页指示该组合物用于治疗有资格接受治疗的受试者,例如具有或易患流感、流感病毒感染、SARS-CoV-2感染、COVID-19和/或ARDS的受试者,提供关于给药量和治疗间隔的特定指导和任何其它药物。该试剂盒可以进一步包含附加的容器,其包含药学上可接受的稀释缓冲液,诸如抑菌注射用水(BWFI)、磷酸盐缓冲盐水、林格氏溶液和/或右旋糖溶液。试剂盒可以进一步包括从商业和用户观点来看所期望的其它材料,包括其它缓冲液、稀释剂、过滤器、针和注射器。
本公开包括以下非限制性实例。
实例
实例1:自我复制RNA的生成
在用DNA质粒转化的感受态大肠杆菌细胞中产生编码自我复制RNA的DNA模板。分离单个细菌菌落,并且在大肠杆菌培养物中扩增所得质粒DNA。发酵后,使用Maxiprep DNA试剂盒分离质粒DNA并且通过限制性消化线性化。然后使用苯酚/氯仿提取和乙醇沉淀去除限制性酶。
使用T7 RNA聚合酶从线性化的DNA模板通过体外转录制备mRNA。随后,通过DNase消化去除DNA模板。用帽0进行酶加帽以提供功能mRNA。纯化得到的mRNA并且重悬于无核酸酶的水中。
使用来自A/火鸡/土耳其/1/2005的HA和NA亚型、来自A/加利福尼亚/2009的NS1和NP,以及来自PR8X的M1和M2制备自我复制RNA(图1A)。制备以下构建体:
●NSP1-4.SGP.H5.SGP.N1(F548)
●NSP1-4.SGP.N1.SGP.H5(F549)
●NSP1-4.SGP.H5.IRES.N1(F556)
●NSP1-4.SGP.N1.IRES.H5(F557)
●NSP1-4.SGP.H5.SGPv2.N1(F602)
●NSP1-4.SGP.H5.SGPv3.N1(F616)
●NSP1-4.SGP.H5.SGPv4.N1(F617)
●NSP1-4.SGP.H5.SGP.N1.SGP.M1(F554)
●NSP1-4.SGP.H5.SGP.NS1(F568)
●NSP1-4.SGP.NS1.SGP.HA(F569)
●NSP1-4.SGP.H5.SGP.M1(F576)
●NSP1-4.SGP.M1.SGPv2.NP(F620)
●NSP1-4.SGP.M1.SGP.N1.SGP.H5(F584)
●NSP1-4.SGP.M1.SGP.M2.SGP.N1.SGP.H5(F590)
SGPv2、v3和v4分别在5'处延伸12、31和52个碱基。图1B和1C绘示了上述构建体中5'-帽驱动的抗原表达。
实例2:自我复制RNA的体外表征
评估实例1中产生的自我复制RNA的目的第一和第二基因的表达。
将未配制(裸的)或LNP配制的自扩增mRNA构建体的两倍连续稀释电穿孔或转染到幼仓鼠肾(BHK)细胞系中。17至19小时后,收获细胞并且使用抗-HA、抗-NA、抗-NS1、抗-NP或抗-M1抗体染色HA、NA、NS1、NP或M1抗原表达。通过FACS测量抗原表达阳性的细胞数和平均荧光强度(MFI)。分析数据以计算特异性效力值(每单位质量RNA成功转染的概率),和未配制的RNA和LNP的MFI分别示于图2和3中。
基于抗原共表达通过FAC确定未配制的RNA和LNP的体外活性和效力并且示于下表1中:
表1:未配制的RNA和LNP的体外活性和效力
抗体应答
为了评估抗体应答,在研究结束时(即,第一次疫苗给药后42天或最后第二次疫苗给药后21天)收集血清,并且通过微量中和测定(图4)和血凝抑制测定(图5)进行测试。
对于所有血清学测定,用霍乱弧菌神经氨酸苷酶,也称为受体破坏酶(RDE)(日本东京生研公司(Denka Seiken Co.Ltd.,Tokyo,Japan))以相同方式处理血清,并且用PBS稀释至1:10的起始稀释度。绵羊血清对H5N1病毒(FDA/CBER肯辛顿批号H5-Ag-1115)被用作阳性对照血清,进行了三次测定。
微量中和测定
在合格的哺乳动物细胞系(专利33016-PF马丁达比狗肾(MDCK))中进行短和长形式的微量中和测定。
微量中和测定短形式(MN测定SF)
使用内部开发的方案进行基于病毒荧光灶的微量中和(FFA MN)测定。将RDE处理的测试小鼠样品和阳性对照血清进行热灭活,用PBS稀释至1:40的起始稀释度,并且使用U形底96孔板(BD Falcon)在中和培养基(由补充有1% BSA(Rockland,BSA-30)、100U/mL青霉素和100ug/mL链霉素(GIBCO)的极限必需培养基D-MEM(GIBCO)组成)中连续稀释四倍。将A/火鸡/土耳其/1/2005(H5N1)病毒在中和培养基中稀释至约1,000至1,500荧光病灶形成单位(FFU)/孔(20,000至30,000FFU/mL),并且以1:1的比率添加稀释的血清。
在37℃、5% CO2下孵育2小时后,将含有MDCK 33016-PF细胞的板(半面积96孔板,康宁公司(Corning))用该混合物接种并且在37℃下用5% CO2孵育过夜16至18小时。将MDCK 33016-PF细胞在6至8小时前以3.0E4/孔(3.0E6/板)接种在细胞生长培养基(由补充有10%胎牛血清-FBS(Gibco)、100U/mL青霉素和100ug/mL链霉素的D-MEM组成)中。过夜孵育后和免疫染色前,用丙酮和甲醇的冷混合物固定细胞。
使用对甲型流感病毒的核蛋白(NP)特异性的单克隆抗体(克隆A1、A3共混物,密理博(Millipore)目录号MAB8251)在室温下单独孵育1小时使病毒可视化并且将Alexa Fluor488山羊抗小鼠IgG(H+L)Ab(英杰公司(Invitrogen)目录号A11001)在含有0.05%吐温-20(西格玛公司(Sigma))和2% BSA(级分V,Calbiochem,2960,1194C175)的PBS缓冲液中稀释。NP病毒蛋白通过CTL免疫斑点分析仪(俄亥俄州克利夫兰谢克海茨蜂窝技术有限公司(Cellular Technology Limited,Shaker Heights,Cleveland,OH))定量,使用荧光素异硫氰酸酯(FITC)荧光过滤器,激发和发射波长为482和536nm。使用软件免疫斑点7.0.12.1专业分析仪DC,使用定制分析模块计数荧光灶。通过该软件将数据连续记录到Excel数据分析电子表格中,然后从病毒对照孔(对于每个板)的平均病灶计数计算60%病灶减少终点,并且通过在紧邻60%终点之上和之下的孔之间的线性内插法计算60%病灶减少中和滴度(对于每个样品)。
微量中和测定长形式(MN测定LF)
使用内部开发的方案进行MN测定LF。将RDE处理的测试小鼠样品和阳性对照血清进行热灭活,用PBS稀释至1:40的起始稀释度,并且使用U形底96孔板(BD Falcon)在中和培养基(由30%用过的生长培养基(Irvine Scientific)和70%感染性培养基(无蛋白质培养基-33016MDCK PFM;GIBCO)组成,补充有100U/mL青霉素、100ug/mL链霉素(GIBCO)和0.33ug/mL TPCK-胰蛋白酶(TPCK处理的,甲苯磺酰基苯丙氨酰氯甲基酮,西格玛))中连续稀释2倍。将A/火鸡/土耳其/1/2005(H5N1)病毒在中和培养基中稀释至每孔100TCID(组织培养感染剂量),并且以与稀释血清1:1的比率添加。将连续预稀释的血清样品与病毒一起孵育并且使其在37℃、5% CO2下反应1小时。在接种步骤中,用无菌PBS洗涤含有MDCK33016-PF细胞(其在无抗生素细胞生长培养基(Irvine Scientific)中在前一天以3.0E4/孔(3.0E6/板)接种)的板(Costar细胞培养96孔板),然后用该混合物感染并且在37℃下用5% CO2孵育1小时。通过抽吸抗体/病毒混合物停止感染,并且用含有两倍连续稀释的抗体的中和培养基(100ul/孔)接种用无菌PBS洗涤的细胞,然后在37℃下用5% CO2孵育5天。在最后的“读取”步骤中,使用0.5%火鸡红细胞(Lampire生物实验室)通过病毒的HA定量进行病毒的检测。没有感染性构成阳性中和反应,并且指示血清样品中存在病毒特异性抗体。
血凝抑制(HAI)测定
如先前所描述的进行HAI测定(WHO(2011)《流感实验室诊断和病毒学监测手册》:WHO出版社,世界卫生组织,瑞士1211日内瓦27的阿皮亚大道20号(20Avenue Appia,1211Geneva 27,Switzerland))。简言之,将RDE处理的测试小鼠样品和阳性对照血清进行热灭活,用PBS稀释至1:10的起始稀释度,并且将两倍连续稀释的样品(25μl)与等体积的A/火鸡/土耳其/1/2005(H5N1)的病毒(4血凝单位[HAU])在室温(RT)下孵育30分钟。然后,添加等体积的0.5%火鸡红细胞(Lampire生物实验室)并且在RT下孵育30分钟。HAI滴度表示为抑制血凝的样品的最高稀释度的倒数。
实例3:自我复制RNA诱导细胞介导的免疫应答
评估自我复制RNA诱导抗原特异性T细胞应答的能力。
对脾培养物进行抗原特异性T细胞检测。简言之,将脾细胞在解离溶液(1:20的MACS BSA原液与autoMACS水洗溶液)中解离,并且以4E7细胞/ml浓缩。简言之,在96孔板中在含有RPMI、NEAA、青霉素/链球菌(pen/strep)和βME的T细胞培养基中建立脾细胞培养物,并且在37℃/5% CO2下培养。将抗CD28(克隆37.51;BD生物科学号553294)和抗CD107a(克隆号1D4B;Biolegend号121618)添加到每个孔中。刺激或不刺激细胞培养物。为了刺激培养物NA pep mix(JPT肽技术公司(JPT Peptide Technologies GmbH);PM-INFA-NATur),添加HA pep mix(JPT肽技术公司;PM-INFA-HAIndo)。刺激后2小时,将高尔基体栓(Golgi Plug)(具有布雷菲德菌素A;BD生物科学号555029)添加到每个孔中。将细胞在37℃下孵育总共6小时,之后将细胞转移至4℃并储存过夜。
使用流式细胞术确定抗原特异性T细胞应答。简言之,将Fc阻断混合物(克隆2.4G2;BD生物科学号553142)添加到每个孔中,然后细胞外染色(包含亮色(Brilliant)染色缓冲液+(BD生物科学号566385)、ICOS BV711(克隆C398.4A;Biolegend号313548)、CD44BUV395(克隆IM7;BD生物科学号740215)、CD3 BV786(克隆145-2C11;BD生物科学号564379)、CD4 APC-H7(克隆GK1.5,BD生物科学号560181)、CD8 AF700(克隆53-6.7,BD生物科学号557959)和染色缓冲液)。根据制造商的方案,将细胞用UltraComp eBeads(eBiosciences号01-222-42)染色,并且在4℃下避光孵育30分钟。用染色缓冲液洗涤细胞,离心,重悬于染色缓冲液中,并且使用流式细胞仪获取数据。
抗原特异性CD4和CD8 T细胞应答示于图6。
实例4:对SARS-CoV-2的自我复制RNA
使用来自SARS-CoV-2株2019-nCoV/USA-WA1/2020的刺突(S)和核壳体(N)抗原,如上述实例1所描述的产生编码自我复制RNA的DNA模板。制备以下构建体:
●NSP1-4.SGP.S(RRAR→QQAA).SGPv2.N(Co18)
●NSP1-4.SGP.S(RRAR→QQAA).SGPv3.N(Co19)
基于S和N共表达通过FAC确定未配制的RNA和LNP的体外活性和效力并且示于下表2中:
表2:未配制的RNA和LNP的体外活性和效力
抗体应答
为了评估抗体应答,在研究结束时(即,在第一疫苗给药后42天或在最后第二疫苗给药后21天)收集血清,并且通过如以上实例2中所描述的微量中和测定进行测试。结果示出在图7A中。
还评估了ACE2结合的抑制。结果示出在图7B中。
还通过ELISA评估对N蛋白特异的抗体(表3)。
表3:对N蛋白的IgG ELISA
疫苗 IgG滴度(GMT)-1μg剂量 IgG滴度(GMT)–0.011μg剂量
Co18 30,016 2,412
Co19 68,290 2,947
IgG亚类
为了表征生成的免疫应答的类型,即Th1对Th2型应答,通过ELISA评价S特异性IgG1和IgG2a IgG亚类。另外,评估IgG1/IgG2a抗体的比率。观察到IgG1和IgG2a应答之间几乎没有差异(表4)。
表4:IgG亚类
载体 IgG1 ELISA GMT(1ug) IgG2a ELISA GMT(1ug)
Co18 22,777 45,844
细胞介导的免疫应答
如以上实例3所描述的,评估自我复制RNA诱导抗原特异性T细胞应答的能力。为了刺激培养物,添加N pep mix(跨越CoV-2全长N蛋白的氨基酸残基1至419)、S pep mix 1(跨越CoV-2全长S蛋白的氨基酸残基1至643)、S pep mix 2(跨越CoV-2全长S蛋白的氨基酸残基633至1273)、CoV-1S肽(CYGVSATKL)或CoV-2S肽(CYGVSPTKL)。
如上所描述的使用流式细胞术确定抗原特异性T细胞应答。
抗原特异性CD4和CD8 T细胞应答示于图8。
sa-mRNA疫苗引出的CD4 T细胞主要是Th0(IL2+和/或TNFa+、IFNg-、IL5-、IL13-)和Th1(IFNg+、IL5-、IL13-),很少或没有Th2(IL5+和/或IL13+、IFNg-)(图9)。发现S1-和S2-反应性CD4 T细胞的频率类似;然而,对于CD8 T细胞,S1反应性T细胞比S2反应性T细胞占优势,其具有广泛的细胞因子表型、产生CD8+T细胞的三重、双重和单一细胞因子。
实例5:用自我复制RNA免疫的保护作用
为了评价免疫的保护作用,在第1天和第22天用Co18以3μg RNA/仓鼠或0.3μgRNA/仓鼠的剂量免疫仓鼠。所有动物在第二次免疫后28天用SARS-CoV-2US病毒鼻内攻击并且在4天后处死,此时收集肺和鼻甲以测量肺和鼻甲中的感染性病毒。
在仓鼠中,3.0和0.3μg剂量分别将中和滴度GMT提高为422和190。
为了评价肺对病毒感染的保护作用,比较用Co18免疫的仓鼠和用PBS免疫的对照仓鼠肺的平均病毒回收率。虽然来自对照仓鼠的病毒滴度为5,011,872TCID50/gr,但是在测定的定量限之下来自疫苗免疫的仓鼠的平均病毒回收率<20TCID50/gr证明研究中包括的所有疫苗对下呼吸道的完全保护。
为了评价上呼吸道的保护作用,测量鼻甲的病毒回收率,其中对照仓鼠的平均病毒回收率为120,226,443TCID50/gr。用Co18免疫的仓鼠分别在3.0和0.3μg的剂量下,病毒滴度降低了5x103至104倍,达到14,454和21,878TCID50/gr。这些结果证明sa-mRNA S-N显著降低上呼吸道中的病毒感染。
实例6:用自我复制RNA对SARS-CoV-2进行双重给药
SARS-CoV-2S和N抗原不是免疫交叉反应性的。为了评价临床前动物模型中的抗体免疫应答,在第0天用1μg剂量免疫雌性BALB/c小鼠,在第21天用第二剂量免疫雌性BALB/c小鼠。在第42天处死动物并且获得血清以测试中和抗体以及抑制S蛋白与ACE2受体结合的抗体。
在本研究中,也使用了单顺反子构建体Co6(包含对SARS-CoV-2N蛋白的抗原)和Co16(包含对SARS-CoV-2S蛋白的抗原)。
评估以下第一至第二剂量组合:
●PBS-Co18
●Co6-Co18
●Co16-Co18
●Co18-Co18
S和N蛋白抗体
在第42天通过ELISA评估对S和N蛋白特异的抗体。结果示出在表5中。
表5:初免-加强免疫后的S蛋白抗体
初免 加强免疫 对S蛋白的IgG滴度(GMT) 对N蛋白的IgG滴度(GMT)
PBS Co18 23501 13698
Co6 Co18 12882 962935
Co16 Co18 499397 926
Co18 Co18 991719 114006
Co18 Co6 33365 5134679
Co18 Co16 856424 8961
Co18 PBS 28537 500
就抗S应答而言,同源初免/加强免疫(即Co18-Co18)比异源初免-加强免疫更有效,然而就抗N应答而言,异源初免-加强免疫(即Co18-Co6)比同源初免-加强免疫更有效。
在没有加强免疫的情况下,抗S抗体从第21天增加到第42天(数据未示出)。
ACE2结合的抑制
还评估了ACE2结合的抑制。结果示出在表6中。
表6:ACE2结合的抑制
微量中和测定
还评估了WT病毒中和。结果示出在表7中。
表7:WT病毒中和
初免 加强免疫 MN滴度(GMT)
PBS Co18 43
Co6 Co18 15
Co16 Co18 1493
Co18 Co18 1280
Co18 Co6 92
Co18 Co16 1372
Co18 PBS 98
细胞介导的免疫应答
还评估了抗原特异性T细胞应答。在用同源和异源抗原接种后观察到CD4和CD8 T细胞应答。
实例7:双顺反子自我复制RNA疫苗诱导免疫应答
如实例1所描述的生成抗流感的双顺反子构建体。生成了以下构建体:
●NSP1-4.SGP.H5.SGPv2.N1(F602)
●NSP1-4.SGP.M1.SGPv2.NP(F620)
疫苗的体外活性和效力示出在表7中。双顺反子活性和效力值基于F620和H5的M1和NP共表达以及F602的N1共表达。
表7:体外活性和效力
构建体 抗原 RNA活性(ng-1) LNP效力(ng-1)
F620 M1-NP 114 6040
F602 H5-N1 115 5298
疫苗制剂的特征示出在表8中。
表8:LNP制剂的生物物理表征
*第一剂量;#第二剂量
为了评价临床前动物模型中的抗体免疫应答,在第0天用0.1μg或0.001μg的剂量免疫小鼠,在第21天用第二剂量免疫小鼠。评估以下第一至第二剂量组合:
初免 加强免疫
F620 F620
F602 F602
F620+F602 F620+F602
为了评估抗体应答,在研究结束时(即,在第一疫苗给药后42天或在最后第二疫苗给药后21天)收集血清,并且通过如以上实例2中所描述的微量中和测定进行测试。所有构建体诱导病毒特异性抗体。
如通过ELISA评估的,所有构建体生成对N蛋白特异的抗体。
还评估了抗原特异性T细胞应答。接种后观察到NP和M1 CD4和NP CD8 T细胞特异性应答。M1 CD8特异性T细胞应答有限。
实例8:SGP和IRES对目的第二抗原的调节
当目的抗原受插入的spgv2启动子或IRES元件调节时,评估抗原特异性T细胞。
评估以下构建体:
●NSP1-4.SGP.H5.IRES.N1(F556)
●NSP1-4.SGP.N1.IRES.H5(F557)
●NSP1-4.SGP.H5.SGPv2.N1(F602)
●NSP1-4.SGP.N1.SGPv2.H5(F632)
将这些构建体与在天然SGP控制下的单顺反子N1和H5构建体进行比较。
简言之,BALB/c小鼠接种两次(第0天和第21天)并且在第42天(第2次接种后3周)安乐死。收集脾脏,汇集并且使用体外抗原刺激/细胞内细胞因子免疫荧光流式细胞术测定来测定抗原特异性CD4和CD8 T细胞。定量产生细胞因子(IL-2、IFN-g、TNF-a、IL-5、IL-13中的一种或多种)的%CD4或CD8 T细胞。
如表9和10所示,在两种剂量和两种调节元件下分别观察到H5特异性CD8和CD4T细胞。看起来0.01mcg RNA足以诱导最大的H5特异性CD4频率。
表9.第2次接种后3周BALB/c小鼠脾脏中的H5特异性CD8 T细胞
/>
b测量精度
表10.第2次接种后3周BALB/c小鼠脾脏中的H5特异性CD4 T细胞
b测量精度
如表11和12所示,在两种剂量和两种调节元件下分别观察到N1特异性CD8和CD4 T细胞。
表11.第2次接种后3周BALB/c小鼠脾脏中的N1特异性CD8 T细胞
b测量精度
表12.第2次接种后3周BALB/c小鼠脾脏中的N1特异性CD4 T细胞
b测量精度
总之,对于sgpv2构建体(F602和F632)和IRES构建体(F556和F557),当目的抗原被插入的spgv2启动子或IRES元件调节时,观察到更高频率的抗原特异性T细胞。
实例9:双顺反子构建体中的基因顺序对抗原特异性CD4 T细胞的频率影响很小或没有影响
评估了使用SGPv2的双顺反子构建体中的基因顺序对免疫应答的影响。
简言之,如先前所描述的制备以下构建体:
●NSP1-4.SGP.H5.SGPv2.N1(F602)
●NSP1-4.SGP.N1.SGPv2.H5(F632)
●NSP1-4.SGP.H3.SGPv2.N2(F629)
●NSP1-4.SGP.N2.SGPv2.H3(F703)
●NSP1-4.SGP.Hyam.SGPv2.Nyam(F631)
●NSP1-4.SGP.Nyam.SGPv2.Hyam(F695)
H5和N1抗原衍生自A/火鸡/土耳其/01/2005。H3和N2抗原衍生自A/特拉华州/39/2019。Hyam和Nyam[B/山形]衍生自B/新加坡/INFTT 16 0610/16(By)。
将这些构建体与在天然SGP控制下的单顺反子N1和H5构建体进行比较。
简言之,BALB/c小鼠接种两次(第0天和第21天)并且在第42天(第2次接种后3周)安乐死。收集脾脏,汇集并且使用体外抗原刺激/细胞内细胞因子免疫荧光流式细胞术测定来测定抗原特异性CD4和CD8 T细胞。定量产生细胞因子(IL-2、IFN-g、TNF-a、IL-5、IL-13中的一种或多种)的%CD4或CD8 T细胞。还进行了中和和抗原特异性ELISA。
如图10A所示,用sa-mRNA免疫诱导主要的Th0或Th1应答。几乎没有或没有混合应答。免疫诱导对同源抗原而不是异源抗原的应答。两种剂量(即1μg和0.01μg)诱导类似CD4应答。
如图10B所示,sa-mRNA载体诱导针对匹配抗原的CD8应答,H3N2除外。
如图10C和D所示,NA-HA基因顺序导致对H5的较高频率CD4应答和对H5、N1和B/山形的较高频率CD8应答。
还在抗HA IgG ELISA、血凝抑制(HAI)测定、假病毒微量中和测定和抗NA抑制测定中对所有构建体中进行血清学评估。所有构建体在所有测定中诱导血清抗体应答。
序列表
<110> Seqirus公司
<120> 多顺反子RNA疫苗及其用途
<130> 532713PCT
<150> US 63/120,362
<151> 2020-12-02
<160> 62
<170> 专利版本3.5
<210> 1
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 甲病毒天然亚基因组启动子的核苷酸序列
<400> 1
ctctctacgg ctaacctgaa tggactacga catagtctag tccgccaag 49
<210> 2
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 延伸的亚基因组启动子(v2)的核苷酸序列
<400> 2
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 60
g 61
<210> 3
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 延伸的亚基因组启动子(v3)的核苷酸序列
<400> 3
tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 60
acatagtcta gtccgccaag 80
<210> 4
<211> 575
<212> DNA
<213> 人工序列
<220>
<223> 野生型EMCV IRES的核苷酸序列
<400> 4
cccccccccc taacgttact ggccgaagcc gcttggaata aggccggtgt gcgtttgtct 60
atatgttatt ttccaccata ttgccgtctt ttggcaatgt gagggcccgg aaacctggcc 120
ctgtcttctt gacgagcatt cctaggggtc tttcccctct cgccaaagga atgcaaggtc 180
tgttgaatgt cgtgaaggaa gcagttcctc tggaagcttc ttgaagacaa acaacgtctg 240
tagcgaccct ttgcaggcag cggaaccccc cacctggcga caggtgcctc tgcggccaaa 300
agccacgtgt ataagataca cctgcaaagg cggcacaacc ccagtgccac gttgtgagtt 360
ggatagttgt ggaaagagtc aaatggctct cctcaagcgt attcaacaag gggctgaagg 420
atgcccagaa ggtaccccat tgtatgggat ctgatctggg gcctcggtgc acatgcttta 480
catgtgttta gtcgaggtta aaaaacgtct aggccccccg aaccacgggg acgtggtttt 540
cctttgaaaa acacgatgat aatatggcca caacc 575
<210> 5
<211> 1692
<212> DNA
<213> 人工序列
<220>
<223> 甲型流感病毒H5血凝素亚型的核苷酸序列
<400> 5
atggagaaaa tagtgcttct tcttgcaata gtcagccttg ttaaaagtga tcagatttgc 60
attggttacc atgcaaacaa ctcgacagag caggttgaca caataatgga aaagaacgtc 120
actgttacac acgcccaaga catactggaa aagacacaca acgggaaact ctgcgatcta 180
gatggagtga agcctctaat tttaagagat tgtagtgtag ctggatggct cctcgggaac 240
ccaatgtgtg acgaattcct caatgtgccg gaatggtctt acatagtgga gaagatcaat 300
ccagccaatg acctctgtta cccagggaat ttcaacgact atgaagaact gaaacaccta 360
ttgagcagaa taaaccattt tgagaaaatt cagatcatcc ccaaaagttc ttggtcagat 420
catgaagcct cagcaggggt gagctcagca tgtccatacc agggaaggtc ctcctttttt 480
agaaatgtgg tatggcttat caaaaaggac aatgcatacc caacaataaa gagaagttac 540
aataatacca accaagaaga tcttttggta ttgtggggga ttcaccatcc aaatgatgcg 600
gcagagcaga caaggctcta tcaaaaccca actacctata tttccgttgg gacatcaaca 660
ctaaaccaga gattggtacc aaaaatagcc actagatcta aggtaaacgg gcaaagtgga 720
aggatggagt tcttttggac aattttaaaa ccgaatgatg caataaactt tgagagtaat 780
ggaaatttca ttgctccaga aaatgcatac aaaattgtca agaaagggga ctcaacaatt 840
atgaaaagtg agttggaata tggtaactgc aacaccaagt gtcaaactcc aataggggcg 900
ataaactcta gtatgccatt ccacaacatc caccctctca ccatcgggga atgccccaaa 960
tatgtgaaat caagcagatt agtccttgct actgggctca gaaatagccc tcaacgagag 1020
acacgaggac tatttggagc tatagcaggt tttatagagg gaggatgggg aatggtagat 1080
ggttggtatg ggtaccacca tagcaacgag caggggagtg ggtacgctgc agacaaagaa 1140
tccactcaaa aggcaataga tggagtcacc aataaggtca actcgatcat tgacaaaatg 1200
aacactcagt ttgaggctgt tggaagggaa tttaataact tagaaaggag aatagaaaat 1260
ttaaacaaga agatggaaga cggattccta gatgtctgga cttataatgc tgaacttctg 1320
gttctcatgg aaaatgagag aactctagac tttcatgact caaatgtcaa gaacctttac 1380
gacaaggtcc gactacagct tagggataat gcaaaggagc ttggtaacgg ttgtttcgag 1440
ttctatcaca gatgtgataa tgaatgtatg gaaagtgtaa gaaacggaac gtatgactac 1500
ccgcagtatt cagaagaagc aagattaaaa agagaggaaa taagtggagt aaaattggaa 1560
tcaataggaa cttaccaaat actgtcaatt tattcaacag tggcgagctc cctagcactg 1620
gcaatcatgg tggctggtct atctttatgg atgtgctcca atggatcgtt acaatgcaga 1680
atttgcattt aa 1692
<210> 6
<211> 1350
<212> DNA
<213> 人工序列
<220>
<223> 甲型流感病毒N1神经氨酸苷酶亚型的核苷酸序列
<400> 6
atgaatccaa atcagaagat aataaccatc ggatcaatct gtatggtaat tggaatagtt 60
agcttaatgt tacaaattgg gaacatgatc tcaatatggg tcagtcattc aattcagaca 120
gggaatcaat gccaagctga accaatcagc aatactaaat ttcttactga gaaagctgtg 180
gcttcagtaa cattagcggg caattcatct ctttgcccca ttagcggatg ggctgtatac 240
agtaaggaca acagtataag gatcggttcc aggggggatg tgtttgttat aagagagccg 300
ttcatctcat gctcccactt ggaatgcaga actttctttt tgactcaggg agccttgctg 360
aatgacaagc actccaatgg gactgtcaaa gacagaagcc ctcacagaac attaatgagt 420
tgtcctgtgg gtgaggctcc ctccccatat aactcaaggt ttgagtctgt tgcttggtca 480
gcaagtgctt gccatgatgg caccagttgg ttgacaattg gaatttctgg tccagacaat 540
ggggctgtgg ctgtattgaa atacaatggc ataataacag acaccatcaa gagttggagg 600
aacaacatac tgagaactca agagtctgaa tgtgcatgtg taaatggctc ttgctttact 660
gtaatgactg atggaccaag tagtgggcag gcatcatata agatcttcaa aatggaaaaa 720
gggaaagtgg ttaaatcagt cgaattggat gctcctaatt atcactatga ggagtgctcc 780
tgttatcctg atgccggcga aatcacatgt gtgtgcaggg ataattggca tggctcaaat 840
aggccatggg tatctttcaa tcaaaatttg gagtatcaaa taggatatat atgcagtgga 900
gttttcggag acaatccacg ccccaatgat ggaacaggta gttgtggtcc ggtgttctct 960
aacggggcat atggggtaaa agggttttca ttcaaatacg gcaatggtgt ttggatcggg 1020
agaaccaaaa gcactaattc caggagcggc tttgaaatga tttgggaccc aaatgggtgg 1080
actggaacgg acagtagctt ttcggtgaag caagatatcg tagcaataac tgattggtca 1140
ggatatagcg ggagttttgt ccagcatcca gaactgacag gattagattg cataagacct 1200
tgtttctggg ttgagttaat cagagggcgg cctaaagaga gcacaatttg gaccagtggg 1260
agcagcatat ctttttgtgg tgtaaatagt gacactgtta gttggtcttg gccagacggt 1320
gctgagttgc cattcaccat tgacaagtag 1350
<210> 7
<211> 1260
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2核壳体(N)蛋白的核苷酸序列
<400> 7
atgagcgaca acggacctca gaaccagaga aatgccccta gaatcacctt tggcggacct 60
agcgacagca ccggcagcaa ccagaatggc gagagaagcg gcgccagatc taagcagcgg 120
cgtccacagg gactgcccaa caacaccgcc agctggttca ccgccctcac ccagcacggc 180
aaagaggacc tgaagttccc ccggggacag ggcgtgccaa tcaacacaaa ctctagcccc 240
gacgaccaga tcggctacta tagacgggcc accagaagga tcagaggagg tgatggcaag 300
atgaaggacc tgagccctag atggtacttc tactacctgg gcacaggccc agaagccggc 360
ctgccttacg gcgccaacaa ggacggcatc atctgggtcg ccaccgaggg cgctctcaac 420
acccctaagg accacattgg aactcggaac cccgctaata acgccgctat cgtgctgcag 480
ctgcctcagg gcacgaccct gcccaagggc ttctacgccg aaggcagcag aggcggcagc 540
caggcctcta gccggtccag ctctcggagc agaaacagca gcagaaactc cacccctggc 600
agcagccgcg gcaccagccc cgccagaatg gccggaaatg gcggcgatgc cgctctggcc 660
ctgctgctgc tggatagact gaaccagctg gaatccaaga tgtctggcaa gggccagcag 720
caacagggcc agaccgtgac caagaaaagc gcagctgaag cctctaaaaa acctcggcag 780
aagcggaccg ccacaaaggc ttacaacgtg acacaggcct ttggcagaag aggacctgag 840
cagacacagg gcaacttcgg cgaccaggag ctgatccggc agggcacaga ctacaagcat 900
tggcctcaga tcgcccagtt cgcccctagt gccagcgcct tcttcggcat gagccggatc 960
ggcatggaag tgacccctag cggcacatgg ctgacctaca ccggcgccat caagctggac 1020
gataaggacc ccaattttaa ggaccaagtg atcctgctga acaagcacat cgacgcctat 1080
aagaccttcc cacctacaga gcctaagaaa gataagaaaa agaaggccga cgagacacaa 1140
gccctgcccc agagacagaa aaagcaacaa acagtgaccc tgctgcctgc cgctgatctg 1200
gatgacttca gcaagcagct gcagcaatct atgagctccg ccgatagcac ccaggcctga 1260
<210> 8
<211> 3822
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2刺突(S)蛋白的核苷酸序列
<400> 8
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgac 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc gggacctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgctggccc tgcaccggag ctacctgacc cccggcgaca gcagcagcgg ctggaccgcc 780
ggcgctgccg cctattacgt gggctacctg caacctagaa ccttcctgct gaaatacaac 840
gagaacggca caatcaccga cgccgtggac tgtgccctgg accccctgtc tgagacaaag 900
tgtaccctga agtctttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcctacag aatctatagt gcggttccct aacatcacca acctgtgtcc ttttggcgag 1020
gtgttcaacg ccactcggtt cgcctctgtc tacgcctgga accggaaacg gatctctaat 1080
tgcgtggccg attacagcgt cctgtataac tccgccagtt tcagcacatt caagtgctac 1140
ggcgtgtcac ccaccaagct gaacgatctg tgcttcacca atgtgtacgc cgatagtttc 1200
gtgatccggg gcgatgaggt gcggcagatc gcccctggac agacaggcaa gatcgccgac 1260
tacaactaca agctgcctga cgacttcaca ggctgtgtga tcgcatggaa cagcaacaac 1320
ctggacagca aggtgggcgg aaactacaac tacctgtaca gactgttcag aaagtccaac 1380
ctgaagcctt tcgagagaga tatatctacc gagatctacc aggccggcag cacaccctgt 1440
aatggagtgg aaggctttaa ctgctacttc cctctgcaaa gctatggatt tcaacctaca 1500
aatggggttg gctaccagcc ttacagagtg gtggtcctta gcttcgagct gctccatgcc 1560
cctgccaccg tgtgcggacc taagaagtcc accaacctgg tgaaaaacaa gtgcgtgaac 1620
tttaatttta acggcctgac cggaacagga gtgctgacag aaagcaacaa aaagttcctg 1680
cctttccagc agttcggcag agacattgcc gacaccacag atgctgttag agacccccag 1740
acgctggaaa tcctggatat caccccctgc tcttttggcg gcgtgagcgt gatcacccca 1800
ggcacaaaca caagcaacca ggtggctgtg ctgtaccagg acgtgaactg tacagaggtc 1860
cctgtggcaa tccacgccga tcagctgacc cctacatggc gggtgtactc cactggatct 1920
aacgtgttcc agacaagggc cggatgcctc atcggcgctg agcacgtgaa caattcttac 1980
gagtgcgaca tccctattgg agcgggcatc tgcgccagct accagacaca gaccaatagc 2040
cctcgcagag ccagaagcgt ggcctcccag agcatcatcg cctacaccat gagcctggga 2100
gccgagaact ctgtggccta cagcaacaac agcatcgcta tccctaccaa cttcaccatc 2160
tctgtcacca ccgaaatcct gcccgtcagt atgaccaaaa ccagcgtcga ctgcaccatg 2220
tacatatgcg gcgatagcac cgaatgcagc aacctgctgc tgcagtatgg ctccttctgc 2280
acccaactta acagagccct gactggcatc gccgtggagc aggacaagaa tacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acacccccga tcaaggactt cggcggcttt 2400
aatttctctc agatcctgcc agacccatct aaaccctcta agcggagctt tatcgaggac 2460
ctgctgttca acaaggtgac tctggctgac gccggcttca tcaagcagta cggcgattgc 2520
ctgggcgaca ttgctgctag agacctgatc tgtgcccaga aattcaacgg tcttactgtg 2580
ctgcctcctc tgctgacgga tgagatgatc gcccagtaca ccagcgccct gctggccggc 2640
accatcacat ccggctggac attcggcgcc ggcgcagccc tgcagatccc ttttgccatg 2700
cagatggcct accggttcaa cggaatcgga gtgacacaga acgtgctcta cgaaaatcag 2760
aagttgatcg ccaaccagtt caacagcgcc atcggcaaga ttcaggatag tctgagttcc 2820
accgccagcg ccctgggaaa gctgcaggac gtggtcaatc agaatgccca agccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gctctgtgct gaacgacatc 2940
ctgagtagac tggacaaggt ggaagccgaa gtgcagatcg acagattgat caccggaaga 3000
ctgcaaagcc tgcagaccta cgtgacccag cagctgataa gagctgctga aatcagagcc 3060
agcgctaatc tggccgctac caagatgagc gagtgcgttc tgggccagtc taagagagtg 3120
gacttctgcg gaaaaggcta ccacctgatg tcctttcctc agtctgcccc ccacggcgtg 3180
gtgttcctgc acgtcacata cgtgcccgct caagagaaaa acttcaccac ggcccctgcc 3240
atctgtcacg acggcaaggc ccacttcccc agagagggcg tgttcgtgag caatggcacc 3300
cactggtttg tgactcagag aaacttctac gagccacaga ttatcaccac agataacacc 3360
ttcgtgtctg gcaactgcga cgtggtgatc ggcatcgtca acaacacagt gtacgaccca 3420
ctgcaacctg agctggactc attcaaggag gaactggata agtacttcaa gaatcacacc 3480
agccccgacg ttgacctggg cgacatcagc ggcattaacg cctctgtggt caacatccag 3540
aaggaaatcg acagactgaa tgaggtggcc aagaatttga acgagagcct gattgatctg 3600
caggagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatctg gctgggcttc 3660
atcgccgggc tgatcgccat cgttatggtg acaatcatgc tgtgttgcat gacaagctgt 3720
tgtagctgcc tgaaaggctg ctgctcctgc ggcagctgtt gcaagtttga cgaagatgac 3780
agcgagcccg tgctgaaagg cgtcaagctg cactacacct ga 3822
<210> 9
<211> 3822
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2修饰的刺突(S)蛋白的核苷酸序列
<400> 9
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgac 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc gggacctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgctggccc tgcaccggag ctacctgacc cccggcgaca gcagcagcgg ctggaccgcc 780
ggcgctgccg cctattacgt gggctacctg caacctagaa ccttcctgct gaaatacaac 840
gagaacggca caatcaccga cgccgtggac tgtgccctgg accccctgtc tgagacaaag 900
tgtaccctga agtctttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcctacag aatctatagt gcggttccct aacatcacca acctgtgtcc ttttggcgag 1020
gtgttcaacg ccactcggtt cgcctctgtc tacgcctgga accggaaacg gatctctaat 1080
tgcgtggccg attacagcgt cctgtataac tccgccagtt tcagcacatt caagtgctac 1140
ggcgtgtcac ccaccaagct gaacgatctg tgcttcacca atgtgtacgc cgatagtttc 1200
gtgatccggg gcgatgaggt gcggcagatc gcccctggac agacaggcaa gatcgccgac 1260
tacaactaca agctgcctga cgacttcaca ggctgtgtga tcgcatggaa cagcaacaac 1320
ctggacagca aggtgggcgg aaactacaac tacctgtaca gactgttcag aaagtccaac 1380
ctgaagcctt tcgagagaga tatatctacc gagatctacc aggccggcag cacaccctgt 1440
aatggagtgg aaggctttaa ctgctacttc cctctgcaaa gctatggatt tcaacctaca 1500
aatggggttg gctaccagcc ttacagagtg gtggtcctta gcttcgagct gctccatgcc 1560
cctgccaccg tgtgcggacc taagaagtcc accaacctgg tgaaaaacaa gtgcgtgaac 1620
tttaatttta acggcctgac cggaacagga gtgctgacag aaagcaacaa aaagttcctg 1680
cctttccagc agttcggcag agacattgcc gacaccacag atgctgttag agacccccag 1740
acgctggaaa tcctggatat caccccctgc tcttttggcg gcgtgagcgt gatcacccca 1800
ggcacaaaca caagcaacca ggtggctgtg ctgtaccagg acgtgaactg tacagaggtc 1860
cctgtggcaa tccacgccga tcagctgacc cctacatggc gggtgtactc cactggatct 1920
aacgtgttcc agacaagggc cggatgcctc atcggcgctg agcacgtgaa caattcttac 1980
gagtgcgaca tccctattgg agcgggcatc tgcgccagct accagacaca gaccaatagc 2040
cctcagcaag ccgctagcgt ggcctcccag agcatcatcg cctacaccat gagcctggga 2100
gccgagaact ctgtggccta cagcaacaac agcatcgcta tccctaccaa cttcaccatc 2160
tctgtcacca ccgaaatcct gcccgtcagt atgaccaaaa ccagcgtcga ctgcaccatg 2220
tacatatgcg gcgatagcac cgaatgcagc aacctgctgc tgcagtatgg ctccttctgc 2280
acccaactta acagagccct gactggcatc gccgtggagc aggacaagaa tacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acacccccga tcaaggactt cggcggcttt 2400
aatttctctc agatcctgcc agacccatct aaaccctcta agcggagctt tatcgaggac 2460
ctgctgttca acaaggtgac tctggctgac gccggcttca tcaagcagta cggcgattgc 2520
ctgggcgaca ttgctgctag agacctgatc tgtgcccaga aattcaacgg tcttactgtg 2580
ctgcctcctc tgctgacgga tgagatgatc gcccagtaca ccagcgccct gctggccggc 2640
accatcacat ccggctggac attcggcgcc ggcgcagccc tgcagatccc ttttgccatg 2700
cagatggcct accggttcaa cggaatcgga gtgacacaga acgtgctcta cgaaaatcag 2760
aagttgatcg ccaaccagtt caacagcgcc atcggcaaga ttcaggatag tctgagttcc 2820
accgccagcg ccctgggaaa gctgcaggac gtggtcaatc agaatgccca agccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gctctgtgct gaacgacatc 2940
ctgagtagac tggacaaggt ggaagccgaa gtgcagatcg acagattgat caccggaaga 3000
ctgcaaagcc tgcagaccta cgtgacccag cagctgataa gagctgctga aatcagagcc 3060
agcgctaatc tggccgctac caagatgagc gagtgcgttc tgggccagtc taagagagtg 3120
gacttctgcg gaaaaggcta ccacctgatg tcctttcctc agtctgcccc ccacggcgtg 3180
gtgttcctgc acgtcacata cgtgcccgct caagagaaaa acttcaccac ggcccctgcc 3240
atctgtcacg acggcaaggc ccacttcccc agagagggcg tgttcgtgag caatggcacc 3300
cactggtttg tgactcagag aaacttctac gagccacaga ttatcaccac agataacacc 3360
ttcgtgtctg gcaactgcga cgtggtgatc ggcatcgtca acaacacagt gtacgaccca 3420
ctgcaacctg agctggactc attcaaggag gaactggata agtacttcaa gaatcacacc 3480
agccccgacg ttgacctggg cgacatcagc ggcattaacg cctctgtggt caacatccag 3540
aaggaaatcg acagactgaa tgaggtggcc aagaatttga acgagagcct gattgatctg 3600
caggagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatctg gctgggcttc 3660
atcgccgggc tgatcgccat cgttatggtg acaatcatgc tgtgttgcat gacaagctgt 3720
tgtagctgcc tgaaaggctg ctgctcctgc ggcagctgtt gcaagtttga cgaagatgac 3780
agcgagcccg tgctgaaagg cgtcaagctg cactacacct ga 3822
<210> 10
<211> 13283
<212> DNA
<213> 人工序列
<220>
<223> 构建体F548的核苷酸序列
<400> 10
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggagaaa atagtgcttc ttcttgcaat agtcagcctt gttaaaagtg atcagatttg 7620
cattggttac catgcaaaca actcgacaga gcaggttgac acaataatgg aaaagaacgt 7680
cactgttaca cacgcccaag acatactgga aaagacacac aacgggaaac tctgcgatct 7740
agatggagtg aagcctctaa ttttaagaga ttgtagtgta gctggatggc tcctcgggaa 7800
cccaatgtgt gacgaattcc tcaatgtgcc ggaatggtct tacatagtgg agaagatcaa 7860
tccagccaat gacctctgtt acccagggaa tttcaacgac tatgaagaac tgaaacacct 7920
attgagcaga ataaaccatt ttgagaaaat tcagatcatc cccaaaagtt cttggtcaga 7980
tcatgaagcc tcagcagggg tgagctcagc atgtccatac cagggaaggt cctccttttt 8040
tagaaatgtg gtatggctta tcaaaaagga caatgcatac ccaacaataa agagaagtta 8100
caataatacc aaccaagaag atcttttggt attgtggggg attcaccatc caaatgatgc 8160
ggcagagcag acaaggctct atcaaaaccc aactacctat atttccgttg ggacatcaac 8220
actaaaccag agattggtac caaaaatagc cactagatct aaggtaaacg ggcaaagtgg 8280
aaggatggag ttcttttgga caattttaaa accgaatgat gcaataaact ttgagagtaa 8340
tggaaatttc attgctccag aaaatgcata caaaattgtc aagaaagggg actcaacaat 8400
tatgaaaagt gagttggaat atggtaactg caacaccaag tgtcaaactc caataggggc 8460
gataaactct agtatgccat tccacaacat ccaccctctc accatcgggg aatgccccaa 8520
atatgtgaaa tcaagcagat tagtccttgc tactgggctc agaaatagcc ctcaacgaga 8580
gacacgagga ctatttggag ctatagcagg ttttatagag ggaggatggg gaatggtaga 8640
tggttggtat gggtaccacc atagcaacga gcaggggagt gggtacgctg cagacaaaga 8700
atccactcaa aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat 8760
gaacactcag tttgaggctg ttggaaggga atttaataac ttagaaagga gaatagaaaa 8820
tttaaacaag aagatggaag acggattcct agatgtctgg acttataatg ctgaacttct 8880
ggttctcatg gaaaatgaga gaactctaga ctttcatgac tcaaatgtca agaaccttta 8940
cgacaaggtc cgactacagc ttagggataa tgcaaaggag cttggtaacg gttgtttcga 9000
gttctatcac agatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta 9060
cccgcagtat tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga 9120
atcaatagga acttaccaaa tactgtcaat ttattcaaca gtggcgagct ccctagcact 9180
ggcaatcatg gtggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag 9240
aatttgcatt taactctcta cggctaacct gaatggacta cgacatagtc tagtccgcca 9300
agatgaatcc aaatcagaag ataataacca tcggatcaat ctgtatggta attggaatag 9360
ttagcttaat gttacaaatt gggaacatga tctcaatatg ggtcagtcat tcaattcaga 9420
cagggaatca atgccaagct gaaccaatca gcaatactaa atttcttact gagaaagctg 9480
tggcttcagt aacattagcg ggcaattcat ctctttgccc cattagcgga tgggctgtat 9540
acagtaagga caacagtata aggatcggtt ccagggggga tgtgtttgtt ataagagagc 9600
cgttcatctc atgctcccac ttggaatgca gaactttctt tttgactcag ggagccttgc 9660
tgaatgacaa gcactccaat gggactgtca aagacagaag ccctcacaga acattaatga 9720
gttgtcctgt gggtgaggct ccctccccat ataactcaag gtttgagtct gttgcttggt 9780
cagcaagtgc ttgccatgat ggcaccagtt ggttgacaat tggaatttct ggtccagaca 9840
atggggctgt ggctgtattg aaatacaatg gcataataac agacaccatc aagagttgga 9900
ggaacaacat actgagaact caagagtctg aatgtgcatg tgtaaatggc tcttgcttta 9960
ctgtaatgac tgatggacca agtagtgggc aggcatcata taagatcttc aaaatggaaa 10020
aagggaaagt ggttaaatca gtcgaattgg atgctcctaa ttatcactat gaggagtgct 10080
cctgttatcc tgatgccggc gaaatcacat gtgtgtgcag ggataattgg catggctcaa 10140
ataggccatg ggtatctttc aatcaaaatt tggagtatca aataggatat atatgcagtg 10200
gagttttcgg agacaatcca cgccccaatg atggaacagg tagttgtggt ccggtgttct 10260
ctaacggggc atatggggta aaagggtttt cattcaaata cggcaatggt gtttggatcg 10320
ggagaaccaa aagcactaat tccaggagcg gctttgaaat gatttgggac ccaaatgggt 10380
ggactggaac ggacagtagc ttttcggtga agcaagatat cgtagcaata actgattggt 10440
caggatatag cgggagtttt gtccagcatc cagaactgac aggattagat tgcataagac 10500
cttgtttctg ggttgagtta atcagagggc ggcctaaaga gagcacaatt tggaccagtg 10560
ggagcagcat atctttttgt ggtgtaaata gtgacactgt tagttggtct tggccagacg 10620
gtgctgagtt gccattcacc attgacaagt agggcgcgcc cacccagcgg ccgcccgcta 10680
cgccccaatg atccgaccag caaaactcga tgtacttccg aggaactgat gtgcataatg 10740
catcaggctg gtacattaga tccccgctta ccgcgggcaa tatagcaaca ctaaaaactc 10800
gatgtacttc cgaggaagcg cagtgcataa tgctgcgcag tgttgccaca taaccactat 10860
attaaccatt tatctagcgg acgccaaaaa ctcaatgtat ttctgaggaa gcgtggtgca 10920
taatgccacg cagcgtctgc ataactttta ttatttcttt tattaatcaa caaaattttg 10980
tttttaacat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaagagcgtt 11040
taaacacgtg atatctggcc tcatgggcct tcctttcact gcccgctttc cagtcgggaa 11100
acctgtcgtg ccagctgcat taacatggtc atagctgttt ccttgcgtat tgggcgctct 11160
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg ggtaaagcct ggggtgccta 11220
atgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 11280
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 11340
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 11400
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 11460
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 11520
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 11580
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 11640
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 11700
ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 11760
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 11820
ttttgtttgc aggcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 11880
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 11940
gaatacacgg tgcctgactg cgttagcaat ttaactgtga taaactaccg cattaaagct 12000
tatcgatgat aagctgtcaa acatgagaat tcttagaaaa actcatcgag catcaaatga 12060
aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag ccgtttctgt 12120
aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg gtatcggtct 12180
gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc aaaaataagg 12240
ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg caaaagctta 12300
tgcatttctt tccagacttg ttcaacaggc cagccattac gctcgtcatc aaaatcactc 12360
gcatcaacca aaccgttatt cattcgtgat tgcgcctgag cgagacgaaa tacgcgatcg 12420
ctgttaaaag gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc 12480
gcatcaacaa tattttcacc tgaatcagga tattcttcta atacctggaa tgctgttttc 12540
ccggggatcg cagtggtgag taaccatgca tcatcaggag tacggataaa atgcttgatg 12600
gtcggaagag gcataaattc cgtcagccag tttagtctga ccatctcatc tgtaacatca 12660
ttggcaacgc tacctttgcc atgtttcaga aacaactctg gcgcatcggg cttcccatac 12720
aatcgataga ttgtcgcacc tgattgcccg acattatcgc gagcccattt atacccatat 12780
aaatcagcat ccatgttgga atttaatcgc ggcctcgagc aagacgtttc ccgttgaata 12840
tggctcataa caccccttgt attactgttt atgtaagcag acagttttat tgttcatgag 12900
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 12960
ccgaaaagtg ccacctaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt 13020
tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca 13080
aaagaataga ccgagatagg gttgagtggc cgctacaggg cgctcccatt cgccattcag 13140
gctgcgcaac tgttgggaag ggcgtttcgg tgcgggcctc ttcgctatta cgccagctgg 13200
cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac 13260
acgcgtaata cgactcacta tag 13283
<210> 11
<211> 13283
<212> DNA
<213> 人工序列
<220>
<223> 构建体F549的核苷酸序列
<400> 11
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgaatcca aatcagaaga taataaccat cggatcaatc tgtatggtaa ttggaatagt 7620
tagcttaatg ttacaaattg ggaacatgat ctcaatatgg gtcagtcatt caattcagac 7680
agggaatcaa tgccaagctg aaccaatcag caatactaaa tttcttactg agaaagctgt 7740
ggcttcagta acattagcgg gcaattcatc tctttgcccc attagcggat gggctgtata 7800
cagtaaggac aacagtataa ggatcggttc caggggggat gtgtttgtta taagagagcc 7860
gttcatctca tgctcccact tggaatgcag aactttcttt ttgactcagg gagccttgct 7920
gaatgacaag cactccaatg ggactgtcaa agacagaagc cctcacagaa cattaatgag 7980
ttgtcctgtg ggtgaggctc cctccccata taactcaagg tttgagtctg ttgcttggtc 8040
agcaagtgct tgccatgatg gcaccagttg gttgacaatt ggaatttctg gtccagacaa 8100
tggggctgtg gctgtattga aatacaatgg cataataaca gacaccatca agagttggag 8160
gaacaacata ctgagaactc aagagtctga atgtgcatgt gtaaatggct cttgctttac 8220
tgtaatgact gatggaccaa gtagtgggca ggcatcatat aagatcttca aaatggaaaa 8280
agggaaagtg gttaaatcag tcgaattgga tgctcctaat tatcactatg aggagtgctc 8340
ctgttatcct gatgccggcg aaatcacatg tgtgtgcagg gataattggc atggctcaaa 8400
taggccatgg gtatctttca atcaaaattt ggagtatcaa ataggatata tatgcagtgg 8460
agttttcgga gacaatccac gccccaatga tggaacaggt agttgtggtc cggtgttctc 8520
taacggggca tatggggtaa aagggttttc attcaaatac ggcaatggtg tttggatcgg 8580
gagaaccaaa agcactaatt ccaggagcgg ctttgaaatg atttgggacc caaatgggtg 8640
gactggaacg gacagtagct tttcggtgaa gcaagatatc gtagcaataa ctgattggtc 8700
aggatatagc gggagttttg tccagcatcc agaactgaca ggattagatt gcataagacc 8760
ttgtttctgg gttgagttaa tcagagggcg gcctaaagag agcacaattt ggaccagtgg 8820
gagcagcata tctttttgtg gtgtaaatag tgacactgtt agttggtctt ggccagacgg 8880
tgctgagttg ccattcacca ttgacaagta gctctctacg gctaacctga atggactacg 8940
acatagtcta gtccgccaag atggagaaaa tagtgcttct tcttgcaata gtcagccttg 9000
ttaaaagtga tcagatttgc attggttacc atgcaaacaa ctcgacagag caggttgaca 9060
caataatgga aaagaacgtc actgttacac acgcccaaga catactggaa aagacacaca 9120
acgggaaact ctgcgatcta gatggagtga agcctctaat tttaagagat tgtagtgtag 9180
ctggatggct cctcgggaac ccaatgtgtg acgaattcct caatgtgccg gaatggtctt 9240
acatagtgga gaagatcaat ccagccaatg acctctgtta cccagggaat ttcaacgact 9300
atgaagaact gaaacaccta ttgagcagaa taaaccattt tgagaaaatt cagatcatcc 9360
ccaaaagttc ttggtcagat catgaagcct cagcaggggt gagctcagca tgtccatacc 9420
agggaaggtc ctcctttttt agaaatgtgg tatggcttat caaaaaggac aatgcatacc 9480
caacaataaa gagaagttac aataatacca accaagaaga tcttttggta ttgtggggga 9540
ttcaccatcc aaatgatgcg gcagagcaga caaggctcta tcaaaaccca actacctata 9600
tttccgttgg gacatcaaca ctaaaccaga gattggtacc aaaaatagcc actagatcta 9660
aggtaaacgg gcaaagtgga aggatggagt tcttttggac aattttaaaa ccgaatgatg 9720
caataaactt tgagagtaat ggaaatttca ttgctccaga aaatgcatac aaaattgtca 9780
agaaagggga ctcaacaatt atgaaaagtg agttggaata tggtaactgc aacaccaagt 9840
gtcaaactcc aataggggcg ataaactcta gtatgccatt ccacaacatc caccctctca 9900
ccatcgggga atgccccaaa tatgtgaaat caagcagatt agtccttgct actgggctca 9960
gaaatagccc tcaacgagag acacgaggac tatttggagc tatagcaggt tttatagagg 10020
gaggatgggg aatggtagat ggttggtatg ggtaccacca tagcaacgag caggggagtg 10080
ggtacgctgc agacaaagaa tccactcaaa aggcaataga tggagtcacc aataaggtca 10140
actcgatcat tgacaaaatg aacactcagt ttgaggctgt tggaagggaa tttaataact 10200
tagaaaggag aatagaaaat ttaaacaaga agatggaaga cggattccta gatgtctgga 10260
cttataatgc tgaacttctg gttctcatgg aaaatgagag aactctagac tttcatgact 10320
caaatgtcaa gaacctttac gacaaggtcc gactacagct tagggataat gcaaaggagc 10380
ttggtaacgg ttgtttcgag ttctatcaca gatgtgataa tgaatgtatg gaaagtgtaa 10440
gaaacggaac gtatgactac ccgcagtatt cagaagaagc aagattaaaa agagaggaaa 10500
taagtggagt aaaattggaa tcaataggaa cttaccaaat actgtcaatt tattcaacag 10560
tggcgagctc cctagcactg gcaatcatgg tggctggtct atctttatgg atgtgctcca 10620
atggatcgtt acaatgcaga atttgcattt aaggcgcgcc cacccagcgg ccgcccgcta 10680
cgccccaatg atccgaccag caaaactcga tgtacttccg aggaactgat gtgcataatg 10740
catcaggctg gtacattaga tccccgctta ccgcgggcaa tatagcaaca ctaaaaactc 10800
gatgtacttc cgaggaagcg cagtgcataa tgctgcgcag tgttgccaca taaccactat 10860
attaaccatt tatctagcgg acgccaaaaa ctcaatgtat ttctgaggaa gcgtggtgca 10920
taatgccacg cagcgtctgc ataactttta ttatttcttt tattaatcaa caaaattttg 10980
tttttaacat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gaagagcgtt 11040
taaacacgtg atatctggcc tcatgggcct tcctttcact gcccgctttc cagtcgggaa 11100
acctgtcgtg ccagctgcat taacatggtc atagctgttt ccttgcgtat tgggcgctct 11160
ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg ggtaaagcct ggggtgccta 11220
atgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 11280
ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 11340
aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 11400
tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 11460
ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 11520
gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 11580
tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 11640
caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 11700
ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 11760
cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 11820
ttttgtttgc aggcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 11880
cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 11940
gaatacacgg tgcctgactg cgttagcaat ttaactgtga taaactaccg cattaaagct 12000
tatcgatgat aagctgtcaa acatgagaat tcttagaaaa actcatcgag catcaaatga 12060
aactgcaatt tattcatatc aggattatca ataccatatt tttgaaaaag ccgtttctgt 12120
aatgaaggag aaaactcacc gaggcagttc cataggatgg caagatcctg gtatcggtct 12180
gcgattccga ctcgtccaac atcaatacaa cctattaatt tcccctcgtc aaaaataagg 12240
ttatcaagtg agaaatcacc atgagtgacg actgaatccg gtgagaatgg caaaagctta 12300
tgcatttctt tccagacttg ttcaacaggc cagccattac gctcgtcatc aaaatcactc 12360
gcatcaacca aaccgttatt cattcgtgat tgcgcctgag cgagacgaaa tacgcgatcg 12420
ctgttaaaag gacaattaca aacaggaatc gaatgcaacc ggcgcaggaa cactgccagc 12480
gcatcaacaa tattttcacc tgaatcagga tattcttcta atacctggaa tgctgttttc 12540
ccggggatcg cagtggtgag taaccatgca tcatcaggag tacggataaa atgcttgatg 12600
gtcggaagag gcataaattc cgtcagccag tttagtctga ccatctcatc tgtaacatca 12660
ttggcaacgc tacctttgcc atgtttcaga aacaactctg gcgcatcggg cttcccatac 12720
aatcgataga ttgtcgcacc tgattgcccg acattatcgc gagcccattt atacccatat 12780
aaatcagcat ccatgttgga atttaatcgc ggcctcgagc aagacgtttc ccgttgaata 12840
tggctcataa caccccttgt attactgttt atgtaagcag acagttttat tgttcatgag 12900
cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc 12960
ccgaaaagtg ccacctaaat tgtaagcgtt aatattttgt taaaattcgc gttaaatttt 13020
tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaaaatccc ttataaatca 13080
aaagaataga ccgagatagg gttgagtggc cgctacaggg cgctcccatt cgccattcag 13140
gctgcgcaac tgttgggaag ggcgtttcgg tgcgggcctc ttcgctatta cgccagctgg 13200
cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagtcac 13260
acgcgtaata cgactcacta tag 13283
<210> 12
<211> 13809
<212> DNA
<213> 人工序列
<220>
<223> 构建体F556的核苷酸序列
<400> 12
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggagaaa atagtgcttc ttcttgcaat agtcagcctt gttaaaagtg atcagatttg 7620
cattggttac catgcaaaca actcgacaga gcaggttgac acaataatgg aaaagaacgt 7680
cactgttaca cacgcccaag acatactgga aaagacacac aacgggaaac tctgcgatct 7740
agatggagtg aagcctctaa ttttaagaga ttgtagtgta gctggatggc tcctcgggaa 7800
cccaatgtgt gacgaattcc tcaatgtgcc ggaatggtct tacatagtgg agaagatcaa 7860
tccagccaat gacctctgtt acccagggaa tttcaacgac tatgaagaac tgaaacacct 7920
attgagcaga ataaaccatt ttgagaaaat tcagatcatc cccaaaagtt cttggtcaga 7980
tcatgaagcc tcagcagggg tgagctcagc atgtccatac cagggaaggt cctccttttt 8040
tagaaatgtg gtatggctta tcaaaaagga caatgcatac ccaacaataa agagaagtta 8100
caataatacc aaccaagaag atcttttggt attgtggggg attcaccatc caaatgatgc 8160
ggcagagcag acaaggctct atcaaaaccc aactacctat atttccgttg ggacatcaac 8220
actaaaccag agattggtac caaaaatagc cactagatct aaggtaaacg ggcaaagtgg 8280
aaggatggag ttcttttgga caattttaaa accgaatgat gcaataaact ttgagagtaa 8340
tggaaatttc attgctccag aaaatgcata caaaattgtc aagaaagggg actcaacaat 8400
tatgaaaagt gagttggaat atggtaactg caacaccaag tgtcaaactc caataggggc 8460
gataaactct agtatgccat tccacaacat ccaccctctc accatcgggg aatgccccaa 8520
atatgtgaaa tcaagcagat tagtccttgc tactgggctc agaaatagcc ctcaacgaga 8580
gacacgagga ctatttggag ctatagcagg ttttatagag ggaggatggg gaatggtaga 8640
tggttggtat gggtaccacc atagcaacga gcaggggagt gggtacgctg cagacaaaga 8700
atccactcaa aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat 8760
gaacactcag tttgaggctg ttggaaggga atttaataac ttagaaagga gaatagaaaa 8820
tttaaacaag aagatggaag acggattcct agatgtctgg acttataatg ctgaacttct 8880
ggttctcatg gaaaatgaga gaactctaga ctttcatgac tcaaatgtca agaaccttta 8940
cgacaaggtc cgactacagc ttagggataa tgcaaaggag cttggtaacg gttgtttcga 9000
gttctatcac agatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta 9060
cccgcagtat tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga 9120
atcaatagga acttaccaaa tactgtcaat ttattcaaca gtggcgagct ccctagcact 9180
ggcaatcatg gtggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag 9240
aatttgcatt taaccccccc ccctaacgtt actggccgaa gccgcttgga ataaggccgg 9300
tgtgcgtttg tctatatgtt attttccacc atattgccgt cttttggcaa tgtgagggcc 9360
cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 9420
ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 9480
caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 9540
ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 9600
cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 9660
aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 9720
tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaacg tctaggcccc ccgaaccacg 9780
gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaaccat gaatccaaat 9840
cagaagataa taaccatcgg atcaatctgt atggtaattg gaatagttag cttaatgtta 9900
caaattggga acatgatctc aatatgggtc agtcattcaa ttcagacagg gaatcaatgc 9960
caagctgaac caatcagcaa tactaaattt cttactgaga aagctgtggc ttcagtaaca 10020
ttagcgggca attcatctct ttgccccatt agcggatggg ctgtatacag taaggacaac 10080
agtataagga tcggttccag gggggatgtg tttgttataa gagagccgtt catctcatgc 10140
tcccacttgg aatgcagaac tttctttttg actcagggag ccttgctgaa tgacaagcac 10200
tccaatggga ctgtcaaaga cagaagccct cacagaacat taatgagttg tcctgtgggt 10260
gaggctccct ccccatataa ctcaaggttt gagtctgttg cttggtcagc aagtgcttgc 10320
catgatggca ccagttggtt gacaattgga atttctggtc cagacaatgg ggctgtggct 10380
gtattgaaat acaatggcat aataacagac accatcaaga gttggaggaa caacatactg 10440
agaactcaag agtctgaatg tgcatgtgta aatggctctt gctttactgt aatgactgat 10500
ggaccaagta gtgggcaggc atcatataag atcttcaaaa tggaaaaagg gaaagtggtt 10560
aaatcagtcg aattggatgc tcctaattat cactatgagg agtgctcctg ttatcctgat 10620
gccggcgaaa tcacatgtgt gtgcagggat aattggcatg gctcaaatag gccatgggta 10680
tctttcaatc aaaatttgga gtatcaaata ggatatatat gcagtggagt tttcggagac 10740
aatccacgcc ccaatgatgg aacaggtagt tgtggtccgg tgttctctaa cggggcatat 10800
ggggtaaaag ggttttcatt caaatacggc aatggtgttt ggatcgggag aaccaaaagc 10860
actaattcca ggagcggctt tgaaatgatt tgggacccaa atgggtggac tggaacggac 10920
agtagctttt cggtgaagca agatatcgta gcaataactg attggtcagg atatagcggg 10980
agttttgtcc agcatccaga actgacagga ttagattgca taagaccttg tttctgggtt 11040
gagttaatca gagggcggcc taaagagagc acaatttgga ccagtgggag cagcatatct 11100
ttttgtggtg taaatagtga cactgttagt tggtcttggc cagacggtgc tgagttgcca 11160
ttcaccattg acaagtaggg cgcgcccacc cagcggccgc ccgctacgcc ccaatgatcc 11220
gaccagcaaa actcgatgta cttccgagga actgatgtgc ataatgcatc aggctggtac 11280
attagatccc cgcttaccgc gggcaatata gcaacactaa aaactcgatg tacttccgag 11340
gaagcgcagt gcataatgct gcgcagtgtt gccacataac cactatatta accatttatc 11400
tagcggacgc caaaaactca atgtatttct gaggaagcgt ggtgcataat gccacgcagc 11460
gtctgcataa cttttattat ttcttttatt aatcaacaaa attttgtttt taacatttca 11520
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaag agcgtttaaa cacgtgatat 11580
ctggcctcat gggccttcct ttcactgccc gctttccagt cgggaaacct gtcgtgccag 11640
ctgcattaac atggtcatag ctgtttcctt gcgtattggg cgctctccgc ttcctcgctc 11700
actgactcgc tgcgctcggt cgttcgggta aagcctgggg tgcctaatga gcaaaaggcc 11760
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 11820
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 11880
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 11940
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 12000
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 12060
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 12120
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 12180
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 12240
gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 12300
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaggc 12360
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 12420
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaat acacggtgcc 12480
tgactgcgtt agcaatttaa ctgtgataaa ctaccgcatt aaagcttatc gatgataagc 12540
tgtcaaacat gagaattctt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 12600
catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 12660
ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 12720
tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 12780
atcaccatga gtgacgactg aatccggtga gaatggcaaa agcttatgca tttctttcca 12840
gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 12900
gttattcatt cgtgattgcg cctgagcgag acgaaatacg cgatcgctgt taaaaggaca 12960
attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 13020
ttcacctgaa tcaggatatt cttctaatac ctggaatgct gttttcccgg ggatcgcagt 13080
ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 13140
aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 13200
tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaatc gatagattgt 13260
cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 13320
gttggaattt aatcgcggcc tcgagcaaga cgtttcccgt tgaatatggc tcataacacc 13380
ccttgtatta ctgtttatgt aagcagacag ttttattgtt catgagcgga tacatatttg 13440
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 13500
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 13560
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 13620
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 13680
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 13740
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacacgc gtaatacgac 13800
tcactatag 13809
<210> 13
<211> 13809
<212> DNA
<213> 人工序列
<220>
<223> 构建体F557的核苷酸序列
<400> 13
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgaatcca aatcagaaga taataaccat cggatcaatc tgtatggtaa ttggaatagt 7620
tagcttaatg ttacaaattg ggaacatgat ctcaatatgg gtcagtcatt caattcagac 7680
agggaatcaa tgccaagctg aaccaatcag caatactaaa tttcttactg agaaagctgt 7740
ggcttcagta acattagcgg gcaattcatc tctttgcccc attagcggat gggctgtata 7800
cagtaaggac aacagtataa ggatcggttc caggggggat gtgtttgtta taagagagcc 7860
gttcatctca tgctcccact tggaatgcag aactttcttt ttgactcagg gagccttgct 7920
gaatgacaag cactccaatg ggactgtcaa agacagaagc cctcacagaa cattaatgag 7980
ttgtcctgtg ggtgaggctc cctccccata taactcaagg tttgagtctg ttgcttggtc 8040
agcaagtgct tgccatgatg gcaccagttg gttgacaatt ggaatttctg gtccagacaa 8100
tggggctgtg gctgtattga aatacaatgg cataataaca gacaccatca agagttggag 8160
gaacaacata ctgagaactc aagagtctga atgtgcatgt gtaaatggct cttgctttac 8220
tgtaatgact gatggaccaa gtagtgggca ggcatcatat aagatcttca aaatggaaaa 8280
agggaaagtg gttaaatcag tcgaattgga tgctcctaat tatcactatg aggagtgctc 8340
ctgttatcct gatgccggcg aaatcacatg tgtgtgcagg gataattggc atggctcaaa 8400
taggccatgg gtatctttca atcaaaattt ggagtatcaa ataggatata tatgcagtgg 8460
agttttcgga gacaatccac gccccaatga tggaacaggt agttgtggtc cggtgttctc 8520
taacggggca tatggggtaa aagggttttc attcaaatac ggcaatggtg tttggatcgg 8580
gagaaccaaa agcactaatt ccaggagcgg ctttgaaatg atttgggacc caaatgggtg 8640
gactggaacg gacagtagct tttcggtgaa gcaagatatc gtagcaataa ctgattggtc 8700
aggatatagc gggagttttg tccagcatcc agaactgaca ggattagatt gcataagacc 8760
ttgtttctgg gttgagttaa tcagagggcg gcctaaagag agcacaattt ggaccagtgg 8820
gagcagcata tctttttgtg gtgtaaatag tgacactgtt agttggtctt ggccagacgg 8880
tgctgagttg ccattcacca ttgacaagta gccccccccc ctaacgttac tggccgaagc 8940
cgcttggaat aaggccggtg tgcgtttgtc tatatgttat tttccaccat attgccgtct 9000
tttggcaatg tgagggcccg gaaacctggc cctgtcttct tgacgagcat tcctaggggt 9060
ctttcccctc tcgccaaagg aatgcaaggt ctgttgaatg tcgtgaagga agcagttcct 9120
ctggaagctt cttgaagaca aacaacgtct gtagcgaccc tttgcaggca gcggaacccc 9180
ccacctggcg acaggtgcct ctgcggccaa aagccacgtg tataagatac acctgcaaag 9240
gcggcacaac cccagtgcca cgttgtgagt tggatagttg tggaaagagt caaatggctc 9300
tcctcaagcg tattcaacaa ggggctgaag gatgcccaga aggtacccca ttgtatggga 9360
tctgatctgg ggcctcggtg cacatgcttt acatgtgttt agtcgaggtt aaaaaacgtc 9420
taggcccccc gaaccacggg gacgtggttt tcctttgaaa aacacgatga taatatggcc 9480
acaaccatgg agaaaatagt gcttcttctt gcaatagtca gccttgttaa aagtgatcag 9540
atttgcattg gttaccatgc aaacaactcg acagagcagg ttgacacaat aatggaaaag 9600
aacgtcactg ttacacacgc ccaagacata ctggaaaaga cacacaacgg gaaactctgc 9660
gatctagatg gagtgaagcc tctaatttta agagattgta gtgtagctgg atggctcctc 9720
gggaacccaa tgtgtgacga attcctcaat gtgccggaat ggtcttacat agtggagaag 9780
atcaatccag ccaatgacct ctgttaccca gggaatttca acgactatga agaactgaaa 9840
cacctattga gcagaataaa ccattttgag aaaattcaga tcatccccaa aagttcttgg 9900
tcagatcatg aagcctcagc aggggtgagc tcagcatgtc cataccaggg aaggtcctcc 9960
ttttttagaa atgtggtatg gcttatcaaa aaggacaatg catacccaac aataaagaga 10020
agttacaata ataccaacca agaagatctt ttggtattgt gggggattca ccatccaaat 10080
gatgcggcag agcagacaag gctctatcaa aacccaacta cctatatttc cgttgggaca 10140
tcaacactaa accagagatt ggtaccaaaa atagccacta gatctaaggt aaacgggcaa 10200
agtggaagga tggagttctt ttggacaatt ttaaaaccga atgatgcaat aaactttgag 10260
agtaatggaa atttcattgc tccagaaaat gcatacaaaa ttgtcaagaa aggggactca 10320
acaattatga aaagtgagtt ggaatatggt aactgcaaca ccaagtgtca aactccaata 10380
ggggcgataa actctagtat gccattccac aacatccacc ctctcaccat cggggaatgc 10440
cccaaatatg tgaaatcaag cagattagtc cttgctactg ggctcagaaa tagccctcaa 10500
cgagagacac gaggactatt tggagctata gcaggtttta tagagggagg atggggaatg 10560
gtagatggtt ggtatgggta ccaccatagc aacgagcagg ggagtgggta cgctgcagac 10620
aaagaatcca ctcaaaaggc aatagatgga gtcaccaata aggtcaactc gatcattgac 10680
aaaatgaaca ctcagtttga ggctgttgga agggaattta ataacttaga aaggagaata 10740
gaaaatttaa acaagaagat ggaagacgga ttcctagatg tctggactta taatgctgaa 10800
cttctggttc tcatggaaaa tgagagaact ctagactttc atgactcaaa tgtcaagaac 10860
ctttacgaca aggtccgact acagcttagg gataatgcaa aggagcttgg taacggttgt 10920
ttcgagttct atcacagatg tgataatgaa tgtatggaaa gtgtaagaaa cggaacgtat 10980
gactacccgc agtattcaga agaagcaaga ttaaaaagag aggaaataag tggagtaaaa 11040
ttggaatcaa taggaactta ccaaatactg tcaatttatt caacagtggc gagctcccta 11100
gcactggcaa tcatggtggc tggtctatct ttatggatgt gctccaatgg atcgttacaa 11160
tgcagaattt gcatttaagg cgcgcccacc cagcggccgc ccgctacgcc ccaatgatcc 11220
gaccagcaaa actcgatgta cttccgagga actgatgtgc ataatgcatc aggctggtac 11280
attagatccc cgcttaccgc gggcaatata gcaacactaa aaactcgatg tacttccgag 11340
gaagcgcagt gcataatgct gcgcagtgtt gccacataac cactatatta accatttatc 11400
tagcggacgc caaaaactca atgtatttct gaggaagcgt ggtgcataat gccacgcagc 11460
gtctgcataa cttttattat ttcttttatt aatcaacaaa attttgtttt taacatttca 11520
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaag agcgtttaaa cacgtgatat 11580
ctggcctcat gggccttcct ttcactgccc gctttccagt cgggaaacct gtcgtgccag 11640
ctgcattaac atggtcatag ctgtttcctt gcgtattggg cgctctccgc ttcctcgctc 11700
actgactcgc tgcgctcggt cgttcgggta aagcctgggg tgcctaatga gcaaaaggcc 11760
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 11820
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 11880
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 11940
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 12000
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 12060
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 12120
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 12180
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 12240
gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 12300
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaggc 12360
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 12420
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaat acacggtgcc 12480
tgactgcgtt agcaatttaa ctgtgataaa ctaccgcatt aaagcttatc gatgataagc 12540
tgtcaaacat gagaattctt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 12600
catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 12660
ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 12720
tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 12780
atcaccatga gtgacgactg aatccggtga gaatggcaaa agcttatgca tttctttcca 12840
gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 12900
gttattcatt cgtgattgcg cctgagcgag acgaaatacg cgatcgctgt taaaaggaca 12960
attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 13020
ttcacctgaa tcaggatatt cttctaatac ctggaatgct gttttcccgg ggatcgcagt 13080
ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 13140
aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 13200
tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaatc gatagattgt 13260
cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 13320
gttggaattt aatcgcggcc tcgagcaaga cgtttcccgt tgaatatggc tcataacacc 13380
ccttgtatta ctgtttatgt aagcagacag ttttattgtt catgagcgga tacatatttg 13440
aatgtattta gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac 13500
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 13560
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 13620
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 13680
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 13740
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacacgc gtaatacgac 13800
tcactatag 13809
<210> 14
<211> 13295
<212> DNA
<213> 人工序列
<220>
<223> 构建体F602的核苷酸序列
<400> 14
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggagaaa atagtgcttc ttcttgcaat agtcagcctt gttaaaagtg atcagatttg 7620
cattggttac catgcaaaca actcgacaga gcaggttgac acaataatgg aaaagaacgt 7680
cactgttaca cacgcccaag acatactgga aaagacacac aacgggaaac tctgcgatct 7740
agatggagtg aagcctctaa ttttaagaga ttgtagtgta gctggatggc tcctcgggaa 7800
cccaatgtgt gacgaattcc tcaatgtgcc ggaatggtct tacatagtgg agaagatcaa 7860
tccagccaat gacctctgtt acccagggaa tttcaacgac tatgaagaac tgaaacacct 7920
attgagcaga ataaaccatt ttgagaaaat tcagatcatc cccaaaagtt cttggtcaga 7980
tcatgaagcc tcagcagggg tgagctcagc atgtccatac cagggaaggt cctccttttt 8040
tagaaatgtg gtatggctta tcaaaaagga caatgcatac ccaacaataa agagaagtta 8100
caataatacc aaccaagaag atcttttggt attgtggggg attcaccatc caaatgatgc 8160
ggcagagcag acaaggctct atcaaaaccc aactacctat atttccgttg ggacatcaac 8220
actaaaccag agattggtac caaaaatagc cactagatct aaggtaaacg ggcaaagtgg 8280
aaggatggag ttcttttgga caattttaaa accgaatgat gcaataaact ttgagagtaa 8340
tggaaatttc attgctccag aaaatgcata caaaattgtc aagaaagggg actcaacaat 8400
tatgaaaagt gagttggaat atggtaactg caacaccaag tgtcaaactc caataggggc 8460
gataaactct agtatgccat tccacaacat ccaccctctc accatcgggg aatgccccaa 8520
atatgtgaaa tcaagcagat tagtccttgc tactgggctc agaaatagcc ctcaacgaga 8580
gacacgagga ctatttggag ctatagcagg ttttatagag ggaggatggg gaatggtaga 8640
tggttggtat gggtaccacc atagcaacga gcaggggagt gggtacgctg cagacaaaga 8700
atccactcaa aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat 8760
gaacactcag tttgaggctg ttggaaggga atttaataac ttagaaagga gaatagaaaa 8820
tttaaacaag aagatggaag acggattcct agatgtctgg acttataatg ctgaacttct 8880
ggttctcatg gaaaatgaga gaactctaga ctttcatgac tcaaatgtca agaaccttta 8940
cgacaaggtc cgactacagc ttagggataa tgcaaaggag cttggtaacg gttgtttcga 9000
gttctatcac agatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta 9060
cccgcagtat tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga 9120
atcaatagga acttaccaaa tactgtcaat ttattcaaca gtggcgagct ccctagcact 9180
ggcaatcatg gtggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag 9240
aatttgcatt taagggcccc tataactctc tacggctaac ctgaatggac tacgacatag 9300
tctagtccgc caagatgaat ccaaatcaga agataataac catcggatca atctgtatgg 9360
taattggaat agttagctta atgttacaaa ttgggaacat gatctcaata tgggtcagtc 9420
attcaattca gacagggaat caatgccaag ctgaaccaat cagcaatact aaatttctta 9480
ctgagaaagc tgtggcttca gtaacattag cgggcaattc atctctttgc cccattagcg 9540
gatgggctgt atacagtaag gacaacagta taaggatcgg ttccaggggg gatgtgtttg 9600
ttataagaga gccgttcatc tcatgctccc acttggaatg cagaactttc tttttgactc 9660
agggagcctt gctgaatgac aagcactcca atgggactgt caaagacaga agccctcaca 9720
gaacattaat gagttgtcct gtgggtgagg ctccctcccc atataactca aggtttgagt 9780
ctgttgcttg gtcagcaagt gcttgccatg atggcaccag ttggttgaca attggaattt 9840
ctggtccaga caatggggct gtggctgtat tgaaatacaa tggcataata acagacacca 9900
tcaagagttg gaggaacaac atactgagaa ctcaagagtc tgaatgtgca tgtgtaaatg 9960
gctcttgctt tactgtaatg actgatggac caagtagtgg gcaggcatca tataagatct 10020
tcaaaatgga aaaagggaaa gtggttaaat cagtcgaatt ggatgctcct aattatcact 10080
atgaggagtg ctcctgttat cctgatgccg gcgaaatcac atgtgtgtgc agggataatt 10140
ggcatggctc aaataggcca tgggtatctt tcaatcaaaa tttggagtat caaataggat 10200
atatatgcag tggagttttc ggagacaatc cacgccccaa tgatggaaca ggtagttgtg 10260
gtccggtgtt ctctaacggg gcatatgggg taaaagggtt ttcattcaaa tacggcaatg 10320
gtgtttggat cgggagaacc aaaagcacta attccaggag cggctttgaa atgatttggg 10380
acccaaatgg gtggactgga acggacagta gcttttcggt gaagcaagat atcgtagcaa 10440
taactgattg gtcaggatat agcgggagtt ttgtccagca tccagaactg acaggattag 10500
attgcataag accttgtttc tgggttgagt taatcagagg gcggcctaaa gagagcacaa 10560
tttggaccag tgggagcagc atatcttttt gtggtgtaaa tagtgacact gttagttggt 10620
cttggccaga cggtgctgag ttgccattca ccattgacaa gtagggcgcg cccacccagc 10680
ggccgcccgc tacgccccaa tgatccgacc agcaaaactc gatgtacttc cgaggaactg 10740
atgtgcataa tgcatcaggc tggtacatta gatccccgct taccgcgggc aatatagcaa 10800
cactaaaaac tcgatgtact tccgaggaag cgcagtgcat aatgctgcgc agtgttgcca 10860
cataaccact atattaacca tttatctagc ggacgccaaa aactcaatgt atttctgagg 10920
aagcgtggtg cataatgcca cgcagcgtct gcataacttt tattatttct tttattaatc 10980
aacaaaattt tgtttttaac atttcaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 11040
aagaagagcg tttaaacacg tgatatctgg cctcatgggc cttcctttca ctgcccgctt 11100
tccagtcggg aaacctgtcg tgccagctgc attaacatgg tcatagctgt ttccttgcgt 11160
attgggcgct ctccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cgggtaaagc 11220
ctggggtgcc taatgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 11280
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 11340
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 11400
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 11460
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 11520
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 11580
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 11640
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 11700
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 11760
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 11820
tagcggtggt ttttttgttt gcaggcagca gattacgcgc agaaaaaaag gatctcaaga 11880
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 11940
gattttggtc atgaatacac ggtgcctgac tgcgttagca atttaactgt gataaactac 12000
cgcattaaag cttatcgatg ataagctgtc aaacatgaga attcttagaa aaactcatcg 12060
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 12120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 12180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 12240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 12300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 12360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 12420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg 12480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 12540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 12600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 12660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 12720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 12780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 12840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacagtttt 12900
attgttcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 12960
gcgcacattt ccccgaaaag tgccacctaa attgtaagcg ttaatatttt gttaaaattc 13020
gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc 13080
ccttataaat caaaagaata gaccgagata gggttgagtg gccgctacag ggcgctccca 13140
ttcgccattc aggctgcgca actgttggga agggcgtttc ggtgcgggcc tcttcgctat 13200
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 13260
tttcccagtc acacgcgtaa tacgactcac tatag 13295
<210> 15
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> 延伸的亚基因组启动子(v4)的核苷酸序列
<400> 15
actctagcta gcagtgttaa atcattcagc tacctgagag gggcccctat aactctctac 60
ggctaacctg aatggactac gacatagtct agtccgccaa g 101
<210> 16
<211> 759
<212> DNA
<213> 人工序列
<220>
<223> 甲型流感病毒M1基质蛋白(PR8X)的核苷酸序列
<400> 16
atgagtcttc taaccgaggt cgaaacgtac gtactctcta tcatcccgtc aggccccctc 60
aaagccgaga tcgcacagag acttgaagat gtctttgcag ggaagaacac cgatcttgag 120
gttctcatgg aatggctaaa gacaagacca atcctgtcac ctctgactaa ggggatttta 180
ggatttgtgt tcacgctcac cgtgcccagt gagcgaggac tgcagcgtag acgctttgtc 240
caaaatgccc ttaatgggaa cggggatcca aataacatgg acaaagcagt taaactgtat 300
aggaagctca agagggagat aacattccat ggggccaaag aaatctcact cagttattct 360
gctggtgcac ttgccagttg tatgggcctc atatacaaca ggatgggggc tgtgaccact 420
gaagtggcat ttggcctggt atgtgcaacc tgtgaacaga ttgctgactc ccagcatcgg 480
tctcataggc aaatggtgac aacaaccaat ccactaatca gacatgagaa cagaatggtt 540
ttagccagca ctacagctaa ggctatggag caaatggctg gatcgagtga gcaagcagca 600
gaggccatgg aggttgctag tcaggctaga caaatggtgc aagcgatgag aaccattggg 660
actcatccta gctccagtgc tggtctgaaa aatgatcttc ttgaaaattt gcaggcctat 720
cagaaacgaa tgggggtgca gatgcaacgg ttcaagtga 759
<210> 17
<211> 294
<212> DNA
<213> 人工序列
<220>
<223> 甲型流感病毒M2基质蛋白的核苷酸序列
<400> 17
atgagtcttc taaccgaggt cgaaacgcct atcagaaacg aatgggggtg cagatgcaac 60
ggttcaagtg atcctctcac tattgccgca aatatcattg ggatcttgca cttgacattg 120
tggattcttg atcgtctttt tttcaaatgc atttaccgtc gctttaaata cggactgaaa 180
ggagggcctt ctacggaagg agtgccaaag tctatgaggg aagaatatcg aaaggaacag 240
cagagtgctg tggatgctga cgatggtcat tttgtcagca tagagctgga gtaa 294
<210> 18
<211> 660
<212> DNA
<213> 人工序列
<220>
<223> 甲型流感病毒NS1非结构蛋白的核苷酸序列(A/加利福尼亚/09)
<400> 18
atggactcca acaccatgtc aagctttcag gtagactgtt tcctttggca tatccgcaag 60
cgatttgcag acaatggatt gggtgatgcc ccattccttg atcggctccg ccgagatcaa 120
aagtccttaa aaggaagagg caacaccctt ggcctcgata tcgaaacagc cactcttgtt 180
gggaaacaaa tcgtggaatg gatcttgaaa gaggaatcca gcgagacact tagaatgaca 240
attgcatctg tacctacttc gcgctacctt tctgacatga ccctcgagga aatgtcacga 300
gactggttca tgctcatgcc taggcaaaag ataataggcc ctctttgcgt gcgattggac 360
caggcgatca tggaaaagaa catagtactg aaagcgaact tcagtgtaat ctttaaccga 420
ttagagacct tgatactact aagggctttc actgaggagg gagcaatagt tggagaaatt 480
tcaccattac cttctcttcc aggacatact tatgaggatg tcaaaaatgc agttggggtc 540
ctcatcggag gacttgaatg gaatggtaac acggttcgag tctctgaaaa tatacagaga 600
ttcgcttgga gaaactgtga tgagaatggg agaccttcac tacctccaga gcagaaatga 660
<210> 19
<211> 14091
<212> DNA
<213> 人工序列
<220>
<223> 构建体F554的核苷酸序列
<400> 19
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggagaaa atagtgcttc ttcttgcaat agtcagcctt gttaaaagtg atcagatttg 7620
cattggttac catgcaaaca actcgacaga gcaggttgac acaataatgg aaaagaacgt 7680
cactgttaca cacgcccaag acatactgga aaagacacac aacgggaaac tctgcgatct 7740
agatggagtg aagcctctaa ttttaagaga ttgtagtgta gctggatggc tcctcgggaa 7800
cccaatgtgt gacgaattcc tcaatgtgcc ggaatggtct tacatagtgg agaagatcaa 7860
tccagccaat gacctctgtt acccagggaa tttcaacgac tatgaagaac tgaaacacct 7920
attgagcaga ataaaccatt ttgagaaaat tcagatcatc cccaaaagtt cttggtcaga 7980
tcatgaagcc tcagcagggg tgagctcagc atgtccatac cagggaaggt cctccttttt 8040
tagaaatgtg gtatggctta tcaaaaagga caatgcatac ccaacaataa agagaagtta 8100
caataatacc aaccaagaag atcttttggt attgtggggg attcaccatc caaatgatgc 8160
ggcagagcag acaaggctct atcaaaaccc aactacctat atttccgttg ggacatcaac 8220
actaaaccag agattggtac caaaaatagc cactagatct aaggtaaacg ggcaaagtgg 8280
aaggatggag ttcttttgga caattttaaa accgaatgat gcaataaact ttgagagtaa 8340
tggaaatttc attgctccag aaaatgcata caaaattgtc aagaaagggg actcaacaat 8400
tatgaaaagt gagttggaat atggtaactg caacaccaag tgtcaaactc caataggggc 8460
gataaactct agtatgccat tccacaacat ccaccctctc accatcgggg aatgccccaa 8520
atatgtgaaa tcaagcagat tagtccttgc tactgggctc agaaatagcc ctcaacgaga 8580
gacacgagga ctatttggag ctatagcagg ttttatagag ggaggatggg gaatggtaga 8640
tggttggtat gggtaccacc atagcaacga gcaggggagt gggtacgctg cagacaaaga 8700
atccactcaa aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat 8760
gaacactcag tttgaggctg ttggaaggga atttaataac ttagaaagga gaatagaaaa 8820
tttaaacaag aagatggaag acggattcct agatgtctgg acttataatg ctgaacttct 8880
ggttctcatg gaaaatgaga gaactctaga ctttcatgac tcaaatgtca agaaccttta 8940
cgacaaggtc cgactacagc ttagggataa tgcaaaggag cttggtaacg gttgtttcga 9000
gttctatcac agatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta 9060
cccgcagtat tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga 9120
atcaatagga acttaccaaa tactgtcaat ttattcaaca gtggcgagct ccctagcact 9180
ggcaatcatg gtggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag 9240
aatttgcatt taactctcta cggctaacct gaatggacta cgacatagtc tagtccgcca 9300
agatgaatcc aaatcagaag ataataacca tcggatcaat ctgtatggta attggaatag 9360
ttagcttaat gttacaaatt gggaacatga tctcaatatg ggtcagtcat tcaattcaga 9420
cagggaatca atgccaagct gaaccaatca gcaatactaa atttcttact gagaaagctg 9480
tggcttcagt aacattagcg ggcaattcat ctctttgccc cattagcgga tgggctgtat 9540
acagtaagga caacagtata aggatcggtt ccagggggga tgtgtttgtt ataagagagc 9600
cgttcatctc atgctcccac ttggaatgca gaactttctt tttgactcag ggagccttgc 9660
tgaatgacaa gcactccaat gggactgtca aagacagaag ccctcacaga acattaatga 9720
gttgtcctgt gggtgaggct ccctccccat ataactcaag gtttgagtct gttgcttggt 9780
cagcaagtgc ttgccatgat ggcaccagtt ggttgacaat tggaatttct ggtccagaca 9840
atggggctgt ggctgtattg aaatacaatg gcataataac agacaccatc aagagttgga 9900
ggaacaacat actgagaact caagagtctg aatgtgcatg tgtaaatggc tcttgcttta 9960
ctgtaatgac tgatggacca agtagtgggc aggcatcata taagatcttc aaaatggaaa 10020
aagggaaagt ggttaaatca gtcgaattgg atgctcctaa ttatcactat gaggagtgct 10080
cctgttatcc tgatgccggc gaaatcacat gtgtgtgcag ggataattgg catggctcaa 10140
ataggccatg ggtatctttc aatcaaaatt tggagtatca aataggatat atatgcagtg 10200
gagttttcgg agacaatcca cgccccaatg atggaacagg tagttgtggt ccggtgttct 10260
ctaacggggc atatggggta aaagggtttt cattcaaata cggcaatggt gtttggatcg 10320
ggagaaccaa aagcactaat tccaggagcg gctttgaaat gatttgggac ccaaatgggt 10380
ggactggaac ggacagtagc ttttcggtga agcaagatat cgtagcaata actgattggt 10440
caggatatag cgggagtttt gtccagcatc cagaactgac aggattagat tgcataagac 10500
cttgtttctg ggttgagtta atcagagggc ggcctaaaga gagcacaatt tggaccagtg 10560
ggagcagcat atctttttgt ggtgtaaata gtgacactgt tagttggtct tggccagacg 10620
gtgctgagtt gccattcacc attgacaagt agctctctac ggctaacctg aatggactac 10680
gacatagtct agtccgccaa gatgagtctt ctaaccgagg tcgaaacgta cgtactctct 10740
atcatcccgt caggccccct caaagccgag atcgcacaga gacttgaaga tgtctttgca 10800
gggaagaaca ccgatcttga ggttctcatg gaatggctaa agacaagacc aatcctgtca 10860
cctctgacta aggggatttt aggatttgtg ttcacgctca ccgtgcccag tgagcgagga 10920
ctgcagcgta gacgctttgt ccaaaatgcc cttaatggga acggggatcc aaataacatg 10980
gacaaagcag ttaaactgta taggaagctc aagagggaga taacattcca tggggccaaa 11040
gaaatctcac tcagttattc tgctggtgca cttgccagtt gtatgggcct catatacaac 11100
aggatggggg ctgtgaccac tgaagtggca tttggcctgg tatgtgcaac ctgtgaacag 11160
attgctgact cccagcatcg gtctcatagg caaatggtga caacaaccaa tccactaatc 11220
agacatgaga acagaatggt tttagccagc actacagcta aggctatgga gcaaatggct 11280
ggatcgagtg agcaagcagc agaggccatg gaggttgcta gtcaggctag acaaatggtg 11340
caagcgatga gaaccattgg gactcatcct agctccagtg ctggtctgaa aaatgatctt 11400
cttgaaaatt tgcaggccta tcagaaacga atgggggtgc agatgcaacg gttcaagtga 11460
ggcgcgccca cccagcggcc gcccgctacg ccccaatgat ccgaccagca aaactcgatg 11520
tacttccgag gaactgatgt gcataatgca tcaggctggt acattagatc cccgcttacc 11580
gcgggcaata tagcaacact aaaaactcga tgtacttccg aggaagcgca gtgcataatg 11640
ctgcgcagtg ttgccacata accactatat taaccattta tctagcggac gccaaaaact 11700
caatgtattt ctgaggaagc gtggtgcata atgccacgca gcgtctgcat aacttttatt 11760
atttctttta ttaatcaaca aaattttgtt tttaacattt caaaaaaaaa aaaaaaaaaa 11820
aaaaaaaaaa aaaaaaaaga agagcgttta aacacgtgat atctggcctc atgggccttc 11880
ctttcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta acatggtcat 11940
agctgtttcc ttgcgtattg ggcgctctcc gcttcctcgc tcactgactc gctgcgctcg 12000
gtcgttcggg taaagcctgg ggtgcctaat gagcaaaagg ccagcaaaag gccaggaacc 12060
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 12120
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 12180
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 12240
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 12300
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 12360
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 12420
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 12480
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 12540
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 12600
aacaaaccac cgctggtagc ggtggttttt ttgtttgcag gcagcagatt acgcgcagaa 12660
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 12720
aaaactcacg ttaagggatt ttggtcatga atacacggtg cctgactgcg ttagcaattt 12780
aactgtgata aactaccgca ttaaagctta tcgatgataa gctgtcaaac atgagaattc 12840
ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 12900
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 12960
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 13020
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 13080
tgaatccggt gagaatggca aaagcttatg catttctttc cagacttgtt caacaggcca 13140
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 13200
cgcctgagcg agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 13260
atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 13320
ttcttctaat acctggaatg ctgttttccc ggggatcgca gtggtgagta accatgcatc 13380
atcaggagta cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt 13440
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 13500
caactctggc gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac 13560
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 13620
cctcgagcaa gacgtttccc gttgaatatg gctcataaca ccccttgtat tactgtttat 13680
gtaagcagac agttttattg ttcatgagcg gatacatatt tgaatgtatt tagaaaaata 13740
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctaaattg taagcgttaa 13800
tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc 13860
cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtggccg 13920
ctacagggcg ctcccattcg ccattcaggc tgcgcaactg ttgggaaggg cgtttcggtg 13980
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 14040
tgggtaacgc cagggttttc ccagtcacac gcgtaatacg actcactata g 14091
<210> 20
<211> 12593
<212> DNA
<213> 人工序列
<220>
<223> 构建体F568的核苷酸序列
<400> 20
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggagaaa atagtgcttc ttcttgcaat agtcagcctt gttaaaagtg atcagatttg 7620
cattggttac catgcaaaca actcgacaga gcaggttgac acaataatgg aaaagaacgt 7680
cactgttaca cacgcccaag acatactgga aaagacacac aacgggaaac tctgcgatct 7740
agatggagtg aagcctctaa ttttaagaga ttgtagtgta gctggatggc tcctcgggaa 7800
cccaatgtgt gacgaattcc tcaatgtgcc ggaatggtct tacatagtgg agaagatcaa 7860
tccagccaat gacctctgtt acccagggaa tttcaacgac tatgaagaac tgaaacacct 7920
attgagcaga ataaaccatt ttgagaaaat tcagatcatc cccaaaagtt cttggtcaga 7980
tcatgaagcc tcagcagggg tgagctcagc atgtccatac cagggaaggt cctccttttt 8040
tagaaatgtg gtatggctta tcaaaaagga caatgcatac ccaacaataa agagaagtta 8100
caataatacc aaccaagaag atcttttggt attgtggggg attcaccatc caaatgatgc 8160
ggcagagcag acaaggctct atcaaaaccc aactacctat atttccgttg ggacatcaac 8220
actaaaccag agattggtac caaaaatagc cactagatct aaggtaaacg ggcaaagtgg 8280
aaggatggag ttcttttgga caattttaaa accgaatgat gcaataaact ttgagagtaa 8340
tggaaatttc attgctccag aaaatgcata caaaattgtc aagaaagggg actcaacaat 8400
tatgaaaagt gagttggaat atggtaactg caacaccaag tgtcaaactc caataggggc 8460
gataaactct agtatgccat tccacaacat ccaccctctc accatcgggg aatgccccaa 8520
atatgtgaaa tcaagcagat tagtccttgc tactgggctc agaaatagcc ctcaacgaga 8580
gacacgagga ctatttggag ctatagcagg ttttatagag ggaggatggg gaatggtaga 8640
tggttggtat gggtaccacc atagcaacga gcaggggagt gggtacgctg cagacaaaga 8700
atccactcaa aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat 8760
gaacactcag tttgaggctg ttggaaggga atttaataac ttagaaagga gaatagaaaa 8820
tttaaacaag aagatggaag acggattcct agatgtctgg acttataatg ctgaacttct 8880
ggttctcatg gaaaatgaga gaactctaga ctttcatgac tcaaatgtca agaaccttta 8940
cgacaaggtc cgactacagc ttagggataa tgcaaaggag cttggtaacg gttgtttcga 9000
gttctatcac agatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta 9060
cccgcagtat tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga 9120
atcaatagga acttaccaaa tactgtcaat ttattcaaca gtggcgagct ccctagcact 9180
ggcaatcatg gtggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag 9240
aatttgcatt taactctcta cggctaacct gaatggacta cgacatagtc tagtccgcca 9300
agatggactc caacaccatg tcaagctttc aggtagactg tttcctttgg catatccgca 9360
agcgatttgc agacaatgga ttgggtgatg ccccattcct tgatcggctc cgccgagatc 9420
aaaagtcctt aaaaggaaga ggcaacaccc ttggcctcga tatcgaaaca gccactcttg 9480
ttgggaaaca aatcgtggaa tggatcttga aagaggaatc cagcgagaca cttagaatga 9540
caattgcatc tgtacctact tcgcgctacc tttctgacat gaccctcgag gaaatgtcac 9600
gagactggtt catgctcatg cctaggcaaa agataatagg ccctctttgc gtgcgattgg 9660
accaggcgat catggaaaag aacatagtac tgaaagcgaa cttcagtgta atctttaacc 9720
gattagagac cttgatacta ctaagggctt tcactgagga gggagcaata gttggagaaa 9780
tttcaccatt accttctctt ccaggacata cttatgagga tgtcaaaaat gcagttgggg 9840
tcctcatcgg aggacttgaa tggaatggta acacggttcg agtctctgaa aatatacaga 9900
gattcgcttg gagaaactgt gatgagaatg ggagaccttc actacctcca gagcagaaat 9960
gaggcgcgcc cacccagcgg ccgcccgcta cgccccaatg atccgaccag caaaactcga 10020
tgtacttccg aggaactgat gtgcataatg catcaggctg gtacattaga tccccgctta 10080
ccgcgggcaa tatagcaaca ctaaaaactc gatgtacttc cgaggaagcg cagtgcataa 10140
tgctgcgcag tgttgccaca taaccactat attaaccatt tatctagcgg acgccaaaaa 10200
ctcaatgtat ttctgaggaa gcgtggtgca taatgccacg cagcgtctgc ataactttta 10260
ttatttcttt tattaatcaa caaaattttg tttttaacat ttcaaaaaaa aaaaaaaaaa 10320
aaaaaaaaaa aaaaaaaaaa gaagagcgtt taaacacgtg atatctggcc tcatgggcct 10380
tcctttcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taacatggtc 10440
atagctgttt ccttgcgtat tgggcgctct ccgcttcctc gctcactgac tcgctgcgct 10500
cggtcgttcg ggtaaagcct ggggtgccta atgagcaaaa ggccagcaaa aggccaggaa 10560
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 10620
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 10680
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 10740
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 10800
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 10860
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 10920
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 10980
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 11040
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 11100
caaacaaacc accgctggta gcggtggttt ttttgtttgc aggcagcaga ttacgcgcag 11160
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 11220
cgaaaactca cgttaaggga ttttggtcat gaatacacgg tgcctgactg cgttagcaat 11280
ttaactgtga taaactaccg cattaaagct tatcgatgat aagctgtcaa acatgagaat 11340
tcttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 11400
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 11460
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 11520
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 11580
actgaatccg gtgagaatgg caaaagctta tgcatttctt tccagacttg ttcaacaggc 11640
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 11700
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 11760
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 11820
tattcttcta atacctggaa tgctgttttc ccggggatcg cagtggtgag taaccatgca 11880
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 11940
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 12000
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 12060
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 12120
ggcctcgagc aagacgtttc ccgttgaata tggctcataa caccccttgt attactgttt 12180
atgtaagcag acagttttat tgttcatgag cggatacata tttgaatgta tttagaaaaa 12240
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctaaat tgtaagcgtt 12300
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 12360
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtggc 12420
cgctacaggg cgctcccatt cgccattcag gctgcgcaac tgttgggaag ggcgtttcgg 12480
tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa 12540
gttgggtaac gccagggttt tcccagtcac acgcgtaata cgactcacta tag 12593
<210> 21
<211> 12593
<212> DNA
<213> 人工序列
<220>
<223> 构建体F569的核苷酸序列
<400> 21
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggactcc aacaccatgt caagctttca ggtagactgt ttcctttggc atatccgcaa 7620
gcgatttgca gacaatggat tgggtgatgc cccattcctt gatcggctcc gccgagatca 7680
aaagtcctta aaaggaagag gcaacaccct tggcctcgat atcgaaacag ccactcttgt 7740
tgggaaacaa atcgtggaat ggatcttgaa agaggaatcc agcgagacac ttagaatgac 7800
aattgcatct gtacctactt cgcgctacct ttctgacatg accctcgagg aaatgtcacg 7860
agactggttc atgctcatgc ctaggcaaaa gataataggc cctctttgcg tgcgattgga 7920
ccaggcgatc atggaaaaga acatagtact gaaagcgaac ttcagtgtaa tctttaaccg 7980
attagagacc ttgatactac taagggcttt cactgaggag ggagcaatag ttggagaaat 8040
ttcaccatta ccttctcttc caggacatac ttatgaggat gtcaaaaatg cagttggggt 8100
cctcatcgga ggacttgaat ggaatggtaa cacggttcga gtctctgaaa atatacagag 8160
attcgcttgg agaaactgtg atgagaatgg gagaccttca ctacctccag agcagaaatg 8220
actctctacg gctaacctga atggactacg acatagtcta gtccgccaag atggagaaaa 8280
tagtgcttct tcttgcaata gtcagccttg ttaaaagtga tcagatttgc attggttacc 8340
atgcaaacaa ctcgacagag caggttgaca caataatgga aaagaacgtc actgttacac 8400
acgcccaaga catactggaa aagacacaca acgggaaact ctgcgatcta gatggagtga 8460
agcctctaat tttaagagat tgtagtgtag ctggatggct cctcgggaac ccaatgtgtg 8520
acgaattcct caatgtgccg gaatggtctt acatagtgga gaagatcaat ccagccaatg 8580
acctctgtta cccagggaat ttcaacgact atgaagaact gaaacaccta ttgagcagaa 8640
taaaccattt tgagaaaatt cagatcatcc ccaaaagttc ttggtcagat catgaagcct 8700
cagcaggggt gagctcagca tgtccatacc agggaaggtc ctcctttttt agaaatgtgg 8760
tatggcttat caaaaaggac aatgcatacc caacaataaa gagaagttac aataatacca 8820
accaagaaga tcttttggta ttgtggggga ttcaccatcc aaatgatgcg gcagagcaga 8880
caaggctcta tcaaaaccca actacctata tttccgttgg gacatcaaca ctaaaccaga 8940
gattggtacc aaaaatagcc actagatcta aggtaaacgg gcaaagtgga aggatggagt 9000
tcttttggac aattttaaaa ccgaatgatg caataaactt tgagagtaat ggaaatttca 9060
ttgctccaga aaatgcatac aaaattgtca agaaagggga ctcaacaatt atgaaaagtg 9120
agttggaata tggtaactgc aacaccaagt gtcaaactcc aataggggcg ataaactcta 9180
gtatgccatt ccacaacatc caccctctca ccatcgggga atgccccaaa tatgtgaaat 9240
caagcagatt agtccttgct actgggctca gaaatagccc tcaacgagag acacgaggac 9300
tatttggagc tatagcaggt tttatagagg gaggatgggg aatggtagat ggttggtatg 9360
ggtaccacca tagcaacgag caggggagtg ggtacgctgc agacaaagaa tccactcaaa 9420
aggcaataga tggagtcacc aataaggtca actcgatcat tgacaaaatg aacactcagt 9480
ttgaggctgt tggaagggaa tttaataact tagaaaggag aatagaaaat ttaaacaaga 9540
agatggaaga cggattccta gatgtctgga cttataatgc tgaacttctg gttctcatgg 9600
aaaatgagag aactctagac tttcatgact caaatgtcaa gaacctttac gacaaggtcc 9660
gactacagct tagggataat gcaaaggagc ttggtaacgg ttgtttcgag ttctatcaca 9720
gatgtgataa tgaatgtatg gaaagtgtaa gaaacggaac gtatgactac ccgcagtatt 9780
cagaagaagc aagattaaaa agagaggaaa taagtggagt aaaattggaa tcaataggaa 9840
cttaccaaat actgtcaatt tattcaacag tggcgagctc cctagcactg gcaatcatgg 9900
tggctggtct atctttatgg atgtgctcca atggatcgtt acaatgcaga atttgcattt 9960
aaggcgcgcc cacccagcgg ccgcccgcta cgccccaatg atccgaccag caaaactcga 10020
tgtacttccg aggaactgat gtgcataatg catcaggctg gtacattaga tccccgctta 10080
ccgcgggcaa tatagcaaca ctaaaaactc gatgtacttc cgaggaagcg cagtgcataa 10140
tgctgcgcag tgttgccaca taaccactat attaaccatt tatctagcgg acgccaaaaa 10200
ctcaatgtat ttctgaggaa gcgtggtgca taatgccacg cagcgtctgc ataactttta 10260
ttatttcttt tattaatcaa caaaattttg tttttaacat ttcaaaaaaa aaaaaaaaaa 10320
aaaaaaaaaa aaaaaaaaaa gaagagcgtt taaacacgtg atatctggcc tcatgggcct 10380
tcctttcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taacatggtc 10440
atagctgttt ccttgcgtat tgggcgctct ccgcttcctc gctcactgac tcgctgcgct 10500
cggtcgttcg ggtaaagcct ggggtgccta atgagcaaaa ggccagcaaa aggccaggaa 10560
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 10620
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 10680
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 10740
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 10800
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 10860
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 10920
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 10980
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa cagtatttgg 11040
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 11100
caaacaaacc accgctggta gcggtggttt ttttgtttgc aggcagcaga ttacgcgcag 11160
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 11220
cgaaaactca cgttaaggga ttttggtcat gaatacacgg tgcctgactg cgttagcaat 11280
ttaactgtga taaactaccg cattaaagct tatcgatgat aagctgtcaa acatgagaat 11340
tcttagaaaa actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca 11400
ataccatatt tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc 11460
cataggatgg caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa 11520
cctattaatt tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg 11580
actgaatccg gtgagaatgg caaaagctta tgcatttctt tccagacttg ttcaacaggc 11640
cagccattac gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat 11700
tgcgcctgag cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc 11760
gaatgcaacc ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga 11820
tattcttcta atacctggaa tgctgttttc ccggggatcg cagtggtgag taaccatgca 11880
tcatcaggag tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag 11940
tttagtctga ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga 12000
aacaactctg gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg 12060
acattatcgc gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc 12120
ggcctcgagc aagacgtttc ccgttgaata tggctcataa caccccttgt attactgttt 12180
atgtaagcag acagttttat tgttcatgag cggatacata tttgaatgta tttagaaaaa 12240
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctaaat tgtaagcgtt 12300
aatattttgt taaaattcgc gttaaatttt tgttaaatca gctcattttt taaccaatag 12360
gccgaaatcg gcaaaatccc ttataaatca aaagaataga ccgagatagg gttgagtggc 12420
cgctacaggg cgctcccatt cgccattcag gctgcgcaac tgttgggaag ggcgtttcgg 12480
tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa 12540
gttgggtaac gccagggttt tcccagtcac acgcgtaata cgactcacta tag 12593
<210> 22
<211> 13032
<212> DNA
<213> 人工序列
<220>
<223> 构建体F570的核苷酸序列
<400> 22
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggagaaa atagtgcttc ttcttgcaat agtcagcctt gttaaaagtg atcagatttg 7620
cattggttac catgcaaaca actcgacaga gcaggttgac acaataatgg aaaagaacgt 7680
cactgttaca cacgcccaag acatactgga aaagacacac aacgggaaac tctgcgatct 7740
agatggagtg aagcctctaa ttttaagaga ttgtagtgta gctggatggc tcctcgggaa 7800
cccaatgtgt gacgaattcc tcaatgtgcc ggaatggtct tacatagtgg agaagatcaa 7860
tccagccaat gacctctgtt acccagggaa tttcaacgac tatgaagaac tgaaacacct 7920
attgagcaga ataaaccatt ttgagaaaat tcagatcatc cccaaaagtt cttggtcaga 7980
tcatgaagcc tcagcagggg tgagctcagc atgtccatac cagggaaggt cctccttttt 8040
tagaaatgtg gtatggctta tcaaaaagga caatgcatac ccaacaataa agagaagtta 8100
caataatacc aaccaagaag atcttttggt attgtggggg attcaccatc caaatgatgc 8160
ggcagagcag acaaggctct atcaaaaccc aactacctat atttccgttg ggacatcaac 8220
actaaaccag agattggtac caaaaatagc cactagatct aaggtaaacg ggcaaagtgg 8280
aaggatggag ttcttttgga caattttaaa accgaatgat gcaataaact ttgagagtaa 8340
tggaaatttc attgctccag aaaatgcata caaaattgtc aagaaagggg actcaacaat 8400
tatgaaaagt gagttggaat atggtaactg caacaccaag tgtcaaactc caataggggc 8460
gataaactct agtatgccat tccacaacat ccaccctctc accatcgggg aatgccccaa 8520
atatgtgaaa tcaagcagat tagtccttgc tactgggctc agaaatagcc ctcaacgaga 8580
gacacgagga ctatttggag ctatagcagg ttttatagag ggaggatggg gaatggtaga 8640
tggttggtat gggtaccacc atagcaacga gcaggggagt gggtacgctg cagacaaaga 8700
atccactcaa aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat 8760
gaacactcag tttgaggctg ttggaaggga atttaataac ttagaaagga gaatagaaaa 8820
tttaaacaag aagatggaag acggattcct agatgtctgg acttataatg ctgaacttct 8880
ggttctcatg gaaaatgaga gaactctaga ctttcatgac tcaaatgtca agaaccttta 8940
cgacaaggtc cgactacagc ttagggataa tgcaaaggag cttggtaacg gttgtttcga 9000
gttctatcac agatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta 9060
cccgcagtat tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga 9120
atcaatagga acttaccaaa tactgtcaat ttattcaaca gtggcgagct ccctagcact 9180
ggcaatcatg gtggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag 9240
aatttgcatt taaccccccc ccctaacgtt actggccgaa gccgcttgga ataaggccgg 9300
tgtgcgtttg tctatatgtt attttccacc atattgccgt cttttggcaa tgtgagggcc 9360
cggaaacctg gccctgtctt cttgacgagc attcctaggg gtctttcccc tctcgccaaa 9420
ggaatgcaag gtctgttgaa tgtcgtgaag gaagcagttc ctctggaagc ttcttgaaga 9480
caaacaacgt ctgtagcgac cctttgcagg cagcggaacc ccccacctgg cgacaggtgc 9540
ctctgcggcc aaaagccacg tgtataagat acacctgcaa aggcggcaca accccagtgc 9600
cacgttgtga gttggatagt tgtggaaaga gtcaaatggc tctcctcaag cgtattcaac 9660
aaggggctga aggatgccca gaaggtaccc cattgtatgg gatctgatct ggggcctcgg 9720
tgcacatgct ttacatgtgt ttagtcgagg ttaaaaaacg tctaggcccc ccgaaccacg 9780
gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaaccat gagcaagatc 9840
tacatcgacg agcggagcaa cgccgagatt gtgtgcgagg ccatcaagac catcggaatc 9900
gaaggcgcca cagccgctca gctgaccaga cagctgaaca tggaaaagcg ggaagtgaac 9960
aaggccctgt acgacctgca gagaagcgcc atggtgtaca gcagcgacga catccctcct 10020
cggtggttta tgaccacaga ggccgacaag cctgacgccg atgctatggc cgacgtgatc 10080
atcgacgacg tgtcccgcga gaagtccatg agagaggacc acaagagctt cgacgatgtg 10140
atccccgcca agaagatcat cgattggaag ggcgccaatc ctgtgaccgt gatcaacgag 10200
tactgccaga tcaccagaag agactggtcc ttccggatcg agagcgtggg acctagcaat 10260
agccctacct tctacgcctg cgtggacatc gacggcagag tgttcgataa ggccgacggc 10320
aagagcaagc gggacgccaa aaacaatgcc gccaagctgg ccgtggataa gctgctgggc 10380
tatgtgatca tccggttcta aggcgcgccc acccagcggc cgcccgctac gccccaatga 10440
tccgaccagc aaaactcgat gtacttccga ggaactgatg tgcataatgc atcaggctgg 10500
tacattagat ccccgcttac cgcgggcaat atagcaacac taaaaactcg atgtacttcc 10560
gaggaagcgc agtgcataat gctgcgcagt gttgccacat aaccactata ttaaccattt 10620
atctagcgga cgccaaaaac tcaatgtatt tctgaggaag cgtggtgcat aatgccacgc 10680
agcgtctgca taacttttat tatttctttt attaatcaac aaaattttgt ttttaacatt 10740
tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaag aagagcgttt aaacacgtga 10800
tatctggcct catgggcctt cctttcactg cccgctttcc agtcgggaaa cctgtcgtgc 10860
cagctgcatt aacatggtca tagctgtttc cttgcgtatt gggcgctctc cgcttcctcg 10920
ctcactgact cgctgcgctc ggtcgttcgg gtaaagcctg gggtgcctaa tgagcaaaag 10980
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 11040
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 11100
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 11160
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 11220
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 11280
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 11340
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 11400
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 11460
ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 11520
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 11580
ggcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 11640
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg aatacacggt 11700
gcctgactgc gttagcaatt taactgtgat aaactaccgc attaaagctt atcgatgata 11760
agctgtcaaa catgagaatt cttagaaaaa ctcatcgagc atcaaatgaa actgcaattt 11820
attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta atgaaggaga 11880
aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg cgattccgac 11940
tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt tatcaagtga 12000
gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagcttat gcatttcttt 12060
ccagacttgt tcaacaggcc agccattacg ctcgtcatca aaatcactcg catcaaccaa 12120
accgttattc attcgtgatt gcgcctgagc gagacgaaat acgcgatcgc tgttaaaagg 12180
acaattacaa acaggaatcg aatgcaaccg gcgcaggaac actgccagcg catcaacaat 12240
attttcacct gaatcaggat attcttctaa tacctggaat gctgttttcc cggggatcgc 12300
agtggtgagt aaccatgcat catcaggagt acggataaaa tgcttgatgg tcggaagagg 12360
cataaattcc gtcagccagt ttagtctgac catctcatct gtaacatcat tggcaacgct 12420
acctttgcca tgtttcagaa acaactctgg cgcatcgggc ttcccataca atcgatagat 12480
tgtcgcacct gattgcccga cattatcgcg agcccattta tacccatata aatcagcatc 12540
catgttggaa tttaatcgcg gcctcgagca agacgtttcc cgttgaatat ggctcataac 12600
accccttgta ttactgttta tgtaagcaga cagttttatt gttcatgagc ggatacatat 12660
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 12720
cacctaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 12780
ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 12840
cgagataggg ttgagtggcc gctacagggc gctcccattc gccattcagg ctgcgcaact 12900
gttgggaagg gcgtttcggt gcgggcctct tcgctattac gccagctggc gaaaggggga 12960
tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcaca cgcgtaatac 13020
gactcactat ag 13032
<210> 23
<211> 12692
<212> DNA
<213> 人工序列
<220>
<223> 构建体F576的核苷酸序列
<400> 23
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggagaaa atagtgcttc ttcttgcaat agtcagcctt gttaaaagtg atcagatttg 7620
cattggttac catgcaaaca actcgacaga gcaggttgac acaataatgg aaaagaacgt 7680
cactgttaca cacgcccaag acatactgga aaagacacac aacgggaaac tctgcgatct 7740
agatggagtg aagcctctaa ttttaagaga ttgtagtgta gctggatggc tcctcgggaa 7800
cccaatgtgt gacgaattcc tcaatgtgcc ggaatggtct tacatagtgg agaagatcaa 7860
tccagccaat gacctctgtt acccagggaa tttcaacgac tatgaagaac tgaaacacct 7920
attgagcaga ataaaccatt ttgagaaaat tcagatcatc cccaaaagtt cttggtcaga 7980
tcatgaagcc tcagcagggg tgagctcagc atgtccatac cagggaaggt cctccttttt 8040
tagaaatgtg gtatggctta tcaaaaagga caatgcatac ccaacaataa agagaagtta 8100
caataatacc aaccaagaag atcttttggt attgtggggg attcaccatc caaatgatgc 8160
ggcagagcag acaaggctct atcaaaaccc aactacctat atttccgttg ggacatcaac 8220
actaaaccag agattggtac caaaaatagc cactagatct aaggtaaacg ggcaaagtgg 8280
aaggatggag ttcttttgga caattttaaa accgaatgat gcaataaact ttgagagtaa 8340
tggaaatttc attgctccag aaaatgcata caaaattgtc aagaaagggg actcaacaat 8400
tatgaaaagt gagttggaat atggtaactg caacaccaag tgtcaaactc caataggggc 8460
gataaactct agtatgccat tccacaacat ccaccctctc accatcgggg aatgccccaa 8520
atatgtgaaa tcaagcagat tagtccttgc tactgggctc agaaatagcc ctcaacgaga 8580
gacacgagga ctatttggag ctatagcagg ttttatagag ggaggatggg gaatggtaga 8640
tggttggtat gggtaccacc atagcaacga gcaggggagt gggtacgctg cagacaaaga 8700
atccactcaa aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat 8760
gaacactcag tttgaggctg ttggaaggga atttaataac ttagaaagga gaatagaaaa 8820
tttaaacaag aagatggaag acggattcct agatgtctgg acttataatg ctgaacttct 8880
ggttctcatg gaaaatgaga gaactctaga ctttcatgac tcaaatgtca agaaccttta 8940
cgacaaggtc cgactacagc ttagggataa tgcaaaggag cttggtaacg gttgtttcga 9000
gttctatcac agatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta 9060
cccgcagtat tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga 9120
atcaatagga acttaccaaa tactgtcaat ttattcaaca gtggcgagct ccctagcact 9180
ggcaatcatg gtggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag 9240
aatttgcatt taactctcta cggctaacct gaatggacta cgacatagtc tagtccgcca 9300
agatgagtct tctaaccgag gtcgaaacgt acgtactctc tatcatcccg tcaggccccc 9360
tcaaagccga gatcgcacag agacttgaag atgtctttgc agggaagaac accgatcttg 9420
aggttctcat ggaatggcta aagacaagac caatcctgtc acctctgact aaggggattt 9480
taggatttgt gttcacgctc accgtgccca gtgagcgagg actgcagcgt agacgctttg 9540
tccaaaatgc ccttaatggg aacggggatc caaataacat ggacaaagca gttaaactgt 9600
ataggaagct caagagggag ataacattcc atggggccaa agaaatctca ctcagttatt 9660
ctgctggtgc acttgccagt tgtatgggcc tcatatacaa caggatgggg gctgtgacca 9720
ctgaagtggc atttggcctg gtatgtgcaa cctgtgaaca gattgctgac tcccagcatc 9780
ggtctcatag gcaaatggtg acaacaacca atccactaat cagacatgag aacagaatgg 9840
ttttagccag cactacagct aaggctatgg agcaaatggc tggatcgagt gagcaagcag 9900
cagaggccat ggaggttgct agtcaggcta gacaaatggt gcaagcgatg agaaccattg 9960
ggactcatcc tagctccagt gctggtctga aaaatgatct tcttgaaaat ttgcaggcct 10020
atcagaaacg aatgggggtg cagatgcaac ggttcaagtg aggcgcgccc acccagcggc 10080
cgcccgctac gccccaatga tccgaccagc aaaactcgat gtacttccga ggaactgatg 10140
tgcataatgc atcaggctgg tacattagat ccccgcttac cgcgggcaat atagcaacac 10200
taaaaactcg atgtacttcc gaggaagcgc agtgcataat gctgcgcagt gttgccacat 10260
aaccactata ttaaccattt atctagcgga cgccaaaaac tcaatgtatt tctgaggaag 10320
cgtggtgcat aatgccacgc agcgtctgca taacttttat tatttctttt attaatcaac 10380
aaaattttgt ttttaacatt tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaag 10440
aagagcgttt aaacacgtga tatctggcct catgggcctt cctttcactg cccgctttcc 10500
agtcgggaaa cctgtcgtgc cagctgcatt aacatggtca tagctgtttc cttgcgtatt 10560
gggcgctctc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg gtaaagcctg 10620
gggtgcctaa tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 10680
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 10740
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 10800
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 10860
gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 10920
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 10980
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 11040
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 11100
gtggcctaac tacggctaca ctagaagaac agtatttggt atctgcgctc tgctgaagcc 11160
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 11220
cggtggtttt tttgtttgca ggcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 11280
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 11340
tttggtcatg aatacacggt gcctgactgc gttagcaatt taactgtgat aaactaccgc 11400
attaaagctt atcgatgata agctgtcaaa catgagaatt cttagaaaaa ctcatcgagc 11460
atcaaatgaa actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc 11520
cgtttctgta atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg 11580
tatcggtctg cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca 11640
aaaataaggt tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc 11700
aaaagcttat gcatttcttt ccagacttgt tcaacaggcc agccattacg ctcgtcatca 11760
aaatcactcg catcaaccaa accgttattc attcgtgatt gcgcctgagc gagacgaaat 11820
acgcgatcgc tgttaaaagg acaattacaa acaggaatcg aatgcaaccg gcgcaggaac 11880
actgccagcg catcaacaat attttcacct gaatcaggat attcttctaa tacctggaat 11940
gctgttttcc cggggatcgc agtggtgagt aaccatgcat catcaggagt acggataaaa 12000
tgcttgatgg tcggaagagg cataaattcc gtcagccagt ttagtctgac catctcatct 12060
gtaacatcat tggcaacgct acctttgcca tgtttcagaa acaactctgg cgcatcgggc 12120
ttcccataca atcgatagat tgtcgcacct gattgcccga cattatcgcg agcccattta 12180
tacccatata aatcagcatc catgttggaa tttaatcgcg gcctcgagca agacgtttcc 12240
cgttgaatat ggctcataac accccttgta ttactgttta tgtaagcaga cagttttatt 12300
gttcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg 12360
cacatttccc cgaaaagtgc cacctaaatt gtaagcgtta atattttgtt aaaattcgcg 12420
ttaaattttt gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg caaaatccct 12480
tataaatcaa aagaatagac cgagataggg ttgagtggcc gctacagggc gctcccattc 12540
gccattcagg ctgcgcaact gttgggaagg gcgtttcggt gcgggcctct tcgctattac 12600
gccagctggc gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt 12660
cccagtcaca cgcgtaatac gactcactat ag 12692
<210> 24
<211> 14091
<212> DNA
<213> 人工序列
<220>
<223> 构建体F584的核苷酸序列
<400> 24
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgagtctt ctaaccgagg tcgaaacgta cgtactctct atcatcccgt caggccccct 7620
caaagccgag atcgcacaga gacttgaaga tgtctttgca gggaagaaca ccgatcttga 7680
ggttctcatg gaatggctaa agacaagacc aatcctgtca cctctgacta aggggatttt 7740
aggatttgtg ttcacgctca ccgtgcccag tgagcgagga ctgcagcgta gacgctttgt 7800
ccaaaatgcc cttaatggga acggggatcc aaataacatg gacaaagcag ttaaactgta 7860
taggaagctc aagagggaga taacattcca tggggccaaa gaaatctcac tcagttattc 7920
tgctggtgca cttgccagtt gtatgggcct catatacaac aggatggggg ctgtgaccac 7980
tgaagtggca tttggcctgg tatgtgcaac ctgtgaacag attgctgact cccagcatcg 8040
gtctcatagg caaatggtga caacaaccaa tccactaatc agacatgaga acagaatggt 8100
tttagccagc actacagcta aggctatgga gcaaatggct ggatcgagtg agcaagcagc 8160
agaggccatg gaggttgcta gtcaggctag acaaatggtg caagcgatga gaaccattgg 8220
gactcatcct agctccagtg ctggtctgaa aaatgatctt cttgaaaatt tgcaggccta 8280
tcagaaacga atgggggtgc agatgcaacg gttcaagtga ctctctacgg ctaacctgaa 8340
tggactacga catagtctag tccgccaaga tgaatccaaa tcagaagata ataaccatcg 8400
gatcaatctg tatggtaatt ggaatagtta gcttaatgtt acaaattggg aacatgatct 8460
caatatgggt cagtcattca attcagacag ggaatcaatg ccaagctgaa ccaatcagca 8520
atactaaatt tcttactgag aaagctgtgg cttcagtaac attagcgggc aattcatctc 8580
tttgccccat tagcggatgg gctgtataca gtaaggacaa cagtataagg atcggttcca 8640
ggggggatgt gtttgttata agagagccgt tcatctcatg ctcccacttg gaatgcagaa 8700
ctttcttttt gactcaggga gccttgctga atgacaagca ctccaatggg actgtcaaag 8760
acagaagccc tcacagaaca ttaatgagtt gtcctgtggg tgaggctccc tccccatata 8820
actcaaggtt tgagtctgtt gcttggtcag caagtgcttg ccatgatggc accagttggt 8880
tgacaattgg aatttctggt ccagacaatg gggctgtggc tgtattgaaa tacaatggca 8940
taataacaga caccatcaag agttggagga acaacatact gagaactcaa gagtctgaat 9000
gtgcatgtgt aaatggctct tgctttactg taatgactga tggaccaagt agtgggcagg 9060
catcatataa gatcttcaaa atggaaaaag ggaaagtggt taaatcagtc gaattggatg 9120
ctcctaatta tcactatgag gagtgctcct gttatcctga tgccggcgaa atcacatgtg 9180
tgtgcaggga taattggcat ggctcaaata ggccatgggt atctttcaat caaaatttgg 9240
agtatcaaat aggatatata tgcagtggag ttttcggaga caatccacgc cccaatgatg 9300
gaacaggtag ttgtggtccg gtgttctcta acggggcata tggggtaaaa gggttttcat 9360
tcaaatacgg caatggtgtt tggatcggga gaaccaaaag cactaattcc aggagcggct 9420
ttgaaatgat ttgggaccca aatgggtgga ctggaacgga cagtagcttt tcggtgaagc 9480
aagatatcgt agcaataact gattggtcag gatatagcgg gagttttgtc cagcatccag 9540
aactgacagg attagattgc ataagacctt gtttctgggt tgagttaatc agagggcggc 9600
ctaaagagag cacaatttgg accagtggga gcagcatatc tttttgtggt gtaaatagtg 9660
acactgttag ttggtcttgg ccagacggtg ctgagttgcc attcaccatt gacaagtagc 9720
tctctacggc taacctgaat ggactacgac atagtctagt ccgccaagat ggagaaaata 9780
gtgcttcttc ttgcaatagt cagccttgtt aaaagtgatc agatttgcat tggttaccat 9840
gcaaacaact cgacagagca ggttgacaca ataatggaaa agaacgtcac tgttacacac 9900
gcccaagaca tactggaaaa gacacacaac gggaaactct gcgatctaga tggagtgaag 9960
cctctaattt taagagattg tagtgtagct ggatggctcc tcgggaaccc aatgtgtgac 10020
gaattcctca atgtgccgga atggtcttac atagtggaga agatcaatcc agccaatgac 10080
ctctgttacc cagggaattt caacgactat gaagaactga aacacctatt gagcagaata 10140
aaccattttg agaaaattca gatcatcccc aaaagttctt ggtcagatca tgaagcctca 10200
gcaggggtga gctcagcatg tccataccag ggaaggtcct ccttttttag aaatgtggta 10260
tggcttatca aaaaggacaa tgcataccca acaataaaga gaagttacaa taataccaac 10320
caagaagatc ttttggtatt gtgggggatt caccatccaa atgatgcggc agagcagaca 10380
aggctctatc aaaacccaac tacctatatt tccgttggga catcaacact aaaccagaga 10440
ttggtaccaa aaatagccac tagatctaag gtaaacgggc aaagtggaag gatggagttc 10500
ttttggacaa ttttaaaacc gaatgatgca ataaactttg agagtaatgg aaatttcatt 10560
gctccagaaa atgcatacaa aattgtcaag aaaggggact caacaattat gaaaagtgag 10620
ttggaatatg gtaactgcaa caccaagtgt caaactccaa taggggcgat aaactctagt 10680
atgccattcc acaacatcca ccctctcacc atcggggaat gccccaaata tgtgaaatca 10740
agcagattag tccttgctac tgggctcaga aatagccctc aacgagagac acgaggacta 10800
tttggagcta tagcaggttt tatagaggga ggatggggaa tggtagatgg ttggtatggg 10860
taccaccata gcaacgagca ggggagtggg tacgctgcag acaaagaatc cactcaaaag 10920
gcaatagatg gagtcaccaa taaggtcaac tcgatcattg acaaaatgaa cactcagttt 10980
gaggctgttg gaagggaatt taataactta gaaaggagaa tagaaaattt aaacaagaag 11040
atggaagacg gattcctaga tgtctggact tataatgctg aacttctggt tctcatggaa 11100
aatgagagaa ctctagactt tcatgactca aatgtcaaga acctttacga caaggtccga 11160
ctacagctta gggataatgc aaaggagctt ggtaacggtt gtttcgagtt ctatcacaga 11220
tgtgataatg aatgtatgga aagtgtaaga aacggaacgt atgactaccc gcagtattca 11280
gaagaagcaa gattaaaaag agaggaaata agtggagtaa aattggaatc aataggaact 11340
taccaaatac tgtcaattta ttcaacagtg gcgagctccc tagcactggc aatcatggtg 11400
gctggtctat ctttatggat gtgctccaat ggatcgttac aatgcagaat ttgcatttaa 11460
ggcgcgccca cccagcggcc gcccgctacg ccccaatgat ccgaccagca aaactcgatg 11520
tacttccgag gaactgatgt gcataatgca tcaggctggt acattagatc cccgcttacc 11580
gcgggcaata tagcaacact aaaaactcga tgtacttccg aggaagcgca gtgcataatg 11640
ctgcgcagtg ttgccacata accactatat taaccattta tctagcggac gccaaaaact 11700
caatgtattt ctgaggaagc gtggtgcata atgccacgca gcgtctgcat aacttttatt 11760
atttctttta ttaatcaaca aaattttgtt tttaacattt caaaaaaaaa aaaaaaaaaa 11820
aaaaaaaaaa aaaaaaaaga agagcgttta aacacgtgat atctggcctc atgggccttc 11880
ctttcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta acatggtcat 11940
agctgtttcc ttgcgtattg ggcgctctcc gcttcctcgc tcactgactc gctgcgctcg 12000
gtcgttcggg taaagcctgg ggtgcctaat gagcaaaagg ccagcaaaag gccaggaacc 12060
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 12120
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 12180
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 12240
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 12300
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 12360
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 12420
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 12480
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 12540
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 12600
aacaaaccac cgctggtagc ggtggttttt ttgtttgcag gcagcagatt acgcgcagaa 12660
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 12720
aaaactcacg ttaagggatt ttggtcatga atacacggtg cctgactgcg ttagcaattt 12780
aactgtgata aactaccgca ttaaagctta tcgatgataa gctgtcaaac atgagaattc 12840
ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 12900
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 12960
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 13020
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 13080
tgaatccggt gagaatggca aaagcttatg catttctttc cagacttgtt caacaggcca 13140
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 13200
cgcctgagcg agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 13260
atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 13320
ttcttctaat acctggaatg ctgttttccc ggggatcgca gtggtgagta accatgcatc 13380
atcaggagta cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt 13440
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 13500
caactctggc gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac 13560
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 13620
cctcgagcaa gacgtttccc gttgaatatg gctcataaca ccccttgtat tactgtttat 13680
gtaagcagac agttttattg ttcatgagcg gatacatatt tgaatgtatt tagaaaaata 13740
aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctaaattg taagcgttaa 13800
tattttgtta aaattcgcgt taaatttttg ttaaatcagc tcatttttta accaataggc 13860
cgaaatcggc aaaatccctt ataaatcaaa agaatagacc gagatagggt tgagtggccg 13920
ctacagggcg ctcccattcg ccattcaggc tgcgcaactg ttgggaaggg cgtttcggtg 13980
cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt 14040
tgggtaacgc cagggttttc ccagtcacac gcgtaatacg actcactata g 14091
<210> 25
<211> 14434
<212> DNA
<213> 人工序列
<220>
<223> 构建体F590的核苷酸序列
<400> 25
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgagtctt ctaaccgagg tcgaaacgta cgtactctct atcatcccgt caggccccct 7620
caaagccgag atcgcacaga gacttgaaga tgtctttgca gggaagaaca ccgatcttga 7680
ggttctcatg gaatggctaa agacaagacc aatcctgtca cctctgacta aggggatttt 7740
aggatttgtg ttcacgctca ccgtgcccag tgagcgagga ctgcagcgta gacgctttgt 7800
ccaaaatgcc cttaatggga acggggatcc aaataacatg gacaaagcag ttaaactgta 7860
taggaagctc aagagggaga taacattcca tggggccaaa gaaatctcac tcagttattc 7920
tgctggtgca cttgccagtt gtatgggcct catatacaac aggatggggg ctgtgaccac 7980
tgaagtggca tttggcctgg tatgtgcaac ctgtgaacag attgctgact cccagcatcg 8040
gtctcatagg caaatggtga caacaaccaa tccactaatc agacatgaga acagaatggt 8100
tttagccagc actacagcta aggctatgga gcaaatggct ggatcgagtg agcaagcagc 8160
agaggccatg gaggttgcta gtcaggctag acaaatggtg caagcgatga gaaccattgg 8220
gactcatcct agctccagtg ctggtctgaa aaatgatctt cttgaaaatt tgcaggccta 8280
tcagaaacga atgggggtgc agatgcaacg gttcaagtga ctctctacgg ctaacctgaa 8340
tggactacga catagtctag tccgccaaga tgagtcttct aaccgaggtc gaaacgccta 8400
tcagaaacga atgggggtgc agatgcaacg gttcaagtga tcctctcact attgccgcaa 8460
atatcattgg gatcttgcac ttgacattgt ggattcttga tcgtcttttt ttcaaatgca 8520
tttaccgtcg ctttaaatac ggactgaaag gagggccttc tacggaagga gtgccaaagt 8580
ctatgaggga agaatatcga aaggaacagc agagtgctgt ggatgctgac gatggtcatt 8640
ttgtcagcat agagctggag taactctcta cggctaacct gaatggacta cgacatagtc 8700
tagtccgcca agatgaatcc aaatcagaag ataataacca tcggatcaat ctgtatggta 8760
attggaatag ttagcttaat gttacaaatt gggaacatga tctcaatatg ggtcagtcat 8820
tcaattcaga cagggaatca atgccaagct gaaccaatca gcaatactaa atttcttact 8880
gagaaagctg tggcttcagt aacattagcg ggcaattcat ctctttgccc cattagcgga 8940
tgggctgtat acagtaagga caacagtata aggatcggtt ccagggggga tgtgtttgtt 9000
ataagagagc cgttcatctc atgctcccac ttggaatgca gaactttctt tttgactcag 9060
ggagccttgc tgaatgacaa gcactccaat gggactgtca aagacagaag ccctcacaga 9120
acattaatga gttgtcctgt gggtgaggct ccctccccat ataactcaag gtttgagtct 9180
gttgcttggt cagcaagtgc ttgccatgat ggcaccagtt ggttgacaat tggaatttct 9240
ggtccagaca atggggctgt ggctgtattg aaatacaatg gcataataac agacaccatc 9300
aagagttgga ggaacaacat actgagaact caagagtctg aatgtgcatg tgtaaatggc 9360
tcttgcttta ctgtaatgac tgatggacca agtagtgggc aggcatcata taagatcttc 9420
aaaatggaaa aagggaaagt ggttaaatca gtcgaattgg atgctcctaa ttatcactat 9480
gaggagtgct cctgttatcc tgatgccggc gaaatcacat gtgtgtgcag ggataattgg 9540
catggctcaa ataggccatg ggtatctttc aatcaaaatt tggagtatca aataggatat 9600
atatgcagtg gagttttcgg agacaatcca cgccccaatg atggaacagg tagttgtggt 9660
ccggtgttct ctaacggggc atatggggta aaagggtttt cattcaaata cggcaatggt 9720
gtttggatcg ggagaaccaa aagcactaat tccaggagcg gctttgaaat gatttgggac 9780
ccaaatgggt ggactggaac ggacagtagc ttttcggtga agcaagatat cgtagcaata 9840
actgattggt caggatatag cgggagtttt gtccagcatc cagaactgac aggattagat 9900
tgcataagac cttgtttctg ggttgagtta atcagagggc ggcctaaaga gagcacaatt 9960
tggaccagtg ggagcagcat atctttttgt ggtgtaaata gtgacactgt tagttggtct 10020
tggccagacg gtgctgagtt gccattcacc attgacaagt agctctctac ggctaacctg 10080
aatggactac gacatagtct agtccgccaa gatggagaaa atagtgcttc ttcttgcaat 10140
agtcagcctt gttaaaagtg atcagatttg cattggttac catgcaaaca actcgacaga 10200
gcaggttgac acaataatgg aaaagaacgt cactgttaca cacgcccaag acatactgga 10260
aaagacacac aacgggaaac tctgcgatct agatggagtg aagcctctaa ttttaagaga 10320
ttgtagtgta gctggatggc tcctcgggaa cccaatgtgt gacgaattcc tcaatgtgcc 10380
ggaatggtct tacatagtgg agaagatcaa tccagccaat gacctctgtt acccagggaa 10440
tttcaacgac tatgaagaac tgaaacacct attgagcaga ataaaccatt ttgagaaaat 10500
tcagatcatc cccaaaagtt cttggtcaga tcatgaagcc tcagcagggg tgagctcagc 10560
atgtccatac cagggaaggt cctccttttt tagaaatgtg gtatggctta tcaaaaagga 10620
caatgcatac ccaacaataa agagaagtta caataatacc aaccaagaag atcttttggt 10680
attgtggggg attcaccatc caaatgatgc ggcagagcag acaaggctct atcaaaaccc 10740
aactacctat atttccgttg ggacatcaac actaaaccag agattggtac caaaaatagc 10800
cactagatct aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa 10860
accgaatgat gcaataaact ttgagagtaa tggaaatttc attgctccag aaaatgcata 10920
caaaattgtc aagaaagggg actcaacaat tatgaaaagt gagttggaat atggtaactg 10980
caacaccaag tgtcaaactc caataggggc gataaactct agtatgccat tccacaacat 11040
ccaccctctc accatcgggg aatgccccaa atatgtgaaa tcaagcagat tagtccttgc 11100
tactgggctc agaaatagcc ctcaacgaga gacacgagga ctatttggag ctatagcagg 11160
ttttatagag ggaggatggg gaatggtaga tggttggtat gggtaccacc atagcaacga 11220
gcaggggagt gggtacgctg cagacaaaga atccactcaa aaggcaatag atggagtcac 11280
caataaggtc aactcgatca ttgacaaaat gaacactcag tttgaggctg ttggaaggga 11340
atttaataac ttagaaagga gaatagaaaa tttaaacaag aagatggaag acggattcct 11400
agatgtctgg acttataatg ctgaacttct ggttctcatg gaaaatgaga gaactctaga 11460
ctttcatgac tcaaatgtca agaaccttta cgacaaggtc cgactacagc ttagggataa 11520
tgcaaaggag cttggtaacg gttgtttcga gttctatcac agatgtgata atgaatgtat 11580
ggaaagtgta agaaacggaa cgtatgacta cccgcagtat tcagaagaag caagattaaa 11640
aagagaggaa ataagtggag taaaattgga atcaatagga acttaccaaa tactgtcaat 11700
ttattcaaca gtggcgagct ccctagcact ggcaatcatg gtggctggtc tatctttatg 11760
gatgtgctcc aatggatcgt tacaatgcag aatttgcatt taaggcgcgc ccacccagcg 11820
gccgcccgct acgccccaat gatccgacca gcaaaactcg atgtacttcc gaggaactga 11880
tgtgcataat gcatcaggct ggtacattag atccccgctt accgcgggca atatagcaac 11940
actaaaaact cgatgtactt ccgaggaagc gcagtgcata atgctgcgca gtgttgccac 12000
ataaccacta tattaaccat ttatctagcg gacgccaaaa actcaatgta tttctgagga 12060
agcgtggtgc ataatgccac gcagcgtctg cataactttt attatttctt ttattaatca 12120
acaaaatttt gtttttaaca tttcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 12180
agaagagcgt ttaaacacgt gatatctggc ctcatgggcc ttcctttcac tgcccgcttt 12240
ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt tccttgcgta 12300
ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc gggtaaagcc 12360
tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 12420
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 12480
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 12540
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 12600
tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 12660
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 12720
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 12780
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 12840
tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag 12900
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 12960
agcggtggtt tttttgtttg caggcagcag attacgcgca gaaaaaaagg atctcaagaa 13020
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 13080
attttggtca tgaatacacg gtgcctgact gcgttagcaa tttaactgtg ataaactacc 13140
gcattaaagc ttatcgatga taagctgtca aacatgagaa ttcttagaaa aactcatcga 13200
gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat ttttgaaaaa 13260
gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg gcaagatcct 13320
ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat ttcccctcgt 13380
caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc ggtgagaatg 13440
gcaaaagctt atgcatttct ttccagactt gttcaacagg ccagccatta cgctcgtcat 13500
caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga gcgagacgaa 13560
atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac cggcgcagga 13620
acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct aatacctgga 13680
atgctgtttt cccggggatc gcagtggtga gtaaccatgc atcatcagga gtacggataa 13740
aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg accatctcat 13800
ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct ggcgcatcgg 13860
gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg cgagcccatt 13920
tatacccata taaatcagca tccatgttgg aatttaatcg cggcctcgag caagacgttt 13980
cccgttgaat atggctcata acaccccttg tattactgtt tatgtaagca gacagtttta 14040
ttgttcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 14100
cgcacatttc cccgaaaagt gccacctaaa ttgtaagcgt taatattttg ttaaaattcg 14160
cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc 14220
cttataaatc aaaagaatag accgagatag ggttgagtgg ccgctacagg gcgctcccat 14280
tcgccattca ggctgcgcaa ctgttgggaa gggcgtttcg gtgcgggcct cttcgctatt 14340
acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 14400
ttcccagtca cacgcgtaat acgactcact atag 14434
<210> 26
<211> 13314
<212> DNA
<213> 人工序列
<220>
<223> 构建体F616的核苷酸序列
<400> 26
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatggagaaa atagtgcttc ttcttgcaat agtcagcctt gttaaaagtg atcagatttg 7620
cattggttac catgcaaaca actcgacaga gcaggttgac acaataatgg aaaagaacgt 7680
cactgttaca cacgcccaag acatactgga aaagacacac aacgggaaac tctgcgatct 7740
agatggagtg aagcctctaa ttttaagaga ttgtagtgta gctggatggc tcctcgggaa 7800
cccaatgtgt gacgaattcc tcaatgtgcc ggaatggtct tacatagtgg agaagatcaa 7860
tccagccaat gacctctgtt acccagggaa tttcaacgac tatgaagaac tgaaacacct 7920
attgagcaga ataaaccatt ttgagaaaat tcagatcatc cccaaaagtt cttggtcaga 7980
tcatgaagcc tcagcagggg tgagctcagc atgtccatac cagggaaggt cctccttttt 8040
tagaaatgtg gtatggctta tcaaaaagga caatgcatac ccaacaataa agagaagtta 8100
caataatacc aaccaagaag atcttttggt attgtggggg attcaccatc caaatgatgc 8160
ggcagagcag acaaggctct atcaaaaccc aactacctat atttccgttg ggacatcaac 8220
actaaaccag agattggtac caaaaatagc cactagatct aaggtaaacg ggcaaagtgg 8280
aaggatggag ttcttttgga caattttaaa accgaatgat gcaataaact ttgagagtaa 8340
tggaaatttc attgctccag aaaatgcata caaaattgtc aagaaagggg actcaacaat 8400
tatgaaaagt gagttggaat atggtaactg caacaccaag tgtcaaactc caataggggc 8460
gataaactct agtatgccat tccacaacat ccaccctctc accatcgggg aatgccccaa 8520
atatgtgaaa tcaagcagat tagtccttgc tactgggctc agaaatagcc ctcaacgaga 8580
gacacgagga ctatttggag ctatagcagg ttttatagag ggaggatggg gaatggtaga 8640
tggttggtat gggtaccacc atagcaacga gcaggggagt gggtacgctg cagacaaaga 8700
atccactcaa aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat 8760
gaacactcag tttgaggctg ttggaaggga atttaataac ttagaaagga gaatagaaaa 8820
tttaaacaag aagatggaag acggattcct agatgtctgg acttataatg ctgaacttct 8880
ggttctcatg gaaaatgaga gaactctaga ctttcatgac tcaaatgtca agaaccttta 8940
cgacaaggtc cgactacagc ttagggataa tgcaaaggag cttggtaacg gttgtttcga 9000
gttctatcac agatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta 9060
cccgcagtat tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga 9120
atcaatagga acttaccaaa tactgtcaat ttattcaaca gtggcgagct ccctagcact 9180
ggcaatcatg gtggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag 9240
aatttgcatt taatcattca gctacctgag aggggcccct ataactctct acggctaacc 9300
tgaatggact acgacatagt ctagtccgcc aagatgaatc caaatcagaa gataataacc 9360
atcggatcaa tctgtatggt aattggaata gttagcttaa tgttacaaat tgggaacatg 9420
atctcaatat gggtcagtca ttcaattcag acagggaatc aatgccaagc tgaaccaatc 9480
agcaatacta aatttcttac tgagaaagct gtggcttcag taacattagc gggcaattca 9540
tctctttgcc ccattagcgg atgggctgta tacagtaagg acaacagtat aaggatcggt 9600
tccagggggg atgtgtttgt tataagagag ccgttcatct catgctccca cttggaatgc 9660
agaactttct ttttgactca gggagccttg ctgaatgaca agcactccaa tgggactgtc 9720
aaagacagaa gccctcacag aacattaatg agttgtcctg tgggtgaggc tccctcccca 9780
tataactcaa ggtttgagtc tgttgcttgg tcagcaagtg cttgccatga tggcaccagt 9840
tggttgacaa ttggaatttc tggtccagac aatggggctg tggctgtatt gaaatacaat 9900
ggcataataa cagacaccat caagagttgg aggaacaaca tactgagaac tcaagagtct 9960
gaatgtgcat gtgtaaatgg ctcttgcttt actgtaatga ctgatggacc aagtagtggg 10020
caggcatcat ataagatctt caaaatggaa aaagggaaag tggttaaatc agtcgaattg 10080
gatgctccta attatcacta tgaggagtgc tcctgttatc ctgatgccgg cgaaatcaca 10140
tgtgtgtgca gggataattg gcatggctca aataggccat gggtatcttt caatcaaaat 10200
ttggagtatc aaataggata tatatgcagt ggagttttcg gagacaatcc acgccccaat 10260
gatggaacag gtagttgtgg tccggtgttc tctaacgggg catatggggt aaaagggttt 10320
tcattcaaat acggcaatgg tgtttggatc gggagaacca aaagcactaa ttccaggagc 10380
ggctttgaaa tgatttggga cccaaatggg tggactggaa cggacagtag cttttcggtg 10440
aagcaagata tcgtagcaat aactgattgg tcaggatata gcgggagttt tgtccagcat 10500
ccagaactga caggattaga ttgcataaga ccttgtttct gggttgagtt aatcagaggg 10560
cggcctaaag agagcacaat ttggaccagt gggagcagca tatctttttg tggtgtaaat 10620
agtgacactg ttagttggtc ttggccagac ggtgctgagt tgccattcac cattgacaag 10680
tagggcgcgc ccacccagcg gccgcccgct acgccccaat gatccgacca gcaaaactcg 10740
atgtacttcc gaggaactga tgtgcataat gcatcaggct ggtacattag atccccgctt 10800
accgcgggca atatagcaac actaaaaact cgatgtactt ccgaggaagc gcagtgcata 10860
atgctgcgca gtgttgccac ataaccacta tattaaccat ttatctagcg gacgccaaaa 10920
actcaatgta tttctgagga agcgtggtgc ataatgccac gcagcgtctg cataactttt 10980
attatttctt ttattaatca acaaaatttt gtttttaaca tttcaaaaaa aaaaaaaaaa 11040
aaaaaaaaaa aaaaaaaaaa agaagagcgt ttaaacacgt gatatctggc ctcatgggcc 11100
ttcctttcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt 11160
catagctgtt tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc 11220
tcggtcgttc gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga 11280
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 11340
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 11400
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 11460
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 11520
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 11580
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 11640
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 11700
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 11760
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 11820
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caggcagcag attacgcgca 11880
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 11940
acgaaaactc acgttaaggg attttggtca tgaatacacg gtgcctgact gcgttagcaa 12000
tttaactgtg ataaactacc gcattaaagc ttatcgatga taagctgtca aacatgagaa 12060
ttcttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 12120
aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 12180
ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 12240
acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 12300
gactgaatcc ggtgagaatg gcaaaagctt atgcatttct ttccagactt gttcaacagg 12360
ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 12420
ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 12480
cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 12540
atattcttct aatacctgga atgctgtttt cccggggatc gcagtggtga gtaaccatgc 12600
atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 12660
gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 12720
aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 12780
gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 12840
cggcctcgag caagacgttt cccgttgaat atggctcata acaccccttg tattactgtt 12900
tatgtaagca gacagtttta ttgttcatga gcggatacat atttgaatgt atttagaaaa 12960
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctaaa ttgtaagcgt 13020
taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt ttaaccaata 13080
ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgg 13140
ccgctacagg gcgctcccat tcgccattca ggctgcgcaa ctgttgggaa gggcgtttcg 13200
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 13260
agttgggtaa cgccagggtt ttcccagtca cacgcgtaat acgactcact atag 13314
<210> 27
<211> 12509
<212> DNA
<213> 人工序列
<220>
<223> 构建体F620的核苷酸序列
<400> 27
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgagtctt ctaaccgagg tcgaaacgta cgttctttct atcatcccgt caggccccct 7620
caaagccgag atcgcgcaga gactggaaag tgtctttgca ggaaagaaca cagatcttga 7680
ggctctcatg gaatggctaa agacaagacc aatcttgtca cctctgacta agggaatttt 7740
aggatttgtg ttcacgctca ccgtgcccag tgagcgagga ctgcagcgta gacgctttgt 7800
ccaaaatgcc ctaaatggga atggggaccc gaacaacatg gatagagcag ttaaactata 7860
caagaagctc aaaagagaaa taacgttcca tggggccaag gaggtgtcac taagctattc 7920
aactggtgca cttgccagtt gcatgggcct catatacaac aggatgggaa cagtgaccac 7980
agaagctgct tttggtctag tgtgtgccac ttgtgaacag attgctgatt cacagcatcg 8040
gtctcacaga cagatggcta ctaccaccaa tccactaatc aggcatgaaa acagaatggt 8100
gctggctagc actacggcaa aggctatgga acagatggct ggatcgagtg aacaggcagc 8160
ggaggccatg gaggttgcta atcagactag gcagatggta catgcaatga gaactattgg 8220
gactcatcct agctccagtg ctggtctgaa agatgacctt cttgaaaatt tgcaggccta 8280
ccagaagcga atgggagtgc agatgcagcg attcaagtga gggcccctat aactctctac 8340
ggctaacctg aatggactac gacatagtct agtccgccaa gatggcgtct caaggcacca 8400
aacgatcata tgaacaaatg gagactggtg gggagcgcca ggatgccaca gaaatcagag 8460
catctgtcgg aagaatgatt ggtggaatcg ggagattcta catccaaatg tgcactgaac 8520
tcaaactcag tgattatgat ggacgactaa tccagaatag cataacaata gagaggatgg 8580
tgctttctgc ttttgatgag agaagaaata aatacctaga ggagcatccc agtgctggga 8640
aggaccctaa gaaaacagga ggacccatat atagaagagt agacggaaag tggatgagag 8700
aactcatcct ttatgacaaa gaagaaataa ggagagtttg gcgccaagca aacaatggcg 8760
aagatgcaac agcaggtctt actcatatca tgatttggca ttccaacctg aatgatgcca 8820
catatcagag aacaagagcg cttgttcgca ccggaatgga tcccagaatg tgctctctaa 8880
tgcaaggttc aacacttccc agaaggtctg gtgccgcagg tgctgcggtg aaaggagttg 8940
gaacaatagc aatggagtta atcagaatga tcaaacgtgg aatcaatgac cgaaatttct 9000
ggaggggtga aaatggacga aggacaaggg ttgcttatga aagaatgtgc aatatcctca 9060
aaggaaaatt tcaaacagct gcccagaggg caatgatgga tcaagtaaga gaaagtcgaa 9120
acccaggaaa cgctgagatt gaagacctca ttttcctggc acggtcagca ctcattctga 9180
ggggatcagt tgcacataaa tcctgcctgc ctgcttgtgt gtatgggctt gcagtagcaa 9240
gtgggcatga ctttgaaagg gaagggtact cactggtcgg gatagaccca ttcaaattac 9300
tccaaaacag ccaagtggtc agcctgatga gaccaaatga aaacccagct cacaagagtc 9360
aattggtgtg gatggcatgc cactctgctg catttgaaga tttaagagta tcaagtttca 9420
taagaggaaa gaaagtgatt ccaagaggaa agctttccac aagaggggtc cagattgctt 9480
caaatgagaa tgtggaaacc atggactcca ataccctgga actgagaagc agatactggg 9540
ccataaggac caggagtgga ggaaatacca atcaacaaaa ggcatccgca ggccagatca 9600
gtgtgcagcc tacattctca gtgcagcgga atctcccttt tgaaagagca accgttatgg 9660
cagcattcag cgggaacaat gaaggacgga catccgacat gcgaacagaa gttataagaa 9720
tgatggaaag tgcaaagcca gaagatttgt ccttccaggg gcggggagtc ttcgagctct 9780
cggacgaaaa ggcaacgaac ccgatcgtgc cttcctttga catgagtaat gaagggtctt 9840
atttcttcgg agacaatgca gaggagtatg acagttgagg cgcgcccacc cagcggccgc 9900
ccgctacgcc ccaatgatcc gaccagcaaa actcgatgta cttccgagga actgatgtgc 9960
ataatgcatc aggctggtac attagatccc cgcttaccgc gggcaatata gcaacactaa 10020
aaactcgatg tacttccgag gaagcgcagt gcataatgct gcgcagtgtt gccacataac 10080
cactatatta accatttatc tagcggacgc caaaaactca atgtatttct gaggaagcgt 10140
ggtgcataat gccacgcagc gtctgcataa cttttattat ttcttttatt aatcaacaaa 10200
attttgtttt taacatttca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaag 10260
agcgtttaaa cacgtgatat ctggcctcat gggccttcct ttcactgccc gctttccagt 10320
cgggaaacct gtcgtgccag ctgcattaac atggtcatag ctgtttcctt gcgtattggg 10380
cgctctccgc ttcctcgctc actgactcgc tgcgctcggt cgttcgggta aagcctgggg 10440
tgcctaatga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 10500
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 10560
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 10620
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 10680
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 10740
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 10800
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 10860
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 10920
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 10980
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 11040
tggttttttt gtttgcaggc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 11100
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 11160
ggtcatgaat acacggtgcc tgactgcgtt agcaatttaa ctgtgataaa ctaccgcatt 11220
aaagcttatc gatgataagc tgtcaaacat gagaattctt agaaaaactc atcgagcatc 11280
aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt 11340
ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat 11400
cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa 11460
ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa 11520
agcttatgca tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa 11580
tcactcgcat caaccaaacc gttattcatt cgtgattgcg cctgagcgag acgaaatacg 11640
cgatcgctgt taaaaggaca attacaaaca ggaatcgaat gcaaccggcg caggaacact 11700
gccagcgcat caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaatgct 11760
gttttcccgg ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc 11820
ttgatggtcg gaagaggcat aaattccgtc agccagttta gtctgaccat ctcatctgta 11880
acatcattgg caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc 11940
ccatacaatc gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac 12000
ccatataaat cagcatccat gttggaattt aatcgcggcc tcgagcaaga cgtttcccgt 12060
tgaatatggc tcataacacc ccttgtatta ctgtttatgt aagcagacag ttttattgtt 12120
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 12180
atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa attcgcgtta 12240
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 12300
aaatcaaaag aatagaccga gatagggttg agtggccgct acagggcgct cccattcgcc 12360
attcaggctg cgcaactgtt gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc 12420
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 12480
agtcacacgc gtaatacgac tcactatag 12509
<210> 28
<211> 1497
<212> DNA
<213> 人工序列
<220>
<223> 流感病毒核蛋白的核苷酸序列(A/加利福尼亚/09)
<400> 28
atggcgtctc aaggcaccaa acgatcatat gaacaaatgg agactggtgg ggagcgccag 60
gatgccacag aaatcagagc atctgtcgga agaatgattg gtggaatcgg gagattctac 120
atccaaatgt gcactgaact caaactcagt gattatgatg gacgactaat ccagaatagc 180
ataacaatag agaggatggt gctttctgct tttgatgaga gaagaaataa atacctagag 240
gagcatccca gtgctgggaa ggaccctaag aaaacaggag gacccatata tagaagagta 300
gacggaaagt ggatgagaga actcatcctt tatgacaaag aagaaataag gagagtttgg 360
cgccaagcaa acaatggcga agatgcaaca gcaggtctta ctcatatcat gatttggcat 420
tccaacctga atgatgccac atatcagaga acaagagcgc ttgttcgcac cggaatggat 480
cccagaatgt gctctctaat gcaaggttca acacttccca gaaggtctgg tgccgcaggt 540
gctgcggtga aaggagttgg aacaatagca atggagttaa tcagaatgat caaacgtgga 600
atcaatgacc gaaatttctg gaggggtgaa aatggacgaa ggacaagggt tgcttatgaa 660
agaatgtgca atatcctcaa aggaaaattt caaacagctg cccagagggc aatgatggat 720
caagtaagag aaagtcgaaa cccaggaaac gctgagattg aagacctcat tttcctggca 780
cggtcagcac tcattctgag gggatcagtt gcacataaat cctgcctgcc tgcttgtgtg 840
tatgggcttg cagtagcaag tgggcatgac tttgaaaggg aagggtactc actggtcggg 900
atagacccat tcaaattact ccaaaacagc caagtggtca gcctgatgag accaaatgaa 960
aacccagctc acaagagtca attggtgtgg atggcatgcc actctgctgc atttgaagat 1020
ttaagagtat caagtttcat aagaggaaag aaagtgattc caagaggaaa gctttccaca 1080
agaggggtcc agattgcttc aaatgagaat gtggaaacca tggactccaa taccctggaa 1140
ctgagaagca gatactgggc cataaggacc aggagtggag gaaataccaa tcaacaaaag 1200
gcatccgcag gccagatcag tgtgcagcct acattctcag tgcagcggaa tctccctttt 1260
gaaagagcaa ccgttatggc agcattcagc gggaacaatg aaggacggac atccgacatg 1320
cgaacagaag ttataagaat gatggaaagt gcaaagccag aagatttgtc cttccagggg 1380
cggggagtct tcgagctctc ggacgaaaag gcaacgaacc cgatcgtgcc ttcctttgac 1440
atgagtaatg aagggtctta tttcttcgga gacaatgcag aggagtatga cagttga 1497
<210> 29
<211> 759
<212> DNA
<213> 人工序列
<220>
<223> 甲型流感病毒M1基质蛋白的核苷酸序列(A/加利福尼亚/09)
<400> 29
atgagtcttc taaccgaggt cgaaacgtac gttctttcta tcatcccgtc aggccccctc 60
aaagccgaga tcgcgcagag actggaaagt gtctttgcag gaaagaacac agatcttgag 120
gctctcatgg aatggctaaa gacaagacca atcttgtcac ctctgactaa gggaatttta 180
ggatttgtgt tcacgctcac cgtgcccagt gagcgaggac tgcagcgtag acgctttgtc 240
caaaatgccc taaatgggaa tggggacccg aacaacatgg atagagcagt taaactatac 300
aagaagctca aaagagaaat aacgttccat ggggccaagg aggtgtcact aagctattca 360
actggtgcac ttgccagttg catgggcctc atatacaaca ggatgggaac agtgaccaca 420
gaagctgctt ttggtctagt gtgtgccact tgtgaacaga ttgctgattc acagcatcgg 480
tctcacagac agatggctac taccaccaat ccactaatca ggcatgaaaa cagaatggtg 540
ctggctagca ctacggcaaa ggctatggaa cagatggctg gatcgagtga acaggcagcg 600
gaggccatgg aggttgctaa tcagactagg cagatggtac atgcaatgag aactattggg 660
actcatccta gctccagtgc tggtctgaaa gatgaccttc ttgaaaattt gcaggcctac 720
cagaagcgaa tgggagtgca gatgcagcga ttcaagtga 759
<210> 30
<211> 15335
<212> DNA
<213> 人工序列
<220>
<223> 构建体Co18的核苷酸序列
<400> 30
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgttcgtg ttcctggtgc tgctgcccct cgttagcagc cagtgcgtga atctgaccac 7620
ccgcacccag ctgccaccag cctacacaaa cagcttcacc agaggagtgt attaccctga 7680
taaggtcttt agatcctccg tcctgcattc tacgcaggat ctcttcttgc cattcttcag 7740
caacgtgaca tggttccacg ccatccacgt ttctggcacc aacggcacaa agcgcttcga 7800
caatcctgtg ttgccgttta acgacggcgt ttacttcgcc agcacagaaa agagcaacat 7860
catccggggc tggatcttcg gcaccaccct ggacagcaaa acccaaagcc tgctcatcgt 7920
gaacaacgcc accaacgtgg tgatcaaggt gtgcgagttc cagttctgca atgatccttt 7980
tctgggcgtg tactatcaca agaacaacaa gagctggatg gaaagcgagt tcagagtgta 8040
ttctagcgcc aacaactgca cctttgagta cgtgtcccag ccctttctta tggacctgga 8100
aggcaagcag ggcaacttca agaatctgag agaattcgtg ttcaagaaca ttgatggcta 8160
cttcaagatc tacagcaagc acacccctat caacctggtt cgggacctgc cacaaggctt 8220
cagcgccctg gaacctctgg tggacctgcc tatcggcatc aacatcacac ggttccaaac 8280
cctgctggcc ctgcaccgga gctacctgac ccccggcgac agcagcagcg gctggaccgc 8340
cggcgctgcc gcctattacg tgggctacct gcaacctaga accttcctgc tgaaatacaa 8400
cgagaacggc acaatcaccg acgccgtgga ctgtgccctg gaccccctgt ctgagacaaa 8460
gtgtaccctg aagtctttca ccgtggagaa gggcatctac cagaccagca acttccgggt 8520
gcagcctaca gaatctatag tgcggttccc taacatcacc aacctgtgtc cttttggcga 8580
ggtgttcaac gccactcggt tcgcctctgt ctacgcctgg aaccggaaac ggatctctaa 8640
ttgcgtggcc gattacagcg tcctgtataa ctccgccagt ttcagcacat tcaagtgcta 8700
cggcgtgtca cccaccaagc tgaacgatct gtgcttcacc aatgtgtacg ccgatagttt 8760
cgtgatccgg ggcgatgagg tgcggcagat cgcccctgga cagacaggca agatcgccga 8820
ctacaactac aagctgcctg acgacttcac aggctgtgtg atcgcatgga acagcaacaa 8880
cctggacagc aaggtgggcg gaaactacaa ctacctgtac agactgttca gaaagtccaa 8940
cctgaagcct ttcgagagag atatatctac cgagatctac caggccggca gcacaccctg 9000
taatggagtg gaaggcttta actgctactt ccctctgcaa agctatggat ttcaacctac 9060
aaatggggtt ggctaccagc cttacagagt ggtggtcctt agcttcgagc tgctccatgc 9120
ccctgccacc gtgtgcggac ctaagaagtc caccaacctg gtgaaaaaca agtgcgtgaa 9180
ctttaatttt aacggcctga ccggaacagg agtgctgaca gaaagcaaca aaaagttcct 9240
gcctttccag cagttcggca gagacattgc cgacaccaca gatgctgtta gagaccccca 9300
gacgctggaa atcctggata tcaccccctg ctcttttggc ggcgtgagcg tgatcacccc 9360
aggcacaaac acaagcaacc aggtggctgt gctgtaccag gacgtgaact gtacagaggt 9420
ccctgtggca atccacgccg atcagctgac ccctacatgg cgggtgtact ccactggatc 9480
taacgtgttc cagacaaggg ccggatgcct catcggcgct gagcacgtga acaattctta 9540
cgagtgcgac atccctattg gagcgggcat ctgcgccagc taccagacac agaccaatag 9600
ccctcagcaa gccgctagcg tggcctccca gagcatcatc gcctacacca tgagcctggg 9660
agccgagaac tctgtggcct acagcaacaa cagcatcgct atccctacca acttcaccat 9720
ctctgtcacc accgaaatcc tgcccgtcag tatgaccaaa accagcgtcg actgcaccat 9780
gtacatatgc ggcgatagca ccgaatgcag caacctgctg ctgcagtatg gctccttctg 9840
cacccaactt aacagagccc tgactggcat cgccgtggag caggacaaga atacccagga 9900
ggtgttcgcc caggtgaagc agatctacaa gacacccccg atcaaggact tcggcggctt 9960
taatttctct cagatcctgc cagacccatc taaaccctct aagcggagct ttatcgagga 10020
cctgctgttc aacaaggtga ctctggctga cgccggcttc atcaagcagt acggcgattg 10080
cctgggcgac attgctgcta gagacctgat ctgtgcccag aaattcaacg gtcttactgt 10140
gctgcctcct ctgctgacgg atgagatgat cgcccagtac accagcgccc tgctggccgg 10200
caccatcaca tccggctgga cattcggcgc cggcgcagcc ctgcagatcc cttttgccat 10260
gcagatggcc taccggttca acggaatcgg agtgacacag aacgtgctct acgaaaatca 10320
gaagttgatc gccaaccagt tcaacagcgc catcggcaag attcaggata gtctgagttc 10380
caccgccagc gccctgggaa agctgcagga cgtggtcaat cagaatgccc aagccctgaa 10440
caccctggtg aagcagctga gcagcaactt cggcgccatc agctctgtgc tgaacgacat 10500
cctgagtaga ctggacaagg tggaagccga agtgcagatc gacagattga tcaccggaag 10560
actgcaaagc ctgcagacct acgtgaccca gcagctgata agagctgctg aaatcagagc 10620
cagcgctaat ctggccgcta ccaagatgag cgagtgcgtt ctgggccagt ctaagagagt 10680
ggacttctgc ggaaaaggct accacctgat gtcctttcct cagtctgccc cccacggcgt 10740
ggtgttcctg cacgtcacat acgtgcccgc tcaagagaaa aacttcacca cggcccctgc 10800
catctgtcac gacggcaagg cccacttccc cagagagggc gtgttcgtga gcaatggcac 10860
ccactggttt gtgactcaga gaaacttcta cgagccacag attatcacca cagataacac 10920
cttcgtgtct ggcaactgcg acgtggtgat cggcatcgtc aacaacacag tgtacgaccc 10980
actgcaacct gagctggact cattcaagga ggaactggat aagtacttca agaatcacac 11040
cagccccgac gttgacctgg gcgacatcag cggcattaac gcctctgtgg tcaacatcca 11100
gaaggaaatc gacagactga atgaggtggc caagaatttg aacgagagcc tgattgatct 11160
gcaggagctg ggcaaatacg agcagtacat caagtggcct tggtacatct ggctgggctt 11220
catcgccggg ctgatcgcca tcgttatggt gacaatcatg ctgtgttgca tgacaagctg 11280
ttgtagctgc ctgaaaggct gctgctcctg cggcagctgt tgcaagtttg acgaagatga 11340
cagcgagccc gtgctgaaag gcgtcaagct gcactacacc tgagggcccc tataactctc 11400
tacggctaac ctgaatggac tacgacatag tctagtccgc caagatgagc gacaacggac 11460
ctcagaacca gagaaatgcc cctagaatca cctttggcgg acctagcgac agcaccggca 11520
gcaaccagaa tggcgagaga agcggcgcca gatctaagca gcggcgtcca cagggactgc 11580
ccaacaacac cgccagctgg ttcaccgccc tcacccagca cggcaaagag gacctgaagt 11640
tcccccgggg acagggcgtg ccaatcaaca caaactctag ccccgacgac cagatcggct 11700
actatagacg ggccaccaga aggatcagag gaggtgatgg caagatgaag gacctgagcc 11760
ctagatggta cttctactac ctgggcacag gcccagaagc cggcctgcct tacggcgcca 11820
acaaggacgg catcatctgg gtcgccaccg agggcgctct caacacccct aaggaccaca 11880
ttggaactcg gaaccccgct aataacgccg ctatcgtgct gcagctgcct cagggcacga 11940
ccctgcccaa gggcttctac gccgaaggca gcagaggcgg cagccaggcc tctagccggt 12000
ccagctctcg gagcagaaac agcagcagaa actccacccc tggcagcagc cgcggcacca 12060
gccccgccag aatggccgga aatggcggcg atgccgctct ggccctgctg ctgctggata 12120
gactgaacca gctggaatcc aagatgtctg gcaagggcca gcagcaacag ggccagaccg 12180
tgaccaagaa aagcgcagct gaagcctcta aaaaacctcg gcagaagcgg accgccacaa 12240
aggcttacaa cgtgacacag gcctttggca gaagaggacc tgagcagaca cagggcaact 12300
tcggcgacca ggagctgatc cggcagggca cagactacaa gcattggcct cagatcgccc 12360
agttcgcccc tagtgccagc gccttcttcg gcatgagccg gatcggcatg gaagtgaccc 12420
ctagcggcac atggctgacc tacaccggcg ccatcaagct ggacgataag gaccccaatt 12480
ttaaggacca agtgatcctg ctgaacaagc acatcgacgc ctataagacc ttcccaccta 12540
cagagcctaa gaaagataag aaaaagaagg ccgacgagac acaagccctg ccccagagac 12600
agaaaaagca acaaacagtg accctgctgc ctgccgctga tctggatgac ttcagcaagc 12660
agctgcagca atctatgagc tccgccgata gcacccaggc ctgaggcgcg cccacccagc 12720
ggccgcccgc tacgccccaa tgatccgacc agcaaaactc gatgtacttc cgaggaactg 12780
atgtgcataa tgcatcaggc tggtacatta gatccccgct taccgcgggc aatatagcaa 12840
cactaaaaac tcgatgtact tccgaggaag cgcagtgcat aatgctgcgc agtgttgcca 12900
cataaccact atattaacca tttatctagc ggacgccaaa aactcaatgt atttctgagg 12960
aagcgtggtg cataatgcca cgcagcgtct gcataacttt tattatttct tttattaatc 13020
aacaaaattt tgtttttaac atttcaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 13080
aagaagagcg tttaaacacg tgatatctgg cctcatgggc cttcctttca ctgcccgctt 13140
tccagtcggg aaacctgtcg tgccagctgc attaacatgg tcatagctgt ttccttgcgt 13200
attgggcgct ctccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cgggtaaagc 13260
ctggggtgcc taatgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 13320
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 13380
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 13440
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 13500
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 13560
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 13620
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 13680
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 13740
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 13800
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 13860
tagcggtggt ttttttgttt gcaggcagca gattacgcgc agaaaaaaag gatctcaaga 13920
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 13980
gattttggtc atgaatacac ggtgcctgac tgcgttagca atttaactgt gataaactac 14040
cgcattaaag cttatcgatg ataagctgtc aaacatgaga attcttagaa aaactcatcg 14100
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 14160
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 14220
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 14280
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 14340
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 14400
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 14460
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg 14520
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 14580
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 14640
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 14700
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 14760
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 14820
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 14880
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacagtttt 14940
attgttcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 15000
gcgcacattt ccccgaaaag tgccacctaa attgtaagcg ttaatatttt gttaaaattc 15060
gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc 15120
ccttataaat caaaagaata gaccgagata gggttgagtg gccgctacag ggcgctccca 15180
ttcgccattc aggctgcgca actgttggga agggcgtttc ggtgcgggcc tcttcgctat 15240
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 15300
tttcccagtc acacgcgtaa tacgactcac tatag 15335
<210> 31
<211> 15354
<212> DNA
<213> 人工序列
<220>
<223> 构建体Co19的核苷酸序列
<400> 31
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgttcgtg ttcctggtgc tgctgcccct cgttagcagc cagtgcgtga atctgaccac 7620
ccgcacccag ctgccaccag cctacacaaa cagcttcacc agaggagtgt attaccctga 7680
taaggtcttt agatcctccg tcctgcattc tacgcaggat ctcttcttgc cattcttcag 7740
caacgtgaca tggttccacg ccatccacgt ttctggcacc aacggcacaa agcgcttcga 7800
caatcctgtg ttgccgttta acgacggcgt ttacttcgcc agcacagaaa agagcaacat 7860
catccggggc tggatcttcg gcaccaccct ggacagcaaa acccaaagcc tgctcatcgt 7920
gaacaacgcc accaacgtgg tgatcaaggt gtgcgagttc cagttctgca atgatccttt 7980
tctgggcgtg tactatcaca agaacaacaa gagctggatg gaaagcgagt tcagagtgta 8040
ttctagcgcc aacaactgca cctttgagta cgtgtcccag ccctttctta tggacctgga 8100
aggcaagcag ggcaacttca agaatctgag agaattcgtg ttcaagaaca ttgatggcta 8160
cttcaagatc tacagcaagc acacccctat caacctggtt cgggacctgc cacaaggctt 8220
cagcgccctg gaacctctgg tggacctgcc tatcggcatc aacatcacac ggttccaaac 8280
cctgctggcc ctgcaccgga gctacctgac ccccggcgac agcagcagcg gctggaccgc 8340
cggcgctgcc gcctattacg tgggctacct gcaacctaga accttcctgc tgaaatacaa 8400
cgagaacggc acaatcaccg acgccgtgga ctgtgccctg gaccccctgt ctgagacaaa 8460
gtgtaccctg aagtctttca ccgtggagaa gggcatctac cagaccagca acttccgggt 8520
gcagcctaca gaatctatag tgcggttccc taacatcacc aacctgtgtc cttttggcga 8580
ggtgttcaac gccactcggt tcgcctctgt ctacgcctgg aaccggaaac ggatctctaa 8640
ttgcgtggcc gattacagcg tcctgtataa ctccgccagt ttcagcacat tcaagtgcta 8700
cggcgtgtca cccaccaagc tgaacgatct gtgcttcacc aatgtgtacg ccgatagttt 8760
cgtgatccgg ggcgatgagg tgcggcagat cgcccctgga cagacaggca agatcgccga 8820
ctacaactac aagctgcctg acgacttcac aggctgtgtg atcgcatgga acagcaacaa 8880
cctggacagc aaggtgggcg gaaactacaa ctacctgtac agactgttca gaaagtccaa 8940
cctgaagcct ttcgagagag atatatctac cgagatctac caggccggca gcacaccctg 9000
taatggagtg gaaggcttta actgctactt ccctctgcaa agctatggat ttcaacctac 9060
aaatggggtt ggctaccagc cttacagagt ggtggtcctt agcttcgagc tgctccatgc 9120
ccctgccacc gtgtgcggac ctaagaagtc caccaacctg gtgaaaaaca agtgcgtgaa 9180
ctttaatttt aacggcctga ccggaacagg agtgctgaca gaaagcaaca aaaagttcct 9240
gcctttccag cagttcggca gagacattgc cgacaccaca gatgctgtta gagaccccca 9300
gacgctggaa atcctggata tcaccccctg ctcttttggc ggcgtgagcg tgatcacccc 9360
aggcacaaac acaagcaacc aggtggctgt gctgtaccag gacgtgaact gtacagaggt 9420
ccctgtggca atccacgccg atcagctgac ccctacatgg cgggtgtact ccactggatc 9480
taacgtgttc cagacaaggg ccggatgcct catcggcgct gagcacgtga acaattctta 9540
cgagtgcgac atccctattg gagcgggcat ctgcgccagc taccagacac agaccaatag 9600
ccctcagcaa gccgctagcg tggcctccca gagcatcatc gcctacacca tgagcctggg 9660
agccgagaac tctgtggcct acagcaacaa cagcatcgct atccctacca acttcaccat 9720
ctctgtcacc accgaaatcc tgcccgtcag tatgaccaaa accagcgtcg actgcaccat 9780
gtacatatgc ggcgatagca ccgaatgcag caacctgctg ctgcagtatg gctccttctg 9840
cacccaactt aacagagccc tgactggcat cgccgtggag caggacaaga atacccagga 9900
ggtgttcgcc caggtgaagc agatctacaa gacacccccg atcaaggact tcggcggctt 9960
taatttctct cagatcctgc cagacccatc taaaccctct aagcggagct ttatcgagga 10020
cctgctgttc aacaaggtga ctctggctga cgccggcttc atcaagcagt acggcgattg 10080
cctgggcgac attgctgcta gagacctgat ctgtgcccag aaattcaacg gtcttactgt 10140
gctgcctcct ctgctgacgg atgagatgat cgcccagtac accagcgccc tgctggccgg 10200
caccatcaca tccggctgga cattcggcgc cggcgcagcc ctgcagatcc cttttgccat 10260
gcagatggcc taccggttca acggaatcgg agtgacacag aacgtgctct acgaaaatca 10320
gaagttgatc gccaaccagt tcaacagcgc catcggcaag attcaggata gtctgagttc 10380
caccgccagc gccctgggaa agctgcagga cgtggtcaat cagaatgccc aagccctgaa 10440
caccctggtg aagcagctga gcagcaactt cggcgccatc agctctgtgc tgaacgacat 10500
cctgagtaga ctggacaagg tggaagccga agtgcagatc gacagattga tcaccggaag 10560
actgcaaagc ctgcagacct acgtgaccca gcagctgata agagctgctg aaatcagagc 10620
cagcgctaat ctggccgcta ccaagatgag cgagtgcgtt ctgggccagt ctaagagagt 10680
ggacttctgc ggaaaaggct accacctgat gtcctttcct cagtctgccc cccacggcgt 10740
ggtgttcctg cacgtcacat acgtgcccgc tcaagagaaa aacttcacca cggcccctgc 10800
catctgtcac gacggcaagg cccacttccc cagagagggc gtgttcgtga gcaatggcac 10860
ccactggttt gtgactcaga gaaacttcta cgagccacag attatcacca cagataacac 10920
cttcgtgtct ggcaactgcg acgtggtgat cggcatcgtc aacaacacag tgtacgaccc 10980
actgcaacct gagctggact cattcaagga ggaactggat aagtacttca agaatcacac 11040
cagccccgac gttgacctgg gcgacatcag cggcattaac gcctctgtgg tcaacatcca 11100
gaaggaaatc gacagactga atgaggtggc caagaatttg aacgagagcc tgattgatct 11160
gcaggagctg ggcaaatacg agcagtacat caagtggcct tggtacatct ggctgggctt 11220
catcgccggg ctgatcgcca tcgttatggt gacaatcatg ctgtgttgca tgacaagctg 11280
ttgtagctgc ctgaaaggct gctgctcctg cggcagctgt tgcaagtttg acgaagatga 11340
cagcgagccc gtgctgaaag gcgtcaagct gcactacacc tgatcattca gctacctgag 11400
aggggcccct ataactctct acggctaacc tgaatggact acgacatagt ctagtccgcc 11460
aagatgagcg acaacggacc tcagaaccag agaaatgccc ctagaatcac ctttggcgga 11520
cctagcgaca gcaccggcag caaccagaat ggcgagagaa gcggcgccag atctaagcag 11580
cggcgtccac agggactgcc caacaacacc gccagctggt tcaccgccct cacccagcac 11640
ggcaaagagg acctgaagtt cccccgggga cagggcgtgc caatcaacac aaactctagc 11700
cccgacgacc agatcggcta ctatagacgg gccaccagaa ggatcagagg aggtgatggc 11760
aagatgaagg acctgagccc tagatggtac ttctactacc tgggcacagg cccagaagcc 11820
ggcctgcctt acggcgccaa caaggacggc atcatctggg tcgccaccga gggcgctctc 11880
aacaccccta aggaccacat tggaactcgg aaccccgcta ataacgccgc tatcgtgctg 11940
cagctgcctc agggcacgac cctgcccaag ggcttctacg ccgaaggcag cagaggcggc 12000
agccaggcct ctagccggtc cagctctcgg agcagaaaca gcagcagaaa ctccacccct 12060
ggcagcagcc gcggcaccag ccccgccaga atggccggaa atggcggcga tgccgctctg 12120
gccctgctgc tgctggatag actgaaccag ctggaatcca agatgtctgg caagggccag 12180
cagcaacagg gccagaccgt gaccaagaaa agcgcagctg aagcctctaa aaaacctcgg 12240
cagaagcgga ccgccacaaa ggcttacaac gtgacacagg cctttggcag aagaggacct 12300
gagcagacac agggcaactt cggcgaccag gagctgatcc ggcagggcac agactacaag 12360
cattggcctc agatcgccca gttcgcccct agtgccagcg ccttcttcgg catgagccgg 12420
atcggcatgg aagtgacccc tagcggcaca tggctgacct acaccggcgc catcaagctg 12480
gacgataagg accccaattt taaggaccaa gtgatcctgc tgaacaagca catcgacgcc 12540
tataagacct tcccacctac agagcctaag aaagataaga aaaagaaggc cgacgagaca 12600
caagccctgc cccagagaca gaaaaagcaa caaacagtga ccctgctgcc tgccgctgat 12660
ctggatgact tcagcaagca gctgcagcaa tctatgagct ccgccgatag cacccaggcc 12720
tgaggcgcgc ccacccagcg gccgcccgct acgccccaat gatccgacca gcaaaactcg 12780
atgtacttcc gaggaactga tgtgcataat gcatcaggct ggtacattag atccccgctt 12840
accgcgggca atatagcaac actaaaaact cgatgtactt ccgaggaagc gcagtgcata 12900
atgctgcgca gtgttgccac ataaccacta tattaaccat ttatctagcg gacgccaaaa 12960
actcaatgta tttctgagga agcgtggtgc ataatgccac gcagcgtctg cataactttt 13020
attatttctt ttattaatca acaaaatttt gtttttaaca tttcaaaaaa aaaaaaaaaa 13080
aaaaaaaaaa aaaaaaaaaa agaagagcgt ttaaacacgt gatatctggc ctcatgggcc 13140
ttcctttcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt 13200
catagctgtt tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc 13260
tcggtcgttc gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga 13320
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 13380
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 13440
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 13500
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 13560
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 13620
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 13680
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 13740
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 13800
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 13860
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caggcagcag attacgcgca 13920
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 13980
acgaaaactc acgttaaggg attttggtca tgaatacacg gtgcctgact gcgttagcaa 14040
tttaactgtg ataaactacc gcattaaagc ttatcgatga taagctgtca aacatgagaa 14100
ttcttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 14160
aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 14220
ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 14280
acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 14340
gactgaatcc ggtgagaatg gcaaaagctt atgcatttct ttccagactt gttcaacagg 14400
ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 14460
ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 14520
cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 14580
atattcttct aatacctgga atgctgtttt cccggggatc gcagtggtga gtaaccatgc 14640
atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 14700
gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 14760
aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 14820
gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 14880
cggcctcgag caagacgttt cccgttgaat atggctcata acaccccttg tattactgtt 14940
tatgtaagca gacagtttta ttgttcatga gcggatacat atttgaatgt atttagaaaa 15000
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctaaa ttgtaagcgt 15060
taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt ttaaccaata 15120
ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgg 15180
ccgctacagg gcgctcccat tcgccattca ggctgcgcaa ctgttgggaa gggcgtttcg 15240
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta 15300
agttgggtaa cgccagggtt ttcccagtca cacgcgtaat acgactcact atag 15354
<210> 32
<211> 3822
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为QQAA的
突变和986P/987P突变)
<400> 32
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgac 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc gggacctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgctggccc tgcaccggag ctacctgacc cccggcgaca gcagcagcgg ctggaccgcc 780
ggcgctgccg cctattacgt gggctacctg caacctagaa ccttcctgct gaaatacaac 840
gagaacggca caatcaccga cgccgtggac tgtgccctgg accccctgtc tgagacaaag 900
tgtaccctga agtctttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcctacag aatctatagt gcggttccct aacatcacca acctgtgtcc ttttggcgag 1020
gtgttcaacg ccactcggtt cgcctctgtc tacgcctgga accggaaacg gatctctaat 1080
tgcgtggccg attacagcgt cctgtataac tccgccagtt tcagcacatt caagtgctac 1140
ggcgtgtcac ccaccaagct gaacgatctg tgcttcacca atgtgtacgc cgatagtttc 1200
gtgatccggg gcgatgaggt gcggcagatc gcccctggac agacaggcaa gatcgccgac 1260
tacaactaca agctgcctga cgacttcaca ggctgtgtga tcgcatggaa cagcaacaac 1320
ctggacagca aggtgggcgg aaactacaac tacctgtaca gactgttcag aaagtccaac 1380
ctgaagcctt tcgagagaga tatatctacc gagatctacc aggccggcag cacaccctgt 1440
aatggagtgg aaggctttaa ctgctacttc cctctgcaaa gctatggatt tcaacctaca 1500
aatggggttg gctaccagcc ttacagagtg gtggtcctta gcttcgagct gctccatgcc 1560
cctgccaccg tgtgcggacc taagaagtcc accaacctgg tgaaaaacaa gtgcgtgaac 1620
tttaatttta acggcctgac cggaacagga gtgctgacag aaagcaacaa aaagttcctg 1680
cctttccagc agttcggcag agacattgcc gacaccacag atgctgttag agacccccag 1740
acgctggaaa tcctggatat caccccctgc tcttttggcg gcgtgagcgt gatcacccca 1800
ggcacaaaca caagcaacca ggtggctgtg ctgtaccagg acgtgaactg tacagaggtc 1860
cctgtggcaa tccacgccga tcagctgacc cctacatggc gggtgtactc cactggatct 1920
aacgtgttcc agacaagggc cggatgcctc atcggcgctg agcacgtgaa caattcttac 1980
gagtgcgaca tccctattgg agcgggcatc tgcgccagct accagacaca gaccaatagc 2040
cctcagcaag ccgctagcgt ggcctcccag agcatcatcg cctacaccat gagcctggga 2100
gccgagaact ctgtggccta cagcaacaac agcatcgcta tccctaccaa cttcaccatc 2160
tctgtcacca ccgaaatcct gcccgtcagt atgaccaaaa ccagcgtcga ctgcaccatg 2220
tacatatgcg gcgatagcac cgaatgcagc aacctgctgc tgcagtatgg ctccttctgc 2280
acccaactta acagagccct gactggcatc gccgtggagc aggacaagaa tacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acacccccga tcaaggactt cggcggcttt 2400
aatttctctc agatcctgcc agacccatct aaaccctcta agcggagctt tatcgaggac 2460
ctgctgttca acaaggtgac tctggctgac gccggcttca tcaagcagta cggcgattgc 2520
ctgggcgaca ttgctgctag agacctgatc tgtgcccaga aattcaacgg tcttactgtg 2580
ctgcctcctc tgctgacgga tgagatgatc gcccagtaca ccagcgccct gctggccggc 2640
accatcacat ccggctggac attcggcgcc ggcgcagccc tgcagatccc ttttgccatg 2700
cagatggcct accggttcaa cggaatcgga gtgacacaga acgtgctcta cgaaaatcag 2760
aagttgatcg ccaaccagtt caacagcgcc atcggcaaga ttcaggatag tctgagttcc 2820
accgccagcg ccctgggaaa gctgcaggac gtggtcaatc agaatgccca agccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gctctgtgct gaacgacatc 2940
ctgagtagac tggacccacc tgaagccgaa gtgcagatcg acagattgat caccggaaga 3000
ctgcaaagcc tgcagaccta cgtgacccag cagctgataa gagctgctga aatcagagcc 3060
agcgctaatc tggccgctac caagatgagc gagtgcgttc tgggccagtc taagagagtg 3120
gacttctgcg gaaaaggcta ccacctgatg tcctttcctc agtctgcccc ccacggcgtg 3180
gtgttcctgc acgtcacata cgtgcccgct caagagaaaa acttcaccac ggcccctgcc 3240
atctgtcacg acggcaaggc ccacttcccc agagagggcg tgttcgtgag caatggcacc 3300
cactggtttg tgactcagag aaacttctac gagccacaga ttatcaccac agataacacc 3360
ttcgtgtctg gcaactgcga cgtggtgatc ggcatcgtca acaacacagt gtacgaccca 3420
ctgcaacctg agctggactc attcaaggag gaactggata agtacttcaa gaatcacacc 3480
agccccgacg ttgacctggg cgacatcagc ggcattaacg cctctgtggt caacatccag 3540
aaggaaatcg acagactgaa tgaggtggcc aagaatttga acgagagcct gattgatctg 3600
caggagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatctg gctgggcttc 3660
atcgccgggc tgatcgccat cgttatggtg acaatcatgc tgtgttgcat gacaagctgt 3720
tgtagctgcc tgaaaggctg ctgctcctgc ggcagctgtt gcaagtttga cgaagatgac 3780
agcgagcccg tgctgaaagg cgtcaagctg cactacacct ga 3822
<210> 33
<211> 3822
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2修饰的刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为
QQAA的突变和D614G突变)
<400> 33
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgac 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc gggacctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgctggccc tgcaccggag ctacctgacc cccggcgaca gcagcagcgg ctggaccgcc 780
ggcgctgccg cctattacgt gggctacctg caacctagaa ccttcctgct gaaatacaac 840
gagaacggca caatcaccga cgccgtggac tgtgccctgg accccctgtc tgagacaaag 900
tgtaccctga agtctttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcctacag aatctatagt gcggttccct aacatcacca acctgtgtcc ttttggcgag 1020
gtgttcaacg ccactcggtt cgcctctgtc tacgcctgga accggaaacg gatctctaat 1080
tgcgtggccg attacagcgt cctgtataac tccgccagtt tcagcacatt caagtgctac 1140
ggcgtgtcac ccaccaagct gaacgatctg tgcttcacca atgtgtacgc cgatagtttc 1200
gtgatccggg gcgatgaggt gcggcagatc gcccctggac agacaggcaa gatcgccgac 1260
tacaactaca agctgcctga cgacttcaca ggctgtgtga tcgcatggaa cagcaacaac 1320
ctggacagca aggtgggcgg aaactacaac tacctgtaca gactgttcag aaagtccaac 1380
ctgaagcctt tcgagagaga tatatctacc gagatctacc aggccggcag cacaccctgt 1440
aatggagtgg aaggctttaa ctgctacttc cctctgcaaa gctatggatt tcaacctaca 1500
aatggggttg gctaccagcc ttacagagtg gtggtcctta gcttcgagct gctccatgcc 1560
cctgccaccg tgtgcggacc taagaagtcc accaacctgg tgaaaaacaa gtgcgtgaac 1620
tttaatttta acggcctgac cggaacagga gtgctgacag aaagcaacaa aaagttcctg 1680
cctttccagc agttcggcag agacattgcc gacaccacag atgctgttag agacccccag 1740
acgctggaaa tcctggatat caccccctgc tcttttggcg gcgtgagcgt gatcacccca 1800
ggcacaaaca caagcaacca ggtggctgtg ctgtaccagg gcgtgaactg tacagaggtc 1860
cctgtggcaa tccacgccga tcagctgacc cctacatggc gggtgtactc cactggatct 1920
aacgtgttcc agacaagggc cggatgcctc atcggcgctg agcacgtgaa caattcttac 1980
gagtgcgaca tccctattgg agcgggcatc tgcgccagct accagacaca gaccaatagc 2040
cctcagcaag ccgctagcgt ggcctcccag agcatcatcg cctacaccat gagcctggga 2100
gccgagaact ctgtggccta cagcaacaac agcatcgcta tccctaccaa cttcaccatc 2160
tctgtcacca ccgaaatcct gcccgtcagt atgaccaaaa ccagcgtcga ctgcaccatg 2220
tacatatgcg gcgatagcac cgaatgcagc aacctgctgc tgcagtatgg ctccttctgc 2280
acccaactta acagagccct gactggcatc gccgtggagc aggacaagaa tacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acacccccga tcaaggactt cggcggcttt 2400
aatttctctc agatcctgcc agacccatct aaaccctcta agcggagctt tatcgaggac 2460
ctgctgttca acaaggtgac tctggctgac gccggcttca tcaagcagta cggcgattgc 2520
ctgggcgaca ttgctgctag agacctgatc tgtgcccaga aattcaacgg tcttactgtg 2580
ctgcctcctc tgctgacgga tgagatgatc gcccagtaca ccagcgccct gctggccggc 2640
accatcacat ccggctggac attcggcgcc ggcgcagccc tgcagatccc ttttgccatg 2700
cagatggcct accggttcaa cggaatcgga gtgacacaga acgtgctcta cgaaaatcag 2760
aagttgatcg ccaaccagtt caacagcgcc atcggcaaga ttcaggatag tctgagttcc 2820
accgccagcg ccctgggaaa gctgcaggac gtggtcaatc agaatgccca agccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gctctgtgct gaacgacatc 2940
ctgagtagac tggacaaggt ggaagccgaa gtgcagatcg acagattgat caccggaaga 3000
ctgcaaagcc tgcagaccta cgtgacccag cagctgataa gagctgctga aatcagagcc 3060
agcgctaatc tggccgctac caagatgagc gagtgcgttc tgggccagtc taagagagtg 3120
gacttctgcg gaaaaggcta ccacctgatg tcctttcctc agtctgcccc ccacggcgtg 3180
gtgttcctgc acgtcacata cgtgcccgct caagagaaaa acttcaccac ggcccctgcc 3240
atctgtcacg acggcaaggc ccacttcccc agagagggcg tgttcgtgag caatggcacc 3300
cactggtttg tgactcagag aaacttctac gagccacaga ttatcaccac agataacacc 3360
ttcgtgtctg gcaactgcga cgtggtgatc ggcatcgtca acaacacagt gtacgaccca 3420
ctgcaacctg agctggactc attcaaggag gaactggata agtacttcaa gaatcacacc 3480
agccccgacg ttgacctggg cgacatcagc ggcattaacg cctctgtggt caacatccag 3540
aaggaaatcg acagactgaa tgaggtggcc aagaatttga acgagagcct gattgatctg 3600
caggagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatctg gctgggcttc 3660
atcgccgggc tgatcgccat cgttatggtg acaatcatgc tgtgttgcat gacaagctgt 3720
tgtagctgcc tgaaaggctg ctgctcctgc ggcagctgtt gcaagtttga cgaagatgac 3780
agcgagcccg tgctgaaagg cgtcaagctg cactacacct ga 3822
<210> 34
<211> 3822
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2修饰的刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为
QQAA的突变和S2'突变)
<400> 34
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgac 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc gggacctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgctggccc tgcaccggag ctacctgacc cccggcgaca gcagcagcgg ctggaccgcc 780
ggcgctgccg cctattacgt gggctacctg caacctagaa ccttcctgct gaaatacaac 840
gagaacggca caatcaccga cgccgtggac tgtgccctgg accccctgtc tgagacaaag 900
tgtaccctga agtctttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcctacag aatctatagt gcggttccct aacatcacca acctgtgtcc ttttggcgag 1020
gtgttcaacg ccactcggtt cgcctctgtc tacgcctgga accggaaacg gatctctaat 1080
tgcgtggccg attacagcgt cctgtataac tccgccagtt tcagcacatt caagtgctac 1140
ggcgtgtcac ccaccaagct gaacgatctg tgcttcacca atgtgtacgc cgatagtttc 1200
gtgatccggg gcgatgaggt gcggcagatc gcccctggac agacaggcaa gatcgccgac 1260
tacaactaca agctgcctga cgacttcaca ggctgtgtga tcgcatggaa cagcaacaac 1320
ctggacagca aggtgggcgg aaactacaac tacctgtaca gactgttcag aaagtccaac 1380
ctgaagcctt tcgagagaga tatatctacc gagatctacc aggccggcag cacaccctgt 1440
aatggagtgg aaggctttaa ctgctacttc cctctgcaaa gctatggatt tcaacctaca 1500
aatggggttg gctaccagcc ttacagagtg gtggtcctta gcttcgagct gctccatgcc 1560
cctgccaccg tgtgcggacc taagaagtcc accaacctgg tgaaaaacaa gtgcgtgaac 1620
tttaatttta acggcctgac cggaacagga gtgctgacag aaagcaacaa aaagttcctg 1680
cctttccagc agttcggcag agacattgcc gacaccacag atgctgttag agacccccag 1740
acgctggaaa tcctggatat caccccctgc tcttttggcg gcgtgagcgt gatcacccca 1800
ggcacaaaca caagcaacca ggtggctgtg ctgtaccagg acgtgaactg tacagaggtc 1860
cctgtggcaa tccacgccga tcagctgacc cctacatggc gggtgtactc cactggatct 1920
aacgtgttcc agacaagggc cggatgcctc atcggcgctg agcacgtgaa caattcttac 1980
gagtgcgaca tccctattgg agcgggcatc tgcgccagct accagacaca gaccaatagc 2040
cctcagcaag ccgctagcgt ggcctcccag agcatcatcg cctacaccat gagcctggga 2100
gccgagaact ctgtggccta cagcaacaac agcatcgcta tccctaccaa cttcaccatc 2160
tctgtcacca ccgaaatcct gcccgtcagt atgaccaaaa ccagcgtcga ctgcaccatg 2220
tacatatgcg gcgatagcac cgaatgcagc aacctgctgc tgcagtatgg ctccttctgc 2280
acccaactta acagagccct gactggcatc gccgtggagc aggacaagaa tacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acacccccga tcaaggactt cggcggcttt 2400
aatttctctc agatcctgcc agacccatct aaaccctcta agaacagctt tatcgaggac 2460
ctgctgttca acaaggtgac tctggctgac gccggcttca tcaagcagta cggcgattgc 2520
ctgggcgaca ttgctgctag agacctgatc tgtgcccaga aattcaacgg tcttactgtg 2580
ctgcctcctc tgctgacgga tgagatgatc gcccagtaca ccagcgccct gctggccggc 2640
accatcacat ccggctggac attcggcgcc ggcgcagccc tgcagatccc ttttgccatg 2700
cagatggcct accggttcaa cggaatcgga gtgacacaga acgtgctcta cgaaaatcag 2760
aagttgatcg ccaaccagtt caacagcgcc atcggcaaga ttcaggatag tctgagttcc 2820
accgccagcg ccctgggaaa gctgcaggac gtggtcaatc agaatgccca agccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gctctgtgct gaacgacatc 2940
ctgagtagac tggacaaggt ggaagccgaa gtgcagatcg acagattgat caccggaaga 3000
ctgcaaagcc tgcagaccta cgtgacccag cagctgataa gagctgctga aatcagagcc 3060
agcgctaatc tggccgctac caagatgagc gagtgcgttc tgggccagtc taagagagtg 3120
gacttctgcg gaaaaggcta ccacctgatg tcctttcctc agtctgcccc ccacggcgtg 3180
gtgttcctgc acgtcacata cgtgcccgct caagagaaaa acttcaccac ggcccctgcc 3240
atctgtcacg acggcaaggc ccacttcccc agagagggcg tgttcgtgag caatggcacc 3300
cactggtttg tgactcagag aaacttctac gagccacaga ttatcaccac agataacacc 3360
ttcgtgtctg gcaactgcga cgtggtgatc ggcatcgtca acaacacagt gtacgaccca 3420
ctgcaacctg agctggactc attcaaggag gaactggata agtacttcaa gaatcacacc 3480
agccccgacg ttgacctggg cgacatcagc ggcattaacg cctctgtggt caacatccag 3540
aaggaaatcg acagactgaa tgaggtggcc aagaatttga acgagagcct gattgatctg 3600
caggagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatctg gctgggcttc 3660
atcgccgggc tgatcgccat cgttatggtg acaatcatgc tgtgttgcat gacaagctgt 3720
tgtagctgcc tgaaaggctg ctgctcctgc ggcagctgtt gcaagtttga cgaagatgac 3780
agcgagcccg tgctgaaagg cgtcaagctg cactacacct ga 3822
<210> 35
<211> 3822
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2修饰的刺突(S)蛋白不可切割的核苷酸序列(S1/S2 RRAR变为
QQAA的突变和D614G突变和S2'突变)
<400> 35
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgac 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc gggacctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgctggccc tgcaccggag ctacctgacc cccggcgaca gcagcagcgg ctggaccgcc 780
ggcgctgccg cctattacgt gggctacctg caacctagaa ccttcctgct gaaatacaac 840
gagaacggca caatcaccga cgccgtggac tgtgccctgg accccctgtc tgagacaaag 900
tgtaccctga agtctttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcctacag aatctatagt gcggttccct aacatcacca acctgtgtcc ttttggcgag 1020
gtgttcaacg ccactcggtt cgcctctgtc tacgcctgga accggaaacg gatctctaat 1080
tgcgtggccg attacagcgt cctgtataac tccgccagtt tcagcacatt caagtgctac 1140
ggcgtgtcac ccaccaagct gaacgatctg tgcttcacca atgtgtacgc cgatagtttc 1200
gtgatccggg gcgatgaggt gcggcagatc gcccctggac agacaggcaa gatcgccgac 1260
tacaactaca agctgcctga cgacttcaca ggctgtgtga tcgcatggaa cagcaacaac 1320
ctggacagca aggtgggcgg aaactacaac tacctgtaca gactgttcag aaagtccaac 1380
ctgaagcctt tcgagagaga tatatctacc gagatctacc aggccggcag cacaccctgt 1440
aatggagtgg aaggctttaa ctgctacttc cctctgcaaa gctatggatt tcaacctaca 1500
aatggggttg gctaccagcc ttacagagtg gtggtcctta gcttcgagct gctccatgcc 1560
cctgccaccg tgtgcggacc taagaagtcc accaacctgg tgaaaaacaa gtgcgtgaac 1620
tttaatttta acggcctgac cggaacagga gtgctgacag aaagcaacaa aaagttcctg 1680
cctttccagc agttcggcag agacattgcc gacaccacag atgctgttag agacccccag 1740
acgctggaaa tcctggatat caccccctgc tcttttggcg gcgtgagcgt gatcacccca 1800
ggcacaaaca caagcaacca ggtggctgtg ctgtaccagg gcgtgaactg tacagaggtc 1860
cctgtggcaa tccacgccga tcagctgacc cctacatggc gggtgtactc cactggatct 1920
aacgtgttcc agacaagggc cggatgcctc atcggcgctg agcacgtgaa caattcttac 1980
gagtgcgaca tccctattgg agcgggcatc tgcgccagct accagacaca gaccaatagc 2040
cctcagcaag ccgctagcgt ggcctcccag agcatcatcg cctacaccat gagcctggga 2100
gccgagaact ctgtggccta cagcaacaac agcatcgcta tccctaccaa cttcaccatc 2160
tctgtcacca ccgaaatcct gcccgtcagt atgaccaaaa ccagcgtcga ctgcaccatg 2220
tacatatgcg gcgatagcac cgaatgcagc aacctgctgc tgcagtatgg ctccttctgc 2280
acccaactta acagagccct gactggcatc gccgtggagc aggacaagaa tacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acacccccga tcaaggactt cggcggcttt 2400
aatttctctc agatcctgcc agacccatct aaaccctcta agaacagctt tatcgaggac 2460
ctgctgttca acaaggtgac tctggctgac gccggcttca tcaagcagta cggcgattgc 2520
ctgggcgaca ttgctgctag agacctgatc tgtgcccaga aattcaacgg tcttactgtg 2580
ctgcctcctc tgctgacgga tgagatgatc gcccagtaca ccagcgccct gctggccggc 2640
accatcacat ccggctggac attcggcgcc ggcgcagccc tgcagatccc ttttgccatg 2700
cagatggcct accggttcaa cggaatcgga gtgacacaga acgtgctcta cgaaaatcag 2760
aagttgatcg ccaaccagtt caacagcgcc atcggcaaga ttcaggatag tctgagttcc 2820
accgccagcg ccctgggaaa gctgcaggac gtggtcaatc agaatgccca agccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gctctgtgct gaacgacatc 2940
ctgagtagac tggacaaggt ggaagccgaa gtgcagatcg acagattgat caccggaaga 3000
ctgcaaagcc tgcagaccta cgtgacccag cagctgataa gagctgctga aatcagagcc 3060
agcgctaatc tggccgctac caagatgagc gagtgcgttc tgggccagtc taagagagtg 3120
gacttctgcg gaaaaggcta ccacctgatg tcctttcctc agtctgcccc ccacggcgtg 3180
gtgttcctgc acgtcacata cgtgcccgct caagagaaaa acttcaccac ggcccctgcc 3240
atctgtcacg acggcaaggc ccacttcccc agagagggcg tgttcgtgag caatggcacc 3300
cactggtttg tgactcagag aaacttctac gagccacaga ttatcaccac agataacacc 3360
ttcgtgtctg gcaactgcga cgtggtgatc ggcatcgtca acaacacagt gtacgaccca 3420
ctgcaacctg agctggactc attcaaggag gaactggata agtacttcaa gaatcacacc 3480
agccccgacg ttgacctggg cgacatcagc ggcattaacg cctctgtggt caacatccag 3540
aaggaaatcg acagactgaa tgaggtggcc aagaatttga acgagagcct gattgatctg 3600
caggagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatctg gctgggcttc 3660
atcgccgggc tgatcgccat cgttatggtg acaatcatgc tgtgttgcat gacaagctgt 3720
tgtagctgcc tgaaaggctg ctgctcctgc ggcagctgtt gcaagtttga cgaagatgac 3780
agcgagcccg tgctgaaagg cgtcaagctg cactacacct ga 3822
<210> 36
<211> 3822
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2修饰的刺突(S)蛋白可切割的核苷酸序列(D614G突变)
<400> 36
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgac 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc gggacctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgctggccc tgcaccggag ctacctgacc cccggcgaca gcagcagcgg ctggaccgcc 780
ggcgctgccg cctattacgt gggctacctg caacctagaa ccttcctgct gaaatacaac 840
gagaacggca caatcaccga cgccgtggac tgtgccctgg accccctgtc tgagacaaag 900
tgtaccctga agtctttcac cgtggagaag ggcatctacc agaccagcaa cttccgggtg 960
cagcctacag aatctatagt gcggttccct aacatcacca acctgtgtcc ttttggcgag 1020
gtgttcaacg ccactcggtt cgcctctgtc tacgcctgga accggaaacg gatctctaat 1080
tgcgtggccg attacagcgt cctgtataac tccgccagtt tcagcacatt caagtgctac 1140
ggcgtgtcac ccaccaagct gaacgatctg tgcttcacca atgtgtacgc cgatagtttc 1200
gtgatccggg gcgatgaggt gcggcagatc gcccctggac agacaggcaa gatcgccgac 1260
tacaactaca agctgcctga cgacttcaca ggctgtgtga tcgcatggaa cagcaacaac 1320
ctggacagca aggtgggcgg aaactacaac tacctgtaca gactgttcag aaagtccaac 1380
ctgaagcctt tcgagagaga tatatctacc gagatctacc aggccggcag cacaccctgt 1440
aatggagtgg aaggctttaa ctgctacttc cctctgcaaa gctatggatt tcaacctaca 1500
aatggggttg gctaccagcc ttacagagtg gtggtcctta gcttcgagct gctccatgcc 1560
cctgccaccg tgtgcggacc taagaagtcc accaacctgg tgaaaaacaa gtgcgtgaac 1620
tttaatttta acggcctgac cggaacagga gtgctgacag aaagcaacaa aaagttcctg 1680
cctttccagc agttcggcag agacattgcc gacaccacag atgctgttag agacccccag 1740
acgctggaaa tcctggatat caccccctgc tcttttggcg gcgtgagcgt gatcacccca 1800
ggcacaaaca caagcaacca ggtggctgtg ctgtaccagg gcgtgaactg tacagaggtc 1860
cctgtggcaa tccacgccga tcagctgacc cctacatggc gggtgtactc cactggatct 1920
aacgtgttcc agacaagggc cggatgcctc atcggcgctg agcacgtgaa caattcttac 1980
gagtgcgaca tccctattgg agcgggcatc tgcgccagct accagacaca gaccaatagc 2040
cctcgcagag ccagaagcgt ggcctcccag agcatcatcg cctacaccat gagcctggga 2100
gccgagaact ctgtggccta cagcaacaac agcatcgcta tccctaccaa cttcaccatc 2160
tctgtcacca ccgaaatcct gcccgtcagt atgaccaaaa ccagcgtcga ctgcaccatg 2220
tacatatgcg gcgatagcac cgaatgcagc aacctgctgc tgcagtatgg ctccttctgc 2280
acccaactta acagagccct gactggcatc gccgtggagc aggacaagaa tacccaggag 2340
gtgttcgccc aggtgaagca gatctacaag acacccccga tcaaggactt cggcggcttt 2400
aatttctctc agatcctgcc agacccatct aaaccctcta agcggagctt tatcgaggac 2460
ctgctgttca acaaggtgac tctggctgac gccggcttca tcaagcagta cggcgattgc 2520
ctgggcgaca ttgctgctag agacctgatc tgtgcccaga aattcaacgg tcttactgtg 2580
ctgcctcctc tgctgacgga tgagatgatc gcccagtaca ccagcgccct gctggccggc 2640
accatcacat ccggctggac attcggcgcc ggcgcagccc tgcagatccc ttttgccatg 2700
cagatggcct accggttcaa cggaatcgga gtgacacaga acgtgctcta cgaaaatcag 2760
aagttgatcg ccaaccagtt caacagcgcc atcggcaaga ttcaggatag tctgagttcc 2820
accgccagcg ccctgggaaa gctgcaggac gtggtcaatc agaatgccca agccctgaac 2880
accctggtga agcagctgag cagcaacttc ggcgccatca gctctgtgct gaacgacatc 2940
ctgagtagac tggacaaggt ggaagccgaa gtgcagatcg acagattgat caccggaaga 3000
ctgcaaagcc tgcagaccta cgtgacccag cagctgataa gagctgctga aatcagagcc 3060
agcgctaatc tggccgctac caagatgagc gagtgcgttc tgggccagtc taagagagtg 3120
gacttctgcg gaaaaggcta ccacctgatg tcctttcctc agtctgcccc ccacggcgtg 3180
gtgttcctgc acgtcacata cgtgcccgct caagagaaaa acttcaccac ggcccctgcc 3240
atctgtcacg acggcaaggc ccacttcccc agagagggcg tgttcgtgag caatggcacc 3300
cactggtttg tgactcagag aaacttctac gagccacaga ttatcaccac agataacacc 3360
ttcgtgtctg gcaactgcga cgtggtgatc ggcatcgtca acaacacagt gtacgaccca 3420
ctgcaacctg agctggactc attcaaggag gaactggata agtacttcaa gaatcacacc 3480
agccccgacg ttgacctggg cgacatcagc ggcattaacg cctctgtggt caacatccag 3540
aaggaaatcg acagactgaa tgaggtggcc aagaatttga acgagagcct gattgatctg 3600
caggagctgg gcaaatacga gcagtacatc aagtggcctt ggtacatctg gctgggcttc 3660
atcgccgggc tgatcgccat cgttatggtg acaatcatgc tgtgttgcat gacaagctgt 3720
tgtagctgcc tgaaaggctg ctgctcctgc ggcagctgtt gcaagtttga cgaagatgac 3780
agcgagcccg tgctgaaagg cgtcaagctg cactacacct ga 3822
<210> 37
<211> 1273
<212> PRT
<213> 人工序列
<220>
<223> SARS-CoV-2 S蛋白全长wt的氨基酸序列
<400> 37
Met Phe Val Phe Leu Val Leu Leu Pro Leu Val Ser Ser Gln Cys Val
1 5 10 15
Asn Leu Thr Thr Arg Thr Gln Leu Pro Pro Ala Tyr Thr Asn Ser Phe
20 25 30
Thr Arg Gly Val Tyr Tyr Pro Asp Lys Val Phe Arg Ser Ser Val Leu
35 40 45
His Ser Thr Gln Asp Leu Phe Leu Pro Phe Phe Ser Asn Val Thr Trp
50 55 60
Phe His Ala Ile His Val Ser Gly Thr Asn Gly Thr Lys Arg Phe Asp
65 70 75 80
Asn Pro Val Leu Pro Phe Asn Asp Gly Val Tyr Phe Ala Ser Thr Glu
85 90 95
Lys Ser Asn Ile Ile Arg Gly Trp Ile Phe Gly Thr Thr Leu Asp Ser
100 105 110
Lys Thr Gln Ser Leu Leu Ile Val Asn Asn Ala Thr Asn Val Val Ile
115 120 125
Lys Val Cys Glu Phe Gln Phe Cys Asn Asp Pro Phe Leu Gly Val Tyr
130 135 140
Tyr His Lys Asn Asn Lys Ser Trp Met Glu Ser Glu Phe Arg Val Tyr
145 150 155 160
Ser Ser Ala Asn Asn Cys Thr Phe Glu Tyr Val Ser Gln Pro Phe Leu
165 170 175
Met Asp Leu Glu Gly Lys Gln Gly Asn Phe Lys Asn Leu Arg Glu Phe
180 185 190
Val Phe Lys Asn Ile Asp Gly Tyr Phe Lys Ile Tyr Ser Lys His Thr
195 200 205
Pro Ile Asn Leu Val Arg Asp Leu Pro Gln Gly Phe Ser Ala Leu Glu
210 215 220
Pro Leu Val Asp Leu Pro Ile Gly Ile Asn Ile Thr Arg Phe Gln Thr
225 230 235 240
Leu Leu Ala Leu His Arg Ser Tyr Leu Thr Pro Gly Asp Ser Ser Ser
245 250 255
Gly Trp Thr Ala Gly Ala Ala Ala Tyr Tyr Val Gly Tyr Leu Gln Pro
260 265 270
Arg Thr Phe Leu Leu Lys Tyr Asn Glu Asn Gly Thr Ile Thr Asp Ala
275 280 285
Val Asp Cys Ala Leu Asp Pro Leu Ser Glu Thr Lys Cys Thr Leu Lys
290 295 300
Ser Phe Thr Val Glu Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val
305 310 315 320
Gln Pro Thr Glu Ser Ile Val Arg Phe Pro Asn Ile Thr Asn Leu Cys
325 330 335
Pro Phe Gly Glu Val Phe Asn Ala Thr Arg Phe Ala Ser Val Tyr Ala
340 345 350
Trp Asn Arg Lys Arg Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu
355 360 365
Tyr Asn Ser Ala Ser Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Pro
370 375 380
Thr Lys Leu Asn Asp Leu Cys Phe Thr Asn Val Tyr Ala Asp Ser Phe
385 390 395 400
Val Ile Arg Gly Asp Glu Val Arg Gln Ile Ala Pro Gly Gln Thr Gly
405 410 415
Lys Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Thr Gly Cys
420 425 430
Val Ile Ala Trp Asn Ser Asn Asn Leu Asp Ser Lys Val Gly Gly Asn
435 440 445
Tyr Asn Tyr Leu Tyr Arg Leu Phe Arg Lys Ser Asn Leu Lys Pro Phe
450 455 460
Glu Arg Asp Ile Ser Thr Glu Ile Tyr Gln Ala Gly Ser Thr Pro Cys
465 470 475 480
Asn Gly Val Glu Gly Phe Asn Cys Tyr Phe Pro Leu Gln Ser Tyr Gly
485 490 495
Phe Gln Pro Thr Asn Gly Val Gly Tyr Gln Pro Tyr Arg Val Val Val
500 505 510
Leu Ser Phe Glu Leu Leu His Ala Pro Ala Thr Val Cys Gly Pro Lys
515 520 525
Lys Ser Thr Asn Leu Val Lys Asn Lys Cys Val Asn Phe Asn Phe Asn
530 535 540
Gly Leu Thr Gly Thr Gly Val Leu Thr Glu Ser Asn Lys Lys Phe Leu
545 550 555 560
Pro Phe Gln Gln Phe Gly Arg Asp Ile Ala Asp Thr Thr Asp Ala Val
565 570 575
Arg Asp Pro Gln Thr Leu Glu Ile Leu Asp Ile Thr Pro Cys Ser Phe
580 585 590
Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Thr Ser Asn Gln Val
595 600 605
Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Glu Val Pro Val Ala Ile
610 615 620
His Ala Asp Gln Leu Thr Pro Thr Trp Arg Val Tyr Ser Thr Gly Ser
625 630 635 640
Asn Val Phe Gln Thr Arg Ala Gly Cys Leu Ile Gly Ala Glu His Val
645 650 655
Asn Asn Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala
660 665 670
Ser Tyr Gln Thr Gln Thr Asn Ser Pro Arg Arg Ala Arg Ser Val Ala
675 680 685
Ser Gln Ser Ile Ile Ala Tyr Thr Met Ser Leu Gly Ala Glu Asn Ser
690 695 700
Val Ala Tyr Ser Asn Asn Ser Ile Ala Ile Pro Thr Asn Phe Thr Ile
705 710 715 720
Ser Val Thr Thr Glu Ile Leu Pro Val Ser Met Thr Lys Thr Ser Val
725 730 735
Asp Cys Thr Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ser Asn Leu
740 745 750
Leu Leu Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Thr
755 760 765
Gly Ile Ala Val Glu Gln Asp Lys Asn Thr Gln Glu Val Phe Ala Gln
770 775 780
Val Lys Gln Ile Tyr Lys Thr Pro Pro Ile Lys Asp Phe Gly Gly Phe
785 790 795 800
Asn Phe Ser Gln Ile Leu Pro Asp Pro Ser Lys Pro Ser Lys Arg Ser
805 810 815
Phe Ile Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly
820 825 830
Phe Ile Lys Gln Tyr Gly Asp Cys Leu Gly Asp Ile Ala Ala Arg Asp
835 840 845
Leu Ile Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu
850 855 860
Leu Thr Asp Glu Met Ile Ala Gln Tyr Thr Ser Ala Leu Leu Ala Gly
865 870 875 880
Thr Ile Thr Ser Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile
885 890 895
Pro Phe Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr
900 905 910
Gln Asn Val Leu Tyr Glu Asn Gln Lys Leu Ile Ala Asn Gln Phe Asn
915 920 925
Ser Ala Ile Gly Lys Ile Gln Asp Ser Leu Ser Ser Thr Ala Ser Ala
930 935 940
Leu Gly Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn
945 950 955 960
Thr Leu Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val
965 970 975
Leu Asn Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln
980 985 990
Ile Asp Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val
995 1000 1005
Thr Gln Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn
1010 1015 1020
Leu Ala Ala Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys
1025 1030 1035
Arg Val Asp Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro
1040 1045 1050
Gln Ser Ala Pro His Gly Val Val Phe Leu His Val Thr Tyr Val
1055 1060 1065
Pro Ala Gln Glu Lys Asn Phe Thr Thr Ala Pro Ala Ile Cys His
1070 1075 1080
Asp Gly Lys Ala His Phe Pro Arg Glu Gly Val Phe Val Ser Asn
1085 1090 1095
Gly Thr His Trp Phe Val Thr Gln Arg Asn Phe Tyr Glu Pro Gln
1100 1105 1110
Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val
1115 1120 1125
Val Ile Gly Ile Val Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro
1130 1135 1140
Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1145 1150 1155
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn
1160 1165 1170
Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu
1175 1180 1185
Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu
1190 1195 1200
Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Ile Trp Leu
1205 1210 1215
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Met
1220 1225 1230
Leu Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Cys Cys
1235 1240 1245
Ser Cys Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro
1250 1255 1260
Val Leu Lys Gly Val Lys Leu His Tyr Thr
1265 1270
<210> 38
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> Kozak共有序列
<400> 38
accatgg 7
<210> 39
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> Kozak共有序列
<400> 39
accatg 6
<210> 40
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 中断接头
<400> 40
gcauaugacu 10
<210> 41
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 富含GC的元件
<400> 41
ccccggcgcc 10
<210> 42
<211> 7
<212> DNA
<213> 人工序列
<220>
<223> 富含GC的元件
<400> 42
ccccggc 7
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 富含GC的元件
<400> 43
gcgccccgcg gcgccccgcg 20
<210> 44
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 组蛋白茎环
<400> 44
caaaggctct tttcagagcc acca 24
<210> 45
<211> 45
<212> DNA
<213> 委内瑞拉马脑炎病毒
<400> 45
gataggcggc gcatgagaga agcccagacc aattacctac ccaaa 45
<210> 46
<211> 341
<212> DNA
<213> 辛德毕斯病毒
<400> 46
ggcgcgccca cccagcggcc gcccgctacg ccccaatgat ccgaccagca aaactcgatg 60
tacttccgag gaactgatgt gcataatgca tcaggctggt acattagatc cccgcttacc 120
gcgggcaata tagcaacact aaaaactcga tgtacttccg aggaagcgca gtgcataatg 180
ctgcgcagtg ttgccacata accactatat taaccattta tctagcggac gccaaaaact 240
caatgtattt ctgaggaagc gtggtgcata atgccacgca gcgtctgcat aacttttatt 300
atttctttta ttaatcaaca aaattttgtt tttaacattt c 341
<210> 47
<211> 71
<212> DNA
<213> 人工序列
<220>
<223> 延伸的亚基因组启动子的核苷酸序列
<400> 47
gggcccctat aactctctac ggctaacctg aatggacctg aatggactac gacatagtct 60
agtccgccaa g 71
<210> 48
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> poly-a序列
<400> 48
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 36
<210> 49
<211> 13409
<212> DNA
<213> 人工序列
<220>
<223> 构建体631的核苷酸序列
<400> 49
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgaaggca ataattgtac tactcatggt agtaacatcc aatgcagatc gaatctgcac 7620
tgggataaca tcttcaaact cacctcatgt ggtcaaaaca gctactcaag gggaggtcaa 7680
tgtgactggc gtgataccac tgacaacaac accaacaaaa tcttattttg caaatctcaa 7740
aggaacaagg accagaggga aactatgccc ggactgtctc aactgtacag atctggatgt 7800
ggccttgggc aggccaatgt gtgtggggac cacaccttct gctaaagctt caatactcca 7860
tgaggtcaga cctgttacat ccgggtgctt tcctataatg cacgacagaa caaaaatcag 7920
acaactaccc aatcttctca gaggatatga aaagatcagg ttatcaaccc aaaacgttat 7980
cgatgcagaa aaagcaccag gaggacccta cagacttgga acctcaggat cttgccctaa 8040
cgctaccagt aaaattggat ttttttcaac aatggcttgg gctgttccaa aggacaacta 8100
caaaaatgca acgaacccac aaacagtgga agtaccatac atttgtacag aaggggaaga 8160
ccaaattact gtttgggggt tccattcgga taacaaaacc caaatgaagt ccctctatgg 8220
agactcaaat cctcaaaagt tcacctcatc tgctaatgga gtgaccacac attatgtttc 8280
tcaaattggc gacttcccag atcaaacaga agacggagga ctaccacaaa gcggcagaat 8340
tgttgttgat tacatggtgc aaaaacctgg gaaaacagga acaattgtct atcaaagggg 8400
tgttttgttg cctcaaaagg tgtggtgcgc gagtggcagg agcaaagtaa taaaagggtc 8460
attgccttta attggtgaag cagattgcct tcatgaagaa tacggtggat taaacaaaag 8520
caagccttac tacacaggaa aacatgcaaa agccatagga aattgcccaa tatgggtaaa 8580
aacacctttg aagcttgcca atggaaccaa atatagacct cctgcaaaac tattgaagga 8640
aaggggtttc ttcggagcta ttgctggttt cctagaagga ggatgggaag gaatgattgc 8700
aggttggcac ggatacacat ctcacggagc acatggagtg gcagtggcgg cagaccttaa 8760
gagtacacaa gaagctataa ataagataac aaaaaatctc aattctttga gtgaactaga 8820
agtaaagaac cttcaaagac taagtggtgc catggatgaa ctccacaacg aaatactcga 8880
gctggatgaa aaagtggatg acctcagagc tgacactata agctcacaaa tagaacttgc 8940
agtcttgctt tccaacgaag gaataataaa cagtgaagat gagcatctat tggcacttga 9000
gagaaaacta aagaaaatgc tgggtccctc tgctgtagac ataggaaacg gatgcttcga 9060
aaccaaacac aaatgcaacc agacctgctt agacaggata gctgctggca cctttaatgc 9120
aggagaatat tctctcccca cttttgactc attgaacatt actgctgcat ctttaaatga 9180
tgatggattg gataaccata ctatactgct ctattactca actgctgctt ctagtttggc 9240
tgtaacatta atgctagcta tttttattgt ttatatggtc tccagagaca acgtttcatg 9300
ctccatttgt ctataagggc ccctataact ctctacggct aacctgaatg gactacgaca 9360
tagtctagtc cgccaagatg ctaccttcaa ctatacaaac gttaacctta tttctcacat 9420
tagggggagt gctattatca ctatatgtgt cagcttcatt gtcatactta ctatattcgg 9480
atatattgct aaaattttca cgaacagaag taactgcacc aataatgcca ttggattgtg 9540
caaacgcatc aaatgtccag gctgtgaatc gttctgcaac aaaaggggtg acacctcttc 9600
tcccagaacc ggagtggacg taccctcgtt tatcttgccc gggctcaacc tttcagaaag 9660
cactcctaat tagcccccat agattcggag aaaccaaagg aaactcagct cccttaataa 9720
taagggaacc ttttattgct tgtggaccaa aggaatgcaa acattttgct ctaacccatt 9780
atgcagctca accaggggga tactacaatg gaacaagaga agacagaaac aagctgaggc 9840
atctaatttc agtcaaattg ggcaaaatcc caacagtaga aaactctatt ttccacatgg 9900
cagcttggag tgggtccgca tgccatgatg gtagagaatg gacttacatc ggagttgatg 9960
gcccagacag taatgcattg ctcaaaataa aatatggaga agcatatact gacacatacc 10020
attcctatgc aaaaaacatc ctaaggacac aagaaagtgc ctgcaattgc atcgggggag 10080
attgttatct gatgataact gatggcccag cttcagggat tagtgaatgc agattcctta 10140
agattcgaga gggccgaata ataaaagaaa tatttccaac aggaagagta aaacacactg 10200
aggaatgcac atgcggattt gccagcaaca aaaccataga atgtgcctgt agagataaca 10260
gttacacagc aaaaagaccc tttgtcaaat taaatgtgga gaccgataca gcggaaataa 10320
gattgatgtg cacaaagact tatttggaca cccccagacc aaatgatgga agcataacag 10380
ggccttgcga atctgatgga aacgaagggg gtggaggcat caagggagga tttgttcacc 10440
aaagaatggc atccaagatt ggaaggtggt actctcggac gatgtctaaa actcaaagaa 10500
tggggatggg actgtatgta aagtatgatg gagacccatg gactgacagt gaagcccttg 10560
ctcttagtgg agtaatggtt tcaatgggag aacctggttg gtattccttt ggcttcgaaa 10620
taaaagataa gaaatgtgat gtcccctgta ttgggataga aatggtacat gatggtggga 10680
aaacgacttg gcactcagcg gcaacagcca tttactgttt aatgggctca ggacaactgc 10740
tgtgggacac tgtcacaggt gttaatatga ctctgtaagg cgcgcccacc cagcggccgc 10800
ccgctacgcc ccaatgatcc gaccagcaaa actcgatgta cttccgagga actgatgtgc 10860
ataatgcatc aggctggtac attagatccc cgcttaccgc gggcaatata gcaacactaa 10920
aaactcgatg tacttccgag gaagcgcagt gcataatgct gcgcagtgtt gccacataac 10980
cactatatta accatttatc tagcggacgc caaaaactca atgtatttct gaggaagcgt 11040
ggtgcataat gccacgcagc gtctgcataa cttttattat ttcttttatt aatcaacaaa 11100
attttgtttt taacatttca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaag 11160
agcgtttaaa cacgtgatat ctggcctcat gggccttcct ttcactgccc gctttccagt 11220
cgggaaacct gtcgtgccag ctgcattaac atggtcatag ctgtttcctt gcgtattggg 11280
cgctctccgc ttcctcgctc actgactcgc tgcgctcggt cgttcgggta aagcctgggg 11340
tgcctaatga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 11400
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 11460
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 11520
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 11580
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 11640
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 11700
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 11760
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 11820
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 11880
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 11940
tggttttttt gtttgcaggc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 12000
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 12060
ggtcatgaat acacggtgcc tgactgcgtt agcaatttaa ctgtgataaa ctaccgcatt 12120
aaagcttatc gatgataagc tgtcaaacat gagaattctt agaaaaactc atcgagcatc 12180
aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt 12240
ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat 12300
cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa 12360
ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa 12420
agcttatgca tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa 12480
tcactcgcat caaccaaacc gttattcatt cgtgattgcg cctgagcgag acgaaatacg 12540
cgatcgctgt taaaaggaca attacaaaca ggaatcgaat gcaaccggcg caggaacact 12600
gccagcgcat caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaatgct 12660
gttttcccgg ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc 12720
ttgatggtcg gaagaggcat aaattccgtc agccagttta gtctgaccat ctcatctgta 12780
acatcattgg caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc 12840
ccatacaatc gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac 12900
ccatataaat cagcatccat gttggaattt aatcgcggcc tcgagcaaga cgtttcccgt 12960
tgaatatggc tcataacacc ccttgtatta ctgtttatgt aagcagacag ttttattgtt 13020
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 13080
atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa attcgcgtta 13140
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 13200
aaatcaaaag aatagaccga gatagggttg agtggccgct acagggcgct cccattcgcc 13260
attcaggctg cgcaactgtt gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc 13320
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 13380
agtcacacgc gtaatacgac tcactatag 13409
<210> 50
<211> 13295
<212> DNA
<213> 人工序列
<220>
<223> 构建体632的核苷酸序列
<400> 50
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgaatcca aatcagaaga taataaccat cggatcaatc tgtatggtaa ttggaatagt 7620
tagcttaatg ttacaaattg ggaacatgat ctcaatatgg gtcagtcatt caattcagac 7680
agggaatcaa tgccaagctg aaccaatcag caatactaaa tttcttactg agaaagctgt 7740
ggcttcagta acattagcgg gcaattcatc tctttgcccc attagcggat gggctgtata 7800
cagtaaggac aacagtataa ggatcggttc caggggggat gtgtttgtta taagagagcc 7860
gttcatctca tgctcccact tggaatgcag aactttcttt ttgactcagg gagccttgct 7920
gaatgacaag cactccaatg ggactgtcaa agacagaagc cctcacagaa cattaatgag 7980
ttgtcctgtg ggtgaggctc cctccccata taactcaagg tttgagtctg ttgcttggtc 8040
agcaagtgct tgccatgatg gcaccagttg gttgacaatt ggaatttctg gtccagacaa 8100
tggggctgtg gctgtattga aatacaatgg cataataaca gacaccatca agagttggag 8160
gaacaacata ctgagaactc aagagtctga atgtgcatgt gtaaatggct cttgctttac 8220
tgtaatgact gatggaccaa gtagtgggca ggcatcatat aagatcttca aaatggaaaa 8280
agggaaagtg gttaaatcag tcgaattgga tgctcctaat tatcactatg aggagtgctc 8340
ctgttatcct gatgccggcg aaatcacatg tgtgtgcagg gataattggc atggctcaaa 8400
taggccatgg gtatctttca atcaaaattt ggagtatcaa ataggatata tatgcagtgg 8460
agttttcgga gacaatccac gccccaatga tggaacaggt agttgtggtc cggtgttctc 8520
taacggggca tatggggtaa aagggttttc attcaaatac ggcaatggtg tttggatcgg 8580
gagaaccaaa agcactaatt ccaggagcgg ctttgaaatg atttgggacc caaatgggtg 8640
gactggaacg gacagtagct tttcggtgaa gcaagatatc gtagcaataa ctgattggtc 8700
aggatatagc gggagttttg tccagcatcc agaactgaca ggattagatt gcataagacc 8760
ttgtttctgg gttgagttaa tcagagggcg gcctaaagag agcacaattt ggaccagtgg 8820
gagcagcata tctttttgtg gtgtaaatag tgacactgtt agttggtctt ggccagacgg 8880
tgctgagttg ccattcacca ttgacaagta ggggccccta taactctcta cggctaacct 8940
gaatggacta cgacatagtc tagtccgcca agatggagaa aatagtgctt cttcttgcaa 9000
tagtcagcct tgttaaaagt gatcagattt gcattggtta ccatgcaaac aactcgacag 9060
agcaggttga cacaataatg gaaaagaacg tcactgttac acacgcccaa gacatactgg 9120
aaaagacaca caacgggaaa ctctgcgatc tagatggagt gaagcctcta attttaagag 9180
attgtagtgt agctggatgg ctcctcggga acccaatgtg tgacgaattc ctcaatgtgc 9240
cggaatggtc ttacatagtg gagaagatca atccagccaa tgacctctgt tacccaggga 9300
atttcaacga ctatgaagaa ctgaaacacc tattgagcag aataaaccat tttgagaaaa 9360
ttcagatcat ccccaaaagt tcttggtcag atcatgaagc ctcagcaggg gtgagctcag 9420
catgtccata ccagggaagg tcctcctttt ttagaaatgt ggtatggctt atcaaaaagg 9480
acaatgcata cccaacaata aagagaagtt acaataatac caaccaagaa gatcttttgg 9540
tattgtgggg gattcaccat ccaaatgatg cggcagagca gacaaggctc tatcaaaacc 9600
caactaccta tatttccgtt gggacatcaa cactaaacca gagattggta ccaaaaatag 9660
ccactagatc taaggtaaac gggcaaagtg gaaggatgga gttcttttgg acaattttaa 9720
aaccgaatga tgcaataaac tttgagagta atggaaattt cattgctcca gaaaatgcat 9780
acaaaattgt caagaaaggg gactcaacaa ttatgaaaag tgagttggaa tatggtaact 9840
gcaacaccaa gtgtcaaact ccaatagggg cgataaactc tagtatgcca ttccacaaca 9900
tccaccctct caccatcggg gaatgcccca aatatgtgaa atcaagcaga ttagtccttg 9960
ctactgggct cagaaatagc cctcaacgag agacacgagg actatttgga gctatagcag 10020
gttttataga gggaggatgg ggaatggtag atggttggta tgggtaccac catagcaacg 10080
agcaggggag tgggtacgct gcagacaaag aatccactca aaaggcaata gatggagtca 10140
ccaataaggt caactcgatc attgacaaaa tgaacactca gtttgaggct gttggaaggg 10200
aatttaataa cttagaaagg agaatagaaa atttaaacaa gaagatggaa gacggattcc 10260
tagatgtctg gacttataat gctgaacttc tggttctcat ggaaaatgag agaactctag 10320
actttcatga ctcaaatgtc aagaaccttt acgacaaggt ccgactacag cttagggata 10380
atgcaaagga gcttggtaac ggttgtttcg agttctatca cagatgtgat aatgaatgta 10440
tggaaagtgt aagaaacgga acgtatgact acccgcagta ttcagaagaa gcaagattaa 10500
aaagagagga aataagtgga gtaaaattgg aatcaatagg aacttaccaa atactgtcaa 10560
tttattcaac agtggcgagc tccctagcac tggcaatcat ggtggctggt ctatctttat 10620
ggatgtgctc caatggatcg ttacaatgca gaatttgcat ttaaggcgcg cccacccagc 10680
ggccgcccgc tacgccccaa tgatccgacc agcaaaactc gatgtacttc cgaggaactg 10740
atgtgcataa tgcatcaggc tggtacatta gatccccgct taccgcgggc aatatagcaa 10800
cactaaaaac tcgatgtact tccgaggaag cgcagtgcat aatgctgcgc agtgttgcca 10860
cataaccact atattaacca tttatctagc ggacgccaaa aactcaatgt atttctgagg 10920
aagcgtggtg cataatgcca cgcagcgtct gcataacttt tattatttct tttattaatc 10980
aacaaaattt tgtttttaac atttcaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 11040
aagaagagcg tttaaacacg tgatatctgg cctcatgggc cttcctttca ctgcccgctt 11100
tccagtcggg aaacctgtcg tgccagctgc attaacatgg tcatagctgt ttccttgcgt 11160
attgggcgct ctccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cgggtaaagc 11220
ctggggtgcc taatgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 11280
gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 11340
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 11400
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 11460
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 11520
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 11580
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 11640
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 11700
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 11760
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 11820
tagcggtggt ttttttgttt gcaggcagca gattacgcgc agaaaaaaag gatctcaaga 11880
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 11940
gattttggtc atgaatacac ggtgcctgac tgcgttagca atttaactgt gataaactac 12000
cgcattaaag cttatcgatg ataagctgtc aaacatgaga attcttagaa aaactcatcg 12060
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 12120
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 12180
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 12240
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 12300
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 12360
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 12420
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg 12480
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 12540
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 12600
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 12660
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 12720
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 12780
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 12840
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacagtttt 12900
attgttcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 12960
gcgcacattt ccccgaaaag tgccacctaa attgtaagcg ttaatatttt gttaaaattc 13020
gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc 13080
ccttataaat caaaagaata gaccgagata gggttgagtg gccgctacag ggcgctccca 13140
ttcgccattc aggctgcgca actgttggga agggcgtttc ggtgcgggcc tcttcgctat 13200
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 13260
tttcccagtc acacgcgtaa tacgactcac tatag 13295
<210> 51
<211> 13364
<212> DNA
<213> 人工序列
<220>
<223> 构建体629的核苷酸序列
<400> 51
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgaagact atcattgctt tgagctacat tctatgtctg gttttcactc aaaaaattcc 7620
tggaaatgac aatagcacgg caacgctgtg ccttgggcac catgcagtac caaacggaac 7680
gatagtgaaa acaatcacaa atgaccgaat tgaagttact aatgctactg agttggttca 7740
gaattcctca ataggtaaaa tatgcgacag tcctcatcag atccttgatg gagggaactg 7800
cacactaata gatgctctat tgggggaccc tcagtgtgac ggctttcaaa ataagaaatg 7860
ggaccttttt gttgaacgaa gcagagccta cagcaactgt tacccttatg atgtgccgga 7920
ttatgcctcc cttaggtcac tagttgcctc atccggcaca ctggagttta aaaatgaaag 7980
cttcaattgg gctggagtca ctcaaaacgg aaaaagtttt tcttgcataa ggggatctag 8040
tagtagtttc tttagtagat taaattggtt gacccattta aactacacat atccagcact 8100
gaacgtgact atgccaaaca aggaacaatt tgacaaattg tacatttggg gggttcacca 8160
cccgggtacg gacaaggacc aaatctccct gtatgctcaa tcatcaggaa gaatcacagt 8220
atctaccaaa agaagccaac aagctgtaat cccaaatatc ggatctagac ccagaataag 8280
ggatatccct agcagaataa gcatctattg gacaatagta aaaccgggag acatactttt 8340
gattaacagc acagggaatc taattgctcc taggggttac ttcaaaatac gaagtgggaa 8400
aagctcaata atgagatcag atgcacccat tggcaaatgc aagtctgaat gcatcactcc 8460
aaatggaagc attcccaatg acaaaccatt ccaaaatgtg aacaggatca catacggggc 8520
ctgtcccaga tatgttaagc aaagcactct gaaattggca acaggaatgc gaaatgtacc 8580
agagaaacaa actagaggca tatttggtgc aatagcgggt ttcatagaaa atggttggga 8640
gggaatggtg gatggttggt acggtttcag acatcaaaat tctgagggaa gaggacaagc 8700
agcagatctc aaaagcactc aagcagcaat cgatcaaatc aatgggaagc tgaatcgatt 8760
gatcggaaaa accaacgaga aattccatca gattgaaaaa gaattctcag aagtagaagg 8820
aagagttcaa gaccttgaga aatatgttga ggacactaaa atagatctct ggtcatacaa 8880
cgcggagctt cttgttgccc tggagaacca acatacaatt gatctaactg actcagaaat 8940
gaacaaactg tttgaaaaaa caaagaagca actgagggaa aatgctgagg atatgggaaa 9000
tggttgtttc aaaatatacc acaaatgtga caatgcctgc ataggatcaa taagaaacga 9060
aacttatgac cacaatgtgt acagggatga agcattaaac aaccggttcc agatcaaggg 9120
agttgagctg aagtcagggt acaaagattg gatcctatgg atttcctttg ccatatcatg 9180
ttttttgctt tgtgttgctt tgttggggtt catcatgtgg gcctgccaaa agggcaacat 9240
tagatgcaac atctgcattt gagggcccct ataactctct acggctaacc tgaatggact 9300
acgacatagt ctagtccgcc aagatgaatc caaatcaaaa gataataacg attggctctg 9360
tttctctcac aatttccaca atatgcttct tcatgcaaat tgccatcctg ataactactg 9420
taacattgca tttcaagcaa tatgaattca actccccccc gaataaccaa gtgatgctgt 9480
gtgaaccaac aataatagaa agaaacataa cagagatagt gtatttgacc aacaccacca 9540
tagagaagga aatatgcccc aaaccagcag aatacagaaa ttggtcaaaa ccgcaatgtg 9600
acattacagg atttgcacct ttctctaagg acaattcgat taggctttcc gctggtgggg 9660
acatctgggt gacaagagaa ccttatgtgt catgcgacct tgacaagtgt tatcaatttg 9720
cacttggaca gggaacaaca ctaaacaacg tgcattcaaa taacacagta cgtgatagga 9780
ccccttatcg gactctattg atgaatgagt tgggtgttcc tttccatctg gggaccaagc 9840
aagtgtgcat agcatggtcc agctcaagtt gtcacgatgg aaaagcatgg ctgcatgttt 9900
gtataacggg ggatgataaa aatgcaactg ctagcttcat ttacaatggg aggcttgtag 9960
atagtgttgt ttcatggtcc aacgatattc tcaggaccca ggagtcagaa tgcgtttgta 10020
tcaatggaac ttgtacagta gtaatgactg atggaaatgc cacaggaaaa gctgatacta 10080
aaatactatt cattgaggag gggaaaatcg ttcatactag caaattgtca ggaagtgctc 10140
agcatgtcga agagtgctct tgctatcctc gatatcctgg tgtcagatgt gtctgcagag 10200
acaactggaa aggatccaac cggcccatca tagatataaa cataaaggat catagcattg 10260
tttccagtta tgtgtgttca gggcttgttg gagacacacc cagaaaaagc gacagctcca 10320
gcagtagcca ttgtttgaat cctaacaatg aaaaaggtgg tcatggagtg aaaggctggg 10380
cctttgatga tggaaatgac gtgtggatgg ggagaacaat caacgagacg tcacgcttag 10440
ggtatgaaac cttcaaagtc gttgaaggct ggtccaaccc taagtccaaa ttgcagataa 10500
ataggcaagt catagttgac agaggtgata ggtccggtta ttctggtatt ttctctgttg 10560
aaggcaaaag ctgcatcaat cggtgcttct atgtggagtt gattagggga agaaaagagg 10620
aaactgaagt cttgtggacc tcaaacagta ttgttgtgtt ttgtggcacc tcaggtacat 10680
atggaacagg ctcatggcct gatggggcgg acctcaatct catgcataca taaggcgcgc 10740
ccacccagcg gccgcccgct acgccccaat gatccgacca gcaaaactcg atgtacttcc 10800
gaggaactga tgtgcataat gcatcaggct ggtacattag atccccgctt accgcgggca 10860
atatagcaac actaaaaact cgatgtactt ccgaggaagc gcagtgcata atgctgcgca 10920
gtgttgccac ataaccacta tattaaccat ttatctagcg gacgccaaaa actcaatgta 10980
tttctgagga agcgtggtgc ataatgccac gcagcgtctg cataactttt attatttctt 11040
ttattaatca acaaaatttt gtttttaaca tttcaaaaaa aaaaaaaaaa aaaaaaaaaa 11100
aaaaaaaaaa agaagagcgt ttaaacacgt gatatctggc ctcatgggcc ttcctttcac 11160
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 11220
tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 11280
gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 11340
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 11400
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 11460
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 11520
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 11580
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 11640
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 11700
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 11760
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 11820
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 11880
caccgctggt agcggtggtt tttttgtttg caggcagcag attacgcgca gaaaaaaagg 11940
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 12000
acgttaaggg attttggtca tgaatacacg gtgcctgact gcgttagcaa tttaactgtg 12060
ataaactacc gcattaaagc ttatcgatga taagctgtca aacatgagaa ttcttagaaa 12120
aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat 12180
ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg 12240
gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat 12300
ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc 12360
ggtgagaatg gcaaaagctt atgcatttct ttccagactt gttcaacagg ccagccatta 12420
cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga 12480
gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac 12540
cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct 12600
aatacctgga atgctgtttt cccggggatc gcagtggtga gtaaccatgc atcatcagga 12660
gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg 12720
accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct 12780
ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg 12840
cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg cggcctcgag 12900
caagacgttt cccgttgaat atggctcata acaccccttg tattactgtt tatgtaagca 12960
gacagtttta ttgttcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 13020
aggggttccg cgcacatttc cccgaaaagt gccacctaaa ttgtaagcgt taatattttg 13080
ttaaaattcg cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc 13140
ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgg ccgctacagg 13200
gcgctcccat tcgccattca ggctgcgcaa ctgttgggaa gggcgtttcg gtgcgggcct 13260
cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 13320
cgccagggtt ttcccagtca cacgcgtaat acgactcact atag 13364
<210> 52
<211> 13409
<212> DNA
<213> 人工序列
<220>
<223> 构建体695的核苷酸序列
<400> 52
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgctacct tcaactatac aaacgttaac cttatttctc acattagggg gagtgctatt 7620
atcactatat gtgtcagctt cattgtcata cttactatat tcggatatat tgctaaaatt 7680
ttcacgaaca gaagtaactg caccaataat gccattggat tgtgcaaacg catcaaatgt 7740
ccaggctgtg aatcgttctg caacaaaagg ggtgacacct cttctcccag aaccggagtg 7800
gacgtaccct cgtttatctt gcccgggctc aacctttcag aaagcactcc taattagccc 7860
ccatagattc ggagaaacca aaggaaactc agctccctta ataataaggg aaccttttat 7920
tgcttgtgga ccaaaggaat gcaaacattt tgctctaacc cattatgcag ctcaaccagg 7980
gggatactac aatggaacaa gagaagacag aaacaagctg aggcatctaa tttcagtcaa 8040
attgggcaaa atcccaacag tagaaaactc tattttccac atggcagctt ggagtgggtc 8100
cgcatgccat gatggtagag aatggactta catcggagtt gatggcccag acagtaatgc 8160
attgctcaaa ataaaatatg gagaagcata tactgacaca taccattcct atgcaaaaaa 8220
catcctaagg acacaagaaa gtgcctgcaa ttgcatcggg ggagattgtt atctgatgat 8280
aactgatggc ccagcttcag ggattagtga atgcagattc cttaagattc gagagggccg 8340
aataataaaa gaaatatttc caacaggaag agtaaaacac actgaggaat gcacatgcgg 8400
atttgccagc aacaaaacca tagaatgtgc ctgtagagat aacagttaca cagcaaaaag 8460
accctttgtc aaattaaatg tggagaccga tacagcggaa ataagattga tgtgcacaaa 8520
gacttatttg gacaccccca gaccaaatga tggaagcata acagggcctt gcgaatctga 8580
tggaaacgaa gggggtggag gcatcaaggg aggatttgtt caccaaagaa tggcatccaa 8640
gattggaagg tggtactctc ggacgatgtc taaaactcaa agaatgggga tgggactgta 8700
tgtaaagtat gatggagacc catggactga cagtgaagcc cttgctctta gtggagtaat 8760
ggtttcaatg ggagaacctg gttggtattc ctttggcttc gaaataaaag ataagaaatg 8820
tgatgtcccc tgtattggga tagaaatggt acatgatggt gggaaaacga cttggcactc 8880
agcggcaaca gccatttact gtttaatggg ctcaggacaa ctgctgtggg acactgtcac 8940
aggtgttaat atgactctgt aagggcccct ataactctct acggctaacc tgaatggact 9000
acgacatagt ctagtccgcc aagatgaagg caataattgt actactcatg gtagtaacat 9060
ccaatgcaga tcgaatctgc actgggataa catcttcaaa ctcacctcat gtggtcaaaa 9120
cagctactca aggggaggtc aatgtgactg gcgtgatacc actgacaaca acaccaacaa 9180
aatcttattt tgcaaatctc aaaggaacaa ggaccagagg gaaactatgc ccggactgtc 9240
tcaactgtac agatctggat gtggccttgg gcaggccaat gtgtgtgggg accacacctt 9300
ctgctaaagc ttcaatactc catgaggtca gacctgttac atccgggtgc tttcctataa 9360
tgcacgacag aacaaaaatc agacaactac ccaatcttct cagaggatat gaaaagatca 9420
ggttatcaac ccaaaacgtt atcgatgcag aaaaagcacc aggaggaccc tacagacttg 9480
gaacctcagg atcttgccct aacgctacca gtaaaattgg atttttttca acaatggctt 9540
gggctgttcc aaaggacaac tacaaaaatg caacgaaccc acaaacagtg gaagtaccat 9600
acatttgtac agaaggggaa gaccaaatta ctgtttgggg gttccattcg gataacaaaa 9660
cccaaatgaa gtccctctat ggagactcaa atcctcaaaa gttcacctca tctgctaatg 9720
gagtgaccac acattatgtt tctcaaattg gcgacttccc agatcaaaca gaagacggag 9780
gactaccaca aagcggcaga attgttgttg attacatggt gcaaaaacct gggaaaacag 9840
gaacaattgt ctatcaaagg ggtgttttgt tgcctcaaaa ggtgtggtgc gcgagtggca 9900
ggagcaaagt aataaaaggg tcattgcctt taattggtga agcagattgc cttcatgaag 9960
aatacggtgg attaaacaaa agcaagcctt actacacagg aaaacatgca aaagccatag 10020
gaaattgccc aatatgggta aaaacacctt tgaagcttgc caatggaacc aaatatagac 10080
ctcctgcaaa actattgaag gaaaggggtt tcttcggagc tattgctggt ttcctagaag 10140
gaggatggga aggaatgatt gcaggttggc acggatacac atctcacgga gcacatggag 10200
tggcagtggc ggcagacctt aagagtacac aagaagctat aaataagata acaaaaaatc 10260
tcaattcttt gagtgaacta gaagtaaaga accttcaaag actaagtggt gccatggatg 10320
aactccacaa cgaaatactc gagctggatg aaaaagtgga tgacctcaga gctgacacta 10380
taagctcaca aatagaactt gcagtcttgc tttccaacga aggaataata aacagtgaag 10440
atgagcatct attggcactt gagagaaaac taaagaaaat gctgggtccc tctgctgtag 10500
acataggaaa cggatgcttc gaaaccaaac acaaatgcaa ccagacctgc ttagacagga 10560
tagctgctgg cacctttaat gcaggagaat attctctccc cacttttgac tcattgaaca 10620
ttactgctgc atctttaaat gatgatggat tggataacca tactatactg ctctattact 10680
caactgctgc ttctagtttg gctgtaacat taatgctagc tatttttatt gtttatatgg 10740
tctccagaga caacgtttca tgctccattt gtctataagg cgcgcccacc cagcggccgc 10800
ccgctacgcc ccaatgatcc gaccagcaaa actcgatgta cttccgagga actgatgtgc 10860
ataatgcatc aggctggtac attagatccc cgcttaccgc gggcaatata gcaacactaa 10920
aaactcgatg tacttccgag gaagcgcagt gcataatgct gcgcagtgtt gccacataac 10980
cactatatta accatttatc tagcggacgc caaaaactca atgtatttct gaggaagcgt 11040
ggtgcataat gccacgcagc gtctgcataa cttttattat ttcttttatt aatcaacaaa 11100
attttgtttt taacatttca aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaagaag 11160
agcgtttaaa cacgtgatat ctggcctcat gggccttcct ttcactgccc gctttccagt 11220
cgggaaacct gtcgtgccag ctgcattaac atggtcatag ctgtttcctt gcgtattggg 11280
cgctctccgc ttcctcgctc actgactcgc tgcgctcggt cgttcgggta aagcctgggg 11340
tgcctaatga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 11400
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 11460
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 11520
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 11580
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 11640
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 11700
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 11760
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 11820
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 11880
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 11940
tggttttttt gtttgcaggc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 12000
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 12060
ggtcatgaat acacggtgcc tgactgcgtt agcaatttaa ctgtgataaa ctaccgcatt 12120
aaagcttatc gatgataagc tgtcaaacat gagaattctt agaaaaactc atcgagcatc 12180
aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg aaaaagccgt 12240
ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag atcctggtat 12300
cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc ctcgtcaaaa 12360
ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga gaatggcaaa 12420
agcttatgca tttctttcca gacttgttca acaggccagc cattacgctc gtcatcaaaa 12480
tcactcgcat caaccaaacc gttattcatt cgtgattgcg cctgagcgag acgaaatacg 12540
cgatcgctgt taaaaggaca attacaaaca ggaatcgaat gcaaccggcg caggaacact 12600
gccagcgcat caacaatatt ttcacctgaa tcaggatatt cttctaatac ctggaatgct 12660
gttttcccgg ggatcgcagt ggtgagtaac catgcatcat caggagtacg gataaaatgc 12720
ttgatggtcg gaagaggcat aaattccgtc agccagttta gtctgaccat ctcatctgta 12780
acatcattgg caacgctacc tttgccatgt ttcagaaaca actctggcgc atcgggcttc 12840
ccatacaatc gatagattgt cgcacctgat tgcccgacat tatcgcgagc ccatttatac 12900
ccatataaat cagcatccat gttggaattt aatcgcggcc tcgagcaaga cgtttcccgt 12960
tgaatatggc tcataacacc ccttgtatta ctgtttatgt aagcagacag ttttattgtt 13020
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 13080
atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa attcgcgtta 13140
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 13200
aaatcaaaag aatagaccga gatagggttg agtggccgct acagggcgct cccattcgcc 13260
attcaggctg cgcaactgtt gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc 13320
agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc 13380
agtcacacgc gtaatacgac tcactatag 13409
<210> 53
<211> 13364
<212> DNA
<213> 人工序列
<220>
<223> 构建体703的核苷酸序列
<400> 53
ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60
ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120
aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180
tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240
gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300
gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360
aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420
ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480
aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540
ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600
agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660
cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720
ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780
ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840
tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900
tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960
cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020
tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080
tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140
tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200
tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260
ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320
acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380
atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440
caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500
acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560
tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620
tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680
aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740
ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800
taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860
tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920
ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980
gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040
aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100
ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160
cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220
gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280
aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340
ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400
ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460
ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520
tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580
gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640
cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700
aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760
aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820
ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880
tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940
taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000
cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060
agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120
tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180
cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240
gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300
cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360
cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420
gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480
tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540
gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600
tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660
tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720
agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780
tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840
gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900
cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960
acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020
aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080
gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140
tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200
tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260
cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320
acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380
acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440
cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500
ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560
atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620
caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680
atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740
tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800
aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860
gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920
tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980
caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040
acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100
cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160
aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220
aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280
ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340
gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400
gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460
gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520
caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580
ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640
ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700
catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760
cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820
tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880
acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940
ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000
tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060
cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120
ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180
ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240
ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300
ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360
cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420
ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480
aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540
taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600
aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660
cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720
acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780
tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840
acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900
tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960
aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020
tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080
cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140
acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200
aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260
gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320
aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380
gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440
tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500
gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560
gatgaatcca aatcaaaaga taataacgat tggctctgtt tctctcacaa tttccacaat 7620
atgcttcttc atgcaaattg ccatcctgat aactactgta acattgcatt tcaagcaata 7680
tgaattcaac tcccccccga ataaccaagt gatgctgtgt gaaccaacaa taatagaaag 7740
aaacataaca gagatagtgt atttgaccaa caccaccata gagaaggaaa tatgccccaa 7800
accagcagaa tacagaaatt ggtcaaaacc gcaatgtgac attacaggat ttgcaccttt 7860
ctctaaggac aattcgatta ggctttccgc tggtggggac atctgggtga caagagaacc 7920
ttatgtgtca tgcgaccttg acaagtgtta tcaatttgca cttggacagg gaacaacact 7980
aaacaacgtg cattcaaata acacagtacg tgataggacc ccttatcgga ctctattgat 8040
gaatgagttg ggtgttcctt tccatctggg gaccaagcaa gtgtgcatag catggtccag 8100
ctcaagttgt cacgatggaa aagcatggct gcatgtttgt ataacggggg atgataaaaa 8160
tgcaactgct agcttcattt acaatgggag gcttgtagat agtgttgttt catggtccaa 8220
cgatattctc aggacccagg agtcagaatg cgtttgtatc aatggaactt gtacagtagt 8280
aatgactgat ggaaatgcca caggaaaagc tgatactaaa atactattca ttgaggaggg 8340
gaaaatcgtt catactagca aattgtcagg aagtgctcag catgtcgaag agtgctcttg 8400
ctatcctcga tatcctggtg tcagatgtgt ctgcagagac aactggaaag gatccaaccg 8460
gcccatcata gatataaaca taaaggatca tagcattgtt tccagttatg tgtgttcagg 8520
gcttgttgga gacacaccca gaaaaagcga cagctccagc agtagccatt gtttgaatcc 8580
taacaatgaa aaaggtggtc atggagtgaa aggctgggcc tttgatgatg gaaatgacgt 8640
gtggatgggg agaacaatca acgagacgtc acgcttaggg tatgaaacct tcaaagtcgt 8700
tgaaggctgg tccaacccta agtccaaatt gcagataaat aggcaagtca tagtggatag 8760
aggtgatagg tccggataca gcggtatttt ctctgttgaa ggcaaaagct gcatcaatcg 8820
gtgcttctat gtggagttga ttaggggaag aaaagaggaa actgaagtct tgtggacctc 8880
aaacagtatt gttgtgtttt gtggcacctc aggtacatat ggaacaggct catggcctga 8940
tggggcggac ctcaatctca tgcatacata agggccccta taactctcta cggctaacct 9000
gaatggacta cgacatagtc tagtccgcca agatgaagac tatcattgct ttgagctaca 9060
ttctatgtct ggttttcact caaaaaattc ctggaaatga caatagcacg gcaacgctgt 9120
gccttgggca ccatgcagta ccaaacggaa cgatagtgaa aacaatcaca aatgaccgaa 9180
ttgaagttac taatgctact gagttggttc agaattcctc aataggtaaa atatgcgaca 9240
gtcctcatca gatccttgat ggagggaact gcacactaat agatgctcta ttgggggacc 9300
ctcagtgtga cggctttcaa aataagaaat gggacctttt tgttgaacga agcagagcct 9360
acagcaactg ttacccttat gatgtgccgg attatgcctc ccttaggtca ctagttgcct 9420
catccggcac actggagttt aaaaatgaaa gcttcaattg ggctggagtc actcaaaacg 9480
gaaaaagttt ttcttgcata aggggatcta gtagtagttt ctttagtaga ttaaattggt 9540
tgacccattt aaactacaca tatccagcac tgaacgtgac tatgccaaac aaggaacaat 9600
ttgacaaatt gtacatttgg ggggttcacc acccgggtac ggacaaggac caaatctccc 9660
tgtatgctca atcatcagga agaatcacag tatctaccaa aagaagccaa caagctgtaa 9720
tcccaaatat cggatctaga cccagaataa gggatatccc tagcagaata agcatctatt 9780
ggacaatagt aaaaccggga gacatacttt tgattaacag cacagggaat ctaattgctc 9840
ctaggggtta cttcaaaata cgaagtggga aaagctcaat aatgagatca gatgcaccca 9900
ttggcaaatg caagtctgaa tgcatcactc caaatggaag cattcccaat gacaaaccat 9960
tccaaaatgt gaacaggatc acatacgggg cctgtcccag atatgttaag caaagcactc 10020
tgaaattggc aacaggaatg cgaaatgtac cagagaaaca aactagaggc atatttggtg 10080
caatagcggg tttcatagaa aatggttggg agggaatggt ggatggttgg tacggtttca 10140
gacatcaaaa ttctgaggga agaggacaag cagcagatct caaaagcact caagcagcaa 10200
tcgatcaaat caatgggaag ctgaatcgat tgatcggaaa aaccaacgag aaattccatc 10260
agattgaaaa agaattctca gaagtagaag gaagagttca agaccttgag aaatatgttg 10320
aggacactaa aatagatctc tggtcataca acgcggagct tcttgttgcc ctggagaacc 10380
aacatacaat tgatctaact gactcagaaa tgaacaaact gtttgaaaaa acaaagaagc 10440
aactgaggga aaatgctgag gatatgggaa atggttgttt caaaatatac cacaaatgtg 10500
acaatgcctg cataggatca ataagaaacg aaacttatga ccacaatgtg tacagggatg 10560
aagcattaaa caaccggttc cagatcaagg gagttgagct gaagtcaggg tacaaagatt 10620
ggatcctatg gatttccttt gccatatcat gttttttgct ttgtgttgct ttgttggggt 10680
tcatcatgtg ggcctgccaa aagggcaaca ttagatgcaa catctgcatt tgaggcgcgc 10740
ccacccagcg gccgcccgct acgccccaat gatccgacca gcaaaactcg atgtacttcc 10800
gaggaactga tgtgcataat gcatcaggct ggtacattag atccccgctt accgcgggca 10860
atatagcaac actaaaaact cgatgtactt ccgaggaagc gcagtgcata atgctgcgca 10920
gtgttgccac ataaccacta tattaaccat ttatctagcg gacgccaaaa actcaatgta 10980
tttctgagga agcgtggtgc ataatgccac gcagcgtctg cataactttt attatttctt 11040
ttattaatca acaaaatttt gtttttaaca tttcaaaaaa aaaaaaaaaa aaaaaaaaaa 11100
aaaaaaaaaa agaagagcgt ttaaacacgt gatatctggc ctcatgggcc ttcctttcac 11160
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 11220
tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 11280
gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 11340
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 11400
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 11460
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 11520
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 11580
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 11640
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 11700
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 11760
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 11820
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 11880
caccgctggt agcggtggtt tttttgtttg caggcagcag attacgcgca gaaaaaaagg 11940
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 12000
acgttaaggg attttggtca tgaatacacg gtgcctgact gcgttagcaa tttaactgtg 12060
ataaactacc gcattaaagc ttatcgatga taagctgtca aacatgagaa ttcttagaaa 12120
aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc aataccatat 12180
ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt ccataggatg 12240
gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca acctattaat 12300
ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac gactgaatcc 12360
ggtgagaatg gcaaaagctt atgcatttct ttccagactt gttcaacagg ccagccatta 12420
cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga ttgcgcctga 12480
gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat cgaatgcaac 12540
cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg atattcttct 12600
aatacctgga atgctgtttt cccggggatc gcagtggtga gtaaccatgc atcatcagga 12660
gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca gtttagtctg 12720
accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag aaacaactct 12780
ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc gacattatcg 12840
cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg cggcctcgag 12900
caagacgttt cccgttgaat atggctcata acaccccttg tattactgtt tatgtaagca 12960
gacagtttta ttgttcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 13020
aggggttccg cgcacatttc cccgaaaagt gccacctaaa ttgtaagcgt taatattttg 13080
ttaaaattcg cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc 13140
ggcaaaatcc cttataaatc aaaagaatag accgagatag ggttgagtgg ccgctacagg 13200
gcgctcccat tcgccattca ggctgcgcaa ctgttgggaa gggcgtttcg gtgcgggcct 13260
cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa 13320
cgccagggtt ttcccagtca cacgcgtaat acgactcact atag 13364
<210> 54
<211> 1701
<212> DNA
<213> 人工序列
<220>
<223> 甲型流感病毒H3蛋白的核苷酸序列(A/特拉华州/39/2019)
<400> 54
atgaagacta tcattgcttt gagctacatt ctatgtctgg ttttcactca aaaaattcct 60
ggaaatgaca atagcacggc aacgctgtgc cttgggcacc atgcagtacc aaacggaacg 120
atagtgaaaa caatcacaaa tgaccgaatt gaagttacta atgctactga gttggttcag 180
aattcctcaa taggtaaaat atgcgacagt cctcatcaga tccttgatgg agggaactgc 240
acactaatag atgctctatt gggggaccct cagtgtgacg gctttcaaaa taagaaatgg 300
gacctttttg ttgaacgaag cagagcctac agcaactgtt acccttatga tgtgccggat 360
tatgcctccc ttaggtcact agttgcctca tccggcacac tggagtttaa aaatgaaagc 420
ttcaattggg ctggagtcac tcaaaacgga aaaagttttt cttgcataag gggatctagt 480
agtagtttct ttagtagatt aaattggttg acccatttaa actacacata tccagcactg 540
aacgtgacta tgccaaacaa ggaacaattt gacaaattgt acatttgggg ggttcaccac 600
ccgggtacgg acaaggacca aatctccctg tatgctcaat catcaggaag aatcacagta 660
tctaccaaaa gaagccaaca agctgtaatc ccaaatatcg gatctagacc cagaataagg 720
gatatcccta gcagaataag catctattgg acaatagtaa aaccgggaga catacttttg 780
attaacagca cagggaatct aattgctcct aggggttact tcaaaatacg aagtgggaaa 840
agctcaataa tgagatcaga tgcacccatt ggcaaatgca agtctgaatg catcactcca 900
aatggaagca ttcccaatga caaaccattc caaaatgtga acaggatcac atacggggcc 960
tgtcccagat atgttaagca aagcactctg aaattggcaa caggaatgcg aaatgtacca 1020
gagaaacaaa ctagaggcat atttggtgca atagcgggtt tcatagaaaa tggttgggag 1080
ggaatggtgg atggttggta cggtttcaga catcaaaatt ctgagggaag aggacaagca 1140
gcagatctca aaagcactca agcagcaatc gatcaaatca atgggaagct gaatcgattg 1200
atcggaaaaa ccaacgagaa attccatcag attgaaaaag aattctcaga agtagaagga 1260
agagttcaag accttgagaa atatgttgag gacactaaaa tagatctctg gtcatacaac 1320
gcggagcttc ttgttgccct ggagaaccaa catacaattg atctaactga ctcagaaatg 1380
aacaaactgt ttgaaaaaac aaagaagcaa ctgagggaaa atgctgagga tatgggaaat 1440
ggttgtttca aaatatacca caaatgtgac aatgcctgca taggatcaat aagaaacgaa 1500
acttatgacc acaatgtgta cagggatgaa gcattaaaca accggttcca gatcaaggga 1560
gttgagctga agtcagggta caaagattgg atcctatgga tttcctttgc catatcatgt 1620
tttttgcttt gtgttgcttt gttggggttc atcatgtggg cctgccaaaa gggcaacatt 1680
agatgcaaca tctgcatttg a 1701
<210> 55
<211> 1410
<212> DNA
<213> 人工序列
<220>
<223> 甲型流感病毒N2蛋白的核苷酸序列(A/特拉华州/39/2019)
<400> 55
atgaatccaa atcaaaagat aataacgatt ggctctgttt ctctcacaat ttccacaata 60
tgcttcttca tgcaaattgc catcctgata actactgtaa cattgcattt caagcaatat 120
gaattcaact cccccccgaa taaccaagtg atgctgtgtg aaccaacaat aatagaaaga 180
aacataacag agatagtgta tttgaccaac accaccatag agaaggaaat atgccccaaa 240
ccagcagaat acagaaattg gtcaaaaccg caatgtgaca ttacaggatt tgcacctttc 300
tctaaggaca attcgattag gctttccgct ggtggggaca tctgggtgac aagagaacct 360
tatgtgtcat gcgaccttga caagtgttat caatttgcac ttggacaggg aacaacacta 420
aacaacgtgc attcaaataa cacagtacgt gataggaccc cttatcggac tctattgatg 480
aatgagttgg gtgttccttt ccatctgggg accaagcaag tgtgcatagc atggtccagc 540
tcaagttgtc acgatggaaa agcatggctg catgtttgta taacggggga tgataaaaat 600
gcaactgcta gcttcattta caatgggagg cttgtagata gtgttgtttc atggtccaac 660
gatattctca ggacccagga gtcagaatgc gtttgtatca atggaacttg tacagtagta 720
atgactgatg gaaatgccac aggaaaagct gatactaaaa tactattcat tgaggagggg 780
aaaatcgttc atactagcaa attgtcagga agtgctcagc atgtcgaaga gtgctcttgc 840
tatcctcgat atcctggtgt cagatgtgtc tgcagagaca actggaaagg atccaaccgg 900
cccatcatag atataaacat aaaggatcat agcattgttt ccagttatgt gtgttcaggg 960
cttgttggag acacacccag aaaaagcgac agctccagca gtagccattg tttgaatcct 1020
aacaatgaaa aaggtggtca tggagtgaaa ggctgggcct ttgatgatgg aaatgacgtg 1080
tggatgggga gaacaatcaa cgagacgtca cgcttagggt atgaaacctt caaagtcgtt 1140
gaaggctggt ccaaccctaa gtccaaattg cagataaata ggcaagtcat agtggataga 1200
ggtgataggt ccggatacag cggtattttc tctgttgaag gcaaaagctg catcaatcgg 1260
tgcttctatg tggagttgat taggggaaga aaagaggaaa ctgaagtctt gtggacctca 1320
aacagtattg ttgtgttttg tggcacctca ggtacatatg gaacaggctc atggcctgat 1380
ggggcggacc tcaatctcat gcatacataa 1410
<210> 56
<211> 1755
<212> DNA
<213> 人工序列
<220>
<223> 乙型流感病毒Hyam的核苷酸序列(B/新加坡/INFTT 16 0610/16(By))
<400> 56
atgaaggcaa taattgtact actcatggta gtaacatcca atgcagatcg aatctgcact 60
gggataacat cttcaaactc acctcatgtg gtcaaaacag ctactcaagg ggaggtcaat 120
gtgactggcg tgataccact gacaacaaca ccaacaaaat cttattttgc aaatctcaaa 180
ggaacaagga ccagagggaa actatgcccg gactgtctca actgtacaga tctggatgtg 240
gccttgggca ggccaatgtg tgtggggacc acaccttctg ctaaagcttc aatactccat 300
gaggtcagac ctgttacatc cgggtgcttt cctataatgc acgacagaac aaaaatcaga 360
caactaccca atcttctcag aggatatgaa aagatcaggt tatcaaccca aaacgttatc 420
gatgcagaaa aagcaccagg aggaccctac agacttggaa cctcaggatc ttgccctaac 480
gctaccagta aaattggatt tttttcaaca atggcttggg ctgttccaaa ggacaactac 540
aaaaatgcaa cgaacccaca aacagtggaa gtaccataca tttgtacaga aggggaagac 600
caaattactg tttgggggtt ccattcggat aacaaaaccc aaatgaagtc cctctatgga 660
gactcaaatc ctcaaaagtt cacctcatct gctaatggag tgaccacaca ttatgtttct 720
caaattggcg acttcccaga tcaaacagaa gacggaggac taccacaaag cggcagaatt 780
gttgttgatt acatggtgca aaaacctggg aaaacaggaa caattgtcta tcaaaggggt 840
gttttgttgc ctcaaaaggt gtggtgcgcg agtggcagga gcaaagtaat aaaagggtca 900
ttgcctttaa ttggtgaagc agattgcctt catgaagaat acggtggatt aaacaaaagc 960
aagccttact acacaggaaa acatgcaaaa gccataggaa attgcccaat atgggtaaaa 1020
acacctttga agcttgccaa tggaaccaaa tatagacctc ctgcaaaact attgaaggaa 1080
aggggtttct tcggagctat tgctggtttc ctagaaggag gatgggaagg aatgattgca 1140
ggttggcacg gatacacatc tcacggagca catggagtgg cagtggcggc agaccttaag 1200
agtacacaag aagctataaa taagataaca aaaaatctca attctttgag tgaactagaa 1260
gtaaagaacc ttcaaagact aagtggtgcc atggatgaac tccacaacga aatactcgag 1320
ctggatgaaa aagtggatga cctcagagct gacactataa gctcacaaat agaacttgca 1380
gtcttgcttt ccaacgaagg aataataaac agtgaagatg agcatctatt ggcacttgag 1440
agaaaactaa agaaaatgct gggtccctct gctgtagaca taggaaacgg atgcttcgaa 1500
accaaacaca aatgcaacca gacctgctta gacaggatag ctgctggcac ctttaatgca 1560
ggagaatatt ctctccccac ttttgactca ttgaacatta ctgctgcatc tttaaatgat 1620
gatggattgg ataaccatac tatactgctc tattactcaa ctgctgcttc tagtttggct 1680
gtaacattaa tgctagctat ttttattgtt tatatggtct ccagagacaa cgtttcatgc 1740
tccatttgtc tataa 1755
<210> 57
<211> 1401
<212> DNA
<213> 人工序列
<220>
<223> 乙型流感病毒Nyam的核苷酸序列(B/新加坡/INFTT 16 0610/16(By))
<400> 57
atgctacctt caactataca aacgttaacc ttatttctca cattaggggg agtgctatta 60
tcactatatg tgtcagcttc attgtcatac ttactatatt cggatatatt gctaaaattt 120
tcacgaacag aagtaactgc accaataatg ccattggatt gtgcaaacgc atcaaatgtc 180
caggctgtga atcgttctgc aacaaaaggg gtgacacctc ttctcccaga accggagtgg 240
acgtaccctc gtttatcttg cccgggctca acctttcaga aagcactcct aattagcccc 300
catagattcg gagaaaccaa aggaaactca gctcccttaa taataaggga accttttatt 360
gcttgtggac caaaggaatg caaacatttt gctctaaccc attatgcagc tcaaccaggg 420
ggatactaca atggaacaag agaagacaga aacaagctga ggcatctaat ttcagtcaaa 480
ttgggcaaaa tcccaacagt agaaaactct attttccaca tggcagcttg gagtgggtcc 540
gcatgccatg atggtagaga atggacttac atcggagttg atggcccaga cagtaatgca 600
ttgctcaaaa taaaatatgg agaagcatat actgacacat accattccta tgcaaaaaac 660
atcctaagga cacaagaaag tgcctgcaat tgcatcgggg gagattgtta tctgatgata 720
actgatggcc cagcttcagg gattagtgaa tgcagattcc ttaagattcg agagggccga 780
ataataaaag aaatatttcc aacaggaaga gtaaaacaca ctgaggaatg cacatgcgga 840
tttgccagca acaaaaccat agaatgtgcc tgtagagata acagttacac agcaaaaaga 900
ccctttgtca aattaaatgt ggagaccgat acagcggaaa taagattgat gtgcacaaag 960
acttatttgg acacccccag accaaatgat ggaagcataa cagggccttg cgaatctgat 1020
ggaaacgaag ggggtggagg catcaaggga ggatttgttc accaaagaat ggcatccaag 1080
attggaaggt ggtactctcg gacgatgtct aaaactcaaa gaatggggat gggactgtat 1140
gtaaagtatg atggagaccc atggactgac agtgaagccc ttgctcttag tggagtaatg 1200
gtttcaatgg gagaacctgg ttggtattcc tttggcttcg aaataaaaga taagaaatgt 1260
gatgtcccct gtattgggat agaaatggta catgatggtg ggaaaacgac ttggcactca 1320
gcggcaacag ccatttactg tttaatgggc tcaggacaac tgctgtggga cactgtcaca 1380
ggtgttaata tgactctgta a 1401
<210> 58
<211> 3813
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR→QQAA;Δ69-70;
ΔY144;N501Y;D614G)
<400> 58
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catctctggc accaacggca caaagcgctt cgacaatcct 240
gtgttgccgt ttaacgacgg cgtttacttc gccagcacag aaaagagcaa catcatccgg 300
ggctggatct tcggcaccac cctggacagc aaaacccaaa gcctgctcat cgtgaacaac 360
gccaccaacg tggtgatcaa ggtgtgcgag ttccagttct gcaatgatcc ttttctgggc 420
gtgtatcaca agaacaacaa gagctggatg gaaagcgagt tcagagtgta ttctagcgcc 480
aacaactgca cctttgagta cgtgtcccag ccctttctta tggacctgga aggcaagcag 540
ggcaacttca agaatctgag agaattcgtg ttcaagaaca ttgatggcta cttcaagatc 600
tacagcaagc acacccctat caacctggtt cgggacctgc cacaaggctt cagcgccctg 660
gaacctctgg tggacctgcc tatcggcatc aacatcacac ggttccaaac cctgctggcc 720
ctgcaccgga gctacctgac ccccggcgac agcagcagcg gctggaccgc cggcgctgcc 780
gcctattacg tgggctacct gcaacctaga accttcctgc tgaaatacaa cgagaacggc 840
acaatcaccg acgccgtgga ctgtgccctg gaccccctgt ctgagacaaa gtgtaccctg 900
aagtctttca ccgtggagaa gggcatctac cagaccagca acttccgggt gcagcctaca 960
gaatctatag tgcggttccc taacatcacc aacctgtgtc cttttggcga ggtgttcaac 1020
gccactcggt tcgcctctgt ctacgcctgg aaccggaaac ggatctctaa ttgcgtggcc 1080
gattacagcg tcctgtataa ctccgccagt ttcagcacat tcaagtgcta cggcgtgtca 1140
cccaccaagc tgaacgatct gtgcttcacc aatgtgtacg ccgatagttt cgtgatccgg 1200
ggcgatgagg tgcggcagat cgcccctgga cagacaggca agatcgccga ctacaactac 1260
aagctgcctg acgacttcac aggctgtgtg atcgcatgga acagcaacaa cctggacagc 1320
aaggtgggcg gaaactacaa ctacctgtac agactgttca gaaagtccaa cctgaagcct 1380
ttcgagagag atatatctac cgagatctac caggccggca gcacaccctg taatggagtg 1440
gaaggcttta actgctactt ccctctgcaa agctatggat ttcaacctac atatggggtt 1500
ggctaccagc cttacagagt ggtggtcctt agcttcgagc tgctccatgc ccctgccacc 1560
gtgtgcggac ctaagaagtc caccaacctg gtgaaaaaca agtgcgtgaa ctttaatttt 1620
aacggcctga ccggaacagg agtgctgaca gaaagcaaca aaaagttcct gcctttccag 1680
cagttcggca gagacattgc cgacaccaca gatgctgtta gagaccccca gacgctggaa 1740
atcctggata tcaccccctg ctcttttggc ggcgtgagcg tgatcacccc aggcacaaac 1800
acaagcaacc aggtggctgt gctgtaccag ggcgtgaact gtacagaggt ccctgtggca 1860
atccacgccg atcagctgac ccctacatgg cgggtgtact ccactggatc taacgtgttc 1920
cagacaaggg ccggatgcct catcggcgct gagcacgtga acaattctta cgagtgcgac 1980
atccctattg gagcgggcat ctgcgccagc taccagacac agaccaatag ccctcagcaa 2040
gccgctagcg tggcctccca gagcatcatc gcctacacca tgagcctggg agccgagaac 2100
tctgtggcct acagcaacaa cagcatcgct atccctacca acttcaccat ctctgtcacc 2160
accgaaatcc tgcccgtcag tatgaccaaa accagcgtcg actgcaccat gtacatatgc 2220
ggcgatagca ccgaatgcag caacctgctg ctgcagtatg gctccttctg cacccaactt 2280
aacagagccc tgactggcat cgccgtggag caggacaaga atacccagga ggtgttcgcc 2340
caggtgaagc agatctacaa gacacccccg atcaaggact tcggcggctt taatttctct 2400
cagatcctgc cagacccatc taaaccctct aagcggagct ttatcgagga cctgctgttc 2460
aacaaggtga ctctggctga cgccggcttc atcaagcagt acggcgattg cctgggcgac 2520
attgctgcta gagacctgat ctgtgcccag aaattcaacg gtcttactgt gctgcctcct 2580
ctgctgacgg atgagatgat cgcccagtac accagcgccc tgctggccgg caccatcaca 2640
tccggctgga cattcggcgc cggcgcagcc ctgcagatcc cttttgccat gcagatggcc 2700
taccggttca acggaatcgg agtgacacag aacgtgctct acgaaaatca gaagttgatc 2760
gccaaccagt tcaacagcgc catcggcaag attcaggata gtctgagttc caccgccagc 2820
gccctgggaa agctgcagga cgtggtcaat cagaatgccc aagccctgaa caccctggtg 2880
aagcagctga gcagcaactt cggcgccatc agctctgtgc tgaacgacat cctgagtaga 2940
ctggacaagg tggaagccga agtgcagatc gacagattga tcaccggaag actgcaaagc 3000
ctgcagacct acgtgaccca gcagctgata agagctgctg aaatcagagc cagcgctaat 3060
ctggccgcta ccaagatgag cgagtgcgtt ctgggccagt ctaagagagt ggacttctgc 3120
ggaaaaggct accacctgat gtcctttcct cagtctgccc cccacggcgt ggtgttcctg 3180
cacgtcacat acgtgcccgc tcaagagaaa aacttcacca cggcccctgc catctgtcac 3240
gacggcaagg cccacttccc cagagagggc gtgttcgtga gcaatggcac ccactggttt 3300
gtgactcaga gaaacttcta cgagccacag attatcacca cagataacac cttcgtgtct 3360
ggcaactgcg acgtggtgat cggcatcgtc aacaacacag tgtacgaccc actgcaacct 3420
gagctggact cattcaagga ggaactggat aagtacttca agaatcacac cagccccgac 3480
gttgacctgg gcgacatcag cggcattaac gcctctgtgg tcaacatcca gaaggaaatc 3540
gacagactga atgaggtggc caagaatttg aacgagagcc tgattgatct gcaggagctg 3600
ggcaaatacg agcagtacat caagtggcct tggtacatct ggctgggctt catcgccggg 3660
ctgatcgcca tcgttatggt gacaatcatg ctgtgttgca tgacaagctg ttgtagctgc 3720
ctgaaaggct gctgctcctg cggcagctgt tgcaagtttg acgaagatga cagcgagccc 3780
gtgctgaaag gcgtcaagct gcactacacc tga 3813
<210> 59
<211> 3813
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR变为QQAA;Δ242-244;
K417N;E484K;N501Y;D614G)
<400> 59
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgac 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc gggacctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgcaccgga gctacctgac ccccggcgac agcagcagcg gctggaccgc cggcgctgcc 780
gcctattacg tgggctacct gcaacctaga accttcctgc tgaaatacaa cgagaacggc 840
acaatcaccg acgccgtgga ctgtgccctg gaccccctgt ctgagacaaa gtgtaccctg 900
aagtctttca ccgtggagaa gggcatctac cagaccagca acttccgggt gcagcctaca 960
gaatctatag tgcggttccc taacatcacc aacctgtgtc cttttggcga ggtgttcaac 1020
gccactcggt tcgcctctgt ctacgcctgg aaccggaaac ggatctctaa ttgcgtggcc 1080
gattacagcg tcctgtataa ctccgccagt ttcagcacat tcaagtgcta cggcgtgtca 1140
cccaccaagc tgaacgatct gtgcttcacc aatgtgtacg ccgatagttt cgtgatccgg 1200
ggcgatgagg tgcggcagat cgcccctgga cagacaggca acatcgccga ctacaactac 1260
aagctgcctg acgacttcac aggctgtgtg atcgcatgga acagcaacaa cctggacagc 1320
aaggtgggcg gaaactacaa ctacctgtac agactgttca gaaagtccaa cctgaagcct 1380
ttcgagagag atatatctac cgagatctac caggccggca gcacaccctg taatggagtg 1440
aaaggcttta actgctactt ccctctgcaa agctatggat ttcaacctac atatggggtt 1500
ggctaccagc cttacagagt ggtggtcctt agcttcgagc tgctccatgc ccctgccacc 1560
gtgtgcggac ctaagaagtc caccaacctg gtgaaaaaca agtgcgtgaa ctttaatttt 1620
aacggcctga ccggaacagg agtgctgaca gaaagcaaca aaaagttcct gcctttccag 1680
cagttcggca gagacattgc cgacaccaca gatgctgtta gagaccccca gacgctggaa 1740
atcctggata tcaccccctg ctcttttggc ggcgtgagcg tgatcacccc aggcacaaac 1800
acaagcaacc aggtggctgt gctgtaccag ggcgtgaact gtacagaggt ccctgtggca 1860
atccacgccg atcagctgac ccctacatgg cgggtgtact ccactggatc taacgtgttc 1920
cagacaaggg ccggatgcct catcggcgct gagcacgtga acaattctta cgagtgcgac 1980
atccctattg gagcgggcat ctgcgccagc taccagacac agaccaatag ccctcagcaa 2040
gccgctagcg tggcctccca gagcatcatc gcctacacca tgagcctggg agccgagaac 2100
tctgtggcct acagcaacaa cagcatcgct atccctacca acttcaccat ctctgtcacc 2160
accgaaatcc tgcccgtcag tatgaccaaa accagcgtcg actgcaccat gtacatatgc 2220
ggcgatagca ccgaatgcag caacctgctg ctgcagtatg gctccttctg cacccaactt 2280
aacagagccc tgactggcat cgccgtggag caggacaaga atacccagga ggtgttcgcc 2340
caggtgaagc agatctacaa gacacccccg atcaaggact tcggcggctt taatttctct 2400
cagatcctgc cagacccatc taaaccctct aagcggagct ttatcgagga cctgctgttc 2460
aacaaggtga ctctggctga cgccggcttc atcaagcagt acggcgattg cctgggcgac 2520
attgctgcta gagacctgat ctgtgcccag aaattcaacg gtcttactgt gctgcctcct 2580
ctgctgacgg atgagatgat cgcccagtac accagcgccc tgctggccgg caccatcaca 2640
tccggctgga cattcggcgc cggcgcagcc ctgcagatcc cttttgccat gcagatggcc 2700
taccggttca acggaatcgg agtgacacag aacgtgctct acgaaaatca gaagttgatc 2760
gccaaccagt tcaacagcgc catcggcaag attcaggata gtctgagttc caccgccagc 2820
gccctgggaa agctgcagga cgtggtcaat cagaatgccc aagccctgaa caccctggtg 2880
aagcagctga gcagcaactt cggcgccatc agctctgtgc tgaacgacat cctgagtaga 2940
ctggacaagg tggaagccga agtgcagatc gacagattga tcaccggaag actgcaaagc 3000
ctgcagacct acgtgaccca gcagctgata agagctgctg aaatcagagc cagcgctaat 3060
ctggccgcta ccaagatgag cgagtgcgtt ctgggccagt ctaagagagt ggacttctgc 3120
ggaaaaggct accacctgat gtcctttcct cagtctgccc cccacggcgt ggtgttcctg 3180
cacgtcacat acgtgcccgc tcaagagaaa aacttcacca cggcccctgc catctgtcac 3240
gacggcaagg cccacttccc cagagagggc gtgttcgtga gcaatggcac ccactggttt 3300
gtgactcaga gaaacttcta cgagccacag attatcacca cagataacac cttcgtgtct 3360
ggcaactgcg acgtggtgat cggcatcgtc aacaacacag tgtacgaccc actgcaacct 3420
gagctggact cattcaagga ggaactggat aagtacttca agaatcacac cagccccgac 3480
gttgacctgg gcgacatcag cggcattaac gcctctgtgg tcaacatcca gaaggaaatc 3540
gacagactga atgaggtggc caagaatttg aacgagagcc tgattgatct gcaggagctg 3600
ggcaaatacg agcagtacat caagtggcct tggtacatct ggctgggctt catcgccggg 3660
ctgatcgcca tcgttatggt gacaatcatg ctgtgttgca tgacaagctg ttgtagctgc 3720
ctgaaaggct gctgctcctg cggcagctgt tgcaagtttg acgaagatga cagcgagccc 3780
gtgctgaaag gcgtcaagct gcactacacc tga 3813
<210> 60
<211> 3804
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR变为QQAA;Δ69-70;
Δ242-244;K417N;E484K;N501Y;D614G)
<400> 60
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catctctggc accaacggca caaagcgctt cgacaatcct 240
gtgttgccgt ttaacgacgg cgtttacttc gccagcacag aaaagagcaa catcatccgg 300
ggctggatct tcggcaccac cctggacagc aaaacccaaa gcctgctcat cgtgaacaac 360
gccaccaacg tggtgatcaa ggtgtgcgag ttccagttct gcaatgatcc ttttctgggc 420
gtgtatcaca agaacaacaa gagctggatg gaaagcgagt tcagagtgta ttctagcgcc 480
aacaactgca cctttgagta cgtgtcccag ccctttctta tggacctgga aggcaagcag 540
ggcaacttca agaatctgag agaattcgtg ttcaagaaca ttgatggcta cttcaagatc 600
tacagcaagc acacccctat caacctggtt cgggacctgc cacaaggctt cagcgccctg 660
gaacctctgg tggacctgcc tatcggcatc aacatcacac ggttccaaac cctgcaccgg 720
agctacctga cccccggcga cagcagcagc ggctggaccg ccggcgctgc cgcctattac 780
gtgggctacc tgcaacctag aaccttcctg ctgaaataca acgagaacgg cacaatcacc 840
gacgccgtgg actgtgccct ggaccccctg tctgagacaa agtgtaccct gaagtctttc 900
accgtggaga agggcatcta ccagaccagc aacttccggg tgcagcctac agaatctata 960
gtgcggttcc ctaacatcac caacctgtgt ccttttggcg aggtgttcaa cgccactcgg 1020
ttcgcctctg tctacgcctg gaaccggaaa cggatctcta attgcgtggc cgattacagc 1080
gtcctgtata actccgccag tttcagcaca ttcaagtgct acggcgtgtc acccaccaag 1140
ctgaacgatc tgtgcttcac caatgtgtac gccgatagtt tcgtgatccg gggcgatgag 1200
gtgcggcaga tcgcccctgg acagacaggc aacatcgccg actacaacta caagctgcct 1260
gacgacttca caggctgtgt gatcgcatgg aacagcaaca acctggacag caaggtgggc 1320
ggaaactaca actacctgta cagactgttc agaaagtcca acctgaagcc tttcgagaga 1380
gatatatcta ccgagatcta ccaggccggc agcacaccct gtaatggagt gaaaggcttt 1440
aactgctact tccctctgca aagctatgga tttcaaccta catatggggt tggctaccag 1500
ccttacagag tggtggtcct tagcttcgag ctgctccatg cccctgccac cgtgtgcgga 1560
cctaagaagt ccaccaacct ggtgaaaaac aagtgcgtga actttaattt taacggcctg 1620
accggaacag gagtgctgac agaaagcaac aaaaagttcc tgcctttcca gcagttcggc 1680
agagacattg ccgacaccac agatgctgtt agagaccccc agacgctgga aatcctggat 1740
atcaccccct gctcttttgg cggcgtgagc gtgatcaccc caggcacaaa cacaagcaac 1800
caggtggctg tgctgtacca gggcgtgaac tgtacagagg tccctgtggc aatccacgcc 1860
gatcagctga cccctacatg gcgggtgtac tccactggat ctaacgtgtt ccagacaagg 1920
gccggatgcc tcatcggcgc tgagcacgtg aacaattctt acgagtgcga catccctatt 1980
ggagcgggca tctgcgccag ctaccagaca cagaccaata gccctcagca agccgctagc 2040
gtggcctccc agagcatcat cgcctacacc atgagcctgg gagccgagaa ctctgtggcc 2100
tacagcaaca acagcatcgc tatccctacc aacttcacca tctctgtcac caccgaaatc 2160
ctgcccgtca gtatgaccaa aaccagcgtc gactgcacca tgtacatatg cggcgatagc 2220
accgaatgca gcaacctgct gctgcagtat ggctccttct gcacccaact taacagagcc 2280
ctgactggca tcgccgtgga gcaggacaag aatacccagg aggtgttcgc ccaggtgaag 2340
cagatctaca agacaccccc gatcaaggac ttcggcggct ttaatttctc tcagatcctg 2400
ccagacccat ctaaaccctc taagcggagc tttatcgagg acctgctgtt caacaaggtg 2460
actctggctg acgccggctt catcaagcag tacggcgatt gcctgggcga cattgctgct 2520
agagacctga tctgtgccca gaaattcaac ggtcttactg tgctgcctcc tctgctgacg 2580
gatgagatga tcgcccagta caccagcgcc ctgctggccg gcaccatcac atccggctgg 2640
acattcggcg ccggcgcagc cctgcagatc ccttttgcca tgcagatggc ctaccggttc 2700
aacggaatcg gagtgacaca gaacgtgctc tacgaaaatc agaagttgat cgccaaccag 2760
ttcaacagcg ccatcggcaa gattcaggat agtctgagtt ccaccgccag cgccctggga 2820
aagctgcagg acgtggtcaa tcagaatgcc caagccctga acaccctggt gaagcagctg 2880
agcagcaact tcggcgccat cagctctgtg ctgaacgaca tcctgagtag actggacaag 2940
gtggaagccg aagtgcagat cgacagattg atcaccggaa gactgcaaag cctgcagacc 3000
tacgtgaccc agcagctgat aagagctgct gaaatcagag ccagcgctaa tctggccgct 3060
accaagatga gcgagtgcgt tctgggccag tctaagagag tggacttctg cggaaaaggc 3120
taccacctga tgtcctttcc tcagtctgcc ccccacggcg tggtgttcct gcacgtcaca 3180
tacgtgcccg ctcaagagaa aaacttcacc acggcccctg ccatctgtca cgacggcaag 3240
gcccacttcc ccagagaggg cgtgttcgtg agcaatggca cccactggtt tgtgactcag 3300
agaaacttct acgagccaca gattatcacc acagataaca ccttcgtgtc tggcaactgc 3360
gacgtggtga tcggcatcgt caacaacaca gtgtacgacc cactgcaacc tgagctggac 3420
tcattcaagg aggaactgga taagtacttc aagaatcaca ccagccccga cgttgacctg 3480
ggcgacatca gcggcattaa cgcctctgtg gtcaacatcc agaaggaaat cgacagactg 3540
aatgaggtgg ccaagaattt gaacgagagc ctgattgatc tgcaggagct gggcaaatac 3600
gagcagtaca tcaagtggcc ttggtacatc tggctgggct tcatcgccgg gctgatcgcc 3660
atcgttatgg tgacaatcat gctgtgttgc atgacaagct gttgtagctg cctgaaaggc 3720
tgctgctcct gcggcagctg ttgcaagttt gacgaagatg acagcgagcc cgtgctgaaa 3780
ggcgtcaagc tgcactacac ctga 3804
<210> 61
<211> 3813
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR变为QQAA;Δ69-70;
ΔY144;N501Y;A570D;D614G;P680H;T716I)
<400> 61
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tctgaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catctctggc accaacggca caaagcgctt cgacaatcct 240
gtgttgccgt ttaacgacgg cgtttacttc gccagcacag aaaagagcaa catcatccgg 300
ggctggatct tcggcaccac cctggacagc aaaacccaaa gcctgctcat cgtgaacaac 360
gccaccaacg tggtgatcaa ggtgtgcgag ttccagttct gcaatgatcc ttttctgggc 420
gtgtatcaca agaacaacaa gagctggatg gaaagcgagt tcagagtgta ttctagcgcc 480
aacaactgca cctttgagta cgtgtcccag ccctttctta tggacctgga aggcaagcag 540
ggcaacttca agaatctgag agaattcgtg ttcaagaaca ttgatggcta cttcaagatc 600
tacagcaagc acacccctat caacctggtt cgggacctgc cacaaggctt cagcgccctg 660
gaacctctgg tggacctgcc tatcggcatc aacatcacac ggttccaaac cctgctggcc 720
ctgcaccgga gctacctgac ccccggcgac agcagcagcg gctggaccgc cggcgctgcc 780
gcctattacg tgggctacct gcaacctaga accttcctgc tgaaatacaa cgagaacggc 840
acaatcaccg acgccgtgga ctgtgccctg gaccccctgt ctgagacaaa gtgtaccctg 900
aagtctttca ccgtggagaa gggcatctac cagaccagca acttccgggt gcagcctaca 960
gaatctatag tgcggttccc taacatcacc aacctgtgtc cttttggcga ggtgttcaac 1020
gccactcggt tcgcctctgt ctacgcctgg aaccggaaac ggatctctaa ttgcgtggcc 1080
gattacagcg tcctgtataa ctccgccagt ttcagcacat tcaagtgcta cggcgtgtca 1140
cccaccaagc tgaacgatct gtgcttcacc aatgtgtacg ccgatagttt cgtgatccgg 1200
ggcgatgagg tgcggcagat cgcccctgga cagacaggca agatcgccga ctacaactac 1260
aagctgcctg acgacttcac aggctgtgtg atcgcatgga acagcaacaa cctggacagc 1320
aaggtgggcg gaaactacaa ctacctgtac agactgttca gaaagtccaa cctgaagcct 1380
ttcgagagag atatatctac cgagatctac caggccggca gcacaccctg taatggagtg 1440
gaaggcttta actgctactt ccctctgcaa agctatggat ttcaacctac atatggggtt 1500
ggctaccagc cttacagagt ggtggtcctt agcttcgagc tgctccatgc ccctgccacc 1560
gtgtgcggac ctaagaagtc caccaacctg gtgaaaaaca agtgcgtgaa ctttaatttt 1620
aacggcctga ccggaacagg agtgctgaca gaaagcaaca aaaagttcct gcctttccag 1680
cagttcggca gagacattga cgacaccaca gatgctgtta gagaccccca gacgctggaa 1740
atcctggata tcaccccctg ctcttttggc ggcgtgagcg tgatcacccc aggcacaaac 1800
acaagcaacc aggtggctgt gctgtaccag ggcgtgaact gtacagaggt ccctgtggca 1860
atccacgccg atcagctgac ccctacatgg cgggtgtact ccactggatc taacgtgttc 1920
cagacaaggg ccggatgcct catcggcgct gagcacgtga acaattctta cgagtgcgac 1980
atccctattg gagcgggcat ctgcgccagc taccagacac agaccaatag ccatcagcaa 2040
gccgctagcg tggcctccca gagcatcatc gcctacacca tgagcctggg agccgagaac 2100
tctgtggcct acagcaacaa cagcatcgct atccctatca acttcaccat ctctgtcacc 2160
accgaaatcc tgcccgtcag tatgaccaaa accagcgtcg actgcaccat gtacatatgc 2220
ggcgatagca ccgaatgcag caacctgctg ctgcagtatg gctccttctg cacccaactt 2280
aacagagccc tgactggcat cgccgtggag caggacaaga atacccagga ggtgttcgcc 2340
caggtgaagc agatctacaa gacacccccg atcaaggact tcggcggctt taatttctct 2400
cagatcctgc cagacccatc taaaccctct aagcggagct ttatcgagga cctgctgttc 2460
aacaaggtga ctctggctga cgccggcttc atcaagcagt acggcgattg cctgggcgac 2520
attgctgcta gagacctgat ctgtgcccag aaattcaacg gtcttactgt gctgcctcct 2580
ctgctgacgg atgagatgat cgcccagtac accagcgccc tgctggccgg caccatcaca 2640
tccggctgga cattcggcgc cggcgcagcc ctgcagatcc cttttgccat gcagatggcc 2700
taccggttca acggaatcgg agtgacacag aacgtgctct acgaaaatca gaagttgatc 2760
gccaaccagt tcaacagcgc catcggcaag attcaggata gtctgagttc caccgccagc 2820
gccctgggaa agctgcagga cgtggtcaat cagaatgccc aagccctgaa caccctggtg 2880
aagcagctga gcagcaactt cggcgccatc agctctgtgc tgaacgacat cctggctaga 2940
ctggacaagg tggaagccga agtgcagatc gacagattga tcaccggaag actgcaaagc 3000
ctgcagacct acgtgaccca gcagctgata agagctgctg aaatcagagc cagcgctaat 3060
ctggccgcta ccaagatgag cgagtgcgtt ctgggccagt ctaagagagt ggacttctgc 3120
ggaaaaggct accacctgat gtcctttcct cagtctgccc cccacggcgt ggtgttcctg 3180
cacgtcacat acgtgcccgc tcaagagaaa aacttcacca cggcccctgc catctgtcac 3240
gacggcaagg cccacttccc cagagagggc gtgttcgtga gcaatggcac ccactggttt 3300
gtgactcaga gaaacttcta cgagccacag attatcacca cacataacac cttcgtgtct 3360
ggcaactgcg acgtggtgat cggcatcgtc aacaacacag tgtacgaccc actgcaacct 3420
gagctggact cattcaagga ggaactggat aagtacttca agaatcacac cagccccgac 3480
gttgacctgg gcgacatcag cggcattaac gcctctgtgg tcaacatcca gaaggaaatc 3540
gacagactga atgaggtggc caagaatttg aacgagagcc tgattgatct gcaggagctg 3600
ggcaaatacg agcagtacat caagtggcct tggtacatct ggctgggctt catcgccggg 3660
ctgatcgcca tcgttatggt gacaatcatg ctgtgttgca tgacaagctg ttgtagctgc 3720
ctgaaaggct gctgctcctg cggcagctgt tgcaagtttg acgaagatga cagcgagccc 3780
gtgctgaaag gcgtcaagct gcactacacc tga 3813
<210> 62
<211> 3813
<212> DNA
<213> 人工序列
<220>
<223> SARS-CoV-2刺突(S)蛋白的核苷酸序列(RRAR变为QQAA;L18F;D80A;
D215G;Δ242-244;K417N;E484K;N501Y;D614G;A701V)
<400> 62
atgttcgtgt tcctggtgct gctgcccctc gttagcagcc agtgcgtgaa tttcaccacc 60
cgcacccagc tgccaccagc ctacacaaac agcttcacca gaggagtgta ttaccctgat 120
aaggtcttta gatcctccgt cctgcattct acgcaggatc tcttcttgcc attcttcagc 180
aacgtgacat ggttccacgc catccacgtt tctggcacca acggcacaaa gcgcttcgcc 240
aatcctgtgt tgccgtttaa cgacggcgtt tacttcgcca gcacagaaaa gagcaacatc 300
atccggggct ggatcttcgg caccaccctg gacagcaaaa cccaaagcct gctcatcgtg 360
aacaacgcca ccaacgtggt gatcaaggtg tgcgagttcc agttctgcaa tgatcctttt 420
ctgggcgtgt actatcacaa gaacaacaag agctggatgg aaagcgagtt cagagtgtat 480
tctagcgcca acaactgcac ctttgagtac gtgtcccagc cctttcttat ggacctggaa 540
ggcaagcagg gcaacttcaa gaatctgaga gaattcgtgt tcaagaacat tgatggctac 600
ttcaagatct acagcaagca cacccctatc aacctggttc ggggcctgcc acaaggcttc 660
agcgccctgg aacctctggt ggacctgcct atcggcatca acatcacacg gttccaaacc 720
ctgcaccgga gctacctgac ccccggcgac agcagcagcg gctggaccgc cggcgctgcc 780
gcctattacg tgggctacct gcaacctaga accttcctgc tgaaatacaa cgagaacggc 840
acaatcaccg acgccgtgga ctgtgccctg gaccccctgt ctgagacaaa gtgtaccctg 900
aagtctttca ccgtggagaa gggcatctac cagaccagca acttccgggt gcagcctaca 960
gaatctatag tgcggttccc taacatcacc aacctgtgtc cttttggcga ggtgttcaac 1020
gccactcggt tcgcctctgt ctacgcctgg aaccggaaac ggatctctaa ttgcgtggcc 1080
gattacagcg tcctgtataa ctccgccagt ttcagcacat tcaagtgcta cggcgtgtca 1140
cccaccaagc tgaacgatct gtgcttcacc aatgtgtacg ccgatagttt cgtgatccgg 1200
ggcgatgagg tgcggcagat cgcccctgga cagacaggca atatcgccga ctacaactac 1260
aagctgcctg acgacttcac aggctgtgtg atcgcatgga acagcaacaa cctggacagc 1320
aaggtgggcg gaaactacaa ctacctgtac agactgttca gaaagtccaa cctgaagcct 1380
ttcgagagag atatatctac cgagatctac caggccggca gcacaccctg taatggagtg 1440
aaaggcttta actgctactt ccctctgcaa agctatggat ttcaacctac atatggggtt 1500
ggctaccagc cttacagagt ggtggtcctt agcttcgagc tgctccatgc ccctgccacc 1560
gtgtgcggac ctaagaagtc caccaacctg gtgaaaaaca agtgcgtgaa ctttaatttt 1620
aacggcctga ccggaacagg agtgctgaca gaaagcaaca aaaagttcct gcctttccag 1680
cagttcggca gagacattgc cgacaccaca gatgctgtta gagaccccca gacgctggaa 1740
atcctggata tcaccccctg ctcttttggc ggcgtgagcg tgatcacccc aggcacaaac 1800
acaagcaacc aggtggctgt gctgtaccag ggcgtgaact gtacagaggt ccctgtggca 1860
atccacgccg atcagctgac ccctacatgg cgggtgtact ccactggatc taacgtgttc 1920
cagacaaggg ccggatgcct catcggcgct gagcacgtga acaattctta cgagtgcgac 1980
atccctattg gagcgggcat ctgcgccagc taccagacac agaccaatag ccctcagcaa 2040
gccgctagcg tggcctccca gagcatcatc gcctacacca tgagcctggg agtcgagaac 2100
tctgtggcct acagcaacaa cagcatcgct atccctacca acttcaccat ctctgtcacc 2160
accgaaatcc tgcccgtcag tatgaccaaa accagcgtcg actgcaccat gtacatatgc 2220
ggcgatagca ccgaatgcag caacctgctg ctgcagtatg gctccttctg cacccaactt 2280
aacagagccc tgactggcat cgccgtggag caggacaaga atacccagga ggtgttcgcc 2340
caggtgaagc agatctacaa gacacccccg atcaaggact tcggcggctt taatttctct 2400
cagatcctgc cagacccatc taaaccctct aagcggagct ttatcgagga cctgctgttc 2460
aacaaggtga ctctggctga cgccggcttc atcaagcagt acggcgattg cctgggcgac 2520
attgctgcta gagacctgat ctgtgcccag aaattcaacg gtcttactgt gctgcctcct 2580
ctgctgacgg atgagatgat cgcccagtac accagcgccc tgctggccgg caccatcaca 2640
tccggctgga cattcggcgc cggcgcagcc ctgcagatcc cttttgccat gcagatggcc 2700
taccggttca acggaatcgg agtgacacag aacgtgctct acgaaaatca gaagttgatc 2760
gccaaccagt tcaacagcgc catcggcaag attcaggata gtctgagttc caccgccagc 2820
gccctgggaa agctgcagga cgtggtcaat cagaatgccc aagccctgaa caccctggtg 2880
aagcagctga gcagcaactt cggcgccatc agctctgtgc tgaacgacat cctgagtaga 2940
ctggacaagg tggaagccga agtgcagatc gacagattga tcaccggaag actgcaaagc 3000
ctgcagacct acgtgaccca gcagctgata agagctgctg aaatcagagc cagcgctaat 3060
ctggccgcta ccaagatgag cgagtgcgtt ctgggccagt ctaagagagt ggacttctgc 3120
ggaaaaggct accacctgat gtcctttcct cagtctgccc cccacggcgt ggtgttcctg 3180
cacgtcacat acgtgcccgc tcaagagaaa aacttcacca cggcccctgc catctgtcac 3240
gacggcaagg cccacttccc cagagagggc gtgttcgtga gcaatggcac ccactggttt 3300
gtgactcaga gaaacttcta cgagccacag attatcacca cagataacac cttcgtgtct 3360
ggcaactgcg acgtggtgat cggcatcgtc aacaacacag tgtacgaccc actgcaacct 3420
gagctggact cattcaagga ggaactggat aagtacttca agaatcacac cagccccgac 3480
gttgacctgg gcgacatcag cggcattaac gcctctgtgg tcaacatcca gaaggaaatc 3540
gacagactga atgaggtggc caagaatttg aacgagagcc tgattgatct gcaggagctg 3600
ggcaaatacg agcagtacat caagtggcct tggtacatct ggctgggctt catcgccggg 3660
ctgatcgcca tcgttatggt gacaatcatg ctgtgttgca tgacaagctg ttgtagctgc 3720
ctgaaaggct gctgctcctg cggcagctgt tgcaagtttg acgaagatga cagcgagccc 3780
gtgctgaaag gcgtcaagct gcactacacc tga 3813

Claims (48)

1.一种多顺反子自我复制RNA,其包含:
a)编码第一抗原的第一核苷酸序列,其与亚基因组(SG)启动子可操作地连接;和
b)编码第二抗原的第二核苷酸序列,其与选自由SG启动子和内部核糖体进入位点(IRES)组成的组的调节元件可操作地连接。
2.根据权利要求1所述的多顺反子自我复制RNA,其中所述RNA按从5'至3'的顺序包含:
a)编码第一抗原的第一核苷酸序列,其与SG启动子可操作地连接;和
b)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接。
3.根据权利要求2所述的多顺反子自我复制RNA,其中所述RNA包含一个或多个附加的核苷酸序列,其中每个序列编码附加的抗原,所述附加的抗原与选自由SG启动子和IRES组成的组的调节元件可操作地连接,并且其中所述一个或多个核苷酸序列位于所述第二核苷酸序列的3'处。
4.根据权利要求1至3中任一项所述的多顺反子自我复制RNA,其中所述SG启动子是最小SG启动子或延伸的SG启动子。
5.根据权利要求4所述的多顺反子自我复制RNA,其中所述延伸的SG启动子在5'端延伸,其中核苷酸存在于编码RNA病毒的非结构蛋白的序列中。
6.根据权利要求1至5中任一项所述的多顺反子自我复制RNA,其中所述IRES是衍生自脑心肌炎病毒(EMCV)的野生型IRES。
7.根据权利要求1至6中任一项所述的多顺反子自我复制RNA,其中所述RNA按从5'至3'的顺序包含:
a)编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与最小SG启动子可操作地连接;或
b)编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与延伸的SG启动子可操作地连接;或
c)编码第一抗原的第一核苷酸序列,其与最小SG启动子可操作地连接;和编码第二抗原的第二核苷酸序列,其与野生型EMCVIRES可操作地连接。
8.根据权利要求4至7中任一项所述的多顺反子自我复制RNA,其中所述最小SG启动子由SEQ ID NO:1中所列的序列编码。
9.根据权利要求4至7中任一项所述的多顺反子自我复制RNA,其中所述延伸的SG启动子由SEQ ID NO:2或SEQ ID NO:3或SEQ ID NO:47中所列的序列编码。
10.根据权利要求6至9中任一项所述的多顺反子自我复制RNA,其中所述野生型EMCVIRES由SEQ ID NO:4中所列的序列编码。
11.根据权利要求1至10中任一项所述的多顺反子自我复制RNA,其中所述抗原以基本相同的水平表达。
12.根据权利要求1至11中任一项所述的多顺反子自我复制RNA,其中所述自我复制RNA来自甲病毒。
13.根据权利要求12所述的多顺反子自我复制RNA,其中所述甲病毒选自由以下组成的组:塞姆利基森林病毒(SFV)、辛德毕斯病毒(SIN)和委内瑞拉马脑炎病毒(VEE)及其组合。
14.根据权利要求1至13中任一项所述的多顺反子自我复制RNA,其中所述抗原是来自呼吸道病毒的病毒抗原。
15.根据权利要求14所述的多顺反子自我复制RNA,其中所述呼吸道病毒选自由以下组成的组:流感病毒、呼吸道合胞病毒、副流感病毒、偏肺病毒、鼻病毒、冠状病毒、腺病毒和博卡病毒。
16.根据权利要求15所述的多顺反子自我复制RNA,其中所述抗原来自所述流感病毒的不同毒株。
17.根据权利要求15或权利要求16所述的多顺反子自我复制RNA,其中所述抗原来自所述流感病毒的不同亚型。
18.根据权利要求15至17中任一项所述的多顺反子自我复制RNA,其中所述抗原是流感病毒血凝素(HA)蛋白、神经氨酸苷酶(NA)蛋白、基质(M)蛋白、核蛋白(NP)和/或非结构(NS)蛋白。
19.根据权利要求15至18中任一项所述的多顺反子自我复制RNA,其中所述抗原是H5蛋白和/或N1蛋白。
20.根据权利要求19所述的多顺反子自我复制RNA,其中所述RNA按从5'至3'的顺序包含:
a)编码所述H5蛋白的第一核苷酸序列;和编码所述N1蛋白的第二核苷酸序列;或
b)编码所述N1蛋白的第一核苷酸序列;和编码所述H5蛋白的第二核苷酸序列。
21.根据权利要求15所述的多顺反子自我复制RNA,其中所述冠状病毒是严重急性呼吸综合征冠状病毒2(SARS-CoV-2)。
22.根据权利要求21所述的多顺反子自我复制RNA,其中所述抗原是SARS-CoV-2核壳体(N)蛋白和/或刺突(S)蛋白。
23.根据权利要求22所述的多顺反子自我复制RNA,其中所述RNA按从5'至3'的顺序包含:
a)编码所述N蛋白的第一核苷酸序列;和编码所述S蛋白的第二核苷酸序列;或
b)编码所述S蛋白的第一核苷酸序列;和编码所述N蛋白的第二核苷酸序列。
24.根据权利要求1至23中任一项所述的多顺反子自我复制RNA,其中所述RNA由SEQ IDNO:10至14或SEQ ID NO:19至27或SEQ ID NO:30至31中任一个所列的序列编码。
25.一种免疫原性组合物,其包含根据权利要求1至24中任一项所述的自我复制RNA。
26.根据权利要求25所述的免疫原性组合物,其包含多个根据权利要求1至24中任一项所述的多顺反子自我复制RNA,其中每个多顺反子自我复制RNA编码不同的多肽抗原序列。
27.一种药物组合物,其包含根据权利要求25或26所述的免疫原性组合物和药学上可接受的载体。
28.根据权利要求27所述的药物组合物,其进一步包含脂质纳米颗粒(LNP)、聚合物微粒或水包油乳液。
29.根据权利要求28所述的药物组合物,其中所述自我复制RNA被包封、结合或吸附在LNP、聚合物微粒或水包油乳液上。
30.根据权利要求25或26所述的免疫原性组合物或根据权利要求27至29中任一项所述的药物组合物,其用作疫苗。
31.根据权利要求25或26所述的免疫原性组合物,或根据权利要求27至29中任一项所述的药物组合物,其用于治疗或预防呼吸道病毒感染或延缓其进展。
32.根据权利要求31所述的免疫原性组合物,其中所述呼吸道病毒感染选自由以下组成的组:流感、流感病毒感染、细支气管炎、肺炎、喉炎、SARS-CoV-2感染、冠状病毒疾病2019(COVID-19)、急性呼吸道疾病综合征(ARDS)及其组合。
33.一种治疗或预防受试者中的疾病或病症或延缓其进展的方法,所述方法包含向有此需要的受试者施用根据权利要求25或26所述的免疫原性组合物或根据权利要求27至29中任一项所述的药物组合物。
34.根据权利要求1至24中任一项所述的自我复制RNA,或根据权利要求25或26所述的免疫原性组合物,或根据权利要求27至28中任一项所述的药物组合物在制造用于治疗或预防有此需要的受试者中的疾病或病症或延缓其进展的药物中的用途。
35.根据权利要求33所述的方法,或根据权利要求34所述的用途,其中所述疾病或病症是呼吸道病毒感染。
36.根据权利要求35所述的方法或用途,其中所述呼吸道病毒感染选自由以下组成的组:流感、流感病毒感染、细支气管炎、肺炎、喉炎、SARS-CoV-2感染、COVID-19、ARDS及其组合。
37.一种在受试者中诱导免疫应答的方法,所述方法包含向有此需要的受试者施用根据权利要求25或26所述的免疫原性组合物或根据权利要求27至29中任一项所述的药物组合物。
38.根据权利要求37所述的方法,其中所述免疫应答是体液和/或细胞介导的免疫应答。
39.根据权利要求1至24中任一项所述的自我复制RNA,或根据权利要求25或26所述的免疫原性组合物,或根据权利要求27至29中任一项所述的药物组合物在制造用于在有此需要的受试者中诱导免疫应答的药物中的用途。
40.一种多核苷酸,其编码根据权利要求1至24中任一项所述的自我复制RNA。
41.根据权利要求40所述的多核苷酸,其中所述多核苷酸是重组DNA。
42.根据权利要求42所述的多核苷酸,其中所述重组DNA是质粒。
43.根据权利要求42所述的多核苷酸,其中所述质粒包含SEQ ID NO:10至14或SEQ IDNO:19至27或SEQ ID NO:30至31中任一个所列的序列。
44.一种多核苷酸,其包含:
a)编码第一抗原的第一核苷酸序列;和
b)编码第二抗原的第二核苷酸序列,其与选自由SG启动子和内部核糖体进入位点(IRES)组成的组的调节元件可操作地连接。
45.根据权利要求44所述的多核苷酸,其中所述多核苷酸按从5'至3'的顺序包含:
c)编码第一抗原的第一核苷酸序列;和
d)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接。
46.一种常规mRNA(cRNA),其包含:
c)编码第一抗原的第一核苷酸序列;和
d)编码第二抗原的第二核苷酸序列,其与选自由SG启动子和内部核糖体进入位点(IRES)组成的组的调节元件可操作地连接。
47.根据权利要求46所述的cRNA,其中所述cRNA按从5'至3'的顺序包含:
e)编码第一抗原的第一核苷酸序列;和
f)编码第二抗原的第二核苷酸序列,其与IRES或SG启动子可操作地连接。
48.根据权利要求44或45所述的多核苷酸,或根据权利要求46或47所述的cRNA,其中所述第一核苷酸序列与选自由以下组成的组的调节元件可操作地连接:Kozak共有序列、IRES、SG启动子及其组合。
CN202180089244.XA 2020-12-02 2021-12-02 多顺反子rna疫苗及其用途 Pending CN117222415A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063120362P 2020-12-02 2020-12-02
US63/120,362 2020-12-02
PCT/IB2021/061203 WO2022118226A1 (en) 2020-12-02 2021-12-02 Multicistronic rna vaccines and uses thereof

Publications (1)

Publication Number Publication Date
CN117222415A true CN117222415A (zh) 2023-12-12

Family

ID=81852979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180089244.XA Pending CN117222415A (zh) 2020-12-02 2021-12-02 多顺反子rna疫苗及其用途

Country Status (9)

Country Link
US (1) US20240024455A1 (zh)
EP (1) EP4255446A1 (zh)
JP (1) JP2023551982A (zh)
KR (1) KR20230120646A (zh)
CN (1) CN117222415A (zh)
AU (1) AU2021392077A1 (zh)
CA (1) CA3199996A1 (zh)
IL (1) IL303315A (zh)
WO (1) WO2022118226A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20240009296A1 (en) * 2022-07-10 2024-01-11 Pfizer Inc. Self-amplifying rna encoding an influenza virus antigen
WO2024033794A1 (en) * 2022-08-08 2024-02-15 Seqirus Inc. Rna encoding virus-like particles and uses thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030232324A1 (en) * 2001-05-31 2003-12-18 Chiron Corporation Chimeric alphavirus replicon particles
WO2011005799A2 (en) * 2009-07-06 2011-01-13 Novartis Ag Self replicating rna molecules and uses thereof
JP6120839B2 (ja) * 2011-07-06 2017-04-26 ノバルティス アーゲー カチオン性水中油型エマルジョン
EP3015475A1 (en) * 2014-10-31 2016-05-04 Novartis AG Mammalian cells expressing cytomegalovirus antigens

Also Published As

Publication number Publication date
CA3199996A1 (en) 2022-06-09
IL303315A (en) 2023-07-01
EP4255446A1 (en) 2023-10-11
AU2021392077A9 (en) 2024-05-23
AU2021392077A1 (en) 2023-07-13
US20240024455A1 (en) 2024-01-25
WO2022118226A1 (en) 2022-06-09
KR20230120646A (ko) 2023-08-17
JP2023551982A (ja) 2023-12-13

Similar Documents

Publication Publication Date Title
AU2020260491B2 (en) Gene therapies for lysosomal disorders
AU2020205228B2 (en) Gene therapies for lysosomal disorders
CN112226445B (zh) 编码SARS-CoV-2病毒刺突蛋白的核酸及其的应用
KR20220141332A (ko) 홍역-벡터화된 covid-19 면역원성 조성물 및 백신
AU2015263150B2 (en) Lentiviral vectors
CA2462455C (en) Development of a preventive vaccine for filovirus infection in primates
AU2020260476B2 (en) Gene therapies for lysosomal disorders
RU2758489C2 (ru) Композиции и способы для экспрессии нескольких биологически активных полипептидов с одного вектора для лечения заболеваний сердца и других патологий
KR20220006527A (ko) 리소좀 장애에 대한 유전자 요법
BRPI0708344A2 (pt) vetores adenovirais quiméricos
CN107574156A (zh) 类病毒组合物颗粒及其使用方法
CN117222415A (zh) 多顺反子rna疫苗及其用途
KR20230066360A (ko) 신경퇴행성 장애를 위한 유전자 요법
KR20210150486A (ko) 리소좀 장애에 대한 유전자 요법
KR20220078607A (ko) 융합 단백질들을 이용한 tcr 재프로그래밍을 위한 조성물 및 방법들
KR20230051529A (ko) 리소좀 장애에 대한 유전자 요법
KR20210150487A (ko) 리소좀 장애를 위한 유전자 요법
CN116916891A (zh) 自我复制rna和其用途
TW202233830A (zh) 使用下一代工程化t細胞療法治療癌症之組合物及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination