CN115029380B - 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用 - Google Patents

一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用 Download PDF

Info

Publication number
CN115029380B
CN115029380B CN202210531625.5A CN202210531625A CN115029380B CN 115029380 B CN115029380 B CN 115029380B CN 202210531625 A CN202210531625 A CN 202210531625A CN 115029380 B CN115029380 B CN 115029380B
Authority
CN
China
Prior art keywords
sequence
cov
gene
sars
replicon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210531625.5A
Other languages
English (en)
Other versions
CN115029380A (zh
Inventor
邓强
王晓燕
吴琼
朱园飞
谢幼华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN202210531625.5A priority Critical patent/CN115029380B/zh
Publication of CN115029380A publication Critical patent/CN115029380A/zh
Application granted granted Critical
Publication of CN115029380B publication Critical patent/CN115029380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0652Cells of skeletal and connective tissues; Mesenchyme
    • C12N5/0656Adult fibroblasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0684Cells of the urinary tract or kidneys
    • C12N5/0686Kidney cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2503/00Use of cells in diagnostics
    • C12N2503/02Drug screening
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/10Screening for compounds of potential therapeutic value involving cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Molecular Biology (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Rheumatology (AREA)
  • Toxicology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明构建了一种新型冠状病毒SARS‑CoV‑2复制子及其细胞模型,其通过克隆SARS‑CoV‑2基因组的DNA编码序列,删除病毒棘突蛋白基因,并以荧光素酶报告基因置换病毒核衣壳蛋白基因部分序列,在病毒基因组5’和3’末端分别插入CMV启动子和HDVRZ序列,在NSP1基因特定位点插入外源嵌合序列,构建转录模件;在转录模件两侧分别插入绝缘子及转座元件序列。通过设计Cre/LoxP介导DNA重组以及内含子RNA拼接,实现外源基因序列在SARS‑CoV‑2基因组无缝插入;通过PiggyBac转座策略,将完整转录模件整合至宿主细胞染色质,筛选获得稳定的病毒复制子细胞模型,其能够诱导重组病毒RNA自主复制和报告基因表达,可广泛应用于抗SARS‑CoV‑2药物筛选及评价,也为深入的基础病毒学研究提供平台。

Description

一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方 法和应用
技术领域
本发明涉及基因工程技术领域,尤其涉及一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用。
背景技术
SARS-CoV-2是冠状病毒亚科β冠状病毒属,其基因组全长约30Kb。病毒粒子直径约100nm,包含单股正链RNA基因组、核衣壳蛋白N、膜蛋白M、外膜蛋白E,以及棘突蛋白S,形成日冕样结构。SARS-CoV-2感染宿主细胞主要经历以下几个步骤:
(1)病毒粘附和进入宿主细胞。病毒粒子表面的S蛋白包含S1和S2两个功能性亚基, S1亚基通过RBD结构域与受体蛋白ACE2结合;S2亚基的S2’裂解位点,能够被细胞表面TMPRSS2蛋白识别和切割,暴露下游的一连串疏水性氨基酸并迅速嵌入到细胞膜中。此外,病毒-受体复合物还可通过网格蛋白介导的内吞作用,转移至内/溶酶体酸性环境,依赖组织蛋白酶水解作用切割S2’位点,实现膜融合并释放病毒RNA入胞。
(2)基因组RNA翻译,复制酶复合物组装。以病毒基因组RNA转录本为模板,利用宿主的翻译机制将ORF1a/b译成复制酶多聚蛋白1a(pp1a)和复制酶多聚蛋白1b(pp1b),通过自身木瓜蛋白酶样蛋白酶和3C样蛋白酶活性,将多聚蛋白裂解成16个非结构蛋白 (NSPs),NSP2-16主要为复制酶及其相关蛋白,构成病毒的复制转录复合物(RTC)。 NSP1的羧基末端折叠成两个螺旋,插入40S核糖体亚基上的mRNA入口通道,选择性抑制宿主mRNAs进入核糖体。NSP1抑制宿主细胞蛋白质翻译,是宿主细胞损伤机制之一。
(3)复制病毒基因组RNA(gRNA)和亚基因组RNA(sgRNAs)。SARS-CoV-2gRNA 复制是一个连续合成的过程,RTC以完整病毒基因组RNA为模板反转录全长负链RNA,再以后者为模板产生子代gRNA。sgRNA复制则是一种非连续的跳跃式转录,RTC在遇到每个转录单元的上游调节序列(TRS-Body)后中断转录,并跳跃至模板链基因组5’末端先导序列(TRS-Leader)重新启动复制,合成带有5’先导序列的sgRNAs。SARS-CoV-2至少有8种sgRNA,分别编码不同的病毒结构蛋白或辅助蛋白。
(4)子代病毒粒子的装配和分泌。sgRNA编码的结构蛋白S、E和M转运至内质网- 高尔基体中间腔室(ERGIC)并形成脂质包膜,通过与包裹新生gRNA的N蛋白相互作用,完成病毒粒子装配并进入区室内腔,经高尔基体分泌囊泡途径释放至胞外。最近也有研究表明,β冠状病毒属小鼠肝炎病毒和SARS-CoV-2可通过溶酶体途径分泌出胞,有待进一步证实。
寻找药物治疗的靶标,开发新型抗病毒药物,均依赖于对病毒感染、复制、以及病毒宿主相互作用分子机制的深入理解。SARS-CoV-2相关病毒学研究需在生物安全三级实验室进行,使得疾病分子机制、抗病毒药物筛选及其安全评价等相关研究工作受到极大限制。
病毒复制子(replicon)是能够在宿主细胞中自主复制的病毒DNA或RNA分子,通过删除结构基因,插入或置换报告基因或筛选标记,广泛应用于分子病毒学研究。RNA病毒复制子模型是重要的病毒学研究工具,通常基于DNA载体体外转录制备重组病毒基因组 RNA,应用电转方式导入细胞,实现病毒RNA在体外培养细胞中的自主复制。由于体外转录和电转操作复杂,有研究通过编码病毒基因组的DNA载体转染细胞,利用真核基因启动子驱动病毒RNA转录,经由核质转运实现RNA自主复制;值得注意的是,重组病毒报告基因在细胞核中常具有较高的背景转录活性,此外,细胞核转录RNA具有潜在的拼接加工机制。
RNA病毒复制子模型是重要的病毒学研究工具,通常基于DNA载体体外转录制备重组病毒基因组RNA,应用转染方式导入细胞,实现病毒RNA在体外培养细胞中的自主复制,例如,Zhang Y等最近的报道SARS-CoV-2复制子系统(Antiviral Res,2021.Doi: 10.1016/j.antiviral.2020.104974),但体外转录和RNA转染实验操作较为复杂。有研究则通过编码病毒基因组的DNA载体转染细胞,利用真核基因启动子驱动病毒RNA转录,经由核质转运实现RNA自主复制,如Almazán F等(J Virol,2006.DOI:10.1128/JVI.00385-06)发展的SAR-CoV复制子模型,值得注意的是,该系统中重组病毒报告基因在细胞核中常具有较高的背景转录活性,此外,细胞核转录RNA具有潜在的拼接加工机制。
因此,开发生物安全型复制子模型及高通量药物筛选系统是病毒学领域的关键科学问题,关于新型冠状病毒SARS-CoV-2的安全型复制子模型在现有技术中也鲜有报道。
发明内容
为了克服现有技术中存在的至少一个问题,本发明提供了一种新型冠状病毒SARS-CoV-2的安全复制子以及一种稳定整合重组SARS-CoV-2基因组转录模件的细胞模型,能够诱导重组病毒RNA自主复制和报告基因表达,具体通过在SARS-CoV-2基因组编码序列中嵌入外源性内含子序列,抑制隐匿性RNA拼接,并通过建立稳定整合细胞系,基于Cre/LoxP介导的DNA重组诱导病毒RNA转录,规避了BAC质粒制备、RNA体外转录、 RNA转染等复杂操作,实验系统更加简易、高效。
为实现上述目的,本发明采用如下技术方案:
本发明的第一个方面是提供一种新型冠状病毒SARS-CoV-2复制子,其包括5’启动子、 DNA编码序列和3’核酶序列,并顺次连接构成转录模件;其中,所述DNA编码序列为SARS-CoV-2基因组序列删除病毒棘突蛋白S的编码序列,以报告基因置换病毒核衣壳蛋白N的部分编码序列,在NSP1基因特定位点插入外源嵌合序列。
进一步地,所述外源嵌合序列插入于NSP1基因的66和67位碱基之间;具体地,其邻近序列5’-CAG66^G67-3’,其中:NSP1读码框第一位碱基设定为nt 1,^表示插入位置。上述邻近序列具有保守的外显子和内含子界面序列特征。
进一步地,所述报告基因序列置换所述病毒核衣壳蛋白N第34-385位氨基酸的编码序列。上述报告基因产物能够定量指示病毒复制情况。
进一步地,删除所述病毒棘突蛋白S第36-1252位氨基酸的编码序列。其删除了S蛋白主要编码序列,以构建生物安全型的复制子系统。
进一步地,所述外源嵌合序列依次包括:真核抗性基因编码序列-转录终止信号。其中,抗性基因应用于筛选病毒转录模件稳定整合的单克隆细胞,转录终止信号能够提前终止启动子驱动的病毒RNA转录。
进一步地,所述外源嵌合序列依次包括:第一特异性切除序列-真核抗性基因编码序列- 转录终止信号-第二特异性切除序列。即,在真核抗性基因编码序列和转录终止信号的两侧含有同向的切除位点,能够在重组酶诱导下发生位点特异性重组,在DNA水平删除抗性基因和转录终止序列。
进一步地,所述外源嵌合序列依次包括:5’内含子供体序列-第一特异性切除序列-真核抗性基因编码序列-转录终止信号-第二特异性切除序列-3’内含子分支位点/受体序列。即,第一特异性切除序列和第二特异性切除序列位点上下游,分别插入5’内含子供体序列和3’内含子分支位点/受体序列。重组酶介导切除位点特异性重组,外源嵌合序列剪切为含有单一拷贝切除位点的功能性内含子序列(5’内含子供体序列-特异性切除序列-3’内含子分支位点/受体序列),能够在RNA水平通过内含子拼接机制移除,启动子驱动的病毒RNA转录得以完成。
进一步地,所述外源嵌合序列依次包括:5’内含子供体序列-第一特异性切除序列-分裂肽-真核抗性基因编码序列-转录终止信号-第二特异性切除序列-3’内含子分支位点/受体序列。即,在第一特异性切除序列和真核抗性基因之间引入一段分裂肽编码序列,利用NSP1 翻译起始位点,引导(相同读框)下游抗性基因蛋白的分裂表达。
进一步地,在所述转录模件的5’和3’末端分别插入转座子5’和3’末端元件、核心绝缘子序列,序列依次为:转座子5’末端元件-绝缘子编码序列-转录模件-绝缘子编码序列-转座子3’末端元件。上述结构在转座酶作用下,可通过“剪切,粘贴”的方式将病毒基因组转录模件整合至宿主细胞染色体。
进一步地,在上述新型冠状病毒SARS-CoV-2复制子中,所述启动子为CMV启动子;和/或,所述报告基因为萤光素酶报告基因(具体可为NLuc);和/或,所述核酶序列为HDV RZ序列;和/或,所述真核抗性基因为Blasticidin;和/或,所述第一特异性切除序列和第二特异性切除序列为LoxP,所述重组酶为Cre重组酶;和/或,所述分裂肽为P2A;和/或,所述转录终止信号包括第一转录终止信号和第二转录终止信号,分别为SV40 polyA和BGH polyA真核基因转录终止/加尾信号;和/或,所述核心绝缘子为鸡β珠蛋白核心绝缘子;和/ 或,所述转座子为PiggyBac转座子,所述转座酶为PiggyBac转座酶。
进一步地,编码部分序列置换为荧光素酶报告基因的病毒核衣壳蛋白N的基因序列如 SEQ ID NO.1所示;和/或,编码HDV RZ的基因序列如SEQ ID NO.2所示;和/或,5’内含子供体序列-第一特异性切除序列-分裂肽-真核抗性基因编码序列-转录终止信号-第二特异性切除序列-3’内含子分支位点/受体序列的基因序列如SEQ ID NO.3所示;和/或,编码所述绝缘子的基因序列如SEQ ID NO.4所示;和/或,转座子5’末端元件的基因序列如SEQID NO.5所示;和/或,转座子3’末端元件的基因序列如SEQ ID NO.6所示。
本发明的第二个方面是提供一种含有本发明的第一个方面中任一所述的新型冠状病毒 SARS-CoV-2复制子的生物材料,其特征在于,所述生物材料包括质粒载体、细胞模型。
进一步地,所述质粒载体为采用pBeloBAC11构建的pBAC-rSARS-CoV-2质粒。
进一步地,所述pBAC-rSARS-CoV-2质粒的全序列如SEQ ID NO.9所示。
进一步地,所述细胞模型为采用所述pBAC-rSARS-CoV-2质粒在转座酶作用下将病毒基因组转录模件整合至宿主细胞染色体中,抗性筛选获得的单克隆细胞株。
进一步地,编码所述转座酶的基因序列如SEQ ID NO.8所示;和/或,所述宿主细胞为仓鼠肾成纤维细胞系BHK-21。
本发明的第三个方面是提供一种如本发明的第一个方面中任一所述的新型冠状病毒 SARS-CoV-2复制子、或本发明的第二个方面中任一所述的生物材料的应用,其选自以下应用中的一种:用于评价新型冠状病毒SARS-CoV-2病毒学作用机制的应用、在筛选抗新型冠状病毒SARS-CoV-2药物中的应用、在制备抗新型冠状病毒SARS-CoV-2药物的筛选试剂盒或筛选系统中的应用。
进一步地,上述筛选系统还可包括报告基因检测装置,具体可为荧光素酶检测装置。
本发明的第四个方面是提供一种如本发明的第二个方面中任一所述的生物材料的制备方法,其包括以下步骤:
步骤1)通过PCR方法扩增得到5’转座子-绝缘子、启动子、5’UTR-NSP1、5’内含子供体序列-第一特异性切除序列-分裂肽、真核抗性基因、第一转录终止信号、第二转录终止信号-第二特异性切除序列-3’内含子分支位点/受体序列-KasI片段,将获得的片段依次经重叠延伸PCR扩增得到F1片段;
步骤2)采用质粒酶切、纯化获得KasI-ORF1ab-BstBI线性化F2片段;
步骤3)经过PCR方法扩增BstBI-ΔS、ORF3-E-M-ORF6-ORF7-ORF8-ORF9-ΔN、报告基因-ΔN、ORF10-3’UTR-核酶、绝缘子-3’转座子片段,将获得的片段依次经重叠延伸 PCR扩增得到F3片段;
步骤4)将pBeloBAC11作为质粒骨架,通过PCR方法扩增获得F4片段;
步骤5)采用步骤1)~步骤4)中获得的F1-F4片段进行重组病毒基因组DNA转录模件的组装,其中F1-F4相邻片段之间均带有同源臂;
步骤6)将步骤5)获得的组装产物转化感受态细胞,鉴定筛选获得阳性质粒 pBAC-rSARS-CoV-2。
进一步地,在上述制备方法中,所述步骤1)中涉及的片段为:5’PiggyBac TR-coreinsulator、CMV、5’UTR-NSP1、5’intron-LoxP1-P2A、Blasticidin、SV40 polyA、BGH polyA-LoxP2-3’intron、NSP1-KasI。
进一步地,在上述制备方法中,步骤2)中采用的质粒为pCC1Bac-ORF1ab质粒。
进一步地,在上述制备方法中,步骤3)中涉及的片段为:BstBI-ΔS、 ORF3-E-M-ORF6-ORF7-ORF8-ORF9-ΔN、NLuc-ΔN、ORF10-3’UTR-HDV-RZ、 core-insulator-3’PiggyBac TR片段。
可理解的是,上述步骤1)~4)的操作顺序没有时间先后,其顺序可进行调整。
进一步地,在上述制备方法中,最小单元片段的PCR扩增反应体系为:5×GXLBuffer 10 μL、通用dNTP 4μL、引物(F/R)1μL、GXL聚合酶1μL、DNA模板2-4μL、ddH2O 31-29μL。反应程序为:98℃120s,1个循环;98℃15s,30个循环;58℃(根据引物调整) 20s,30个循环;68℃60s/Kb,30个循环;68℃6min,1个循环。重叠延伸PCR扩增反应体系及反应程序同上。
进一步地,在上述制备方法中,重叠延伸PCR扩增方法包括(以F1片段为例):以两个相邻最小单元片段(F1片段共6个最小单元片段依次命名为F1-1,F1-2,F1-3,F1-4, F1-5,F1-6)为模板,采用F1-1片段的正向引物与F1-2片段的反向引物进行PCR扩增,下游片段按照类似的方法扩增,得到3个融合片段后,按照同样的方法进行下一轮PCR,依此方法进行PCR直至获得F1片段。
进一步地,在上述制备方法中,质粒酶切反应体系为:pCC1Bac-ORF1ab 10μg;KasI5 μL;BstBI 5μL;10×Buffer 10μL;ddH2O补至100μL,37℃孵育4h后,核酸电泳分离,胶回收纯化。
进一步地,在上述制备方法中,所述重组病毒基因组DNA转录模件的组装的反应体系为:反应体系为0.08pmol/片段、20μL Gibson Assembly HiFi Mix,ddH2O补足至40μL,50℃反应60min,获得组装产物。
进一步地,在上述制备方法中,步骤6)的具体操作步骤包括:取组装产物加入DH10B 电转化感受态中,将感受态转移到电转杯中,进行电转化后,加入SOC培养基,摇床复苏,将复苏后感受态细胞均匀涂布氯霉素抗性的SOC平板培养,挑取单克隆用于菌液PCR鉴定,将阳性克隆进行扩增,扩增菌液用于提取质粒,将质粒样品测序,获得阳性质粒pBAC-rSARS-CoV-2。
进一步地,在上述制备方法中,在步骤6)之后,还包括以下步骤:步骤7)将所述pBAC-rSARS-CoV-2与转座酶按照预定比例共转染BHK-21细胞,抗性筛选,获得单克隆细胞株BHK-21-R-CAGG-NLuc。
进一步地,在一具体实施方式中,将pBAC-rSARS-CoV-2与PiggyBac转座酶按照4:1的比例共转染BHK-21细胞,在转染24h后换液并加入10μg/mL Blasticidin进行筛选,每24h更换10μg/mL Blasticidin的新鲜培养基,经Blasticidin筛选10天后,将药物浓度提高到20μg/mL,筛选获得单克隆稳定细胞株BHK-21-R-CAGG-NLuc。
本发明的第五个方面是提供一种抗新型冠状病毒SARS-CoV-2药物的筛选方法,其通过向包含如本发明的第一个方面中任一所述的新型冠状病毒SARS-CoV-2复制子的表达系统中,加入候选药物,检测报告基因的差异表达,评估所述候选药物的抗新型冠状病毒SARS-CoV-2的效果。
进一步地,在上述药物筛选方法中,所述表达系统的构建方法为:在重组酶的诱导条件下,含有所述新型冠状病毒SARS-CoV-2复制子的稳定单克隆细胞株 BHK-21-R-CAGG-NLuc进行SARS-CoV-2病毒RNA转录,并实现N蛋白拯救的病毒RNA 自主复制和荧光素酶报告基因的表达。
进一步地,在上述药物筛选方法中,所述重组酶为重组酶Cre,其由pCDH-N-IRES-Cre 质粒载体表达,编码N-IRES-Cre的基因序列如SEQ ID NO.7所示。
本发明的第六个方面是提供一种体外诱导RNA复制的方法,其在重组酶的诱导条件下,含有如本发明的第一个方面中任一所述的新型冠状病毒SARS-CoV-2复制子的稳定单克隆细胞株BHK-21-R-CAGG-NLuc进行SARS-CoV-2病毒RNA转录,并实现N蛋白拯救的病毒RNA自主复制和荧光素酶报告基因的表达。
进一步地,在上述体外诱导RNA复制方法中,所述重组酶为重组酶Cre,其由 pCDH-N-IRES-Cre质粒载体表达,编码N-IRES-Cre的基因序列如SEQ ID NO.7所示。
进一步地,所述pCDH-N-IRES-Cre的构建步骤包括:
步骤A)通过PCR扩增反应获得N、IRES以及Cre基因片段,相邻片段以及载体与片段之间均含有同源臂;
步骤B)pCDH载体经EcoRI和NotI酶切;
步骤C)将所述步骤A)中3个DNA片段与和所述步骤B)中双酶切载体经琼脂糖凝胶电泳分离纯化DNA片段;
步骤D)将步骤C)中纯化的DNA片段与载体克隆连接,获得重组子;
步骤E)将步骤D)中获得的重组子转化感受态细胞,经测序鉴定获得阳性克隆。
进一步地,在上述步骤D)中,所述连接的反应体系为:100ng/片段、10μL SeamlessCloning Mix,ddH2O补足至20μL,50℃反应30min,获得连接产物。
进一步地,在上述步骤E)中,转化感受态细胞的具体操作步骤包括:取重组子加入DH5α化学转化感受态中,42℃热激90s后,加入LB培养基,摇床复苏,将复苏后感受态细胞均匀涂布氨苄抗性的LB平板培养,将挑取单克隆扩增,菌液用于测序鉴定,将阳性克隆扩增菌液用于提取质粒,获得阳性质粒pCDH-N-IRES-Cre。
上述技术方案中涉及的具体序列信息如下表所示:
与现有技术相比,本发明采用上述技术方案具有以下有益效果:
基于SARS-CoV-2感染具有潜在的细胞毒性,例如,NSP1可抑制宿主细胞70%mRNA的翻译表达,本发明设计了一种可诱导的SARS-CoV-2复制子细胞模型的构建方法,有利于病毒基因组整合细胞的稳定性,其在SARS-CoV-2基因组转录模件中插入一段外源序列嵌合的内含子(intron),在5’内含子供体序列和3’内含子分支位点/受体序列之间引入转录终止序列,能够提前终止CMV启动子驱动的病毒RNA转录。在重组酶Cre诱导条件下,转录终止序列通过嵌合序列中同向LoxP位点重组,在DNA水平被删除;残留的单拷贝LoxP 序列则在RNA水平通过内含子拼接机制移除,CMV启动子驱动的病毒RNA转录得以完成。
真核生物细胞基因通常由外显子和内含子间隔排列,这些序列被转录在前体RNA中,其中的内含子序列在mRNA加工过程中被移除。外显子与内含子邻界序列具有一定的保守性,如5’-(C/A)AG^G-3’(^表示内含子插入位置)。内含子的功能序列包括5’端内含子供体序列,3’端内含子分支位点,以及3’端内含子受体序列。基于此,本发明将外源嵌合序列插入于NSP1基因nt 66和67之间,邻近序列5’-CAG66^G67-3’。
SARS-CoV-2棘突蛋白S与宿主细胞表面受体ACE2结合,是病毒感染进入宿主细胞的关键步骤。为构建生物安全型的复制子系统,本发明在重组病毒基因组模件中删除了S蛋白主要编码序列。
N蛋白基因毗邻病毒基因组3’末端复制起始位点,相关sgRNAs具有较高丰度。本发明在重组病毒基因组模件中,以荧光素酶报告基因置换N蛋白基因,提高重组复制子系统灵敏度。N蛋白能够协助RTC招募病毒基因组RNA,对病毒复制至关重要,因此在本发明细胞模型中,通过N蛋白反式互补拯救重组病毒RNA复制和报告基因表达。
本发明还公开了一种PiggyBac转座子介导的、将SARS-CoV-2基因组转录模件(>30Kb) 整合至宿主细胞染色质DNA的方法。PiggyBac转座子来源于鳞翅目昆虫,其转座元件是5’和3’末端重复序列(5’TR和3’TR),分别含有一个13bp的末端反向重复序列(ITR)和一个19bp的亚末端重复序列(STR),ITR和STR之间分别有一个3bp和31bp的间隔序列。本发明将PiggyBac转座子5’和3’末端元件,分别插入在病毒基因组转录模件的5’和3’末端。通过共表达PiggyBac转座酶,精确识别并结合转座子末端元件,通过“剪切,粘贴”的方式将病毒基因组转录模件整合至宿主细胞染色体。且绝缘子片段为高GC含量序列,能够增加与染色质的空间阻隔,确保被转座基因稳定表达。
本发明通过设计Cre/LoxP介导DNA重组,以及内含子RNA拼接,实现外源基因序列在SARS-CoV-2基因组无缝插入;通过PiggyBac转座策略,将完整SARS-CoV-2基因组转录模件整合至宿主细胞染色质,筛选获得稳定的病毒复制子细胞模型。上述细胞模型能够诱导重组病毒RNA自主复制和报告基因表达,可广泛应用于相关病毒学研究、抗病毒药物筛选和评价,具有重要的病毒学意义和应用前景。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明仅用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一实施例中SARS-CoV-2基因组示意图以及重组病毒基因组转录模件的主要基因操作示意图。
图2为本发明一实施例中重组病毒基因组转录模件整合至宿主细胞后的操作示意图;其中,重组病毒基因组转录模件经Cre/LoxP介导位点特异性重组,移除抗性基因和转录终止序列,外源嵌合序列剪切为含有单一拷贝LoxP位点的功能性内含子(5’内含子供体序列→LoxP→3’内含子分支位点/受体序列)。
图3为本发明一实施例中将构建的pBAC-rSARS-CoV-2,pcDNA3.1-N,pCDH-Cre共转染BHK-21细胞后病毒RNA复制能力的结果示意图。
图4为本发明一实施例中将pBAC-rSARS-CoV-2转座至宿主细胞与稳定细胞株筛选的流程示意图。
图5为本发明一实施例中稳定整合重组病毒基因组转录模件的BHK-21细胞通过转染 pCDH-N-IRES-Cre诱导NLuc报告基因表达的结果示意图。
图6为本发明一实施例中进行报告基因插入位置优化时所构建的R-S-Nluc与R-N-Nluc 质粒模型的结构示意图。
图7为本发明一实施例中R-S-Nluc复制子NLuc报告基因检测系统的灵敏度鉴定的结果示意图。
图8为本发明一实施例中R-N-NLuc复制子NLuc报告基因检测系统的灵敏度鉴定的结果示意图。
图9为本发明一实施例中外源嵌合序列在不同插入位置时NLuc酶活性的检测结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。下列实施例中未注明具体条件的实验方法,通常按照国家标准测定。下述实施例中未注明出处的实验材料,均为市售原料。下述实施例中的各步骤中采用的设备均为常规设备。若没有相应的国家标准,则按照通用的国际标准、常规条件、或按照制造厂商所建议的条件进行。除非另外说明,否则所有的份数为重量份,所有的百分比为质量百分比。除非另有定义或说明,本发明中所使用的所有专业与科学用语与本领域技术熟练人员所熟悉的意义相同。此外任何与所记载内容相似或均等的方法及材料皆可应用于本发明方法中。
在本发明的一具体实施方案中,提供一种稳定整合重组SARS-CoV-2基因组转录模件的细胞模型,能够诱导重组病毒RNA自主复制和报告基因表达。其操作要点为:克隆病毒基因组的DNA编码序列,删除病毒S基因,并以荧光素酶报告基因置换N蛋白基因序列,基因组两端分别引入CMV启动子和HDV RZ序列,构建功能性病毒基因组转录模件;在 NSP1基因特定位点插入外源嵌合序列,包括同向LoxP为侧翼的抗性筛选基因与转录终止信号。在重组酶Cre诱导条件下,通过位点特异性重组删除转录终止信号,残留的单拷贝 LoxP位点则在RNA水平通过内含子拼接机制移除,转录模件驱动的病毒RNA转录得以完成。进一步地,在重组病毒转录模件两侧插入PiggyBac转座子序列,利用PiggyBac转座酶将重组病毒转录模件整合至宿主细胞染色体,基于抗性基因筛选获得稳定整合的单克隆细胞,能够在重组酶Cre诱导条件下,实现N蛋白拯救的病毒RNA复制和报告基因表达。
在本发明的一具体实施方案中,基于pBeloBAC11载体构建了pBAC-rSARS-CoV-2质粒,编码功能性病毒基因组转录模件,能够在共表达PiggyBac转座酶条件下,将病毒基因组转录模件整合至宿主细胞染色体;能够在转染细胞共表达Cre条件下,实现N蛋白拯救的病毒RNA复制和报告基因表达。
在本发明的一具体实施方案中,构建了pCDH-N-IRES-Cre表达质粒,能够在转染细胞中共表达病毒N蛋白及重组酶Cre,诱导基于重组病毒转录模件的病毒RNA转录,以及N 蛋白拯救的病毒RNA自主复制。
在本发明的一具体实施方案中,提供SARS-CoV-2重组病毒复制子细胞模型的构建方法:应用pBeloBAC11载体克隆SARS-CoV-2基因组DNA编码序列,删除病毒基因组S蛋白aa36-1252编码序列,以荧光素酶报告基因替换N蛋白aa34-385编码序列;基因组两端分别引入CMV启动子和HDV RZ序列,构建功能性病毒基因组转录模件;在重组病毒NSP1 编码区nt 66和67之间(5’-CAG66^G67-3’,NSP1读码框第一位碱基设定为nt 1)插入外源嵌合序列,依次为5’内含子供体序列→P2A编码序列→LoxP1→真核抗性基因→转录终止信号→LoxP2→3’内含子分支位点/受体序列。其中,转录终止信号包括SV40 polyA和BGH polyA两段真核基因转录终止/加尾信号;P2A编码序列与上游NSP1翻译起始位点,以及下游真核抗性基因(Blasticidin resistance)共用同一读码框,引导抗性基因蛋白的分裂表达。
进一步地,将PiggyBac转座子5’和3’末端元件,以及鸡β珠蛋白核心绝缘子序列,分别插入在病毒基因组转录模件的5’和3’末端(序列依次为,转座子5’末端元件→绝缘子→重组病毒转录模件→绝缘子→转座子3’末端元件),完成重组病毒BAC质粒 (pBAC-rSARS-CoV-2)的构建。应用上述BAC质粒转染仓鼠肾成纤维细胞系BHK-21,在PiggyBac转座酶作用下,通过“剪切,粘贴”的方式将病毒基因组转录模件整合至宿主细胞染色体,基于重组病毒模件中的真核抗性基因,筛选稳定整合单克隆细胞。在诱导条件下,Cre/LoxP介导整合序列位点特异性重组,移除抗性基因和转录终止序列,外源嵌合序列则剪切为含有单一拷贝LoxP位点的功能性内含子(5’内含子供体序列→LoxP→3’内含子分支位点/受体序列),能够在RNA水平通过内含子拼接机制移除,实现基于重组病毒转录模件的病毒RNA转录,并实现N蛋白拯救的病毒RNA自主复制和报告基因表达。
在本发明的一具体实施方案中,还提供了:编码N-Nano-luciferase(N代表残留的N 基因序列)序列如SEQ ID NO.1所示;编码HDV反义核酶序列如SEQ ID NO.2所示;嵌合intron的双LoxP序列及其之间插入基因(5’intron-LoxP1-P2A-Blasticidin-SV40 polyA-BGH polyA-LoxP2-3’intron)序列如SEQ ID NO.3所示;鸡β珠蛋白核心绝缘子编码序列如SEQ ID NO.4所示;5’末端PiggyBac转座元件序列(243bp)如SEQ ID NO.5所示; 3’末端PiggyBac转座元件序列(314bp)如SEQ ID NO.6所示;编码Cre重组酶(N-IRES-Cre 基因)基因序列如SEQ ID NO.7所示;编码PiggyBac转座酶基因序列SEQ ID NO.8所示;以及,pBAC-rSARS-CoV-2复制子全序列如SEQ ID NO.9所示。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
下述实施例中,新型冠状病毒SARS-CoV-2的原始序列为GenBank:OM065388.1(https://www.ncbi.nlm.nih.gov/nucleotide/OM065388.1?report=genbank&log$=nucltop&blast_ rank=2&RID=7JA2HWEX013)。
实施例1–重组SARS-CoV-2病毒基因组BAC质粒(pBAC-rSARS-CoV-2)的构建
本实施例基于pBeloBAC11载体构建了pBAC-rSARS-CoV-2质粒,其涉及的重组病毒基因组转录模件(rSARS-CoV-2)的主要基因操作如图1所示,其包括删除S基因、NLuc 报告基因置换病毒N蛋白基因、外源嵌合序列插入NSP1基因位点,并给出外源嵌合基因的主要构成。如图2所示,重组病毒基因组转录模件整合至宿主细胞后,经Cre/LoxP介导位点特异性重组,移除抗性基因和转录终止序列,外源嵌合序列剪切为含有单一拷贝LoxP 位点的功能性内含子(5’内含子供体序列→LoxP→3’内含子分支位点/受体序列),能够在 RNA水平通过内含子拼接机制移除,实现基于重组病毒转录模件的病毒RNA转录,并实现N蛋白拯救的病毒RNA自主复制和报告基因表达。
上述pBAC-rSARS-CoV-2质粒的具体构建步骤包括:
通过PCR方法扩增得到5’PiggyBac TR-core insulator、CMV、5’UTR-NSP1、 5’intron-LoxP1-P2A、Blasticidin、SV40 polyA、BGH polyA-LoxP2-3’intron、NSP1-KasI片段,将获得的片段依次经重叠延伸PCR扩增得到约3Kb的F1片段;
SARS-CoV-2非结构蛋白pp1ab基因片段来自于pCC1Bac-ORF1ab质粒(金唯智公司,PA11799)。将pCC1Bac-ORF1ab质粒用KasI和BstBI酶切,经纯化后获得约19.6Kb的 KasI-ORF1ab-BstBI线性化F2片段;
经过PCR方法扩增BstBI-ΔS、ORF3-E-M-ORF6-ORF7-ORF8-ORF9-ΔN、NLuc-ΔN、ORF10-3’UTR-HDV-RZ、core-insulator-3’PiggyBac TR片段,将获得的片段依次经重叠延伸 PCR扩增得到约6.35Kb的F3片段;
将低拷贝细菌人工染色体pBeloBAC11作为质粒骨架,通过PCR方法扩增获得约7.3Kb的F4片段,上述F1-F4相邻片段之间均带有40bp的同源臂;
将F1-F4片段经GeneArt Gibson组装重组病毒基因组DNA转录模件,反应体系为0.08 pmol/片段、20μL Gibson Assembly HiFi Mix,ddH2O补足至40μL,50℃反应60min后,取2μL组装产物加入DH10B电转化感受态中,冰上静置2min,将感受态转移到2mm电转杯中,电转化参数设置为2500V,25μF和100Ω电击一次后,冰上放置5min,加入1mL SOC培养基,在37℃250rpm摇床复苏45min。将复苏后感受态细胞均匀涂布12.5μg/ml 氯霉素抗性的SOC平板,37℃细菌培养箱中培养14-18h,挑取单克隆用于菌液PCR鉴定,将阳性克隆进行扩增,扩增菌液用于提取质粒,将质粒样品测序,获得质粒 pBAC-rSARS-CoV-2。
上述构建方法中,最小单元片段的PCR扩增方法:以相应质粒或基因片段为模板,通过特异性PCR引物进行扩增,获得目的片段,相邻片段间至少存在20bp的同源序列;本实施例通过引物将短基因序列引入目的片段,如扩增BGH polyA-LoxP2-3’intron片段,首先以pcDNA3.1载体为模板,BGH-F、BGH-R1为引物进行第一轮PCR扩增,进一步以第一轮经纯化后的PCR产物为模板,BGH-F、BGH-R2为引物进行第二轮PCR扩增,纯化后获得目的片段,其他需要引入短基因序列片段操作步骤同上。所涉及的PCR反应体系为: 5×GXL Buffer 10μL、通用dNTP 4μL、引物(F/R)1μL、GXL聚合酶1μL、DNA模板 2-4μL、ddH2O 31-29μL。反应程序为:98℃120s,1个循环;98℃15s,30个循环; 58℃(根据引物调整)20s,30个循环;68℃60s/Kb,30个循环;68℃6min,1个循环。
上述反应体系中涉及的PCR引物列表
上述构建方法中,重叠延伸PCR扩增方法:以上述纯化的两个相邻最小单元片段(F1 片段共6个最小单元片段依次命名为F1-1,F1-2,F1-3,F1-4,F1-5,F1-6)为模板,采用F1-1片段的正向引物与F1-2片段的反向引物进行PCR扩增,下游片段按照类似的方法扩增,得到3个融合片段后,按照同样的方法进行下一轮PCR,依此方法进行PCR直至获得 F1片段。上述PCR扩增反应体系、反应条件以及反应程序同最小单元片段扩增。F3和F4 片段获得同上述方法。
上述构建方法中,pCC1Bac-ORF1ab酶切反应体系为:pCC1Bac-ORF1ab 10μg;KasI5μL;BstBI 5μL;10×Buffer 10μL;ddH2O补至100μL。将反应管至于37℃孵育4h后,核酸电泳分离,胶回收纯化后,-20℃保存待用。
上述构建方法中,酶切载体与PCR产物纯化:
1)酶切载体或PCR产物经核酸电泳分离DNA片段,在紫外灯下,切取DNA片段,凝胶称重,并转移至相应管中,按0.1g凝胶加入100μL GDP(在胶回超过5Kb的片段时,需加入300μL GDP并在凝胶溶解后加入1倍体积的异丙醇),55℃水浴11~15min,其间不断颠倒混匀至溶解,将DNA吸附于膜上,11500g离心57s;
2)弃滤液,加入300μL GDP至DNA结合膜中,2min后,11500g离心55s;
3)弃掉滤液,加入650μL DW2,11500g离心54s,重复洗涤一次,将柱子重复放入2mL离心管中,11500g离心2min;
4)将吸附膜放于1.5mL EP管中,室温开盖放置2min,待乙醇挥发后,将20μL预热的ddH2O加入至吸附膜中央,50℃空气浴2min,11500g离心54s,将滤液再次加入吸附膜上,11500g离心51s,收取DNA溶液,NanoDrop测定浓度,直接使用或者-20℃保存。
上述构建方法中,所用片段基因序列来源如下:PiggyBac转座元件与鸡β珠蛋白核心绝缘子编码序列来源于PiggyBac Dual Promoter质粒(PB513B-1,淼灵质粒平台)、CMV与BGH polyA序列来源于pcDNA3.1载体、SV40 polyA来源于pCMV质粒载体、intron序列参考pCI-neo载体序列5’intron-LoxP1-P2A通过基因合成的方法获得、LoxP1与LoxP2序列相同、Blasticidin序列来源于pCDH-Blasticidin载体;SARS-CoV-2相关基因(BstBI-ΔS、ORF3-E-M-ORF6-ORF7-ORF8-ORF9-ΔN)序列来源于复旦大学生物安全三级实验室、NLuc 基因序列来源于pNL1.3[secNluc]载体(N1021,Promega公司)、ORF10-3’UTR-HDV-RZ通过基因合成方法获得、pBeloBAC11载体购自淼灵质粒平台、pCC1Bac-ORF1ab购自金唯智公司(PA11799)。
上述构建方法中合成或参考基因序列如下表
实施例2-pBAC-rSARS-CoV-2病毒RNA复制的验证
本实施例采用实施例1构建获得的pBAC-rSARS-CoV-2以进行SARS-CoV-2病毒RNA复制的验证,包括步骤:
将pBAC-rSARS-CoV-2分别与pcDNA3.1-N+pCDH-Cre+Renilla(N蛋白和Cre重组酶均表达,实验组)、pcDNA3.1-N+pCDH+Renilla(仅表达N蛋白,对照组1)、 pcDNA3.1+pCDH-Cre+Renilla(仅表达Cre重组酶,对照组2)以及pcDNA3.1+pCDH+Renilla(N蛋白和Cre重组酶均不表达,阴性对照组)按照4:1:1:0.1的比例共转染BHK-21细胞, 48孔板每孔共计转染0.61μg质粒,转染6h后,加入核苷类似物10μM瑞德西韦(remdesivir) 抑制RdRP酶活性,瑞德西韦对照组加入等体积的DMSO转染24h后将细胞样品裂解,检测NLuc酶活性。该实验独立重复3次,每个处理组设3个生物学重复。Renilla用于校正转染效率,因此测得的数据经过Renilla校正后,以转染pcDNA3.1+pCDH+Renilla组为对照组进行差异倍数分析。
上述实验中,以SARS-CoV-2病毒逆转后cDNA为模板,通过PCR的方法获得N基因片段,片段与载体有20bp同源臂;pcDNA3.1载体(Invitrogen,V790-20),经BamHI和 EcoRI酶切纯化后连接,克隆经测序后鉴定获得pcDNA3.1-N质粒。pCDH-Cre构建方法:以pCMV-Cre-EGFP(碧云天,D2608)质粒为模板,通过PCR方法扩增获得Cre基因片段,片段与载体有20bp同源臂;pCDH载体(优宝生物,VT1480)经EcoRI和BamHI酶切纯化后连接,克隆经测序后鉴定获得pCDH-Cre质粒。上述连接转化、PCR方法、PCR步骤反应程序同pCDH-N-IRES-Cre构建方法。
上述实验中,细胞转染具体操作步骤:1)质粒DNA混合物配制:以上述48孔板为例,将汇合度为80-90%细胞更换完全培养基后,将质粒加入12.5μL opti-MEM中混匀后加入1μL p3000,混匀静置2min;2)转染试剂的稀释:将1μL Lipo 3000溶液与12.5μL opti-MEM混合后加入1)复合物中,室温静置10min(室温静置时间不宜过长)后混合均匀,加入细胞培养板,轻轻晃动,转染12h后换液。
上述实验中,NLuc&Renilla报告基因检测:1)裂解与收样:将5×PLB稀释成1×裂解液并加入蛋白酶抑制剂Cocktail,裂解液与底物缓冲液均平衡至室温,向PBS洗后的样品中加入相应体积的裂解液,100rpm摇床上,裂解30min。2)荧光测定:配制底物工作液,底物缓冲液与底物按照50:1,例如需要1mL工作液,则向1mL底物缓冲液中加入20 μL底物,混匀后待用。取10μL样品与10μL底物工作液混合均匀后,用GloMax20/20发光仪检测,加入10μLStop&Glo,测定Renilla,记录数据。
上述pcDNA3.1-N与pCDH-Cre质粒构建引物信息及基因序列信息表
上述检测结果如图3所示,与其他对照组相比,在共转染Cre重组酶和N蛋白条件下,显示重组酶Cre成功诱导N蛋白互补条件下的重组病毒复制,pBAC-rSARS-CoV-2病毒RNA高效复制,且表达的报告基因被瑞德西韦显著抑制。
实施例3-pBAC-rSARS-CoV-2转座至宿主细胞与稳定细胞株筛选
本实施例利用实施例1中构建获得的质粒pBAC-rSARS-CoV-2来制备新型冠状病毒SARS-CoV-2复制子细胞模型,其操作如图4所示,具体操作步骤包括:将质粒 pBAC-rSARS-CoV-2与PiggyBac转座酶按照4:1的比例共转染BHK-21细胞(仓鼠肾成纤维细胞系)(转染步骤同实施例2),在转染24h后换液并加入10μg/mL Blasticidin进行筛选,每24h更换10μg/mL Blasticidin的新鲜培养基,经Blasticidin筛选10天后,将药物浓度提高到20μg/mL,初步筛选的细胞进一步筛选获得单克隆稳定细胞株BHK-21-R-CAGG-NLuc。
实施例4-BHK-21-R-CAGG-NLuc细胞株的病毒RNA转录验证
本实施例采用实施例3构建获得的BHK-21-R-CAGG-NLuc细胞株以进行SARS-CoV-2病毒RNA转录的验证,包括步骤:
将0.5μg pCDH-N-IRES-Cre+0.1μg Renilla质粒转染48孔板中单克隆细胞株BHK-21-R-CAGG-NLuc(转染步骤同实施例2),转染6h后加入终浓度10μM瑞德西韦,对照组加入等体积DMSO,转染24h后收集裂解细胞样品,检测NLuc酶活性(方法同实施例2)。
上述pCDH-N-IRES-Cre(编码N-IRES-Cre的基因序列如SEQ ID NO.7所示)的构建方法为:通过PCR扩增反应获得N、IRES以及Cre基因片段,相邻片段以及载体与片段之间均含有20bp的同源臂;pCDH载体经EcoRI和NotI酶切;将N、IRES以及Cre基因片段与双酶切pCDH载体经琼脂糖凝胶电泳分离纯化DNA片段;将纯化的DNA片段与载体克隆连接,连接的反应体系为:100ng/片段、10μL Seamless Cloning Mix,ddH2O补足至 20μL,50℃反应30min,获得连接产物,即重组子;将重组子加入DH5α化学转化感受态中,42℃热激90s后,加入LB培养基,摇床复苏,将复苏后感受态细胞均匀涂布氨苄抗性的LB平板培养,将挑取单克隆扩增,菌液用于测序鉴定,将阳性克隆扩增菌液用于提取质粒,经测序鉴定获得阳性质粒pCDH-N-IRES-Cre。
上述检测结果如图5所示,Cre重组酶诱导和N蛋白拯救该细胞株中病毒RNA复制和报告基因表达,瑞德西韦能够显著抑制报告基因表达。
实施例5-报告基因插入N基因位置优化
为优化报告基因的插入位置,本实施例构建包含转录模件的SARS-CoV-2复制子质粒模型:R-S-NLuc复制子质粒模型和R-N-NLuc复制子质粒模型,通过改变报告基因的插入位置,提高报告基因的灵敏度。
一、R-S-NLuc复制子质粒模型构建
在SARS-CoV-2基因组的两侧插入上述实施例-1中转录模件,NLuc报告基因序列置换部分S基因序列,以pBeloBAC11为载体构建瞬时转染的复制子质粒模型(R-S-NLuc),该模型在转染宿主细胞中具有功能性复制特征,具体构建步骤如下,
(1)pBeloBAC11载体酶切位点引入
pBeloBAC11载体用ApaL1和HindIII酶切纯化后,通过Bac11-F/R引物片段退火的方式引入BamHI,ApaL1,NheI,NsiI和HindIII酶切位点,命名为pBeloBAC11-1。具体步骤为,将Bac11-F/R引物按照下述反体系置于100℃沸水5min后,待其自然降至室温,获得引物片段。将纯化后酶切载体pBeloBAC11-ApaL1/HindIII与退火后引物片段按照下述连接体系,经4℃孵育过夜后,将其按照构建克隆pCDH-N-IRES-Cre步骤转化后,挑取单克隆进行测序鉴定,获得pBeloBAC11-1载体。
上述酶切反应体系、反应条件以及载体回收纯化同pBAC-rSARS-CoV-2构建方法。Bac11-F/R引物退火反应体系为:Bac11-F(20μM)5μL;Bac11-R(20μM)5μL;10×NEB Buffer25μL;ddH2O 35μL。载体与退火后引物片段连接反应体系为:pBeloBAC11-ApaL1/ HindIII20ng;引物退火产物2μL;NEB T4 DNA ligase 1μL;10×NEB T4 DNA ligase Buffer2μL;ddH2O补至20μL。
(2)BsaI酶切位点移除
由于pBeloBAC11-1质粒骨架中BsaI酶切位点会影响后续克隆构建,因此通过重叠延伸PCR方法移除该位点。将pBeloBAC11-1载体SpeI/PciI酶切纯化回收后,以pBeloBAC11-1 为模板进行重叠延伸PCR,获得移除片段,将该片段与纯化后pBeloBAC11-1-SpeI/PciI载体连接转化,挑取单克隆,经测序得到pBeloBAC11-2。
(3)中间体克隆构建
通过PCR方法扩增CMV、5’UTR、T2A-NLuc、ORF3-E-M-ORF6-ORF7-ORF8-ORF9-N-ORF10、3’UTR-HDV-RZ、BGH polyA得到最小单元片段,将获得的片段CMV、5’UTR、 T2A-NLuc依次经重叠延伸PCR扩增得到CMV-5’UTR-T2A-NLuc片段,将剩余3个片段依次经重叠延伸PCR扩增得到ORF3-BGH polyA的片段,2个片段之间以及片段与载体之间带有40bp的同源臂;将pBeloBAC11-2载体经NheI、NsiI酶切纯化后2个片段经GeneArt Gibson组装,将组装产物经电转化感受态细胞,将复苏感受态细胞涂布氯霉素抗性的SOC 平板,经培养后挑取克隆进行菌液PCR鉴定,将阳性克隆进行扩增,扩增菌液用于提取质粒,将质粒样品测序,获得中间体质粒pBAC11-2-5’UTR-S-NLuc-3’UTR-BGH polyA。
(4)R-S-NLuc复制子模型克隆构建
将SARS-CoV-2病毒基因组ORF1ab分成4个片段,其相邻片段间带有40bp同源序列,以pCC1Bac-ORF1ab质粒(金唯智公司,PA11799)质粒为模板进行PCR,经纯化后获得相应片段。将中间体质粒经KasI/BamHI酶切纯化后的载体片段与上述4个片段经GeneArt Gibson组装,组装产物经电转化感受态细胞,将复苏感受态细胞涂布氯霉素抗性的SOC平板,经培养后挑取克隆进行菌液PCR鉴定,选阳性克隆进行扩增,扩增菌液用于提取质粒,将质粒样品测序,获得R-S-Nluc复制子质粒克隆。
二、R-N-NLuc复制子质粒模型构建
基于SARS-CoV-2病毒学特征,删除S基因部分序列,将报告基因置换N基因部分序列,通过回补N实现病毒基因组功能性复制。该质粒模型构建步骤为:通过PCR方法扩增ΔS-ORF8-ΔN、NLuc、ΔN-SbfI片段,3个最小单元片段的模板均为R-S-NLuc质粒,将前2个纯化后片段进行重叠延伸PCR,获得ΔS-ORF8-ΔN-NLuc片段;R-S-Nluc质粒经 BamHI/SbfI双酶切纯化后载体与上述2个片段(ΔS-ORF8-ΔN-NLuc、ΔN-SbfI)经GeneArt Gibson组装,组装产物经电转化感受态细胞,将复苏感受态细胞涂布氯霉素抗性的SOC平板,经培养后挑取克隆进行菌液PCR鉴定,选阳性克隆进行扩增,扩增菌液用于提取质粒,将质粒样品测序,获得R-N-NLuc复制子质粒模型。
图6为上述R-S-Nluc与R-N-Nluc质粒模型结构示意图,上述R-S-NLuc和R-N-NLuc复制子模型构建过程中所涉及的PCR扩增方法、重叠延伸PCR扩增方法、酶切连接及纯化的具体操作步骤同pBAC-rSARS-CoV-2构建方法。
上述R-S-NLuc复制子质粒模型构建所需引物序列信息
上述R-N-NLuc复制子质粒模型构建所需引物序列信息
三、报告基因插入位置灵敏度鉴定
将0.45μg R-S-NLuc与0.05μg Renilla共转染至48孔板的BHK-21细胞,转染6h后,实验组加入10μM瑞德西韦,对照组加入等体的DMSO,转染24h后将细胞样品裂解,检测NLuc酶活性。该实验独立重复3次,每个处理组设3个生物学重复。Renilla用于校正转染效率,因此测得的数据经过Renilla校正后,进行差异倍数分析。上述检测结果如图7 所示,与对照组相比,瑞德西韦对R-S-Nluc复制子酶活性抑制的10倍高,高度灵敏NLuc 报告基因检测系统的灵敏度并未达到理想效果。基于病毒学特征将报告基因插入在N基因内部,即上述R-N-NLuc质粒模型。
将0.35μg R-N-NLuc+0.15μg pcDNA3.1-N+0.01μg Renilla进行共转染至48孔板的 BHK-21细胞,转染6h后,实验组加入10μM瑞德西韦,对照组加入等体的DMSO,转染 24h后将细胞样品裂解,检测NLuc酶活性。该实验独立重复3次,每个处理组设3个生物学重复。Renilla用于校正转染效率,因此测得的数据经过Renilla校正后,进行差异倍数分析。上述检测结果如图8所示,与对照组相比,瑞德西韦对R-N-Nluc复制子模型酶活性抑制效果高达100倍,因此本实施例将报告基因优选插入在该N基因内部。
实施例6-外源嵌合序列插入CAGG位置优化
基于外源嵌合序列特征,需将其插入在保守的外显子和内含子界面序列的位置,病毒 NSP1编码区包含2个此特征序列(5’-CAG66^G67-3’,5’-AAG175^G176-3’,NSP1读码框第一位碱基设定为nt 1)。本实施例将外源嵌合序列分别插入在2个特定位置,构建为pBAC-rSARS-CoV-2(CAGG)与pBAC-rSARS-CoV-2-AAGG,其中AAGG插入位置的构建方法同pBAC-rSARS-CoV-2。
将pBAC-rSARS-CoV-2+pCDH-N-IRES-Cre+Renilla(CAGG)、pBAC-rSARS-CoV-2 -AAGG+pCDH-N-IRES-Cre+Renilla(AAGG)按照4:2:0.1比例共转染BHK-21细胞,48孔板每孔共计转染0.61μg质粒,转染24h后将细胞样品裂解,检测NLuc酶活性。
上述检测结果如图9所示,与pBAC-rSARS-CoV-2-AAGG相比,pBAC-rSARS-CoV-2(CAGG)复制子模型酶活性高,因此,本实施例将外源嵌合序列优选插入在NSP1基因 nt 66和67之间。
由上述实施例可知,本发明构建了一种新型SARS-CoV-2复制子细胞模型,其通过报告基因插入位置和外源嵌合序列插入位置的优化,应用载体克隆SARS-CoV-2基因组DNA编码序列,删除病毒基因组S蛋白主要编码序列,以荧光素酶报告基因替换N蛋白aa34-385编码序列,在重组病毒NSP1编码区nt 66和67之间插入外源嵌合序列,从而能够诱导重组病毒RNA自主复制和报告基因表达。通过设计Cre/LoxP介导DNA重组,以及内含子RNA 拼接,实现外源基因序列在SARS-CoV-2基因组无缝插入。通过PiggyBac转座策略,将完整SARS-CoV-2基因组转录模件整合至宿主细胞染色质,筛选获得稳定的病毒复制子细胞模型。本发明构建的新型SARS-CoV-2复制子细胞模型,可广泛应用于抗SARS-CoV-2药物筛选及评价,也为深入的基础病毒学研究提供平台。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围。
序列表
<110> 复旦大学
<120> 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用
<160> 9
<170> SIPOSequenceListing 1.0
<210> 1
<211> 717
<212> DNA
<213> 编码N-Nano-luciferase的基因序列(Artificial Sequence)
<400> 1
atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60
tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg tcttcacact cgaagatttc 120
gttggggact ggcgacagac agccggctac aacctggacc aagtccttga acagggaggt 180
gtgtccagtt tgtttcagaa tctcggggtg tccgtaactc cgatccaaag gattgtcctg 240
agcggtgaaa atgggctgaa gatcgacatc catgtcatca tcccgtatga aggtctgagc 300
ggcgaccaaa tgggccagat cgaaaaaatt tttaaggtgg tgtaccctgt ggatgatcat 360
cactttaagg tgatcctgca ctatggcaca ctggtaatcg acggggttac gccgaacatg 420
atcgactatt tcggacggcc gtatgaaggc atcgccgtgt tcgacggcaa aaagatcact 480
gtaacaggga ccctgtggaa cggcaacaaa attatcgacg agcgcctgat caaccccgac 540
ggctccctgc tgttccgagt aaccatcaac ggagtgaccg gctggcggct gtgcgaacgc 600
attctggcgt aacagaagaa acagcaaact gtgactcttc ttcctgctgc agatttggat 660
gatttctcca aacaattgca acaatccatg agcagtgctg actcaactca ggcctaa 717
<210> 2
<211> 88
<212> DNA
<213> 编码HDV反义核酶的基因序列(Artificial Sequence)
<400> 2
gggtcggcat ggcatctcca cctcctcgcg gtccgacctg ggcatccgaa ggaggacgca 60
cgtccactcg gatggctaag ggagagcc 88
<210> 3
<211> 1063
<212> DNA
<213> 5’intron-LoxP1-P2A-Blasticidin-SV40 polyA-BGH polyA-LoxP2-3’intron基因序列(Artificial Sequence)
<400> 3
gtaagtatca aggttacaag acaggttata aggagaccaa tagaaactgg gcttgtcgag 60
ataacttcgt ataatgtatg ctatacgaag ttatccggat ccggcgcaac aaacttctct 120
ctgctgaaac aagccggaga tgtcgaagag aatcctggac cggccaagcc tttgtctcaa 180
gaagaatcca ccctcattga aagagcaacg gctacaatca acagcatccc catctctgaa 240
gactacagcg tcgccagcgc agctctctct agcgacggcc gcatcttcac tggtgtcaat 300
gtatatcatt ttactggggg accttgtgca gaactcgtgg tgctgggcac tgctgctgct 360
gcggcagctg gcaacctgac ttgtatcgtc gcgatcggaa atgagaacag gggcatcttg 420
agcccctgcg gacggtgccg acaggtgctt ctcgatctgc atcctgggat caaagccata 480
gtgaaggaca gtgatggaca gccgacggca gttgggattc gtgaattgct gccctctggt 540
tatgtgtggg agggctaact ggagttcttc gcccacccca acttgtttat tgcagcttat 600
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 660
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg aaacccgctg 720
atcagcctcg actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc 780
ttccttgacc ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc 840
atcgcattgt ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa 900
gggggaggat tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggataa 960
cttcgtataa tgtatgctat acgaagttat cagagaagac tcttgcgttt ctgataggca 1020
cctattggtc ttactgacat ccactttgcc tttctctcca cag 1063
<210> 4
<211> 230
<212> DNA
<213> 鸡β珠蛋白核心绝缘子基因编码序列(Artificial Sequence)
<400> 4
ttttccccgt atccccccag gtgtctgcag gctcaaagag cagcgagaag cgttcagagg 60
aaagcgatcc cgtgccacct tccccgtgcc cgggctgtcc ccgcacgctg ccggctcggg 120
gatgcggggg gagcgccgga ccggagcgga gccccgggcg gctcgctgct gccccctagc 180
gggggaggga cgtaattaca tccctggggg ctttgggggg gggctgtccc 230
<210> 5
<211> 243
<212> DNA
<213> 5’末端piggyBac转座元件基因序列(Artificial Sequence)
<400> 5
ttaaccctag aaagataatc atattgtgac gtacgttaaa gataatcatg cgtaaaattg 60
acgcatgtgt tttatcggtc tgtatatcga ggtttattta ttaatttgaa tagatattaa 120
gttttattat atttacactt acatactaat aataaattca acaaacaatt tatttatgtt 180
tatttattta ttaaaaaaaa acaaaaactc aaaatttctt ctataaagta acaaaacttt 240
tat 243
<210> 6
<211> 314
<212> DNA
<213> 3’末端piggyBac转座元件基因序列(Artificial Sequence)
<400> 6
tgatatctat aacaagaaaa tatatatata ataagttatc acgtaagtag aacatgaaat 60
aacaatataa ttatcgtatg agttaaatct taaaagtcac gtaaaagata atcatgcgtc 120
attttgactc acgcggtcgt tatagttcaa aatcagtgac acttaccgca ttgacaagca 180
cgcctcacgg gagctccaag cggcgactga gatgtcctaa atgcacagcg acggattcgc 240
gctatttaga aagagagagc aatatttcaa gaatgcatgc gtcaatttta cgcagactat 300
ctttctaggg ttaa 314
<210> 7
<211> 2937
<212> DNA
<213> 编码N-IRES-Cre基因序列(Artificial Sequence)
<400> 7
atgtctgata atggacccca aaatcagcga aatgcacccc gcattacgtt tggtggaccc 60
tcagattcaa ctggcagtaa ccagaatgga gaacgcagtg gggcgcgatc aaaacaacgt 120
cggccccaag gtttacccaa taatactgcg tcttggttca ccgctctcac tcaacatggc 180
aaggaagacc ttaaattccc tcgaggacaa ggcgttccaa ttaacaccaa tagcagtcca 240
gatgaccaaa ttggctacta ccgaagagct accagacgaa ttcgtggtgg tgacggtaaa 300
atgaaagatc tcagtccaag atggtatttc tactacctag gaactgggcc agaagctgga 360
cttccctatg gtgctaacaa agacggcatc atatgggttg caactgaggg agccttgaat 420
acaccaaaag atcacattgg cacccgcaat cctgctaaca atgctgcaat cgtgctacaa 480
cttcctcaag gaacaacatt gccaaaaggc ttctacgcag aagggagcag aggcggcagt 540
caagcctctt ctcgttcctc atcacgtagt cgcaacagtt caagaaattc aactccaggc 600
agcagtaggg gaacttctcc tgctagaatg gctggcaatg gcggtgatgc tgctcttgct 660
ttgctgctgc ttgacagatt gaaccagctt gagagcaaaa tgtctggtaa aggccaacaa 720
caacaaggcc aaactgtcac taagaaatct gctgctgagg cttctaagaa gcctcggcaa 780
aaacgtactg ccactaaagc atacaatgta acacaagctt tcggcagacg tggtccagaa 840
caaacccaag gaaattttgg ggaccaggaa ctaatcagac aaggaactga ttacaaacat 900
tggccgcaaa ttgcacaatt tgcccccagc gcttcagcgt tcttcggaat gtcgcgcatt 960
ggcatggaag tcacaccttc gggaacgtgg ttgacctaca caggtgccat caaattggat 1020
gacaaagatc caaatttcaa agatcaagtc attttgctga ataagcatat tgacgcatac 1080
aaaacattcc caccaacaga gcctaaaaag gacaaaaaga agaaggctga tgaaactcaa 1140
gccttaccgc agagacagaa gaaacagcaa actgtgactc ttcttcctgc tgcagatttg 1200
gatgatttct ccaaacaatt gcaacaatcc atgagcagtg ctgactcaac tcaggcctaa 1260
gcccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa taaggccggt 1320
gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat gtgagggccc 1380
ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct ctcgccaaag 1440
gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct tcttgaagac 1500
aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc gacaggtgcc 1560
tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa ccccagtgcc 1620
acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc gtattcaaca 1680
aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg gggcctcggt 1740
gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc ccgaaccacg 1800
gggacgtggt tttcctttga aaaacacgat gataatatgg ccacaatggg ccccaagaag 1860
aagaggaagg tgtccaattt actgaccgta caccaaaatt tgcctgcatt accggtcgat 1920
gcaacgagtg atgaggttcg caagaacctg atggacatgt tcagggatcg ccaggcgttt 1980
tctgagcata cctggaaaat gcttctgtcc gtttgccggt cgtgggcggc atggtgcaag 2040
ttgaataacc ggaaatggtt tcccgcagaa cctgaagatg ttcgcgatta tcttctatat 2100
cttcaggcgc gcggtctggc agtaaaaact atccagcaac atttgggcca gctaaacatg 2160
cttcatcgtc ggtccgggct gccacgacca agtgacagca atgctgtttc actggttatg 2220
cggcggatcc gaaaagaaaa cgttgatgcc ggtgaacgtg caaaacaggc tctagcgttc 2280
gaacgcactg atttcgacca ggttcgttca ctcatggaaa atagcgatcg ctgccaggat 2340
atacgtaatc tggcatttct ggggattgct tataacaccc tgttacgtat agccgaaatt 2400
gccaggatca gggttaaaga tatctcacgt actgacggtg ggagaatgtt aatccatatt 2460
ggcagaacga aaacgctggt tagcaccgca ggtgtagaga aggcacttag cctgggggta 2520
actaaactgg tcgagcgatg gatttccgtc tctggtgtag ctgatgatcc gaataactac 2580
ctgttttgcc gggtcagaaa aaatggtgtt gccgcgccat ctgccaccag ccagctatca 2640
actcgcgccc tggaagggat ttttgaagca actcatcgat tgatttacgg cgctaaggat 2700
gactctggtc agagatacct ggcctggtct ggacacagtg cccgtgtcgg agccgcgcga 2760
gatatggccc gcgctggagt ttcaataccg gagatcatgc aagctggtgg ctggaccaat 2820
gtaaatattg tcatgaacta tatccgtaac ctggatagtg aaacaggggc aatggtgcgc 2880
ctgctggaag atggtgatgg aggaggaagc gattataaag atgatgatga taaataa 2937
<210> 8
<211> 1785
<212> DNA
<213> 编码piggyBac转座酶基因序列(Artificial Sequence)
<400> 8
atgggctcta gcctggacga cgagcacatc ctgagcgccc tgctgcagag cgacgacgaa 60
ctggtgggcg aggacagcga cagcgaggtc agcgaccacg tgtccgagga cgacgtgcag 120
tccgacaccg aggaagcctt catcgacgag gtgcacgaag tgcagcctac cagcagcggc 180
tccgagatcc tggacgagca gaacgtgatc gagcagcctg gcagctccct ggccagcaac 240
agaatcctga ccctgcccca gagaaccatc agaggcaaga acaagcactg ctggtccacc 300
tccaagagca ccaggcggag cagagtgtcc gccctgaaca tcgtgcggag ccagaggggc 360
cccaccagaa tgtgcagaaa catctacgac cccctgctgt gcttcaagct gttcttcacc 420
gacgagatca tcagcgagat cgtgaagtgg accaacgccg agatcagcct gaagaggcgg 480
gagagcatga ccagcgccac cttcagagac accaacgagg acgagatcta cgccttcttc 540
ggcatcctgg tgatgaccgc cgtgagaaag gacaaccaca tgagcaccga cgacctgttc 600
gacagatccc tgagcatggt gtacgtgtcc gtgatgagca gagacagatt cgacttcctg 660
atcagatgcc tgagaatgga cgacaagagc atcagaccca ccctgcggga gaacgacgtg 720
ttcacccccg tgcggaagat ctgggacctg ttcatccacc agtgcatcca gaactacacc 780
cctggcgccc acctgaccat cgatgagcag ctgctgggct tcagaggcag atgccccttc 840
agagtgtaca tccccaacaa gcccagcaag tacggcatca agatcctgat gatgtgcgac 900
agcggcacca agtacatgat caacggcatg ccctacctgg gcagaggcac ccagacaaac 960
ggcgtgcccc tgggcgagta ctacgtgaaa gaactgagca agcctgtgca tggcagctgc 1020
aggaacatca cctgcgacaa ctggttcacc agcatccccc tggccaagaa cctgctgcag 1080
gaaccctaca agctgaccat cgtgggcacc gtgcggagca acaagcggga gatcccagag 1140
gtgctgaaga acagcagatc cagacctgtg ggaacaagca tgttctgctt cgacggcccc 1200
ctgaccctgg tgtcctacaa gcccaagccc gccaagatgg tgtacctgct gtccagctgc 1260
gacgaggacg ccagcatcaa cgagagcacc ggcaagcccc agatggtgat gtactacaac 1320
cagaccaagg gcggcgtgga caccctggac cagatgtgca gcgtgatgac ctgcagcaga 1380
aagaccaaca gatggcccat ggccctgctg tacggcatga tcaatatcgc ctgcatcaac 1440
agcttcatca tctacagcca caacgtgtcc agcaagggcg agaaggtgca gagccggaag 1500
aaattcatgc ggaacctgta catgagcctg acctccagct tcatgagaaa gagactggaa 1560
gcccccaccc tgaagagata cctgcgggac aacatcagca acatcctgcc caaggaagtg 1620
ccaggaacaa gcgacgacag caccgaggaa cccgtgatga agaagaggac ctactgcacc 1680
tactgtccca gcaagatcag aagaaaggcc aacgccagct gcaagaaatg caaaaaagtg 1740
atctgccggg agcacaacat cgacatgtgc cagagctgtt tctga 1785
<210> 9
<211> 36356
<212> DNA
<213> pBAC-rSARS-CoV-2复制子质粒全序列(Artificial Sequence)
<400> 9
gcggccgcaa ggggttcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 60
cggcatcaga gcagattgta ctgagagtgc acgctagctt gaacccgtgg aggacgggca 120
gactcgcggt gcaaatgtgt tttacagcgt gatggagcag atgaagatgc tcgacacgct 180
gcagaacacg cagctagatt aaccctagaa agataatcat attgtgacgt acgttaaaga 240
taatcatgcg taaaattgac gcatgtgttt tatcggtctg tatatcgagg tttatttatt 300
aatttgaata gatattaagt tttattatat ttacacttac atactaataa taaattcaac 360
aaacaattta tttatgttta tttatttatt aaaaaaaaac aaaaactcaa aatttcttct 420
ataaagtaac aaaactttta tgagggacag ccccccccca aagcccccag ggatgtaatt 480
acgtccctcc cccgctaggg ggcagcagcg agccgcccgg ggctccgctc cggtccggcg 540
ctccccccgc atccccgagc cggcagcgtg cggggacagc ccgggcacgg ggaaggtggc 600
acgggatcgc tttcctctga acgcttctcg ctgctctttg agcctgcaga cacctggggg 660
gatacgggga aaaggcctcc aaggcctact agtattatgc ccagtacatg accttatggg 720
actttcctac ttggcagtac atctacgtat tagtcatcgc tattaccatg gttgacattg 780
attattgact agttattaat agtaatcaat tacggggtca ttagttcata gcccatatat 840
ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc ccaacgaccc 900
ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag ggactttcca 960
ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac atcaagtgta 1020
tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg cctggcatta 1080
tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg tattagtcat 1140
cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat agcggtttga 1200
ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt tttggcacca 1260
aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc aaatgggcgg 1320
taggcgtgta cggtgggagg tctatataag cagagctcgt ttagtgaacc gtattaaagg 1380
tttatacctt cccaggtaac aaaccaacca actttcgatc tcttgtagat ctgttctcta 1440
aacgaacttt aaaatctgtg tggctgtcac tcggctgcat gcttagtgca ctcacgcagt 1500
ataattaata actaattact gtcgttgaca ggacacgagt aactcgtcta tcttctgcag 1560
gctgcttacg gtttcgtccg tgttgcagcc gatcatcagc acatctaggt ttcgtccggg 1620
tgtgaccgaa aggtaagatg gagagccttg tccctggttt caacgagaaa acacacgtcc 1680
aactcagttt gcctgtttta caggtaagta tcaaggttac aagacaggtt ataaggagac 1740
caatagaaac tgggcttgtc gagataactt cgtataatgt atgctatacg aagttatccg 1800
gatccggcgc aacaaacttc tctctgctga aacaagccgg agatgtcgaa gagaatcctg 1860
gaccggccaa gcctttgtct caagaagaat ccaccctcat tgaaagagca acggctacaa 1920
tcaacagcat ccccatctct gaagactaca gcgtcgccag cgcagctctc tctagcgacg 1980
gccgcatctt cactggtgtc aatgtatatc attttactgg gggaccttgt gcagaactcg 2040
tggtgctggg cactgctgct gctgcggcag ctggcaacct gacttgtatc gtcgcgatcg 2100
gaaatgagaa caggggcatc ttgagcccct gcggacggtg ccgacaggtg cttctcgatc 2160
tgcatcctgg gatcaaagcc atagtgaagg acagtgatgg acagccgacg gcagttggga 2220
ttcgtgaatt gctgccctct ggttatgtgt gggagggcta actggagttc ttcgcccacc 2280
ccaacttgtt tattgcagct tataatggtt acaaataaag caatagcatc acaaatttca 2340
caaataaagc atttttttca ctgcattcta gttgtggttt gtccaaactc atcaatgtat 2400
cttatcatgt ctgaaacccg ctgatcagcc tcgactgtgc cttctagttg ccagccatct 2460
gttgtttgcc cctcccccgt gccttccttg accctggaag gtgccactcc cactgtcctt 2520
tcctaataaa atgaggaaat tgcatcgcat tgtctgagta ggtgtcattc tattctgggg 2580
ggtggggtgg ggcaggacag caagggggag gattgggaag acaatagcag gcatgctggg 2640
gatgcggtgg gctctatgga taacttcgta taatgtatgc tatacgaagt tatcagagaa 2700
gactcttgcg tttctgatag gcacctattg gtcttactga catccacttt gcctttctct 2760
ccacaggttc gcgacgtgct cgtacgtggc tttggagact ccgtggagga ggtcttatca 2820
gaggcacgtc aacatcttaa agatggcact tgtggcttag tagaagttga aaaaggcgtt 2880
ttgcctcaac ttgaacagcc ctatgtgttc atcaaacgtt cggatgctcg aactgcacct 2940
catggtcatg ttatggttga gctggtagca gaactcgaag gcattcagta cggtcgtagt 3000
ggtgagacac ttggtgtcct tgtccctcat gtgggcgaaa taccagtggc ttaccgcaag 3060
gttcttcttc gtaagaacgg taataaagga gctggtggcc atagttacgg cgccgatcta 3120
aagtcatttg acttaggcga cgagcttggc actgatcctt atgaagattt tcaagaaaac 3180
tggaacacta aacatagcag tggtgttacc cgtgaactca tgcgtgagct taacggaggg 3240
gcatacactc gctatgtcga taacaacttc tgtggccctg atggctaccc tcttgagtgc 3300
attaaagacc ttctagcacg tgctggtaaa gcttcatgca ctttgtccga acaactggac 3360
tttattgaca ctaagagggg tgtatactgc tgccgtgaac atgagcatga aattgcttgg 3420
tacacggaac gttctgaaaa gagctatgaa ttgcagacac cttttgaaat taaattggca 3480
aagaaatttg acaccttcaa tggggaatgt ccaaattttg tatttccctt aaattccata 3540
atcaagacta ttcaaccaag ggttgaaaag aaaaagcttg atggctttat gggtagaatt 3600
cgatctgtct atccagttgc gtcaccaaat gaatgcaacc aaatgtgcct ttcaactctc 3660
atgaagtgtg atcattgtgg tgaaacttca tggcagacgg gcgattttgt taaagccact 3720
tgcgaatttt gtggcactga gaatttgact aaagaaggtg ccactacttg tggttactta 3780
ccccaaaatg ctgttgttaa aatttattgt ccagcatgtc acaattcaga agtaggacct 3840
gagcatagtc ttgccgaata ccataatgaa tctggcttga aaaccattct tcgtaagggt 3900
ggtcgcacta ttgcctttgg aggctgtgtg ttctcttatg ttggttgcca taacaagtgt 3960
gcctattggg ttccacgtgc tagcgctaac ataggttgta accatacagg tgttgttgga 4020
gaaggttccg aaggtcttaa tgacaacctt cttgaaatac tccaaaaaga gaaagtcaac 4080
atcaatattg ttggtgactt taaacttaat gaagagatcg ccattatttt ggcatctttt 4140
tctgcttcca caagtgcttt tgtggaaact gtgaaaggtt tggattataa agcattcaaa 4200
caaattgttg aatcctgtgg taattttaaa gttacaaaag gaaaagctaa aaaaggtgcc 4260
tggaatattg gtgaacagaa atcaatactg agtcctcttt atgcatttgc atcagaggct 4320
gctcgtgttg tacgatcaat tttctcccgc actcttgaaa ctgctcaaaa ttctgtgcgt 4380
gttttacaga aggccgctat aacaatacta gatggaattt cacagtattc actgagactc 4440
attgatgcta tgatgttcac atctgatttg gctactaaca atctagttgt aatggcctac 4500
attacaggtg gtgttgttca gttgacttcg cagtggctaa ctaacatctt tggcactgtt 4560
tatgaaaaac tcaaacccgt ccttgattgg cttgaagaga agtttaagga aggtgtagag 4620
tttcttagag acggttggga aattgttaaa tttatctcaa cctgtgcttg tgaaattgtc 4680
ggtggacaaa ttgtcacctg tgcaaaggaa attaaggaga gtgttcagac attctttaag 4740
cttgtaaata aatttttggc tttgtgtgct gactctatca ttattggtgg agctaaactt 4800
aaagccttga atttaggtga aacatttgtc acgcactcaa agggattgta cagaaagtgt 4860
gttaaatcca gagaagaaac tggcctactc atgcctctaa aagccccaaa agaaattatc 4920
ttcttagagg gagaaacact tcccacagaa gtgttaacag aggaagttgt cttgaaaact 4980
ggtgatttac aaccattaga acaacctact agtgaagctg ttgaagctcc attggttggt 5040
acaccagttt gtattaacgg gcttatgttg ctcgaaatca aagacacaga aaagtactgt 5100
gcccttgcac ctaatatgat ggtaacaaac aataccttca cactcaaagg cggtgcacca 5160
acaaaggtta cttttggtga tgacactgtg atagaagtgc aaggttacaa gagtgtgaat 5220
atcacttttg aacttgatga aaggattgat aaagtactta atgagaagtg ctctgcctat 5280
acagttgaac tcggtacaga agtaaatgag ttcgcctgtg ttgtggcaga tgctgtcata 5340
aaaactttgc aaccagtatc tgaattactt acaccactgg gcattgattt agatgagtgg 5400
agtatggcta catactactt atttgatgag tctggtgagt ttaaattggc ttcacatatg 5460
tattgttctt tctaccctcc agatgaggat gaagaagaag gtgattgtga agaagaagag 5520
tttgagccat caactcaata tgagtatggt actgaagatg attaccaagg taaacctttg 5580
gaatttggtg ccacttctgc tgctcttcaa cctgaagaag agcaagaaga agattggtta 5640
gatgatgata gtcaacaaac tgttggtcaa caagacggca gtgaggacaa tcagacaact 5700
actattcaaa caattgttga ggttcaacct caattagaga tggaacttac accagttgtt 5760
cagactattg aagtgaatag ttttagtggt tatttaaaac ttactgacaa tgtatacatt 5820
aaaaatgcag acattgtgga agaagctaaa aaggtaaaac caacagtggt tgttaatgca 5880
gccaatgttt accttaaaca tggaggaggt gttgcaggag ccttaaataa ggctactaac 5940
aatgccatgc aagttgaatc tgatgattac atagctacta atggaccact taaagtgggt 6000
ggtagttgtg ttttaagcgg acacaatctt gctaaacact gtcttcatgt tgtcggccca 6060
aatgttaaca aaggtgaaga cattcaactt cttaagagtg cttatgaaaa ttttaatcag 6120
cacgaagttc tacttgcacc attattatca gctggtattt ttggtgctga ccctatacat 6180
tctttaagag tttgtgtaga tactgttcgc acaaatgtct acttagctgt ctttgataaa 6240
aatctctatg acaaacttgt ttcaagcttt ttggaaatga agagtgaaaa gcaagttgaa 6300
caaaagatcg ctgagattcc taaagaggaa gttaagccat ttataactga aagtaaacct 6360
tcagttgaac agagaaaaca agatgataag aaaatcaaag cttgtgttga agaagttaca 6420
acaactctgg aagaaactaa gttcctcaca gaaaacttgt tactttatat tgacattaat 6480
ggcaatcttc atccagattc tgccactctt gttagtgaca ttgacatcac tttcttaaag 6540
aaagatgctc catatatagt gggtgatgtt gttcaagagg gtgttttaac tgctgtggtt 6600
atacctacta aaaaggctgg tggcactact gaaatgctag cgaaagcttt gagaaaagtg 6660
ccaacagaca attatataac cacttacccg ggtcagggtt taaatggtta cactgtagag 6720
gaggcaaaga cagtgcttaa aaagtgtaaa agtgcctttt acattctacc atctattatc 6780
tctaatgaga agcaagaaat tcttggaact gtttcttgga atttgcgaga aatgcttgca 6840
catgcagaag aaacacgcaa attaatgcct gtctgtgtgg aaactaaagc catagtttca 6900
actatacagc gtaaatataa gggtattaaa atacaagagg gtgtggttga ttatggtgct 6960
agattttact tttacaccag taaaacaact gtagcgtcac ttatcaacac acttaacgat 7020
ctaaatgaaa ctcttgttac aatgccactt ggctatgtaa cacatggctt aaatttggaa 7080
gaagctgctc ggtatatgag atctctcaaa gtgccagcta cagtttctgt ttcttcacct 7140
gatgctgtta cagcgtataa tggttatctt acttcttctt ctaaaacacc tgaagaacat 7200
tttattgaaa ccatctcact tgctggttcc tataaagatt ggtcctattc tggacaatct 7260
acacaactag gtatagaatt tcttaagaga ggtgataaaa gtgtatatta cactagtaat 7320
cctaccacat tccacctaga tggtgaagtt atcacctttg acaatcttaa gacacttctt 7380
tctttgagag aagtgaggac tattaaggtg tttacaacag tagacaacat taacctccac 7440
acgcaagttg tggacatgtc aatgacatat ggacaacagt ttggtccaac ttatttggat 7500
ggagctgatg ttactaaaat aaaacctcat aattcacatg aaggtaaaac attttatgtt 7560
ttacctaatg atgacactct acgtgttgag gcttttgagt actaccacac aactgatcct 7620
agttttctgg gtaggtacat gtcagcatta aatcacacta aaaagtggaa atacccacaa 7680
gttaatggtt taacttctat taaatgggca gataacaact gttatcttgc cactgcattg 7740
ttaacactcc aacaaataga gttgaagttt aatccacctg ctctacaaga tgcttattac 7800
agagcaaggg ctggtgaagc tgctaacttt tgtgcactta tcttagccta ctgtaataag 7860
acagtaggtg agttaggtga tgttagagaa acaatgagtt acttgtttca acatgccaat 7920
ttagattctt gcaaaagagt cttgaacgtg gtgtgtaaaa cttgtggaca acagcagaca 7980
acccttaagg gtgtagaagc tgttatgtac atgggcacac tttcttatga acaatttaag 8040
aaaggtgttc agataccttg tacgtgtggt aaacaagcta caaaatatct agtacaacag 8100
gagtcacctt ttgttatgat gtcagcacca cctgctcagt atgaacttaa gcatggtaca 8160
tttacttgtg ctagtgagta cactggtaat taccagtgtg gtcactataa acatataact 8220
tctaaagaaa ctttgtattg catagacggt gctttactta caaagtcctc agaatacaaa 8280
ggtcctatta cggatgtttt ctacaaagaa aacagttaca caacaaccat aaaaccagtt 8340
acttataaat tggatggtgt tgtttgtaca gaaattgacc ctaagttgga caattattat 8400
aagaaagaca attcttattt cacagagcaa ccaattgatc ttgtaccaaa ccaaccatat 8460
tcaaacgcaa gcttcgataa ttttaagttt gtatgtgata atatcaaatt tgctgatgat 8520
ttaaaccagt taactggtta taagaaacct gcttcaagag agcttaaagt tacatttttc 8580
cctgacttaa atggtgatgt ggtggctatt gattataaac actacacacc ctcttttaag 8640
aaaggagcta aattgttaca taaacctatt gtttggcatg ttaacaatgc aactaataaa 8700
gccacgtata aaccaaatac ctggtgtata cgttgtcttt ggagcacaaa accagttgaa 8760
acatcaaatt cgtttgatgt actgaagtca gaggacgcgc agggaatgga taatcttgcc 8820
tgcgaagatc taaaaccagt ctctgaagaa gtagtggaaa atcctaccat acagaaagac 8880
gttcttgagt gtaatgtgaa aactaccgaa gttgtaggag acattatact taaaccagca 8940
aataatagtt taaaaattac agaagaggtt ggccacacag atctaatggc tgcttatgta 9000
gacaattcta gtcttactat taagaaacct aatgaattat ctagagtatt aggtttgaaa 9060
acccttgcta ctcatggttt agctgctgtt aatagtgtcc cttgggatac tatagctaat 9120
tatgctaagc cttttcttaa caaagttgtt agtacaacta ctaacatagt tacacggtgt 9180
ttaaaccgtg tttgtactaa ttatatgcct tatttcttta ctttattgct acaattgtgt 9240
acttttacta gaagtacaaa ttctagaatt aaagcatcta tgccgactac tatagcaaag 9300
aatactgtta agagtgtcgg taaattttgt ctagaggctt catttaatta tttgaagtca 9360
cctaattttt ctaaactgat aaatattata atttggtttt tactattaag tgtttgccta 9420
ggttctttaa tctactcaac cgctgcttta ggtgttttaa tgtctaattt aggcatgcct 9480
tcttactgta ctggttacag agaaggctat ttgaactcta ctaatgtcac tattgcaacc 9540
tactgtactg gttctatacc ttgtagtgtt tgtcttagtg gtttagattc tttagacacc 9600
tatccttctt tagaaactat acaaattacc atttcatctt ttaaatggga tttaactgct 9660
tttggcttag ttgcagagtg gtttttggca tatattcttt tcactaggtt tttctatgta 9720
cttggattgg ctgcaatcat gcaattgttt ttcagctatt ttgcagtaca ttttattagt 9780
aattcttggc ttatgtggtt aataattaat cttgtacaaa tggccccgat ttcagctatg 9840
gttagaatgt acatcttctt tgcatcattt tattatgtat ggaaaagtta tgtgcatgtt 9900
gtagacggtt gtaattcatc aacttgtatg atgtgttaca aacgtaatag agcaacaaga 9960
gtcgaatgta caactattgt taatggtgtt agaaggtcct tttatgtcta tgctaatgga 10020
ggtaaaggct tttgcaaact acacaattgg aattgtgtta attgtgatac attctgtgct 10080
ggtagtacat ttattagtga tgaagttgcg agagacttgt cactacagtt taaaagacca 10140
ataaatccta ctgaccagtc ttcttacatc gttgatagtg ttacagtgaa gaatggttcc 10200
atccatcttt actttgataa agctggtcaa aagacttatg aaagacattc tctctctcat 10260
tttgttaact tagacaacct gagagctaat aacactaaag gttcattgcc tattaatgtt 10320
atagtttttg atggtaaatc aaaatgtgaa gaatcatctg caaaatcagc gtctgtttac 10380
tacagtcagc ttatgtgtca acctatactg ttactagatc aggcattagt gtctgatgtt 10440
ggtgatagtg cggaagttgc agttaaaatg tttgatgctt acgttaatac gttttcatca 10500
acttttaacg taccaatgga aaaactcaaa acactagttg caactgcaga agctgaactt 10560
gcaaagaatg tgtccttaga caatgtctta tctactttta tttcagcagc tcggcaaggg 10620
tttgttgatt cagatgtaga aactaaagat gttgttgaat gtcttaaatt gtcacatcaa 10680
tctgacatag aagttactgg cgatagttgt aataactata tgctcaccta taacaaagtt 10740
gaaaacatga caccccgtga ccttggtgct tgtattgact gtagtgcgcg tcatattaat 10800
gcgcaggtag caaaaagtca caacattgct ttgatatgga acgttaaaga tttcatgtca 10860
ttgtctgaac aactacgaaa acaaatacgt agtgctgcta aaaagaataa cttacctttt 10920
aagttgacat gtgcaactac tagacaagtt gttaatgttg taacaacaaa gatagcactt 10980
aagggtggta aaattgttaa taattggttg aagcagttaa ttaaagttac acttgtgttc 11040
ctttttgttg ctgctatttt ctatttaata acacctgttc atgtcatgtc taaacatact 11100
gacttttcaa gtgaaatcat aggatacaag gctattgatg gtggtgtcac tcgtgacata 11160
gcatctacag atacttgttt tgctaacaaa catgctgatt ttgacacatg gtttagccag 11220
cgtggtggta gttatactaa tgacaaagct tgcccattga ttgctgcagt cataacaaga 11280
gaagtgggtt ttgtcgtgcc tggtttgcct ggcacgatat tacgcacaac taatggtgac 11340
tttttgcatt tcttacctag agtttttagt gcagttggta acatctgtta cacaccatca 11400
aaacttatag agtacactga ctttgcaaca tcagcttgtg ttttggctgc tgaatgtaca 11460
atttttaaag atgcttctgg taagccagta ccatattgtt atgataccaa tgtactagaa 11520
ggttctgttg cttatgaaag tttacgccct gacacacgtt atgtgctcat ggatggctct 11580
attattcaat ttcctaacac ctaccttgaa ggttctgtta gagtggtaac aacttttgat 11640
tctgagtact gtaggcacgg cacttgtgaa agatcagaag ctggtgtttg tgtatctact 11700
agtggtagat gggtacttaa caatgattat tacagatctt taccaggagt tttctgtggt 11760
gtagatgctg taaatttact tactaatatg tttacaccac taattcaacc tattggtgct 11820
ttggacatat cagcatctat agtagctggt ggtattgtag ctatcgtagt aacatgcctt 11880
gcctactatt ttatgaggtt tagaagagct tttggtgaat acagtcatgt agttgccttt 11940
aatactttac tattccttat gtcattcact gtactctgtt taacaccagt ttactcattc 12000
ttacctggtg tttattctgt tatttacttg tacttgacat tttatcttac taatgatgtt 12060
tcttttttag cacatattca gtggatggtt atgttcacac ctttagtacc tttctggata 12120
acaattgctt atatcatttg tatttccaca aagcatttct attggttctt tagtaattac 12180
ctaaagagac gtgtagtctt taatggtgtt tcctttagta cttttgaaga agctgcgctg 12240
tgcacctttt tgttaaataa agaaatgtat ctaaagttgc gtagtgatgt gctattacct 12300
cttacgcaat ataatagata cttagctctt tataataagt acaagtattt tagtggagca 12360
atggatacaa ctagctacag agaagctgct tgttgtcatc tcgcaaaggc tctcaatgac 12420
ttcagtaact caggttctga tgttctttac caaccaccac aaacctctat cacctcagct 12480
gttttgcaga gtggttttag aaaaatggca ttcccatctg gtaaagttga gggttgtatg 12540
gtacaagtaa cttgtggtac aactacactt aacggtcttt ggcttgatga cgtagtttac 12600
tgtccaagac atgtgatctg cacctctgaa gacatgctta accctaatta tgaagattta 12660
ctcattcgta agtctaatca taatttcttg gtacaggctg gtaatgttca actcagggtt 12720
attggacatt ctatgcaaaa ttgtgtactt aagcttaagg ttgatacagc caatcctaag 12780
acacctaagt ataagtttgt tcgcattcaa ccaggacaga ctttttcagt gttagcttgt 12840
tacaatggtt caccatctgg tgtttaccaa tgtgctatga ggcccaattt cactattaag 12900
ggttcattcc ttaatggttc atgtggtagt gttggtttta acatagatta tgactgtgtc 12960
tctttttgtt acatgcacca tatggaatta ccaactggag ttcatgctgg cacagactta 13020
gaaggtaact tttatggacc ttttgttgac aggcaaacag cacaagcagc tggtacggac 13080
acaactatta cagttaatgt tttagcttgg ttgtacgctg ctgttataaa tggagacagg 13140
tggtttctca atcgatttac cacaactctt aatgacttta accttgtggc tatgaagtac 13200
aattatgaac ctctaacaca agaccatgtt gacatactag gacctctttc tgctcaaact 13260
ggaattgccg ttttagatat gtgtgcttca ttaaaagaat tactgcaaaa tggtatgaat 13320
ggacgtacca tattgggtag tgctttatta gaagatgaat ttacaccttt tgatgttgtt 13380
agacaatgct caggtgttac tttccaaagt gcagtgaaaa gaacaatcaa gggtacacac 13440
cactggttgt tactcacaat tttgacttca cttttagttt tagtccagag tactcaatgg 13500
tctttgttct tttttttgta tgaaaatgcc tttttacctt ttgctatggg tattattgct 13560
atgtctgctt ttgcaatgat gtttgtcaaa cataagcatg catttctctg tttgtttttg 13620
ttaccttctc ttgccactgt agcttatttt aatatggtct atatgcctgc tagttgggtg 13680
atgcgtatta tgacatggtt ggatatggtt gatactagtt tgtctggttt taagctaaaa 13740
gactgtgtta tgtatgcatc agctgtagtg ttactaatcc ttatgacagc aagaactgtg 13800
tatgatgatg gtgctaggag agtgtggaca cttatgaatg tcttgacact cgtttataaa 13860
gtttattatg gtaatgcttt agatcaagcc atttccatgt gggctcttat aatctctgtt 13920
acttctaact actcaggtgt agttacaact gtcatgtttt tggccagagg tattgttttt 13980
atgtgtgttg agtattgccc tattttcttc ataactggta atacacttca gtgtataatg 14040
ctagtttatt gtttcttagg ctatttttgt acttgttact ttggcctctt ttgtttactc 14100
aaccgctact ttagactgac tcttggtgtt tatgattact tagtttctac acaggagttt 14160
agatatatga attcacaggg actactccca cccaagaata gcatagatgc cttcaaactc 14220
aacattaaat tgttgggtgt tggtggcaaa ccttgtatca aagtagccac tgtacagtct 14280
aaaatgtcag atgtaaagtg cacatcagta gtcttactct cagttttgca acaactcaga 14340
gtagaatcat catctaaatt gtgggctcaa tgtgtccagt tacacaatga cattctctta 14400
gctaaagata ctactgaagc ctttgaaaaa atggtttcac tactttctgt tttgctttcc 14460
atgcagggtg ctgtagacat aaacaagctt tgtgaagaaa tgctggacaa cagggcaacc 14520
ttacaagcta tagcctcaga gtttagttcc cttccatcat atgcagcttt tgctactgct 14580
caagaagctt atgagcaggc tgttgctaat ggtgattctg aagttgttct taaaaagttg 14640
aagaagtctt tgaatgtggc taaatctgaa tttgaccgtg atgcagccat gcaacgtaag 14700
ttggaaaaga tggctgatca agctatgacc caaatgtata aacaggctag atctgaggac 14760
aagagggcaa aagttactag tgctatgcag acaatgcttt tcactatgct tagaaagttg 14820
gataatgatg cactcaacaa cattatcaac aatgcaagag atggttgtgt tcccttgaac 14880
ataatacctc ttacaacagc agccaaatta atggttgtca taccagacta taacacatat 14940
aaaaatacgt gtgatggtac aacatttact tatgcatcag cattgtggga aatccaacag 15000
gttgtagatg cagatagtaa aattgttcaa cttagtgaaa ttagtatgga caattcacct 15060
aatttagcat ggcctcttat tgtaacagct ttaagggcca attctgctgt caaattacag 15120
aataatgagc ttagtcctgt tgcactacga cagatgtctt gtgctgccgg tactacacaa 15180
actgcttgca ctgatgacaa tgcgttagct tactacaaca caacaaaggg aggtaggttt 15240
gtacttgcac tgttatccga tttacaggat ttgaaatggg ctagattccc taagagtgat 15300
ggaactggta ctatctatac agaactggaa ccaccttgta ggtttgttac agacacacct 15360
aaaggtccta aagtgaagta tttatacttt attaaaggat taaacaacct aaatagaggt 15420
atggtacttg gtagtttagc tgccacagta cgtctacaag ctggtaatgc aacagaagtg 15480
cctgccaatt caactgtatt atctttctgt gcttttgctg tagatgctgc taaagcttac 15540
aaagattatc tagctagtgg gggacaacca atcactaatt gtgttaagat gttgtgtaca 15600
cacactggta ctggtcaggc aataacagtt acaccggaag ccaatatgga tcaagaatcc 15660
tttggtggtg catcgtgttg tctgtactgc cgttgccaca tagatcatcc aaatcctaaa 15720
ggattttgtg acttaaaagg taagtatgta caaataccta caacttgtgc taatgaccct 15780
gtgggtttta cacttaaaaa cacagtctgt accgtctgcg gtatgtggaa aggttatggc 15840
tgtagttgtg atcaactccg cgaacccatg cttcagtcag ctgatgcaca atcgttttta 15900
aacgggtttg cggtgtaagt gcagcccgtc ttacaccgtg cggcacaggc actagtactg 15960
atgtcgtata cagggctttt gacatctaca atgataaagt agctggtttt gctaaattcc 16020
taaaaactaa ttgttgtcgc ttccaagaaa aggacgaaga tgacaattta attgattctt 16080
actttgtagt taagagacac actttctcta actaccaaca tgaagaaaca atttataatt 16140
tacttaagga ttgtccagct gttgctaaac atgacttctt taagtttaga atagacggtg 16200
acatggtacc acatatatca cgtcaacgtc ttactaaata cacaatggca gacctcgtct 16260
atgctttaag gcattttgat gaaggtaatt gtgacacatt aaaagaaata cttgtcacat 16320
acaattgttg tgatgatgat tatttcaata aaaaggactg gtatgatttt gtagaaaacc 16380
cagatatatt acgcgtatac gccaacttag gtgaacgtgt acgccaagct ttgttaaaaa 16440
cagtacaatt ctgtgatgcc atgcgaaatg ctggtattgt tggtgtactg acattagata 16500
atcaagatct caatggtaac tggtatgatt tcggtgattt catacaaacc acgccaggta 16560
gtggagttcc tgttgtagat tcttattatt cattgttaat gcctatatta accttgacca 16620
gggctttaac tgcagagtca catgttgaca ctgacttaac aaagccttac attaagtggg 16680
atttgttaaa atatgacttc acggaagaga ggttaaaact ctttgaccgt tattttaaat 16740
attgggatca gacataccac ccaaattgtg ttaactgttt ggatgacaga tgcattctgc 16800
attgtgcaaa ctttaatgtt ttattctcta cagtgttccc acctacaagt tttggaccac 16860
tagtgagaaa aatatttgtt gatggtgttc catttgtagt ttcaactgga taccacttca 16920
gagagctagg tgttgtacat aatcaggatg taaacttaca tagctctaga cttagtttta 16980
aggaattact tgtgtatgct gctgaccctg ctatgcacgc tgcttctggt aatctattac 17040
tagataaacg cactacgtgc ttttcagtag ctgcacttac taacaatgtt gcttttcaaa 17100
ctgtcaaacc cggtaatttt aacaaagact tctatgactt tgctgtgtct aagggtttct 17160
ttaaggaagg aagttctgtt gaattaaaac acttcttctt tgctcaggat ggtaatgctg 17220
ctatcagcga ttatgactac tatcgttata atctaccaac aatgtgtgat atcagacaac 17280
tactatttgt agttgaagtt gttgataagt actttgattg ttacgatggt ggctgtatta 17340
atgctaacca agtcatcgtc aacaacctag acaaatcagc tggttttcca tttaataaat 17400
ggggtaaggc tagactttat tatgattcaa tgagttatga ggatcaagat gcacttttcg 17460
catatacaaa acgtaatgtc atccctacta taactcaaat gaatcttaag tatgccatta 17520
gtgcaaagaa tagagctcgc accgtagctg gtgtctctat ctgtagtact atgaccaata 17580
gacagtttca tcaaaaatta ttgaaatcaa tagccgccac tagaggagct actgtagtaa 17640
ttggaacaag caaattctat ggtggttggc acaacatgtt aaaaactgtt tatagtgatg 17700
tagaaaaccc tcaccttatg ggttgggatt atcctaaatg tgatagagcc atgcctaaca 17760
tgcttagaat tatggcctca cttgttcttg ctcgcaaaca tacaacgtgt tgtagcttgt 17820
cacaccgttt ctatagatta gctaatgagt gtgctcaagt attgagtgaa atggtcatgt 17880
gtggcggttc actatatgtt aaaccaggtg gaacctcatc aggagatgcc acaactgctt 17940
atgctaatag tgtttttaac atttgtcaag ctgtcacggc caatgttaat gcacttttat 18000
ctactgatgg taacaaaatt gccgataagt atgtccgcaa tttacaacac agactttatg 18060
agtgtctcta tagaaataga gatgttgaca cagactttgt gaatgagttt tacgcatatt 18120
tgcgtaaaca tttctcaatg atgatactct ctgacgatgc tgttgtgtgt ttcaatagca 18180
cttatgcatc tcaaggtcta gtggctagca taaagaactt taagtcagtt ctttattatc 18240
aaaacaatgt ttttatgtct gaagcaaaat gttggactga gactgacctt actaaaggac 18300
ctcatgaatt ttgctctcaa catacaatgc tagttaaaca gggtgatgat tatgtgtacc 18360
ttccttaccc agatccatca agaatcctag gggccggctg ttttgtagat gatatcgtaa 18420
aaacagatgg tacacttatg attgaacggt tcgtgtcttt agctatagat gcttacccac 18480
ttactaaaca tcctaatcag gagtatgctg atgtctttca tttgtactta caatacataa 18540
gaaagctaca tgatgagtta acaggacaca tgttagacat gtattctgtt atgcttacta 18600
atgataacac ttcaaggtat tgggaacctg agttttatga ggctatgtac acaccgcata 18660
cagtcttaca ggctgttggg gcttgtgttc tttgcaattc acagacttca ttaagatgtg 18720
gtgcttgcat acgtagacca ttcttatgtt gtaaatgctg ttacgaccat gtcatatcaa 18780
catcacataa attagtcttg tctgttaatc cgtatgtttg caatgctcca ggttgtgatg 18840
tcacagatgt gactcaactt tacttaggag gtatgagcta ttattgtaaa tcacataaac 18900
cacccattag ttttccattg tgtgctaatg gacaagtttt tggtttatat aaaaatacat 18960
gtgttggtag cgataatgtt actgacttta atgcaattgc aacatgtgac tggacaaatg 19020
ctggtgatta cattttagct aacacctgta ctgaaagact caagcttttt gcagcagaaa 19080
cgctcaaagc tactgaggag acatttaaac tgtcttatgg tattgctact gtacgtgaag 19140
tgctgtctga cagagaatta catctttcat gggaagttgg taaacctaga ccaccactta 19200
accgaaatta tgtctttact ggttatcgtg taactaaaaa cagtaaagta caaataggag 19260
agtacacctt tgaaaaaggt gactatggtg atgctgttgt ttaccgaggt acaacaactt 19320
acaaattaaa tgttggtgat tattttgtgc tgacatcaca tacagtaatg ccattaagtg 19380
cacctacact agtgccacaa gagcactatg ttagaattac tggcttatac ccaacactca 19440
atatctcaga tgagttttct agcaatgttg caaattatca aaaggttggt atgcaaaagt 19500
attctacact ccagggacca cctggtactg gtaagagtca ttttgctatt ggcctagctc 19560
tctactaccc ttctgctcgc atagtgtata cagcttgctc tcatgccgct gttgatgcac 19620
tatgtgagaa ggcattaaaa tatttgccta tagataaatg tagtagaatt atacctgcac 19680
gtgctcgtgt agagtgtttt gataaattca aagtgaattc aacattagaa cagtatgtct 19740
tttgtactgt aaatgcattg cctgagacga cagcagatat agttgtcttt gatgaaattt 19800
caatggccac aaattatgat ttgagtgttg tcaatgccag attacgtgct aagcactatg 19860
tgtacattgg cgaccctgct caattacctg caccacgcac attgctaact aagggcacac 19920
tagaaccaga atatttcaat tcagtgtgta gacttatgaa aactataggt ccagacatgt 19980
tcctcggaac ttgtcggcgt tgtcctgctg aaattgttga cactgtgagt gctttggttt 20040
atgataataa gcttaaagca cataaagaca aatcagctca atgctttaaa atgttttata 20100
agggtgttat cacgcatgat gtttcatctg caattaacag gccacaaata ggcgtggtaa 20160
gagaattcct tacacgtaac cctgcttgga gaaaagctgt ctttatttca ccttataatt 20220
cacagaatgc tgtagcctca aagattttgg gactaccaac tcaaactgtt gattcatcac 20280
agggctcaga atatgactat gtcatattca ctcaaaccac tgaaacagct cactcttgta 20340
atgtaaacag atttaatgtt gctattacca gagcaaaagt aggcatactt tgcataatgt 20400
ctgatagaga cctttatgac aagttgcaat ttacaagtct tgaaattcca cgtaggaatg 20460
tggcaacttt acaagctgaa aatgtaacag gactctttaa agattgtagt aaggtaatca 20520
ctgggttaca tcctacacag gcacctacac acctcagtgt tgacactaaa ttcaaaactg 20580
aaggtttatg tgttgacata cctggcatac ctaaggacat gacctataga agactcatct 20640
ctatgatggg ttttaaaatg aattatcaag ttaatggtta ccctaacatg tttatcaccc 20700
gcgaagaagc tataagacat gtacgtgcat ggattggctt cgatgtcgag gggtgtcatg 20760
ctactagaga agctgttggt accaatttac ctttacagct aggtttttct acaggtgtta 20820
acctagttgc tgtacctaca ggttatgttg atacacctaa taatacagat ttttccagag 20880
ttagtgctaa accaccgcct ggagatcaat ttaaacacct cataccactt atgtacaaag 20940
gacttccttg gaatgtagtg cgtataaaga ttgtacaaat gttaagtgac acacttaaaa 21000
atctctctga cagagtcgta tttgtcttat gggcacatgg ctttgagttg acatctatga 21060
agtattttgt gaaaatagga cctgagcgca cctgttgtct atgtgataga cgtgccacat 21120
gcttttccac tgcttcagac acttatgcct gttggcatca ttctattgga tttgattacg 21180
tctataatcc gtttatgatt gatgttcaac aatggggttt tacaggtaac ctacaaagca 21240
accatgatct gtattgtcaa gtccatggta atgcacatgt agctagttgt gatgcaatca 21300
tgactaggtg tctagctgtc cacgagtgct ttgttaagcg tgttgactgg actattgaat 21360
atcctataat tggtgatgaa ctgaagatta atgcggcttg tagaaaggtt caacacatgg 21420
ttgttaaagc tgcattatta gcagacaaat tcccagttct tcacgacatt ggtaacccta 21480
aagctattaa gtgtgtacct caagctgatg tagaatggaa gttctatgat gcacagcctt 21540
gtagtgacaa agcttataaa atagaagaat tattctattc ttatgccaca cattctgaca 21600
aattcacaga tggtgtatgc ctattttgga attgcaatgt cgatagatat cctgctaatt 21660
ccattgtttg tagatttgac actagagtgc tatctaacct taacttgcct ggttgtgatg 21720
gtggcagttt gtatgtaaat aaacatgcat tccacacacc agcttttgat aaaagtgctt 21780
ttgttaattt aaaacaatta ccatttttct attactctga cagtccatgt gagtctcatg 21840
gaaaacaagt agtgtcagat atagattatg taccactaaa gtctgctacg tgtataacac 21900
gttgcaattt aggtggtgct gtctgtagac atcatgctaa tgagtacaga ttgtatctcg 21960
atgcttataa catgatgatc tcagctggct ttagcttgtg ggtttacaaa caatttgata 22020
cttataacct ctggaacact tttacaagac ttcagagttt agaaaatgtg gcttttaatg 22080
ttgtaaataa gggacacttt gatggacaac agggtgaagt accagtttct atcattaata 22140
acactgttta cacaaaagtt gatggtgttg atgtagaatt gtttgaaaat aaaacaacat 22200
tacctgttaa tgtagcattt gagctttggg ctaagcgcaa cattaaacca gtaccagagg 22260
tgaaaatact caataatttg ggtgtggaca ttgctgctaa tactgtgatc tgggactaca 22320
aaagagatgc tccagcacat atatctacta ttggtgtttg ttctatgact gacatagcca 22380
agaaaccaac tgaaacgatt tgtgcaccac tcactgtctt ttttgatggt agagttgatg 22440
gtcaagtaga cttatttaga aatgcccgta atggtgttct tattacagaa ggtagtgtta 22500
aaggtttaca accatctgta ggtcccaaac aagctagtct taatggagtc acattaattg 22560
gagaagccgt aaaaacacag ttcaattatt ataagaaagt tgatggtgtt gtccaacaat 22620
tacctgaaac ttactttact cagagtagaa atttacaaga atttaaaccc aggagtcaaa 22680
tggaaattga tttcttagaa ttagctatgg atgaattcat tgaacggtat aaattagaag 22740
gctatgcctt cgaacatatc gtttatggag attttagtca tagtcagtta ggtggtttac 22800
atctactgat tggactagct aaacgtttta aggaatcacc ttttgaatta gaagatttta 22860
ttcctatgga cagtacagtt aaaaactatt tcataacaga tgcgcaaaca ggttcatcta 22920
agtgtgtgtg ttctgttatt gatttattac ttgatgattt tgttgaaata ataaaatccc 22980
aagatttatc tgtagtttct aaggttgtca aagtgactat tgactataca gaaatttcat 23040
ttatgctttg gtgtaaagat ggccatgtag aaacatttta cccaaaatta caatctagtc 23100
aagcgtggca accgggtgtt gctatgccta atctttacaa aatgcaaaga atgctattag 23160
aaaagtgtga ccttcaaaat tatggtgata gtgcaacatt acctaaaggc ataatgatga 23220
atgtcgcaaa atatactcaa ctgtgtcaat atttaaacac attaacatta gctgtaccct 23280
ataatatgag agttatacat tttggtgctg gttctgataa aggagttgca ccaggtacag 23340
ctgttttaag acagtggttg cctacgggta cgctgcttgt cgattcagat cttaatgact 23400
ttgtctctga tgcagattca actttgattg gtgattgtgc aactgtacat acagctaata 23460
aatgggatct cattattagt gatatgtacg accctaagac taaaaatgtt acaaaagaaa 23520
atgactctaa agagggtttt ttcacttaca tttgtgggtt tatacaacaa aagctagctc 23580
ttggaggttc cgtggctata aagataacag aacattcttg gaatgctgat ctttataagc 23640
tcatgggaca cttcgcatgg tggacagcct ttgttactaa tgtgaatgcg tcatcatctg 23700
aagcattttt aattggatgt aattatcttg gcaaaccacg cgaacaaata gatggttatg 23760
tcatgcatgc aaattacata ttttggagga atacaaatcc aattcagttg tcttcctatt 23820
ctttatttga catgagtaaa tttcccctta aattaagggg tactgctgtt atgtctttaa 23880
aagaaggtca aatcaatgat atgattttat ctcttcttag taaaggtaga cttataatta 23940
gagaaaacaa cagagttgtt atttctagtg atgttcttgt taacaactaa acgaacaatg 24000
tttgtttttc ttgttttatt gccactagtc tctagtcagt gtgttaatct tacaaccaga 24060
actcaattac cccctgcata cactaattct ttcacacgtg gttgctgcaa atttgatgaa 24120
gacgactctg agccagtgct caaaggagtc aaattacatt acacataaac gaacttatgg 24180
atttgtttat gagaatcttc acaattggaa ctgtaacttt gaagcaaggt gaaatcaagg 24240
atgctactcc ttcagatttt gttcgcgcta ctgcaacgat accgatacaa gcctcactcc 24300
ctttcggatg gcttattgtt ggcgttgcac ttcttgctgt ttttcagagc gcttccaaaa 24360
tcataaccct caaaaagaga tggcaactag cactctccaa gggtgttcac tttgtttgca 24420
acttgctgtt gttgtttgta acagtttact cacacctttt gctcgttgct gctggccttg 24480
aagccccttt tctctatctt tatgctttag tctacttctt gcagagtata aactttgtaa 24540
gaataataat gaggctttgg ctttgctgga aatgccgttc caaaaaccca ttactttatg 24600
atgccaacta ttttctttgc tggcatacta attgttacga ctattgtata ccttacaata 24660
gtgtaacttc ttcaattgtc attacttcag gtgatggcac aacaagtcct atttctgaac 24720
atgactacca gattggtggt tatactgaaa aatgggaatc tggagtaaaa gactgtgttg 24780
tattacacag ttacttcact tcagactatt accagctgta ctcaactcaa ttgagtacag 24840
acactggtgt tgaacatgtt accttcttca tctacaataa aattgttgat gagcctgaag 24900
aacatgtcca aattcacaca atcgacggtt catccggagt tgttaatcca gtaatggaac 24960
caatttatga tgaaccgacg acgactacta gcgtgccttt gtaagcacaa gctgatgagt 25020
acgaacttat gtactcattc gtttcggaag agacaggtac gttaatagtt aatagcgtac 25080
ttctttttct tgctttcgtg gtattcttgc tagttacact agccatcctt actgcgcttc 25140
gattgtgtgc gtactgctgc aatattgtta acgtgagtct tgtaaaacct tctttttacg 25200
tttactctcg tgttaaaaat ctgaattctt ctagagttcc tgatcttctg gtctaaacga 25260
actaaatatt atattagttt ttctgtttgg aactttaatt ttagccatgg cagattccaa 25320
cggtactatt accgttgaag agcttaaaaa gctccttgaa caatggaacc tagtaatagg 25380
tttcctattc cttacatgga tttgtcttct acaatttgcc tatgccaaca ggaataggtt 25440
tttgtatata attaagttaa ttttcctctg gctgttatgg ccagtaactt tagcttgttt 25500
tgtgcttgct gctgtttaca gaataaattg gatcaccggt ggaattgcta tcgcaatggc 25560
ttgtcttgta ggcttgatgt ggctcagcta cttcattgct tctttcagac tgtttgcgcg 25620
tacgcgttcc atgtggtcat tcaatccaga aactaacatt cttctcaacg tgccactcca 25680
tggcactatt ctgaccagac cgcttctaga aagtgaactc gtaatcggag ctgtgatcct 25740
tcgtggacat cttcgtattg ctggacacca tctaggacgc tgtgacatca aggacctgcc 25800
taaagaaatc actgttgcta catcacgaac gctttcttat tacaaattgg gagcttcgca 25860
gcgtgtagca ggtgactcag gttttgctgc atacagtcgc tacaggattg gcaactataa 25920
attaaacaca gaccattcca gtagcagtga caatattgct ttgcttgtac agtaagtgac 25980
aacagatgtt tcatctcgtt gactttcagg ttactatagc agagatatta ctaattatta 26040
tgaggacttt taaagtttcc atttggaatc ttgattacat cataaacctc ataattaaaa 26100
atttatctaa gtcactaact gagaataaat attctcaatt agatgaagag caaccaatgg 26160
agattgatta aacgaacatg aaaattattc ttttcttggc actgataaca ctcgctactt 26220
gtgagcttta tcactaccaa gagtgtgtta gaggtacaac agtactttta aaagaacctt 26280
gctcttctgg aacatacgag ggcaattcac catttcatcc tctagctgat aacaaatttg 26340
cactgacttg ctttagcact caatttgctt ttgcttgtcc tgacggcgta aaacacgtct 26400
atcagttacg tgccagatca gtttcaccta aactgttcat cagacaagag gaagttcaag 26460
aactttactc tccaattttt cttattgttg cggcaatagt gtttataaca ctttgcttca 26520
cactcaaaag aaagacagaa tgattgaact ttcattaatt gacttctatt tgtgcttttt 26580
agcctttctg ctattccttg ttttaattat gcttattatc ttttggttct cacttgaact 26640
gcaagatcat aatgaaactt gtcacgccta aacgaacatg aaatttcttg ttttcttagg 26700
aatcatcaca actgtagctg catttcacca agaatgtagt ttacagtcat gtactcaaca 26760
tcaaccatat gtagttgatg acccgtgtcc tattcacttc tattctaaat ggtatattag 26820
agtaggagct agaaaatcag cacctttaat tgaattgtgc gtggatgagg ctggttctaa 26880
atcacccatt cagtacatcg atatcggtaa ttatacagtt tcctgtttac cttttacaat 26940
taattgccag gaacctaaat tgggtagtct tgtagtgcgt tgttcgttct atgaagactt 27000
tttagagtat catgacgttc gtgttgtttt agatttcatc taaacgaaca aactaaaatg 27060
tctgataatg gaccccaaaa tcagcgaaat gcaccccgca ttacgtttgg tggaccctca 27120
gattcaactg gcagtaacca gaatggagaa cgcagtgtct tcacactcga agatttcgtt 27180
ggggactggc gacagacagc cggctacaac ctggaccaag tccttgaaca gggaggtgtg 27240
tccagtttgt ttcagaatct cggggtgtcc gtaactccga tccaaaggat tgtcctgagc 27300
ggtgaaaatg ggctgaagat cgacatccat gtcatcatcc cgtatgaagg tctgagcggc 27360
gaccaaatgg gccagatcga aaaaattttt aaggtggtgt accctgtgga tgatcatcac 27420
tttaaggtga tcctgcacta tggcacactg gtaatcgacg gggttacgcc gaacatgatc 27480
gactatttcg gacggccgta tgaaggcatc gccgtgttcg acggcaaaaa gatcactgta 27540
acagggaccc tgtggaacgg caacaaaatt atcgacgagc gcctgatcaa ccccgacggc 27600
tccctgctgt tccgagtaac catcaacgga gtgaccggct ggcggctgtg cgaacgcatt 27660
ctggcgtaac agaagaaaca gcaaactgtg actcttcttc ctgctgcaga tttggatgat 27720
ttctccaaac aattgcaaca atccatgagc agtgctgact caactcaggc ctaaactcat 27780
gcagaccaca caaggcagat gggctatata aacgttttcg cttttccgtt tacgatatat 27840
agtctactct tgtgcagaat gaattctcgt aactacatag cacaagtaga tgtagttaac 27900
tttaatctca catagcaatc tttaatcagt gtgtaacatt agggaggact tgaaagagcc 27960
accacatttt caccgaggcc acgcggagta cgatcgagtg tacagtgaac aatgctaggg 28020
agagctgcct atatggaaga gccctaatgt gtaaaattaa ttttagtagt gctatcccca 28080
tgtgatttta atagcttctt aggagaatga caaaaaaaaa aaaaaaaaaa aaaaaaaaaa 28140
aaaagggtcg gcatggcatc tccacctcct cgcggtccga cctgggcatc cgaaggagga 28200
cgcacgtcca ctcggatggc taagggagag ccgggcccgt ttaaacccgc tgatcatgtc 28260
tggaattgac tcaaatgatg tcaattagtc tatcagaagc tatctggtct cccttccggg 28320
ggacaagaca tccctgttta atatttaaac agcagtgttc ccaaactggg ttcttatatc 28380
ccttgctctg gtcaaccagg ttgcagggtt tcctgtcctc acaggaacga agtccctaaa 28440
gaaacagtgg cagccaggtt tagccccgga attgactgga ttcctttttt agggcccatt 28500
ggtatggctt tttccccgta tccccccagg tgtctgcagg ctcaaagagc agcgagaagc 28560
gttcagagga aagcgatccc gtgccacctt ccccgtgccc gggctgtccc cgcacgctgc 28620
cggctcgggg atgcgggggg agcgccggac cggagcggag ccccgggcgg ctcgctgctg 28680
ccccctagcg ggggagggac gtaattacat ccctgggggc tttggggggg ggctgtccct 28740
gatatctata acaagaaaat atatatataa taagttatca cgtaagtaga acatgaaata 28800
acaatataat tatcgtatga gttaaatctt aaaagtcacg taaaagataa tcatgcgtca 28860
ttttgactca cgcggtcgtt atagttcaaa atcagtgaca cttaccgcat tgacaagcac 28920
gcctcacggg agctccaagc ggcgactgag atgtcctaaa tgcacagcga cggattcgcg 28980
ctatttagaa agagagagca atatttcaag aatgcatgcg tcaattttac gcagactatc 29040
tttctagggt taatctagct gcatcaggat catatcgtcg ggtctttttt ccggctcagt 29100
catcgcccaa gctggcgcta tctgggcatc ggggaggaag aagcccgtgc cttaattctg 29160
tggaatgtgt gtcagttagg gtgtggaaag tccccaggct ccccagcagg cagaagtatg 29220
caaagcatgc ataagcttga gtattctata gtgtcaccta aatagcttgg cgtaatcatg 29280
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 29340
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 29400
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 29460
cggccaacgc gaaccccttg cggccgcccg ggccgtcgac caattctcat gtttgacagc 29520
ttatcatcga atttctgcca ttcatccgct tattatcact tattcaggcg tagcaaccag 29580
gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc cactcatcgc 29640
agtactgttg taattcatta agcattctgc cgacatggaa gccatcacaa acggcatgat 29700
gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg 29760
tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac 29820
tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg 29880
ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat 29940
cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt 30000
aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacggaatt 30060
ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 30120
tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 30180
tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 30240
caacggtggt atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc 30300
tcgataactc aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac 30360
ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt ggcccagggc ttcccggtat 30420
caacagggac accaggattt atttattctg cgaagtgatc ttccgtcaca ggtatttatt 30480
cgcgataagc tcatggagcg gcgtaaccgt cgcacaggaa ggacagagaa agcgcggatc 30540
tgggaagtga cggacagaac ggtcaggacc tggattgggg aggcggttgc cgccgctgct 30600
gctgacggtg tgacgttctc tgttccggtc acaccacata cgttccgcca ttcctatgcg 30660
atgcacatgc tgtatgccgg tataccgctg aaagttctgc aaagcctgat gggacataag 30720
tccatcagtt caacggaagt ctacacgaag gtttttgcgc tggatgtggc tgcccggcac 30780
cgggtgcagt ttgcgatgcc ggagtctgat gcggttgcga tgctgaaaca attatcctga 30840
gaataaatgc cttggccttt atatggaaat gtggaactga gtggatatgc tgtttttgtc 30900
tgttaaacag agaagctggc tgttatccac tgagaagcga acgaaacagt cgggaaaatc 30960
tcccattatc gtagagatcc gcattattaa tctcaggagc ctgtgtagcg tttataggaa 31020
gtagtgttct gtcatgatgc ctgcaagcgg taacgaaaac gatttgaata tgccttcagg 31080
aacaatagaa atcttcgtgc ggtgttacgt tgaagtggag cggattatgt cagcaatgga 31140
cagaacaacc taatgaacac agaaccatga tgtggtctgt ccttttacag ccagtagtgc 31200
tcgccgcagt cgagcgacag ggcgaagccc tcgagtgagc gaggaagcac cagggaacag 31260
cacttatata ttctgcttac acacgatgcc tgaaaaaact tcccttgggg ttatccactt 31320
atccacgggg atatttttat aattattttt tttatagttt ttagatcttc ttttttagag 31380
cgccttgtag gcctttatcc atgctggttc tagagaaggt gttgtgacaa attgcccttt 31440
cagtgtgaca aatcaccctc aaatgacagt cctgtctgtg acaaattgcc cttaaccctg 31500
tgacaaattg ccctcagaag aagctgtttt ttcacaaagt tatccctgct tattgactct 31560
tttttattta gtgtgacaat ctaaaaactt gtcacacttc acatggatct gtcatggcgg 31620
aaacagcggt tatcaatcac aagaaacgta aaaatagccc gcgaatcgtc cagtcaaacg 31680
acctcactga ggcggcatat agtctctccc gggatcaaaa acgtatgctg tatctgttcg 31740
ttgaccagat cagaaaatct gatggcaccc tacaggaaca tgacggtatc tgcgagatcc 31800
atgttgctaa atatgctgaa atattcggat tgacctctgc ggaagccagt aaggatatac 31860
ggcaggcatt gaagagtttc gcggggaagg aagtggtttt ttatcgccct gaagaggatg 31920
ccggcgatga aaaaggctat gaatcttttc cttggtttat caaacgtgcg cacagtccat 31980
ccagagggct ttacagtgta catatcaacc catatctcat tcccttcttt atcgggttac 32040
agaaccggtt tacgcagttt cggcttagtg aaacaaaaga aatcaccaat ccgtatgcca 32100
tgcgtttata cgaatccctg tgtcagtatc gtaagccgga tggctcaggc atcgtctctc 32160
tgaaaatcga ctggatcata gagcgttacc agctgcctca aagttaccag cgtatgcctg 32220
acttccgccg ccgcttcctg caggtctgtg ttaatgagat caacagcaga actccaatgc 32280
gcctctcata cattgagaaa aagaaaggcc gccagacgac tcatatcgta ttttccttcc 32340
gcgatatcac ttccatgacg acaggatagt ctgagggtta tctgtcacag atttgagggt 32400
ggttcgtcac atttgttctg acctactgag ggtaatttgt cacagttttg ctgtttcctt 32460
cagcctgcat ggattttctc atactttttg aactgtaatt tttaaggaag ccaaatttga 32520
gggcagtttg tcacagttga tttccttctc tttcccttcg tcatgtgacc tgatatcggg 32580
ggttagttcg tcatcattga tgagggttga ttatcacagt ttattactct gaattggcta 32640
tccgcgtgtg tacctctacc tggagttttt cccacggtgg atatttcttc ttgcgctgag 32700
cgtaagagct atctgacaga acagttcttc tttgcttcct cgccagttcg ctcgctatgc 32760
tcggttacac ggctgcggcg agcgctagtg ataataagtg actgaggtat gtgctcttct 32820
tatctccttt tgtagtgttg ctcttatttt aaacaacttt gcggtttttt gatgactttg 32880
cgattttgtt gttgctttgc agtaaattgc aagatttaat aaaaaaacgc aaagcaatga 32940
ttaaaggatg ttcagaatga aactcatgga aacacttaac cagtgcataa acgctggtca 33000
tgaaatgacg aaggctatcg ccattgcaca gtttaatgat gacagcccgg aagcgaggaa 33060
aataacccgg cgctggagaa taggtgaagc agcggattta gttggggttt cttctcaggc 33120
tatcagagat gccgagaaag cagggcgact accgcacccg gatatggaaa ttcgaggacg 33180
ggttgagcaa cgtgttggtt atacaattga acaaattaat catatgcgtg atgtgtttgg 33240
tacgcgattg cgacgtgctg aagacgtatt tccaccggtg atcggggttg ctgcccataa 33300
aggtggcgtt tacaaaacct cagtttctgt tcatcttgct caggatctgg ctctgaaggg 33360
gctacgtgtt ttgctcgtgg aaggtaacga cccccaggga acagcctcaa tgtatcacgg 33420
atgggtacca gatcttcata ttcatgcaga agacactctc ctgcctttct atcttgggga 33480
aaaggacgat gtcacttatg caataaagcc cacttgctgg ccggggcttg acattattcc 33540
ttcctgtctg gctctgcacc gtattgaaac tgagttaatg ggcaaatttg atgaaggtaa 33600
actgcccacc gatccacacc tgatgctccg actggccatt gaaactgttg ctcatgacta 33660
tgatgtcata gttattgaca gcgcgcctaa cctgggtatc ggcacgatta atgtcgtatg 33720
tgctgctgat gtgctgattg ttcccacgcc tgctgagttg tttgactaca cctccgcact 33780
gcagtttttc gatatgcttc gtgatctgct caagaacgtt gatcttaaag ggttcgagcc 33840
tgatgtacgt attttgctta ccaaatacag caatagtaat ggctctcagt ccccgtggat 33900
ggaggagcaa attcgggatg cctggggaag catggttcta aaaaatgttg tacgtgaaac 33960
ggatgaagtt ggtaaaggtc agatccggat gagaactgtt tttgaacagg ccattgatca 34020
acgctcttca actggtgcct ggagaaatgc tctttctatt tgggaacctg tctgcaatga 34080
aattttcgat cgtctgatta aaccacgctg ggagattaga taatgaagcg tgcgcctgtt 34140
attccaaaac atacgctcaa tactcaaccg gttgaagata cttcgttatc gacaccagct 34200
gccccgatgg tggattcgtt aattgcgcgc gtaggagtaa tggctcgcgg taatgccatt 34260
actttgcctg tatgtggtcg ggatgtgaag tttactcttg aagtgctccg gggtgatagt 34320
gttgagaaga cctctcgggt atggtcaggt aatgaacgtg accaggagct gcttactgag 34380
gacgcactgg atgatctcat cccttctttt ctactgactg gtcaacagac accggcgttc 34440
ggtcgaagag tatctggtgt catagaaatt gccgatggga gtcgccgtcg taaagctgct 34500
gcacttaccg aaagtgatta tcgtgttctg gttggcgagc tggatgatga gcagatggct 34560
gcattatcca gattgggtaa cgattatcgc ccaacaagtg cttatgaacg tggtcagcgt 34620
tatgcaagcc gattgcagaa tgaatttgct ggaaatattt ctgcgctggc tgatgcggaa 34680
aatatttcac gtaagattat tacccgctgt atcaacaccg ccaaattgcc taaatcagtt 34740
gttgctcttt tttctcaccc cggtgaacta tctgcccggt caggtgatgc acttcaaaaa 34800
gcctttacag ataaagagga attacttaag cagcaggcat ctaaccttca tgagcagaaa 34860
aaagctgggg tgatatttga agctgaagaa gttatcactc ttttaacttc tgtgcttaaa 34920
acgtcatctg catcaagaac tagtttaagc tcacgacatc agtttgctcc tggagcgaca 34980
gtattgtata agggcgataa aatggtgctt aacctggaca ggtctagagt tccaactgag 35040
tgtatagaga aaattgaggc cattcttaag gaacttgaaa agccagcacc ctgatgcgac 35100
cacgttttag tctacgttta tctgtcttta cttaatgtcc tttgttacag gccagaaagc 35160
ataactggcc tgaatattct ctctgggccc actgttccac ttgtatcgtc ggtctgataa 35220
tcagactggg accacggtcc cactcgtatc gtcggtctga ttattagtct gggaccacgg 35280
tcccactcgt atcgtcggtc tgattattag tctgggacca cggtcccact cgtatcgtcg 35340
gtctgataat cagactggga ccacggtccc actcgtatcg tcggtctgat tattagtctg 35400
ggaccatggt cccactcgta tcgtcggtct gattattagt ctgggaccac ggtcccactc 35460
gtatcgtcgg tctgattatt agtctggaac cacggtccca ctcgtatcgt cggtctgatt 35520
attagtctgg gaccacggtc ccactcgtat cgtcggtctg attattagtc tgggaccacg 35580
atcccactcg tgttgtcggt ctgattatcg gtctgggacc acggtcccac ttgtattgtc 35640
gatcagacta tcagcgtgag actacgattc catcaatgcc tgtcaagggc aagtattgac 35700
atgtcgtcgt aacctgtaga acggagtaac ctcggtgtgc ggttgtatgc ctgctgtgga 35760
ttgctgctgt gtcctgctta tccacaacat tttgcgcacg gttatgtgga caaaatacct 35820
ggttacccag gccgtgccgg cacgttaacc gggctgcatc cgatgcaagt gtgtcgctgt 35880
cgacgagctc gcgagctcgg acatgaggtt gccccgtatt cagtgtcgct gatttgtatt 35940
gtctgaagtt gtttttacgt taagttgatg cagatcaatt aatacgatac ctgcgtcata 36000
attgattatt tgacgtggtt tgatggcctc cacgcacgtt gtgatatgta gatgataatc 36060
attatcactt tacgggtcct ttccggtgat ccgacaggtt acggggcggc gacctcgcgg 36120
gttttcgcta tttatgaaaa ttttccggtt taaggcgttt ccgttcttct tcgtcataac 36180
ttaatgtttt tatttaaaat accctctgaa aagaaaggaa acgacaggtg ctgaaagcga 36240
gctttttggc ctctgtcgtt tcctttctct gtttttgtcc gtggaatgaa caatggaagt 36300
ccgagctcat cgctaataac ttcgtatagc atacattata cgaagttata ttcgat 36356

Claims (16)

1.一种新型冠状病毒SARS-CoV-2复制子,其特征在于,包括5”启动子、DNA编码序列和3’核酶序列,并顺次连接构成转录模件;其中,所述DNA编码序列为SARS-CoV-2基因组序列删除病毒棘突蛋白S的编码序列,以报告基因置换病毒核衣壳蛋白N的部分编码序列,在NSP1基因特定位点插入外源嵌合序列;
其中,所述外源嵌合序列插入于NSP1基因的66和67位碱基之间;所述外源嵌合序列依次包括:5’内含子供体序列-第一特异性切除序列-分裂肽-真核抗性基因编码序列-转录终止信号-第二特异性切除序列-3’内含子分支位点/受体序列,重组酶介导第一特异性切除序列和第二特异性切除序列位点特异性重组;所述5’内含子供体序列-第一特异性切除序列-分裂肽-真核抗性基因编码序列-转录终止信号-第二特异性切除序列-3’内含子分支位点/受体序列的基因序列如SEQ ID NO.3所示。
2.根据权利要求1所述的一种新型冠状病毒SARS-CoV-2复制子,其特征在于,所述报告基因序列置换所述病毒核衣壳蛋白N第34-385位氨基酸的编码序列;
和/或,删除所述病毒棘突蛋白S第36-1252位氨基酸的编码序列。
3.根据权利要求1所述的一种新型冠状病毒SARS-CoV-2复制子,其特征在于,在所述转录模件的5’和3’末端分别插入转座子5’和3’末端元件、核心绝缘子序列,序列依次为:转座子5’末端元件-绝缘子编码序列-转录模件-绝缘子编码序列-转座子3’末端元件。
4.根据权利要求3所述的一种新型冠状病毒SARS-CoV-2复制子,其特征在于,所述启动子为CMV启动子;和/或,所述报告基因为萤光素酶报告基因;和/或,所述核酶序列为HDV RZ序列;和/或,所述真核抗性基因为Blasticidin;和/或,所述第一特异性切除序列和第二特异性切除序列为LoxP,所述重组酶为重组酶Cre;和/或,所述分裂肽为P2A;和/或,所述转录终止信号包括第一转录终止信号和第二转录终止信号,分别为SV40 polyA和BGH polyA真核基因转录终止/加尾信号;和/或,所述核心绝缘子为鸡β珠蛋白核心绝缘子;和/或,所述转座子为PiggyBac转座子。
5.根据权利要求4所述的一种新型冠状病毒SARS-CoV-2复制子,其特征在于,编码部分序列置换为荧光素酶报告基因的病毒核衣壳蛋白N的基因序列如SEQ ID NO.1所示;和/或,编码HDV RZ的基因序列如SEQ ID NO.2所示;和/或,编码所述核心绝缘子的基因序列如SEQID NO.4所示;和/或,转座子5’末端元件的基因序列如SEQ ID NO.5所示;和/或,转座子3’末端元件的基因序列如SEQ ID NO.6所示。
6.一种含有权利要求1~5中任一项所述的新型冠状病毒SARS-CoV-2复制子的生物材料,其特征在于,所述生物材料包括质粒载体、细胞模型。
7.根据权利要求6所述的生物材料,其特征在于,所述质粒载体为采用pBeloBAC11构建的pBAC-rSARS-CoV-2质粒。
8.根据权利要求7所述的生物材料,其特征在于,所述pBAC-rSARS-CoV-2质粒的全序列如SEQ ID NO.9所示。
9.根据权利要求7所述的生物材料,其特征在于,所述细胞模型为采用所述pBAC-rSARS-CoV-2质粒在转座酶作用下将病毒基因组转录模件整合至宿主细胞染色体中,抗性筛选获得的单克隆细胞株。
10.根据权利要求9所述的生物材料,其特征在于,编码所述转座酶的基因序列如SEQID NO.8所示;和/或,所述宿主细胞为仓鼠肾成纤维细胞系BHK-21。
11.一种如权利要求1~5中任一项所述的新型冠状病毒SARS-CoV-2复制子、或如权利要求6~10中任一项所述的生物材料的应用,其特征在于,所述应用选自以下应用中的一种:在评价新型冠状病毒SARS-CoV-2病毒学作用机制的应用、在筛选抗新型冠状病毒SARS-CoV-2药物中的应用、在制备抗新型冠状病毒SARS-CoV-2药物的筛选试剂盒或筛选系统中的应用。
12.一种如权利要求6~10中任一项所述的生物材料的制备方法,其特征在于,包括以下步骤:
步骤1)通过PCR方法扩增得到5’转座子-绝缘子、启动子、5’UTR-NSP1、5’内含子供体序列-第一特异性切除序列-分裂肽、真核抗性基因、第一转录终止信号、第二转录终止信号-第二特异性切除序列-3’内含子分支位点/受体序列-KasI片段,将获得的片段依次经重叠延伸PCR扩增得到F1片段;
步骤2)采用质粒酶切、纯化获得KasI-ORF1ab-BstBI线性化F2片段;
步骤3)经过PCR方法扩增BstBI-ΔS、ORF3-E-M-ORF6-ORF7-ORF8-ORF9-ΔN、报告基因-ΔN、ORF10-3’UTR-核酶、绝缘子-3’转座子片段,将获得的片段依次经重叠延伸PCR扩增得到F3片段;
步骤4)将pBeloBAC11作为质粒骨架,通过PCR方法扩增获得F4片段;
步骤5)采用步骤1)~步骤4)中获得的F1-F4片段进行重组病毒基因组DNA转录模件的组装,其中F1-F4相邻片段之间均带有同源臂;
步骤6)将步骤5)获得的组装产物转化感受态细胞,鉴定筛选获得阳性质粒pBAC-rSARS-CoV-2。
13.根据权利要求12所述的制备方法,其特征在于,在步骤6)之后,还包括以下步骤:步骤7)将所述pBAC-rSARS-CoV-2与转座酶按照预定比例共转染BHK-21细胞,抗性筛选,获得稳定单克隆细胞株BHK-21-R-CAGG-NLuc。
14.一种抗新型冠状病毒SARS-CoV-2药物的筛选方法,其特征在于,通过向包含如权利要求1~5中任一项所述的新型冠状病毒SARS-CoV-2复制子的表达系统中,加入候选药物,检测报告基因的差异表达,评估所述候选药物的抗新型冠状病毒SARS-CoV-2的效果。
15.根据权利要求14的筛选方法,其特征在于,所述表达系统的构建方法为:在重组酶的诱导条件下,含有如权利要求1~5中任一项所述的新型冠状病毒SARS-CoV-2复制子的稳定单克隆细胞株BHK-21-R-CAGG-NLuc进行SARS-CoV-2病毒RNA转录,并实现N蛋白拯救的病毒RNA自主复制和荧光素酶报告基因的表达。
16.根据权利要求15所述的筛选方法,其特征在于,所述重组酶为重组酶Cre,其由pCDH-N-IRES-Cre质粒载体表达,编码N-IRES-Cre的基因序列如SEQ ID NO.7所示。
CN202210531625.5A 2022-05-16 2022-05-16 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用 Active CN115029380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210531625.5A CN115029380B (zh) 2022-05-16 2022-05-16 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210531625.5A CN115029380B (zh) 2022-05-16 2022-05-16 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用

Publications (2)

Publication Number Publication Date
CN115029380A CN115029380A (zh) 2022-09-09
CN115029380B true CN115029380B (zh) 2023-11-28

Family

ID=83120198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210531625.5A Active CN115029380B (zh) 2022-05-16 2022-05-16 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用

Country Status (1)

Country Link
CN (1) CN115029380B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112029781A (zh) * 2020-08-14 2020-12-04 中山大学 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用
CN112301043A (zh) * 2020-10-13 2021-02-02 中国医学科学院病原生物学研究所 一种新型冠状病毒SARS-CoV-2复制子、其构建方法及应用
CN112852746A (zh) * 2021-02-04 2021-05-28 中吉智药(南京)生物技术有限公司 基于Cre重组酶诱导的大规模慢病毒基因药物制备系统及方法
WO2021195596A2 (en) * 2020-03-27 2021-09-30 Xie Xuping Reverse genetic system for sars-cov-2
CN114231544A (zh) * 2020-09-09 2022-03-25 复旦大学 基于细菌人工染色体的新冠病毒SARS-CoV-2亚基因组复制子克隆、构建及应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021195596A2 (en) * 2020-03-27 2021-09-30 Xie Xuping Reverse genetic system for sars-cov-2
CN112029781A (zh) * 2020-08-14 2020-12-04 中山大学 一种新型冠状病毒SARS-CoV-2的安全型复制子系统及其应用
CN114231544A (zh) * 2020-09-09 2022-03-25 复旦大学 基于细菌人工染色体的新冠病毒SARS-CoV-2亚基因组复制子克隆、构建及应用
CN112301043A (zh) * 2020-10-13 2021-02-02 中国医学科学院病原生物学研究所 一种新型冠状病毒SARS-CoV-2复制子、其构建方法及应用
CN112852746A (zh) * 2021-02-04 2021-05-28 中吉智药(南京)生物技术有限公司 基于Cre重组酶诱导的大规模慢病毒基因药物制备系统及方法

Also Published As

Publication number Publication date
CN115029380A (zh) 2022-09-09

Similar Documents

Publication Publication Date Title
KR102499953B1 (ko) Aav 입자의 생산을 위한 벡터
CN111593073B (zh) 双报告基因骨架载体、四质粒假病毒包装系统、包装新冠肺炎假病毒
AU2015263150B2 (en) Lentiviral vectors
CN114457044A (zh) 武装有异源基因的溶瘤腺病毒
KR20210143897A (ko) 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합
JP2024073576A (ja) 改変アデノウイルス
CN107723276A (zh) 一种稳定高表达目标产物的细胞株的构建方法和试剂盒
KR20210144861A (ko) 아마이엘로이스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포 게놈으로의 전위
KR20160102024A (ko) 아데노바이러스 및 상응하는 플라스미드의 제조 방법
CN107699589B (zh) 一种Cre和Flp依赖的逆向示踪重组伪狂犬病毒的制备方法和应用
KR20200066349A (ko) 복제 가능 아데노바이러스 벡터
KR20210013589A (ko) 면역 체크포인트 억제제 공동-발현 벡터
CN106536722B (zh) 用于快速制备感染性rna病毒的方法
CN113039272B (zh) 转录调节元件及其在增强异源蛋白表达中的应用
CN115176016B (zh) 增强的表达系统及其使用方法
CN114805500B (zh) 非洲猪瘟病毒i73r蛋白作为免疫抑制剂的应用及免疫抑制位点突变毒株的构建
CN102329784A (zh) 一种日本乙型脑炎病毒样颗粒及其制备方法和应用
CN115029380B (zh) 一种新型冠状病毒SARS-CoV-2复制子及其细胞模型、构建方法和应用
CN110885819A (zh) 基于aav病毒的基因编辑表达盒
CN113308480B (zh) 一种A型塞内卡病毒SVA/HeB全长感染性cDNA克隆及其制备方法与应用
US20240082327A1 (en) Retroviral vectors
CN113462700B (zh) SARS-CoV-2线性DNA疫苗
CN111850015B (zh) 细胞抗逆基因片段及改造的HepG2细胞
WO2024062259A1 (en) Retroviral vector comprising rre inserted within an intron
KR20220072758A (ko) 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant