CN112852860A - 质粒载体及其在构建多拷贝表达系统中的应用 - Google Patents

质粒载体及其在构建多拷贝表达系统中的应用 Download PDF

Info

Publication number
CN112852860A
CN112852860A CN202110155734.7A CN202110155734A CN112852860A CN 112852860 A CN112852860 A CN 112852860A CN 202110155734 A CN202110155734 A CN 202110155734A CN 112852860 A CN112852860 A CN 112852860A
Authority
CN
China
Prior art keywords
plasmid
gene
fragment
raf1
rep2
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110155734.7A
Other languages
English (en)
Other versions
CN112852860B (zh
Inventor
元英进
曾薄轩
王颖
姚明东
肖文海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN202110155734.7A priority Critical patent/CN112852860B/zh
Publication of CN112852860A publication Critical patent/CN112852860A/zh
Application granted granted Critical
Publication of CN112852860B publication Critical patent/CN112852860B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/905Stable introduction of foreign DNA into chromosome using homologous recombination in yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及基因工程技术领域,尤其涉及质粒载体及其在构建多拷贝表达系统中的应用。本发明基于CRISPR/cas9基因编辑技术构建了质粒载体,从而能够在酿酒酵母内通过增加基因拷贝数来过表达目的基因。通过直接编辑酿酒酵母内源性2μ质粒,将目标基因直接插入到2μ质粒中,可使得目标基因可以多拷贝的形式在酿酒酵母内进行稳定的过表达。以二氢青蒿酸的表达为例,使用pE2μ多拷贝质粒系统的菌株SyBE_Sc01130584的产量达到620.9mg/L,而使用pC2μ质粒进行过表达仅仅产生131.0mg/L。

Description

质粒载体及其在构建多拷贝表达系统中的应用
技术领域
本发明涉及基因工程技术领域,尤其涉及质粒载体及其在构建多拷贝表达系统中的应用。
背景技术
多拷贝质粒普遍用于对目的基因进行多拷贝表达,由于其易于操作,转化效率高等优点,在各种细胞中被开发为重要的工具。在酿酒酵母中,传统的2μ穿梭质粒(pC2μ)如pYES2、pRS426和pESC被广泛用于重组蛋白的生产和代谢途径的构建(Karim et al.,2013)。传统的2μ质粒源于酵母内源性2μ质粒(pE2μ)。传统的2μ质粒为了操作方便,只保留了pE2μ的2μori,加上了酵母的筛选标记(营养缺陷型标记或抗生素标记)和大肠杆菌的克隆元件。通过基因操作,可将外源目的基因连入质粒中,再导入宿主酿酒酵母后,可实现外源插入基因的多拷贝过表达,以及对异源合成代谢路径的优化。
酵母内源性2μ质粒pE2μ存在于大多数野生型和实验室酿酒酵母菌株中。pE2μ是酿酒酵母中天然的可自主复制的环状DNA分子(Gnügge and Rudolf,2017)。它包含一个特殊的复制起始位点(2μori)、两个FRT位点(FLP1识别的靶位点)和编码四个已知基因的序列:REP1、REP2、RAF1和FLP1。FLP1和两个FRT位点对pE2μ的扩增至关重要(Rizvi et al.,2017)。该扩增系统以FLP1介导的重组为基础,遵循特殊的Futcher模型(Futcher,1986),因此每个质粒在一个细胞周期内可以复制多个拷贝,以在质粒拷贝数分配不均衡和其他外界对质粒拷贝数扰动的情况下恢复质粒拷贝数(PCN)的稳定状态(Rizvi et al.,2017)。REP1和REP2对于pE2μ的分配体系是必不可少的。REP1和REP2形成复合物REP1-REP2,它与位于2μori内的STB位点结合,以协助质粒在细胞分裂的时候平均分配到字母细胞中;RAF1负责调节分配和扩增系统的功能,以使pE2μ的拷贝数保持在最小的细胞间变化(McQuaid et al.,2017)。基于上述严格控制的质粒分配系统和多拷贝扩增系统,pE2μ可以被均匀分离,从而导致非常低的丢失频率(<0.01%)(Gnügge and Rudolf,2017)。
传统的pC2μ质粒在细胞中的存活率通常取决于培养基产生的选择性压力(含抗生素的培养基或者营养缺陷型的培养基)。在没有选择压力的丰富的培养条件下,pC2μ很难保持较高的拷贝数,并且细胞会不断地丢失质粒,细胞在非选择性培养基中培养约24小时后,有近50%-60%的细胞失去质粒(Christianson et al.,1992)。对于含有pC2μ菌株,使用YPD等营养丰富的天然的培养基,虽然生长速度较快,但由于质粒丢失,会让细胞失去重要的特性,因此不适合长期发酵;而对于有抗生素标记的菌株,则需要添加昂贵的抗生素以维持质粒的存在,也不适合工业化规模的发酵。
此外,pC2μ质粒只含有一个FRT位点。因此pC2μ不能以Futcher模型的形式进行扩增,pC2μ的扩增效率也不如pE2μ高。pC2μ需要pE2μ来维持分配时的稳定性,在没有pE2μ的菌株中不适合使用pC2μ来进行基因的过表达。在没有pE2μ的酵母菌株中使用传统的2μ质粒,其质粒丢失频率约为50%(Christianson et al.,1992)。
因此,为了使目的基因可以更加稳定表达,且不受培养条件的限制,构建多拷贝质粒系统十分必要。
发明内容
有鉴于此,本发明要解决的技术问题在于提供一种质粒载体,从而使目的基因直接插入到野生pE2μ,以实现目的基因的多拷贝表达。
本发明提供了如下I)~IV)中至少一种在构建多拷贝基因表达系统中的应用:
I)、RAF1基因或其同源片段;
II)、REP2基因或其同源片段;
III)、靶向RAF1基因或靶向RAF1基因上下游片段的gRNA;
IV)、靶向REP2基因或靶向REP2基因上下游片段的gRNA;
V)、与I)~IV)中任一项部分互补或完全互补的核酸。
本发明中,所述RAF1基因或REP2基因为酿酒酵母的RAF1基因或REP2基因,其位于酿酒酵母的2μ质粒。本发明利用CRISPR技术进行胞内编辑,切割酿酒酵母野生内源2μ质粒并目的基因片段整合到2μ质粒上的RAF1或REP2基因下游,从而实现目的基因的多拷贝表达。
为此,本发明提供了两种质粒,其中一种是用于在胞内切割内源性野生pE2μ的CRISPR工具质粒,另一种是便于导入目标基因的Donor质粒。将经线性化的pDonor质粒,与相应CRISPR工具质粒混合后导入含有野生pE2μ的酿酒酵母中,可使目的基因直接插入到野生pE2μ,以实现目的基因的多拷贝。
本发明提供的CRISPR工具质粒,包括骨架载体、编码Cas9的核酸和gRNA;
所述gRNA靶向REP2基因下游片段或RAF1基因下游片段。
本发明所述的CRISPR工具质粒,包括顺序连接的:PTEF1、Cas9、TCYC1、PSNR52、gRNA、TSUP4
本发明所述的CRISPR工具质粒还包括ori片段、抗性标记、CEN/ARS片段和营养缺陷型标记。
本发明中,所述CRISPR工具质粒的骨架载体为pRS416载体;所述抗性标记为AmpR标记,所述营养缺陷型标记为URA3标记;所述编码Cas9的核酸序列如SEQ ID NO:1所述;所述靶向RAF1基因下游片段的gRNA的序列如SEQ ID NO:2所示,所述靶向REP2基因下游片段的gRNA的序列如SEQ ID NO:3所示。
本发明提供的CRISPR工具质粒,为着丝粒质粒,Cas9蛋白与gRNA都在该质粒上表达,以避免与pE2μ之间发生重组。通过替换gRNA,以满足对不同的pE2μ质粒及其衍生质粒进行编辑的需求。
本发明还提供了一种Donor质粒,包括骨架载体和i)~ii)中至少一种;
i)、RAF1同源片段;ii)、REP2同源片段。
本发明中,所述RAF1同源片段包括RAF1同源臂A和RAF1同源臂B,所述RAF1同源臂A的核酸序列如SEQ ID NO:4所示,所述RAF1同源臂B的核酸序列如SEQ ID NO:5所示。
本发明中,所述REP2同源片段包括REP2同源臂a和REP2同源臂b,所述REP2同源臂a的核酸序列如SEQ ID NO:6所示,所述REP2同源臂b的核酸序列如SEQ ID NO:7所示。
本发明所述Donor载体还包括:线性化酶切位点、终止子、抗性筛选标记、营养缺陷型筛选标记和目的基因插入位点;
本发明所述Donor载体中,线性化酶切位点位于所述同源片段的同源臂A和同源臂B之间。
本发明所述Donor载体中,所述线性化酶切位点为PmeI;所述终止子为TCPS1;所述抗性筛选标记为KanMX6;所述营养缺陷型筛选标记为G418;所述目的基因插入位点包括BsaI位点。
本发明提供的Donor质粒拥有两段野生2μ质粒的同源臂,可通过同源重组,整合到2μ质粒上的RAF1或REP2基因的下游。两段同源臂之间添加了PmeI酶切位点,便于线性化。
利用RAF1的表达质粒组合中,CRISPR工具质粒中靶向RAF1基因下游片段的gRNA的序列如SEQ ID NO:2所示;Donor质粒中包括RAF1同源臂A和RAF1同源臂B,所述RAF1同源臂A的核酸序列如SEQ ID NO:4所示,所述RAF1同源臂B的核酸序列如SEQ ID NO:5所示。
利用REF2的表达质粒组合中,CRISPR工具质粒中靶向REF2基因下游片段的gRNA的序列如SEQ ID NO:3所示;Donor质粒中包括REP2同源臂a和REP2同源臂b,所述REP2同源臂a的核酸序列如SEQ ID NO:6所示,所述REP2同源臂b的核酸序列如SEQ ID NO:7所示。
本发明还提供了多拷贝基因表达系统,其包括:含有pE2μ质粒的酵母菌、所述的CRISPR工具质粒和所述的Donor质粒。
本发明还提供了一种多拷贝基因表达方法,其包括:
将目的基因插入所述的Donor质粒,制得pDonor Target载体;
所述pDonor Target载体经线性化,与所述的CRISPR工具质粒共转化至宿主进行表达;
所述宿主为含有pE2μ质粒的酵母菌。
利用本发明提供的CRISPR工具质粒和所述的Donor质粒对酿酒酵母(含有野生2μ质粒)可以获得编辑后的质粒,本发明中将该质粒记为多拷贝基因表达质粒。这种质粒可用于在没有野生2μ质粒的酿酒酵母中构建pE2μ多拷贝系统。
TPI1是酿酒酵母基因组上的必需基因,将其迁移至2μ质粒上有助于进一步提高质粒的拷贝数和稳定性。因此,本发明所述多拷贝基因表达方法中,所述宿主pE2μ质粒中插入TPI 1基因,且其基因组中TPI 1基因被敲除。一些具体实施例中,所述TPI 1基因的核酸序列如SEQ ID NO:8所示。
本发明中,以二氢青蒿酸的表达为例,构建多拷贝基因表达菌株。其中,所述目的基因为ADS、CYP71AV1和DBR2。
本发明所述方法构建的表达二氢青蒿酸的酵母菌株,其宿主为酿酒酵母CEN.PK2-1C。
构建所得菌株的保藏编号为CGMCC NO. 21335。
本发明还提供了另一种多拷贝基因表达质粒,其包括:骨架载体和2μori片段、REP2片段、FLP片段、REP1片段、RAF1片段。
本发明所述的多拷贝基因表达质粒中所述骨架载体为pSB1C3;所述2μori和RAF1之间还包括:抗性标记和目的基因插入位点;所述抗性标记为kanMX6。
本发明所述的多拷贝基因表达质粒的构建方法,其包括,以所述的CRISPR工具质粒和所述的Donor质粒对含有pE2μ质粒的酵母菌进行编辑。
本发明还提供了多拷贝基因表达系统,其包括:不含有pE2μ质粒的酵母菌和所述的多拷贝基因表达质粒。
本发明还提供了一种多拷贝基因表达方法,包括:
将目的基因插入所述多拷贝基因表达质粒,然后转化至宿主进行表达;所述宿主为不含有pE2μ质粒的酵母菌。
本发明基于CRISPR/cas9基因编辑技术构建了质粒载体,从而能够在酿酒酵母内通过增加基因拷贝数来过表达目的基因。通过直接编辑酿酒酵母内源性2μ质粒,将目标基因直接插入到2μ质粒中,可使得目标基因可以多拷贝的形式在酿酒酵母内进行稳定的过表达。以二氢青蒿酸的表达为例,使用pE2μ多拷贝质粒系统的菌株SyBE_Sc01130584的产量达到620.9mg/L,而使用pC2μ质粒进行过表达仅仅产生131.0mg/L。
生物保藏说明
生物材料SyBE_Sc01130584,分类命名:酿酒酵母Saccharomyces cerevisiae,于2020年12月08日保藏在中国微生物菌种保藏管理委员会普通微生物中心,地址为:北京市朝阳区北辰西路1号院3号中国科学院微生物研究所,保藏编号为CGMCC No.21335
附图说明
图1示菌株SyBE_Sc01130534,SyBE_Sc01130438和SyBE_Sc01130382传代实验,在各个代时下的流式细胞测定结果,每个图横轴为荧光强度,纵轴为各个荧光强度所对应的细胞个数,CV%为变异系数,描述分布的发散程度;
图2示菌株SyBE_Sc01130534,SyBE_Sc01130438及SyBE_Sc01130382传代实验,在各个代时下质粒存活率的测定;
图3示菌株SyBE_Sc01130534,SyBE_Sc01130438及SyBE_Sc01130382在0代时的质粒拷贝数;
图4示菌株SyBE_Sc01130534,SyBE_Sc01130438及SyBE_Sc01130382在0代,10代,20代,30代时的相对平均荧光值;
图5示SyBE_Sc01130530及SyBE_Sc01130594在经过90代传代实验后在YPD平板上涂布;
图6示菌株SyBE_Sc01130594,SyBE_Sc01130530传代实验,在各个代时下的流式细胞测定结果;
图7示菌株SyBE_Sc01130594,SyBE_Sc01130530在0代和90代时的拷贝数;
图8示菌株SyBE_Sc01130366,SyBE_Sc01130343,SyBE_Sc01130584发酵测试结果;
图9示CRISPR工具质粒pCasRAF1的质粒图谱;
图10示Donor质粒pDonorRAF1的质粒图谱;
图11示Donor质粒pDonorREP2的质粒图谱;
图12示Donor质粒pDonorDCA的质粒图谱;
图13示pE2μRAF1构建过程及获得的载体图谱;
图14示菌株SyBE_Sc01130594的构建过程,及获得的载体图谱;
图15示CRISRP工具质粒切割位点。
具体实施方式
本发明提供了质粒载体及其在构建多拷贝表达系统中的应用,本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明的方法及应用已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文的方法和应用进行改动或适当变更与组合,来实现和应用本发明技术。
本发明中,RAF1基因或REP2基因来自酿酒酵母的2μ质粒,所述同源片段是指基因的两个同源臂,其中一个同源臂位于基因的3’端,另一个同源臂位于基因的5’端。
本发明中gRNA靶向的位置是RAF1基因或REP2基因中,或在基因的上游,或在基因的下游。在本发明实施例中,gRNA靶向的位置是RAF1基因或REP2基因的下游。具体实施例中,本发明构建的CRISPR工具质粒中gRNA引导切割的位点如图15所示。
本发明提供的CRISPR工具质粒中,Cas9或gRNA的启动子和终止子可以选自本领域任意可行的方案。在本发明的实施例中,Cas9的启动子为PTEF1,终止子为TCYC1。gRNA的启动子为PSNR52,终止子为TSUP4
本发明提供的CRISPR工具质粒用于切割酵母菌内天然存在的2μ质粒,本发明中,构建的2个CRISPR工具质粒分别为pCasREP2和pCasRAF1。其中:
pCasREP2的基因型为:pRS416_PTEF1-Cas9-TCYC1_PSNR52-gRNA.2μ.REP2-TSUP4-TCYC1
pCasRAF1的基因型为:pRS416_PTEF1-Cas9-TCYC1_PSNR52-gRNA.2μ.RAF1-TSUP4-TCYC1
本发明对CRISPR工具质粒的构建方法不做限定,其可以采用本领域熟知的任意手段制备获得。例如,对于核酸片段的获得,可以从已知的质粒中扩增获得,也可以采用其他任意人工合成的手段获得。对于核酸片段的来源,可以来自商业化的载体、菌株,本发明对此不做限定。作为一个实施例,本发明提供的CRISPR工具质粒的构建方法包括:
从质粒pNA0306中扩增获得Cas9表达模块(包括启动子,编码Cas9的核酸和终止子);
从质粒pNA0304中扩增获得含有gRNA片段(包括启动子、gRNA序列和终止子);
将Cas9表达模块、gRNA片段连接入骨架载体pRS416,获得所述CRISPR工具质粒。
本发明构建的Donor载体中,主要包括RAF1或REP2的同源片段。为了构建方便,还包括线性化的酶切位点。在本发明的实施例中,所述Donor质粒中连接有RFP片段,其为红色荧光蛋白。RFP在Donor质粒中可以作为表达的目标片段,在对其他目的片段进行表达时,可将其他片段对RFP片段进行替换。RFP在Donor质粒中也可作为荧光标记,在对其他目的片段进行表达时,将其他片段直接插入Donor质粒中。
本发明提供的Donor质粒用于导入目标基因,本发明中,构建的2个Donor质粒分别为pDonorRAF1和pDonorREP2。其中:
pDonorREP2的基因型为:pSB1C3_PTDH3-RFP-TADH1_KanMX6(RC)_TCPS1(RC)_homoREP2(RC)_TREP2(RC)。
pDonorRAF1的基因型为:pSB1C3_PTDH3-RFP-TADH1_KanMX6(RC)_TPGI1(RC)_homoRAF1(RC)_TRAF1(RC)
本发明对Donor质粒的构建方法不做限定,其可以采用本领域熟知的任意手段制备获得。例如,对于核酸片段的获得,可以从已知的质粒中扩增获得,也可以采用其他任意人工合成的手段获得。对于核酸片段的来源,可以来自商业化的载体、菌株,本发明对此不做限定。
作为一个实施例,本发明所述pDonorRAF1的构建方法包括:
从酵母CEN.PK2.1C基因组扩增获得RAF1同源臂A,和RAF1同源臂B和TPGI1,连接获得Tho片段;
从质粒pRS425RK中扩增获得KanMX6片段和rfp片段;
将Tho片段、KanMX6片段和rfp片段插入质粒pSB1C3获得pDonorRAF1。
作为一个实施例,本发明所述pDonor REP2的构建方法包括:
从酵母CEN.PK2.1C基因组扩增获得REP2同源片段1和REP2同源片段2;
从pDonorRAF1中酶切获得REP2同源片段3;
将REP2同源片段1、REP2同源片段2、REP2同源片段3连接入线性化的pDonorRAF1,获得pDonor REP2。
本发明所述的多拷贝基因表达质粒是在天然2μ质粒中引入目的片段。本发明对所述多拷贝基因表达质粒的制备方法不做限定,其可采用任意本领域熟知的手段制备获得。在本发明中,所述多拷贝基因表达质粒由所述CRISPR工具质粒和所述的Donor质粒对酿酒酵母编辑获得。在酵母菌中编辑获得所述的多拷贝基因表达质粒后,提取酵母质粒,转化入大肠杆菌中,对所述的多拷贝基因表达质粒进行扩增和保存。
本发明采用的试材皆为普通市售品,皆可于市场购得。
表1文中涉及缩写及简称
Figure BDA0002934610290000061
Figure BDA0002934610290000071
表2本发明中所构建及使用的所有质粒信息
Figure BDA0002934610290000072
Figure BDA0002934610290000081
表3本发明中相关的酿酒酵母
Figure BDA0002934610290000082
Figure BDA0002934610290000091
表4本发明中所用的引物及gRNA序列
Figure BDA0002934610290000092
Figure BDA0002934610290000101
下面结合实施例,进一步阐述本发明:
实施例
1、CRISPR工具质粒pCasRAF1,pCasE2μ的构建
pCasRAF1用于胞内编辑切割酿酒酵母野生内源2μ质粒以导入目的基因片段,pCasE2μ用于胞内编辑切割质粒pE2μRAF1以插入基因tpi1。
1)、pCasRAF1构建
以质粒pNA0306为模板,以18Q3-cas9-F,18Q3-cas9-R,利用PCR扩增出片段cas9(含有元件PTEF1-Cas9-TCYC1);
以pNA0304为模板,以18Q3-pSNR52-F,18Q0b-pSNR52-R为引物,利用PCR扩增出片段18Q0b-p;
以pNA0304为模板,以18Q0b-gRNA-F,18Q3-cyc1t-R为引物,利用PCR扩增出片段18Q0b-g;
以18Q0b-g和18Q0b-p的混合物为模板,以18Q3-cyc1t-R,18Q3-pSNR52-F为引物,通过OE-PCR的方式扩增得到片段18Q0b-pg;
将质粒pRS416用限制性内切酶NotI和KpnI处理,得到片段pRS416-KN;
片段cas9用限制性内切酶SphI和KpnI处理得到片段cas9-SK;片段18Q0b-pg用限制性内切酶SphI和NotI处理得到片段18Q0b-pg-SN。
将18Q0b-pg-SN,pRS416-KN,cas9-SK三个片段通过T4连接酶连接得到质粒pCasRAF1(图谱如图9)。
2)、pCasREP2构建
pCasREP2的构建与pCasRAF1的构建过程类似,其中片段cas9来自质粒pNA0306,包含gRNA及其启动子和终止子的片段来自质粒pNA0304。
3)、pCasE2μ的构建
以pNA0304为模板,以18Q3-pSNR52-F,18Q0l-pSNR52-R为引物,利用PCR扩增出片段18Q0l-p;
以pNA0304为模板,以18Q0l-gRNA-F,18Q3-cyc1t-R为引物,利用PCR扩增出片段18Q0l-g;
以18Q0l-g和18Q0l-p的混合物为模板,以18Q3-cyc1t-R,18Q3-pSNR52-F为引物,通过OE-PCR的方式扩增得到片段18Q0l-pg;
片段18Q0l-pg用限制性内切酶SphI和NotI处理得到片段18Q0l-pg-SN。将18Q0l-pg-SN,18Q0-SN两个个片段通过T4连接酶连接得到质粒pCasE2μ。
2、Donor质粒的构建
Donor质粒pDonorRAF1和pDonorDCA拥有两段野生2μ质粒的同源臂(TRAF1和homoRAF1),可通过同源重组,整合到2μ质粒上的RAF1基因的下游。两段同源臂之间添加了PmeI酶切位点,便于线性化。
1)pDonorRAF1构建
以CEN.PK2.1C的基因组为模板,以18Q2a-pgi1t-R,18Q2a-pgi1t-F为引物扩增出片段TGPI1
以CEN.PK2.1C的基因组为模板,以18Q2a-homodown-F和18Q2a-homodown-R为引物扩增出片段homoRAF1;
以CEN.PK2.1C的基因组为模板,以18Q2a-homoup-F和18Q2a-homoup-R为引物扩增出片段TRAF1
以homoRAF1,TGPI1和TRAF1的混合物为模板,以18Q2a-pgi1t-F和18Q2a-homoup-R为引物通过OE-PCR扩增得到片段Tho.
以pRS425RK为模板,以18Q4-pTDH3-F和18Q4-adh1t-R为引物扩增出片段rfp;
以pRS425RK为模板,以18Q4a-kanMX6-F和18Q4a-kanMX6-R为引物扩增出片段kan;
将片段Tho用限制性内切酶PstI和XbaI处理得到片段Tho-PX;片段rfp用EcoRI,XhoI处理得到片段rfp-EX;kan用XhoI和XbaI处理得到kan-XX;pSB1C3用PstI和EcoRI处理得到片段1C3-PE。
将片段Tho-PX,rfp-EX,kan-XX和1C3-PE用T4连接酶连接得到质粒pDonorRAF1(质粒图谱如图10)。
2)pDonorREP2构建
以CEN.PK2.1C的基因组为模板,以18Q4f0b-2u-F,18Q4f0b-2u-R为引物扩增出片段18Q4f0b;
以CEN.PK2.1C的基因组为模板,以18Q4f0-D-R,18C1a-cps1t-F为引物扩增出片段cps1t;
以18C1a-rep2-R,18Q4f0-D-F为引物扩增出rep2;以rep2,cps1t混合物为模板,以18Q4f0-D-F,18Q4f0-D-R为引物,通过OE-PCR扩增出片段18Q4f0a;
以pDonorRAF1为模板,18Q4f0-g418-F和18Q4f0-adh1t-F为引物扩增出片段18Q4f0c。
18Q4f0a用内切酶BamHI和XbaI处理得到片段18Q4f0a-BX;18Q4f0b用内切酶NotI,BamHI处理得到片段18Q4f0b-NB;18Q4f0c用XbaI,SalI处理得到18Q4f0c-XS;pDonorRAF1用NotI和SalI处理得到片段pDonor-NS。
将18Q4f0a-BX,18Q4f0b-NB,18Q4f0c-XS,pDonor-NS用T4连接酶连接得到质粒pDonorREP2(质粒图谱如图11)。
3)pDonorDCA构建
将pDonorRAF1用BsaI处理,得到片段pDonor-B;
将质粒质粒p425DCA用限制性内切酶BamHI,XhoI,BsaI处理,得到片段DCA-BX(包含DBR2基因、ADS基因和CYP71AV1基因)。
将pDonor-B与DCA-BX用T4连接酶连接得到质粒pDonorDCA(质粒图谱如图12)。3、酿酒酵母菌株及多拷贝基因表达质粒的构建
1)SyBE_Sc01130382和SyBE_Sc01130438的构建,及质粒pE2μRAF1,pE2μREP2的获取(如何构建pE2μ多拷贝质粒系统)
1.1菌株SyBE_Sc01130382和质粒pE2μRAF1的构建
将pDonorRAF1用PmeI处理,然后将所得片段(3μg)与质粒pCasRAF1(500ng)混合后转化至宿主菌株CEN.PK2.1C中,然后涂布在SC-ura+g418的固体培养平板上,于30℃下培养3天。
挑取红色单菌落,划线富集于SC-ura+g418的固体培养平板上,于30℃下培养1天。
利用菌落PCR进行验证,挑取正确的菌落至YPD液体中于30℃培养24h,将培养物涂布于5-FOA+g418固体培养平板上,30℃培养3天,以丢掉质粒pCasRAF1。
挑取单菌落,至YPD液体中于30℃培养12-16h,得到菌株SyBE_Sc01130382。
提取酵母菌株SyBE_Sc01130382的酵母质粒,回转至E.coliDH5α感受态细胞中,涂布于LB+Cm固体培养基中,37℃培养16h,挑取单菌落至LB+Cm液体培养基中,培养12h,存甘油菌,并提取培养物的质粒,获得pE2μRAF1(构建过程如图13)。
1.2菌株SyBE_Sc01130438和质粒pE2μREP2的构建
将pDonorREP2用PmeI处理,然后将所得片段(3μg)与质粒pCasREP2(500ng)混合后转化至宿主菌株CEN.PK2.1C中,然后涂布在SC-ura+g418的固体培养平板上,于30℃下培养3天。
挑取红色单菌落,划线富集于SC-ura+g418的固体培养平板上,于30℃下培养1天。
利用菌落PCR进行验证,挑取正确的菌落至YPD液体中于30℃培养24h,将培养物涂布于5-FOA+g418固体培养平板上,30℃培养3天,以丢掉质粒pCasREP2。
挑取单菌落,至YPD液体中于30℃培养12-16h,得到菌株SyBE_Sc01130438。
提取酵母菌株SyBE_Sc01130382的酵母质粒,回转至E.coliDH5α感受态细胞中,涂布于LB+Cm固体培养基中,37℃培养16h,挑取单菌落至LB+Cm液体培养基中,培养12h,存甘油菌,并提取培养物的质粒,获得pE2μREP2。
2)SyBE_Sc01130594的构建(△tpi1,PE2μRT)
以CEN.PK2.1C为模板,以20QRcT-F1,20QRcT-R1为引物,扩增出片段TPI1-1;
以TPI1-1为模板,以20QRcT-F2,20QRcT-R2为引物,扩增出片段TPI1-2;
以TPI1-2为模板,以20QRcT-F3,20QRcT-R3为引物,扩增出片段TPI1-3;
将TPI1-3(3μg)与pCasE2μ(500ng)混合后,转化至菌株SyBE_Sc01130382中,然后涂布在SC-ura+g418的固体培养平板上筛选,经菌落PCR验证后,得到中间菌株SyBE_Sc01130591。
以质粒p425DCA为模板,以20dTPI1-leu2-F1,20dTPI1-leu2-R1为引物,扩增出片段dTL-1;
以dTL-1为模板,以20dTPI1-leu2-F2,20dTPI1-leu2-R2为引物,扩增出片段dTL-2;
以dTL-2为模板,以20dTPI1-leu2-F3,20dTPI1-leu2-R3为引物扩增得到片段dTL-3。
将dTL-3转化至菌株SyBE_Sc01130591中,涂布于SC-leu固体培养平板上筛选,经菌落PCR验证后得到菌株SyBE_Sc01130594(质粒图谱如图14)。
3)SyBE_Sc01130343的构建
将pDonorDCA用PmeI处理,然后将所得片段(3μg)与质粒pCasRAF1(500ng)混合后转化至宿主菌株SyBE_Sc01130341中,然后涂布在SC-ura+g418的固体培养平板上筛选,经菌落PCR验证后,得到中间菌株SyBE_Sc01130343。
4)SyBE_Sc01130584的构建
将TPI1-3(3μg)与pCasE2μ(500ng)混合后,转化至菌株SyBE_Sc01130343中,然后涂布在SC-ura+g418的固体培养平板上筛选,经菌落PCR验证后,得到中间菌株SyBE_Sc01130582。
将dTL-3转化至菌株SyBE_Sc01130582中,涂布于SC-leu固体培养平板上筛选,经菌落PCR验证后得到菌株SyBE_Sc01130584
5)对照菌株SyBE_Sc01130534,SyBE_Sc01130366,SyBE_Sc01130530的构建
将质粒pRS425RK转化至CEN.PK2.1C中,涂布于SC-leu固体培养平板上筛选,挑取单菌落,得到菌株SyBE_Sc01130534;
将质粒p425DCA转化至菌株SyBE_Sc01130341中,涂布于SC-leu固体培养平板上筛选,挑取单菌落,得到菌株SyBE_Sc01130366。将质粒p425RT转化至CEN.PK2.1C中,涂布于SC-leu固体培养平板上筛选,挑取单菌落,得到中间菌株SyBE_Sc01130527,
以20dTPI1-his3-F1,20dTPI1-his3-R1为引物,扩增出片段dTH-1;以dTH-1为模板,以20dTPI1-his3-F2,20dTPI1-his3-R2为引物,扩增出片段dTH-2;以dTH-2为模板,以20dTPI1-his3-F3,20dTPI1-his3-R3为引物扩增得到片段dTH-3。将dTH-3转化至菌株SyBE_Sc01130527中,涂布于SC-his-leu固体培养平板上筛选,经菌落PCR验证后得到菌株SyBE_Sc01130530。
4、pE2μ多拷贝质粒系统表征(传代实验表征)
为了表征pE2μ多拷贝质粒系统的优良特性,本方案以rfp为报告基因,首先对菌株SyBE_Sc01130382与使用传统多拷贝质粒的进行过表达的菌株SyBE_Sc01130534,进行了质粒稳定性的测试。方法如下:
挑取SyBE_Sc01130382,SyBE_Sc01130438和SyBE_Sc01130534的单菌落,至YPD+G418液体培养基中,于30℃培养16h。之后以初始OD600=0.05转接至新鲜的YPD+G418液体培养基中,于30℃培养10h,该培养物记为0代样品,测定其荧光强度及OD600。将该培养物以初始OD600=0.05转接至新鲜的YPD,于30℃培养5代(至OD600=1.6-2.0,约10h,倍增时间约2h)。之后,再将培养物以OD600=0.05转接至新鲜的YPD,于30℃培养5代,依次类推培养30代。将0代,5代,10代,20代,30代的样品,用流式细胞仪(NovoCyte D2040R),测定荧光强度分布,用酶标仪(SpectraMAX M2,Molecular Devices)测定平均荧光强度。5代,10代,20代,30代样品经过10000倍稀释,涂布于YPD和YPD+G418固体培养平板上,30℃培养48h,记录菌落数,计算质粒存活率=菌落数(YPD+G418)/菌落数(YPD)。
表征结果如图1,2,3,4所示。在0代时(有筛选压的情况下),相较于使用传统2μ质粒(pRS425RK),使用pE2μ系统表达的RFP,细胞个体间的差异性更小(CV%更小),同时相对平均荧光强度也更高,其中使用pE2μRAF1的菌株的平均荧光强度是对照的3.67倍,使用pE2μREP2的菌株是3.42倍。pE2μ系列的质粒的平均拷贝数也更高,是对照的约1.67倍。
随着在YPD培养基中的传代实验的进行,所有的菌株都在30代后都有大量细胞丢失质粒。对照菌株在传了10代左右时88%-89%的细胞都丢失了质粒,而pE2μ系列的多拷贝质粒,10代的时候只有约20%-23%的细胞丢失了质粒。含pE2μ系列的质粒的菌株在没有筛选压力的条件下拥有更高的质粒稳定性。
5、pE2μ多拷贝质粒系统表征(必需基因tpi1的营养缺陷型优化的表征)
为了解决在没有筛选压条件下质粒会丢失的问题,本方案将必需基因tpi1导入质粒中并敲除了染色体上原有的质粒,使得丢失质粒的细胞在任何条件下都无法存活。
这一策略在使用传统2μ质粒的菌株和用pE2μ质粒系统的菌株上都进行了应用,构建出了菌株SyBE_Sc01130530和SyBE_Sc01130594。之后对这两株菌进行了长达90代的传代实验,并测定了其个体细胞荧光分布,以及拷贝数。结果显示,90代时,所有细胞在平板上均呈现红色,即SyBE_Sc01130530和SyBE_Sc01130594可以在90代无筛选压得培养下保持质粒不丢失。在0代时,SyBE_Sc01130594的拷贝数可以达到18.3,是没有经过优化的SyBE_Sc01130382的1.76倍,SyBE_Sc01130530的质粒拷贝数可达到10.8,是没有经过优化的SyBE_Sc01130534的1.80倍。使用pE2μ多拷贝质粒体系的菌株的质粒拷贝数依然比使用传统的2μ质粒菌株的质粒拷贝数高。经过90代的无筛选压传代实验,SyBE_Sc01130594和SyBE_Sc01130530的拷贝数均有所下降,不过SyBE_Sc01130594的拷贝数仅下降8.74%至16.7,而SyBE_Sc01130530的拷贝数则下降38.2%至6.67。而SyBE_Sc01130594的荧光分布比SyBE_Sc01130530的荧光分布更加收敛(CV%更低),SyBE_Sc01130594中每个细胞的质粒拷贝数更加均一,并且随着传代进行,SyBE_Sc01130594的CV%的上升幅度(提高20.2%)也小于SyBE_Sc01130530(提高37%)。
6、pE2μ多拷贝质粒系统表征(用pE2μ多拷贝质粒系统对二氢青蒿酸合成路径进行优化)
菌株SyBE_Sc01130366为对照菌株,用传统2μ质粒表达二氢青蒿酸合成关键基因ADS,CYP71AV1,DBR2。利用pE2μ多拷贝质粒系统过表达ADS,CYP71AV1,DBR2构建出菌株SyBE_Sc01130343,再通过将必需基因tpi1导入质粒并敲除染色体上的tpi1来进行优,构建出菌株SyBE_Sc01130584(CGMCC NO.21335)。
(1)培养基配制
发酵测试中所用所有培养基YPD培养基,其配方如下:
40g/L葡萄糖,酵母提取物10g/L,蛋白胨20g/L,无水MgSO4 4g/L
(2)种子培养
将菌株SyBE_Sc011300366在SC固体培养基(20g/L葡萄糖,6.7g/L酵母氮源,10ml/L氨基酸溶液,20mg/L腺嘌呤,20g/L琼脂粉)上划线分纯,SyBE_Sc01130584和SyBE_Sc01130343于YPD+G418的培养基上划线分纯,置于30℃培养3天。之后,挑取单菌落,接入3mL有筛选压得液体培养基(SyBE_Sc011300366接入SC-leu培养基,SyBE_Sc01130584和SyBE_Sc01130343于YPD+G418培养基中),于30℃培养16-20h,此时OD600值为5-8,以初始OD600=0.05转接至另一个含3ml液体培养基的试管中,置于30℃培养12-16h。
(3)摇瓶发酵过程
将上一步的培养物,以初始OD600=0.05转接到含25mlYPD培养基的药瓶中中,置于30℃摇床培养,摇床转速为200r/min。在36h左右补充625μl/瓶的无水乙醇,并加入5ml正十二烷进行萃取发酵,发酵条件依旧时30℃,摇床转速为200r/min。总共发酵时间为120小时。
(4)产物提取与测定
从摇瓶中取的样品,12000r/min离心,分离出上层IPM有机相,用甲醇溶解稀释20倍后进紫外-高效液相色谱进行产物测定。高效液相色谱仪器方法如下:色谱柱为ThermoC18高效液相色谱柱(4.6mm×150mm×5μm),柱温25℃;进样量为10μL,总流速为1mL/min,流动相A为乙腈+0.1%甲酸,流动相B为65%乙腈+0.1%甲酸水溶液,梯度程序如下:0-3min,维持0%A,100%B;3-10min A由0%均匀上升至100%;10-13min维持100%A;13min-15minA相由100%均匀下降至0%,并维持0%A,100%B至20min。
(5)摇瓶发酵结果如下图所示
使用pE2μ多拷贝质粒系统的菌株SyBE_Sc01130343的二氢青蒿酸产量达到519.2mg/L,而使用pC2μ质粒进行过表达仅仅产生131.0mg/L。经过必需基因tpi1优化的菌株(SyBE_Sc01130584)二氢青蒿酸的产量可进一步提高至620.9mg/L,青蒿酸的产量也由351mg/L升至390mg/L。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
参考文献
Christianson,T.W.,Sikorski,R.S.,Dante,M.,Shero,J.H.,and Hieter,P.(1992).Multifunctional yeast high-copy-number shuttle vectors.Gene 110(1),119-122.doi:10.1016/0378-1119(92)90454-w.
Futcher,A.B.(1986).Copy number amplification of the 2 micron circleplasmid of Saccharomyces cerevisiae.Journal of Theoretical Biology 119(2),197-204.
Gnügge,R.,and Rudolf,F.(2017).Saccharomyces cerevisiae Shuttlevectors.Yeast 34(5).
Karim,A.S.,Curran,K.A.,and Alper,H.S.(2013).Characterization ofplasmid burden and copy number in Saccharomyces cerevisiae for optimizationof metabolic engineering applications.Fems Yeast Research(1),1.
McQuaid,M.E.,Pinder,J.B.,Arumuggam,N.,Lacoste,Jessica S.C.,Chew,JoyceS.K.,and Dobso,M.J.(2017).The yeast 2-μm plasmid Raf protein contributes toplasmid inheritance by stabilizing the Rep1 and Rep2 partitioningproteins.Nucleic Acids Research.
Rizvi,S.M.A.,Prajapati,H.K.,and Ghosh,S.K.(2017).The 2 micronplasmid:a selfish genetic element with an optimized survival strategy withinSaccharomyces cerevisiae.Current Genetics.
Xie,Z.X.,Mitchell,L.A.,Liu,H.M.,Li,B.Z.,Liu,D.,Agmon,N.,et al.(2018).Rapid and Efficient CRISPR/Cas9-Based Mating-Type Switching of Saccharomycescerevisiae.G3(Bethesda)8(1),173-183.doi:10.1534/g3.117.300347.
Zeng,B.-X.,Yao,M.-D.,Wang,Y.,Xiao,W.-H.,and Yuan,Y.-J.(2020).Metabolic Engineering of Saccharomyces cerevisiae for EnhancedDihydroartemisinic Acid Production.Frontiers in Bioengineering andBiotechnology 8.
序列表
<110> 天津大学
<120> 质粒载体及其在构建多拷贝表达系统中的应用
<130> MP2034954
<160> 50
<170> SIPOSequenceListing 1.0
<210> 1
<211> 4140
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
atggacaaga agtactccat tgggctcgat atcggcacaa acagcgtcgg ctgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggcgcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagcttgtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcat 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga agagaacccg 600
atcaacgcat ccggagttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc ttcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctta acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgcccg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagaggc gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatgggatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460
gacatgtacg tggatcagga actggacatc aatcggctct ccgactacga cgtggatcat 2520
atcgtgcccc agtcttttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580
gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880
aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000
tatcccaagc ttgaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240
gcgacagtcc ggaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480
aaggaactgc tgggcatcac aatcatggag cgatcaagct tcgaaaaaaa ccccatcgac 3540
tttctcgagg cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gcttcccaag 3600
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720
cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780
caacacaaac actaccttga tgagatcatc gagcaaataa gcgaattctc caaaagagtg 3840
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960
cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080
gacctctctc agctcggtgg agacagcagg gctgacccca agaagaagag gaaggtgtga 4140
<210> 2
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
gaaaatcacg taatacttct gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct ttttttgttt tttatgtct 119
<210> 3
<211> 119
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gaaaatcacg taatacttct gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtggtgct ttttttgttt tttatgtct 119
<210> 4
<211> 249
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ttattataca ggttcaaata tactatctgt ttcagggaaa actcccaggt tcggatgttc 60
aaaattcaat gatgggtaac aagtacgatc gtaaatctgt aaaacagttt gtcggatatt 120
aggctgtatc tcctcaaagc gtattcgaat atcattgaga agctgcagcg tcacatcgga 180
taataatgat ggcagccatt gtagaagtgc cttttgcatt tctagtctct ttctcggtct 240
agctagttt 249
<210> 5
<211> 130
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ctacaaaatg aagcacagat gcttcgttaa caaagatatg ctattgaagt gcaagatgga 60
aacgcagaaa atgaaccggg gatgcgacgt gcaagattac ctatgcaata gatgcaatag 120
tttctccagg 130
<210> 6
<211> 382
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
tcatactctt gatgtgtttc ttgattttct gccccttacc ctcgttgcta ctctcctttt 60
tttcgtggga accgctttag ggccctcagt gatggtgttt tgtaatttat atgctcctct 120
tgcatttgtg tctctacttc ttgttcgcct ggagggaact tcttcatttg tattagcatg 180
gttcacttca gtccttcctt ccaactcact ctttttttgc tgtaaacgat tctctgccgc 240
cagttcattg aaactattga atatatcctt tagagattcc gggatgaata aatcacctat 300
taaagcagct tgacgatctg gtggaactaa agtaagcaat tgggtaacga cgcttacgag 360
cttcataaca tcttcttccg tt 382
<210> 7
<211> 163
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
cggatgaaag gtagtctagt acctcctgtg atattatccc attccatgcg gggtatcgta 60
tgcttccttc agcactaccc tttagctgtt ctatatgctg ccactcctca attggattag 120
tctcatcctt caatgctatc atttcctttg atattggatc ata 163
<210> 8
<211> 747
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
atggctagaa ctttctttgt cggtggtaac tttaaattaa acggttccaa acaatccatt 60
aaggaaattg ttgaaagatt gaacactgct tctatcccag aaaatgtcga agttgttatc 120
tgtcctccag ctacctactt agactactct gtctctttgg ttaagaagcc acaagtcact 180
gtcggtgctc aaaacgccta cttgaaggct tctggtgctt tcaccggtga aaactccgtt 240
gaccaaatca aggatgttgg tgctaagtgg gttattttgg gtcactccga aagaagatct 300
tacttccacg aagatgacaa gttcattgct gacaagacca agttcgcttt aggtcaaggt 360
gtcggtgtca tcttgtgtat cggtgaaact ttggaagaaa agaaggccgg taagactttg 420
gatgttgttg aaagacaatt gaacgctgtc ttggaagaag ttaaggactg gactaacgtc 480
gttgtcgctt acgaaccagt ctgggccatt ggtaccggtt tggctgctac tccagaagat 540
gctcaagata ttcacgcttc catcagaaag ttcttggctt ccaagttggg tgacaaggct 600
gccagcgaat tgagaatctt atacggtggt tccgctaacg gtagcaacgc cgttaccttc 660
aaggacaagg ctgatgtcga tggtttcttg gtcggtggtg cttctttgaa gccagaattt 720
gttgatatca tcaactctag aaactaa 747
<210> 9
<211> 51
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 9
taacgcggta ccagctcata gcttcaaaat gtttctactc cttttttact c 51
<210> 10
<211> 44
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 10
gagctcgcat gcccgcaaat taaagccttc gagcgtccca aaac 44
<210> 11
<211> 51
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 11
taatcgggca tgcgagctct ctttgaaaag ataatgtatg attatgcttt c 51
<210> 12
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 12
aaacaaatac atacattgtc ttccgatcat ttatctttca ctgcggagaa gtttcg 56
<210> 13
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 13
cggaagacaa tgtatgtatt tgttttagag ctagaaatag caagttaaaa taaggc 56
<210> 14
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 14
ggataagaat gcggccgcaa agccttcgag cgtcccaaaa c 41
<210> 15
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 15
gatcgaaaat cacgtaatac ttctgtttta gagctagaaa tagcaagtta aaataaggc 59
<210> 16
<211> 57
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 16
gctctaaaac agaagtatta cgtgattttc gatcatttat ctttcactgc ggagaag 57
<210> 17
<211> 54
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 17
acgtgcccga tcaactcgag tgccacctat cttcagtggc atgtgagatt ctcc 54
<210> 18
<211> 50
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 18
cattatggtg aaagttggaa cctcttacgt gcccgatcaa ctcgagtgcc 50
<210> 19
<211> 54
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 19
caaaaaatac gcccggtagt gatcttattt cattatggtg aaagttggaa cctc 54
<210> 20
<211> 53
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 20
ttaatgtcat gataataatg gtttcttgta aatctaccgt cccttacaag aac 53
<210> 21
<211> 57
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 21
gatacgccta tttttatagg ttaatgtcat gataataatg gtttcttgta aatctac 57
<210> 22
<211> 54
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 22
ttttatctga aattctgcct cgtgatacgc ctatttttat aggttaatgt catg 54
<210> 23
<211> 46
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 23
ccttttctgg catccagttt tgattcaaga aatatcttga ccgcag 46
<210> 24
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 24
cagcttcctc tattgatgtt acacctggac accccttttc tggcatccag ttttga 56
<210> 25
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 25
ttggtggaag attacccgtt ctaagacttt tcagcttcct ctattgatgt tacacc 56
<210> 26
<211> 47
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 26
aaaaagcgcc ttgctttttg tttgcaccat atcgactacg tcgtaag 47
<210> 27
<211> 58
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 27
ttcaattgtt aaatgctttt cttcttttta ttagaaaaag cgccttgctt tttgtttg 58
<210> 28
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 28
gttgatatag aggtgttcaa ttgttaaatg cttttcttct ttttattaga aaaagc 56
<210> 29
<211> 52
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 29
gttcggatgt gatgtgagaa ctggtagttt agtgtttttc ttccagtgcg ag 52
<210> 30
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 30
aaacgcggat ccaaatcgct cttaaatata tacctaaaga ac 42
<210> 31
<211> 54
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 31
ttacgcggat ccttattata caggttcaaa tatactatct gtttcaggga aaac 54
<210> 32
<211> 57
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 32
atctgtgctt cattttgtag gtttaaacta gctagaccga gaaagagact agaaatg 57
<210> 33
<211> 58
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 33
ttctcggtct agctagttta aacctacaaa atgaagcaca gatgcttcgt taacaaag 58
<210> 34
<211> 42
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 34
tttaggacta gtcctggaga aactattgca tctattgcat ag 42
<210> 35
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 35
ttaccggaat tcggatccga gaccagttta tcattatcaa tactgccatt tcaaagaat 59
<210> 36
<211> 51
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 36
acatacgtct cagtagctcg aggagaccgg tagaggtgtg gtcaataaga g 51
<210> 37
<211> 40
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 37
tacggtctag agatctgttt agcttgcctc gtccccgccg 40
<210> 38
<211> 43
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 38
tctaccggtc tcctcgagct actggatggc ggcgttagta tcg 43
<210> 39
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 39
tcataatggt ttcttagacg tcgttttaga gctagaaata gcaagttaaa ataagg 56
<210> 40
<211> 57
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 40
gctctaaaac gacgtctaag aaaccattat gatcatttat ctttcactgc ggagaag 57
<210> 41
<211> 29
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 41
gggcgtcgac agctttggac ttcttcgcc 29
<210> 42
<211> 45
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 42
aatggtctag acccggccag cgacatggag gcccagaata ccctc 45
<210> 43
<211> 56
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 43
cagatctcta gaccatttga cacttgattt gacacttctt ttttttttta tttatg 56
<210> 44
<211> 43
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 44
tcaataggat ccgtttaaac ggaagaagat gttatgaagc tcg 43
<210> 45
<211> 44
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 45
gtttaaacgg atcccggatg aaaggtagtc tagtacctcc tgtg 44
<210> 46
<211> 49
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 46
ttatagcggc cgcactagtt atgatccaat atcaaaggaa atgatagca 49
<210> 47
<211> 59
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 47
atcattgcgc actagtcata ctcttgatgt gtttcttgat tttctgcccc ttaccctcg 59
<210> 48
<211> 58
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 48
aaatcaagaa acacatcaag agtatgacta gtgcgcaatg attgaatagt caaagatt 58
<210> 49
<211> 9909
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 49
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga gggaactttc 240
accattatgg gaaatgcttc aagaaggtat tgacttaaac tccatcaaat ggtcaggtca 300
ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc aatatcaaat 360
taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt gccctcctcc 420
ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc cattagtatc 480
aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat aaatgtatgt 540
agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa tttcgtgtcg 600
tttctattat gaatttcatt tataaagttt atgtacaaat atcataaaaa aagagaatct 660
ttttaagcaa ggattttctt aacttcttcg gcgacagcat caccgacttc ggtggtactg 720
ttggaaccac ctaaatcacc agttctgata cctgcatcca aaaccttttt aactgcatct 780
tcaatggcct taccttcttc aggcaagttc aatgacaatt tcaacatcat tgcagcagac 840
aagatagtgg cgatagggtc aaccttattc tttggcaaat ctggagcaga accgtggcat 900
ggttcgtaca aaccaaatgc ggtgttcttg tctggcaaag aggccaagga cgcagatggc 960
aacaaaccca aggaacctgg gataacggag gcttcatcgg agatgatatc accaaacatg 1020
ttgctggtga ttataatacc atttaggtgg gttgggttct taactaggat catggcggca 1080
gaatcaatca attgatgttg aaccttcaat gtagggaatt cgttcttgat ggtttcctcc 1140
acagtttttc tccataatct tgaagaggcc aaaagattag ctttatccaa ggaccaaata 1200
ggcaatggtg gctcatgttg tagggccatg aaagcggcca ttcttgtgat tctttgcact 1260
tctggaacgg tgtattgttc actatcccaa gcgacaccat caccatcgtc ttcctttctc 1320
ttaccaaagt aaatacctcc cactaattct ctgacaacaa cgaagtcagt acctttagca 1380
aattgtggct tgattggaga taagtctaaa agagagtcgg atgcaaagtt acatggtctt 1440
aagttggcgt acaattgaag ttctttacgg atttttagta aaccttgttc aggtctaaca 1500
ctaccggtac cccatttagg accagccaca gcacctaaca aaacggcatc aaccttcttg 1560
gaggcttcca gcgcctcatc tggaagtggg acacctgtag catcgatagc agcaccacca 1620
attaaatgat tttcgaaatc gaacttgaca ttggaacgaa catcagaaat agctttaaga 1680
accttaatgg cttcggctgt gatttcttga ccaacgtggt cacctggcaa aacgacgatc 1740
ttcttagggg cagacatagg ggcagacatt agaatggtat atccttgaaa tatatatata 1800
tattgctgaa atgtaaaagg taagaaaagt tagaaagtaa gacgattgct aaccacctat 1860
tggaaaaaac aataggtcct taaataatat tgtcaacttc aagtattgtg atgcaagcat 1920
ttagtcatga acgcttctct attctatatg aaaagccggt tccggcctct cacctttcct 1980
ttttctccca atttttcagt tgaaaaaggt atatgcgtca ggcgacctct gaaattaaca 2040
aaaaatttcc agtcatcgaa tttgattctg tgcgatagcg cccctgtgtg ttctcgttat 2100
gttgaggaaa aaaataatgg ttgctaagag attcgaactc ttgcatctta cgatacctga 2160
gtattcccac agttaactgc ggtcaagata tttcttgaat caggcgcctt agaccgctcg 2220
gccaaacaac caattacttg ttgagaaata gagtataatt atcctataaa tataacgttt 2280
ttgaacacac atgaacaagg aagtacagga caattgattt tgaagagaat gtggattttg 2340
atgtaattgt tgggattcca tttttaataa ggcaataata ttaggtatgt ggatatacta 2400
gaagttctcc tcgaccgtcg atatgcggtg tgaaataccg cacagatgcg taaggagaaa 2460
ataccgcatc aggaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt 2520
taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa 2580
gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag 2640
aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt 2700
gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac 2760
cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag 2820
gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg 2880
cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc gcgccattcg 2940
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 3000
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 3060
cagtcacgac gttgtaaaac gacggccagt gagcgcgcgt aatacgactc actatagggc 3120
gaattgggta ccgggccccc cctcgaggag accggtagag gtgtggtcaa taagagcgac 3180
ctcatgctat acctgagaaa gcaacctgac ctacaggaaa gagttactca agaataagaa 3240
ttttcgtttt aaaacctaag agtcacttta aaatttgtat acacttattt tttttataac 3300
ttatttaata ataaaaatca taaatcataa gaaattcgct tatttagaag tgtcaacaac 3360
gtatctacca acgatttgac ccttttccat cttttcgtaa atttctggca aggtagacaa 3420
gccgacaacc ttgattggag acttgaccaa acctctggcg aagaagtcca aagctgtcga 3480
cgcccttggt ctcactcatt atttatataa ttcatccata ccaccagttg aatgtctacc 3540
ttcagctctt tcatattgtt caacaatagt ataatcttca ttatgtgaag taatatccaa 3600
tttaatatta acattataag cacctggtaa ttgaactggt tttttagctt tataagtagt 3660
tttaacttca gcatcataat gaccaccatc ttttaatttc aatctttgtt taatttcacc 3720
ttttaaagca ccatcttctg gatacattct ttctgatgaa gcttcccaac ccatagtttt 3780
tttttgcata actggaccat ctgatggaaa attagtacct ctcaatttaa ctttataaat 3840
aaattcacca tcttgtaatg atgaatcttg agtaacagta acaacaccac catcttcaaa 3900
attcataact ctttcccatt taaaaccttc tggaaatgac aattttaaat aatctggaat 3960
atcagctgga tgtttaacat aagcttttga accatacata aattgtggtg acaaaatatc 4020
ccaagcaaat ggtaatggac cacctttagt aactttcaat ttagcagttt gagtaccttc 4080
atatggtcta ccttcacctt caccttcaat ttcaaattca tgaccattaa ctgaaccttc 4140
catatgaact ttaaatctca taaattcttt aataatagcc atattatctt cttcaccttt 4200
tgaaaccatt tgagacctct agatatagtt ttttctcctt gacgttaaag tatagaggta 4260
tattaacaat tttttgttga tacttttatg acatttgaat ttgctaagga atatacttac 4320
attcatggtt gtttgtaaat actgctgggt gcagcttttc catttatata cttattagtc 4380
aagtagggga ataatttcag ggaactggtt tcaacctttt ttttcagctt tttccaaatc 4440
agagagagca gaaggtaata gaaggtgtaa gaaaatgaga tagatacatg cgtgggtcaa 4500
ttgccttgtg tcatcattta ctccaggcag gttgcatcac tccattgagg ttgtgcccgt 4560
tttttgcctg tttgtgcccc tgttctctgt agttgcgcta agagaatgga cctatgaact 4620
gatggttggt gaagaaaaca atattttggt gctgggattc tttttttttc tggatgccag 4680
cttaaaaagc gggctccatt atatttagtg gatgccagga ataaactgtt cacccagaca 4740
cctacgatgt tatatattct gtgtaacccg ccccctattt tgggcatgta cgggttacag 4800
cagaattaaa aggctaattt tttgactaaa taaagttagg aaaatcacta ctattaatta 4860
tttacgtatt ctttgaaatg gcagtattga taatgataaa ctggtctcgg atcccagtat 4920
agcgaccagc attcacatac gattgacgca tgatattact ttctgcgcac ttaacttcgc 4980
atctgggcag atgatgtcga ggcgaaaaaa aatataaatc acgctaacat ttgattaaaa 5040
tagaacaact acaatataaa aaaactatac aaatgacaag ttcttgaaaa caagaatctt 5100
tttattgtca gtactgatta gaaaaactca tcgagcatca aatgaaactg caatttattc 5160
atatcaggat tatcaatacc atatttttga aaaagccgtt tctgtaatga aggagaaaac 5220
tcaccgaggc agttccatag gatggcaaga tcctggtatc ggtctgcgat tccgactcgt 5280
ccaacatcaa tacaacctat taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa 5340
tcaccatgag tgacgactga atccggtgag aatggcaaaa gcttatgcat ttctttccag 5400
acttgttcaa caggccagcc attacgctcg tcatcaaaat cactcgcatc aaccaaaccg 5460
ttattcattc gtgattgcgc ctgagcgaga cgaaatacgc gatcgctgtt aaaaggacaa 5520
ttacaaacag gaatcgaatg caaccggcgc aggaacactg ccagcgcatc aacaatattt 5580
tcacctgaat caggatattc ttctaatacc tggaatgctg ttttgccggg gatcgcagtg 5640
gtgagtaacc atgcatcatc aggagtacgg ataaaatgct tgatggtcgg aagaggcata 5700
aattccgtca gccagtttag tctgaccatc tcatctgtaa catcattggc aacgctacct 5760
ttgccatgtt tcagaaacaa ctctggcgca tcgggcttcc catacaatcg atagattgtc 5820
gcacctgatt gcccgacatt atcgcgagcc catttatacc catataaatc agcatccatg 5880
ttggaattta atcgcggcct cgaaacgtga gtcttttcct tacccaggtt gtttatgttc 5940
ggatgtgatg tgagaactgt atcctagcaa gattttaaaa ggaagtatat gaaagaagaa 6000
cctcagtggc aaatcctaac cttttatatt tctctacagg ggcgcggcgt ggggacaatt 6060
caacgcgtct gtgaggggag cgtttccctg ctcgcaggtc tgcagcgagg agccgtaatt 6120
tttgcttcgc gccgtgcggc catcaaaatg tatggatgca aatgattata catggggatg 6180
tatgggctaa atgtacgggc gacagtcaca tcatgcccct gagctgcgca cgtcaagact 6240
gtcaaggagg gtattctggg cctccatgtc gcggccgcca ccgcggtgga gctccagctt 6300
ttgttccctt tagtgagggt taattgcgcg cttggcgtaa tcatggtcat agctgtttcc 6360
tgtgtgaaat tgttatccgc tcacaattcc acacaacata ggagccggaa gcataaagtg 6420
taaagcctgg ggtgcctaat gagtgaggta actcacatta attgcgttgc gctcactgcc 6480
cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 6540
gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 6600
ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 6660
agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 6720
ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 6780
caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 6840
gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 6900
cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta 6960
tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 7020
gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 7080
cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 7140
tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 7200
tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 7260
caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 7320
aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 7380
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 7440
ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc 7500
tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc 7560
atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc 7620
tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc 7680
aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc 7740
catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt 7800
gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc 7860
ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa 7920
aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt 7980
atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg 8040
cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc 8100
gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa 8160
agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt 8220
gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt 8280
caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag 8340
ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta 8400
tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat 8460
aggggttccg cgcacatttc cccgaaaagt gccacctgaa cgaagcatct gtgcttcatt 8520
ttgtagaaca aaaatgcaac gcgagagcgc taatttttca aacaaagaat ctgagctgca 8580
tttttacaga acagaaatgc aacgcgaaag cgctatttta ccaacgaaga atctgtgctt 8640
catttttgta aaacaaaaat gcaacgcgag agcgctaatt tttcaaacaa agaatctgag 8700
ctgcattttt acagaacaga aatgcaacgc gagagcgcta ttttaccaac aaagaatcta 8760
tacttctttt ttgttctaca aaaatgcatc ccgagagcgc tatttttcta acaaagcatc 8820
ttagattact ttttttctcc tttgtgcgct ctataatgca gtctcttgat aactttttgc 8880
actgtaggtc cgttaaggtt agaagaaggc tactttggtg tctattttct cttccataaa 8940
aaaagcctga ctccacttcc cgcgtttact gattactagc gaagctgcgg gtgcattttt 9000
tcaagataaa ggcatccccg attatattct ataccgatgt ggattgcgca tactttgtga 9060
acagaaagtg atagcgttga tgattcttca ttggtcagaa aattatgaac ggtttcttct 9120
attttgtctc tatatactac gtataggaaa tgtttacatt ttcgtattgt tttcgattca 9180
ctctatgaat agttcttact acaatttttt tgtctaaaga gtaatactag agataaacat 9240
aaaaaatgta gaggtcgagt ttagatgcaa gttcaaggag cgaaaggtgg atgggtaggt 9300
tatataggga tatagcacag agatatatag caaagagata cttttgagca atgtttgtgg 9360
aagcggtatt cgcaatattt tagtagctcg ttacagtccg gtgcgttttt ggttttttga 9420
aagtgcgtct tcagagcgct tttggttttc aaaagcgctc tgaagttcct atactttcta 9480
gagaatagga acttcggaat aggaacttca aagcgtttcc gaaaacgagc gcttccgaaa 9540
atgcaacgcg agctgcgcac atacagctca ctgttcacgt cgcacctata tctgcgtgtt 9600
gcctgtatat atatatacat gagaagaacg gcatagtgcg tgtttatgct taaatgcgta 9660
cttatatgcg tctatttatg taggatgaaa ggtagtctag tacctcctgt gatattatcc 9720
cattccatgc ggggtatcgt atgcttcctt cagcactacc ctttagctgt tctatatgct 9780
gccactcctc aattggatta gtctcatcct tcaatgctat catttccttt gatattggat 9840
catactaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc 9900
cctttcgtc 9909
<210> 50
<211> 13444
<212> DNA
<213> 人工序列(Artificial sequence)
<400> 50
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatcga ctacgtcgta aggccgtttc tgacagagta aaattcttga gggaactttc 240
accattatgg gaaatgcttc aagaaggtat tgacttaaac tccatcaaat ggtcaggtca 300
ttgagtgttt tttatttgtt gtattttttt ttttttagag aaaatcctcc aatatcaaat 360
taggaatcgt agtttcatga ttttctgtta cacctaactt tttgtgtggt gccctcctcc 420
ttgtcaatat taatgttaaa gtgcaattct ttttccttat cacgttgagc cattagtatc 480
aatttgctta cctgtattcc tttactatcc tcctttttct ccttcttgat aaatgtatgt 540
agattgcgta tatagtttcg tctaccctat gaacatattc cattttgtaa tttcgtgtcg 600
tttctattat gaatttcatt tataaagttt atgtacaaat atcataaaaa aagagaatct 660
ttttaagcaa ggattttctt aacttcttcg gcgacagcat caccgacttc ggtggtactg 720
ttggaaccac ctaaatcacc agttctgata cctgcatcca aaaccttttt aactgcatct 780
tcaatggcct taccttcttc aggcaagttc aatgacaatt tcaacatcat tgcagcagac 840
aagatagtgg cgatagggtc aaccttattc tttggcaaat ctggagcaga accgtggcat 900
ggttcgtaca aaccaaatgc ggtgttcttg tctggcaaag aggccaagga cgcagatggc 960
aacaaaccca aggaacctgg gataacggag gcttcatcgg agatgatatc accaaacatg 1020
ttgctggtga ttataatacc atttaggtgg gttgggttct taactaggat catggcggca 1080
gaatcaatca attgatgttg aaccttcaat gtagggaatt cgttcttgat ggtttcctcc 1140
acagtttttc tccataatct tgaagaggcc aaaagattag ctttatccaa ggaccaaata 1200
ggcaatggtg gctcatgttg tagggccatg aaagcggcca ttcttgtgat tctttgcact 1260
tctggaacgg tgtattgttc actatcccaa gcgacaccat caccatcgtc ttcctttctc 1320
ttaccaaagt aaatacctcc cactaattct ctgacaacaa cgaagtcagt acctttagca 1380
aattgtggct tgattggaga taagtctaaa agagagtcgg atgcaaagtt acatggtctt 1440
aagttggcgt acaattgaag ttctttacgg atttttagta aaccttgttc aggtctaaca 1500
ctaccggtac cccatttagg accagccaca gcacctaaca aaacggcatc aaccttcttg 1560
gaggcttcca gcgcctcatc tggaagtggg acacctgtag catcgatagc agcaccacca 1620
attaaatgat tttcgaaatc gaacttgaca ttggaacgaa catcagaaat agctttaaga 1680
accttaatgg cttcggctgt gatttcttga ccaacgtggt cacctggcaa aacgacgatc 1740
ttcttagggg cagacatagg ggcagacatt agaatggtat atccttgaaa tatatatata 1800
tattgctgaa atgtaaaagg taagaaaagt tagaaagtaa gacgattgct aaccacctat 1860
tggaaaaaac aataggtcct taaataatat tgtcaacttc aagtattgtg atgcaagcat 1920
ttagtcatga acgcttctct attctatatg aaaagccggt tccggcctct cacctttcct 1980
ttttctccca atttttcagt tgaaaaaggt atatgcgtca ggcgacctct gaaattaaca 2040
aaaaatttcc agtcatcgaa tttgattctg tgcgatagcg cccctgtgtg ttctcgttat 2100
gttgaggaaa aaaataatgg ttgctaagag attcgaactc ttgcatctta cgatacctga 2160
gtattcccac agttaactgc ggtcaagata tttcttgaat caggcgcctt agaccgctcg 2220
gccaaacaac caattacttg ttgagaaata gagtataatt atcctataaa tataacgttt 2280
ttgaacacac atgaacaagg aagtacagga caattgattt tgaagagaat gtggattttg 2340
atgtaattgt tgggattcca tttttaataa ggcaataata ttaggtatgt ggatatacta 2400
gaagttctcc tcgaccgtcg atatgcggtg tgaaataccg cacagatgcg taaggagaaa 2460
ataccgcatc aggaaattgt aaacgttaat attttgttaa aattcgcgtt aaatttttgt 2520
taaatcagct cattttttaa ccaataggcc gaaatcggca aaatccctta taaatcaaaa 2580
gaatagaccg agatagggtt gagtgttgtt ccagtttgga acaagagtcc actattaaag 2640
aacgtggact ccaacgtcaa agggcgaaaa accgtctatc agggcgatgg cccactacgt 2700
gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc gtaaagcact aaatcggaac 2760
cctaaaggga gcccccgatt tagagcttga cggggaaagc cggcgaacgt ggcgagaaag 2820
gaagggaaga aagcgaaagg agcgggcgct agggcgctgg caagtgtagc ggtcacgctg 2880
cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac agggcgcgtc gcgccattcg 2940
ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc 3000
cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc 3060
cagtcacgac gttgtaaaac gacggccagt gagcgcgcgt aatacgactc actatagggc 3120
gaattgggta ccgggccccc cctcgagcat gccggtagag gtgtggtcaa taagagcgac 3180
ctcatgctat acctgagaaa gcaacctgac ctacaggaaa gagttactca agaataagaa 3240
ttttcgtttt aaaacctaag agtcacttta aaatttgtat acacttattt tttttataac 3300
ttatttaata ataaaaatca taaatcataa gaaattcgct ttaaaaacta gggaccaata 3360
gcaattctgt tttacgttgc attgttgcac ctgaactttc cgtcatgtca atttgatcat 3420
atgaaactcc attgggcaac ttccagttga aatgataaag aatgttggct agtggcagtt 3480
gaacattggc caaacctaac gcagcgccag gacacatacg acgtccagcc ccaaatggta 3540
aatattcata ttcggcgccc atcactgttg ccgaagagtt ttcaaatctt tcaggtataa 3600
acgcttctgc atccttccag tattcaggat ctctattgat cgcaaacaca ttaacgatta 3660
atttcgtttt gttagggata ttataaccag ccaagtttac tggctgacga cattctctag 3720
gtagcactaa cggcaagggt gggtgtagtc taagagtctc tttgatgacc atattcaagt 3780
aggacaattc ttgtatatct tcttcatgta ttttttcttt cccattcaag gccttacgta 3840
attcagcctg aaccttttcc attgctttcg gacattttat tagctcgctt atagcccatt 3900
ctatggtaga acttgaagtg tcggtccctg caccgaacat gtccaaaatt attgctttga 3960
tattatccga agtcagagga aactcagcag aatcctttaa tctaagtaat acatctaata 4020
gggtttcgtt ggttttggat gacgtattta cggtatgttc agctaccaaa ttgtcaatta 4080
agttatcaat ctttttacgt aggctagtta atcttgctct cttaccgctc aagtgatgca 4140
agaacttttt agatgggaaa atatcggcaa catcgaaacc gcctgtttgt ctcagtattt 4200
ctttaacaat ttcagtaagt tccttttgat ctttaattcc cttaccaaac gcagcacggg 4260
atagtatagt ggcaattagt ttaaaaacgt tttcacttaa atttactggt ctaccactac 4320
ctgaagcctt tatttcctgg actaaattcc aacattcttc ttccctcaac gattgaaatg 4380
acttaacctt ttttacagac aacaattcaa gagtacaaat cttccttaat tgtctccagt 4440
attccccata tggagcaagg acaacatcag tgttatgata taaaactatt tccccagtta 4500
aagtttcggg tctattagcg aaagtaatat cgtaggttgt aagaatttcc ttagcccact 4560
taggactcga cacgactatt gtgggtacct ctcccaattg aaggtgcatt agcgaaccat 4620
attttctcgc taaatccctt acacccctgt gtggtgtggt tccgatcaaa tggtgcatgt 4680
gaccaatgat gggtagcctc caaggttccg gcaaggactt tttagttgac ttacttctag 4740
tggcaaattt gtacacgaac aacaaaatag ttgctaaagc aataaaaact gctaataaca 4800
gagccatttt tgagggaata ttcaactgtt tttttttatc atgttgatgc tctgcataat 4860
aatgcccata aatatttccg acctgctttt atatctttgc tagccaaact aactgaacat 4920
agctacacat tattttcagc ttggctattt tgtgaacact gtatagccag tccttcggat 4980
cacggtcaac agttgtccga gcgctttttg gaccctttcc cttatttttg ggttaaggaa 5040
aatgacagaa aatatatcta atgagccttc gctcaacagt gctccgaagt atagctttcc 5100
aaaaggagag gcaaagcaat ttaagaatgt atgaacaaaa taaaggggaa aaattacccc 5160
ctctacttta ccaaacgaat actaccaata atatttacaa cttttcctta tgattttttc 5220
actgaagcgc ttcgcaatag ttgtgagcga tatcaaaagt aacgaaatga acttcgcggc 5280
tcgtgctata ttcttgttgc taccgtccat atctttccat agattttcaa tctttgatgt 5340
ctccatggtg gtacagagaa cttgtaaaca attcggtccc tacatgtgag gaaattcgct 5400
gtgacacttt tatcactgaa ctccaaattt aaaaaatagc ataaaattcg ttatacagca 5460
aatctatgtg ttgcaattaa gaactaaaag atatagagtg catattttca agaaggatag 5520
taagctggca aatctgcaga acgaacgcag aattttcgag ttattaaact taaaatacgc 5580
tgaacccgaa catagaaata tcgagaaaaa aaaactgcat aaaggcatta aaagaggagc 5640
gaattttttt ttaataaaaa tcttaataat cattaaaaga taaataatag tctatatata 5700
cgtatataaa taaaaaatat tcaaaaaata aaataaacta ttattttagc gtaaaggatg 5760
gggaaagaga aaagaaaaaa attgatctat cgatttcaat tcaattcaat ttagatagac 5820
attgggtaaa ccaacaaaga cttgatcaag tgcttgtatt cgtcacccat tctagtgaag 5880
ttgtccttac cagcgtattg aacttccaag aattgacaca agtagataac agccatcaac 5940
aatggtcttg ggatgttctt agtagtcaag tattctctgt tgatgtcctt ccaaacgtct 6000
tcaacttcct tgtagatcaa agtttgagcg tattcttcgt taacgttgta ttccttcatg 6060
taagattcca aagaagaaga agagtgcttt ctttcttgtt cagccttgtg agtcatcaag 6120
tcgttcaatc ttctacccaa gataccagag tatctgaaca atggtggagc agaaacagcc 6180
cattcaacag attccttagt gaagatgtca gacataccca agtaacaagt agtagtcaac 6240
aagttagcac caccagtgat gataacaact gggtcgtgtt cttcagtagt tgggatgtga 6300
ccttcgttag cccacttagc ttcaaccatc aagtttctaa cgaattcctt aacgaattcc 6360
ttaccacagt tgaacaagtc agttctacct tccttagcca agaattcttc catttcagtg 6420
taagtgtcca tgaacaactt gtagattggc ttcatgtatt ctggcaaagt gtccaaacaa 6480
gtgatagacc atctttcaac agcttcagtg aagatcttca attcttcgta agtaccgtaa 6540
gcgtcgtaag tgtcgtcgat caaagtgata acagcaacag ccttagtgaa gaaaactcta 6600
gctctagagt attgtggttc gtaaccagaa cccaaacccc agaagtaaca ttcaacgatt 6660
ctgtctctca aacatggagc gttcttcttg atgtcgaaag ccttccacca cttacaaacg 6720
tgagacaatt cttccttgtg caaagattgc aacaagttga attccaactt agccaacttc 6780
aacaaagtct tgttgtgaga gtcttgttgt tggtagaatg ggatgtattg agcagcttcg 6840
attcttggca atctcttcca caatggttgc ttcaaagctc tttggatttc agtgaacaaa 6900
gctgggttag tagagaaagc gtccttagtc atgatagaca atctagatct agtgaaaccc 6960
aaagcgtctt ccaagatgat ttcacctgga actctcatag aagtagcttc gtacaattcc 7020
aacaaacctt caacgtcgtt agccaaagat tgcttgaaag caccgttctt gtccttgtag 7080
ttgttgaaaa cgtcacaagt aacgtagtaa ccttgctttc tcatcaatct gaaccacaaa 7140
gaagatctgt caccgttcca gttgtcaccg taagtttcgt agatacattg caaagcgtgg 7200
tcgatttctc tttcgaagtg gtatgggata cccaatcttt ggatttcgtc gatcaacttc 7260
aacaagttag cgtgcttcat tgggatgtcc aaagcttcct tcaacaattg tctaacttcc 7320
ttcttcaagt cgttaacgat ttgttcaaca ccttgttcaa cttgcttttc gtagatcaag 7380
aattggtcac cccagataga tggtgggaag ttagcgattg gtctgattgg cttttcttca 7440
gtcaaagaca ttatagtttt ttctccttga cgttaaagta tagaggtata ttaacaattt 7500
tttgttgata cttttatgac atttgaataa gaagtaatac aaaccgaaaa tgttgaaagt 7560
attagttaaa gtggttatgc agcttttgca tttatatatc tgttaataga tcaaaaatca 7620
tcgcttcgct gattaattac cccagaaata aggctaaaaa actaatcgca ttattatcct 7680
atggttgtta atttgattcg ttgatttgaa ggtttgtggg gccaggttac tgccaatttt 7740
tcctcttcat aaccataaaa gctagtattg tagaatcttt attgttcgga gcagtgcggc 7800
gcgaggcaca tctgcgtttc aggaacgcga ccggtgaaga ccaggacgca cggaggagag 7860
tcttccgtcg gagggctgtc gcccgctcgg cggcttctaa tccgtacttc aatatagcaa 7920
tgagcagtta agcgtattac tgaaagttcc aaagagaagg tttttttagg ctaagataat 7980
ggggctcttt acatttccac aacatataag taagattaga tatggatatg tatatggtgg 8040
tattgccatg taatatgatt attaaacttc tttgcgtcca tccaaaaaaa aagtaagaat 8100
ttttgaaaat tcaatataaa tgtctgaaaa gccaaccttg ttctctgctt acaagatggg 8160
taacttcaac ttgtctcaca gagttgtttt ggctccaatg accagatgta gagctatcaa 8220
cgctatccca aacgaagctt tggttgaata ctacagacaa agatctaccg ctggtggttt 8280
cttgatcacc gaaggtacca tgatctctcc atcttctgct ggtttcccac acgttccagg 8340
tatcttcacc aaggaacaag ttgaaggttg gaagaaggtt gttgacgctg ctcacaagga 8400
aggtgctgtt atcttctgtc aattgtggca cgttggtaga gcttctcaca aggtttacca 8460
accaggtggt gctgctccaa tctcttctac ctctaagcca atctctaaga agtgggaaat 8520
cttgttgcca gacgctacct acggtaccta cccagaacca agaccattgg ctgctaacga 8580
aatcttggaa gttgttgaag actacagagt tgctgctatc aacgctatcg aagctggttt 8640
cgacggtatc gaaatccacg gtgctcacgg ttacttgttg gaccaattca tgaaggacgg 8700
tatcaacgac agaaccgacg aatacggtgg ttctttggaa aacagatgta agttcatctt 8760
gcaagttgtt caagctgttt ctgctgctat cggtaccgac agagttggta tcagaatctc 8820
tccagctatc gaccacaccg acgctatgga ctctgaccca agatctttgg gtttggctgt 8880
tatcgaaaga ttgaacaagt tgcaattcaa gttgggttct agattggctt acttgcacgt 8940
tacccaacca agatacaccg ctgacggtca cggtcaaacc gaagctggtg ctaacggttc 9000
tgaccacgaa gaagaagttg ctcaattgat gaagacctgg agaggtgctt acgttggtac 9060
cttcatctgt tgtggtggtt acaccagaga attgggtttg caagctgttg ctcaaggtga 9120
cgctgacttg gttgctttcg gtagatactt catctctaac ccagacttgg ttttgagatt 9180
gaagttgaac gctccattga acagatacga cagagctacc ttctacaccc acgacccagt 9240
tgttggttac accgactacc catctttgga ccaaggttct ttgttgtaaa caggcccctt 9300
ttcctttgtc gatatcatgt aattagttat gtcacgctta cattcacgcc ctccccccac 9360
atccgctcta accgaaaagg aaggagttag acaacctgaa gtctaggtcc ctatttattt 9420
ttttatagtt atgttagtat taagaacgtt atttatattt caaatttttc ttttttttct 9480
gtacaaacgc gtgtacgcat gtaacattat actgaaaacc ttgcttgaga aggttttggg 9540
acgctcgaag gctttaattt gcaagcttcg cagtttacac tctcatcgtc gctctcatca 9600
tcgcttccgt tgttgttttc cttagtagcg tctgcttcca gagagtattt atctcttatt 9660
acctctaaag gttctgcttg atttctgact ttgttcgcct catgtgcata tttttcttgg 9720
ttcttttggg acaaaatatg cgtaaaggac ttttgttgtt ccctcacatt ccagtttagt 9780
tgtcgacgga tccactagtt ctagagcggc cgccaccgcg gtggagctcc agcttttgtt 9840
ccctttagtg agggttaatt gcgcgcttgg cgtaatcatg gtcatagctg tttcctgtgt 9900
gaaattgtta tccgctcaca attccacaca acataggagc cggaagcata aagtgtaaag 9960
cctggggtgc ctaatgagtg aggtaactca cattaattgc gttgcgctca ctgcccgctt 10020
tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag 10080
gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg 10140
ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat 10200
caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta 10260
aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa 10320
atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc 10380
cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt 10440
ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca 10500
gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg 10560
accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat 10620
cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta 10680
cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct 10740
gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac 10800
aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa 10860
aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa 10920
actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt 10980
taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca 11040
gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca 11100
tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc 11160
ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa 11220
accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc 11280
agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca 11340
acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat 11400
tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag 11460
cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac 11520
tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt 11580
ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt 11640
gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc 11700
tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat 11760
ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca 11820
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 11880
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 11940
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 12000
ttccgcgcac atttccccga aaagtgccac ctgaacgaag catctgtgct tcattttgta 12060
gaacaaaaat gcaacgcgag agcgctaatt tttcaaacaa agaatctgag ctgcattttt 12120
acagaacaga aatgcaacgc gaaagcgcta ttttaccaac gaagaatctg tgcttcattt 12180
ttgtaaaaca aaaatgcaac gcgagagcgc taatttttca aacaaagaat ctgagctgca 12240
tttttacaga acagaaatgc aacgcgagag cgctatttta ccaacaaaga atctatactt 12300
cttttttgtt ctacaaaaat gcatcccgag agcgctattt ttctaacaaa gcatcttaga 12360
ttactttttt tctcctttgt gcgctctata atgcagtctc ttgataactt tttgcactgt 12420
aggtccgtta aggttagaag aaggctactt tggtgtctat tttctcttcc ataaaaaaag 12480
cctgactcca cttcccgcgt ttactgatta ctagcgaagc tgcgggtgca ttttttcaag 12540
ataaaggcat ccccgattat attctatacc gatgtggatt gcgcatactt tgtgaacaga 12600
aagtgatagc gttgatgatt cttcattggt cagaaaatta tgaacggttt cttctatttt 12660
gtctctatat actacgtata ggaaatgttt acattttcgt attgttttcg attcactcta 12720
tgaatagttc ttactacaat ttttttgtct aaagagtaat actagagata aacataaaaa 12780
atgtagaggt cgagtttaga tgcaagttca aggagcgaaa ggtggatggg taggttatat 12840
agggatatag cacagagata tatagcaaag agatactttt gagcaatgtt tgtggaagcg 12900
gtattcgcaa tattttagta gctcgttaca gtccggtgcg tttttggttt tttgaaagtg 12960
cgtcttcaga gcgcttttgg ttttcaaaag cgctctgaag ttcctatact ttctagagaa 13020
taggaacttc ggaataggaa cttcaaagcg tttccgaaaa cgagcgcttc cgaaaatgca 13080
acgcgagctg cgcacataca gctcactgtt cacgtcgcac ctatatctgc gtgttgcctg 13140
tatatatata tacatgagaa gaacggcata gtgcgtgttt atgcttaaat gcgtacttat 13200
atgcgtctat ttatgtagga tgaaaggtag tctagtacct cctgtgatat tatcccattc 13260
catgcggggt atcgtatgct tccttcagca ctacccttta gctgttctat atgctgccac 13320
tcctcaattg gattagtctc atccttcaat gctatcattt cctttgatat tggatcatac 13380
taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt 13440
cgtc 13444

Claims (22)

1.I)~IV)中至少一种在构建多拷贝基因表达系统中的应用:
I)、RAF1基因或其同源片段;
II)、REP2基因或其同源片段;
III)、靶向RAF1基因或靶向RAF1基因上下游片段的gRNA;
IV)、靶向REP2基因或靶向REP2基因上下游片段的gRNA;
V)、与I)~IV)中任一项部分互补或完全互补的核酸。
2.CRISPR工具质粒,包括骨架载体、编码Cas9的核酸和gRNA;
所述gRNA靶向REP2基因下游片段或RAF1基因下游片段。
3.根据权利要求2所述的CRISPR工具质粒,其特征在于,其包括顺序连接的:PTEF1、Cas9、TCYC1、PSNR52、gRNA、TSUP4
4.根据权利要求2或3所述的CRISPR工具质粒,其特征在于,还包括ori片段、抗性标记、CEN/ARS片段和营养缺陷型标记。
5.根据权利要求2~4任一项所述的CRISPR工具质粒,其特征在于,
所述骨架载体为pRS416载体;
所述抗性标记为AmpR标记,所述营养缺陷型标记为URA3标记;
所述编码Cas9的核酸序列如SEQ ID NO:1所述;
所述靶向RAF1基因下游片段的gRNA的序列如SEQ ID NO:2所示,
所述靶向REP2基因下游片段的gRNA的序列如SEQ ID NO:3所示。
6.Donor质粒,包括骨架载体和i)~ii)中至少一种;
i)、RAF1同源片段;ii)、REP2同源片段。
7.根据权利要求6所述的Donor质粒,其特征在于,
所述RAF1同源片段包括RAF1同源臂A和RAF1同源臂B,所述RAF1同源臂A的核酸序列如SEQ ID NO:4所示,所述RAF1同源臂B的核酸序列如SEQ ID NO:5所示;
所述REP2同源片段包括REP2同源臂a和REP2同源臂b,所述REP2同源臂a的核酸序列如SEQ ID NO:6所示,所述REP2同源臂b的核酸序列如SEQ ID NO:7所示。
8.根据权利要求6或7所述的Donor质粒,其特征在于,还包括:线性化酶切位点、终止子、抗性筛选标记、营养缺陷型筛选标记和目的基因插入位点;
所述线性化酶切位点位于所述同源片段的同源臂A和同源臂B之间。
9.根据权利要求8所述的Donor质粒,其特征在于,
所述线性化酶切位点为PmeI;
所述终止子为TCPS1
所述抗性筛选标记为KanMX6;
所述营养缺陷型筛选标记为G418;
所述目的基因插入位点包括BsaI位点。
10.多拷贝基因表达质粒组合,其包括权利要求2~5任一项所述的CRISPR工具质粒和权利要求6~9任一项所述的Donor质粒。
11.多拷贝基因表达系统,其包括:含有pE2μ质粒的酵母菌、权利要求2~5任一项所述的CRISPR工具质粒和权利要求6~9任一项所述的Donor质粒。
12.一种多拷贝基因表达方法,其包括:
将目的基因插入权利要求6~9任一项所述的Donor质粒,制得pDonor Target载体;
所述pDonor Target载体经线性化,与权利要求2~5任一项所述的CRISPR工具质粒共转化至宿主进行表达;
所述宿主为含有pE2μ质粒的酵母菌。
13.根据权利要求12所述的多拷贝基因表达方法,其特征在于,所述宿主pE2μ质粒中插入TPI 1基因,且其基因组中TPI 1基因被敲除。
14.根据权利要求13所述的多拷贝基因表达方法,其特征在于,所述TPI 1基因的核酸序列如SEQ ID NO:8所示。
15.根据权利要求12~14任一项所述的表达方法,其特征在于,所述目的基因为ADS、CYP71AV1和DBR2。
16.权利要求15所述表达方法构建的表达二氢青蒿酸的酵母菌株,其宿主为酿酒酵母CEN.PK2-1C。
17.权利要求16所述的酵母菌株,其保藏编号为CGMCC NO.21335。
18.多拷贝基因表达质粒,其包括:骨架载体和2μori片段、REP2片段、FLP片段、REP1片段、RAF1片段。
19.根据权利要求18所述的多拷贝基因表达质粒,其特征在于,
所述骨架载体为pSB1C3;
所述2μori和RAF1之间还包括:抗性标记和目的基因插入位点;
所述抗性标记为kanMX6。
20.权利要求18或19所述的多拷贝基因表达质粒的构建方法,其包括,以权利要求2~5任一项所述的CRISPR工具质粒和权利要求6~9任一项所述的Donor质粒对含有pE2μ质粒的酵母菌进行编辑。
21.多拷贝基因表达系统,其包括:不含有pE2μ质粒的酵母菌、权利要求18或19所述的多拷贝基因表达质粒。
22.一种多拷贝基因表达方法,包括:
将目的基因插入权利要求18或19所述的多拷贝基因表达质粒,然后转化至宿主进行表达;所述宿主为不含有pE2μ质粒的酵母菌。
CN202110155734.7A 2021-02-04 2021-02-04 质粒载体及其在构建多拷贝表达系统中的应用 Active CN112852860B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110155734.7A CN112852860B (zh) 2021-02-04 2021-02-04 质粒载体及其在构建多拷贝表达系统中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110155734.7A CN112852860B (zh) 2021-02-04 2021-02-04 质粒载体及其在构建多拷贝表达系统中的应用

Publications (2)

Publication Number Publication Date
CN112852860A true CN112852860A (zh) 2021-05-28
CN112852860B CN112852860B (zh) 2023-04-28

Family

ID=75987909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110155734.7A Active CN112852860B (zh) 2021-02-04 2021-02-04 质粒载体及其在构建多拷贝表达系统中的应用

Country Status (1)

Country Link
CN (1) CN112852860B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113403334A (zh) * 2021-06-11 2021-09-17 江南大学 一组用于酿酒酵母多拷贝整合的质粒工具包
CN114574517A (zh) * 2022-03-04 2022-06-03 江南大学 用于酿酒酵母多拷贝整合的质粒工具包

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0340170A2 (en) * 1988-04-26 1989-11-02 Ciba-Geigy Ag Process for the production of polypeptides
US5637504A (en) * 1987-04-09 1997-06-10 Delta Biotechnology Limited Stable yeast 2 μm vector
US20180010151A1 (en) * 2015-01-06 2018-01-11 Dsm Ip Assets B.V. A crispr-cas system for a yeast host cell
WO2018045630A1 (zh) * 2016-09-09 2018-03-15 康码(上海)生物科技有限公司 一种为克鲁维酵母优化的CRISPR/Cas9高效基因编辑系统
CN110699383A (zh) * 2019-11-08 2020-01-17 上海市农业科学院 一种将目的基因多拷贝整合至酿酒酵母基因组的方法
CN111073822A (zh) * 2019-11-06 2020-04-28 天津大学 一种生产二氢青蒿酸的酿酒酵母工程菌及其构建方法和应用

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5637504A (en) * 1987-04-09 1997-06-10 Delta Biotechnology Limited Stable yeast 2 μm vector
EP0340170A2 (en) * 1988-04-26 1989-11-02 Ciba-Geigy Ag Process for the production of polypeptides
US20180010151A1 (en) * 2015-01-06 2018-01-11 Dsm Ip Assets B.V. A crispr-cas system for a yeast host cell
WO2018045630A1 (zh) * 2016-09-09 2018-03-15 康码(上海)生物科技有限公司 一种为克鲁维酵母优化的CRISPR/Cas9高效基因编辑系统
CN111073822A (zh) * 2019-11-06 2020-04-28 天津大学 一种生产二氢青蒿酸的酿酒酵母工程菌及其构建方法和应用
CN110699383A (zh) * 2019-11-08 2020-01-17 上海市农业科学院 一种将目的基因多拷贝整合至酿酒酵母基因组的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MARY E. MCQUAID等: "The yeast 2-μm plasmid Raf protein contributes to plasmid inheritance by stabilizing the Rep1 and Rep2 partitioning proteins", 《NUCLEIC ACIDS RESEARCH》 *
邹克琴: "《基因工程原理和技术》", 31 January 2009, 浙江大学出版社 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113403334A (zh) * 2021-06-11 2021-09-17 江南大学 一组用于酿酒酵母多拷贝整合的质粒工具包
CN113403334B (zh) * 2021-06-11 2023-10-27 江南大学 一组用于酿酒酵母多拷贝整合的质粒工具包
CN114574517A (zh) * 2022-03-04 2022-06-03 江南大学 用于酿酒酵母多拷贝整合的质粒工具包

Also Published As

Publication number Publication date
CN112852860B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
Horwitz et al. Efficient multiplexed integration of synergistic alleles and metabolic pathways in yeasts via CRISPR-Cas
CN108396027A (zh) CRISPR-Cas9靶向敲除人肠癌细胞DEAF1基因及其特异性的sgRNA
CN112852860B (zh) 质粒载体及其在构建多拷贝表达系统中的应用
KR20120115500A (ko) 전해질 첨가를 동반한 추출성 발효를 사용해 부탄올을 제조하는 방법
CN110088275A (zh) 改进的无甘油的乙醇生产
KR20130087014A (ko) 알코올 생산성 향상을 위한 지방산의 보충
CN110835633B (zh) 利用优化的基因密码子扩展系统制备ptc稳定细胞系及应用
KR20150014953A (ko) 케톨-산 리덕토아이소머라아제 효소 및 사용 방법
KR20130087013A (ko) 추출 발효에서의 알코올 제거를 위한 오일로부터 유래되는 추출 용매
KR20110015045A (ko) 2-상 추출 발효를 이용한 부탄올의 생산방법
KR20180053684A (ko) Fdca의 진균 제조
AU2016361421A1 (en) Genetically modified yeasts and fermentation processes using genetically modified yeasts
KR20210148227A (ko) 재조합 바이러스 벡터의 제조 방법
CN113943737A (zh) 一种鸡ctgf基因在抑制鸡前脂肪细胞分化的应用
CN109055425B (zh) 一种带有黄色或红色荧光蛋白标签的非洲爪蟾卵母细胞表达载体及应用
CN107760705B (zh) 一种穿梭质粒载体及其构建方法和应用
CN109402155A (zh) 一种双控延迟裂解性质粒及其构建方法与应用
CN107474131A (zh) 一种重组牛血清蛋白成熟肽及其制备方法和应用
KR101077689B1 (ko) 허혈성 질환용 저산소상태 유도성 혈관 내피 성장 인자플라스미드
CN108060175B (zh) 诱导型酵母转化重组系统的构建及其应用
CA2677475C (en) Expression of polypeptides from the nuclear genome of ostreococcus sp
CN107541526B (zh) 能敲低内源性ctla4表达的cik及制备方法与应用
KR101960382B1 (ko) 호기조건에서 부탄올을 생성하는 변이 미생물 및 이를 이용한 부탄올의 제조방법
CN111909918B (zh) 一种内溶素突变体及其编码基因与应用
CN116555318A (zh) 一种产反式橙花叔醇的解脂耶氏酵母基因工程菌及其构建方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant