一种在大肠杆菌-链霉菌-假单胞菌之间穿梭表达的BAC载体及其构建方法
技术领域
本发明涉及基因工程领域,具体是涉及一个在大肠杆菌-链霉菌-假单胞菌三个宿主之间穿梭表达的BAC载体,以及其构建方法。
背景技术:
微生物是临床使用的药物的主要来源。1981年至2006年间,FDA批准的34%的小分子药物是微生物来源的天然产物或其直接的半合成衍生物;总共155个抗癌药物中,47%是天然产物或其直接的半合成衍生物。随着微生物分子生物学的迅速发展,越来越多的微生物基因组被解析,微生物基因组资源的充分利用成为微生物药物学研究领域的一个热点。
在诸多的基因工程手段中,生物合成基因蔟的异源表达被证明是迄今最为有效的。异源表达在针对常规方法难以或不能培养的生理活性物质产生菌的遗传操作、对产量极低而通常发酵难以进行的化合物的研究、因结构复杂而使得化学合成难以进行或因收率极低而不能运用于工业化生产的化合物的研究等等方面,均有着其它方法无可比拟的优越性。
大肠杆菌(E.coli),链霉菌(Streptomyces)和假单胞菌(Pseudomonas)是最为常见的三种生物合成基因蔟异源表达的宿主菌。三者各有其优点。大肠杆菌是最为通用的宿主菌,生长迅速,克隆和表达体系完善,目的产物的提取,分离和纯化工艺成熟高效。但缺点是不产生次级代谢产物生物合成所需的多种小分子前体,且由于其基因组的GC%含量与链霉菌差异较大,表达链霉菌来源的生物合成基因蔟的效率难以预测。链霉菌是次级代谢产物来源的微生物药物的最主要来源,约70%来源于此。模式菌株Streptomyces lividans(变铅青链霉菌)的操作较为简易,但菌体倍增时间长(约4小时,而大肠杆菌为17分钟),产物分离纯化较大肠杆菌困难。假单胞菌异源表达系统在近年发展日趋成熟,假单胞菌已成为首选的宿主菌之一。其优点包含:假单胞菌与链霉菌GC%含量以及密码子的使用频率相近、有翻译后修饰(即酰基转移蛋白的磷酸泛酰乙胺化)、安全无毒(如模式菌株恶臭假单胞菌Pseudomonas putida)、生长快速(倍增时间与大肠杆菌相仿)、DNA转化效率高、次级代谢产物背景清晰。缺点是在提供复杂的次级代谢产物所需的多种小分子前体方面不全面。生物合成基因蔟在这三个宿主间共同表达可以相互补充,而在寻找未知的,大量的基因蔟的表达的最优化条件方面尤为有效。
异源表达生物合成基因蔟已有许多成功的例子。如与紫杉醇作用模式相同、而药效更强的抗癌药物epothilone在其生物合成基因蔟的被阐明后,已在链霉菌和粘球菌等异源宿主菌中得以大量表达。这就克服了原始产生菌纤维堆囊菌繁殖时间长、产量低、菌种选育难以进行等缺点。epothilone D即将在美国和欧洲完成III期临床实验,前景非常看好,有望成为紫杉醇的换代产品。
微生物Prochloron sp.产生环肽类化合物Patellamide和ascidiacylamide,但由于其遗传操作难以进行,克隆化合物的生物合成基因蔟一直不能成功。Long等首先Prochloron sp.容量为50kb的基因组片段克隆至大肠杆菌-链霉菌穿梭表达BAC载体pPAC-S1,构建了BAC文库。此文库在大肠杆菌DH10B中表达后,分离得到了Patellamide和ascidiacylamide,产量分别可达77mg/l和94mg/l。相应的表达克隆即包含化合物的生物合成基因蔟,这就克服了原始产生菌遗传操作难以进行的困难。
Penn等在链霉菌Streptomyce lividans TK64中表达了128kb的克隆在BAC载体pStreptoBACV上的daptomycin生物合成基因蔟,daptomycin是抗耐甲氧西林的金黄色葡萄球菌,抗万古霉素的金黄色葡萄球菌等病源菌的环酯肽类抗生素。这是迄今异源表达的最大片段。通过发酵工程等手段,表达产量达20-55mg/l。
Wenzel等在假单胞菌Pseudomonas putida KT 2440中表达了粘细菌Stigmatella aurantiaca来源的Myxochromide生物合成基因蔟,两天后发酵产量达到了40mg/ml,相应的原株七天发酵产量仅为8mg/ml。这就解决了的Myxochromide化合物来源不足而药效学研究难以进行的问题。
由于次级代谢产物的生物合成基因蔟常常较大(数十至上百千碱基对),常规的克隆载体以及粘粒载体(cosmid),fosmid等由于容量有限(最大可达45千碱基对)而不能在一个载体中涵盖完整的生物合成基因蔟,而生物合成基因蔟分布在两个甚至逐个载体上则牵涉载体的抗性筛选标记,载体的不相容性以及DNA之间、蛋白质之间相互作用效率可能受影响等问题。
BAC(Bacterial Artificial Chromosome)载体,即细菌人工染色体载体,由于其具有可克隆大片段(多至350kb)、所克隆的外源片段可在宿主内稳定存在(不发生缺失,扩增,重组)等特点而成为克隆和异源表达的首选载体之一。但通常使用的BAC载体为单拷贝(1-2个分子/细胞),这样在进行DNA操作以及获取足够量的DNA方面有着许多困难。而且,迄今的BAC载体多为在大肠杆菌中进行操作,缺乏可在大肠杆菌,链霉菌和假单胞菌三个宿主之间穿梭表达BAC载体。
BAC载体已逐渐成为异源表达的常规载体,因此,发展有效的BAC载体可以大大提高异源表达的效率,增加高通量筛选的成功率。
Sosio等将attP-int-tsr基因盒克隆至pCYPAC2,构建了首个克隆链霉菌基因的BAC载体pPAC-S1和pPAC-S2(基因盒的方向不同)。attP位点可与链霉菌基因组上的attB位点进行特异性整合,int为催化整合反应的整合酶,tsr为硫链丝菌素抗性基因,作为在链霉菌中的筛选标记。不足的是,以蔗糖作为负筛选标记有一定的假阳性(约5%);硫链丝菌素难以获得;且只能在链霉菌中进行基因表达。
表达daptomycin的pStreptoBACV的详细信息未公布。
Martinez等构建了大肠杆菌-链霉菌-假单胞菌的穿梭表达载体pMDB13和pMDB14。它们共同的特征是含有int-attP-Am-oriT基因盒,及保留了起始BAC载体pBleoBAC11的氯霉素抗性基因。在假单胞菌中的表达是通过attP和工程菌P.putida MBD1基因组上的attB位点整合而实现。P.putida MBD1是将含有attB位点,卡那霉素抗性基因和较大载体部分的DNA片段整合至P.putidaKT2440的基因组而获得。pMDB13含一个pUC的填充片段,pMDB14含有LacZ部分以利于克隆外源基因。利用此载体,他们成功地建立了高通量的克隆,种间基因转移,表达和筛选的体系。三个已知化合物(蓝色色素MG1.1,紫色色素Granaticin及具有抗菌活性的2,4-diacetylphloroglucinol)的基因蔟得以表达。缺点是载体或仍为单拷贝;或没有明显的筛选重组克隆的标记;且改造后的假单胞菌基因组中带有较多外源基因,可能影响克隆在载体上的基因的表达效率。
发明内容
本发明的一个目的是提供了一个在大肠杆菌,链霉菌和假单胞菌三个最常见的异源表达宿主之间进行穿梭表达的BAC载体。
所说的BAC载体,其含有pUC18的复制子、氨苄青霉素抗性基因、接合转移片段oriT、整合位点attP、整合酶基因int、阿普霉素抗性基因、假单胞菌的PP_0423′基因的5′端、假单胞菌的crp基因、BAC载体的redF基因、BAC载体的复制区OriS、BAC载体的repA基因、BAC载体的sopA基因、BAC载体的sopB基因、BAC载体的sopC基因、BAC载体的cos位点和BAC载体的loxP位点。
pUC18的复制子(ori),序列如SEQ NO.1;
氨苄青霉素抗性基因(Ap),序列如SEQ NO.2;
接合转移片段(oriT),序列如SEQ NO.3;
整合位点(attP),可整合至链霉菌基因组的attB位点;序列如SEQ NO.4;
整合酶基因(int),序列如SEQ NO.5;
阿普霉素(Am)抗性基因,序列如SEQ NO.6;
假单胞菌的PP_0423′基因的5′端,序列如SEQ NO.7;
假单胞菌的crp基因,序列如SEQ NO.8;
BAC载体的redF基因,序列如SEQ NO.9;
BAC载体的复制区OriS,序列如SEQ NO.10;
BAC载体的repA基因,序列如SEQ NO.11;
BAC载体的sopA基因,序列如SEQ NO.12;
BAC载体的sopB基因,序列如SEQ NO.13;
BAC载体的sopC基因,序列如SEQ NO.14;
BAC载体的cos位点,序列如SEQ NO.15;
BAC载体的loxP位点,序列如SEQ NO.16。
更具体的是,所说的BAC载体是pESPBAC,其具有SEQ NO.17所示的序列。
本发明的另一个目的是提供本发明所说的BAC载体的构建方法。
详细构建途如下。首先将pUC18以BamHI酶切后克隆至pECBAC1的BamHI位点,得到pEPUBAC。将pEPUBAC上BglII 2.1kb片段克隆至pIJ2925的BglII位点,得到克隆pBG2。将pBG上的XbaI位点以T4 DNA聚合酶和dNTP进行补平,这样即去除了XbaI位点,得到克隆pBG2-2。
将pBG-2上BglII 2.1kb片段克隆至pEPUBAC BglII酶切的8.0kb大片段,选取基因方向与pEPUBAC一致的克隆,命名为pEXPUBAC。
将来源于pSET152的阿普霉素抗性基因(Am)片段克隆至pKS(-),得到克隆pAM。将来源于P.Pudita KT2440的PP_0423′基因的5′端和crp基因片段至pKS(-),得到克隆pCrp。将Am片段和PP_0423′-crp克隆至pKS(-),得到Am-PP_0423′-crp基因盒的克隆pAC。
以PCR的方法扩增pAC上的Am-crp-PP_0423′基因基因盒和pSET152上的oriT-attP-int基因盒,将DNA片段以DpnI酶处理以消除模板DNA后,回收目的片段。将pEXPUBAC转化至含重组酶质粒pSC101-gbaA-Tc的大肠杆菌HS996。将两个DNA片段共转化至以L-阿拉伯糖诱导重组酶表达的HS996/pSC101-gbaA-Tc+pEXPUBAC,以阿普霉素和氨苄青霉素做为筛选标记,在37℃下进行筛选,将获得的质粒在转化E.coli DH10B的感受态细胞以纯化质粒,最终得到目的载体pESPBAC。以一系列的酶切证明后,再设计测序引物对pESPBAC进行克隆片段的测序,所得结果与预期完全一致。
本发明所说的穿梭表达BAC载体。具有以下特点:1.其载体上的oriT片段同时供转移至假单胞菌和链霉菌。attp位点用来整合至链霉菌基因组的attB位点,而非必须基因crp部分可以通过同源重组而整合至假单胞菌的基因组。这样,克隆在pESPBAC载体上的DNA片段在大肠杆菌中以游离质粒形式存在而进行表达,在链霉菌和假单胞菌中则为整合至基因组上进行表达。2.保留了BAC载体克隆大片段(可多至350kb)的特点。保留了LacZ,这样可以使用蓝白斑筛选重组克隆。3.pUC18作为填充片段克隆至BamHI位点,使得BAC载体由单拷贝(1-2个分子/细胞)变为高拷贝(500-700个分子/细胞),这样基因操作如常规克隆载体一样简便易行。填充片段可以通过BamHI切除,所得片段即为克隆大片段BAC载体。4.去除了原载体pECBAC1一个多余的XbaI位点,这样通过位于载体的多克隆位点上克隆片段两侧的、链霉菌基因组上酶切位点较少的限制性内切酶EcoRI和XbaI将克隆片段切出,通过电泳来鉴定克隆片段大小。5.阿普霉素作为pESPBAC转化至大肠杆菌-链霉菌-假单胞菌三个宿主的共同筛选标记。因此,pESPBAC能在大肠杆菌-链霉菌-假单胞菌三个宿主之间穿梭表达。
本发明从构建基因文库最常用的BAC载体之一pECBAC1出发,将异源表达的必需原件加以有效地综合和优化,充分运用了常规的分子生物学手段以及在基因克隆方面有突出优势的重组工程等策略,并综合运用常规的基因克隆和重组工程等手段,成功地构建了在大肠杆菌,链霉菌和假单胞菌三个最常见的异源表达宿主之间进行穿梭表达的BAC载体pESPBAC,为异源表达生物合成基因蔟以及高通量筛选方面提供了方便。
附图说明
图1是pESPBAC构建的示意图
图2是pESPBAC的结构示意图
图3是pESPBAC酶切的琼脂糖凝胶电泳结果
1.DNA分子量标准λ/HindIII:23.1kb,9.4kb,6.6kb,4.4kb,2.2kb,2.0kb
2.pESPBAC/BamHI:11.0kb,2.7kb
3.pESPBAC/BglII:11.6kb,2.1kb
4.pESPBAC/HindIII:11.2kb,1.5kb,1.0kb
5.pESPBAC/SphI:9.5kb,3.5kb,0.7kb
6.pESPBAC/XhoI:11.2kb,1.5kb,0.7kb
7.pESPBAC/XbaI:13.8kb
具体实施方式
在本发明中所使用的术语,除非有另外说明,一般具有本领域普通技术人员通常理解的含义。
下面结合具体的实施例,并参照数据进一步详细地描述本发明。应理解,这些实施例只是为了举例说明本发明,而非以任何方式限制本发明的范围。
在以下的实施例中,未详细描述的各种过程和方法是本领域中公知的常规方法。所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均以首次标明的内容相同。
实施例中所用到的质粒,均为已公开载体:
pUC18(Norrander,J.,Kempe,T.and Messing,J.(1983)“Construction ofimproved M13 vectors using oligodeoxynucleotide-directed mutagenesis.”Gene 26(1):101-106),本实施例中所用pUC18购自NEB公司。
pECBAC1(Frijters,A et al.(1997).“Construction ofa bacterial artificialchromosome library containing large EcoRI and HindIII genomic fragments oflettuce”.Theor Appl Genet 94(3):390-399.),本实施例中所用pECBAC1来自美国Richard Michelmore教授。
pBluescript KS(-)(Alting-Mees,M.A.and Short,J.M.(1989).“pBluescript II:gene mapping vectors”.Nucleic Acids Res.17(22):9494.),本实施例中所用pBluescript KS(-)购自Novagen公司。
pIJ2925(Janssen,G.R.and Bibb,M.J(1993).“Derivatives of pUC18 that haveBglII sites flanking a modified multiple cloning site and that retain the ability toidentify recombinant clones by visual screening of Escherichia coli colonies”.Gene124(1):133-134),本实施例中所用pIJ2925来自英国John Innes Institute,MervinBibb教授。
pSET152(Bierman,M.,R.Logan,et al.(1992).“Plasmid cloning vectors forthe conjugal transfer of DNA from Escherichia coli to Streptomyces spp.”Gene116(1):43-49.),本实施例中所用SET152来自英国John Innes Institute,DavidHopwood教授。
pSC101-gbaA-Tc(Zhang,Y.,F.Buchholz,et al.(1998).“A new logic forDNA engineering using recombination in Escherichia coli”.Nat Genet 20(2):123-8.);本实施例中所用pSC101-gbaA-Tc来自德国Dresden University的Youming Zhang博士。
crp基因和PP_0423′基因的5′端来自假单胞菌Pseudomonas puditaKT2440,为模式菌株,基因组测序文献Nelson,K et al.(2002).“Complete genomesequence and comparative analysis of the metabolically versatile Pseudomonas putidaKT2440”.Environ.Microbio.4(12):799-808;本实施例中所用Pseudomonas puditaKT2440来自美国Keller Nelson教授。
实施例1:
参见图1,将pUC18,Am,Crp,PP_0423′,int,attP,OriT等基因或片段以常规的分子生物学手段和重组工程手段克隆至pECBAC1,并去除pECBAC1上氯霉素抗性基因部分。
pECBAC1和pUC18相连获得高拷贝的BAC载体pEPUBAC
将pECBAC1和pUC18均以BamHI酶切,乙醇沉淀后,溶于适量双蒸水,以T4 DNA连接酶在16℃下连接过夜,连接液转化E.coli DH10B的感受态细胞,转化液涂布至含氯霉素12.5μg/ml,50μg/ml氨苄青霉素,20μg/ml IPTG和40μg/ml Xgal的LB固体平板上,37℃培养过夜。挑取白色菌落,提取质粒,酶切验证,正确的克隆命名为pEPUBAC。
pEPUBAC多克隆位点外的XbaI位点的去除
采用的策略是先将pEPUBAC上含XbaI位点的2.1kb的BglII片段克隆至pIJ2925(pUC18的衍生载体,其多克隆位点两侧均为BglII位点),得到pBG2。以XbaI酶切pBG2,乙醇沉淀后,溶于适量双蒸水,加入T4 DNA聚合酶和dNTP,使得XbaI位点的序列TCTAGA变为TCTAGCTAGA,这样即去除了XbaI位点。测序证明序列正确后,将所得克隆命名为pBG2-2。将pBG-2上BglII 2.1kb片段克隆至pEPUBAC BglII酶切的8.0kb大片段,,酶切验证克隆方向正确后,得到pEXPUBAC。pEXPUBAC只有在多克隆位点上由单一XbaI位点。
Am-crp-PP0423′基因盒的构建
以pSET152为模板,设计引物A1:5′-AAA GGATCCGGTTCATGTGCAGCTCCATCAG-3′,A2:5′-GGGCTGCAG TCA CCA TCGACTGGCGAGC-3′,分别在5′端和3′端引入BamHI和PstI位点(以下划线表示),PCR扩增0.9kb的阿普霉素抗性基因(Am)片段,以BamHI和PstI酶切后,克隆至pKS(-)相同位点,测序正确后,得到克隆pAM。
提取P.Pudita KT2440的基因组DNA,并以之为模板,设计引物C1:5′-GGGCTGCAG TGTGATGTGCTGCGCGAGTGG-3′,C2:5′-GGG GAATTCATGGTTGCCTCCGCCCTACCC-3′,分别在5′端和3′端引入PstI和EcoRI位点(以下划线表示),PCR扩增1.0kb的PP_0423′基因的5′端和crp基因片段,以PstI和EcoRI酶切后,克隆至pKS(-)相同位点,测序正确后,得到克隆pCrp。
将BamHI和PstI酶切pAM所得的0.9kb阿普霉素抗性基因片段、PstI和EcoRI酶切pCrp所得的1.0kb的PP_0423′基因的5′端和crp基因片段与BamHI和EcoRI酶切的pKS(-)进行三片段连接,转化,筛选质粒,酶切正确的克隆命名pAC,pAC即包含Am-crp-PP0423′基因盒。
以上50μl PCR反应体系:
33μl dH2O
5μl10xPCR反应缓冲液
1.25μl 10mM dNTP
1.5μl上游引物(终浓度0.75μM)
1.5μl下游引物(终浓度0.75μM)
2μl模板(质粒~100ng,基因组DNA~200ng)
0.5μl pfu聚合酶(5U/μl)
PCR反应条件:95℃变性5分钟,(95℃ 45秒,60℃ 1分钟,72℃ 2分钟),共30个循环,72℃延伸10分钟。使用仪器为Bio-rad公司的PTC-200型号的PCR仪。
反应结束后,以加入20mg/ml的溴乙锭(EB)染料的0.7%的琼脂糖凝胶电泳进行检测。
含重组酶质粒pSC101-gbaA-Tc的大肠杆菌HS996的电转化感受态的制备:
将在-70℃冻存的HS996/pSC101-gba-tet划线于含10μg/ml四环素的LB固体平板上,30℃培养20小时以上。挑取单菌落至10ml 10μg/ml四环素的LB液体培养基,于30℃过夜振荡培养,12,000rpm,4℃离心3分钟,弃上清,以10%的甘油洗涤沉淀两次,最后悬浮于100μl的10%的甘油中。
pEXPUBAC的转化:
将约100ng pEPUBAC加至50μl冰上融化的HS996/pSC101-gbaA-Tc的电转化感受态细胞中,轻弹混匀。将混合液转移至冰上预冷的1mm电转池中,电击转化。电转化条件:1mm电转池,200Ω,1300V,Bio-Rad公司Gene Pulser IIR电转化仪。加1ml LB液体培养基至电转池,吹打混匀,将溶液转移至一个无菌的1.5ml eppendorf管中,37℃振荡培养60分钟后,转化液涂布与含100μg/ml氨苄青霉素和10μg/ml四环素的LB抗性平板上,30℃培养20小时以上。所获菌株为HS996/pSC101-gbaA-Tc+pEXPUBAC。
HS996/pSC101-gbaA-Tc+pEXPUBAC电转化感受态细胞的制备:
将在-70℃冻存的菌株划线于含100μg/ml氨苄青霉素和10μg/ml四环素的LB抗性平板,30℃培养20小时以上。挑单菌落至2ml含100μg/ml氨苄青霉素和10μg/ml四环素的LB液体培养基,于30℃振荡过夜培养,按1/50的体积转接至20ml同样的培养基,30℃振荡培养,至OD260为0.2时,加入终浓度为0.15%的L-阿拉伯糖,37℃振荡培养至OD260为0.4时,12,000rpm,4℃离心3分钟,弃上清,以10%的甘油洗涤沉淀两次,最终悬浮于200μl 10%的甘油中。
重组工程法构建目的BAC载体
本发明采用重组工程法中的“三片段克隆法”来对靶载体进行改造。两个片段同时克隆至靶载体并去除载体相应部位的“三片段克隆”的策略是:上下游两个片段分别在其5′和3′引入与靶载体的同源臂(“同源臂”即序列相同的一段寡核苷酸),上游片段的3′端和下游片段的5′端之间也引入同源臂,同源臂是通过PCR引入的。在大肠杆菌体内,L-阿拉伯糖诱导重组酶的表达,重组酶催化三个同源臂之间的的DNA重组。经过筛选,即可得到目的克隆。
本发明中所设计的PCR引物如下。
SP1:5′-
CCGGCCAGCCTCGCAGAGCAGG-3′,前50个碱基(斜体)为与pEXPUBAC氯霉素抗性基因3′端,3397nt-3346nt序列相同的同源臂,后面为扩增pSET152oriT部位的序列。SP2:5′-
-3′,此51个碱基(斜体)为pSET152整合酶(int)3′端的序列。SP3:5′-
GGTTCATGTGCAGCTCCATCAG-3′,前51个碱基(斜体)为SP2的反向互补序列,后面为扩增Am-crp-PP0423′基因盒5′的序列。SP4:5′-
ATGGTTGCCTCCGCCCTACCC-3′,前50个碱基(斜体)为与pEXPUBAC redF和氯霉素抗性基因5′端之间,4107nt-4156nt序列相同的同源臂,后面为扩增Am-crp-PP0423′基因盒3′端的序列。
以pSET152为模板,引物SP1和SP2扩增2.4kb的oriT-attp-int基因盒,以pAC为模板,引物SP3和SP4扩增2.6kb的Am-crp-PP0423′基因盒。琼脂糖凝胶电泳检测后,在溶液中加入1/10倍体积的pH5.2的醋酸钠溶液和2.5倍体积的4℃预冷的无水乙醇,混匀沉淀,离心去上清,室温干燥后,溶于双蒸水。分别加入20U的DpnI酶,37℃,处理4小时,以消除模板DNA后,胶回收目的片段。最后将溶于DNA10 mM pH8.0的Tris.Cl(三羟甲基氨基甲烷,以浓盐酸调节pH至8.0),OD260测定DNA浓度,调节浓度为300ng/μl。将0.3ug的oriT-attp-int基因盒DNA片段和0.3ug/的Am-crp-PP0423′基因盒DNA片段共转化至L-阿拉伯糖诱导重组酶表达HS996/pSC101-gbaA-Tc+pEXPUBAC。在共同培养基中加入50μg/ml阿普霉素和100μg/ml氨苄青霉素加以筛选,所得的质粒再次转化E.coli DH10B的感受态细胞加以纯化,最终得到目的载体pESPBAC,其质粒图谱见图2,酶切验证的结果见图3。
pESPBAC全长13791bp,其序列如SEQ NO.17所示,其中
792-1380:pUC18的复制子(ori);
1551-2411:氨苄青霉素抗性基因(Ap);
3447-3558:接合转移片段(oriT);
3906-3944:整合位点(attP),可整合至链霉菌基因组的attB位点;
3961-5802:整合酶基因(int);
5923-6699:阿普霉素(Am)抗性基因;
6705-7065:假单胞菌的PP_0423′基因的5′端;
7062-7706:假单胞菌的crp基因;
7795-8271:BAC载体的redF基因;
8650-8716:BAC载体的复制区OriS;
9049-9804:BAC载体的repA基因;
10392-11558:BAC载体的sopA基因;
11558-12592:BAC载体的sopB基因;
12602-13075:BAC载体的sopC基因;
13334-13733:BAC载体的cos位点;
13751-13784:BAC载体的loxP位点。
重组工程法所克隆片段的测序验证:
设计测序引物S1-S5,对克隆片段进行测序,结果证明与预期完全一致。S1-S5的序列如下。
S1:5′AATTTCTGCCATTCATCCGCT-3′
S2:5′-CGGGCATTTCAGCGAAGCGCC-3′
S3:5′-GATTGCGGACCGATCATCGAG-3′
S4:5′-GCGTAGGGTTCATGTGCAGCT-3′
S5:5′-TGTGATGTGCTGCGCGAGTGG-3′。
SEQUENCE LISTING
<110>南京师范大学
<120>一种在大肠杆菌-链霉菌-假单胞菌之间穿梭表达的BAC载体及其构建方法
<160>17
<210>1
<211>589
<212>DNA
<213>人工序列
<400>1
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 60
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 120
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 180
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 240
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 300
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 360
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 420
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 480
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 540
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaa 589
<210>2
<211>861
<212>DNA
<213>人工序列
<400>2
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 180
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840
acggaaatgt tgaatactca t 861
<210>3
<211>112
<212>DNA
<213>人工序列
<400>3
ccggccagcc tcgcagagca ggattcccgt tgagcaccgc caggtgcgaa taagggacag 60
tgaagaagga acacccgctc gcgggtgggc ctacttcacc tatcctgccc gg 112
<210>4
<211>39
<212>DNA
<213>人工序列
<400>4
gccccaactg gggtaacctt tgagttctct cagttgggg 39
<210>5
<211>1842
<212>DNA
<213>人工序列
<400>5
atgacacaag gggttgtgac cggggtggac acgtacgcgg gtgcttacga ccgtcagtcg 60
cgcgagcgcg agaatttgag cgcagcaagc ccagcgacac agcgtagcgc caacgaagac 120
aaggcggccg accttcagcg cgaagtcgag cgcgacgggg gccggttcag gttcgtcggg 180
catttcagcg aagcgccggg cacgtcggcg ttcgggacgg cggagcgccc ggagttcgaa 240
cgcatcctga acgaatgccg cgccgggcgg ctcaacatga tcattgtcta tgacgtgtcg 300
cgcttctcgc gcctgaaggt catggacgcg attccgattg tctcggaatt gctcgccctg 360
ggcgtgacga ttgtttccac tcaggaaggc gtcttccggc agggaaacgt catggacctg 420
attcacctga ttatgcggct cgacgcgtcg cacaaagaat cttcgctgaa gtcggcgaag 480
attctcgaca cgaagaacct tcagcgcgaa ttgggcgggt acgtcggcgg gaaggcgcct 540
tacggcttcg agcttgtttc ggagacgaag gagatcacgc gcaacggccg aatggtcaat 600
gtcgtcatca acaagcttgc gcactcgacc actcccctta ccggaccctt cgagttcgag 660
cccgacgtaa tccggtggtg gtggcgtgag atcaagacgc acaaacacct tcccttcaag 720
ccgggcagtc aagccgccat tcacccgggc agcatcacgg ggctttgtaa gcgcatggac 780
gctgacgccg tgccgacccg gggcgagacg attgggaaga agaccgcttc aagcgcctgg 840
gacccggcaa ccgttatgcg aatccttcgg gacccgcgta ttgcgggctt cgccgctgag 900
gtgatctaca agaagaagcc ggacggcacg ccgaccacga agattgaggg ttaccgcatt 960
cagcgcgacc cgatcacgct ccggccggtc gagcttgatt gcggaccgat catcgagccc 1020
gctgagtggt atgagcttca ggcgtggttg gacggcaggg ggcgcggcaa ggggctttcc 1080
cgggggcaag ccattctgtc cgccatggac aagctgtact gcgagtgtgg cgccgtcatg 1140
acttcgaagc gcggggaaga atcgatcaag gactcttacc gctgccgtcg ccggaaggtg 1200
gtcgacccgt ccgcacctgg gcagcacgaa ggcacgtgca acgtcagcat ggcggcactc 1260
gacaagttcg ttgcggaacg catcttcaac aagatcaggc acgccgaagg cgacgaagag 1320
acgttggcgc ttctgtggga agccgcccga cgcttcggca agctcactga ggcgcctgag 1380
aagagcggcg aacgggcgaa ccttgttgcg gagcgcgccg acgccctgaa cgcccttgaa 1440
gagctgtacg aagaccgcgc ggcaggcgcg tacgacggac ccgttggcag gaagcacttc 1500
cggaagcaac aggcagcgct gacgctccgg cagcaagggg cggaagagcg gcttgccgaa 1560
cttgaagccg ccgaagcccc gaagcttccc cttgaccaat ggttccccga agacgccgac 1620
gctgacccga ccggccctaa gtcgtggtgg gggcgcgcgt cagtagacga caagcgcgtg 1680
ttcgtcgggc tcttcgtaga caagatcgtt gtcacgaagt cgactacggg cagggggcag 1740
ggaacgccca tcgagaagcg cgcttcgatc acgtgggcga agccgccgac cgacgacgac 1800
gaagacgacg cccaggacgg cacggaagac gtagcggcgt ag 1842
<210>6
<211>777
<212>DNA
<213>人工序列
<400>6
gtgcaatacg aatggcgaaa agccgagctc atcggtcagc ttctcaacct tggggttacc 60
cccggcggtg tgctgctggt ccacagctcc ttccgtagcg tccggcccct cgaagatggg 120
ccacttggac tgatcgaggc cctgcgtgct gcgctgggtc cgggagggac gctcgtcatg 180
ccctcgtggt caggtctgga cgacgagccg ttcgatcctg ccacgtcgcc cgttacaccg 240
gaccttggag ttgtctctga cacattctgg cgcctgccaa atgtaaagcg cagcgcccat 300
ccatttgcct ttgcggcagc ggggccacag gcagagcaga tcatctctga tccattgccc 360
ctgccacctc actcgcctgc aagcccggtc gcccgtgtcc atgaactcga tgggcaggta 420
cttctcctcg gcgtgggaca cgatgccaac acgacgctgc atcttgccga gttgatggca 480
aaggttccct atggggtgcc gagacactgc accattcttc aggatggcaa gttggtacgc 540
gtcgattatc tcgagaatga ccactgctgt gagcgctttg ccttggcgga caggtggctc 600
aaggagaaga gccttcagaa ggaaggtcca gtcggtcatg cctttgctcg gttgatccgc 660
tcccgcgaca ttgtggcgac agccctgggt caactgggcc gagatccgtt gatcttcctg 720
catccgccag aggcgggatg cgaagaatgc gatgccgctc gccagtcgat tggctga 777
<210>7
<211>361
<212>DNA
<213>恶臭假单胞菌(Pseudomonas pudita)
<400>7
gtgtgatgtg ctgcgcgagt ggggcggcgt agcgtcagtc ggggaaatcg acggggcctt 60
ctgcgatggc cgctacaacg tcaacctcaa tggccgcaaa ttggtgggta ccgcccagcg 120
ctggcgtcag ggcctgggtg gcaagcgtcc ggtggtgctg gtgcacggtg cgctgctgct 180
ggacaacgag cgtgagtcga tggtggcggc ggtcaaccgc ttcaacgagt gctgtgagct 240
ggagcaacgc tgtcgcgccg atgcgcacat cgccttgcac gaagtggcgc cggtagcacc 300
ttggttcgag cgcctttcgc aggcctacgc caaggtactg gccgagttgc ccaaggacta 360
g 361
<210>8
<211>645
<212>DNA
<213>恶臭假单胞菌(Pseudomonas pudita)
<400>8
ctagcgggta ccgtggacca ccatggtctt gcctttgacc tgcaccaggc tgcgttcctc 60
gagatccttg agaacgcggc cgaccatttc ccgagagcaa ccgacgattc ggccgatttc 120
ctgacgggta atcttgattt gcatgccatc ggggtgggtc atggcgtcgg gctgcttgca 180
cagttccagc aggcaacggg caactcgccc ggtcacgtcg aaaaatgcca aatcgccaac 240
cttgcgcgta gtgttgcgca ggcgctgggc catctggcta cccagggcat agaggatttc 300
cgggtcctgg cgcgccagct cgcgaaactt ctcgtagctg atttcggcca cttcgcattc 360
tgtcttggcg cgtacccagg cactgcgctg ctgctcgcca tcaacgggct cgaacaggcc 420
tagctcgcca aagaaatcgc catggttgag gtaggcgatg atcatttcat ggccgtcgtc 480
gtcctcgatg aggatggtga ccgaaccctt gatgatgaac gacagtgtct cggcccggtc 540
gccggcgcag atgatattgc ttttggcggt gtagcggcgg cgctggcagt gtaccagcag 600
cttgtcgatg ttctttatct tggcgggtag ggcggaggca accat 645
<210>9
<211>477
<212>DNA
<213>人工序列
<400>9
ttacgtgccg atcaacgtct cattttcgcc aaaagttggc ccagggcttc ccggtatcaa 60
cagggacacc aggatttatt tattctgcga agtgatcttc cgtcacaggt atttattcgc 120
gataagctca tggagcggcg taaccgtcgc acaggaagga cagagaaagc gcggatctgg 180
gaagtgacgg acagaacggt caggacctgg attggggagg cggttgccgc cgctgctgct 240
gacggtgtga cgttctctgt tccggtcaca ccacatacgt tccgccattc ctatgcgatg 300
cacatgctgt atgccggtat accgctgaaa gttctgcaaa gcctgatggg acataagtcc 360
atcagttcaa cggaagtcta cacgaaggtt tttgcgctgg atgtggctgc ccggcaccgg 420
gtgcagtttg cgatgccgga gtctgatgcg gttgcgatgc tgaaacaatt atcctga 477
<210>10
<211>67
<212>DNA
<213>人工序列
<400>10
agggcgaagc cctcgagtga gcgaggaagc accagggaac agcacttata tattctgctt 60
acacacg 67
<210>11
<211>756
<212>DNA
<213>人工序列
<400>11
atggcggaaa cagcggttat caatcacaag aaacgtaaaa atagcccgcg aatcgtccag 60
tcaaacgacc tcactgaggc ggcatatagt ctctcccggg atcaaaaacg tatgctgtat 120
ctgttcgttg accagatcag aaaatctgat ggcaccctac aggaacatga cggtatctgc 180
gagatccatg ttgctaaata tgctgaaata ttcggattga cctctgcgga agccagtaag 240
gatatacggc aggcattgaa gagtttcgcg gggaaggaag tggtttttta tcgccctgaa 300
gaggatgccg gcgatgaaaa aggctatgaa tcttttcctt ggtttatcaa acgtgcgcac 360
agtccatcca gagggcttta cagtgtacat atcaacccat atctcattcc cttctttatc 420
gggttacaga accggtttac gcagtttcgg cttagtgaaa caaaagaaat caccaatccg 480
tatgccatgc gtttatacga atccctgtgt cagtatcgta agccggatgg ctcaggcatc 540
gtctctctga aaatcgactg gatcatagag cgttaccagc tgcctcaaag ttaccagcgt 600
atgcctgact tccgccgccg cttcctgcag gtctgtgtta atgagatcaa cagcagaact 660
ccaatgcgcc tctcatacat tgagaaaaag aaaggccgcc agacgactca tatcgtattt 720
tccttccgcg atatcacttc catgacgaca ggatag 756
<210>12
<211>1167
<212>DNA
<213>人工序列
<400>12
atgaaactca tggaaacact taaccagtgc ataaacgctg gtcatgaaat gacgaaggct 60
atcgccattg cacagtttaa tgatgacagc ccggaagcga ggaaaataac ccggcgctgg 120
agaataggtg aagcagcgga tttagttggg gtttcttctc aggctatcag agatgccgag 180
aaagcagggc gactaccgca cccggatatg gaaattcgag gacgggttga gcaacgtgtt 240
ggttatacaa ttgaacaaat taatcatatg cgtgatgtgt ttggtacgcg attgcgacgt 300
gctgaagacg tatttccacc ggtgatcggg gttgctgccc ataaaggtgg cgtttacaaa 360
acctcagttt ctgttcatct tgctcaggat ctggctctga aggggctacg tgttttgctc 420
gtggaaggta acgaccccca gggaacagcc tcaatgtatc acggatgggt accagatctt 480
catattcatg cagaagacac tctcctgcct ttctatcttg gggaaaagga cgatgtcact 540
tatgcaataa agcccacttg ctggccgggg cttgacatta ttccttcctg tctggctctg 600
caccgtattg aaactgagtt aatgggcaaa tttgatgaag gtaaactgcc caccgatcca 660
cacctgatgc tccgactggc cattgaaact gttgctcatg actatgatgt catagttatt 720
gacagcgcgc ctaacctggg tatcggcacg attaatgtcg tatgtgctgc tgatgtgctg 780
attgttccca cgcctgctga gttgtttgac tacacctccg cactgcagtt tttcgatatg 840
cttcgtgatc tgctcaagaa cgttgatctt aaagggttcg agcctgatgt acgtattttg 900
cttaccaaat acagcaatag taatggctct cagtccccgt ggatggagga gcaaattcgg 960
gatgcctggg gaagcatggt tctaaaaaat gttgtacgtg aaacggatga agttggtaaa 1020
ggtcagatcc ggatgagaac tgtttttgaa caggccattg atcaacgctc ttcaactggt 1080
gcctggagaa atgctctttc tatttgggaa cctgtctgca atgaaatttt cgatcgtctg 1140
attaaaccac gctgggagat tagataa 1167
<210>13
<211>972
<212>DNA
<213>人工序列
<400>13
Atgaagcgtg cgcctgttat tccaaaacat acgctcaata ctcaaccggt tgaagatact 60
tcgttatcga caccagctgc cccgatggtg gattcgttaa ttgcgcgcgt aggagtaatg 120
gctcgcggta atgccattac tttgcctgta tgtggtcggg atgtgaagtt tactcttgaa 180
gtgctccggg gtgatagtgt tgagaagacc tctcgggtat ggtcaggtaa tgaacgtgac 240
caggagctgc ttactgagga cgcactggat gatctcatcc cttcttttct actgactggt 300
caacagacac cggcgttcgg tcgaagagta tctggtgtca tagaaattgc cgatgggagt 360
cgccgtcgta aagctgctgc acttaccgaa agtgattatc gtgttctggt tggcgagctg 420
gatgatgagc agatggctgc attatccaga ttgggtaacg attatcgccc aacaagtgct 480
tatgaacgtg gtcagcgtta tgcaagccga ttgcagaatg aatttgctgg aaatatttct 540
gcgctggctg atgcggaaaa tatttcacgt aagattatta cccgctgtat caacaccgcc 600
aaattgccta aatcagttgt tgctcttttt tctcaccccg gtgaactatc tgcccggtca 660
ggtgatgcac ttcaaaaagc ctttacagat aaagaggaat tacttaagca gcaggcatct 720
aaccttcatg agcagaaaaa agctggggtg atatttgaag ctgaagaagt tatcactctt 780
ttaacttctg tgcttaaaac gtcatctgca tcaagaacta gtttaagctc acgacatcag 840
tttgctcctg gagcgacagt attgtataag ggcgataaaa tggtgcttaa cctggacagg 900
tctcgtgttc caactgagtg tatagagaaa attgaggcca ttcttaagga acttgaaaag 960
ccagcaccct ga 972
<210>14
<211>474
<212>DNA
<213>人工序列
<400>14
ggcctgaata ttctctctgg gcccactgtt ccacttgtat cgtcggtctg ataatcagac 60
tgggaccacg gtcccactcg tatcgtcggt ctgattatta gtctgggacc acggtcccac 120
tcgtatcgtc ggtctgatta ttagtctggg accacggtcc cactcgtatc gtcggtctga 180
taatcagact gggaccacgg tcccactcgt atcgtcggtc tgattattag tctgggacca 240
tggtcccact cgtatcgtcg gtctgattat tagtctggga ccacggtccc actcgtatcg 300
tcggtctgat tattagtctg gaaccacggt cccactcgta tcgtcggtct gattattagt 360
ctgggaccac ggtcccactc gtatcgtcgg tctgattatt agtctgggac cacgatccca 420
ctcgtgttgt cggtctgatt atcggtctgg gaccacggtc ccacttgtat tgtc 474
<210>15
<211>400
<212>DNA
<213>人工序列
<400>15
ggacatgagg ttgccccgta ttcagtgtcg ctgatttgta ttgtctgaag ttgtttttac 60
gttaagttga tgcagatcaa ttaatacgat acctgcgtca taattgatta tttgacgtgg 120
tttgatggcc tccacgcacg ttgtgatatg tagatgataa tcattatcac tttacgggtc 180
ctttccggtg atccgacagg ttacggggcg gcgacctcgc gggttttcgc tatttatgaa 240
aattttccgg tttaaggcgt ttccgttctt cttcgtcata acttaatgtt tttatttaaa 300
ataccctctg aaaagaaagg aaacgacagg tgctgaaagc gagctttttg gcctctgtcg 360
tttcctttct ctgtttttgt ccgtggaatg aacaatggaa 400
<210>16
<211>34
<212>DNA
<213>人工序列
<400>16
ataacttcgt atagcataca ttatacgaag ttat 34
<210>17
<211>13791
<212>DNA
<213>人工序列
<400>17
gcggccgcaa ggggttcgcg tcagcgggtg ttggcgggtg tcggggctgg cttaactatg 60
cggcatcaga gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat 120
gcgtaaggag aaaataccgc atcaggcgcc attcgccatt caggctgcgc aactgttggg 180
aagggcgatc ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg 240
caaggcgatt aagttgggta acgccagggt tttcccagtc acgacgttgt aaaacgacgg 300
ccagtgaatt gtaatacgac tcactatagg gcgaattcga gctcggtacc cggggatccc 360
cgggtaccga gctcgaattc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 420
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 480
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 540
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 600
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 660
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 720
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 780
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 840
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 900
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 960
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 1020
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 1080
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 1140
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 1200
aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 1260
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 1320
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 1380
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 1440
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 1500
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 1560
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 1620
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 1680
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 1740
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 1800
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 1860
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 1920
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 1980
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 2040
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 2100
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 2160
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 2220
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 2280
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 2340
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 2400
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 2460
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 2520
tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac attaacctat 2580
aaaaataggc gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga cggtgaaaac 2640
ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc 2700
agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg gcttaactat 2760
gcggcatcag agcagattgt actgagagtg caccatatgc ggtgtgaaat accgcacaga 2820
tgcgtaagga gaaaataccg catcaggcgc cattcgccat tcaggctgcg caactgttgg 2880
gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct 2940
gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg 3000
gccagtgcca agcttgcatg cctgcaggtc gactctagag gatcctctag agtcgacctg 3060
caggcatgca agcttgagta ttctatagtg tcacctaaat agcttggcgt aatcatggtc 3120
atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 3180
aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 3240
gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 3300
ccaacgcgaa ccccttgcgg ccgcccgggc cgtcgaccaa ttctcatgtt tgacagctta 3360
tcatcgaatt tctgccattc atccgcttat tatcacttat tcaggcgtag caaccaggcg 3420
tttaagggca ccaataactg ccttaaccgg ccagcctcgc agagcaggat tcccgttgag 3480
caccgccagg tgcgaataag ggacagtgaa gaaggaacac ccgctcgcgg gtgggcctac 3540
ttcacctatc ctgcccggct gacgccgttg gatacaccaa ggaaagtcta cacgaaccct 3600
ttggcaaaat cctgtatatc gtgcgaaaaa ggatggatat accgaaaaaa tcgctataat 3660
gaccccgaag cagggttatg cagcggaaaa gatccgtcga cctgcaggca tgcaagctct 3720
agcgattcca gacgtcccga aggcgtggcg cggcttcccc gtgccggagc aatcgccctg 3780
ggtgggttac acgacgcccc tctatggccc gtactgacgg acacaccgaa gccccggcgg 3840
caaccctcag cggatgcccc ggggcttcac gttttcccag gtcagaagcg gttttcggga 3900
gtagtgcccc aactggggta acctttgagt tctctcagtt gggggcgtag ggtcgccgac 3960
atgacacaag gggttgtgac cggggtggac acgtacgcgg gtgcttacga ccgtcagtcg 4020
cgcgagcgcg agaatttgag cgcagcaagc ccagcgacac agcgtagcgc caacgaagac 4080
aaggcggccg accttcagcg cgaagtcgag cgcgacgggg gccggttcag gttcgtcggg 4140
catttcagcg aagcgccggg cacgtcggcg ttcgggacgg cggagcgccc ggagttcgaa 4200
cgcatcctga acgaatgccg cgccgggcgg ctcaacatga tcattgtcta tgacgtgtcg 4260
cgcttctcgc gcctgaaggt catggacgcg attccgattg tctcggaatt gctcgccctg 4320
ggcgtgacga ttgtttccac tcaggaaggc gtcttccggc agggaaacgt catggacctg 4380
attcacctga ttatgcggct cgacgcgtcg cacaaagaat cttcgctgaa gtcggcgaag 4440
attctcgaca cgaagaacct tcagcgcgaa ttgggcgggt acgtcggcgg gaaggcgcct 4500
tacggcttcg agcttgtttc ggagacgaag gagatcacgc gcaacggccg aatggtcaat 4560
gtcgtcatca acaagcttgc gcactcgacc actcccctta ccggaccctt cgagttcgag 4620
cccgacgtaa tccggtggtg gtggcgtgag atcaagacgc acaaacacct tcccttcaag 4680
ccgggcagtc aagccgccat tcacccgggc agcatcacgg ggctttgtaa gcgcatggac 4740
gctgacgccg tgccgacccg gggcgagacg attgggaaga agaccgcttc aagcgcctgg 4800
gacccggcaa ccgttatgcg aatccttcgg gacccgcgta ttgcgggctt cgccgctgag 4860
gtgatctaca agaagaagcc ggacggcacg ccgaccacga agattgaggg ttaccgcatt 4920
cagcgcgacc cgatcacgct ccggccggtc gagcttgatt gcggaccgat catcgagccc 4980
gctgagtggt atgagcttca ggcgtggttg gacggcaggg ggcgcggcaa ggggctttcc 5040
cgggggcaag ccattctgtc cgccatggac aagctgtact gcgagtgtgg cgccgtcatg 5100
acttcgaagc gcggggaaga atcgatcaag gactcttacc gctgccgtcg ccggaaggtg 5160
gtcgacccgt ccgcacctgg gcagcacgaa ggcacgtgca acgtcagcat ggcggcactc 5220
gacaagttcg ttgcggaacg catcttcaac aagatcaggc acgccgaagg cgacgaagag 5280
acgttggcgc ttctgtggga agccgcccga cgcttcggca agctcactga ggcgcctgag 5340
aagagcggcg aacgggcgaa ccttgttgcg gagcgcgccg acgccctgaa cgcccttgaa 5400
gagctgtacg aagaccgcgc ggcaggcgcg tacgacggac ccgttggcag gaagcacttc 5460
cggaagcaac aggcagcgct gacgctccgg cagcaagggg cggaagagcg gcttgccgaa 5520
cttgaagccg ccgaagcccc gaagcttccc cttgaccaat ggttccccga agacgccgac 5580
gctgacccga ccggccctaa gtcgtggtgg gggcgcgcgt cagtagacga caagcgcgtg 5640
ttcgtcgggc tcttcgtaga caagatcgtt gtcacgaagt cgactacggg cagggggcag 5700
ggaacgccca tcgagaagcg cgcttcgatc acgtgggcga agccgccgac cgacgacgac 5760
gaagacgacg cccaggacgg cacggaagac gtagcggcgt agggttcatg tgcagctcca 5820
tcagcaaaag gggatgataa gtttatcacc accgactatt tgcaacagtg ccgttgatcg 5880
tgctatgatc gactgatgtc atcagcggtg gagtgcaatg tcgtgcaata cgaatggcga 5940
aaagccgagc tcatcggtca gcttctcaac cttggggtta cccccggcgg tgtgctgctg 6000
gtccacagct ccttccgtag cgtccggccc ctcgaagatg ggccacttgg actgatcgag 6060
gccctgcgtg ctgcgctggg tccgggaggg acgctcgtca tgccctcgtg gtcaggtctg 6120
gacgacgagc cgttcgatcc tgccacgtcg cccgttacac cggaccttgg agttgtctct 6180
gacacattct ggcgcctgcc aaatgtaaag cgcagcgccc atccatttgc ctttgcggca 6240
gcggggccac aggcagagca gatcatctct gatccattgc ccctgccacc tcactcgcct 6300
gcaagcccgg tcgcccgtgt ccatgaactc gatgggcagg tacttctcct cggcgtggga 6360
cacgatgcca acacgacgct gcatcttgcc gagttgatgg caaaggttcc ctatggggtg 6420
ccgagacact gcaccattct tcaggatggc aagttggtac gcgtcgatta tctcgagaat 6480
gaccactgct gtgagcgctt tgccttggcg gacaggtggc tcaaggagaa gagccttcag 6540
aaggaaggtc cagtcggtca tgcctttgct cggttgatcc gctcccgcga cattgtggcg 6600
acagccctgg gtcaactggg ccgagatccg ttgatcttcc tgcatccgcc agaggcggga 6660
tgcgaagaat gcgatgccgc tcgccagtcg attggctgac tgcagtgtga tgtgctgcgc 6720
gagtggggcg gcgtagcgtc agtcggggaa atcgacgggg ccttctgcga tggccgctac 6780
aacgtcaacc tcaatggccg caaattggtg ggtaccgccc agcgctggcg tcagggcctg 6840
ggtggcaagc gtccggtggt gctggtgcac ggtgcgctgc tgctggacaa cgagcgtgag 6900
tcgatggtgg cggcggtcaa ccgcttcaac gagtgctgtg agctggagca acgctgtcgc 6960
gccgatgcgc acatcgcctt gcacgaagtg gcgccggtag caccttggtt cgagcgcctt 7020
tcgcaggcct acgccaaggt actggccgag ttgcccaagg actagcgggt accgtggacc 7080
accatggtct tgcctttgac ctgcaccagg ctgcgttcct cgagatcctt gagaacgcgg 7140
ccgaccattt cccgagagca accgacgatt cggccgattt cctgacgggt aatcttgatt 7200
tgcatgccat cggggtgggt catggcgtcg ggctgcttgc acagttccag caggcaacgg 7260
gcaactcgcc cggtcacgtc gaaaaatgcc aaatcgccaa ccttgcgcgt agtgttgcgc 7320
aggcgctggg ccatctggct acccagggca tagaggattt ccgggtcctg gcgcgccagc 7380
tcgcgaaact tctcgtagct gatttcggcc acttcgcatt ctgtcttggc gcgtacccag 7440
gcactgcgct gctgctcgcc atcaacgggc tcgaacaggc ctagctcgcc aaagaaatcg 7500
ccatggttga ggtaggcgat gatcatttca tggccgtcgt cgtcctcgat gaggatggtg 7560
accgaaccct tgatgatgaa cgacagtgtc tcggcccggt cgccggcgca gatgatattg 7620
cttttggcgg tgtagcggcg gcgctggcag tgtaccagca gcttgtcgat gttctttatc 7680
ttggcgggta gggcggaggc aaccatttag cttccttagc tcctgaaaat ctcgataact 7740
caaaaaatac gcccggtagt gatcttattt cattatggtg aaagttggaa cctcttacgt 7800
gccgatcaac gtctcatttt cgccaaaagt tggcccaggg cttcccggta tcaacaggga 7860
caccaggatt tatttattct gcgaagtgat cttccgtcac aggtatttat tcgcgataag 7920
ctcatggagc ggcgtaaccg tcgcacagga aggacagaga aagcgcggat ctgggaagtg 7980
acggacagaa cggtcaggac ctggattggg gaggcggttg ccgccgctgc tgctgacggt 8040
gtgacgttct ctgttccggt cacaccacat acgttccgcc attcctatgc gatgcacatg 8100
ctgtatgccg gtataccgct gaaagttctg caaagcctga tgggacataa gtccatcagt 8160
tcaacggaag tctacacgaa ggtttttgcg ctggatgtgg ctgcccggca ccgggtgcag 8220
tttgcgatgc cggagtctga tgcggttgcg atgctgaaac aattatcctg agaataaatg 8280
ccttggcctt tatatggaaa tgtggaactg agtggatatg ctgtttttgt ctgttaaaca 8340
gagaagctgg ctgttatcca ctgagaagcg aacgaaacag tcgggaaaat ctcccattat 8400
cgtagagatc cgcattatta atctcaggag cctgtgtagc gtttatagga agtagtgttc 8460
tgtcatgatg cctgcaagcg gtaacgaaaa cgatttgaat atgccttcag gaacaataga 8520
aatcttcgtg cggtgttacg ttgaagtgga gcggattatg tcagcaatgg acagaacaac 8580
ctaatgaaca cagaaccatg atgtggtctg tccttttaca gccagtagtg ctcgccgcag 8640
tcgagcgaca gggcgaagcc ctcgagtgag cgaggaagca ccagggaaca gcacttatat 8700
attctgctta cacacgatgc ctgaaaaaac ttcccttggg gttatccact tatccacggg 8760
gatattttta taattatttt ttttatagtt tttagatctt cttttttaga gcgccttgta 8820
ggcctttatc catgctggtt ctagctagag aaggtgttgt gacaaattgc cctttcagtg 8880
tgacaaatca ccctcaaatg acagtcctgt ctgtgacaaa ttgcccttaa ccctgtgaca 8940
aattgccctc agaagaagct gttttttcac aaagttatcc ctgcttattg actctttttt 9000
atttagtgtg acaatctaaa aacttgtcac acttcacatg gatctgtcat ggcggaaaca 9060
gcggttatca atcacaagaa acgtaaaaat agcccgcgaa tcgtccagtc aaacgacctc 9120
actgaggcgg catatagtct ctcccgggat caaaaacgta tgctgtatct gttcgttgac 9180
cagatcagaa aatctgatgg caccctacag gaacatgacg gtatctgcga gatccatgtt 9240
gctaaatatg ctgaaatatt cggattgacc tctgcggaag ccagtaagga tatacggcag 9300
gcattgaaga gtttcgcggg gaaggaagtg gttttttatc gccctgaaga ggatgccggc 9360
gatgaaaaag gctatgaatc ttttccttgg tttatcaaac gtgcgcacag tccatccaga 9420
gggctttaca gtgtacatat caacccatat ctcattccct tctttatcgg gttacagaac 9480
cggtttacgc agtttcggct tagtgaaaca aaagaaatca ccaatccgta tgccatgcgt 9540
ttatacgaat ccctgtgtca gtatcgtaag ccggatggct caggcatcgt ctctctgaaa 9600
atcgactgga tcatagagcg ttaccagctg cctcaaagtt accagcgtat gcctgacttc 9660
cgccgccgct tcctgcaggt ctgtgttaat gagatcaaca gcagaactcc aatgcgcctc 9720
tcatacattg agaaaaagaa aggccgccag acgactcata tcgtattttc cttccgcgat 9780
atcacttcca tgacgacagg atagtctgag ggttatctgt cacagatttg agggtggttc 9840
gtcacatttg ttctgaccta ctgagggtaa tttgtcacag ttttgctgtt tccttcagcc 9900
tgcatggatt ttctcatact ttttgaactg taatttttaa ggaagccaaa tttgagggca 9960
gtttgtcaca gttgatttcc ttctctttcc cttcgtcatg tgacctgata tcgggggtta 10020
gttcgtcatc attgatgagg gttgattatc acagtttatt actctgaatt ggctatccgc 10080
gtgtgtacct ctacctggag tttttcccac ggtggatatt tcttcttgcg ctgagcgtaa 10140
gagctatctg acagaacagt tcttctttgc ttcctcgcca gttcgctcgc tatgctcggt 10200
tacacggctg cggcgagcgc tagtgataat aagtgactga ggtatgtgct cttcttatct 10260
ccttttgtag tgttgctctt attttaaaca actttgcggt tttttgatga ctttgcgatt 10320
ttgttgttgc tttgcagtaa attgcaagat ttaataaaaa aacgcaaagc aatgattaaa 10380
ggatgttcag aatgaaactc atggaaacac ttaaccagtg cataaacgct ggtcatgaaa 10440
tgacgaaggc tatcgccatt gcacagttta atgatgacag cccggaagcg aggaaaataa 10500
cccggcgctg gagaataggt gaagcagcgg atttagttgg ggtttcttct caggctatca 10560
gagatgccga gaaagcaggg cgactaccgc acccggatat ggaaattcga ggacgggttg 10620
agcaacgtgt tggttataca attgaacaaa ttaatcatat gcgtgatgtg tttggtacgc 10680
gattgcgacg tgctgaagac gtatttccac cggtgatcgg ggttgctgcc cataaaggtg 10740
gcgtttacaa aacctcagtt tctgttcatc ttgctcagga tctggctctg aaggggctac 10800
gtgttttgct cgtggaaggt aacgaccccc agggaacagc ctcaatgtat cacggatggg 10860
taccagatct tcatattcat gcagaagaca ctctcctgcc tttctatctt ggggaaaagg 10920
acgatgtcac ttatgcaata aagcccactt gctggccggg gcttgacatt attccttcct 10980
gtctggctct gcaccgtatt gaaactgagt taatgggcaa atttgatgaa ggtaaactgc 11040
ccaccgatcc acacctgatg ctccgactgg ccattgaaac tgttgctcat gactatgatg 11100
tcatagttat tgacagcgcg cctaacctgg gtatcggcac gattaatgtc gtatgtgctg 11160
ctgatgtgct gattgttccc acgcctgctg agttgtttga ctacacctcc gcactgcagt 11220
ttttcgatat gcttcgtgat ctgctcaaga acgttgatct taaagggttc gagcctgatg 11280
tacgtatttt gcttaccaaa tacagcaata gtaatggctc tcagtccccg tggatggagg 11340
agcaaattcg ggatgcctgg ggaagcatgg ttctaaaaaa tgttgtacgt gaaacggatg 11400
aagttggtaa aggtcagatc cggatgagaa ctgtttttga acaggccatt gatcaacgct 11460
cttcaactgg tgcctggaga aatgctcttt ctatttggga acctgtctgc aatgaaattt 11520
tcgatcgtct gattaaacca cgctgggaga ttagataatg aagcgtgcgc ctgttattcc 11580
aaaacatacg ctcaatactc aaccggttga agatacttcg ttatcgacac cagctgcccc 11640
gatggtggat tcgttaattg cgcgcgtagg agtaatggct cgcggtaatg ccattacttt 11700
gcctgtatgt ggtcgggatg tgaagtttac tcttgaagtg ctccggggtg atagtgttga 11760
gaagacctct cgggtatggt caggtaatga acgtgaccag gagctgctta ctgaggacgc 11820
actggatgat ctcatccctt cttttctact gactggtcaa cagacaccgg cgttcggtcg 11880
aagagtatct ggtgtcatag aaattgccga tgggagtcgc cgtcgtaaag ctgctgcact 11940
taccgaaagt gattatcgtg ttctggttgg cgagctggat gatgagcaga tggctgcatt 12000
atccagattg ggtaacgatt atcgcccaac aagtgcttat gaacgtggtc agcgttatgc 12060
aagccgattg cagaatgaat ttgctggaaa tatttctgcg ctggctgatg cggaaaatat 12120
ttcacgtaag attattaccc gctgtatcaa caccgccaaa ttgcctaaat cagttgttgc 12180
tcttttttct caccccggtg aactatctgc ccggtcaggt gatgcacttc aaaaagcctt 12240
tacagataaa gaggaattac ttaagcagca ggcatctaac cttcatgagc agaaaaaagc 12300
tggggtgata tttgaagctg aagaagttat cactctttta acttctgtgc ttaaaacgtc 12360
atctgcatca agaactagtt taagctcacg acatcagttt gctcctggag cgacagtatt 12420
gtataagggc gataaaatgg tgcttaacct ggacaggtct cgtgttccaa ctgagtgtat 12480
agagaaaatt gaggccattc ttaaggaact tgaaaagcca gcaccctgat gcgaccacgt 12540
tttagtctac gtttatctgt ctttacttaa tgtcctttgt tacaggccag aaagcataac 12600
tggcctgaat attctctctg ggcccactgt tccacttgta tcgtcggtct gataatcaga 12660
ctgggaccac ggtcccactc gtatcgtcgg tctgattatt agtctgggac cacggtccca 12720
ctcgtatcgt cggtctgatt attagtctgg gaccacggtc ccactcgtat cgtcggtctg 12780
ataatcagac tgggaccacg gtcccactcg tatcgtcggt ctgattatta gtctgggacc 12840
atggtcccac tcgtatcgtc ggtctgatta ttagtctggg accacggtcc cactcgtatc 12900
gtcggtctga ttattagtct ggaaccacgg tcccactcgt atcgtcggtc tgattattag 12960
tctgggacca cggtcccact cgtatcgtcg gtctgattat tagtctggga ccacgatccc 13020
actcgtgttg tcggtctgat tatcggtctg ggaccacggt cccacttgta ttgtcgatca 13080
gactatcagc gtgagactac gattccatca atgcctgtca agggcaagta ttgacatgtc 13140
gtcgtaacct gtagaacgga gtaacctcgg tgtgcggttg tatgcctgct gtggattgct 13200
gctgtgtcct gcttatccac aacattttgc gcacggttat gtggacaaaa tacctggtta 13260
cccaggccgt gccggcacgt taaccgggct gcatccgatg caagtgtgtc gctgtcgacg 13320
agctcgcgag ctcggacatg aggttgcccc gtattcagtg tcgctgattt gtattgtctg 13380
aagttgtttt tacgttaagt tgatgcagat caattaatac gatacctgcg tcataattga 13440
ttatttgacg tggtttgatg gcctccacgc acgttgtgat atgtagatga taatcattat 13500
cactttacgg gtcctttccg gtgatccgac aggttacggg gcggcgacct cgcgggtttt 13560
cgctatttat gaaaattttc cggtttaagg cgtttccgtt cttcttcgtc ataacttaat 13620
gtttttattt aaaataccct ctgaaaagaa aggaaacgac aggtgctgaa agcgagcttt 13680
ttggcctctg tcgtttcctt tctctgtttt tgtccgtgga atgaacaatg gaagtccgag 13740
ctcatcgcta ataacttcgt atagcataca ttatacgaag ttatattcga t 13791