CN111548946B - 一种生产次丹参酮二烯的重组酵母工程菌 - Google Patents

一种生产次丹参酮二烯的重组酵母工程菌 Download PDF

Info

Publication number
CN111548946B
CN111548946B CN202010240128.0A CN202010240128A CN111548946B CN 111548946 B CN111548946 B CN 111548946B CN 202010240128 A CN202010240128 A CN 202010240128A CN 111548946 B CN111548946 B CN 111548946B
Authority
CN
China
Prior art keywords
tanshinone
gene
diene
smksl1
producing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010240128.0A
Other languages
English (en)
Other versions
CN111548946A (zh
Inventor
高伟
黄璐琦
胡添源
周家伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Medical University
Original Assignee
Capital Medical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Medical University filed Critical Capital Medical University
Priority to CN202010240128.0A priority Critical patent/CN111548946B/zh
Publication of CN111548946A publication Critical patent/CN111548946A/zh
Application granted granted Critical
Publication of CN111548946B publication Critical patent/CN111548946B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P15/00Preparation of compounds containing at least three condensed carbocyclic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及一种用于生产次丹参酮二烯的重组酵母工程菌,所述工程菌能发酵生产GGPP,通过将不同植物来源的II类二萜合酶基因和I类二萜合酶基因插入到底盘菌中,如将来源于毛喉鞘蕊花的CfTPS1和来源于丹参的SmCPS1二萜合酶进行组合,可获得高产丹参酮二烯的重组工程菌,而当将二者以SmCPS1‑CfTPS1形式融合时,次丹参酮二烯产量可以进一步升高。

Description

一种生产次丹参酮二烯的重组酵母工程菌
背景技术
在自然界中,许多二萜类化合物具有重要的药用或生物学活性,但因其结构的复杂性,很难通过化学合成的手段获得。二萜类化合物按照骨架可以分为克罗烷型(clerodane)、半日花烷型(labdane)、海松烷型(pimarane)、松香烷型(abietane)以及贝壳杉烷型(kaurane)二萜1-3。在植物体内,甲羟戊酸(mevalonate,MVA)途径和4-磷酸-2-甲基赤藓糖(2-C-methyl-D-erythritol-4-phosphate,MEP)途径产生成异戊烯基焦磷酸(isopentenyl diphosphate,IPP)及其同分异构体二甲基烯丙基焦磷酸(dimethylallyldiphosphate,DMAPP),在牻牛儿牻牛儿焦磷酸合酶(geranylgeranyl diphosphatesynthase,GGPPS)的催化下,IPP和DMAPP缩合生成二萜类化合物的共同前体物质牻牛儿牻牛儿焦磷酸((E,E,E)-geranylgeranyl diphosphate,GGPP)(图1-1)4。许多松香烷型二萜具有重要的药用价值,例如,来源于中药植物雷公藤的雷公藤甲素,具有显著的抗炎、抗肿瘤、免疫调节等活性,其成药已经处于I和II期临床试验阶段;以及来源于丹参的丹参酮类成分,具有心血管保护、抗氧化和抗肿瘤等显著药理活性5-8
尽管二萜类化合物具有广阔的应用前景,但其在天然植物组织中的含量较低,提取工艺繁琐且效率低下,严重限制了其进一步的开发和应用。相比之下,利用微生物进行天然产物的异源生产不仅可以保护自然资源还可以实现重要化合物的高效生产,如青蒿素的前体物质青蒿酸和紫杉醇的重要前体物质紫杉二烯9-10。充足的前体供给对实现二萜类化合物的途径重构和高效生产至关重要。松香完型二萜广泛存在于药用植物中,是合成多种二萜化合物的重要中间体,如雷公藤甲素、丹参酮、鼠尾草酸、鼠尾草酚、红砂烷内酯A-D等11-19。中国专利CN108395997中公开了一种高产二萜类成分的酵母工程菌,并在酿酒酵母中重构次丹参酮二烯的生物合成途径,将来源于丹参的两条二萜合酶基因(SmCPS1、SmKSL1)进行模块化途径工程优化,摇瓶发酵水平达到93.63mg/L的水平,在15L的发酵罐中获得了365mg/L的次丹参酮二烯20;随后,戴住波等人通过质粒过表达参与GGPP生物合成途径的关键基因,增加前体物质FPP和GGPP的代谢流,使次丹参酮二烯的摇瓶发酵水平达到61.8mg/L,继而通过发酵罐高密度发酵,产量进一步提高到488mg/L21。然而,这样的产量仍然达不到工业生产级别。
二萜类化合物的共同前体物质GGPP在含有“DXDD”特征功能域的II类(Class II)二萜合酶(diterpene synthase,di-TPS)的作用下初始环化为normal构型的柯巴基焦磷酸((+)-copalyl diphosphate,(+)-CPP),随后,在I类(Class I)二萜合酶(含有“DDXXD”特征功能域)的催化下,进一步环化、重排生成次丹参酮二烯17(附图1)。近年来,越来越多的研究报导了来源于不同植物的二萜合酶可以生成次丹参酮二烯11-19,22-24,但至今没有研究对这些二萜合酶生产次丹参酮二烯的效率进行比较。Jia等人收集来源于植物和细菌中的I类和II类二萜合酶,在大肠杆菌中进行重组表达,并分离鉴定出了13种新的二萜类化合物,并利用酶的组合效应使部分化合物的产量得到了显著地提高到了15mg/L的水平1。此外,关键酶的蛋白质修饰,包括融合酶的构建以及转运肽的截短,也是增加萜类化合物产量的有效策略10,20,25。例如,Jiang等人通组合调控植物来源的香叶醇合酶和酵母自身的异戊烯基转移酶Erg20,将酿酒酵母中香叶醇的产量由痕量提升至524mg/L(摇瓶产量)的国际领先水平26
发明内容
本发明的第一方面,在于提供一种用于生产次丹参酮二烯的重组酵母工程菌,所述重组酵母工程菌能发酵生产GGPP,采用多策略综合应用,包括(1)底盘菌的优化,提高前体物质GGPP的供给;(2)多植物来源次丹参酮二烯合酶的组合筛选;和(3)次丹参酮二烯合成模块的蛋白修饰,以期望获得可进一步提高次丹参酮二烯产量的有效方法。
本发明中,所述的多植物来源的次丹参酮二烯合酶组合,包括不同植物来源的II类二萜合酶和I类二萜合酶的组合。比如,所述多植物来源的次丹参酮二烯合酶,可以是来源于7种植物的14条次丹参酮二烯合酶,包含5条II类二萜合酶,8条I类二萜合酶,以及1条双功能酶(详见表7)。分别是来源于丹参(Salvia miltiorrhiza)的SmCPS1和SmKSL1、雷公藤(Tripterygium wilfordii)的TwCPS1和TwMS、毛喉鞘蕊花(Coleus forskohlii)的CfTPS1、CfTPS3和CfTPS4、欧夏至草(Marrubium vulgare)的MvCPS3和MvELS、迷迭香(Rosmarinus officinalis)的RoCPS1、RoKSL1和RoKSL2、希腊鼠尾草(Salvia fruticosa)的SfKSL,以及来源于江南卷柏(Selaginella moellendorffii)的双功能次丹参酮二烯合酶SmoMDS。
将上述II类二萜合酶的编码基因与I类二萜合酶编码基因进行随机组合,转化到可产GGPP的底盘菌中。
具体地,本发明所述重组酵母菌,首先其能够发酵生产GGPP,并在所述重组酵母工程菌中,新插入了包含如下基因:
(1)选自II类二萜合酶基因SmCPS1、TwCPS1、CfCPS1、MvCPS3或RoCPS1中的任意一种;以及
(2)选自I类二萜合酶基因SmKSL1、TwMS、CfTPS3、CfTPS4、MvELS、RoKSL1、RoKSL2或SfKSL中的任意一种。
本发明中,对于相同字母,或表示酶或表示酶的编码基因,在于字母斜体应用的不同,一个示例性的如SmCPS1,当用SmCPS1时,表示酶;而当用SmCPS1,表示该酶的编码基因。
本发明技术人员意外发现,II类萜类合酶CfTPS1与I类萜类合酶组合时,次丹参酮二烯产量高于其他II类萜类合酶,因此本发明一种优选的方式是:所述重组酵母工程菌中包含:
(1)II类二萜合酶基因优选为CfCPS1,以及
(2)选自I类二萜合酶基因SmKSL1、TwMS、CfTPS3、CfTPS4、MvELS、RoKSL1、RoKSL2或SfKSL中的任意一种。
另一方面,当I类萜类合酶SmKSL1与II类萜类合酶组合时,次丹参酮二烯的产量普遍高于其他I类萜类合酶,因此本发明另一种优选的方式是:所述重组酵母工程菌中包含:
(1)选自II类二萜合酶基因SmCPS1、TwCPS1、CfCPS1、MvCPS3或RoCPS1中的任意一种;以及
(2)I类二萜合酶基因SmKSL1。
更为优选的一种方式是,本发明所重组酵母工程菌,II类二萜合酶基因为CfCPS1,I类二萜合酶基因为SmKSL1。
本发明中,一个具体的实施方式可以是:如可以将I类二萜合酶基因和II类二萜合酶基因分别构建至pESC系列真核表达载体中,如构建至pESC-LEU的pGAL1和pGAL10启动子下游。表达载体也可以是其它,比如pYX212以及pESC系列其他筛选标记载体。
本发明的第二方面,进一步地,将获得的生产次丹参酮二烯高产模块CfTPS1与SmKSL1进行融合蛋白的构建,以柔性肽“GGGS”编码序列将CfTPS1与SmKSL1两条基因首尾相连成为融合蛋白模块(去掉前面基因的终止密码子),技术人员意外发现,当以SmKSL1-CfTPS1方式融合时,次丹参酮二烯的产量比未融合的方式,提高了约1.81倍,而以CfTPS1-SmKSL方式融合时,反而使次丹参酮二烯产量下降了近30%。因此,在本发明一个优选的实施方案中,所述II类二萜合酶基因CfTPS1,和所述I类二萜合酶基因SmKSL1,通过SmKSL1-CfTPS1融合方式,插入到可产GGPP的酵母菌中,得到生产次丹参酮二烯的重组酵母工程菌。
在本发明的第三方面,基于融合蛋白SmKSL1-CfTPS1高产模块基础上,对融合基因进行了进一步修饰。将融合蛋白SmKSL1-CfTPS1的SmKSL1 N端的叶绿体转运肽(M2-C47)截掉,形成截短的融合蛋白(下文称tSmKSL1-CfTPS1,其编码基因为tSmKSL1-CfTPS1),发现截短体融合蛋白的次丹参酮二烯产量得到了明显的提高,达到了截短前的约1.75倍。然而,在截短了SmKSL1 N端的叶绿体转运肽(M2-C47)基础上,进一步将CfTPS1的N端转运肽(M2-N81)截掉,次丹参酮二烯产量反而出现显著下调,仅有约融合蛋白SmKSL1-CfTPS1的58%,但仍比未融合之前高,为未融合之前的约1.8倍。因此,本发明的一个优选实施方案中,将在融合蛋白SmKSL1-CfTPS1的SmKSL1 N端的叶绿体转运肽(M2-C47)截掉而得到的截短融合蛋白tSmKSL1-CfTPS1编码基因tSmKSL1-CfTPS1,插入到可产GGPP的酵母菌中,得到生产次丹参酮二烯的重组酵母工程菌。一个具体的实施方案,可以是将融合酶基因构建到表达载体的pGAL10启动子下游。
本发明第四方面,本发明通过进一步改造生产次丹参酮二烯的重组酵母工程菌,以提高重组酵母酵母中前体物质GGPP的供给,结合优化后的次丹参酮二烯合酶基因模块,以期获得在酵母菌中次丹参酮二烯产量的进一步提高。
优选地,本发明所述重组酵母工程菌,在酵母菌过表达融合酶基因BTS1/ERG20、牻牛儿牻牛儿焦磷酸合酶基因SaGGPS和HMG-CoA还原酶基因催化活性域tHMG1。
在一个更为优选的实施方案中,所述重组酵母菌,在过表达BTS1/ERG20、SaGGPS和tHMG1基础上,进一步敲除了ROX1基因、YJL064w基因、YPL062w基因或ERG9启动子激活域(ERG9p)中的任意一种或多种,如单独敲除酵母菌中的ROX1基因,或单独敲除酵母菌中的YJL064w基因,或单独敲除YPL062w基因,或单独敲除ERG9p,也可以是敲除这些基因的组合,如敲除ROX1基因和ERG9p,或敲除ROX1基因和YPL062w基因,或敲除ROX1基因和YJL064w基因,或敲除ERG9p和YPL062w基因,或敲除ERG9p和YJL064w基因,或敲除ROX1基因、ERG9p和YJL064w基因,或敲除ROX1基因、ERG9p和YPL062w基因,或敲除ERG9p、YPL062w和YJL064w基因,或4个基因都敲除调。
中国专利CN108395997A公开了通过CRISPR/Cas9基因编辑技术改造酿酒酵母工程菌,增强二萜类化合物的生产能力,筛选得到高产GGPP的底盘菌,具体筛选方案包括:
(1)对BY4742菌进行改造,得到BY-T20底盘菌:
BY-T20酿酒酵母工程菌由BY4742改造而来,基因型为MATαtrp1Δ0leu2Δ0ura3Δ0,trp1::HIS3-PPGK1-BTS1/ERG20-TADH1-PTDH3-SaGGPS-TTPI1-PTEF1-tHMG1-TCYC1,前期已针对二萜途径进行了相应的改造(构建方法还可参考文献:Zhubo Dai,Beibei Wang,XueliZhang,et al.Scientific Reorts.2014(4):3698│DOI:10.1038/srep03698,1-6),在其基因组中过表达了HMGR、ERG20、BTSI和嗜酸热硫化叶菌的SaGGPS等增强GGPP代谢流的基因,但是并未对MVA途径起到抑制作用的基因进行改造。
(2)对BY-T20底盘菌的进一步改造,以获得GGPP积累能力更强的底盘菌:改造策略如下:①弱化FPP向三萜和甾醇途径转移的第一个关键基因ERG9的表达,敲除其启动子序列的诱导型顺式元件UAS;②敲除抑制甾醇途径上基因表达的转录因子编码基因ROX1;③敲除基因YPL062w和YJL064w,以提高MVA途径代谢流。将改造完成的菌株发酵,并检测二萜化合物共同前体物质GGPP的含量,筛选得到最优工程菌。
上述的改造方案均在中国专利CN108395997A(公开日2018.08.14)已有详细说明,在此将该专利全文引用到本发明中,可以通过CN108395997A实施例1至实施例10的技术方案,筛选底盘菌,底盘菌菌株信息如表3。
本发明中,所用的酵母工程菌,可以是来源于GEN.PK系酿酒酵母菌或BY系酿酒酵母菌,优选为BY系酿酒酵母,如可以是BY4741酿酒酵母、BY4742酿酒酵母或BY-T20酿酒酵母。
本发明的第五方面,提供了一种生产次丹参酮二烯的方法,所述方法包括:
将生产次丹参酮二烯的重组酵母工程菌接种到培养基中,进行发酵,提取分离发酵后的菌液,得到目标产物次丹参酮二烯,其中,所述重组酵母工程菌能发酵生产GGPP,并且所述重组酵母工程菌包含:
(1)选自II类二萜合酶基因SmCPS1、TwCPS1、CfCPS1、MvCPS3或RoCPS1中的任意一种;以及
(2)选自I类二萜合酶基因SmKSL1、TwMS、CfTPS3、CfTPS4、MvELS、RoKSL1、RoKSL2或SfKSL中的任意一种;
一种优选的II类二萜合酶基因与I类二萜合酶基因的组合方式是:
(1)II类二萜合酶基因优选为CfCPS1,以及
(2)选自I类二萜合酶基因SmKSL1、TwMS、CfTPS3、CfTPS4、MvELS、RoKSL1、RoKSL2或SfKSL中的任意一种。
一种优选的I类二萜合酶基因与II类二萜合酶基因的组合方式是:
(1)选自II类二萜合酶基因SmCPS1、TwCPS1、CfCPS1、MvCPS3或RoCPS1中的任意一种;以及
(2)I类二萜合酶基因SmKSL1。
更为优选的一种方式是,本发明所重组酵母工程菌,II类二萜合酶基因为CfCPS1,I类二萜合酶基因为SmKSL1。
本发明中,所述生产次丹参酮二烯的方法,其中所述II类二萜合酶基因CfCPS1与I类二萜合酶基因SmKSL1与通过融合方式插入到重组酵母菌中,优选的是以SmKSL1-CfTPS1方式融合。
在一优选的实施方案中,所述生产次丹参酮二烯的方法,其中融合基因SmKSL1-CfCPS1在SmKSL1的N端进行了截短,比如截短SmKSL1的N端叶绿体转运肽S2-C47编码基因。
本发明生产次丹参酮二烯的方法,所述重组酵母菌经进一步改造以提高重组酵母中前体物质GGPP的供给,并结合优化后的次丹参酮二烯合酶基因模块,以期获得在酵母菌中次丹参酮二烯产量的进一步提高,比如在酵母菌过表达融合酶基因BTS1/ERG20、牻牛儿牻牛儿焦磷酸合酶基因SaGGPS和HMG-CoA还原酶基因催化活性域tHMG1。在此基础上,进一步敲除了ROX1基因、YJL064w基因、YPL062w基因或ERG9启动子激活域(ERG9p)中的任意一种或多种,得到优化的底盘菌。
本发明生产次丹参酮二烯的方法,所述重组酵母菌,可以是来源于GEN.PK系酿酒酵母菌或BY系酿酒酵母菌,优选为BY系酿酒酵母,如可以是BY4741酿酒酵母、BY4742酿酒酵母或BY-T20酿酒酵母。
附图说明
图1为酿酒酵母中GGPP和次丹参酮二烯的生物合成途径示意图。
图2为改造的底盘菌菌株中GGOH产量图,其中A为不同基因型菌株中GGOH的产量;B为不同培养基发酵BY-HZ16菌株的GGOH产量;C为BY-HZ16菌株GGOH的高密度发酵结果。
图3为次丹参酮二烯真核表达载体的构建示意图,其中MCS(Multiple cloningsite)表示多克隆位点。
图4为丹参酮二烯的GC-MS定性检测图,其中A为次丹参酮二烯的气象色谱检测结果;B为次丹参酮二烯的质谱鉴定结果。
图5为不同来源二萜合酶组合的次丹参酮二烯产量比较图。
图6为二萜合酶CfTPS1及SmKSL1的不同融合方式对次丹参酮二烯产量的影响,其中A为不同融合方式在菌株中次丹参酮二烯的产量比较,B为两种不同融合方式蛋白的结构模拟。
图7为不同蛋白截短对次丹参酮二烯产量的影响,其中A为表达蛋白截短变体的菌株中次丹参酮二烯的产量;B为对蛋白截短体表达菌株的产物进行GC-MS定性分析;C为不同菌株中二萜类产物产量的比较分析。
图8为BY-HZ70菌株的高密度发酵的次丹参酮二烯的产量。
图9为不同表达模块在不同底盘菌中次丹参酮二烯产量比较,不同菌中,不同模块对次丹参酮二烯表达产量的影响趋势基本一致。
具体实施方式
实验材料
表1本发明载体和菌株信息
Figure BDA0002432253580000051
表2本发明主要试剂
Figure BDA0002432253580000052
Figure BDA0002432253580000061
实施例1重组酵母底盘菌的筛选
以增加次丹参酮二烯的前体物质GGPP为指标,对酿酒酵母菌BY4742、BY-T20进行改造,改造方法可以参考文献(Zhubo Dai,Beibei Wang,Xueli Zhang,et al.ScientificReorts.2014(4):3698│DOI:10.1038/srep03698,1-6)及中国专利CN108395997A,CN108395997A实施例1至实施例10中公开了BY-T20菌株的改造,将其全部引用到本发明中。(本发明重组酵母底盘菌信息见表3)。
BY-T20菌株基因型为:MATαtrp1Δ0 leu2Δ0 ura3Δ0,trp1::HIS3-PPGK1-BTS1/ERG20-TADH1-PTDH3-SaGGPS-TTPI1-PTEF1-tHMG1-TCYC1,来源于中国科学院天津工业生物技术研究所张学礼教授。首先将酿酒酵母菌株BY4742(ATCC Number:201389)基因组中的Trp1基因替换成His3基因,然后在菌株染色体的rDNA位点插入以下三个基因,以提高GGPP的代谢流,它们分别是:①MVA途径的关键酶基因HMG1的催化活性域tHMG1;②可以催化IPP和DMAPP依次生成FPP和GGPP的融合酶基因BTS1/ERG20;③可以直接催化IPP和DMAPP生成GGPP的嗜酸热硫化叶菌牻牛儿牻牛儿焦磷酸合酶基因SaGGPS,各基因的启动子和终止子均以酿酒酵母BY4741基因组为模板PCR扩增得到(构建方法还可参考文献:Zhubo Dai,Beibei Wang,Xueli Zhang,et al.Scientific Reorts.2014(4):3698│DOI:10.1038/srep03698,1-6)。
为了获得更高产量的GGPP,在5-L生物反应器(上海宝兴生物工程设备有限公司)中对BY-HZ16菌株进行补料分批发酵。详细过程为:挑取单克隆接种到含有20mL YPD培养基的100mL三角瓶中,30℃和200rpm培养24h。将初次活化菌液按照OD600≈0.2接种到150mL新鲜的YPD培养基中,扩繁12h,直到OD600≈5.0。将二次活化后的菌液按照OD600≈0.1接种至含有1.5L优化YPD培养基(OYPD、5%葡萄糖、1%酵母提取物、3%蛋白胨、0.8%KH2PO4和0.6%MgSO4)的生物反应器中,温度设置为30℃,氨水调节至pH值约为5.5。通过调节搅拌速度和通气,使溶氧(DO)保持在30%以上。根据菌体密度以指数速度补充浓度为80%(w/v)的葡萄糖浓缩溶液,并控制罐中葡萄糖浓度不超过1g/L。此外,定时补充5×YP混合物(5%酵母提取物,15%蛋白胨),为细胞生长提供足够的营养。在发酵10h时,向培养基中加入20%(v/v)正十二烷的萃取相,开始双相萃取发酵。定时取料以测定细胞密度和GGOH的产量。
发酵结束后,小心吸取100μL正十二烷层到PCR管中,12000×g离心1min,吸取10μL上清,按照1:100溶解到正己烷中,过0.22μm微孔滤膜,转移至液相小瓶中,密封,用于GC-MS检测。
GC-MS分析条件为:色谱柱为DB-5ms(15m×0.25mm),取1μL样品进样,无分流模式下,100℃保持1min,40℃/min升至200℃,保持1min,20℃/min升至300℃,保持1min(总运行时间10.5min);进样口温度250℃,离子源温度250℃,电子能量70ev,对样品进行20-300m/z范围扫描。使用MRM程序对样品进行精确定量,选取119m/z作为定量离子,41m/z和53m/z作为限定离子。以GGOH标准品作为对照,制作标准曲线,并对样品中GGOH含量进行测定。
表3底盘菌基因型信息
Figure BDA0002432253580000071
注:本发明中,菌株名称BY-HZ10对应于专利CN108395997A中的BY-HZ11,BY-HZ11CN108395997A中的BY-HZ10,BY-HZ12对应CN108395997A中的BY-HZ14,BY-HZ15对应CN108395997A中的BY-HZ12,BY-HZ17。BY-HZ17和BY-HZ18为将UPC2.1基因插入到YPL062w删除位点。
在BY-T20原菌中,检测到其GGOH的产量为40.3mg/L。下调了BY-T20中ERG9基因的表达(BY-HZ10),其GGOH产量得到了显著的提高,达到了196.4mg/L。ROX1基因的敲除将GGOH产量提高了1.96倍(BY-HZ11)。在BY-T20中同时敲除了上述两条基因,发现GGOH产量得到了进一步提高,产量为206.9mg/L(BY-HZ12)。分别敲除了YPL062w和YJL064w基因(BY-HZ13、BY-HZ15)的改造菌,其GGOH产量上调水平较小。以BY-HZ12为基础,同时对这两条基因进行敲除时,我们发现GGOH产量提高到了274.7mg/L(BY-HZ16)。在UPC2.1插入菌株中,发现BY-H17中的GGOH产量比BY-HZ13提高了1.36倍。因此,在BY-HZ16菌株的基础上插入了UPC2.1基因,但结果显示,BY-HZ18的GGOH产量反而较BY-HZ16有所下降(附图2A)。
对发酵条件进行优化,发现高浓度的经优化的YPD培养基(5%葡萄糖、1%酵母提取物、3%蛋白胨、0.8%KH2PO4和0.6%MgSO4)对菌体生长及GGPP产量具有显著的上调作用。经过优化的YPD培养基培养,BY-HZ16的GGOH产量达到了557.2mg/L(图2B)。随后,用该优化培养基对BY-HZ16菌株进行发酵罐分批补料发酵,GGOH产量可以达到2.1g/L(附图2C)。
实施例2次丹参酮二烯合酶真核表达载体的构建
在NCBI数据库(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)中下载14条二萜合酶基因的序列,分别是来源于丹参(Salvia miltiorrhiza)的SmCPS1和SmKSL1、雷公藤(Tripterygium wilfordii)的TwCPS1和TwMS、毛喉鞘蕊花(Coleus forskohlii)的CfTPS1、CfTPS3和CfTPS4、欧夏至草(Marrubium vulgare)的MvCPS3和MvELS、迷迭香(Rosmarinusofficinalis)的RoCPS1、RoKSL1和RoKSL2、希腊鼠尾草(Salvia fruticosa)的SfKSL,以及来源于江南卷柏(Selaginella moellendorffii)的双功能次丹参酮二烯合酶基因SmoMDS。将其根据酿酒酵母密码子偏好性进行改进,改进的方法是本领域的常规技术手段,例如,根据本领域已知的相关基因的序列并参照酿酒酵母密码子偏好性进行人工合成(酿酒酵母密码子偏好性设计可参考http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=493所公开的信息进行),任何依据酿酒酵母密码子偏好而设计得到的上述基因,均可以用于本发明。示例性的各二萜合酶基因改进后的密码子序列如SEQ ID NO:50(TwCPS1)、51(RoCPS1)、52(SmCPS1)、53(CfTPS1)、54(MvCPS3)、55(SmKSL1)、56(CfTPS3)、57(CfTPS4)、58(TwMS)、59(MvEKS)、60(RoKSL1)、61(RoKSL2)、62(SfKSL)及63(SmoMDS)所示。将获得上述改进的二萜合酶基因,通过同源重组的方式将I类二萜合酶基因和II类二萜合酶基因分别构建至真核表达载体pESC-LEU的pGAL1和pGAL10启动子下游(MCS2和MCS1)(附图3)。具体操作如下:
(1)将I类二萜合酶、II类二萜合酶、MCS1启动子同源片段L1和终止子同源片段L2、MCS2启动子同源片段L3和终止子同源片段L4以及启动子片段pGAL1-pGAL10分别扩增,纯化;
(2)使用无缝拼接载体构建法,分别拼接L1-II类二萜合酶-L2和L3-I类二萜合酶-L4片段。
体系:
Figure BDA0002432253580000081
条件:50℃孵育15min;冰上放置。
(3)将上述反应体系作为模板,使用L1-F/L2-R与L3-F/L4-R作为引物,分别扩增L1-II类二萜合酶-L2和L3-I类二萜合酶-L4片段(引物L1-F、L1-R、L2-F、L2-R、L3-F、L3-R、L4-F及L4-R,以及扩增本发明所述的各I类二萜合酶基因、II类二萜合酶基因的引物、融合酶基因的引物,详见表4);
(4)pESC-LEU双酶切
选取pESC-LEU载体MCS1的NotI限制性酶切位点和MCS2的BamHI限制性酶切位点作为酶切位点进行双酶切。
体系:
Figure BDA0002432253580000082
Figure BDA0002432253580000091
条件:37℃ 2h
(5)切胶回收载体和扩增片段,测定核酸浓度,待用;
(6)挑取含有BY-HZ16单菌落,按照下面步骤制备电击转化感受态细胞:
①收集菌体
单菌落→10mL YPD(12~16h)→50mL YPD(3~5h)→OD600=0.6~1.0
将菌液于4℃,10000g离心,弃上清,用等体积4℃预冷无菌水重悬清洗一次,同样条件下离心,去上清。
②菌体处理
按下表配方配制处理液:
加入等体积处理液,25℃下放置20min(DTT现用现加)。
Figure BDA0002432253580000092
③离心弃上清,用等体积1M山梨醇洗两次。
④用500μL 1M山梨醇重悬菌体,分装成100μL/管,梯度降温冻存至-80℃冰箱。
(7)将线性化载体和插入片段(pGAL1-pGAL10、L1-II类二萜合酶-L2和L3-I类二萜合酶-L4片段)按照载体60-80ng/kb、片段100ng/kb1的量混合,转化到200μL电转感受态中,涂SD-His-Leu固体培养基,30℃培养2-3天;
(8)挑取单菌落,摇培至浑浊后使用L2-R和L4-R引物进行菌液PCR验证,出现6kb左右条带的PCR产物送测序,若测序结果无误,则载体构建成功;
(9)向阳性菌液中添加20%的甘油,-80℃冻存,备用(构建所得的各种次丹参酮二烯合酶真核表达载体的质粒信息见表5,菌株信息见表6)。
表4扩增引物信息
Figure BDA0002432253580000093
Figure BDA0002432253580000101
Figure BDA0002432253580000111
注:CSC、CSS是构建pESC-LEU::(CfTPS1-SmKSL1)时分别用于扩增CfTPS1和SmKSL1的引物;
SCS、SCC是构建pESC-LEU::(SmKSL1-CfTPS1)时分别用于扩增SmKSL1和CfTPS1的引物;
T1-Sm是构建pESC-LEU::(tSmKSL1-CfTPS1)扩增tSmKSL1的引物;
T2-Cf是构建pESC-LEU::(tSmKSL1-tCfTPS1)扩增tCfTPS1的引物;
T3-Sm是构建pESC-LEU::(SmKSL1α-CfTPS1)扩增SmKSL1α的引物;
T4-Cf是构建pESC-LEU::(SmKSL1α-CfTPS1βγ)扩增CfTPS1βγ的引物。
表5次丹参酮二烯真核表达载体质粒信息
Figure BDA0002432253580000112
Figure BDA0002432253580000121
表6次丹参酮二烯重组酵母工程菌菌株信息
Figure BDA0002432253580000122
Figure BDA0002432253580000131
融合蛋白载体pESC-LEU::(CfTPS1-SmKSL1)和pESC-LEU::(SmKSL1-CfTPS1)构建时,将上游基因的终止密码子去除,并用柔性肽“GGGS”编码序列将两个基因连接,然后构建到pGAL10启动子下游。融合蛋白截短体①pESC-LEU::(tSmKSL1-CfTPS1)去掉了SmKSL1的N端转运肽(S2-C47),②pESC-LEU::(tSmKSL1-tCfTPS1)在①的基础上去掉了CfTPS1的N端转运肽(G2-N81),③pESC-LEU::(SmKSL1α-CfTPS1)去掉了SmKSL1的β结构域(S2-S256)、④pESC-LEU::(SmKSL1α-CfTPS1βγ)在③的基础上去掉了CfTPS1的α结构域(N550-A786)。载体的构建方法同上,获得融合蛋白载体质粒信息、以及菌株信息见表5和表6。
实施例3次丹参酮二烯的发酵
由于pGAL1和pGAL10为半乳糖诱导启动子,因此发酵过程中需使用半乳糖诱导型培养基。
小量摇瓶发酵使用诱导型SD-Leu液体培养基:SD-Leu+0.2%葡萄糖+1.8%半乳糖,双相萃取发酵,具体操作如下
(1)挑取阳性单菌落转接入5mL SD-Leu液体培养基中,30℃ 200rpm摇培24h至OD600约为5;
(2)测(1)中菌液的OD值,按照终浓度为OD600=0.2进行稀释,30℃,200rpm摇培10-12h,进行二次活化;
(3)将(2)中的菌液按照终浓度OD600=0.05进行稀释,诱导型SD-Leu液体培养基30℃,200rpm进行发酵,发酵体积为20mL,每个菌株做5个生物学重复;
(4)发酵10h时,向培养基中加入10%体积的正十二烷,发酵总时间为6天。
为了探索高产菌株次丹参酮二烯的生产潜力,对BY-HZ70菌株进行高密度发酵。菌体活化步骤与GGOH发酵过程类似(改YPD培养基为SD-His-Leu),使用无机盐培养基作为初始发酵培养基(5g/L(NH4)2SO4,3g/L KH2PO4,0.5g/L MgSO4·7H2O,60g/Lmg/L尿嘧啶,60g/Lmg/L色氨酸,20g/L葡萄糖以及微量金属元素和维生素溶液)。温度、pH以及溶氧的控制与GGOH发酵过程一样。当发酵6h时,将碳源由葡萄糖改为半乳糖,补糖速率根据菌体密度进行指数性调节。当发酵总时间为10h时,向发酵液中加入20%(v/v)的正十二烷。每隔约12h取样,进行生物量与次丹参酮二烯产量的测定。
实施例4次丹参酮二烯的提取与含量测定
发酵结束后,小心吸取100μL正十二烷层到PCR管中,12000×g离心1min,吸取10μL上清,按照1:100溶解到正己烷中,
过0.22μm微孔滤膜,转移至液相小瓶中,密封,用于GC-MS检测。
GC-MS分析条件为:色谱柱为DB-5ms(15m×0.25mm),取1μL样品进样,无分流模式下,50℃保持2min,40℃·min-1升至170℃,20℃·min-1升至240℃,40℃·min-1升至300℃,保持1min(总运行时间11min);进样口温度250℃,离子源温度250℃,电子能量70ev,对样品进行20-300m/z范围扫描。使用MRM程序对样品进行精确定量,选取134m/z作为定量离子,65m/z和91m/z作为限定离子。以次丹参酮二烯标准品作为对照,制作标准曲线,并对样品中次丹参酮二烯含量进行测定。
实施例5次丹参酮二烯高产模块的筛选
除了充足的前体供给,二萜合酶基因的催化活性是影响下游二萜产物产量的另一关键因素。在植物中,II类二萜合酶催化GGPP初始环化成为CPP,CPP又在I类二萜合酶的作用下生成次丹参酮二烯,二萜合酶的催化效率是影响次丹参酮二烯产量的关键因素。本发明搜集了来自7种不同植物的14条次丹参酮二烯合酶,其中包括5条II类二萜合酶、8条I类二萜合酶以及1条双功能酶(表7),具体为来自Salvia miltiorrhiza的SmCPS1和SmKSL1、来自Tripterygium wilfordii的TwCPS1和TwMS、来自Coleus forskohlii的CfTPS1、CfTPS3和CfTPS4、来自Marrubium vulgare的MvCPS3和MvELS、来自Rosmarinus officinalis的RoCPS1、RoKSL1和RoKSL2、来自Salvia fruticosa的SfKSL,以及来自Selaginellamoellendorffii的双功能酶SmoMDS。将上述II类与I类二萜合酶进行随机组合构建真核载体(载体质粒信息见表5),并转化到GGPP高产底盘菌BY-HZ16中(菌株信息见表6),在发酵液中成功检测到次丹参酮二烯(附图4)。
表7二萜合酶基因信息
Figure BDA0002432253580000141
Figure BDA0002432253580000151
对39个次丹参酮二烯生产菌株进行定量(详见图5),本发明技术人员惊奇地发现,II类萜类合酶CfTPS1与I类萜类合酶组合时,次丹参酮二烯产量高于其他II类萜类合酶,I类萜类合酶SmKSL1与II类萜类合酶组合时,次丹参酮二烯的产量普遍高于其他I类萜类合酶,且与CfTPS1组合时次丹参酮二烯产量最高,为105.3mg/L(BY-HZ49)(附图5)。相反,来源于雷公藤的TwMS产生次丹参酮二烯的量最低。此外,我们还发现,不同组合的II类与I类萜类合酶生成的次丹参酮二烯产量的分布规律不同,例如,RoKSL2、RoKSL1与CfTPS1组合时RoKSL2次丹参酮二烯的转化率较高,而二者与SmCPS1组合时结果则相反。综上所述,本发明筛选得到了生产次丹参酮二烯的最佳组合SmKSL1与CfTPS1。
实施例6次丹参酮二烯高产模块的蛋白结构优化
本发明中将获得的次丹参酮二烯高产模块CfTPS1与SmKSL1进行不同方向的融合,以柔性肽“GGGS”编码序列将两条基因首尾相连成为融合蛋白模块(去掉前面基因的终止密码子),结果表明,当以SmKSL1-CfTPS1方式融合时(BY-HZ69),次丹参酮二烯的产量比对照提高了1.81倍,达到了313.4mg/L,而另一种融合方式CfTPS1-SmKSL反而使次丹参酮二烯产量下降至70.5mg/L(BY-HZ68)。II类二萜合酶具有αβγ三个结构域,其催化活性位点位于βγ结构域之间,I类二萜合酶具有αβ结构域,其催化活性位点位于α结构域,对两种不同方式的融合蛋白进行结构模拟,结果表明,当以CfTPS1-SmKSL方式融合时,两个催化活性位点之间的距离明显大于SmKSL1-CfTPS1方式融合蛋白,这可能是不同融合方向次丹参酮二烯产量相差很大的原因(附图6)。本发明获得了次丹参酮二烯高产融合模块SmKSL1-CfTPS1。
继续以融合蛋白SmKSL1-CfTPS1为模板,对其进行了进一步修饰。来源于植物的二萜合酶往往具有N端转运肽,这些转运肽可以将酶定位到特定的质体,定位结束后,转运肽被水解,然而,酿酒酵母不能降解植物来源的转运肽,这在一定程度上会影响二萜合酶的活性27。鉴于此,对SmKSL1和CfTPS1两条基因进行了蛋白结构和转运肽分析(http:// www.compbio.dundee.ac.uk/jpred/index.htmlhttp://www.cbs.dtu.dk/services/ ChloroP/),发现二者均存在N端叶绿体转运肽。于是,将融合蛋白SmKSL1 N端的叶绿体转运肽(S2-C47)截掉,发现截短体融合蛋白的次丹参酮二烯产量得到了明显的提高,达到了550.7mg/L(BY-HZ70)(附图7)。在此基础上,接下来又将CfTPS1的N端转运肽(G2-N81)截掉,但是次丹参酮二烯产量反而显著下调至180.48mg/L(BY-HZ71)。
通常认为II类二萜合酶的α结构域远离催化活性中心且缺少“DDXXD”保守位点,为非功能结构域;I类二萜合酶的β结构域远离催化活性中心且缺少“DXDD”保守位点,为非功能结构域。基于此,本发明又对融合蛋白进行了进一步的改造,首先,将视为无催化功能的SmKSL1β结构域(S2-S256)截掉(BY-HZ72),结果并没有如预期所想,产物中检测不到次丹参酮二烯,只有CPP的水解产物copalol以及副产物GGOH。然后,又在前者的基础上将CfTPS1的α结构域(N550-A786)截掉(BY-HZ73),结果产物中既没有次丹参酮二烯也没有copalol。通过上面的结果,推测,虽然II类二萜合酶的α结构域和I类二萜合酶的β结构域远离催化活性位点,但是对蛋白发挥完整的功能依然具有存在的必要性。
实施例7次丹参酮二烯的高密度发酵
本发明将获得的最优次丹参酮二烯高产菌株BY-HZ70进行高密度发酵。使用无机盐培养基作为发酵培养基(5g/L(NH4)2SO4,3g/L KH2PO4,0.5g/L MgSO4·7H2O,60mg/L尿嘧啶,60mg/L色氨酸,20g/L葡萄糖以及微量金属元素和维生素溶液),初始碳源为葡萄糖,发酵6h后换成半乳糖。如附图8所示,当菌体代谢适应半乳糖后(约发酵时间24h),菌体量与次丹参酮二烯产量均开始稳定增长,并于132h时,菌体量达到最大,为OD600=99.28。次丹参酮二烯产量与生物量呈显著正相关,且持续累积至180h达到最高值,产量为3.5g/L。在发酵的前两天,副产物GGOH浓度非常低,但是随着菌体量的增大也在慢慢积累,直到发酵结束时GGOH的浓度为92.4mg/L。与摇瓶发酵相比,副产物GGOH的比例显著下降。由此可见,高密度发酵有效地提高了二萜前体物质GGPP的利用率,BY-HZ70菌株具有工业化生产次丹参酮二烯的潜力。
实施例8丹参酮二烯合酶模块(tSmKSL1-CfTPS1)的适用性
为了探讨该次丹参酮二烯合酶模块(tSmKSL1-CfTPS1)在其他酿酒酵母宿主菌中是否同样具有优势,我们将部分次丹参酮二烯生产质粒pESC-LEU::SmCPS1+SmKSL1、pESC-LEU::MvCPS3+CfTPS4、pESC-LEU::CfTPS1+SmKSL1、pESC-LEU::CfTPS1+CfTPS4、pESC-LEU::RoCPS1+SmKSL1、pESC-LEU::TwCPS1+SmKSL1、pESC-LEU::(CfTPS1-SmKSL1)、pESC-LEU::(SmKSL1-CfTPS1)、pESC-LEU::(tSmKSL1-CfTPS1)以及pESC-LEU::(tSmKSL1-tCfTPS1)转化到酿酒酵母BY-T20、BY-HZ11以及BY-HZ12中。结果显示(如图9),这些次丹参酮二烯生产模块在不同底盘菌中的次丹参酮二烯产量趋势与在BY-HZ16中基本一致,CfTPS1+SmKSL1组合优于其他I类与II类二萜合酶组合,SmKSL1-CfTPS1融合模块优于分开表达和CfTPS1-SmKSL1融合模块,SmKSL1 N端转运肽截短融合模块tSmKSL1-CfTPS1产量最高,优于一切其他组合与截短模块。但是由于底盘细胞生产GGPP的差异,这些菌株中次丹参酮二烯产量均比BY-HZ70低。由此可见,优选模块tSmKSL1-CfTPS1具有较高的次丹参酮二烯生产水平。
参考文献
1.Jia,M.R.;Potter,K.C.;Peters,R.J.,Metab Eng 2016,37,24-34.
2.Christianson,D.W.,Chem Rev 2017,117(17),11570-11648.
3.Gao,Y.;Honzatko,R.B.;Peters,R.J.,Nat Prod Rep 2012,29(10),1153-1175.
4.Ignea,C.;Trikka,F.A.;Nikolaidis,A.K.;Georgantea,P.;Ioannou,E.;Loupassaki,S.;Kefalas,P.;Kanellis,A.K.;Roussis,V.;Makris,A.M.;Kampranis,S.C.,Metab Eng 2015,27,65-75.
5.Noel,P.;Von Hoff,D.D.;Saluja,A.K.;Velagapudi,M.;Borazanci,E.;Han,H.Y.,Trends Pharmacol Sci 2019,40(5),327-341.
6.Corson,T.W.;Crews,C.M.,Cell 2007,130(5),769-774.
7.Feng,C.;Huang,Y.N.;He,W.X.;Cheng,X.Y.;Liu,H.L.;Huang,Y.Q.;Ma,B.H.;Zhang,W.;Liao,C.B.;Wu,W.H.;Shao,Y.P.;Xu,D.;Su,Z.D.;Lu,W.Y.,Acs Central Sci2019,5(7),1278-1288.
8.Jiang,Z.Q.;Gao,W.;Huang,L.Q.,Front Pharmacol 2019,10.
9.Paddon,C.J.;Westfall,P.J.;Pitera,D.J.;Benjamin,K.;Fisher,K.;McPhee,D.;Leavell,M.D.;Tai,A.;Main,A.;Eng,D.;Polichuk,D.R.;Teoh,K.H.;Reed,D.W.;Treynor,T.;Lenihan,J.;Fleck,M.;Bajad,S.;Dang,G.;Dengrove,D.;Diola,D.;Dorin,G.;Ellens,K.W.;Fickes,S.;Galazzo,J.;Gaucher,S.P.;Geistlinger,T.;Henry,R.;Hepp,M.;Horning,T.;Iqbal,T.;Jiang,H.;Kizer,L.;Lieu,B.;Melis,D.;Moss,N.;Regentin,R.;Secrest,S.;Tsuruta,H.;Vazquez,R.;Westblade,L.F.;Xu,L.;Yu,M.;Zhang,Y.;Zhao,L.;Lievense,J.;Covello,P.S.;Keasling,J.D.;Reiling,K.K.;Renninger,N.S.;Newman,J.D.,Nature 2013,496(7446),528-+.
10.Ajikumar,P.K.;Xiao,W.H.;Tyo,K.E.J.;Wang,Y.;Simeon,F.;Leonard,E.;Mucha,O.;Phon,T.H.;Pfeifer,B.;Stephanopoulos,G.,Science 2010,330(6000),70-74.
11.Su,P.;Guan,H.;Zhao,Y.;Tong,Y.;Xu,M.;Zhang,Y.;Hu,T.;Yang,J.;Cheng,Q.;Gao,L.;Liu,Y.;Zhou,J.;Peters,R.J.;Huang,L.;Gao,W.,Plant J 2018,93(1),50-65.
12.Sugai,Y.;Ueno,Y.;Hayashi,K.;Oogami,S.;Toyomasu,T.;Matsumoto,S.;Natsume,M.;Nozaki,H.;Kawaide,H.,J Biol Chem 2011,286(50),42840-42847.
13.Bruckner,K.;Bozic,D.;Manzano,D.;Papaefthimiou,D.;Pateraki,I.;Scheler,U.;Ferrer,A.;de Vos,R.C.H.;Kanellis,A.K.;Tissier,A.,Phytochemistry2014,101,52-64.
14.Zerbe,P.;Chiang,A.;Dullat,H.;O'Neil-Johnson,M.;Starks,C.;Hamberger,B.;Bohlmann,J.,Plant Journal 2014,79(6),914-927.
15.Pateraki,I.;Andersen-Ranberg,J.;Hamberger,B.;Heskes,A.M.;Martens,H.J.;Zerbe,P.;Bach,S.S.;Moller,B.L.;Bohlmann,J.;Hamberger,B.,Plant Physiol2014,164(3),1222-1236.
16.Bozic,D.;Papaefthimiou,D.;Bruckner,K.;de Vos,R.C.H.;Tsoleridis,C.A.;Katsarou,D.;Papanikolaou,A.;Pateraki,I.;Chatzopoulou,F.M.;Dimitriadou,E.;Kostas,S.;Manzano,D.;Scheler,U.;Ferrer,A.;Tissier,A.;Makris,A.M.;Kampranis,S.C.;Kanellis,A.K.,Plos One 2015,10(5).
17.Gao,W.;Hillwig,M.L.;Huang,L.;Cui,G.H.;Wang,X.Y.;Kong,J.Q.;Yang,B.;Peters,R.J.,Org Lett 2009,11(22),5170-5173.
18.Hansen,N.L.;Heskes,A.M.;Hamberger,B.;Olsen,C.E.;Hallstrom,B.M.;Andersen-Ranberg,J.;Hamberger,B.,Plant Journal 2017,89(3),429-441.
19.Jin,B.;Cui,G.;Guo,J.;Tang,J.;Duan,L.;Lin,H.;Shen,Y.;Chen,T.;Zhang,H.;Huang,L.,Plant Physiol 2017,174(2),943-955.
20.Zhou,Y.J.J.;Gao,W.;Rong,Q.X.;Jin,G.J.;Chu,H.Y.;Liu,W.J.;Yang,W.;Zhu,Z.W.;Li,G.H.;Zhu,G.F.;Huang,L.Q.;Zhao,Z.B.K.,J Am Chem Soc 2012,134(6),3234-3241.
21.Dai,Z.;Liu,Y.;Huang,L.;Zhang,X.,Biotechnol Bioeng 2012,109(11),2845-53.
22.Inabuy,F.S.;Fischedick,J.T.;Lange,I.;Hartmann,M.;Srividya,N.;Parrish,A.N.;Xu,M.M.;Peters,R.J.;Lange,B.M.,Plant Physiol 2017,175(1),92-103.
23.Pelot,K.A.;Hagelthorn,D.M.;Addison,J.B.;Zerbe,P.,Plos One 2017,12(4).
24.Zhang,H.B.;Jin,B.L.;Bu,J.L.;Guo,J.;Chen,T.;Ma,Y.;Tang,J.F.;Cui,G.H.;Huang,L.Q.,Molecules 2018,23(11).
25.Chen,Y.;Xiao,W.H.;Wang,Y.;Liu,H.;Li,X.;Yuan,Y.J.,Microb Cell Fact2016,15.
26.Jiang,G.Z.;Yao,M.D.;Wang,Y.;Zhou,L.;Song,T.Q.;Liu,H.;Xiao,W.H.;Yuan,Y.J.,Metab Eng 2017,41,57-66.
27.Bohlmann,J.;Meyer-Gauen,G.;Croteau,R.,P Natl Acad Sci USA 1998,95(8),4126-4133.
序列表
<110> 首都医科大学
<120> 一种生产次丹参酮二烯的重组酵母工程菌
<130> TQZX2020-ZL0190
<141> 2020-03-31
<160> 63
<170> SIPOSequenceListing 1.0
<210> 1
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 1
agcagttaag cgtattactg aaag 24
<210> 2
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 2
gccctttagt gagggttgaa ttcga 25
<210> 3
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 3
gcactagtat cgatggatta caagg 25
<210> 4
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 4
cctgacctac aggaaagagt tactc 25
<210> 5
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 5
ggtaattaat cagcgaagcg atga 24
<210> 6
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 6
ccggggtttt ttctccttga cgtta 25
<210> 7
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 7
ccgtaatacg actcactata gggcc 25
<210> 8
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 8
gttacatgcg tacacgcgtc tgtac 25
<210> 9
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 9
tcaaccctca ctaaagggca tggcttcatt gtcatctact atct 44
<210> 10
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 10
aatccatcga tactagtgct taggcaactg gctcaaacaa aacc 44
<210> 11
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 11
tcaaccctca ctaaagggca tgcactccct gttgatgaag aaag 44
<210> 12
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 12
aatccatcga tactagtgct cagtcaaccc tctcgaacaa aacc 44
<210> 13
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 13
tcaaccctca ctaaagggca tgggttcttt gtctaccatg aact 44
<210> 14
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 14
aatccatcga tactagtgct caggcgactg gttcgaacaa aacc 44
<210> 15
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 15
tcaaccctca ctaaagggca tgggttcttt gtctaccctg aact 44
<210> 16
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 16
aatccatcga tactagtgct cacacaactg gttcgaacaa gacc 44
<210> 17
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 17
tcaaccctca ctaaagggca tgacctccat gtcatctttg aatt 44
<210> 18
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 18
aatccatcga tactagtgct cagacgactg gaccgaacaa aact 44
<210> 19
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 19
tcaaggagaa aaaaccccgg atgtccttgg cttttaatcc agctg 45
<210> 20
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 20
tatagtgagt cgtattacgg ttatttacct ctgacattgt tggca 45
<210> 21
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 21
tcaaggagaa aaaaccccgg atggccccaa tgattttctc cttga 45
<210> 22
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 22
tatagtgagt cgtattacgg ttagattggg atttgtctga agatc 45
<210> 23
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 23
tcaaggagaa aaaaccccgg atgtcatctt tggctggtaa cttga 45
<210> 24
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 24
tatagtgagt cgtattacgg tcagttagac acgcaggaca ttttt 45
<210> 25
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 25
tcaaggagaa aaaaccccgg atgtccatca ccatcaactt gagag 45
<210> 26
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 26
tatagtgagt cgtattacgg ttagttagct ggtggtggat gaatt 45
<210> 27
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 27
tcaaggagaa aaaaccccgg atgtccatca ccttcaactt gaaga 45
<210> 28
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 28
tatagtgagt cgtattacgg tcagacgtta atggcttcca atgga 45
<210> 29
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 29
tcaaggagaa aaaaccccgg atgtccttgg cttttaatcc agctg 45
<210> 30
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 30
tatagtgagt cgtattacgg tcacttacca gacacctttt tagct 45
<210> 31
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 31
tcaaggagaa aaaaccccgg atgttgttgg ccttcaacat ctctg 45
<210> 32
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 32
tatagtgagt cgtattacgg ttagatgtcc ctggtatcat gatgt 45
<210> 33
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 33
tcaaggagaa aaaaccccgg atgctgttga ccttcaacat tactg 45
<210> 34
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 34
tatagtgagt cgtattacgg tcattcacca actggttcgt aaacc 45
<210> 35
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 35
tcaaccctca ctaaagggca tggccaaggt tttgttctcc tctt 44
<210> 36
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 36
aatccatcga tactagtgct tacagggtcc tgtaagtttc caag 44
<210> 37
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 37
tcaaccctca ctaaagggca tgggttcttt gtctaccatg aact 44
<210> 38
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 38
aaggacatag aaccaccacc ggcgactggt tcgaacaaaa cc 42
<210> 39
<211> 40
<212> DNA
<213> Artificial Sequence
<400> 39
cagtcgccgg tggtggttct atgtccttgg cttttaatcc 40
<210> 40
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 40
taatccatcg atactagtgc ttatttacct ctgacattgt tg 42
<210> 41
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 41
ttcaaccctc actaaagggc atgtccttgg cttttaatcc ag 42
<210> 42
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 42
agaaccacca cctttacctc tttacctctg acattgttgg ca 42
<210> 43
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 43
gaggtaaagg tggtggttct atgggttctt tgtctaccat gaact 45
<210> 44
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 44
aatccatcga tactagtgct caggcgactg gttcgaacaa aacc 44
<210> 45
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 45
tcaaccctca ctaaagggca tgaacttgac tactactgac ttga 44
<210> 46
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 46
aacccataga accaccacct ttacctctga cattgttggc aacc 44
<210> 47
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 47
ggtaaaggtg gtggttctcc aatgccatga tgccgttaac aaca 44
<210> 48
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 48
tcaaccctca ctaaagggca tgaacagatt ctctaatttg tgct 44
<210> 49
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 49
aatccatcga tactagtgct cagttgcaag attcgtacca t 41
<210> 50
<211> 2424
<212> DNA
<213> Artificial Sequence
<400> 50
atgcactccc tgttgatgaa gaaagtcatc atgtactctt cccaaactac ccacgttttt 60
tcttctccat tgcactgtac tatccccaag tcatcttcat ttttcttgga tgctccagtt 120
gttagattgc attgcttgtc tggtcatggt gctaaaaaga agagattgca cttcgatatc 180
caacaaggta gaaacgctat ttccaagact catactccag aagatctgta cgctaagcaa 240
gaatactctg ttccagaaat cgttaaggac gacgacaaag aagaagaagt cgtcaagatc 300
aaagaacacg ttgacatcat caagtccatg ctgtcatcta tggaagatgg tgaaatttcc 360
atttccgctt atgatactgc ttgggttgct ttgattcaag acattcataa caatggtgct 420
ccacagtttc catcatcttt gttgtggatt gccgaaaatc aattgccaga tggttcttgg 480
ggtgattcta gagttttttt ggctttcgac agaatcatta acaccttggc ttgtgttgtt 540
gccttgaaat cttggaatgt tcatccagat aagtgcgaaa gaggtatctc attcctgaaa 600
gaaaacatct ccatgttgga aaaggatgac tctgaacaca tgttggttgg ttttgaattt 660
ggtttcccag tcttgttaga tatggctaga agattgggta tcgatgttcc agatgattct 720
ccattcttgc aagctatcta cgttcaaaga gacttgaagt tgaagagaat cccaaaggat 780
atcttgcata acgttccaac cactttgttg cattccttgg aagctattcc agatttggat 840
tggactaagt tgttgaagtt gcaatgtcaa gacggctcct tgttgttttc tccatcttct 900
actgctatgg cctttattaa cactaaggac gaaaactgct tgaggtactt gaattacgtt 960
gtccaaagat tcaatggtgg tgctcctact gtttatccat acgatttgtt tgaacataac 1020
tgggccgttg acagattgca aagattaggt atttccagat tcttccagcc agaaatcaga 1080
gaatgtatgt cctacgttta cagatactgg accaaggatg gtattttctg taccagaaac 1140
tccagagttc acgatgttga tgatacagca atgggtttca gattattgag gttgcatggt 1200
tacgaagttc acccagatgc ttttagacaa ttcaaaaagg gttgcgagtt catctgttac 1260
gaaggtcaat ctcatccaac tgttaccgtt atgtataact tgtacagagc ctctcaattg 1320
atgttccctg aagaaaagat tttggatgaa gccaagcaat tcaccgaaaa gttcttgggt 1380
gaaaagagat ctgctaacaa gttgttggac aagtggatta tcaccaaaga tttgccaggt 1440
gaagttggtt tcgctttgga tgttccatgg tatgtttctt tgccaagagt tgaagctaga 1500
ttcttcattc agcattacgg tggtgaagat gatgtttggt tggataaggc attatacaga 1560
atgccatacg tcaacaacaa cgtctatttg gaattggcca agttggatta caattactgt 1620
caagccttgc atggtactga atggggtaga attcaaaagt ggtacgaaga atgtaagcca 1680
agagatttcg gtatctcaag agaatgtttg ttgagagctt actttatggc tgctgcctct 1740
atttttgaac ccgaaagatc aatggaaaga ttggcttggg ctaagactgc tattttgttg 1800
gaaatcatcg tgtcctactt caacgaagtt ggtaactcta ccgaacaaag aattgctttc 1860
actaccgaat tctccataag agcttctcca atgggtggtt atatcaacgg tagaaaattg 1920
gacaagatcg gtactaccca agaattgatc caaatgttgt tggctaccat cgaccaattt 1980
tcacaagatg catttgctgc ctacgatcat gatattacta gacacttgca caacagctgg 2040
aaaatgtggt tgttgaaatg gcaagaggaa ggtgatcgtt ggttgggtga agctgaattg 2100
gttattcaaa ccattaactt gatggccgat cataagatcg ctgagaagtt gtttatgggt 2160
cataccaatt acgagcagtt gttctctttg actaacaagg tttgttactc cttgggtcat 2220
cacgaattgc aaaacaacag agaattggaa cacgacatgc agagattggt tcaattggtc 2280
ttgactaact cctccgatgg tattgattcc gatatcaaaa agaccttctt ggccgttgct 2340
aagagatttt actacactgc ttttgttgat cccgaaaccg ttaacgttca tattgctaag 2400
gttttgttcg agagggttga ctga 2424
<210> 51
<211> 2400
<212> DNA
<213> Artificial Sequence
<400> 51
atgacctcca tgtcatcttt gaatttgtct agagcaccag ccatctctag aagattgcaa 60
ttgccagcta aagttcagtt gccagaattt tacgctgttt gctcttggtt gaacaactct 120
tctaaacata ccccattgtc ctgccatatc catagaaaac aattgtccaa ggttaccaag 180
tgcagagttg cttctttgga tgcttctcaa gtttctgaaa agggtacatc ttctccagtt 240
caaactccag aagaagtcaa cgaaaagatc gaaaactaca tcgagtacat caagaacttg 300
ttgactacat ctggtgacgg tagaatttct gtttctccat acgatacttc catcgtcgct 360
ttgattaagg atttgaaggg tagagatact ccacaattcc catcttgttt ggaatggatt 420
gctcaacatc aaatggctga tggttcttgg ggtgatgaat ttttctgtat ctacgacaga 480
atcttgaaca ccttggcttg tgttgttgct ttgaagtctt ggaatgttca tgccgatatg 540
atcgaaaagg gtgttactta cgttaacgag aacgtccaaa aattggagga tggtaacttg 600
gaacatatga cctctggttt cgaaatagtt gttccagctt tggttcaaag agcacaagat 660
ttgggtattc aaggtttgcc atatgatcac ccattgatca aagaaatcgc caacacaaaa 720
gagggccgtt tgaaaaagat tccaaaggac atgatctacc aaaagccaac tactctgttg 780
ttctctttgg aaggtttggg tgacttggaa tgggaaaaga ttttgaagtt gcaatccggt 840
gacggttctt ttttgacttc tccatcttct actgcccacg tttttatgaa aactaaggac 900
gaaaagtgcc tgaagttcat tgaaaacgct gttaagaact gtaatggtgg tgctccacat 960
acttatccag ttgatgtttt tgctagattg tgggccgttg atagattgca aagattgggt 1020
atctctcgtt tcttccagca agaaatcaag tacttcttgg accacattaa ctctgtttgg 1080
actgaaaacg gtgttttctc tggtagagat tctgaattct gcgatatcga tgatacctct 1140
atgggtattc gtttgttgaa gatgcatggt tacgatattg atccaaacgc tttggaacat 1200
ttcaagcaac aagacggtaa attctcttgt tacggtggtc aaatgattga atctgcttct 1260
ccaatctaca acttgtacag agctgcacaa ttgagatttc caggtgaaga aattttggaa 1320
gaagctacca agttcgccta caacttctta caagaaaaga ttgccaacga ccagttccaa 1380
gaaaagtggg ttatttccga tcacttgatc gatgaagtta agttgggttt gaaaatgcca 1440
tggtatgcta ctttgccaag agttgaagct gcttattact tgcaatatta cgctggttgt 1500
ggtgatgttt ggattggtaa ggttttttac aggatgcccg aaatctctaa cgatacctac 1560
aaaaagttgg ccatcttgga tttcaacaga tgccaagcac aacatcaatt cgaatggatc 1620
tatatgcaag agtggtatca cagatcctct gtctctgaat ttggtatctc taagaaggat 1680
ttgttgaggg cttacttttt ggctgctgct actatttttg aaccagaaag aacccaagaa 1740
agattggttt gggctaagac tcaaatcgtt tctggtatga ttacctcctt cgttaactct 1800
ggtactacct tgtcattgca tcaaaagact gctttgttgt cccaaatcgg tcataatttt 1860
gatggtttgg acgaaatcat ctccgccatg aaggatcatg gtttagctgc tactttattg 1920
actaccttcc aacagttgtt ggatggtttc gatagataca ccagacacca attgaaaaac 1980
gcttggtcac aatggttcat gaagctacaa caaggtgaag cttctggtgg tgaagatgct 2040
gaattattgg ctaacacctt gaacatttgc gctggtttga ttgctttcaa cgaagatgtt 2100
ttgtcccatc atgagtacac tactttgtct actttgacca acaagatctg caagagattg 2160
actcagatcc aagacaaaaa gaccttggaa gttgtcgatg gttccatcaa agacaaagaa 2220
ttggaaaagg acatccagat gttggtgaag ttggtcttgg aagaaaatgg tggcggtgtt 2280
gatagaaaca ttaagcacac tttcttgtcc gttttcaaga ccttttacta caacgcttac 2340
catgatgacg aaaccactga tgttcatatc ttcaaagttt tgttcggtcc agtcgtctga 2400
<210> 52
<211> 2382
<212> DNA
<213> Artificial Sequence
<400> 52
atggcttcat tgtcatctac tatcttgtca agatctccag ctgcaagaag aaggattact 60
ccagcttctg ctaaattgca tagaccagaa tgttttgcta cttctgcttg gatgggttcc 120
tcttctaaaa acttgtcttt gtcctaccag ctgaaccaca aaaagatttc tgttgctact 180
gttgatgccc cacaagttca tgatcacgat ggtactactg ttcatcaagg tcatgatgcc 240
gttaagaaca ttgaagatcc aatcgagtac atcagaacct tgttgagaac tactggtgat 300
ggtagaattt ccgtttctcc atatgataca gcttgggttg ctatgatcaa ggatgttgaa 360
ggtcgtgatg gtccacaatt tccatcatct ttggaatgga tcgtccaaaa ccagttggaa 420
gatggttctt ggggtgatca aaagttattc tgcgtttacg acagactggt taacaccatt 480
gcttgtgttg ttgctttgag atcttggaat gttcatgccc ataaggttaa gagaggtgtc 540
acttacatca aagagaacgt tgacaagttg atggaaggta acgaagaaca tatgacctgt 600
ggtttcgaag ttgtttttcc tgctttgttg caaaaggcta agtctttggg tattgaggat 660
ttgccatatg attcaccagc tgttcaagaa gtttaccacg ttagagaaca gaagttgaag 720
agaatcccat tggaaatcat gcacaagatc ccaactagct tgttgttttc attggaaggt 780
ttggagaatt tggactggga caaattgctg aaattgcaat ctgctgacgg tagctttttg 840
acttctccat cttctacagc tttcgccttt atgcaaacta aggacgaaaa atgctaccaa 900
ttcattaaga acaccatcga tactttcaat ggtggtgctc cacatactta tccagttgat 960
gtttttggta gattgtgggc cattgataga ttgcaaagac taggtatctc caggtttttc 1020
gaaccagaaa ttgcagattg cttgtcccat attcataagt tctggactga taagggtgtg 1080
ttctctggta gagaatccga attctgtgat atcgatgata cctctatggg tatgagattg 1140
atgagaatgc atggttacga tgttgatcca aacgtcttga gaaacttcaa gcaaaaggac 1200
ggtaaattct cttgttacgg tggtcaaatg atcgaatctc catctccaat ctacaacttg 1260
tacagagctt cccaattgag atttccaggt gaagaaattt tggaggatgc taagagattc 1320
gcctacgatt tcttgaaaga gaagttggct aacaaccaga tattggataa gtgggttatc 1380
tctaaacact tgccagacga aatcaagttg ggtttagata tgccttggtt ggctactttg 1440
ccaagagttg aagctaagta ctacattcaa tattacgctg gttcaggtga tgtttggatt 1500
ggtaaaacct tgtataggat gcccgaaatc tctaacgata cctatcatga tttggccaag 1560
accgatttca aaagatgtca agctaagcac caattcgagt ggttgtatat gcaagaatgg 1620
tacgaatctt gcggtatcga agaatttggt atctctagaa aggacctgct gttgtcttac 1680
tttttggcta ccgcttctat cttcgaattg gaaagaacta acgaaagaat cgcttgggcc 1740
aagtctcaaa ttattgctaa gatgatcacc tcgttcttca acaaagaaac cacatctgaa 1800
gaagataaga gggccttgtt gaatgagttg ggtaacatta acggtttgaa cgatacaaat 1860
ggtgcaggta gagaaggtgg cgctggttct attgcattag ctactttgac tcaattcttg 1920
gagggtttcg atagatacac cagacaccaa ttgaagaatg cttggtctgt ttggttgact 1980
caactacaac atggtgaagc tgatgatgct gaattattga ctaacacctt gaacatttgc 2040
gctggtcata ttgcctttag agaagagatt ttggctcaca atgagtacaa ggctttgtct 2100
aatttgacct ctaagatctg cagacagttg tccttcatcc agtctgaaaa agaaatgggt 2160
gttgaaggtg aaattgccgc caaatctagc atcaaaaaca aagaattgga agaggacatg 2220
cagatgttgg ttaagttggt cttggaaaag tacggtggta tcgatagaaa catcaagaag 2280
gcttttttgg ctgttgctaa gacctactac tatagagctt atcatgctgc cgataccatt 2340
gatacccata tgtttaaggt tttgtttgag ccagttgcct aa 2382
<210> 53
<211> 2361
<212> DNA
<213> Artificial Sequence
<400> 53
atgggttctt tgtctaccat gaacttgaac cattctccaa tgtcctactc tggtattttg 60
ccatcttctt cagctaaggc taagttgttg ttgccaggtt gtttttctat ttccgcttgg 120
atgaacaacg gcaagaattt gaattgccaa ttgacccaca agaagatctc taaggttgcc 180
gaaattagag ttgctactgt taatgctcca ccagttcatg atcaagatga ctctactgaa 240
aatcaatgcc atgatgccgt taacaacatc gaagatccaa ttgagtacat cagaaccttg 300
ttgagaacta ctggtgatgg tagaatttcc gtttctccat atgatactgc ttgggttgct 360
ttgattaagg acttgcaagg tagagatgct ccagaatttc catcttcatt ggaatggatt 420
atccaaaacc agttggctga tggttcttgg ggtgatgcta agtttttttg cgtttacgat 480
agactggtta acaccattgc ttgtgttgtt gctttaagat cctgggatgt tcatgctgaa 540
aaagttgaaa gaggtgtcag gtacatcaac gaaaacgttg aaaaattgcg tgacggtaac 600
gaagaacata tgacttgtgg tttcgaagtt gttttcccag ctttgttgca aagagctaag 660
tctttgggta ttcaagattt gccatatgat gccccagtta tccaagaaat ctaccactct 720
agagaacaga agtccaagag aattccattg gaaatgatgc acaaggtccc aactagtttg 780
ttgttttctt tggaaggttt ggagaacttg gaatgggaca agttgttgaa attgcaatca 840
gctgacggtt ctttcttgac ttctccatct tctactgctt tcgctttcat gcaaactaga 900
gatccaaagt gctaccaatt catcaagaac accattcaaa ctttcaacgg tggtgctcca 960
catacttatc cagttgatgt ttttggtaga ttgtgggcca ttgacagatt gcaaagattg 1020
ggtatttcca ggttcttcga atctgaaatt gctgactgca ttgcccatat tcatagattc 1080
tggactgaaa agggtgtgtt ctctggtaga gaatctgaat tctgcgatat cgatgatacc 1140
tctatgggtg ttagattgat gagaatgcat ggttacgatg ttgatccaaa cgtcttgaag 1200
aatttcaaga aggacgataa gttctcttgc tacggtggtc aaatgattga atctccatct 1260
ccaatctaca acttgtacag agcttcccaa ttgagatttc ctggtgaaca aattttggag 1320
gatgctaaca agttcgccta cgacttttta caagaaaagt tggcccataa ccagatcttg 1380
gacaaatggg ttatctccaa acatttgcca gacgaaatca agttgggttt agaaatgcca 1440
tggtatgcta ctttgccaag agttgaagcc agatattaca ttcaatatta cgccggttct 1500
ggtgatgttt ggattggtaa aacactgtac agaatgcccg aaatctctaa cgatacttac 1560
catgaattgg ccaagaccga tttcaaaaga tgtcaagctc aacaccaatt cgagtggatc 1620
tatatgcaag aatggtacga atcttgcaac atggaagaat tcggtatctc cagaaaagaa 1680
ctgttggttg cttacttttt ggctaccgct tctatctttg aattggaaag agccaacgaa 1740
agaattgctt gggctaagtc tcaaatcatc tctactatta tcgcctcctt cttcaacaat 1800
caaaacactt ctccagagga taagttggcc tttttgaccg attttaagaa cggtaactct 1860
accaacatgg ctttggttac tttgacccaa ttcttggagg gtttcgatag atacacttcc 1920
catcaattga agaacgcttg gtctgtttgg ttgagaaagt tgcaacaagg tgaaggtaat 1980
ggtggtgctg atgctgaatt attggttaat accttgaaca tttgcgccgg tcatattgct 2040
ttcagagaag aaattttggc tcacaacgat tacaagacct tgtctaattt gacctctaag 2100
atctgcagac agttgtccca aatccagaac gaaaaagaat tagaaaccga gggtcaaaag 2160
acctccatta agaacaaaga attggaagag gacatgcaga gattggttaa gttggtcttg 2220
gaaaagtcta gagtcggtat caacagagac atgaagaaaa cttttttggc cgttgtcaag 2280
acctactact acaaagctta tcattccgct caagccatcg ataaccatat gtttaaggtt 2340
ttgttcgaac cagtcgcctg a 2361
<210> 54
<211> 2358
<212> DNA
<213> Artificial Sequence
<400> 54
atgggttctt tgtctaccct gaacttgatt aagacttgtg ttaccttggc ctcctccgaa 60
aaattgaatc aaccatctca atgctacacc atctctacct gtatgaagtc atctaacaat 120
ccaccattca actactacca gatcaacggt agaaagaaga tgtctaccgc tatcgattct 180
tctgttaatg ctccaccaga acagaagtac aattctactg ctttggaaca cgataccgaa 240
atcatcgaaa tcgaagatca tatcgaatgc atcagaaggt tgttgagaac tgctggtgat 300
ggtagaattt ctgtttctcc atatgatacc gcttggatcg ctttgattaa ggatttggat 360
ggtcatgact ctccacaatt tccatcttct atggaatggg ttgccgataa tcaattgcca 420
gatggttctt ggggtgatga acattttgtt tgcgtttacg atagactggt taacaccatt 480
gcttgtgttg ttgctttgag atcttggaat gttcatgctc ataagtgcga aaagggtatc 540
aagtacatca aagaaaacgt ccacaagttg gaagatgcca acgaagaaca tatgacttgt 600
ggtttcgaag ttgttttccc agctttgttg caaagggctc aatctatggg tattaagggt 660
attccataca acgccccagt tatcgaagaa atctataact ccagagagaa gaagttgaag 720
aggatcccaa tggaagttgt tcataaggtt gctacgtctt tgctgttttc attggaaggt 780
ttggaaaact tggaatggga gaagttgttg aagttgcaat ctcctgatgg ttcctttttg 840
acttctccat cttcaactgc tttcgccttt attcatacca aggatagaaa gtgtttcaac 900
ttcatcaaca acatcgtcca cacttttaaa ggtggtgctc cacatactta cccagttgat 960
atttttggta gattgtgggc cgttgacaga ttgcaaagat tgggtatttc taggttcttc 1020
gaatccgaaa ttgccgaatt cttgtcccat gttcatagat tctggtctga tgaagctggt 1080
gttttttctg gtagagaatc tgttttctgc gatatcgatg atacctctat gggtttgaga 1140
ctgttaagaa tgcatggtta ccatgttgat ccaaacgtct tgaagaactt caagcaatcc 1200
gataagttct cttgttacgg tggtcaaatg atggaatgta gttctccaat ctacaacttg 1260
tacagagcct ctcaattaca attcccaggt gaagaaattt tggaggaagc taacaagttc 1320
gcctacaagt ttctgcaaga aaagttggaa tccaaccaga ttttggacaa gtggttgatc 1380
tctaaccatt tgtctgacga aatcaaggtt ggtttagaaa tgccatggta tgctactttg 1440
ccaagagttg aaacctccta ctatatccat cattatggtg gtggtgacga tgtttggatt 1500
ggtaaaacat tatacaggat gcccgaaatc tctaacgata cctatagaga attggccaga 1560
ttggatttca gaaggtgtca agctcaacat caattggaat ggatctacat gcaaaggtgg 1620
tacgaatctt gtaggatgca agaatttggc atctccagaa aagaagtctt gagagcttac 1680
tttttggcct ccggtactat ttttgaagtc gaaagagcta aagaaagagt tgcttgggct 1740
agatcccaaa tcatttctca catgatcaag tcgttcttca acaaagaaac cacctcctct 1800
gatcaaaaac aagctttgtt aaccgagttg ctgttcggta atatttctgc ttctgaaacc 1860
gaaaagcgtg aattggatgg tgttgttgtt gcaactttga gacaattctt ggagggtttc 1920
gatatcggta ctagacatca agttaaggct gcttgggatg tttggttgag aaaggttgaa 1980
caaggtgaag ctcatggtgg tgctgatgct gaattgtgta ctactacttt gaacacctgt 2040
gctaaccagc atttgtcatc tcatccagat tacaacacct tgtctaagtt gaccaacaag 2100
atctgccata agttgtccca aatccaacac cagaaagaaa tgaagggtgg tatcaaagct 2160
aagtgctcca ttaacaacaa agaggtcgac attgaaatgc agtggttggt taagttggtc 2220
ttggaaaagt ctggtttgaa cagaaaagct aagcaagcct tcttgtctat tgctaagact 2280
tactactata gagcctacta cgctgatcaa actatggatg ctcatatctt caaggtcttg 2340
ttcgaaccag ttgtgtga 2358
<210> 55
<211> 1788
<212> DNA
<213> Artificial Sequence
<400> 55
atgtccttgg cttttaatcc agctgctact gctttttctg gtaatggtgc tagatccaga 60
agagaaaatt tcccagtcaa acacgttacc gttagaggtt ttccaatgat cactaacaag 120
tcatccttcg ctgttaagtg taacttgact actactgact tgatgggtaa gattgccgaa 180
aagtttaagg gcgaagattc taattttcca gctgccgctg ctgttcaacc agctgctgat 240
atgccatcta acttgtgtat tatcgacacc ttgcaaagat tgggtgttga cagatacttc 300
agatccgaaa ttgataccat cttggaagat acctacagat tgtggcagag aaaagaaaga 360
gccattttct ctgataccgc tattcatgct atggctttta gactgttgag agtcaaaggt 420
tacgaagtct cttctgaaga attggctcca tatgctgatc aagaacatgt tgacttgcaa 480
accattgaag ttgctaccgt tattgagttg tatagagctg ctcaagaaag aaccggtgaa 540
gatgaatctt ccttgaaaaa attgcatgct tggactacca ccttcttgaa gcaaaagttg 600
ttgaccaatt ccattccaga caagaagttg cataagttgg ttgagtacta cctgaagaac 660
taccacggta ttttggatag aatgggtgtc agacaaaact tggacttgta cgatatctct 720
tactacagaa cttctaaggc tgccaacaga ttctctaatt tgtgctctga agatttcttg 780
gctttcgcta gacaagattt caacatttgc caagctcaac accagaaaga attgcaacaa 840
ttgcagagat ggtacgctga ttgcaaattg gatactttga agtacggtag agatgttgtt 900
agagtcgcta actttttgac ctccgctatt attggtgatc cagaattgtc tgatgtcaga 960
atcgttttcg ctcaacacat cgttttggtt accagaatcg atgatttctt cgatcacaga 1020
ggttccagag aagaatccta caagattttg gagttgatca aagagtggaa agaaaaacca 1080
gcagctgaat acggttcaga agaagtcgaa attttgttca ccgctgttta caacaccgtt 1140
aacgaattgg ctgaaagggc tcatgctgaa caaggtagat ctgttaagga cttcttgatt 1200
aagttgtggg tccagatctt gtccatcttc aaaagagaat tagatacctg gtccgatgat 1260
actgctttga ctttggatga ttacttgtct gcttcctggg tttctattgg ttgtagaatc 1320
tgcatcttga tgtccatgca attcatcggt atcaagttgt ctgacgagat gttgctatcc 1380
gaagaatgta ttgatttgtg caggcacgtt agtatggttg ataggttgtt gaacgatgtc 1440
cagacctttg aaaaagagcg taaagaaaac accggtaact ctgttacttt gttgttggct 1500
gctaacaagg acgattcttc attcacagaa gaagaagcca ttaggatcgc taaagaaatg 1560
gctgaatgta acagacgtca attgatgcaa atcgtttaca agaccggtac tatcttccca 1620
agacaatgta aggacatgtt tttgaaggtc tgcagaattg gttgttactt gtacgcttct 1680
ggtgatgaat tcacttctcc acaacaaatg atggaagata tgaagtcctt ggtctacgaa 1740
ccattgacta ttcatccatt ggttgccaac aatgtcagag gtaaataa 1788
<210> 56
<211> 1797
<212> DNA
<213> Artificial Sequence
<400> 56
atgtcatctt tggctggtaa cttgagagtt attccattct ctggtaacag agttcaaacc 60
agaactggta ttttgccagt tcatcaaact cccatgatta cctctaaatc ttctgctgct 120
gttaagtgct ctttgactac tccaactgat ttgatgggta agatcaaaga ggtgttcaac 180
agagaagttg atacttctcc agctgctatg actactcatt ctactgatat tccatccaac 240
ttgtgcatca tcgatacctt gcaaagattg ggtatcgacc aatacttcca atccgaaatt 300
gatgctgtct tgcatgatac ttacagattg tggcaattga agaagaagga catcttctcc 360
gatattacta ctcatgctat ggctttcaga ctgttgagag tcaaaggtta tgaagttgcc 420
tctgatgaat tggctccata tgctgatcaa gaaagaatca acttgcaaac cattgatgtt 480
ccaaccgttg ttgaattata cagagctgca caagaaaggt tgaccgaaga agattctact 540
ttggaaaagt tgtacgtttg gacctctgct tttttgaagc aacagttgtt gactgatgcc 600
attccagata agaagttgca taagcaagtt gagtactacc tgaagaacta ccacggtatt 660
ttggatagaa tgggtgtcag aagaaacttg gacttgtacg atatctccca ctacaaatct 720
ttgaaggctg ctcatagatt ctacaacttg tctaacgaag atattttggc cttcgccaga 780
caagatttca acatttctca agcccaacac cagaaagaat tgcaacaatt acaaagatgg 840
tacgccgatt gcagattgga tactttgaaa ttcggtagag atgttgtcag gatcggtaac 900
tttttgactt ctgctatgat tggtgaccca gaattgtctg atttgagatt ggctttcgcc 960
aaacacatcg ttttggttac cagaatcgat gatttcttcg atcatggtgg tccaaaagaa 1020
gaatcctacg aaattttgga actggtcaaa gagtggaaag aaaaacctgc tggtgaatac 1080
gtttccgaag aagtggaaat tttgttcacc gctgtttaca acaccgttaa cgaattggct 1140
gaaatggccc atattgaaca aggtagatct gttaaggatc tgttggttaa gttgtgggtc 1200
gagattttgt ccgttttcag aattgaattg gatacctgga ctaacgatac tgctttgact 1260
ttggaagaat acttgtccca atcctgggtt tctattggtt gcagaatctg cattttgatc 1320
tccatgcaat tccaaggtgt taagttgagt gacgaaatgt tgcagtctga agaatgtacc 1380
gatttgtgca gatacgtttc aatggttgat aggttgttga acgatgtcca gaccttcgaa 1440
aaagaacgta aagaaaacac cggcaactcc gtttctttgt tgcaagctgc tcacaaagat 1500
gagagagtta tcaacgaaga agaggcttgc attaaggtca aagaattggc agagtacaac 1560
aggcgtaagt tgatgcaaat cgtttacaag accggtacta tcttcccaag aaagtgtaag 1620
gatttgttct tgaaggcttg cagaattggt tgctacttgt attcttctgg tgacgaattc 1680
acttccccac aacaaatgat ggaagatatg aagtccttgg tctatgaacc attgccaatt 1740
tctccacctg aagctaacaa tgcatctggt gaaaaaatgt cctgcgtgtc taactga 1797
<210> 57
<211> 1764
<212> DNA
<213> Artificial Sequence
<400> 57
atgtccatca ccatcaactt gagagttatt gcttttccag gtcacggtgt tcaatctaga 60
caaggtattt ttgccgttat ggaattcccc agaaacaaga acactttcaa gtcatctttc 120
gccgttaagt gctctttgtc tactccaact gatttgatgg gtaagatcaa agagaagttg 180
tccgaaaagg ttgataactc tgttgctgct atggctactg attctgctga tatgccaact 240
aacttgtgca tcgttgattc cttgcaaaga ttgggtgttg aaaagtactt ccagtccgaa 300
attgataccg ttttggatga tgcttacaga ttgtggcaat tgaagcaaaa ggatatcttc 360
tccgatatta ctactcatgc tatggccttt agactgttga gagtcaaagg ttacgatgtc 420
tcttctgaag aattggctcc atatgctgat caagaaggta tgaacttgca aaccattgat 480
ttggctgctg ttatcgaatt atacagagct gctcaagaaa gagttgccga agaagattct 540
actctggaaa agttgtatgt ttggacctcc acttttttga agcaacaatt attggctggt 600
gccattccag atcaaaagtt gcataagcaa gttgagtact acctgaagaa ctaccacggt 660
attttggata gaatgggtgt gagaaaaggt ttggacttgt atgatgctgg ttactacaag 720
gctttgaaag ctgctgatag attggttgat ttgtgcaacg aagatttgtt ggctttcgct 780
agacaagact tcaacatcaa tcaagcccaa cacagaaaag aattggaaca attgcagaga 840
tggtacgctg attgcagatt ggataagttg gaattcggta gagatgttgt cagagtctct 900
aactttttga cctctgctat tttgggtgac ccagaattgt ctgaagttag attggtcttt 960
gctaagcaca tcgttttggt taccagaatc gatgatttct tcgatcatgg tggtccaaga 1020
gaagaatccc ataagatttt ggagctgatc aaagaatgga aagaaaagcc agctggtgag 1080
tacgtttcta aagaagttga aatcttgtac accgccgttt acaacactgt taatgaattg 1140
gctgaaagag ccaacgttga acaaggtaga aatgttgaac cattcttgag aaccttgtgg 1200
gtccaaattt tgtccatctt caagatcgaa ttggatacct ggtctgatga tactgctttg 1260
acattggatg actacttgaa caactcctgg gtttctattg gttgcagaat ctgcattttg 1320
atgtccatgc aattcatcgg tatgaagcta ccagaagaga tgttattgtc cgaagaatgt 1380
gttgacttgt gcagacatgt ttcaatggtt gataggttgt tgaacgacgt ccagactttc 1440
gaaaaagaga gaaaagaaaa caccggtaac gccgtttctt tgttgttggc tgctcataag 1500
ggtgaaagag ctttttcaga agaagaagct attgctaagg ctaagtattt ggccgattgc 1560
aatagaagat ccttgatgca aatcgtttac aagaccggta ctatcttccc aagaaagtgt 1620
aaggatatgt tcttgaaggt ctgcagaatt ggttgttact tgtatgcttc tggtgacgaa 1680
ttcacttctc cacaacaaat gatggaagat atgaagtcct tggtctacga accattgcaa 1740
attcatccac caccagctaa ctaa 1764
<210> 58
<211> 1770
<212> DNA
<213> Artificial Sequence
<400> 58
atggccccaa tgattttctc cttgaccatt tctcatttcg tcatccaaac tggttctact 60
gcattgcatt attctgcttt gccagaaact agaactaagc actgtcattc ttctagacca 120
ttcgcctcta ttaactccaa ctccttgcaa atgaatcaaa gaccattgac cgattacaga 180
ccagctattt ggaatccaga attgatcgat tctttgaaca ccccatattc ctatcaagct 240
catggtactc aattggaaaa gttgagacaa gatgccaaga ggttgttgtc atctacatct 300
gatccatgct tgttgttgaa ccacgttgaa tctatgcaaa gattgggtat tgcctaccac 360
ttccaagaag aaatcgatta cttgctgaac accagaatcc aaccatattc tccagatgat 420
catgacttgc atacaaccgc tttgagattc agaatcttga gagataacaa cttccccatc 480
tcctctgatg ttttcggtaa gtttatgtct agagagggca agttcttgga ctctttatct 540
agagatgtta agggcctgtt gtccttgtat gaagctagtt ttttgggtgt tgatggtgaa 600
gttattttgg acgaagccaa agagttctcc tcaaagaatt tgagagcttt gttgggtaga 660
ttggagtcca cttctattga tgttgcagaa caagtcaagc agtcattgca aattcctttg 720
ttttggagaa tgcctagagt tgaagctaga aacttcatcg acttctacca aaagaaggat 780
gccaaatctt ctaccttgtt ggaattggct aagctggatt ttaacttggt gcaatctacc 840
taccagcaag agttgaaaga attgtctaga tggtgggaaa acttgggttt caagcaaaag 900
ttgtctttca ccagagacag attgatgcag tcttacttct ctaccattgg tattaccttc 960
aagccacaat tctccaaggc tagaattgct gctactaagt tcatcaacat cgttaacacc 1020
atcgatgata tccacgatta ctacggttct caagatgact tgaagttgtt taactccgct 1080
gttaagagat gggacttagc tgctatggaa gaattgccag attacatgaa gatttgctac 1140
ttcgccatgt acaacttggt taacgaattg gcttacgacg ttttgattaa ccagggtata 1200
gatgttttgc catgtttgag agaagcctgg actaagtttt gtggtgctgc atttgttgaa 1260
tcccaatggt gttatactgg ttacactcca tctatggatg actacttgaa gaactgctgg 1320
atttccattg gtgttcacgg ttctttgaat tttgctagag cacatcaaca gggttctaga 1380
tctccaatgg ctaatactcc attacactgt ttggaagatc agctgttgta ttggtcatct 1440
gtcatctgta gattgaacaa cgatttggct accttccaac acgaatctaa aacaggtgaa 1500
gttgcctctt tcgttaagtg ctacatggtt gaaaaaggtg tgtctcaaga acaagcctgt 1560
gacgaaatta gggaattgat caaacatgcc tggaagatgt tgaacaccga aagaagaaga 1620
tctgatttgc caccattgat ggtcgaaatg tgtatggata ctccaaagtt gtcacaatgc 1680
ttgtaccaac atggtgatgg ttttggtgtt gctattgaat tgaccaagga tgtcatgtcc 1740
tcattgatct tcagacaaat cccaatctaa 1770
<210> 59
<211> 1743
<212> DNA
<213> Artificial Sequence
<400> 59
atgtccatca ccttcaactt gaagattgct ccattttctg gtccaggtat ccagagatct 60
aaagaaactt ttccagccac cgaaattcaa attactgctt ctactaagtc taccatgacc 120
accaagtgtt cttttaacgc ttctactgac tttatgggca agttgagaga aaaagttggt 180
ggtaaagctg ataagccacc agttgttatt catccagttg acatctcttc taacttgtgc 240
atgattgaca ccttgcaatc tttgggtgtt gacagatatt tccagtctga aatcaacacc 300
ttgttggaac atacttacag gttgtggaaa gaaaagaaga agaacatcat cttcaaggac 360
gtttcttgtt gcgctattgc ttttaggttg ctaagagaaa agggttacca agtctcttct 420
gataagttgg ctccatttgc cgattacaga attagagatg ttgctaccat tttggagttg 480
tacagagctt ctcaagccag gttgtatgaa gatgaacata ccttggaaaa actgcacgat 540
tggtcctcta atttgttgaa gcaacacttg ttgaacggtt ccattccaga tcataagttg 600
cacaagcaag tcgagtactt cttgaagaat taccacggta tcttggatag agttgccgtt 660
agaagatctt tggacctgta caacattaac catcatcaca gaattccaga tgtcgctgat 720
ggttttccaa aagaagattt cttggagtac tctatgcagg acttcaacat ttgtcaagcc 780
caacaacaag aagaattgca ccaattgcaa agatggtatg ctgattgcag attggatact 840
ttgaactacg gtagagatgt cgttagaatt gctaacttct tgacctctgc tattttcggt 900
gaaccagaat tttctgatgc tagattggct ttcgccaagc acattatttt ggttaccaga 960
atcgatgact tcttcgatca tggtggttct agagaagaat cctacaagat tttggacttg 1020
gtccaagaat ggaaagagaa accagctgaa gaatacggtt ccaaagaagt cgaaattttg 1080
ttcaccgctg tttacaacac cgttaacgat ttggctgaaa aggcccatat tgaacaaggt 1140
agatgtgtta agcctctgtt gattaagttg tgggttgaga ttttgacctc cttcaagaaa 1200
gaattggact cttggactga agaaactgct ttgactttgg acgaatactt gtcatcttcc 1260
tgggtttcta ttggttgcag aatctgcatt ttgaacagct tgcaatactt gggcatcaag 1320
ttgtccgaag aaatgttgtc atctcaagaa tgtaccgatt tgtgcagaca cgtttcatcc 1380
gttgataggt tgttgaatga tgtccagacc tttaagaaag agaggttgga aaacaccatt 1440
aactctgttg gtttacaatt ggctgctcac aaaggtgaaa gagctatgac tgaagaggat 1500
gctatgtcca agatcaaaga gatggctgat taccatagac gtaagttgat gcagatcgtc 1560
tacaaagaag gtactgtttt cccaagagaa tgcaaggatg ttttcttgag agtatgcaga 1620
atcggctact acttgtattc ttctggtgat gaattcacct ctccacaaca aatgaaggaa 1680
gatatgaagt ccttggttta ccaaccagtt aagatccatc cattggaagc cattaacgtc 1740
tga 1743
<210> 60
<211> 1779
<212> DNA
<213> Artificial Sequence
<400> 60
atgtccttgg cttttaatcc agctgttact gctttttccg gtcacagagt tagatccaga 60
agagaaattt tgccaggtca acacgttatc gttcaaggtt ttccaatgat caccaacaag 120
tcatctttca ccgttaagtg taacttgact accactgatt tgatgggtaa gattgccgaa 180
aagttcaagg gtcaagattc taattttcca gctgctgttg ctgttcaacc agctactgat 240
attccatcta acttgtgcat tatcgacacc ttgcaaagat tgggtgttga cagatacttc 300
caatccgaaa tcgatatcat cttggaagat acctacagat tgtggcagag aaaagaaagg 360
gaaatcttct ccgatatcac cattcatgtt atggctttca gactgttgag agtcaaaggt 420
tacgaagtct tgtctgaaga attggctcca tatgctgatc aagaaagaat tgacttgcaa 480
gccattgatg tttccaccgt tatcgaatta tacagagctg cacaagaaag gatcgacgaa 540
gaagaatcat ctttggaaaa attgcatgct tggactaccg cttttttgaa gcaacagttg 600
ttgaccaatt ccattccaga taagaagctg cataagttgg tcgagtctta cttgaagaat 660
taccacggta tcttggatag aatgggtgtc agattgaatt tggacttgta cggtatctct 720
cactaccaga ctttgaacag attctctaac ttgaggaccg aagatttctt ggctttcact 780
agacaagatt tcaacatctg ccaagctcaa caccaaaaag aattgcagtt gttgcagaga 840
tggtatgctg attgcagatt ggatactttg aagtacggta gagatgttgt cagggtttct 900
aactttttga cctctgctat tttcggtgac ccagaattgt ctgatgttag attggttttt 960
gccaagcaca tcgttttggt taccagaatc gatgatttct tcgatcatgg tggttccaga 1020
gaagaatcct acaagatttt ggacctgatc aaagagtgga aagaaaaacc agctgcagaa 1080
tacggttctg aagaagtcga aattttgttc accgctgttt acaacactgt taacggtttg 1140
gctgaaatgg ctcatgttga acaaggtaga tctgtcaaag agttcctgat taagttgtgg 1200
gttcagatct tgtccatctt caagatcgaa ttggatacct ggactgatga tactgctttg 1260
actttggatg attacttggc ttcttcctgg gtttctattg gttgtagaat ctgcatcttg 1320
atgtccatgc aattcatcgg tatcaagttg tctgacgaga tgttgctaag tgaagaatgt 1380
accgatttgt gcagacacgt ttcaatggtc gataggttgt tgaacgatgt tcagaccttc 1440
gaaaaagagc gtaaagaaaa cactggcaac tccgtttctt tgttgttggc tgctaacaag 1500
gatgattccg cttttactga agaagaagct attaccaagg ctaaaaagat ggctgaatgc 1560
aacagacgtc aattgatgca aatcgtttac aagaccggta ctatcttccc aagaaagtgt 1620
aaggatatgt tcttgaaggt ctgtagaatc ggttgctact tgtattcttc tggtgatgaa 1680
ttcacctctc cacaacaaat gatggaagat atgaagtcct tggtctacga accattgact 1740
gttcatccat tggaagctaa aaaggtgtct ggtaagtga 1779
<210> 61
<211> 1773
<212> DNA
<213> Artificial Sequence
<400> 61
atgttgttgg ccttcaacat ctctgatgtt ccattgtcta accacagagt catcttgtct 60
agaagagaac attttccaag acatgccttc cataagtttc cagctatcgt tactaccaag 120
tcctctgtta atgctatttg ttctcatgct accccatctg acttgatggg taaattgaaa 180
gaaaagttca aggccaagga tgttaatcca ttggctgctg gtgctattca accagctgct 240
aatattccat cttccttgtg cattatcgac accttgcaaa gattgggtgt tgacagatac 300
ttccaatctc aaattgatgc catcctggaa gaaacttata gattgtggcg tgaaaaggac 360
agagatatct actccgatgt tttcactcat gctatggctt ttagactgtt gagagttaag 420
ggttacgaag tctcttctga agaattggct ccatatgctg aacacgaaag agttaacttg 480
caaaagatcg atgttgccac cgttattgaa ttatacagag ctgctcacga aaggatctac 540
gaagaagaaa aatccttgga gaagttgttg gcttggacta ctactttttt gaagcaccat 600
ttgctgacca tctctaaccc agataacaag ttgcataagc aagtcgagta ctacttgaag 660
aactaccacg gtattttgga tagaatgggt gtcagaagat ctttggactt gtacgatatc 720
aaccactaca gatctttgag agcttctttc ccaactttgt gcaacgaaga ttttttgtcc 780
ttggccagac aagatttcaa catgtgtcaa gctcaacaca gagaagagtt ggaacaatta 840
caaagatggt actccgattg cagattggac aaattgaagt tcggtagaaa cgttgtcaga 900
gtctctaact ttttgacctc cgctattatt ggtgacccag aattttctga agtcagattg 960
gttttcgcca agcacattat tttggttacc ttgatcgatg acttgttcga tcatggtggt 1020
actagagaac aatcctacaa gattttggaa ttggtcaccg aatggaaaga gaaatctgct 1080
gctgaatatg gttctgaagc cgtcgaaatt ttgttcactg ctgtttacaa caccgtcaac 1140
gaattggttg aaagggctca tgttgaacaa ggtagatctg tcaaagagtt cctgattaag 1200
ttgtgggttc agatcttgtc catcttcaag attgaattgg atacctggtc tgatgatact 1260
gctttgactt tggatgagta cttgtcatct tcctgggttt ctattggttg cagaatctgc 1320
attttgatgt ccatgcaatt catcggtatt aagttgaccg acgagatgtt gttgagtgaa 1380
gaatgtttgg atttgtgcag gcacgtttca atggtcgata gattattgaa cgatgtccag 1440
accttcgaga aagagagaaa agaaaacact ggcaactccg tgtctttgtt gttagctgca 1500
aacaaggatg atatctcttt cactgaagaa gaggccatca aaaaggctaa agaaatggct 1560
gaatgtaaca ggcgtaagtt gatgcaaatc gtttacaaga ccggtactat cttcccaaga 1620
aagtgtagag atatgttcct gaaggtctgt agaatcggtt gttacttgta tgcttctggt 1680
gatgaattca cctctccaca acaaatgatg gaagatatga agtccttggt ctacgaacca 1740
ttgactttac atcatgatac cagggacatc taa 1773
<210> 62
<211> 1755
<212> DNA
<213> Artificial Sequence
<400> 62
atgctgttga ccttcaacat tactgatgct actttgtccc atggtgtcat cttgagaaga 60
agagaaaatt tcccaagaca cgccttccaa atttttccag ctattgctgc tactaagaga 120
tcctttaatg ctgtttgttc tttgggtact ccaccaactg atttgatcgg taagatcaaa 180
gaaaagttca acggtaagga tgataaccca ttggctgctg ctgcagctat tcaatctgct 240
gctaatattc catcctcctt gtgcattatt gacaccttgc aaagattggg tgttgacaga 300
tacttccaat ccgaaatcga ttccattttg gaagaaacct acagatcttg gagagaaaag 360
gactctgaaa tctactctga tgttactact catgctatgg ctttcagact gttgagagtt 420
aagggttacg aagtctcttc tgaagaattg gctccatatg ctgaacaaga aagagttgac 480
ttgcaaacca ttgatgttgc taccgttatt gagttgtata gagctgccca agaaagaatc 540
tctgaagagg aatcttcttt ggagaagttg ttaggttgga ctactacctt tttgaagcaa 600
cagttgttga ccaactccat tccagataac aagttgcata agcaagtcga gtactacttg 660
aagaactacc acggtatttt ggatagaatg ggtgtcagaa gaaacttgga cttgtacgat 720
atctcccatt acagatcatt gagagcttgg tttccaaact tgtgcaacga agattttttg 780
tcctttgcca gacaagactt caacatgtgt caagctcaac acagagaaga gttggaacaa 840
ttacaaagat ggtactccga ttgcagattg gatactttga agttcggtag aaacgttttg 900
agagttgcta acttcttgac ctccgctatt attggtgatc cagaattgtc tgaagtcaga 960
atcgttttcg cccaacatat tatcttggtt accttgatcg atgacttgtt cgatcatggt 1020
ggtactaagc aagaatccta caagattctg gaattggtca aagagtggaa agaaaaatca 1080
gctgctgaat acggttgcga agaagttgaa attttgttca ccgctgttta caacaccgtt 1140
aacgaagttg ttgaaagggc tcatgctgct caaggtagat ctgttaagga tttcttgatt 1200
aagttgtggg tccagatcct gtccattttc aagattgaat tggatacctg gtctgacgaa 1260
accgaattgt ctttggatga atacttgtcc aactcctggg tttctattgg ttgtagaatc 1320
tgcatcttga tgtccatgca attcatgggt attaagttga ccgacgagat gttgttgtcc 1380
gaagaatgta ttgatttgtg caggcacgtt tcaatggttg ataggttgtt gaacgatgtc 1440
cagaccttcg aaaaagaacg taaagaaaac accggcaact ccgtttcttt gttgttggct 1500
gctaacaaag atgattctgc tttcactgaa gaagaagcta ttaccaaggc taaagaaatg 1560
gctgaatgga acagacgtca attgatgaag atcgtttaca tcaagggtaa caagttccct 1620
agaaagtgca gagatatgtt cttgaaggtc tgtagaattg gttgctactt gtatgcttct 1680
ggtgatgaat tcacttcccc acaacaaatg atggaagata tgaagtcctt ggtttacgaa 1740
ccagttggtg aatga 1755
<210> 63
<211> 2604
<212> DNA
<213> Artificial Sequence
<400> 63
atggccaagg ttttgttctc ctcttttcaa caaactggta tctccggttc tttgaagtct 60
ggtcaattgt ctggtgtttt caccaacggt acaaacttga agtctaatgc tcatgccaag 120
aggttcagaa agaactctac ttcctctatt accatttctt gctgcgcttc taattctcca 180
actctggaaa acacaaaatt ggctgaagct ccagaaaaga gacaaaagaa aaagcaattg 240
ccataccagg gtatcttgca tgttccaggt gatagagtag aagaattgga taccagagaa 300
acctctttgt tggttgctga agtaaaaggt tggttaatga agttggcttc tggtaagggt 360
gaaatttctc catctgctta tgatactgct tgggttgcta gaattccttc cgaatctgat 420
tcttcattgc cagaattccc tgaagctttg gaatggatta tcaactctca attgccagat 480
ggttcttggg gtgatgatag acacttgcaa ttatacgata gagtcctgtc taccttgtct 540
tgtttggtta ctttgaaaac ctgggatatc ggtcataact ctattgctca aggtactaag 600
ttcctgaggg aaaacatgat caagttgaag caagatgatg gcgatttgtt gtctggtttc 660
gaagttactt ttcccatgat gttgcatgaa gccaagcaat tgggtttaga tattccatac 720
gaaaccgaat tcaccaggtt gttggaaatt tctaccaaaa agaagctggc caagattcca 780
ttggataaga ttcattctgc tccaacgact ctgttgtatt ccttggaagg tttacaagac 840
ttggaaatcg attggcagaa gatcttgaag ttgcaatcta aggacggttc ctttttgtca 900
tctccatctt ctactgcttg cgtctacttg aaaactaagg gtagaaagtc cttgcagtac 960
ttgcaaaatg ctatggaaga tcagaattac gctgttccat gtcattaccc aatcgacttg 1020
tttgaatctt tgtgggttgt tgacaccatc gaaagattgg gtattgatgt tttcttcagg 1080
gacgaaatca aggccgtttt ggattacgtt tactctttct ggactaacga aggtattggt 1140
tggggttcta cttgcttggt taacgatatt gatgataccg ctatggcctt cagaatcttg 1200
agaatgcatg gttacaacgt ttctaccgat gcctttaatc aattttggtt gccaggtgac 1260
aagttctgtt gttttgttgg tgaattgtcc cacggtgttt ctgaaatgtt gaacttgcat 1320
agagcctctc aagttgattt tccaaacgaa gctattctga ccaagacctt caaatactcc 1380
catgactact tgttgaacgt tgattctgct catatggata agtgggctac caagaaaaat 1440
ttgatgggtg aagttgcttt cgagttggct aatccatttc atgattgctt gccaaggatc 1500
tacaacaacg cttacatcaa acattacggt atggatgatt tgtggattgc caagactatc 1560
tacagattgc cattggttaa caacaaggtg ttcttggaat tggctaacag atacgctcaa 1620
caatgtcagt tgtatcaacc agctgaattg accaagttag ttaactggtg gcattcctct 1680
agattcgaag atattccttc tactagattg accgccaaca ttgatatgtt gccttacatc 1740
tactacgtta tttgcgctac cttccacgaa caagaatttg ctcaactgag agtgtttttc 1800
tcaaaggctt gttgcttgaa cactttgttc gatgacttga tggattgtgc cacctctatc 1860
gaagaattag acagattgca aaacgtcatc gaaaagtggg atatctcctt gtctcatgaa 1920
ttgccattag agtacagaat cccattccaa gagttctaca acaccgtttt ggttatgact 1980
gaagctgctt ccaagatcca caaaaatttg tctccagaat tcatctgcaa gtacctgtct 2040
ggtatctaca ctaagttgat caaatccgaa attgccgatg ctaggtggaa aattgaaggt 2100
tacattccat ctttcgaaga gtacatggaa aacgccgaag tttctatttc tacctgggtt 2160
catgttctga tgtccatttt gttctgtggt gaaccattga ccgaagaaat tttgaacacc 2220
atctacgact ctaggccatt gaagttggat agaattatct gtaggttgtg caacgacatc 2280
caaacctaca agatcgaaat gaagttaggt caacctactc aaggtgtttc ctgttacatg 2340
aaggaacatc caggtgctac tgaagaagat gctttggttt acttgcagtc cttgttagaa 2400
aagaccaaga gggaattgaa cgagtcctac tttattaccc acgaaaacga tttgcccaag 2460
aacatcaaga gattcaattt cgagatggtc aggatgatgt tgatcactta caacgaaact 2520
agacaggtgg acttgtttag aaacccagat aacgaattga aggacatgat taagttctgc 2580
ttggaaactt acaggaccct gtaa 2604

Claims (19)

1.一种生产次丹参酮二烯的重组酵母工程菌,所述重组酵母工程菌能发酵生产GGPP,其特征在于,在所述重组酵母菌中包含II类二萜合酶基因CfTPS1,以及I类二萜合酶基因SmKSL1。
2.根据权利要求1所述的生产次丹参酮二烯的重组酵母工程菌,其中所述II类二萜合酶基因CfTPS1和I类二萜合酶基因SmKSL1以SmKSL1-CfTPS1的方式融合。
3.根据权利要求2所述的生产次丹参酮二烯的重组酵母工程菌,其中II类二萜合酶基因CfTPS1和I类二萜合酶基因SmKSL1通过柔性肽GGGS相连。
4.根据权利要求2所述的生产次丹参酮二烯的重组酵母工程菌,其中所述SmKSL1-CfTPS1融合基因SmKSL1的N端进行了截短,所述截短的方式为N端的叶绿体转运肽S2-C47。
5.根据权利要求4所述的生产次丹参酮二烯的重组酵母工程菌,其中所述SmKSL1-CfTPS1融合基因SmKSL1的N端进行了截短,所述截短的方式为N端的叶绿体转运肽S2-C47,并且还在CfTPS1的N端也进行了截短,截短的方式为N端转运肽M2-N81。
6.根据权利要求1-5中任意一权利要求所述的生产次丹参酮二烯的重组酵母工程菌,其中所述重组酵母工程菌过表达融合酶基因BTS1/ERG20、牻牛儿牻牛儿基焦磷酸合酶基因SaGGPS和HMG-CoA还原酶基因的催化活性域tHMG1。
7.根据权利要求6所述的生产次丹参酮二烯的重组酵母工程菌,其中所述重组酵母工程菌敲除了ROX1基因、YJL064w基因、YPL062w基因或ERG9启动子激活域(ERG9p)中的任意一种或多种。
8.根据权利要求1-7中任意一权利要求所述的生产次丹参酮二烯的重组酵母工程菌,其中所述酵母工程菌为GEN.PK系酿酒酵母菌或BY系酿酒酵母菌。
9.根据权利要求8所述的生产次丹参酮二烯的重组酵母工程菌,其中所述BY系酿酒酵母菌为BY4741酿酒酵母、BY4742酿酒酵母或BY-T20酿酒酵母,所述BY-T20的基因型为:MATαtrp1Δ0leu2Δ0ura3Δ0,trp1::HIS3-PPGK1-BTS1/ERG20-TADH1-PTDH3-SaGGPS-TTPI1-PTEF1-tHMG1-TCYC1
10.一种生产次丹参酮二烯的方法,所述方法包括:
将生产次丹参酮二烯的重组酵母工程菌转入培养基中,进行发酵,提取分离发酵后的菌液,得到目标产物次丹参酮二烯,其中,所述重组酵母工程菌能发酵生产GGPP,并且所述重组酵母工程菌包含:选自II类二萜合酶基因CfTPS1以及选自I类二萜合酶基因SmKSL1。
11.根据权利要求10所述的方法,其中所述重组酵母工程菌包含:II类二萜合酶基因CfTPS1,以及I类二萜合酶基因SmKSL1通过SmKSL1-CfTPS1的方式融合。
12.根据权利要求11所述的生产次丹参酮二烯的方法,其中II类二萜合酶基因CfTPS1和I类二萜合酶基因SmKSL1通过柔性肽GGGS相连。
13.根据权利要求11所述的生产次丹参酮二烯的方法,其中所述SmKSL1-CfTPS1融合基因SmKSL1的N端进行了截短,所述截短的方式为N端的叶绿体转运肽S2-C47。
14.根据权利要求13所述的生产次丹参酮二烯的方法,其中所述SmKSL1-CfTPS1融合基因SmKSL1的N端进行了截短,所述截短的方式为N端的叶绿体转运肽S2-C47,并且还在CfTPS1的N端也进行了截短,截短的方式为N端转运肽M2-N81。
15.根据权利要求10-14中任意一权利要求所述的生产次丹参酮二烯的方法,其中所述重组酵母工程菌过表达融合酶基因BTS1/ERG20、牻牛儿牻牛儿基焦磷酸合酶基因SaGGPS和HMG-CoA还原酶基因的催化活性域tHMG1。
16.根据权利要求15所述的生产次丹参酮二烯的方法,其中所述重组酵母工程菌敲除了ROX1基因、YJL064w基因、YPL062w基因或ERG9启动子激活域(ERG9p)中的任意一种或多种。
17.根据权利要求16所述的生产次丹参酮二烯的方法,其中所述酵母工程菌为GEN.PK系酿酒酵母菌或BY系酿酒酵母菌。
18.根据权利要求17所述的生产次丹参酮二烯的方法,其中所述BY系酿酒酵母菌为BY4741酿酒酵母、BY4742酿酒酵母或BY-T20酿酒酵母,所述BY-T20的基因型为:MATαtrp1Δ0leu2Δ0ura3Δ0,trp1::HIS3-PPGK1-BTS1/ERG20-TADH1-PTDH3-SaGGPS-TTPI1-PTEF1-tHMG1-TCYC1
19.根据权利要求10所述的生产次丹参酮二烯的方法,其中所述酵母菌的发酵方式为在无机盐培养基中进行高密度发酵培养。
CN202010240128.0A 2020-03-31 2020-03-31 一种生产次丹参酮二烯的重组酵母工程菌 Active CN111548946B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010240128.0A CN111548946B (zh) 2020-03-31 2020-03-31 一种生产次丹参酮二烯的重组酵母工程菌

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010240128.0A CN111548946B (zh) 2020-03-31 2020-03-31 一种生产次丹参酮二烯的重组酵母工程菌

Publications (2)

Publication Number Publication Date
CN111548946A CN111548946A (zh) 2020-08-18
CN111548946B true CN111548946B (zh) 2022-05-13

Family

ID=71998155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010240128.0A Active CN111548946B (zh) 2020-03-31 2020-03-31 一种生产次丹参酮二烯的重组酵母工程菌

Country Status (1)

Country Link
CN (1) CN111548946B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114150011B (zh) * 2021-11-17 2023-04-18 天津大学 异源合成鼠尾草酸的重组酿酒酵母及构建方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3918185B2 (ja) * 2001-12-20 2007-05-23 トヨタ自動車株式会社 プレニルアルコールの製造方法
CN108395997A (zh) * 2018-03-05 2018-08-14 首都医科大学 一种高产二萜类成分的酵母工程菌

Also Published As

Publication number Publication date
CN111548946A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN110106209B (zh) 一种利用解脂耶氏酵母途径定位合成萜类化合物的方法
CN110878261B (zh) 合成木糖醇的重组解脂耶氏酵母的构建方法及其菌株
CN112695003B (zh) 一种高产西柏三烯一醇的基因工程菌及其构建方法与应用
CN114107340A (zh) 一种甲羟戊酸激酶基因rkmk及其应用
CN113652385B (zh) 一种高产乳酰-n-四糖的微生物的构建方法及应用
WO2024055735A1 (zh) 一种高产赤霉素ga 3的基因工程菌、构建方法及应用
CN111004763A (zh) 一种生产β-石竹烯的工程菌及其构建方法与应用
CN108929884B (zh) 通过合成生物学手段异源生物合成灵芝酸的方法
CN113502278B (zh) 酶组合物及其在柚皮素生物合成中的应用
CN111088175A (zh) 一种产红没药烯的解脂耶氏酵母及其构建方法与用途
CN111548946B (zh) 一种生产次丹参酮二烯的重组酵母工程菌
CN109136119B (zh) 微生物及其用途
CN111607546B (zh) 一种高产法尼烯的基因工程菌及其构建方法与应用
CN112175848A (zh) 一种广藿香醇生产酵母菌株及其构建方法和应用
CN114517161B (zh) 高产赤霉素ga3的基因工程菌、构建方法及应用
CN109136120B (zh) 微生物及其用途
CN110669713A (zh) 一种合成d-柠檬烯的基因工程菌及其构建方法与应用
EP4249583A1 (en) Use of fatty acid elongase gene and esterase gene in synthesis of nervonic acid and grease in yeast
CN113684163B (zh) 一种提高乳酰-n-四糖产量的基因工程菌及其生产方法
CN115873836A (zh) 一种橙花叔醇合成酶及应用
KR20210047992A (ko) 알파-휴물렌 생산용 형질전환 메탄자화균 및 이의 용도
CN114606146B (zh) 一种生产d-柠檬烯的酵母及其应用
CN115305254B (zh) 一种萜类底盘微生物与工程菌及其构建方法和应用
CN114774503B (zh) 角鲨烯环氧化酶及其编码基因与应用
CN114806914B (zh) 一种高产β-胡萝卜素的解脂耶氏酵母菌及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant