发明内容
有鉴于此,本发明提供了一种生物全合成紫杉醇关键前体物质巴卡亭III的方法、生物材料及应用。本申请成功鉴定了紫杉烷C4-C20氧杂环丁烷形成酶的基因(TOT)和紫杉烷9α羟基化酶的基因(T9αH),鉴定了巴卡亭III生物合成途径的核心成分,为通过合成生物学高效开发紫杉醇等紫杉烷类产品的绿色低碳生产途径开辟了道路。
为了实现上述发明目的,本发明提供以下技术方案:
第一方面,本发明提供了一种生物酶组合物,该生物酶组合物包括紫杉烷9α羟基化酶(T9αH),以及紫杉烷C4-C20氧杂环丁烷形成酶(TOT);
T9αH的氨基酸序列包括如下(a1)~(a4)中的至少一种:
(a1)SEQ ID NO:1~14所示氨基酸序列中的至少一种;
(a2)SEQ ID NO:1~14所示氨基酸序列中的至少一种的N端和/或C端连接标签得到的融合氨基酸序列;
(a3)SEQ ID NO:1~14所示氨基酸序列中的至少一种经过一个或多个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的氨基酸序列;
(a4)与SEQ ID NO:1~14所示氨基酸序列中的至少一种具有至少60%同一性且具有相同功能的氨基酸序列;
TOT的氨基酸序列包括如下(b1)~(b4)中的至少一种:
(b1)SEQ ID NO:29~52所示氨基酸序列中的至少一种;
(b2)SEQ ID NO:29~52所示氨基酸序列中的至少一种的N端和/或C端连接标签得到的融合氨基酸序列;
(b3)SEQ ID NO:29~52所示氨基酸序列中的至少一种经过一个或多个氨基酸残基的取代和/或缺失和/或添加得到的具有相同功能的氨基酸序列;
(b4)与SEQ ID NO:29~52所示氨基酸序列中的至少一种具有至少60%同一性且具有相同功能的氨基酸序列。
上述(a4)或(b4)中,具有至少60%同一性的氨基酸序列示例性的为具有至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。
本发明研究发现,在巴卡亭III生物合成途径中,在紫杉二烯合成酶TS催化下,GGPP转化为紫杉二烯;随后,紫杉二烯被6个内质网相关的p450酶协同催化修饰,包括紫杉烷5α羟基化酶T5αH、紫杉烷2α羟基化酶T2αH、紫杉烷7β羟基化酶T7βH、紫杉烷9α羟基化酶T9αH、紫杉烷13α羟基化酶T13αH和紫杉烷C4-C20氧杂环丁烷形成酶TOT,并在两种胞质酰基转移酶(紫杉烷5α乙酰基转移酶TAT和紫杉烷2α-氧-苯甲酰基转移酶TBT)的催化下,最终转化为巴卡亭III。
在本发明一实施方式中,当起始原料为牻牛儿基牻牛儿基焦磷酸(GGPP),合成巴卡亭III时,本发明生物酶组合物还包括紫杉二烯合成酶(TS)、紫杉烷5α羟基化酶(T5αH)、紫杉烷13α羟基化酶(T13αH)、紫杉烷2α羟基化酶(T2αH)、紫杉烷7β羟基化酶(T7βH)、紫杉烷5α乙酰基转移酶(TAT)、紫杉烷2α-氧-苯甲酰基转移酶(TBT)中的至少一种。
在一些实施方式中,上述多种生物酶的天然氨基酸序列可为来源于红豆杉属不同种和或不同株的变体序列。上述多种生物酶的人工氨基酸序列可为天然氨基酸序列通过适当修饰得到的变体序列,所述修饰包括但不限于不影响目标蛋白的生物活性的适当氨基酸取代/添加/缺失、N-端的氨基酸被截短、适用于宿主细胞偏好的密码子优化、标签的添加、融合等。
上述生物酶可为去除信号肽的生物酶,也可为包括信号肽的生物酶。
在本发明另一实施方式中,当起始原料为牻牛儿基牻牛儿基焦磷酸(GGPP),合成巴卡亭III的下游产物紫杉醇时,除了上述T9αH、TOT,以及除了TS、T5αH、T13αH、T2αH、T7βH、TAT、TBT中的至少一种,生物酶组合物还包括苯丙氨酰CoA连接酶(Phenylalanoyl CoAligase,PCL)、苯丙氨酸氨基变位酶(phenylalanine aminomutase,PAM)、巴卡亭Ⅲ3氨基3苯丙醇基转移酶(baccatinⅢ:3amino 3phenylpropanoyl transferase,BAPT)、细胞色素P450羟化酶(T2′αH)、3′N去苯甲酰2′脱氧紫杉醇N苯甲酰基转移酶(3′N debenzoyl2′deoxytaxol N benzoyl transferase,DBTNPT)中的至少一种。
在本发明另一实施方式中,当起始原料为GGPP的前体物质异戊烯焦磷酸(IPP)和/或焦磷酸二甲基烯丙酯(DMAPP),合成巴卡亭III时,在本发明实施方式中,生物酶组合物还包括牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS)。合成GGPP的前体分子IPP和DMAPP可由宿主细胞自身提供。
第二方面,本发明提供了编码上述生物酶组合物的核酸分子组合物,其包括编码T9αH的核酸分子和编码TOT的核酸分子;
编码T9αH的核酸分子的核苷酸序列包括如下序列中的至少一种:
(c1)SEQ ID NO:15~28所示核苷酸序列中的至少一种;
(c2)SEQ ID NO:15~28所示核苷酸序列中的至少一种的互补序列、简并序列或同源序列,同源序列为与SEQ ID NO:15~28所示核苷酸序列具有至少75%同一性的核苷酸序列;具有至少75%同一性的核苷酸序列示例性的为具有至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。
(c3)在严格条件下与(c1)或(c2)所示的核苷酸序列杂交,且能够编码相同功能蛋白质的核苷酸序列;
编码TOT的核酸分子的核苷酸序列包括如下序列中的至少一种:
(d1)SEQ ID NO:53~76所示核苷酸序列中的至少一种;
(d2)SEQ ID NO:53~76所示核苷酸序列中的至少一种的互补序列、简并序列或同源序列,同源序列为与SEQ ID NO:53~76所示核苷酸序列具有至少74%同一性的核苷酸序列;具有至少74%同一性的核苷酸序列示例性的为具有至少74%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的核苷酸序列。
(d3)在严格条件下与(d1)或(d2)所示的核苷酸序列杂交,且能够编码相同功能蛋白质的核苷酸序列。
在本发明一实施方式中,由GGPP合成巴卡亭III时,上述核酸分子组合物还包括编码如下生物酶中的至少一种的核酸分子:紫杉二烯合成酶(TS)、紫杉烷5α羟基化酶(T5αH)、紫杉烷13α羟基化酶(T13αH)、紫杉烷2α羟基化酶(T2αH)、紫杉烷7β羟基化酶(T7βH)、紫杉烷5α乙酰基转移酶(TAT)、紫杉烷2α-氧-苯甲酰基转移酶(TBT)。
在一些实施方式中,本发明相关核酸分子的天然核苷酸序列可为来源于红豆杉属不同种和或不同株的变体序列,其人工核苷酸序列可为天然核苷酸序列通过适当修饰得到的变体序列,所述修饰包括但不限于不影响目标蛋白的生物活性的适当核苷酸取代/添加/缺失、N-端氨基酸被截短、适用于宿主细胞偏好的密码子优化、标签的添加、融合等对应的核苷酸变体序列。
在本发明另一实施方式中,由GGPP合成巴卡亭III的下游产物紫杉醇时,核酸分子组合物还包括编码苯丙氨酰CoA连接酶(PCL)、苯丙氨酸氨基变位酶(PAM)、巴卡亭Ⅲ3氨基3苯丙醇基转移酶(BAPT)、细胞色素P450羟化酶(T2′αH)、3′N去苯甲酰2′脱氧紫杉醇N苯甲酰基转移酶(DBTNPT)中的至少一种核酸分子。
在本发明实施方式中,由GGPP的前体物质IPP和/或DMAPP合成巴卡亭III时,核酸分子组合物还包括编码牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS)的核酸分子,和/或IPP异构酶。
本发明相关核酸分子可从多种来源获得。在一些实施方案中,部分核酸分子由宿主细胞自身提供,例如合成GGPP所需的核苷酸分子可由宿主细胞自身提供,合成紫杉二烯和或紫杉二烯5α-醇可由的已记载的转化宿主细胞提供,例如Ajikumar PK,Xiao WH,TyoKE,et al.Isoprenoid pathway optimization for Taxol precursor overproductionin Escherichia coli[J].Science,2010,330(6000):70-74.;Zhou K,Qiao K,Edgar S,etal.Distributing a metabolic pathway among a microbial consortium enhancesproduction of natural products[J].Nature Biotechnology,2015,doi:10.1038/nbt.3095等中的相应记载。
任选的,所述核酸分子为合成的和/或分离的。
第三方面,本发明提供了一种生物材料,生物材料为下述(e1)~(e3)中的任一种:
(e1)含有上述核酸分子组合物的表达盒或其组合物;
(e2)含有上述核酸分子组合物或(e1)表达盒或其组合物的载体或其组合物;
(e3)含有上述核酸分子组合物、(e1)表达盒或其组合物、(e2)载体或其组合物中的至少一种的宿主细胞或其组合物。
在本发明一实施方式中,生物材料为表达盒或其组合物。
在本发明实施方式中,核酸分子组合物包括编码T9αH和TOT两种生物酶的核酸分子时,可将其制备成一个表达盒,在一个表达盒表达T9αH基因和TOT基因,也可将其制备成多个表达盒组成的组合物,在两个表达盒分别表达T9αH基因和TOT基因。
在本发明实施方式中,核酸分子组合物包括编码T9αH和TOT两种生物酶的核酸分子,还包括编码TS、T5αH、T13αH、T2αH、T7βH、TAT、TBT中的至少一种的核酸分子时,可将其制备成一个表达盒,在一个表达盒中表达所有核酸分子;也可将其制备成多个表达盒组成的组合物,在多个表达盒中表达所有核酸分子,一个表达盒中表达一种或多种核酸分子,只要能够实现所有核酸分子的共表达即可。
在本发明实施方式中,表达盒还包括调控元件,调控元件包括启动子、增强子、前导序列、转座子、终止子、标记基因中的至少一种。
在本发明实施方式中,表达盒包括天然启动子和/或异源启动子。
在本发明实施方式中,可操作连接的异源启动子的选择可取决于许多因素,诸如例如期望的时间安排、定位和表达模式以及对特定生物或非生物刺激的响应性。异源启动子包括但不限于诱导型启动子、组成型启动子、组织特异性启动子、伤口可诱导的启动子和化学调节的启动子等。例如Trc、T5、Tac、T7、T7lac、Sp6、araBAD、trp、lac、Ptac、pL、T3、GAL1、GAL10、MET17、CUP1、AOX1、polyhedrin、CMV、EF1A、EFS、CAG、PGK1、CBh、SFFV、MSCV、SV40、mPGK、hPGK、UBC、human beta actin、Actin、CaMV35S、TEF1、GPD、GDS、Ubi、ADH1、GAP、actin5C、Polyubiquitin、a1tubulin、TRE、TRE3G、UAS、Ac5等。
在本发明实施方式中,表达盒还包括(a)-(d)中酶的修饰核酸序列的表达盒,其中,修饰可以为增加5'前导序列,增强序列翻译表达的作用;修饰还可以为增加调控元件,或者对启动子修饰等。
基因表达所需调控序列的确切性质在物种或细胞类型之间可能会有所不同,但一般按需要应包括转录和翻译起始的5'非转录和5'非翻译序列,例如TATA盒、加帽序列、CAAT序列等等。尤其是,这种5'非转录调控序列将包括启动子区域,其包括控制对有效连接的基因进行转录控制的启动子序列。调控序列也可包括增强子序列或所需的上游激活子序列。本发明表达盒可任选地包括5'前导或信号序列。
在本发明实施方式中,核酸分子的表达可通过操作基因或操纵子在细胞中的拷贝数来调节。
在一些实施方案中,核酸分子的表达可通过操作模块内核酸分子的顺序来调节。
在一些实施方案中,核酸分子的表达通过将一个或更多个核酸分子或操纵子整合到染色体上来调节。
在本发明另一实施方式中,生物材料为载体或其组合物。
在一些实施方案中,一个或更多个本发明相关的核酸分子在表达载体中表达。本文所用的“载体”可是大量核酸中的任何一种,其中可通过限制性酶切和连接来插入所需的一个或更多个序列,以便在不同的遗传环境中运送或在宿主细胞中表达。载体通常是由DNA组成,也可由RNA组成。
在本发明实施方式中,载体包括质粒、叶绿体、病毒载体、噬菌体、噬菌粒、黏粒、F黏粒、细菌噬菌体或人工染色体,并且任选地,病毒载体包括腺病毒载体、反转录病毒载体或腺相关病毒载体,并且任选地,载体包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1-衍生的载体(PAC)、酵母人工染色体(YAC)或哺乳动物人工染色体(MAC)。例如载体包括pFastBac1、pYES2、pYES2.1、pESC-Ura、pESC-Trp、pESC-Leu、pESC-His、pGEX2T、pTAex3、pUSA、pYMB0、pHT43、pET28b、pIJ702、pUCP19、pYMB03、pHT43、pEAQ等。
克隆载体能自主复制或整合在宿主细胞基因组中,其还以一个或更多个限制性内切酶位点为特征,可以在该位点以确定的方式切割载体并可将期望的DNA序列连接到载体中,从而新的质粒保留了它在宿主细胞中复制的能力。在质粒的情况下,期望序列的复制可随着质粒在宿主细胞(如细菌宿主)中的拷贝数增加而多次发生,或仅在宿主通过有丝分裂繁殖前在每个宿主中发生一次。在噬菌体的情况下,复制可在裂解期过程中主动发生或在溶原期过程中被动发生。
表达载体可通过限制性酶切和连接将期望的DNA序列插入其中,以使其与调控序列有效连接中并可表达为RNA转录本。载体还可包含适合用于鉴定细胞是否已被载体转化或转染的一种或更多种标记序列。标记包括如编码提高或降低其对抗生素或其他化合物之抗性或敏感性的蛋白质的基因,编码可通过本领域已知标准方法检测活性的酶的基因(例如β-半乳糖苷酶、萤光素酶或碱性磷酸酶),以及对转化或转染细胞、宿主、菌落或菌斑的表型有可见影响的基因(例如绿色荧光蛋白)。优选的载体是能够自主复制和表达与其有效连接的DNA片段中所存在的结构基因产物的载体。
在一些实施方案中,可将本发明的核酸分子组合物稳定地整合到宿主细胞的基因组(包括叶绿体基因组)中。
在另一些实施方案中,通过显微注射、微粒轰击、病毒载体侵染等方式,或者通过喷雾、灌溉、撒粉等向植物或其部分施用经修饰的病毒和/或经修饰的病毒核酸,将核酸分子不是稳定地整合到宿主细胞的基因组中,使宿主或宿主细胞瞬时表达目的基因。
在本发明实施方式中,核酸分子组合物包括编码T9αH和TOT两种生物酶的核酸分子时,可将其制备成一个载体,在一个载体表达T9αH核酸分子和TOT核酸分子,也可将其制备成多个载体组成的组合物,在两个载体分别表达T9αH核酸分子和TOT核酸分子。
在本发明实施方式中,核酸分子组合物包括编码T9αH和TOT两种生物酶的核酸分子,还包括编码TS、T5αH、T13αH、T2αH、T7βH、TAT、TBT中的至少一种核酸分子时,可将其制备成一个载体,在一个载体中表达所有核酸分子;也可将其制备成多个载体组成的组合物,在多个载体中表达所有核酸分子,一个载体中表达一种或多种核酸分子,只要能够实现所有核酸分子的共表达即可。
在本发明实施方式中,载体或其组合物中还包括编码苯丙氨酰CoA连接酶(PCL)、苯丙氨酸氨基变位酶(PAM)、巴卡亭Ⅲ3氨基3苯丙醇基转移酶(BAPT)、细胞色素P450羟化酶(T2′αH)、3′N去苯甲酰2′脱氧紫杉醇N苯甲酰基转移酶(DBTNPT)等侧链酯化相关核酸分子中的至少一种。
在本发明实施方式中,载体或其组合物中还包括编码牻牛儿基牻牛儿基焦磷酸合成酶(GGPPS)的核酸分子。
在本发明实施方式中,载体还包括转录调控因子。例如转录调控因子包括TcWRKY1、TcWRKY2、TcWRKY6、TcWRKY8、TcWRKY47、TcMYC2a等等。
在本发明另一实施方式中,生物材料为宿主细胞或其组合物。
任选的,宿主细胞包括微生物细胞、植物细胞、动物细胞、藻类细胞中的至少一种。
在本发明实施方式中,所述宿主细胞为微生物。
在本发明实施方式中,微生物包括细菌和/或真菌。
在本发明实施方式中,所述宿主细胞组合物包括但不限于细菌之间、真菌之间、细菌和真菌之间的组合。例如大肠杆菌和酵母的组合。不同宿主细胞组成的组合物可以通过共培养、多段培养等方式实现本发明目的。
在本发明实施方式中,细菌包括但不限于埃希氏菌属细胞、乳杆菌属细胞、乳球菌属细胞、棒杆菌属细菌、醋杆菌属细菌、不动杆菌属细菌、假单胞菌属细胞、链霉菌属细胞、芽孢杆菌属细胞、葡萄球菌属细胞、农杆菌属细胞、红豆杉内生菌。例如大肠杆菌、枯草芽孢杆菌、根癌农杆菌、发根农杆菌、乳酸乳球菌、蜡状芽孢杆菌、荧光假单胞菌等等。在一些实施方案中,细菌细胞例如埃希氏菌(Escherichia spp.)、链霉菌(Streptomyces spp.)、Zymonas spp.、醋酸菌(Acetobacter spp.)、柠檬酸菌(Citrobacter spp.)、Synechocystis spp.、根瘤菌(Rhizobium spp.)、梭状芽孢杆菌(Clostridium spp.)、棒状杆菌(Corynebacteriumspp.)、链球菌(Streptococcus spp.)、黄单胞菌(Xanthomonasspp.)、乳杆菌(Lactobacillus spp.)、乳球菌(Lactococcus spp.)、芽孢杆菌(Bacillusspp.)、产碱杆菌(Alcaligenes spp.)、假单胞菌(Pseudomonas spp.)、气单胞菌(Aeromonasspp.)、固氮菌(Azotobacter spp.)、丛毛单胞菌(Comamonas spp.)、结核分枝杆菌(Mycobacterium spp.)、红球菌(Rhodococcus spp.)、葡糖杆菌(Gluconobacterspp.)、雷尔氏菌(Ralstonia spp.)、硫杆菌(Acidithiobacillus spp.)、Microlunatusspp.、地杆菌(Geobacter spp.)、地芽孢杆菌(Geobacillus spp.)、节杆菌(Arthrobacterspp.)、黄杆菌(Flavobacterium spp.)、沙雷氏菌(Serratia spp.)、糖多孢菌(Saccharopolyspora spp.)、栖热菌(Thermus spp.)、寡养单胞菌(Stenotrophomonasspp)、色杆菌(Chromobacterium spp)、中华根瘤菌(Sinorhizobiumspp)、糖多孢菌(Saccharopolyspora spp)、农杆菌(Agrobacterium spp)和泛菌(Pantoeaspp)。细菌细胞可是革兰氏阴性细胞,如大肠杆菌(E.coli)细胞,或革兰氏阳性细胞,如芽孢杆菌种。
在本发明实施方式中,真菌包括但不限于酵母、丝状真菌或蘑菇。
在本发明具体实施方式中,酵母包括但不限于酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母、产朊假丝酵母、巴斯德毕赤酵母、乳酸克鲁维酵母、多形汉逊酵母、博伊丁假丝酵母、解腺嘌呤阿氏酵母、红发夫酵母、白假丝酵母菌。酵母细胞例如为酵母菌(Saccharomycesspp.)、裂殖酵母(Schizosaccharomyces spp.)、毕赤酵母(Pichia spp.)、Paffia spp.、克鲁维酵母(Kluyveromyces spp.)、念珠菌(Candida spp.)、蓝状菌(Talaromyces spp.)、酒香酵母(Brettanomycesspp.)、管囊酵母(Pachysolen spp.)、德巴利酵母(Debaryomycesspp.)、耶氏酵母(Yarrowia spp.)和工业上的多倍体酵母菌株。优选地,酵母菌株是酿酒酵母(S.cerevisiae)菌株或耶氏酵母菌株。
在本发明具体实施方式中,丝状真菌包括但不限于红曲菌、米曲霉、黑曲霉、黄曲霉、青霉。真菌例如为曲霉(Aspergillusspp.)、青霉(Pennicilium spp.)、镰孢菌(Fusarium spp.)、根霉(Rhizopus spp.)、顶孢霉(Acremonium spp.)、脉孢霉(Neurosporaspp.)、粪壳菌(Sordaria spp.)、稻瘟病菌(Magnaporthe spp.)、异水霉(Allomycesspp.)、黑粉菌(Ustilago spp.)、葡萄孢霉(Botrytisspp.)和木霉(Trichoderma spp)。
在本发明实施方式中,所述宿主细胞为植物细胞。
在本发明具体实施方式中,植物细胞包括但不限于烟草细胞、白豆杉细胞、青蒿细胞、拟南芥细胞、小立碗藓细胞、地钱细胞、番茄细胞、人参细胞、棉花细胞、甘蔗细胞、马铃薯细胞、玉米细胞、小麦细胞、水稻细胞、萝卜细胞、莴苣细胞等,所述细胞包括原生质体、悬浮细胞等。
在本发明实施方式中,所述宿主细胞为动物细胞。
在本发明实施方式中,动物细胞包括昆虫细胞、哺乳动物细胞、线虫细胞、鱼类细胞。
在本发明具体实施方式中,昆虫细胞包括但不限于S2果蝇细胞或Sf9细胞。
在本发明具体实施方式中,哺乳动物细胞包括但不限于成纤维细胞、淋巴细胞、上皮细胞、成髓细胞。例如HEK293细胞、CHO细胞、COS细胞、BHK细胞、海拉细胞、中国仓鼠卵巢细胞、Vero细胞、SP2/0细胞、NS/0骨髓瘤细胞、小仓鼠肾细胞、人B细胞、人T细胞Jurkat、神经元细胞、CV-I/EBNA细胞、L细胞、3T3细胞、HEPG2细胞、MDCK细胞。
在本发明具体实施方式中,鱼类细胞包括但不限于斑马鱼细胞。
在本发明的实施方式中,植物细胞和/或动物细胞包括非生物性转换(non-biologically transformed)的重组植物细胞和/或重组动物细胞。
任选的,植物细胞或动物细胞可通过细胞培养方式表达生物酶、生产目标产物。
在本发明实施方式中,所述宿主细胞为藻类细胞。
在本发明实施方式中,藻类细胞包括但不限于蓝藻(蓝细菌)、绿藻、聚球藻、细长聚球藻、集胞藻、鱼腥藻、衣藻、莱茵衣藻中的至少一种。
本发明还提供了一种用于产生宿主细胞的方法,该方法包括用上述核酸分子、生物材料中的表达盒或载体中的至少一种转化宿主细胞。
本发明提供了一种用于产生植物或植物细胞的方法,该方法包括用上述核酸分子、生物材料中的表达盒或载体中的至少一种转化植物或植物细胞。
第四方面,本发明提供了一种产生上述生物酶组合物的方法,将本发明的核酸分子组合物,或生物材料中的表达盒或其组合物、载体或其组合物中的至少一种,转化宿主细胞中,使宿主细胞产生生物酶组合物。
在本发明的实施方式中,所述宿主细胞包括微生物细胞、植物细胞、动物细胞和/或藻类细胞。
在上述方法中,将核酸分子、表达盒、载体转化宿主细胞的方法包括但不限于农杆菌介导的转化、基因枪转化、电穿孔、聚乙二醇(PEG)转化、脂质转染、热休克、磷酸钙沉淀、病毒介导、显微注射、基因工程编辑技术。宿主细胞包括微生物、植物细胞、动物细胞和/或藻类细胞。
在本发明具体实施方式中,产生生物酶组合物的方法例如为:(1)构建包含本发明核酸分子组合物的载体;(2)将所得的载体转化宿主细胞(包括微生物细胞、植物细胞、动物细胞、藻类细胞等);(3)将所得的宿主细胞进行培养,使基因共表达生成巴卡亭III。
在本发明具体实施方式中,在产生生物酶组合物的方法中,当在多个载体中表达核酸分子,载体包括表达至少两种核酸分子的载体,包含多个核酸分子的载体的构建可采用多元模块工程技术(multivariate modular metabolic engineering,MMME)进行构建。
在一些实施方案中,本发明相关的一个或更多个核酸分子在细菌细胞中重组表达。本发明的细菌细胞可培养在任何类型(丰富或基本)和任何组成的培养基中。本领域普通技术人员将可以理解,常规优化将允许使用多种类型的培养基。选定的培养基可补充多种额外组分。补充组分的一些非限定性实例包括葡萄糖、抗生素、用于基因诱导的IPTG、ATCC微量矿物质补充剂和乙醇酸。同样,培养基的其他方面和本发明细胞的生长条件可通过常规实验来优化。例如,pH和温度是可优化因素的非限定性实例。在一些实施方案中,如培养基选择、培养基补充和温度等因素可影响巴卡亭III、紫杉醇等紫杉烷类产品的生产水平。在一些实施方案中,可优化补充性组分的浓度和量。在一些实施方案中,优化了用一种或更多种补充性组分来补充培养基的频率和在收获萜类化合物如紫杉二烯之前培养基的培养时间。
用于本发明相关细胞生长的液体培养物可储于任何本领域已知和使用的培养容器中。在一些实施方案中,通气反应容器(如搅拌反应釜)中的大规模生产可用于产生大量的紫杉烷类产品,其可从细胞培养物中回收。在一些实施方案中,紫杉烷类产品是从细胞培养物的气相中回收的,例如通过向细胞培养物中加入有机层如十二烷并从有机层中回收紫杉烷类产品。
第五方面,本发明提供了本发明生物酶组合物、核酸分子组合物、生物材料中的任一种在合成巴卡亭III和/或其中间体中的应用。
在本发明实施方式中,巴卡亭III中间体包括如式II和/或式III所示的化合物:
其中,R1、R3、R4各自独立地选自H、-OH、-OAc;R2、R6选自H、-OH、-OAc、-OBz;R5、R7选自H、-OH、=O、-OAc。
在本发明实施方式中,巴卡亭Ⅲ还包括巴卡亭Ⅲ衍生物。
第六方面,本发明提供了一种合成巴卡亭III和/或其中间体的方法,以巴卡亭III和/或其中间体的前体物质为底物,在本发明生物酶组合物或上述方法产生的生物酶组合物的作用下,催化紫杉烷环骨架C9位羟基化,以及催化紫杉烷环骨架C4-C20氧杂环丁烷的形成,合成巴卡亭III和/或其中间体;
和/或,
将本发明核酸分子组合物、生物材料(e1)~(e2)中的任一种转化宿主细胞,使宿主细胞产生生物酶组合物;宿主细胞包括微生物细胞、植物细胞、动物细胞、藻类细胞中的至少一种;以巴卡亭III和/或其中间体的前体物质为底物,在产生的生物酶组合物的作用下,催化紫杉烷环骨架C9位羟基化,以及催化紫杉烷环骨架C4-C20氧杂环丁烷的形成,合成巴卡亭III和/或其中间体。
在本发明实施方式中,合成巴卡亭III和/或其中间体的方法中还包括如下(f1)~(f3)反应中的任一种:
(f1)紫杉烷环骨架C1、C2、C5、C7、C10、C13中的至少一个碳位的羟基化;
(f2)C2、C5、C10中的至少一个羟基的酰基化;
(f3)C9位羟基的酮基化。
在本发明实施方式中,宿主细胞为微生物细胞,合成巴卡亭III和/或其中间体的方法还包括发酵培养的步骤。
在本发明实施方式中,宿主细胞为植物细胞或动物细胞,合成巴卡亭III和/或其中间体的方法还包括细胞培养的步骤。
任选的,所述培养的方法包括固定化细胞培养、两段培养、两相培养、添加诱导物(例如水杨酸、硝酸银、茉莉酸甲酯、花生四烯酸、柠檬酸铵等)、添加旁路抑制剂(例如矮壮素)、添加底物(GGPP、紫杉二烯和/或其他巴卡亭III中间体)等。
在本发明实施方式中,宿主细胞为植物细胞,合成巴卡亭III和/或其中间体的方法还包括种植植物、收获植物、提取产物的步骤。
在本发明实施方式中,合成巴卡亭III的方法包括以紫杉二烯为底物,至少在6个p450酶(即T2αH、T5αH、T7βH、T9αH、T13αH和TOT)以及两种胞质酰基转移酶(TAT和TBT)的作用下,合成巴卡亭III。
在本发明的具体实施方式中,所述底物紫杉二烯在TS酶的作用下合成。
第七方面,本发明提供了本发明生物酶组合物、核酸分子组合物、生物材料中的任一种在合成紫杉烷类化合物和/或其中间体中的应用。
第八方面,本发明提供了一种合成紫杉烷类化合物和/或其中间体的方法,包括如下步骤:
采用前述的方法合成巴卡亭III;
以巴卡亭III为底物,进一步催化合成紫杉烷类化合物和/或其中间体。
在上述合成巴卡亭III、紫杉烷类化合物和/或其中间体的方法中,还包括优化步骤。优化步骤包括如下优化方式中的至少一种:
基因表达优化:例如密码子优化、转录调控因子优化、启动子优化、融合蛋白优化等。密码子优化(包括鉴定多种生物的最佳密码子,以及实现密码子优化的方法)是本领域普通技术人员熟知的,而且可使用标准方法来完成。转录调控因子ORCA3基因是一个受MeJA诱导的调控植物基础和次生代谢的转录调控因子。基因表达的优化也可通过选择合适的启动子和核糖体结合位点来实现。在一些实施方案中,这可包括选择高拷贝数的质粒,或者低或中等拷贝数的质粒。也可以靶向转录终止的步骤来调节基因表达,这通过引入或消除诸如茎环的结构来实现。
代谢工程优化:例如通过克服限速步骤、减少流向竞争途径的代谢流、降低分解代谢、以及过量表达调节基因等一些通过代谢工程来增加次级代谢物产量的方法;
调节因子优化:添加MeJA及其类似物、水杨酸、花生四烯酸、冠菌素等调节生物合成;
培养方法优化:例如改善培养基、调节培养温度时间等环境因素、优化培养流程、组合培养等;例如Zhou K等给出了大肠杆菌和酵母共培养的培养实例(Zhou,K.,Qiao,K.,Edgar,S.,and Stephanopoulos,G.(2015).Distributing a metabolic pathway among amicrobial consortium enhances production of natural products.NAT BIOTECHNOL33,377-383.)。
在本发明实施方式中,紫杉烷类化合物包括但不限于紫杉醇及其衍生物、紫杉素及其衍生物、多西他赛及其衍生物、卡巴他赛及其衍生物中的至少一种。
在本发明实施方式中,紫杉烷类化合物中间体包括但不限于β-苯丙氨酰巴卡亭III(β-phenylalanoyl baccatin III)、3’-氮-脱苯甲酰基紫杉醇(3′-N-debenzoyltaxol)。
第九方面,本发明提供了一种植物或其植物部分,植物为如下植物之一:
(g1)上述植物细胞生长形成的植物;
(g2)采用上述在植物中产生生物酶组合物的方法生产获得的植物;
(g3)所述(g1)-(g2)中任一植物自交所形成的后代,以及后代生长形成的植物;
(g4)所述(g1)-(g2)中任一植物与其它品种杂交所形成的后代,以及后代生长形成的植物;
上述植物部分为根、茎、叶、花、果实、花粉或种子。
第十方面,本发明提供了一种植物或其植物部分,植物包括含有上述核酸分子组合物的转基因植物。
第十一方面,本发明还提供了植物或其植物部分的制备方法,该制备方法包括组织培养和/或诱导培养的步骤。
第十二方面,本发明还提供了一种制造商业产品的方法,其包括获得第九和第十方面中任一项所述的植物或其植物部分,及由所述植物或其植物部分制造所述商业产品,其中所述商业产品是选自由以下组成的群组:含有巴卡亭III及其衍生物、紫杉醇及其衍生物、紫杉素及其衍生物、多西他赛及其衍生物、卡巴他赛及其衍生物中的至少一种的粗提物、原料药和/或药品制剂。
第十三方面,本发明还提供第六、第八和第十二方面中任一项方法生产获得的产品,其中所述产品含有以下成分:巴卡亭III及其衍生物、紫杉醇及其衍生物、紫杉素及其衍生物、多西他赛及其衍生物、卡巴他赛及其衍生物中的至少一种。
与现有技术相比,本发明具有的有益效果为:
本申请成功鉴定了巴卡亭III合成的两个必需基因——紫杉烷C4-C20氧杂环丁烷形成酶的基因(TOT)和紫杉烷9α羟基化酶的基因(T9αH)。其中,TOT具有前人推测的C4-C20环氧酶(C4β,C20-epoxidase,EPOX)和环氧变位酶(Oxomutase,OXM)两个酶的作用,能够催化紫杉烷类分子的碳碳双键氧化为氧杂环丁烷和氧杂环丙烷。
进一步地,本申请将TOT、T9αH这两个新基因和参与巴卡亭III生物合成的其他已知基因(TS、T5αH、T13αH、T2αH、T7βH、TAT和TBT)共表达,惊喜地发现,9个基因即能够成功重建巴卡亭III在烟草中从GGPP到巴卡亭III的生物合成途径。结果表明,这9种酶是从GGPP到巴卡亭III生物合成的核心成分,包括紫杉二烯合成酶(TS)、2种酰基转移酶和6种CYP450酶。前人推测的C9氧化酶(T9αO)、C1羟化酶(T1βH)可能由本申请基因组合中的其他酶代为行使功能。本申请的研究结果揭示了一种前所未有的氧化重排反应机制,鉴定了巴卡亭III生物合成途径的核心成分,构建了巴卡亭III人工合成线路。
进一步地,现有技术中一直被认为是巴卡亭III生物合成的必要基因T10βH、10-去乙酰巴卡亭III-10-β-O-乙酰转移酶(DBAT),在本申请巴卡亭III生物合成方法中,在没有这两种酶的情况下,巴卡亭III仍然能够被合成。本发明研究表明,T10βH和DBAT并不是必要的,可能也由本申请基因组合中的其他酶代为行使功能。
更进一步地,通过成功构建烟草中巴卡亭III的完整生物合成途径,揭示了紫杉醇生物合成中新的酶学机制,填补了其完整的生物合成途径的关键空白,为通过合成生物学高效开发紫杉醇等紫杉烷类产品绿色低碳生产途径开辟了道路。
具体实施方式
本发明公开了一种生物全合成紫杉醇关键前体物质巴卡亭III的方法、生物材料及应用,本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明的方法及应用已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的方法和应用进行改动或适当变更与组合,来实现和应用本发明技术。
术语解释:
本发明中,术语“生物酶”或“酶”为具有生物活性的蛋白质(或“多肽”或“肽组合物”),既包括天然存在的蛋白质,又包括其变体及修饰形式。本文所用的术语“蛋白质”和“多肽”可互换使用,因此术语多肽可用于指全长多肽,也可用于指全长多肽的一个片段。术语“片段”指多肽序列的一部分。“片段”或“生物学活性部分”包括包含足够数目的邻接氨基酸残基以保留生物学活性的多肽,例如N-端的氨基酸被截短的多肽。
“变体”意指基本上相似的序列。如本领域技术人员容易理解的,天然存在的蛋白质在相同属的不同种或者相同种的不同样本之间可能存在一些差异,可能是一个或多个内部位点处一个或多个氨基酸的缺失和/或添加和/或在天然多肽的一个或多个位点处一个或多个氨基酸的取代。但这并不影响其发挥相同或相似的作用,这些蛋白质可以称为示例性蛋白质的天然变体。蛋白质的修饰形式包括但不限于不影响目标蛋白的生物活性的适当氨基酸取代/添加/缺失、N-端的氨基酸被截短、适用于宿主细胞偏好的密码子优化、标签的添加、融合等。这些蛋白质可以称为示例性蛋白质的人工变体。对于不影响目标蛋白的生物活性的适当氨基酸取代的指导,可见于Dayhoff等(1978)Atlas of Protein SequenceandStructure(蛋白质序列和结构图册)(Natl.Biomed.Res.Found.,Washington,D.C.)的模型,通过引用结合到本文中。诸如将一个氨基酸取代成具有类似特性的另一个氨基酸的保守取代,可以是最优的。
本发明中,术语“氨基酸”是指任何氨基酸(标准和非标准氨基酸二者),包括但不限于α-氨基酸、β-氨基酸、γ-氨基酸和δ-氨基酸。适合的氨基酸的实例包括但不限于丙氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、脯氨酸、丝氨酸、酪氨酸、精氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯基丙氨酸、苏氨酸、色氨酸和缬氨酸。
本发明中,术语“紫杉二烯合成酶”是指催化GGPP环化生成紫杉二烯(taxa-4(5),11(12)-diene)的酶,其示例氨基酸序列或核苷酸序列如表1所示,本领域技术人员通过数据库或文献报道也可以获知其他具有相同功能的氨基酸序列或核苷酸序列。该酶促反应生成了紫杉烷类化合物独特的骨架结构,因此该酶被认为是决定前体复合物是否能够合成紫杉醇的关键酶。在本发明中,术语“TS”可以表示紫杉二烯合成酶,或紫杉二烯合成酶基因,或编码紫杉二烯合成酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。专利CN202010647327.3中的相关内容通过参考整体并入本文。
本发明中,术语“紫杉烷5α羟基化酶”是指催化紫杉烷骨架C5位的羟基化的酶,其示例氨基酸序列或核苷酸序列如表1所示,本领域技术人员通过数据库或文献报道也可以获知其他具有相同功能的氨基酸序列或核苷酸序列。在本发明中,术语“T5αH”可以表示紫杉烷5α羟基化酶,或紫杉烷5α羟基化酶基因,或编码紫杉烷5α羟基化酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。
本发明中,术语“紫杉烷13α羟基化酶”是指催化紫杉烷骨架C13位的羟基化的酶,其示例氨基酸序列或核苷酸序列如表1所示,本领域技术人员通过数据库或文献报道也可以获知其他具有相同功能的氨基酸序列或核苷酸序列。在本发明中,术语“T13αH”可以表示紫杉烷13α羟基化酶,或紫杉烷13α羟基化酶基因,或编码紫杉烷13α羟基化酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。
本发明中,术语“紫杉烷2α羟基化酶”是指催化紫杉骨架C2位的羟基化的酶,其示例氨基酸序列或核苷酸序列如表1所示,本领域技术人员通过数据库或文献报道也可以获知其他具有相同功能的氨基酸序列或核苷酸序列。在本发明中,术语“T2αH”可以表示紫杉烷2α羟基化酶,或紫杉烷2α羟基化酶基因,或编码紫杉烷2α羟基化酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。
本发明中,术语“紫杉烷7β羟基化酶”是指催化紫杉烷骨架C7位的羟基化的酶,其示例氨基酸序列或核苷酸序列如表1所示,本领域技术人员通过数据库或文献报道也可以获知其他具有相同功能的氨基酸序列或核苷酸序列。在本发明中,术语“T7βH”可以表示紫杉烷7β羟基化酶,或紫杉烷7β羟基化酶基因,或编码紫杉烷7β羟基化酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。
本发明中,术语“紫杉烷5α乙酰基转移酶”是指催化紫杉烷C5位氧化产物的乙酰化的酶,其示例氨基酸序列或核苷酸序列如表1所示,其也可以同时具有催化紫杉烷C10位氧化产物的乙酰化的功能,本领域技术人员通过数据库或文献报道也可以获知其他具有相同功能的氨基酸序列或核苷酸序列。在本发明中,术语“TAT”可以表示紫杉烷5α乙酰基转移酶,或紫杉烷5α乙酰基转移酶基因,或编码紫杉烷5α乙酰基转移酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。
本发明中,术语“紫杉烷2α-氧-苯甲酰基转移酶”是指催化紫杉烷C2位氧化产物的苯甲酰基化的酶,其示例氨基酸序列或核苷酸序列如表1所示,本领域技术人员通过数据库或文献报道也可以获知其他具有相同功能的氨基酸序列或核苷酸序列。在本发明中,术语“TBT”可以表示紫杉烷2α-氧-苯甲酰基转移酶,或紫杉烷2α-氧-苯甲酰基转移酶基因,或编码紫杉烷2α-氧-苯甲酰基转移酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。
本发明中,术语“紫杉烷9α羟基化酶”是指催化紫杉烷骨架C9位的羟基化的酶,根据本发明实验结果分析,其也可以同时具有催化紫杉烷环骨架C9位羰基化的功能,其示例氨基酸序列或核苷酸序列如表1所示。在本发明中,术语“T9αH”可以表示紫杉烷9α羟基化酶,或紫杉烷9α羟基化酶,或编码紫杉烷9α羟基化酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。专利CN202310961179.6中的相关内容通过参考整体并入本文。
本发明中,术语“紫杉烷C4-C20氧杂环丁烷形成酶”是指催化紫杉烷类分子的碳碳双键氧化为氧杂环丁烷和氧杂环丙烷的酶,如催化紫杉二烯-六醇-六乙酸酯生成1-去羟基巴卡亭IV和巴卡亭I,其示例氨基酸序列或核苷酸序列如表1所示。在本发明中,术语“TOT”可以表示紫杉烷C4-C20氧杂环丁烷形成酶,或紫杉烷C4-C20氧杂环丁烷形成酶基因,或编码紫杉烷C4-C20氧杂环丁烷形成酶的核苷酸分子或序列,具体所指的含义可以结合上下文判断。专利CN202310496624.6中的相关内容通过参考整体并入本文。
在一些实施方案中,本发明相关的生物酶可从来自任何来源的包含给定生物酶的材料中分离出来。任何获得发明相关的生物酶的方法都是与本发明相容的。
本发明中,术语“分离”是指已从其自然环境中移除,或从首次形成化合物时存在的其他化合物中移除。术语“分离的”包括从天然来源分离的材料以及通过在宿主细胞中重组表达制备后回收的材料(如核酸和蛋白质),或化学合成的化合物,如核酸分子、蛋白质和肽。
本发明中,术语“核酸分子”(或“核酸”或“多核苷酸”)可以指核苷酸的聚合形式,其可以包括RNA、cDNA、基因组DNA的有义和反义链,以及上述的合成形式和混合聚合物。核苷酸可以指核糖核苷酸、脱氧核糖核苷酸或任一类型核苷酸的修饰形式。本文中使用的“核酸分子”与“核酸”和“多核苷酸”同义。一个核酸分子的长度通常至少有10个碱基,除非另有说明。该术语可以指长度不确定的RNA或DNA分子。这个术语包括单链和双链形式的DNA。核酸分子可以包括通过天然存在和/或非天然存在的核苷酸连接连接在一起的天然存在和修饰的核苷酸中的一种或两者。
如本领域技术人员容易理解的,对于核苷酸序列,可以使用众所周知的分子生物学技术,例如本文概述的聚合酶链式反应(PCR)和杂交技术来鉴定天然存在的变体,即基本相似的序列。
如本领域技术人员容易理解的,核酸分子可以被化学或生物化学修饰,或者可以包含非天然或衍生的核苷酸碱基这种修饰包括例如标记、甲基化、用类似物取代一种或多种天然存在的核苷酸、核苷酸间修饰(例如,不带电荷的键:例如膦酸甲酯、磷酸三酯、亚磷酰胺、氨基甲酸酯等;带电荷的键:例如硫代磷酸酯、二硫代磷酸酯等;悬垂部分:例如肽;嵌入剂:例如吖啶、补骨脂素等。螯合剂;烷基化剂;和修饰的键:例如α异头核酸等。),术语“核酸分子”也包括任何拓扑构象,包括单链、双链、部分双链、三链、发夹、环状和挂锁构象。
本发明中,术语“同一性”指与天然核酸序列或氨基酸序列的序列相似性。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
除非另有说明,否则本文提供的序列同一性值是指使用本发明的全长序列通过Jalview 2.11.2.7版(Waterhouse,A.M.,Procter,J.B.,Martin,D.M.A,Clamp,M.andBarton,G.J.(2009)"Jalview Version 2-a multiple sequence alignment editor andanalysis workbench"Bioinformatics 25(9)1189-1191doi:10.1093/bioinformatics/btp033)使用多重比对软件包MUSCLE v3.8.31版("MUSCLE:multiple sequence alignmentwith high accuracy and high throughput"Nucleic Acids Res.32(5):1792(2004))中的默认参数;或其任何等同程序)获得的值。
另外的数学算法是本领域中已知的并且可以用于比对两个序列。参见例如Karlinand Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264的算法,如Karlin andAltschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877中改动。这种算法被引入Altschul et al.(1990)J.Mol.Biol.215:403的BLAST程序内。可以用BLASTN程序(针对核苷酸序列搜索的核苷酸查询)执行BLAST核苷酸搜索,以获得与本发明的核酸分子同源的核苷酸序列,或用BLASTX程序(针对蛋白质序列搜索的翻译核苷酸查询),以获得与本发明的核酸分子同源的蛋白质序列。可以用BLASTP程序(针对蛋白质序列搜索的蛋白质查询)执行BLAST蛋白质搜索,以获得与本发明的蛋白质分子同源的氨基酸序列,或用TBLASTN程序(针对翻译的核苷酸序列搜索的蛋白质查询),以获得与本发明的蛋白质分子同源的核苷酸序列。为了获得用于比较目的的缺口比对,Gapped BLAST(在BLAST2.0中)可以如Altschul etal.(1997)Nucleic Acids Res.25:3389中所述利用。可替代地,PSI-Blast可以用于执行迭代搜索,其检测分子之间的遥远关系。参见Altschul et al.(1997)supra。当利用BLAST、Gapped BLAST和PSI-Blast程序时,可以使用相应程序(例如BLASTX和BLASTN)的默认参数。比对也可以通过检查手动执行。
本发明中,术语“同源性”有时用于指两个或多个核酸或氨基酸序列之间以位置同一性百分比表示的相似性水平(即序列相似性或同一性)。同源性也指进化相关性的概念,通常由共享相似序列的不同核酸或蛋白质之间相似的功能特性来证明。
在一些实施方案中,本发明相关的同源性序列可以通过示例性序列在进化关系相近的物种样本基因组或转录组数据中比对得到。例如在相同属的不同种之间、相同种的不同株之间,通过示例性序列在样本基因组或转录组数据中经比对得到该序列的同源序列,本领域技术人员可以预期其具有相同或相似的功能。
在一些实施方案中,本发明相关的核酸分子可从来自任何来源的包含给定核酸分子的DNA中克隆出来,例如通过PCR扩增和/或限制性酶切。在一些实施方案中,本发明相关的核酸分子是合成的。任何获得发明相关的核酸分子的方法都是与本发明相容的。
本发明中,术语“合成的”是指通过作为体外过程的化学合成产生的多核苷酸(即DNA或RNA)分子。例如,可以在EppendorfTM管内的反应过程中产生合成DNA,使得合成DNA由天然DNA或RNA链酶促产生。可以利用其他实验室方法来合成多核苷酸序列。寡核苷酸可以通过使用亚磷酰胺的固相合成在寡核苷酸合成器上化学合成。合成的寡核苷酸可以作为复合物彼此退火,从而产生“合成的”多核苷酸。用于化学合成多核苷酸的其他方法在本领域是已知的,并且可以容易地实施用于本公开。
本发明中,术语“基因”是指表达特定蛋白质的核酸片段。“基因”包括编码基因产物的DNA区域,以及调节基因产物产生的所有DNA区域,无论这种调节序列是否与编码和/或转录序列相邻。因此,基因包括但不一定限于启动子序列、终止子、翻译调节序列如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘体、边界元件、复制起点、基质附着位点、内含子和基因座控制区。
本发明中,术语“基因产物”是指基因产生的任何产物。例如,基因产物可以是基因的直接转录产物(如mRNA、tRNA、rRNA、反义RNA、干扰RNA、核糖酶、结构RNA或任何其他类型的RNA),也可以是由mRNA翻译产生的蛋白质。
本发明中,术语“表达盒”是指可以在特定限制性位点或通过同源重组插入核酸或多核苷酸的DNA片段。如本文所用,DNA片段包含编码目的多肽的多核苷酸,并且表达盒和限制性位点被设计成确保表达盒插入到用于转录和翻译的适当阅读框中。在一个实施方案中,表达盒可以包括编码目的多肽的多核苷酸,并且除了多核苷酸之外还具有促进特定宿主细胞转化的元件。在一个实施方案中,表达盒还可以包括允许在宿主细胞中增强编码目的多肽的多核苷酸表达的元件。这些元件可以包括但不限于:启动子、最小启动子、增强子、应答元件、终止子序列、聚腺苷酸化序列等。
表达盒还可以包含用于选择转化细胞的选择标记基因。选择标记基因用于选择转化的细胞或组织。标记基因包括编码抗生素抗性的基因,诸如编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草化合物(诸如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸酯(2,4-d))抗性的基因。另外的选择标记包括表型标记诸如β-半乳糖苷酶和荧光蛋白,诸如绿色荧光蛋白(GFP)、青色荧光蛋白(CYP)以及黄色荧光蛋白。
本发明中,术语“载体”与“构建体”、“克隆载体”和“表达载体”可互换使用,并且意味着可以将DNA或RNA序列(例如外源基因)引入宿主细胞以转化宿主并促进所引入序列的表达(例如转录和翻译)的载体。“非病毒载体”是指不包含病毒或逆转录病毒的任何载体。在一些实施方案中,“载体”是包含至少一个DNA复制起点和至少一个选择性标记基因的DNA序列。例子包括但不限于携带外源DNA进入细胞的质粒、粘粒、噬菌体、细菌人工染色体(BAC)或病毒。载体还可以包括一个或多个基因、反义分子和/或选择性标记基因和本领域已知的其他遗传元件载体可以转导、转化或感染细胞,从而导致细胞表达由载体编码的核酸分子和/或蛋白质。术语“质粒”是指能够在原核或真核宿主细胞中进行常染色体复制的核酸环状链。该术语包括核酸,其可以是DNA或RNA,并且可以是单链或双链的。该定义的质粒也可以包括对应于细菌复制起点的序列。
在一些实施方案中,“克隆载体”能自主复制或整合在宿主细胞基因组中,其还以一个或更多个限制性内切酶位点为特征,可以在该位点以确定的方式切割载体并可将期望的DNA序列连接到载体中,从而新的重组质粒保留了它在宿主细胞中复制的能力。在质粒的情况下,期望序列的复制可随着质粒在宿主细胞(如细菌宿主)中的拷贝数增加而多次发生,或仅在宿主通过有丝分裂繁殖前在每个宿主中发生一次。在噬菌体的情况下,复制可在裂解期过程中主动发生或在溶原期过程中被动发生。
在一些实施方案中,“表达载体”可通过限制性酶切和连接将期望的DNA序列插入其中,以使其与调控序列有效连接中并可表达为RNA转录本。载体还可包含适合用于鉴定细胞是否已被载体转化或转染的一种或更多种标记序列。标记包括如编码提高或降低其对抗生素或其他化合物之抗性或敏感性的蛋白质的基因,编码可通过本领域已知标准方法检测活性的酶的基因(例如β-半乳糖苷酶、萤光素酶或碱性磷酸酶),以及对转化或转染细胞、宿主、菌落或菌斑的表型有可见影响的基因(例如绿色荧光蛋白)。优选的载体是那些能够自主复制和表达与其有效连接的DNA片段中所存在的结构基因之产物的载体。
在本发明中,术语“表达”是指基因产物的生物合成,包括所述基因产物的转录和/或翻译。从DNA分子“表达”或“产生”蛋白质或多肽是指转录和翻译编码序列以产生蛋白质或多肽,而从RNA分子“表达”或“产生”蛋白质或多肽是指翻译RNA编码序列以产生蛋白质或多肽。
基因表达可受外部信号的影响,例如,细胞、组织或生物体暴露于一种可增加或减少基因表达的物质。基因的表达也可以在从DNA到RNA再到蛋白质的过程中的任何地方受到调控。基因表达的调控可通过对转录、翻译、RNA转运和加工、中间分子(如mRNA)降解的控制,或通过特定蛋白质分子生成后的激活、失活、区隔或降解,或通过它们的组合来实现。基因表达所需调控序列的确切性质在物种或细胞类型之间可能会有所不同,但一般按需要应包括,分别涉及转录和翻译起始的5′非转录和5′非翻译序列,例如TATA盒、加帽序列、CAAT序列等等。尤其是,这种5′非转录调控序列将包括启动子区域,其包括控制对有效连接的基因进行转录控制的启动子序列。调控序列也可包括增强子序列或所需的上游激活子序列。本发明载体可任选地包括5′前导或信号序列。合适载体的选择和设计是在本领域普通技术人员的能力和判断范围内的。
在一些实施方案中,当编码本发明任何酶的核酸分子在细胞中表达时,多种转录控制序列(例如启动子/增强子序列)可用于指导其表达。启动子可是天然的启动子,即基因的启动子在其内源环境中,这提供了基因表达的正常调节。在一些实施方案中,启动子可是组成型的,即启动子持续转录其相关基因而不受调节。也可用多种条件启动子,例如由分子的存在与否控制的启动子。化学物质调控的启动子可用于通过应用外源化学调节剂调节宿主中基因的表达。取决于目的,启动子可以是化学物质诱导型启动子,其中化学物质的应用诱导基因表达,或是化学物质阻遏型启动子,其中化学物质的应用阻遏基因表达。化学物质诱导型启动子是本领域已知的,包括但不限于玉米In2-2启动子(其由苯磺酰胺除草剂安全剂激活)、玉米GST启动子(其被用作萌发前除草剂的疏水性亲电子化合物激活)以及烟草PR-1a启动子(其被水杨酸活化)。其他感兴趣的化学物质调控的启动子包括类固醇反应性启动子中的糖皮质激素诱导型启动子以及四环素诱导型和四环素阻遏型启动子。
包含所有必需表达元件的表达载体是市售的,而且是本领域技术人员熟知的。例如见Sambrook等,Molecular Cloning:A Laboratory Manual,第二版,Cold SpringHarbor Laboratory Press,1989。通过将外源性DNA(RNA)导入细胞而对细胞进行遗传工程。该外源性DNA(RNA)被置于转录元件的有效控制下,以允许外源性DNA在宿主细胞中表达。
本发明中,术语“转化”包括可将核酸分子引入这种细胞的所有技术。例子包括但不限于:用病毒载体转染;质粒载体转化;电穿孔;脂肪感染;显微注射;农杆菌介导的转移;直接DNA摄取;WHISKERSTM介导的转化;和微射弹轰击。这些技术可用于宿主细胞的稳定转化和瞬时转化。“稳定转化”是指将核酸片段引入宿主生物的基因组,导致遗传稳定。一旦稳定转化,核酸片段就稳定地整合到宿主生物和任何后续世代的基因组中。含有转化核酸片段的宿主生物被称为“转基因”生物。“瞬时转化”是指将核酸片段引入宿主生物的细胞核或含DNA的细胞器,导致基因表达而没有遗传稳定的遗传。
在一些实施方案中,为了转化宿主和宿主细胞,可以使用标准技术将本发明的核苷酸序列插入本领域已知的适合于在宿主或宿主细胞中表达核苷酸序列的任何载体中。载体的选择取决于优选的转化技术和待转化的目标宿主物种。转化方法取决于待转化的宿主细胞、所用载体的稳定性、基因产物的表达水平和其他参数。
本发明中,术语“植物”包括种子、植物细胞、植物原生质体、可从其再生植物的植物细胞组织培养物、植物愈伤组织、植物块以及在植物或植物部分诸如胚胎、花粉、胚珠、种子、块茎、繁殖体、叶、花、分枝、果实、根、根尖、花药等中是完整的植物细胞。再生植物的后代、变体和突变体也包括在本发明的范围内,条件是这些部分包含引入的多核苷酸。如本文中所用,除非另有明确说明或从使用的背景中显而易见,否则“后代”和“后代植物”包括植物的任何后续世代,无论是由有性生殖和/或无性繁殖产生的。
术语“转基因植物”和“转化植物”是指如上所述的“植物”的等同术语,其中植物包含通过例如本文其他地方公开的或另外地本领域已知的任何稳定和瞬时转化方法引入植物的异源核酸分子、异源多核苷酸或异源多核苷酸构建体。此类转基因植物和转化植物还指例如首先引入异源核酸分子、异源多核苷酸或异源多核苷酸构建体的植物以及包含所述异源核酸分子、异源多核苷酸或异源多核苷酸构建体的任何其后代植物。
本发明中,术语“DNA”或“RNA”的使用无意将本发明限制于包含DNA或RNA的多核苷酸分子。本领域普通技术人员将认识到,本发明的方法和组合物包括由脱氧核糖核苷酸(即DNA)、核糖核苷酸(即RNA)或核糖核苷酸和脱氧核糖核苷酸的组合组成的多核苷酸分子。此类脱氧核糖核苷酸和核糖核苷酸包括天然存在的分子和合成类似物,包括但不限于核苷酸类似物或经修饰的骨架残基或键联,其是合成的、天然存在的和非天然存在的,其具有与参考核酸相似的结合特性,并且其以与参考核苷酸相似的方式代谢。此类类似物的实例包括但不限于硫代磷酸酯、氨基磷酸酯、甲基膦酸酯、手性-甲基膦酸酯、2-O-甲基核糖核苷酸、肽-核酸(PNA)。本发明的多核苷酸分子还包括所有形式的多核苷酸分子,包括但不限于单链形式、双链形式、发夹、茎环结构等。此外,本领域普通技术人员应理解,本文公开的核苷酸序列还包括该示例性核苷酸序列的互补序列。
本发明中,所述的“严格条件”可为低严格条件、中严格条件、高严格条件中的任一种。“低严格条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、32℃的条件。“中严格条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、42℃的条件。“高严格条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、50℃的条件。在上述条件中,越提高温度,越能期待高效地获得具有高同源性的DNA。影响杂交严格性的因素可为温度、探针浓度、探针长度、离子强度、时间、盐浓度等多种因素,本领域技术人员通过适宜选择这些因素,可实现同样的严格条件。
表1中英文对照表
/>
注:表1中的已鉴定基因的蛋白序列编号均来源于Uniprot。
表2 T9αH生物酶的氨基酸序列相似度
生物酶名称 |
序列编号 |
与T9αH1的相似度 |
T9αH1(或T9H1) |
1 |
100% |
T9αH2(或T9H2) |
2 |
83.86% |
T9αH3(或T9H3) |
3 |
67.27% |
T9αH4(或T9H4) |
4 |
99.60% |
T9αH5(或T9H5) |
5 |
67.47% |
T9αH6(或T9H6) |
6 |
99.60% |
T9αH7(或T9H7) |
7 |
67.66% |
T9αH8(或T9H8) |
8 |
99.00% |
T9αH9(或T9H9) |
9 |
67.27% |
T9αH10(或T9H10) |
10 |
65.67% |
T9αH11(或T9H11) |
11 |
65.07% |
T9αH12(或T9H12) |
12 |
99.00% |
T9αH13(或T9H13) |
13 |
63.75% |
T9αH14(或T9H14) |
14 |
63.15% |
表3 T9αH生物酶的核苷酸序列相似度
基因名称 |
序列编号 |
与T9αH1的相似度 |
T9αH1(或T9H1) |
15 |
100% |
T9αH2(或T9H2) |
16 |
88.47% |
T9αH3(或T9H3) |
17 |
77.54% |
T9αH4(或T9H4) |
18 |
99.80% |
T9αH5(或T9H5) |
19 |
77.71% |
T9αH6(或T9H6) |
20 |
99.34% |
T9αH7(或T9H7) |
21 |
77.86% |
T9αH8(或T9H8) |
22 |
99.34% |
T9αH9(或T9H9) |
23 |
77.64% |
T9αH10(或T9H10) |
24 |
75.84% |
T9αH11(或T9H11) |
25 |
75.83% |
T9αH12(或T9H12) |
26 |
99.14% |
T9αH13(或T9H13) |
27 |
75.48% |
T9αH14(或T9H14) |
28 |
75.83% |
表4 TOT生物酶的氨基酸序列相似度
生物酶名称 |
序列编号 |
与TOT1的相似度 |
TOT1 |
29 |
100% |
TOT2 |
30 |
94.08% |
TOT3 |
31 |
96.45% |
TOT4 |
32 |
95.46% |
TOT5 |
33 |
94.78% |
TOT6 |
34 |
93.69% |
TOT7 |
35 |
93.89% |
TOT8 |
36 |
94.38% |
TOT9 |
37 |
94.18% |
TOT10 |
38 |
93.89% |
TOT11 |
39 |
94.38% |
TOT12 |
40 |
96.59% |
TOT13 |
41 |
93.78% |
TOT14 |
42 |
97.44% |
TOT15 |
43 |
95.07% |
TOT16 |
44 |
97.39% |
TOT17 |
45 |
94.98% |
TOT18 |
46 |
94.28% |
TOT19 |
47 |
67.47% |
TOT20 |
48 |
94.18% |
TOT21 |
49 |
97.44% |
TOT22 |
50 |
97.39% |
TOT23 |
51 |
93.49% |
TOT24 |
52 |
63.64% |
表5 TOT生物酶的核苷酸序列相似度
生物酶名称 |
序列编号 |
与TOT1的相似度 |
TOT1 |
53 |
100% |
TOT2 |
54 |
96.21% |
TOT3 |
55 |
97.84% |
TOT4 |
56 |
97.06% |
TOT5 |
57 |
96.73% |
TOT6 |
58 |
96.14% |
TOT7 |
59 |
96.14% |
TOT8 |
60 |
96.73% |
TOT9 |
61 |
96.60% |
TOT10 |
62 |
96.08% |
TOT11 |
63 |
96.46% |
TOT12 |
64 |
97.87% |
TOT13 |
65 |
96.01% |
TOT14 |
66 |
98.10% |
TOT15 |
67 |
96.66% |
TOT16 |
68 |
98.07% |
TOT17 |
69 |
96.60% |
TOT18 |
70 |
96.14% |
TOT19 |
71 |
77.56% |
TOT20 |
72 |
96.07% |
TOT21 |
73 |
98.30% |
TOT22 |
74 |
98.27% |
TOT23 |
75 |
96.08% |
TOT24 |
76 |
74.85% |
表6氨基酸以及英文名、英文缩写
中文名 |
英文名 |
三字母缩写 |
单字母缩写 |
甘氨酸 |
Glycine |
Gly |
G |
丙氨酸 |
Alanine |
Ala |
A |
缬氨酸 |
Valine |
Val |
V |
亮氨酸 |
Leucine |
Leu |
L |
异亮氨酸 |
Isoleucine |
Ile |
I |
脯氨酸 |
Proline |
Pro |
P |
苯丙氨酸 |
Phenylalanine |
Phe |
F |
酪氨酸 |
Tyrosine |
Tyr |
Y |
色氨酸 |
Tryptophan |
Trp |
W |
丝氨酸 |
Serine |
Ser |
S |
苏氨酸 |
Threonine |
Thr |
T |
半胱氨酸 |
Cystine |
Cys |
C |
蛋氨酸 |
Methionine |
Met |
M |
天冬酰胺 |
Asparagine |
Asn |
N |
谷氨酰胺 |
Glutarnine |
Gln |
Q |
天冬氨酸 |
Asparticacid |
Asp |
D |
谷氨酸 |
Glutamicacid |
Glu |
E |
赖氨酸 |
Lysine |
Lys |
K |
精氨酸 |
Arginine |
Arg |
R |
组氨酸 |
Histidine |
His |
H |
本发明中所用试剂、仪器或生物材料等均可通过商业渠道获得。
下面结合实施例,进一步阐述本发明:
实施例1.紫杉烷紫杉烷9α羟基化酶T9αH基因的克隆
1.cDNA获取
南方红豆杉为实验室保存,采集幼嫩叶片后,立即置于液氮中速冻,取部分样品,利用研钵研磨,取100mg加入1.5mL离心管中,加入裂解液,抽提RNA(Plant Total RNAIsolation Kit Plus,FOREGENE,China)。利用逆转录试剂盒(HiScript III 1st StrandcDNA Synthesis Kit,Vazyme,China)将mRNA逆转录为cDNA。
2.紫杉烷紫杉烷9α羟基化酶T9αH的克隆
对南方红豆杉基因组进行分析,T9αH读码框氨基酸序列和核苷酸序列分别为SEQID NO:1(其同源序列见序列表中SEQ ID NO:2~14)和SEQ ID NO:15(其同源序列见序列表中SEQ ID NO:16~28)所示序列。
T9αH读码框氨基酸序列(SEQ ID NO:1):
MDSLSFLKSMEAKFGQVIHRDQSSSTALLSLAFTAALAIFLVLLFRFKSRPSTNFPPGNFGFPFIGETIQFLRALRSESPHMFFDERLKKFGRVFKTSLTGHPTAVFCGPAGNRFIYSNEHKLVQSSGPNSFVKLVGQQSIVTKTGEEHRIFRGVLNEFLGPHALQSYTPKMSSKIQENINKHWKGKDEVNMLPSIRQLVFSISSSLFFDINDEDQQEQLKTLLETILVGTLSVPLDIPGSNFRKALRARSKLDEILSRLIESRRKDMRSGIASTSKNLLSVLLAFKDERGNPLTDTEILDNFSFMLHASYDTTVSPTVCIFKLLSANPECYEKVVQEQLGILGNKKDGEEICWNDLKAMKYTWQAAQETMRLFPPAFGSFRKVIADIHHDGYIIPKGWKAMVTNYSTSRKEEYFDEPDKFKPSRFGDGKYVAPYTFLPFGAGIRICPGWEFAKLEMLLFIHHFVKNFSGYLPLDTKEKISGDPFPPLPKNGFPIKLFPRT
T9αH读码框核苷酸序列(SEQ ID NO:15):
ATGGATTCCTTAAGTTTTCTAAAAAGCATGGAAGCGAAATTCGGCCAAGTCATACACCGGGATCAGTCTTCCAGTACTGCTCTTCTGTCCCTCGCATTCACAGCTGCTCTTGCCATTTTTCTTGTGTTGCTCTTTCGATTTAAAAGCCGGCCCTCTACTAATTTCCCTCCAGGAAATTTTGGCTTCCCTTTCATTGGAGAGACGATACAGTTCTTGCGGGCACTTCGATCAGAATCGCCTCATATGTTTTTTGATGAGAGATTGAAGAAATTTGGGCGTGTATTCAAGACGTCATTAACTGGGCATCCCACAGCTGTGTTCTGCGGGCCTGCGGGAAACCGGTTTATTTACTCGAATGAGCACAAGCTGGTGCAGTCGTCTGGGCCCAACTCCTTCGTCAAACTGGTTGGGCAGCAATCCATCGTGACCAAAACAGGAGAGGAGCACCGCATCTTTCGTGGTGTCCTGAACGAGTTTCTGGGGCCTCATGCCTTACAGAGTTATACGCCTAAAATGAGTTCCAAAATCCAGGAGAATATCAATAAGCATTGGAAGGGTAAAGATGAAGTGAACATGCTTCCTTCGATAAGACAGCTCGTCTTCTCCATTTCAAGCAGCTTGTTTTTTGATATTAATGATGAGGATCAACAGGAACAACTTAAAACTCTTTTAGAAACTATTCTTGTTGGAACTTTGTCGGTTCCCCTCGACATTCCAGGATCTAATTTTCGTAAAGCTCTTCGGGCGCGTTCCAAGCTGGATGAAATTCTGTCTCGTTTAATCGAAAGCAGAAGAAAAGATATGCGTTCTGGGATAGCTTCTACCAGTAAAAATCTACTGTCGGTGCTGCTCGCCTTCAAAGATGAAAGAGGGAATCCATTGACGGACACGGAGATCCTCGACAACTTTTCTTTTATGCTTCACGCCTCATACGACACCACCGTTTCGCCCACGGTTTGTATATTTAAGCTGCTCTCCGCCAATCCAGAATGCTATGAAAAAGTAGTTCAAGAACAATTGGGAATACTTGGCAATAAAAAGGACGGTGAAGAAATCTGTTGGAACGATCTGAAAGCTATGAAATATACATGGCAAGCAGCTCAAGAAACAATGAGGCTTTTCCCTCCAGCGTTTGGATCATTTCGCAAGGTCATCGCCGATATTCATCATGATGGCTATATAATTCCCAAAGGATGGAAAGCTATGGTGACAAATTACAGTACAAGTAGGAAAGAAGAGTACTTCGATGAACCAGACAAATTCAAGCCTTCAAGATTTGGGGATGGAAAGTATGTGGCTCCGTACACGTTCTTACCTTTCGGGGCAGGAATACGCATATGCCCAGGATGGGAGTTCGCTAAGTTGGAGATGTTACTGTTCATCCATCATTTTGTCAAAAATTTCAGCGGATACCTCCCACTTGACACCAAGGAAAAGATTTCCGGAGATCCATTCCCTCCTCTCCCCAAAAATGGATTTCCCATTAAACTATTTCCCAGAACCTAA
以T9αH基因的核苷酸序列为依据,设计扩增T9αH基因的引物P1和P2,引物包含部分烟草表达载体pEAQ-HT的序列。以南方红豆杉叶片的cDNA为模板,采用PCR方法扩增T9αH基因,PCR目的产物经切胶回收后,与经RruI和XhoI双酶切的线性pEAQ-HT载体重组连接,采用ClonExpress一步克隆试剂盒(诺唯赞)克隆并测序,阳性重组质粒命名为pEAQ-HT-T9αH。
引物序列见下表。
表7引物序列
注:小写序列为载体序列,大写序列为T9αH特异引物序列。
实施例2.紫杉烷C4-C20氧杂环丁烷形成酶TOT基因的克隆
1.cDNA获取
南方红豆杉为实验室保存,采集幼嫩叶片后,立即置于液氮中速冻,取部分样品,利用研钵研磨,取100mg加入1.5mL离心管中,加入裂解液,抽提RNA(Plant Total RNAIsolation Kit Plus,FOREGENE,China)。利用逆转录试剂盒(HiScript III 1st StrandcDNA Synthesis Kit,Vazyme,China)将mRNA逆转录为cDNA。
2.紫杉烷C4-C20氧杂环丁烷形成酶TOT的克隆
对南方红豆杉基因组进行分析,TOT读码框氨基酸序列和核苷酸序列分别为SEQID NO:31(其同源序列见序列表中SEQ ID NO:29、30、32~52)和SEQ ID NO:55(其同源序列见序列表中SEQ ID NO:53、54、56~76)所示。
SEQ ID NO:31序列如下:
MVHVLHVVKMDRVREIFNGSSGSPAGIPHSVITAGVGAIIIILLSLLLLRRSSKRGDSSHPPGNSGLPFIGETLSFTKAFKSNTLAEFFEERVKKFGNVFKISIIGPPTVVMCGNEGNRFIFANEEKLMHLSWSGRYAKILGGESVSMKRGDDHRSVRAAFAGFLSSASLPVYISKMSAQIQDHINEKWKGKDVIAVVPLVKELVFNVSYNLFFSINDSEELHRLHKIFETIVEGHLSMPIDLPGFTFHRALQGRAKLKKVFSSLIERRRSDLSSGLASANQDLISVLLTYKDDRGYTMTHDELLDNFLSLLEGSYDSINSPMACIFKLLYDNPECYEKVVQEQLGILSGKKEGQEISWKDLRSMKYTWQVLQETLRLYTQVAGIFRKAMTDIHYDGHTIPKGWQLLWANQTTHLNDKYFSEPEKFMPSRFDEEGNNMIPYSFVPFGGGRRMCPGWEFGKMEILLFVHHFVKTFSGFTPIDPNEKITGNPFPHLPANGFLIKPILRS
SEQ ID NO:55序列如下:
ATGGTTCATGTGTTGCACGTAGTGAAAATGGATAGAGTTAGAGAAATATTTAATGGAAGTTCAGGTTCTCCAGCTGGTATTCCCCACAGTGTGATCACAGCCGGTGTGGGTGCCATAATAATAATTCTTCTGTCACTACTGCTCCTCCGCCGTTCTAGTAAACGGGGCGACTCCTCTCATCCTCCTGGGAATTCAGGCCTTCCATTCATTGGGGAGACATTATCATTCACCAAGGCTTTTAAATCGAACACGCTGGCCGAATTTTTTGAGGAGAGGGTGAAGAAATTCGGGAATGTATTTAAGATTTCAATAATCGGGCCTCCCACAGTGGTAATGTGCGGCAATGAGGGAAACCGGTTTATTTTCGCCAACGAGGAGAAGCTGATGCACCTGTCGTGGTCCGGTCGATATGCGAAAATCCTTGGTGGGGAATCCGTTTCCATGAAGAGGGGAGATGATCATCGCAGTGTACGTGCCGCATTCGCAGGGTTTTTGAGCTCTGCATCGCTGCCTGTTTACATAAGTAAAATGAGTGCACAGATCCAAGATCATATCAACGAAAAATGGAAAGGAAAAGATGTAATTGCTGTAGTTCCTCTGGTAAAGGAGCTCGTCTTCAACGTTTCCTACAACTTGTTTTTCAGCATAAATGATAGCGAGGAACTGCATCGATTGCATAAGATTTTCGAAACTATTGTGGAGGGACATCTTTCCATGCCGATAGACCTTCCCGGATTCACCTTTCATAGAGCACTTCAGGGAAGGGCGAAGCTCAAGAAAGTTTTCTCTTCTTTAATAGAAAGGAGAAGAAGCGATCTGAGCTCCGGATTGGCATCTGCTAATCAGGATCTCATTTCTGTTTTACTCACCTACAAAGATGATAGGGGGTATACAATGACCCACGACGAGCTCCTCGACAACTTTCTTTCCCTTCTTGAAGGCTCCTATGATTCCATCAATTCACCAATGGCCTGCATTTTTAAGCTTTTGTATGACAATCCAGAATGCTATGAAAAAGTAGTTCAAGAGCAATTGGGGATACTTTCTGGTAAGAAGGAAGGACAAGAAATCTCGTGGAAGGATCTGAGATCCATGAAATACACATGGCAAGTACTTCAGGAAACGCTACGACTGTATACTCAAGTTGCTGGAATATTTCGCAAAGCCATGACTGACATTCATTATGATGGTCACACCATTCCCAAAGGGTGGCAACTTCTTTGGGCAAACCAAACTACACATCTGAACGACAAATATTTCAGTGAGCCTGAAAAATTCATGCCTTCCAGATTCGATGAAGAAGGAAACAATATGATTCCTTACTCATTCGTACCATTTGGAGGAGGGCGGCGGATGTGTCCAGGTTGGGAATTCGGAAAGATGGAGATCTTACTCTTTGTCCATCACTTTGTTAAAACGTTCAGTGGCTTTACCCCAATTGATCCGAACGAAAAAATTACTGGGAATCCTTTTCCTCATCTCCCTGCCAATGGATTTCTAATAAAACCTATTCTCAGATCCTAA
以TOT基因的核苷酸序列为依据,设计扩增TOT基因的引物P3和P4,引物包含部分烟草表达载体pEAQ-HT的序列。以南方红豆杉叶片的cDNA为模板,采用PCR方法扩增TOT基因,PCR目的产物经切胶回收后,与经RruI和XhoI双酶切的线性pEAQ-HT载体重组连接,采用ClonExpress一步克隆试剂盒(诺唯赞)克隆并测序,阳性重组质粒命名为pEAQ-HT-TOT3。
其中引物序列见下表。
表8引物序列
注:小写序列为载体序列,大写序列为TOT特异引物序列。
实施例3.T9αH基因和TOT基因参与巴卡亭III的合成在烟草中进行功能验证
将构建好的表达载体pEAQ-HT-T9αH转入农杆菌GV3101中,获得GV3101/pEAQ-HT-T9αH转基因菌株;挑取阳性单克隆接种于LB培养基中(含50μg/mL卡那霉素和25μg/mL利福平),28℃培养24h;取培养好的菌液按1:100的比例于10mL LB培养基中(含50μg/mL卡那霉素和25μg/mL利福平),28℃过夜培养至OD600值为0.8-1.0;加入重悬液MMA(10mM MES,10mMMgCl2,150μM乙酰丁香酮)至最终OD600为0.8-1.0,室温静置1-2h。
将构建好的表达载体pEAQ-HT-TOT转入农杆菌GV3101中,获得GV3101/pEAQ-HT-TOT3转基因菌株;挑取阳性单克隆接种于LB培养基中(含50μg/mL卡那霉素和25μg/mL利福平),28℃培养24h;取培养好的菌液按1:100的比例于10mL LB培养基中(含50μg/mL卡那霉素和25μg/mL利福平),28℃过夜培养至OD600值为0.8-1.0;加入重悬液MMA(10mM MES,10mMMgCl2,150μM乙酰丁香酮)至最终OD600为0.8-1.0,室温静置1-2h。
以同样的方式将分别含有TS(U48796)、TAT(AF190130或AY628434,优选地,AY628434)、T5αH(AY289209)、T13αH(AY056019)、T2αH(AY518383)、T7βH(AY307951)、TBT(AF297618)等基因的CV3101农杆菌进行培养,并在MMA中重悬至OD600值为0.8-1.0,然后分别与含有T9αH的农杆菌、含有TOT的农杆菌按照1:1的比例进行混合,其中包含荧光蛋白GFP的农杆菌作为对照。
用去掉针头的1mL注射器将重悬后的农杆菌组合注射4-6周本式烟(Nicotianabenthamiana)的叶背,光下晾干1-2h后转移至黑暗处培养24h,后转至正常光照下培养,注射农杆菌5天后,收集样品,以注射含有GFP的叶片作为对照。
将烟草样品用研磨机研磨,后将样品粉末转移至5mL离心管中,经冷冻干燥后,加入1mL甲醇,超声提取30min,13000rpm离心15min后,将上清转移至新离心管,再以13000rpm离心15min,从中取出200μL至进样瓶中,于LC-MS中检测。
结果表明,当T9αH和TOT与巴卡亭III生物合成途径的7个已知基因共表达时,可以检测到新的产物峰7,峰产物与巴卡亭III(7)具有相同的质量(m/z 609[M+Na]+)和保留时间(图2中Group1)。串联质谱(MS/MS)分析进一步证明新产物7是巴卡亭III(图3)。
进一步研究了这9个基因是否是烟草中合成巴卡亭III的最小基因组合。如图2所示,当共表达系统中9个基因中的任何一个缺失时,都无法检测到巴卡亭III(图2中Group2~10)。结果表明,这9个基因构成了巴卡亭III生物合成的核心成分。
此外,T10βH长期以来一直被认为是巴卡亭III生物合成的必要基因。本申请的结果表明,在没有T10βH的情况下,巴卡亭III仍然能够被合成(图2和图3)。
此外,10-去乙酰巴卡亭III-10-β-O-乙酰转移酶(DBAT)被认为是巴卡亭III中C10酰化的关键酶。本申请的研究结果显示,在没有DBAT的情况下,巴卡亭III仍然能够被合成(图2和图3),说明TAT可以取代其在烟草中的功能。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。