CN114277024A

CN114277024A - 一种新型三萜合酶及其应用

Info

Publication number: CN114277024A
Application number: CN202011032594.6A
Authority: CN
Inventors: 周志华; 樊震鋆; 王燕; 严兴; 王平平
Original assignee: Center for Excellence in Molecular Plant Sciences of CAS
Current assignee: Center for Excellence in Molecular Plant Sciences of CAS
Priority date: 2020-09-27
Filing date: 2020-09-27
Publication date: 2022-04-05
Anticipated expiration: 2040-09-27
Also published as: CN114277024B

Abstract

本发明提供了一种新型三萜合酶、其制备及其应用。本发明的三萜合酶能有效地催化三萜化合物前体形成西米杜鹃醇。本发明的三萜合酶能够在酵母等工程细胞中表达以及进行西米杜鹃醇合酶的生产，具有非常好的应用前景。

Description

一种新型三萜合酶及其应用

技术领域

本发明涉及生物技术和植物生物学领域；更具体地，本发明涉及一种新型三萜合酶及其应用。

背景技术

三萜化合物是植物中广泛存在的一大类天然产物，其结构复杂，功能多样，在众多领域发挥着重要功能。三萜合酶作为三萜化合物合成途径中的关键酶，形成结构多样的核心骨架，是三萜化合物结构多样性的基础。

三萜合酶催化2,3环氧角鲨烯形成不同的碳骨架，进一步由细胞色素P450、糖基转移酶和酰基转移酶等修饰酶的修饰，产生结构多样的三萜化合物，广泛应用于食品、医药和工业生物技术等领域。因此探索新功能的三萜合酶或具有新异三萜碳骨架的三萜合酶元件有助于开发自然界中丰富的三萜化合物资源。

目前植物中已鉴定了100余种三萜骨架，包含85条不同功能的三萜合酶，还有一些具有生物活性的三萜化合物是通过植物化学法分离到并鉴定结构的，然而相关的三萜合酶元件并未分离到，导致无法大量合成此类化合物，阻碍了其功能的全面解析与应用。因此本领域有必要开发三萜合酶元件的方法，加快解析自然界中丰富的三萜合酶。

综上，新型的三萜合酶的开发以及将之应用于生产工业上、药物学上有用的产品，是本领域迫切所需的。

发明内容

本发明的目的在于提供一种新型三萜合酶及其应用。

在本发明的第一方面，提供一种分离的多肽，该多肽选自下组：

(a)SEQ ID NO:2所示氨基酸序列的多肽；

(b)与SEQ ID NO:2所示的氨基酸序列有至少70％相同性(较佳地75％以上；更佳地80％以上；更佳85％以上，如90％，95％，98％或99％以上)，且具有(a)所限定的多肽的功能(包括催化2,3环氧角鲨烯生成西米杜鹃醇功能)的多肽；

(c)将(a)所限定的多肽的氨基酸序列经过一个或多个(如1-20个，较佳地1-10个；更佳地1-5个；更佳地1-3个)氨基酸残基的取代、缺失或添加而形成的，且具有(a)所限定的多肽的功能的多肽；或

(d)(a)～(c)任一所述多肽的片段，其包含有该多肽的催化结构域，且具有(a)所限定的多肽的功能；

(e)(a)～(d)任一所述多肽的N或C末端添加标签序列，或在其N末端添加信号肽序列后形成的多肽。

在本发明的另一方面，提供一种分离的多核苷酸，它包含一核苷酸序列，该核苷酸序列选自下组：(1)编码如所述多肽的多核苷酸；(2)与多核苷酸(1)互补的多核苷酸。

在一个优选例中，该多核苷酸编码如SEQ ID NO:2所示氨基酸序列的多肽；较佳地，该多核苷酸的核苷酸序列如SEQ ID NO:1所示。

在本发明的另一方面，提供一种载体，它含有前面任一所述的多核苷酸。

在本发明的另一方面，提供一种遗传工程化的宿主细胞，它含有所述的载体，或其基因组中整合有前面任一所述的多核苷酸。

在另一优选例中，所述的整合包括定向整合或随机整合。

在另一优选例中，所述宿主细胞包括(但不限于)：原核细胞或真核细胞；较佳地，所述原核细胞包括大肠杆菌、枯草杆菌；所述真核细胞包括(但不限于)：酵母细胞、真菌细胞、昆虫细胞、哺乳动物细胞；较佳地，所述宿主细胞为酵母细胞。

在本发明的另一方面，提供一种制备所述的多肽的方法，包括：(i)培养所述的宿主细胞；(ii)收集含有所述的多肽的培养物；(iii)从培养物中分离出所述的多肽。

在本发明的另一方面，提供所述的多肽的用途，用于催化2,3环氧角鲨烯生成西米杜鹃醇。

在本发明的另一方面，提供一种组合物，其包含所述的多肽；以及工业学或微生物学上可接受的载体。

在本发明的另一方面，提供一种组合物，其包含所述的宿主细胞；以及工业学或微生物学上可接受的载体。

在本发明的另一方面，提供一种生产西米杜鹃醇的方法，包括：应用所述的多肽、所述的宿主细胞或述的组合物催化2,3环氧角鲨烯，生成西米杜鹃醇。

在本发明的另一方面，提供一种生产西米杜鹃醇的方法，包括：

(1)提供一工程细胞，该细胞：包含2,3环氧角鲨烯，能吸收胞外的2,3环氧角鲨烯，或具有2,3环氧角鲨烯生产途径；

(2)在(1)所述工程细胞中表达所述的多肽；

(3)培养(2)的工程细胞，生产西米杜鹃醇。

在一个优选例中，所述方法还包括：在所述工程细胞中过表达ERG10基因，ERG13基因，ERG12基因，ERG8基因，ERG19基因，IDI基因，tHMG1基因。

在本发明的另一方面，提供一种用于生产西米杜鹃醇的工程细胞，该细胞：包含2,3环氧角鲨烯，能吸收胞外的2,3环氧角鲨烯或具有2,3环氧角鲨烯生产途径；且，该细胞表达所述的多肽。

在一个优选例中，所述工程细胞中过表达ERG10基因，ERG13基因，ERG12基因，ERG8基因，ERG19基因，IDI基因，tHMG1基因。

在另一优选例中，所述的工程细胞包括(但不限于)：原核细胞或真核细胞；较佳地，所述原核细胞包括大肠杆菌、枯草杆菌；所述真核细胞包括(但不限于)：酵母细胞、真菌细胞、昆虫细胞、哺乳动物细胞；较佳地，所述工程细胞为酵母细胞；更佳地，所述工程细胞为酿酒酵母细胞。

在本发明的另一方面，提供一种用于生产西米杜鹃醇的试剂盒，其中包括：前面任一所述的工程细胞；较佳地，其中还包括细胞培养基或培养组分；较佳地，其中还包括使用说明书。

本发明的其它方面由于本文的公开内容，对本领域的技术人员而言是显而易见的。应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

图1、两对引物SEQ ID NO:1和2的PCR产物的琼脂糖凝胶电泳检测结果。其中，泳道1为翊圣生物公司的1kb DNA ladder Marker，泳道2为ZmOSC1的PCR产物。

图2、西米杜鹃醇合酶ZmOSC1 Western印迹分析。

图3、重组酿酒酵母pESC-Leu-ZmOSC1/WP7发酵产物的HPLC图。其中，编号为1号的HPLC峰图为pESC-Leu/WP7空载质粒作为阴性对照的测定峰图，编号为2号的HPLC峰图为pESC-Leu-ZmOSC1/WP7的测定峰图。

具体实施方式

本发明人经过大规模的筛选和深入的研究，从玉米植物中分离到了一种新颖的三萜合酶，为西米杜鹃醇合酶(Simiarenol Synthase)，本发明人将之命名为(Zm)OSC1。本发明的OSC1能有效地催化三萜化合物前体形成西米杜鹃醇(Simiarenol)。本发明的三萜合酶能够在酵母等工程细胞中表达以及进行西米杜鹃醇合酶的生产，具有非常好的应用前景。

新型多肽、其核酸、构建体及制备

如本文所用，术语“本发明的多肽”、“本发明的蛋白”、“西米杜鹃醇合酶”、“三萜合酶”、“OSC1”可互换使用，都指具有SEQ ID NO:2或其片段或其变异形式或衍生物的蛋白或多肽。

如本文所用，“分离的”是指物质从其原始环境中分离出来(如果是天然的物质，原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的，但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开，则为分离纯化的。

如本文所用，“分离的多肽(本发明中为OSC1)”是指本发明所述OSC1基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述OSC1。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述OSC1的纯度能用氨基酸序列分析。

本发明中，所述“含有”表示各种成分可一起应用于本发明的混合物或组合物中。因此，术语“主要由...组成”和“由...组成”包含在术语“含有”中。

本发明的多肽(OSC1)可以是重组多肽、天然多肽、合成多肽，优选重组多肽。本发明的多肽可以是天然纯化的产物，或是化学合成的产物，或使用重组技术从真核或原核宿主(例如，细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主，本发明的多肽可以是糖基化的，或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。

本发明还包括所述OSC1的片段、衍生物和类似物。如本文所用，术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然OSC1相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列，或与抗原IgG片段的形成的融合蛋白)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

在本发明中，术语“所述OSC1”指具有所述OSC1活性的SEQ ID NO:2序列的多肽。该术语还包括具有与所述OSC1相同功能的、SEQ ID NO:2序列的变异形式。这些变异形式包括(但并不限于)：一个或多个(通常为1-50个，较佳地1-30个，更佳地1-20个，更佳地1-10个，最佳地1-5个)氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加或缺失一个或数个(通常为20个以内，较佳地为10个以内，更佳地为5个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。比如，在C末端和/或N末端添加或缺失一个或数个氨基酸通常也不会改变蛋白质的功能；又比如，仅表达该蛋白的催化结构域，而不表达碳水化合物结合结构域也能获得和完整蛋白同样的催化功能。因此该术语还包括所述OSC1的活性片段和活性衍生物。例如，变异可以发生在SEQ ID NO:2的催化功能域之外。

该多肽的变异形式包括：同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严谨度条件下能与所述OSC1DNA杂交的DNA所编码的蛋白、以及利用抗所述OSC1的抗体获得的多肽或蛋白。本发明还提供了其他多肽，如包含所述OSC1或其片段的融合蛋白。除了几乎全长的多肽外，本发明还包括了所述OSC1的片段。通常，该片段具有所述OSC1序列的至少约10个连续氨基酸，通常至少约30个连续氨基酸，较佳地至少约50个连续氨基酸，更佳地至少约80个连续氨基酸，最佳地至少约100个连续氨基酸。

发明还提供所述OSC1蛋白或多肽的类似物。这些类似物与天然所述OSC1的差别可以是氨基酸序列上的差异，也可以是不影响序列的修饰形式上的差异，或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到，如通过辐射或暴露于诱变剂而产生随机诱变，还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物，以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解，本发明的多肽并不限于上述例举的代表性的多肽。

在本发明中，“所述OSC1的保守性变异体”指与SEQ ID NO:2的氨基酸序列相比，有至多30个，较佳地至多20个，更佳地至多10个，更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异体较佳地根据表1进行氨基酸替换而产生。

表1

本发明的OSC1的氨基端或羧基端还可含有一个或多个多肽片段，作为蛋白标签。任何合适的标签都可以用于本发明。例如，所述的标签可以是FLAG，HA，HA1，c-Myc，Poly-His，Poly-Arg，Strep-TagII，AU1，EE，T7，4A6，ε，B，gE以及Ty1。

为了使翻译的蛋白分泌表达(如分泌到细胞外)，还可在所述所述OSC1的氨基酸氨基末端用宿主适用的信号肽替换本身信号肽序列。信号肽在多肽从细胞内分泌出来的过程中可被切去。

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与OSC1的天然编码序列或与SEQ ID NO:1所示编码序列相同或者是简并的变异体。如本文所用，“简并的变异体”在本发明中是指编码具有SEQ ID NO:2的蛋白质，但与OSC1的天然编码序列或SEQ ID NO:1所示编码序列有差别的核酸序列。

编码SEQ ID NO:2的成熟多肽的多核苷酸包括：只编码成熟多肽的编码序列；成熟多肽的编码序列和各种附加编码序列；成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸，也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明还涉及上述多核苷酸的变异体，其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的，等位变异体是一个多核苷酸的替换形式，它可能是一个或多个核苷酸的取代、缺失或插入，但不会从实质上改变其编码的多肽的功能。

本发明还涉及与上述的序列杂交且两个序列之间具有至少50％，较佳地至少70％，更佳地至少80％相同性的多核苷酸。本发明特别涉及在严格条件(或严谨条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中，“严格条件”是指：(1)在较低离子强度和较高温度下的杂交和洗脱，如0.2×SSC，0.1％SDS，60℃；或(2)杂交时加有变性剂，如50％(v/v)甲酰胺，0.1％小牛血清/0.1％Ficoll，42℃等；或(3)仅在两条序列之间的相同性至少在90％以上，更好是95％以上时才发生杂交。并且，可杂交的多核苷酸编码的多肽与SEQ ID NO:2所示的成熟多肽有相同的生物学功能和活性。

本发明中的多肽和多核苷酸优选以分离的形式提供，更佳地被纯化至均质。

所述OSC1核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。目前，已经可以完全通过化学合成来得到编码本发明蛋白(或其片段，或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。

本发明也提供了包含本发明的多核苷酸的载体，以及用本发明的载体或所述OSC1编码序列经基因工程产生的宿主细胞，以及经重组技术产生本发明所述多肽的方法。

通过常规的重组DNA技术，可利用本发明的多聚核苷酸序列可用来表达或生产重组的所述OSC1。一般来说有以下步骤：(1).用编码所述OSC1的多核苷酸(或变异体)，或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞；(2).在合适的培养基中培养的宿主细胞；(3).从培养基或细胞中分离、纯化蛋白质。

本发明中，所述OSC1多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定，任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。

本领域的技术人员熟知的方法能用于构建含编码所述OSC1的DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状。包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。

宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，枯草杆菌，链霉菌属、鼠伤寒沙门氏菌的细菌细胞；真菌细胞如酵母；植物细胞；昆虫细胞(如果蝇S2或Sf9)；CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。在本发明的优选方式中，所述的宿主细胞为真核细胞，较佳地为酵母细胞，如酿酒酵母细胞。

获得的转化子可以用常规方法培养，表达本发明的基因所编码的多肽。根据所用的宿主细胞，培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后，用合适的方法(如温度转换或化学诱导)诱导选择的启动子，将细胞再培养一段时间。

在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要，可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于：常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。

作为本发明的优选方式，采用酵母细胞作为宿主细胞来表达所述OSC1。本发明通过构建表达系统，在大酵母工程细胞中异源表达所述的OSC1。

三萜化合物的生产

经过大量筛选，从玉米中获得了一种新型西米杜鹃醇合酶，其具有催化2,3环氧角鲨烯的环化产生三萜化合物西米杜鹃醇的功能。

本发明的OSC1或其保守性变异体，可应用于特异和高效地催化2,3环氧角鲨烯的环化，从而产生三萜化合物西米杜鹃醇产物。

西米杜鹃醇是一个五环三萜化合物，具有显著的α葡糖苷酶抑制活性，有助于减弱餐后高血糖。此外，西米杜鹃醇可能具有抗利什曼原虫活性，利什曼病是一个世界性的健康问题，在发展中国家高度流行，目前所用药物严重的副作用与耐药性问题使替代药物的研发迫在眉睫。

西米杜鹃醇合酶(Simiarenol Synthase)是合成三萜化合物西米杜鹃醇(Simiarenol)的关键酶，催化三萜化合物前体2,3环氧角鲨烯环化形成三萜化合物西米杜鹃醇。其反应式示意如下：

作为一种可选的方式，可利用本发明的OSC1进行体外生产，可以通过规模化生产本发明的OSC1，将之与前体2,3环氧角鲨烯进行反应，以获得西米杜鹃醇。

作为本发明的优选方式，利用生物合成的方法进行生产。这通常包括：(1)提供一工程细胞，该细胞具有选自下组的至少一方面特征：包含2,3环氧角鲨烯，能吸收胞外的2,3环氧角鲨烯，或具有2,3环氧角鲨烯生产途径；(2)在(1)所述工程细胞中表达所述的多肽；以及(3)培养(2)的工程细胞，生产西米杜鹃醇。在更为优选的方式中，所述方法还包括：从工程细胞的培养物中，分离纯化西米杜鹃醇的步骤。

在利用生物合成的方法进行生产时，作为本发明的优选方式，还包括在细胞中强化2,3环氧角鲨烯的生产途径。更优选地，通过在细胞中引入一系列的基因来进行强化，包括：ERG10基因，ERG13基因，ERG12基因，ERG8基因，ERG19基因，IDI基因，tHMG1基因。也可以通过强化2,3环氧角鲨烯的上游途径的化合物的产生，来提供更多的2,3环氧角鲨烯，作为西米杜鹃醇的前体。应理解，其它一些强化细胞中2,3环氧角鲨烯的产生的方法也可被包含于本发明中。

本发明也提供了用于生物合成西米杜鹃醇的试剂盒，其中包括：本发明所述的基因工程细胞。较佳地，所述试剂盒中还可包括适于进行所述基因工程细胞的培养的培养基或培养组分。较佳地，所述试剂盒中还包括说明进行生物合成的方法的使用说明书，以指导本领域技术人员以适当的方法来进行生产。

本发明为将来利用合成生物学技术来大量合成西米杜鹃醇提供了必须的元件。

相对于传统的植物提取手段，微生物发酵具有速度快、受外界因素影响较小等优势；部分化合物通过微生物合成的产量远高于植物提取，已经成为天然产物获得的一种重要手段。西米杜鹃醇天然丰度低，并且在植物(例如来自植物艾叶)提取物中分离纯化的程序繁琐复杂。本发明中使用微生物发酵的方式来定向得合成西米杜鹃醇，可极为有效地降低分离纯化这类化合物的成本。

下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件如J.萨姆布鲁克等编著，分子克隆实验指南，第三版，科学出版社，2002中所述的条件，或按照制造厂商所建议的条件。

生物序列信息本发明后续实施例中所涉及的基因、多肽及引物如表1。

表1

实施例1、西米杜鹃醇合酶(ZmOSC1)的克隆

合成两条引物分别具有序列表中SEQ ID NO:3和SEQ ID NO:4的核苷酸序列。

以从玉米中提取的RNA反转录获得的cDNA为模板，利用如上两对引物SEQ ID NO:3和SEQ ID NO:4进行PCR。DNA聚合酶选用宝生物工程(大连)有限公司(Takara)高保真的PrimeStar DNA聚合酶。PCR扩增程序为：98℃2min；98℃10s，58℃15s，68℃3min，共35个循环；68℃7min，降至10℃。PCR产物经琼脂糖凝胶电泳检测，结果如图1。

在紫外下照射，切下目标DNA条带。然后采用Axygen Gel Extraction Kit(AXYGEN公司)从琼脂糖凝胶中回收DNA即为扩增出的三萜合酶基因的DNA片段。利用全式金有限公司的

-Blunt Simple Cloning Kit克隆试剂盒，将回收的PCR产物克隆到pEASY载体，所构建的载体分别命名为pEASY-ZmOSC1，经测序获得ZmOSC1的基因序列。

ZmOSC1基因具有序列表中SEQ ID NO:1的核苷酸序列。自SEQ ID NO:1的5’端第1-2277位核苷酸为ZmOSC1的开放阅读框(Open Reading Frame，ORF)，自SEQ ID NO:1的5’端的第1-3位核苷酸为ZmOSC1基因的起始密码子ATG，自SEQ ID NO:1的5’端的第2275-2277位核苷酸为ZmOSC1基因的终止密码子TGA。西米杜鹃醇合酶基因ZmOSC1编码一个含有758个氨基酸的蛋白质ZmOSC1，具有SEQ ID NO:2的氨基酸残基序列，用软件预测到该蛋白质的理论分子量大小为87.21kDa，等电点pI为6.40。

实施例2、重组酿酒酵母WP7-pESC-Leu-ZmOSC1的构建

1、工程细胞的建立

强化酵母CENPK-II(购自Euroscarf)的ERG10，ERG13，ERG12，ERG8，ERG19，IDI和tHMG1基因，将这些基因在酵母CENPK-II中过表达，获得高产角鲨烯烃和2,3环氧角鲨烯的酵母工程细胞WP7。其中各个基因的序列信息见表1中。

2、重组酿酒酵母WP7-pESC-Leu-ZmOSC1的建立

合成分别具有序列表中SEQ ID NO:5和SEQ ID NO:6核苷酸序列的两条引物。

在合成的引物SEQ ID NO:5和SEQ ID NO:6(扩增ZmOSC1)两端分别设置有同源臂序列，以从玉米中提取的RNA反转录的cDNA为模板进行PCR。PCR扩增程序同实施例1。PCR产物经琼脂糖凝胶电泳分离、回收后，与经SmalI酶切的pESC-Leu质粒(购自Invitrogen公司)连接，所获得的重组质粒命名为pESC-Leu-ZmOSC1。

将重组质粒pESC-Leu-ZmOSC1及空载体pESC-Leu分别转化酿酒酵母三萜重组细胞WP7中，分别建立重组酿酒酵母WP7-pESC-Leu-ZmOSC1和WP7-pESC-Leu。

实施例3、利用重组酿酒酵母诱导生产西米杜鹃醇

1、诱导培养方法

挑取在固体SCO培养基平板上划线的酵母：WP7-pESC-Leu-ZmOSC1和WP7-pESC-Leu分别于含有4mL液体种子培养基的试管震荡培养过夜(30℃，250rpm，16h)；按1％的接种量转接于含有液体合成培养基的250ml锥形瓶中进行摇瓶发酵，30℃，250rpm震荡培养4天得到发酵产物。

2、Western印迹分析

13000g离心30秒收集菌体，加入PH8.0的Tris-HCl缓冲液重悬菌体，转入Fastprep管中6M/s，35s/次震荡破碎4次，4℃12000g离心收集细胞裂解液上清于新的EP管中，再15000离心20分钟收集上清。取样品进行Western blot分析。

西米杜鹃醇合酶ZmOSC1 Western印迹分析结果如附图2。

3、西米杜鹃醇产物提取及检测

取1mL的WP7-pESC-Leu-ZmOSC1/WP7-pESC-Leu(Control)的发酵液离心收集菌体，加入800μL抽提液(20％KOH、50％无水乙醇)，用Fastprep震荡裂解酵母，沸水煮30分钟。加入等体积(800μL)的正己烷抽提，而后在真空条件下使正己烷蒸干。用100μL无水乙醇溶解后通过HPLC检测目的产物西米杜鹃醇。

HPLC结果见图3。

从图3中结果可以看出，相对于阴性对照，重组酿酒酵母WP7-pESC-Leu-ZmOSC1发酵产物有两个新峰。经核磁分析证明红色箭头标注的产物峰为西米杜鹃醇，表明本发明中发现的三萜合酶西米杜鹃醇合酶ZmOSC1能催化2,3环氧角鲨烯产生五环三萜化合物西米杜鹃醇。

实施例4、重组酿酒酵母WP7-pESC-Leu-ZmOSC1诱导生产西米杜鹃醇的结构鉴定

西米杜鹃醇产物的纯化：先用硅胶柱层析初步纯化WP7-pESC-Leu-ZmOSC1的发酵液，再用大连依利特公司的C18半制备柱SinoChrom ODS-BP柱(5μm，10.0mm×250mm)进行液相半制备，得到纯化的西米杜鹃醇产物。

西米杜鹃醇产物的鉴定：用Bruker公司的Bruker AdvanceIII 500(¹H:500MHz，¹³C:125MHz)的核磁仪器采集西米杜鹃醇产物的核磁共振数据，以CDCl3为溶剂，三级甲硅烷的C和H的化学位移作为零点参照。

ZmOSC1和simiarenol的¹³C NMR数据对比见表2。其中，第一列为¹³C NMR的C，第二列为ZmOSC1的¹³C NMR数据，第三列为Simiarenol的核磁数据。

表2、ZmOSC1合酶发酵产物的NMR鉴定结果

根据表1，其NMR氢谱和碳谱与已报道的天然产物Simiarenol的NMR氢谱和碳谱数据均完全吻合。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 中国科学院分子植物科学卓越创新中心

<120> 一种新型三萜合酶及其应用

<130> 204412

<160> 6

<170> SIPOSequenceListing 1.0

<210> 1

<211> 2277

<212> DNA

<213> 玉米(Zea mays L.)

<400> 1

atgtggaggt taaagatcgg agagggggga gggccgtgga tgcagacggt gagcggcttc 60

catggccggc aggtttggga gtacgacccg gacgccggca ccgacgagga gcgcagcaag 120

gtggagcagc ttcgccggga gttcacagag aaccgcttcc gaaggaggga atcgcaggac 180

ctcctcatgc gtatgcagtt aactggacaa aaacatctgc atgcggacga aatgggagcg 240

gccaccaaga tagaggatgg cgacgaggtg acggaggaga ggttgcggga gtcgctgagg 300

cgagcgctgg ggtggatgtc tgctctccaa gctgaagatg gccactggcc tggtgatttc 360

agtgggatta cgtacattat gccgttctgg attttcgccc tgcacatcac aggatccatc 420

gatgttgtcc tatcgaaaga gcatagacgt gagatctgcc gccatatcta caaccatcag 480

aacgaggacg gaggatgggg cttcaacatc ttagatgaga gcgccatgtt ttccacatgc 540

ttaaactaca ccgccctgag acttctgggt gaggtgcagc aggaggagaa cgatgggcta 600

gctaaaggtc gagcatggat cctatcccat ggaactgcaa ctgcagcacc gcagtgggca 660

aaaatactac tctcggttat tggtgtatat gattggcgtg gcaataatcc agttgtacct 720

gaactatggt tggtaccacg tttcctccca attcacccag ggcggttctg gtgtttcact 780

aggattacat acatgtcaat agctttcctt tatggcaaaa aattcgttgg tcccattaca 840

ccaactattt tagaactaag ggaggaactc tacagtttgc cttatgttca gatagattgg 900

agtaaagctc gtaattcttg tgccaaggag gacatgcgca ataaaccttc agaaatattc 960

aaatttattt caacatgctt gaacatgttc gtggagcctg tgttgaacta ttggccactt 1020

aacaagttaa gagagagagc tttgaaccac gttctggaac atatccacta cgaagatgaa 1080

actactcaat atattggcat atctcccgtt acaaaggcac taaacatgat ttgttgctgg 1140

gttgaaaacc caaattcaga tgcgctcaag cgacatattc caaggataca tgattatttg 1200

tggattgctg aagatggaat gaacaccaaa atatacgatg gtacccacaa ctgggagttg 1260

gcacttataa tccaggccat attatcagca gatgctgcca atgagtatgg tccaaccatt 1320

cagagggcta tggaatactt aaagagagca caagttacta caaaccctcc agggaaccca 1380

agttattggt tccgccatag gtcaaaagga tcatggccac tttccactat agacaatggc 1440

tggggctcat cggatactag tgcggaagca actaaggcac ttttgatgat ttccaaggta 1500

tatcccaacc tcgttgaaaa ttcaaatgga gatgagtgga tgttgaatgc tgttgattgc 1560

cttctttcat ttatgaacaa agatggttca gtttctacat ttgaatgtca aagaacttat 1620

tcttggctag agattctgaa tcctttggag agttttcgaa atattgtcgc tgattacccg 1680

acggttgaat gtacatcctc ggtgttgcag gcattggtat tatttgagga attcaattca 1740

gagtaccgca gtaaagaaat aaaagaaaat gttaagaaag ctgccatata tattgagaat 1800

aatcaaaaca aggatggatc ctggtacggc acatggggaa tatgttttgt ctatgggact 1860

ctctatgcaa taaaaggctt agttgctgct gggagaaatt atgagaacag tatttgcatt 1920

aggaaagcat gtaacttttt gctctcaata caactcaaaa ctggtggctg ggcagagagc 1980

tatcattcct gtgaaagaca ggtttatgta gagggtcata gcactcatgt tgtacaaact 2040

gcttgggcga tgctagcttt gatttatact ggacagatgg aacgggaccc aacaccatta 2100

catcgagcag caaaagtatt gattaatatg caactggaga caggagacta tgctcaacaa 2160

gaacatgttg gtagcaccaa ctgctctgta tacttcaact accccaacta tcgtattttg 2220

ttccctgttt gggctcttgg agagtatcat cgcaaagtat gtaccaaaag taattga 2277

<210> 2

<211> 758

<212> PRT

<213> 玉米(Zea mays L.)

<400> 2

Met Trp Arg Leu Lys Ile Gly Glu Gly Gly Gly Pro Trp Met Gln Thr

1 5 10 15

Val Ser Gly Phe His Gly Arg Gln Val Trp Glu Tyr Asp Pro Asp Ala

20 25 30

Gly Thr Asp Glu Glu Arg Ser Lys Val Glu Gln Leu Arg Arg Glu Phe

35 40 45

Thr Glu Asn Arg Phe Arg Arg Arg Glu Ser Gln Asp Leu Leu Met Arg

50 55 60

Met Gln Leu Thr Gly Gln Lys His Leu His Ala Asp Glu Met Gly Ala

65 70 75 80

Ala Thr Lys Ile Glu Asp Gly Asp Glu Val Thr Glu Glu Arg Leu Arg

85 90 95

Glu Ser Leu Arg Arg Ala Leu Gly Trp Met Ser Ala Leu Gln Ala Glu

100 105 110

Asp Gly His Trp Pro Gly Asp Phe Ser Gly Ile Thr Tyr Ile Met Pro

115 120 125

Phe Trp Ile Phe Ala Leu His Ile Thr Gly Ser Ile Asp Val Val Leu

130 135 140

Ser Lys Glu His Arg Arg Glu Ile Cys Arg His Ile Tyr Asn His Gln

145 150 155 160

Asn Glu Asp Gly Gly Trp Gly Phe Asn Ile Leu Asp Glu Ser Ala Met

165 170 175

Phe Ser Thr Cys Leu Asn Tyr Thr Ala Leu Arg Leu Leu Gly Glu Val

180 185 190

Gln Gln Glu Glu Asn Asp Gly Leu Ala Lys Gly Arg Ala Trp Ile Leu

195 200 205

Ser His Gly Thr Ala Thr Ala Ala Pro Gln Trp Ala Lys Ile Leu Leu

210 215 220

Ser Val Ile Gly Val Tyr Asp Trp Arg Gly Asn Asn Pro Val Val Pro

225 230 235 240

Glu Leu Trp Leu Val Pro Arg Phe Leu Pro Ile His Pro Gly Arg Phe

245 250 255

Trp Cys Phe Thr Arg Ile Thr Tyr Met Ser Ile Ala Phe Leu Tyr Gly

260 265 270

Lys Lys Phe Val Gly Pro Ile Thr Pro Thr Ile Leu Glu Leu Arg Glu

275 280 285

Glu Leu Tyr Ser Leu Pro Tyr Val Gln Ile Asp Trp Ser Lys Ala Arg

290 295 300

Asn Ser Cys Ala Lys Glu Asp Met Arg Asn Lys Pro Ser Glu Ile Phe

305 310 315 320

Lys Phe Ile Ser Thr Cys Leu Asn Met Phe Val Glu Pro Val Leu Asn

325 330 335

Tyr Trp Pro Leu Asn Lys Leu Arg Glu Arg Ala Leu Asn His Val Leu

340 345 350

Glu His Ile His Tyr Glu Asp Glu Thr Thr Gln Tyr Ile Gly Ile Ser

355 360 365

Pro Val Thr Lys Ala Leu Asn Met Ile Cys Cys Trp Val Glu Asn Pro

370 375 380

Asn Ser Asp Ala Leu Lys Arg His Ile Pro Arg Ile His Asp Tyr Leu

385 390 395 400

Trp Ile Ala Glu Asp Gly Met Asn Thr Lys Ile Tyr Asp Gly Thr His

405 410 415

Asn Trp Glu Leu Ala Leu Ile Ile Gln Ala Ile Leu Ser Ala Asp Ala

420 425 430

Ala Asn Glu Tyr Gly Pro Thr Ile Gln Arg Ala Met Glu Tyr Leu Lys

435 440 445

Arg Ala Gln Val Thr Thr Asn Pro Pro Gly Asn Pro Ser Tyr Trp Phe

450 455 460

Arg His Arg Ser Lys Gly Ser Trp Pro Leu Ser Thr Ile Asp Asn Gly

465 470 475 480

Trp Gly Ser Ser Asp Thr Ser Ala Glu Ala Thr Lys Ala Leu Leu Met

485 490 495

Ile Ser Lys Val Tyr Pro Asn Leu Val Glu Asn Ser Asn Gly Asp Glu

500 505 510

Trp Met Leu Asn Ala Val Asp Cys Leu Leu Ser Phe Met Asn Lys Asp

515 520 525

Gly Ser Val Ser Thr Phe Glu Cys Gln Arg Thr Tyr Ser Trp Leu Glu

530 535 540

Ile Leu Asn Pro Leu Glu Ser Phe Arg Asn Ile Val Ala Asp Tyr Pro

545 550 555 560

Thr Val Glu Cys Thr Ser Ser Val Leu Gln Ala Leu Val Leu Phe Glu

565 570 575

Glu Phe Asn Ser Glu Tyr Arg Ser Lys Glu Ile Lys Glu Asn Val Lys

580 585 590

Lys Ala Ala Ile Tyr Ile Glu Asn Asn Gln Asn Lys Asp Gly Ser Trp

595 600 605

Tyr Gly Thr Trp Gly Ile Cys Phe Val Tyr Gly Thr Leu Tyr Ala Ile

610 615 620

Lys Gly Leu Val Ala Ala Gly Arg Asn Tyr Glu Asn Ser Ile Cys Ile

625 630 635 640

Arg Lys Ala Cys Asn Phe Leu Leu Ser Ile Gln Leu Lys Thr Gly Gly

645 650 655

Trp Ala Glu Ser Tyr His Ser Cys Glu Arg Gln Val Tyr Val Glu Gly

660 665 670

His Ser Thr His Val Val Gln Thr Ala Trp Ala Met Leu Ala Leu Ile

675 680 685

Tyr Thr Gly Gln Met Glu Arg Asp Pro Thr Pro Leu His Arg Ala Ala

690 695 700

Lys Val Leu Ile Asn Met Gln Leu Glu Thr Gly Asp Tyr Ala Gln Gln

705 710 715 720

Glu His Val Gly Ser Thr Asn Cys Ser Val Tyr Phe Asn Tyr Pro Asn

725 730 735

Tyr Arg Ile Leu Phe Pro Val Trp Ala Leu Gly Glu Tyr His Arg Lys

740 745 750

Val Cys Thr Lys Ser Asn

755

<210> 3

<211> 24

<212> DNA

<213> 引物(Primer)

<400> 3

atgtggaggt taaagatcgg agag 24

<210> 4

<211> 27

<212> DNA

<213> 引物(Primer)

<400> 4

tcaattactt ttggtacata ctttgcg 27

<210> 5

<211> 59

<212> DNA

<213> 引物(Primer)

<400> 5

aatatacctc tatactttaa cgtcaaggag aaaaaaccca tgtggaggtt aaagatcgg 59

<210> 6

<211> 59

<212> DNA

<213> 引物(Primer)

<400> 6

ttttcggtta gagcggattt aatgatgatg atgatgatgt caattacttt tggtacata 59

Claims

1.一种分离的多肽，其特征在于，该多肽选自下组：

(a)SEQ ID NO:2所示氨基酸序列的多肽；

(b)与SEQ ID NO:2所示的氨基酸序列有至少70％相同性，且具有(a)所限定的多肽的功能的多肽；

(c)将(a)所限定的多肽的氨基酸序列经过一个或多个氨基酸残基的取代、缺失或添加而形成的，且具有(a)所限定的多肽的功能的多肽；或

2.一种分离的多核苷酸，其特征在于，它包含一核苷酸序列，该核苷酸序列选自下组：

(1)编码如权利要求1所述多肽的多核苷酸；

(2)与多核苷酸(1)互补的多核苷酸。

3.如权利要求2所述的多核苷酸，其特征在于，该多核苷酸编码如SEQ ID NO:2所示氨基酸序列的多肽；较佳地，该多核苷酸的核苷酸序列如SEQ ID NO:1所示。

4.一种载体，其特征在于，它含有权利要求2～3任一所述的多核苷酸。

5.一种遗传工程化的宿主细胞，其特征在于，它含有权利要求4所述的载体，或其基因组中整合有权利要求2～3任一所述的多核苷酸。

6.一种制备权利要求1所述的多肽的方法，包括：

(i)培养权利要求5所述的宿主细胞；

(ii)收集含有权利要求1所述的多肽的培养物；

(iii)从培养物中分离出权利要求1所述的多肽。

7.权利要求1所述的多肽的用途，用于催化2,3环氧角鲨烯生成西米杜鹃醇。

8.一种组合物，其包含选自下组的成分：权利要求1所述的多肽；或权利要求5所述的宿主细胞；以及，工业学或微生物学上可接受的载体。

9.一种生产西米杜鹃醇的方法，包括：应用权利要求1所述的多肽、权利要求5所述的宿主细胞或权利要求8所述的组合物催化2,3环氧角鲨烯，生成西米杜鹃醇。

10.一种生产西米杜鹃醇的方法，包括：

(1)提供一工程细胞，该细胞：

包含2,3环氧角鲨烯，

能吸收胞外的2,3环氧角鲨烯，或

具有2,3环氧角鲨烯生产途径；

(2)在(1)所述工程细胞中表达权利要求1所述的多肽；

(3)培养(2)的工程细胞，生产西米杜鹃醇。

11.如权利要求10所述的方法，其特征在于，还包括：在所述工程细胞中过表达ERG10基因，ERG13基因，ERG12基因，ERG8基因，ERG19基因，IDI基因，tHMG1基因。

12.一种用于生产西米杜鹃醇的工程细胞，该细胞：

包含2,3环氧角鲨烯，

能吸收胞外的2,3环氧角鲨烯，或

具有2,3环氧角鲨烯生产途径；

且，该细胞表达权利要求1所述的多肽。

13.如权利要求12所述的工程细胞，其特征在于，所述工程细胞中过表达ERG10基因，ERG13基因，ERG12基因，ERG8基因，ERG19基因，IDI基因，tHMG1基因。

14.如权利要求10～13任一所述，其特征在于，所述的工程细胞包括：原核细胞或真核细胞；较佳地，所述原核细胞包括大肠杆菌、枯草杆菌；所述真核细胞包括：酵母细胞、真菌细胞、昆虫细胞、哺乳动物细胞；较佳地，所述工程细胞为酵母细胞；更佳地，所述工程细胞为酿酒酵母细胞。

15.一种用于生产西米杜鹃醇的试剂盒，其中包括：权利要求12～14任一所述的工程细胞；较佳地，其中还包括细胞培养基或培养组分；较佳地，其中还包括使用说明书。