CN115322989A

CN115322989A - 具有启动子活性的多核苷酸及其用途和生产目标化合物的方法

Info

Publication number: CN115322989A
Application number: CN202110504946.1A
Authority: CN
Inventors: 郑平; 陈久洲; 黄婧文; 孙际宾; 周文娟; 王钰; 马延和
Original assignee: Tianjin Institute of Industrial Biotechnology of CAS
Current assignee: Tianjin Institute of Industrial Biotechnology of CAS
Priority date: 2021-05-10
Filing date: 2021-05-10
Publication date: 2022-11-11

Abstract

本公开属于生物技术和基因工程技术领域，具体涉及一种具有启动子活性的多核苷酸，包含具有启动子活性的多核苷酸的转录表达盒、重组表达载体、重组宿主细胞，以及调控目标基因转录的方法、制备蛋白的方法和生产目标化合物的方法。本公开中具有启动子活性的多核苷酸，为在如SEQ ID NO：2‑4任一项所示序列的多核苷酸基础上获得的突变体，是一种高盐、高渗透压诱导型的启动子。与野生型启动子相比，本公开中的突变体在高盐、高渗透压环境下的启动子活性较野生型启动子进一步提高，可用于目标化合物在高盐、高渗透压环境下的高效稳定生产，具有重要的工业应用价值。

Description

具有启动子活性的多核苷酸及其用途和生产目标化合物的方法

技术领域

本公开属于生物技术和基因工程技术领域，具体涉及一种具有启动子活性的多核苷酸，包含具有启动子活性的多核苷酸的转录表达盒、重组表达载体、重组宿主细胞，以及调控目标基因转录的方法、制备蛋白的方法和生产目标化合物的方法。

背景技术

微生物发酵法可以生产多种目标化合物，如氨基酸、有机酸、生物基材料、药物化合物等等，这些目标化合物可广泛应用于医药、健康、食品、动物饲料和化妆品等领域，具有巨大的经济价值。近年来，随着对氨基酸、有机酸、生物基材料、原料药物等市场需求的不断增加，如何提高目标化合物的产量，实现对目标化合物的工业化大规模生产，是当前亟需解决的重要问题。

通过基因工程的方法对微生物代谢途径中的关键基因进行改造，是提高目标化合物的发酵产量的重要方法。影响基因表达的因素包括启动子的活性、基因翻译效率、基因拷贝数等。然而，基因拷贝数的增加会降低菌种基因组的稳定性，与此相比，通过提高启动子活性以提高基因的表达效率成为对关键基因进行改造的重要手段。

诱导型启动子可以控制转录起始的时间，因此更有利于菌株的代谢流调控和重新分配。目前tac、trc等诱导型启动子在谷氨酸棒状杆菌的代谢调控中被广泛使用。然而上述启动子往往需要额外添加昂贵的诱导剂，例如IPTG，这些诱导剂的添加也会对菌株造成一定的毒性，或对发酵体系造成较大的干扰。因此开发工业发酵条件下的自诱导系统对于工业菌株的构建至关重要。此外，在发酵罐中pH和溶氧严格控制的条件下，利用微生物发酵生产谷氨酸、赖氨酸等大宗化学品的产量能够达到100g/L甚至200g/L以上的水平^[5-6]，因此，在发酵后期高浓度产物或中间代谢物的积累以及底物的不断流加势必引发高盐、高渗的压力。同时，高盐高渗条件也几乎是所有工业菌株在发酵后期都将面临的环境诱导因素。

因此，鉴定高盐高渗诱导型启动子，开发构建针对发酵后期高盐高渗条件的自诱导系统，不仅可以增加可用的自诱导系统，而且可以为所有工业菌株的开发提供通用的自诱导元件，这也成为当前工业微生物开发亟需解决的关键问题。

发明内容

发明要解决的问题

鉴于现有技术中存在的技术问题，例如，tac、trc等诱导型启动子需添加IPTG等昂贵诱导剂、且诱导剂的添加对菌株造成毒性的问题。为此，本公开提供了一种具有启动子活性的多核苷酸，为在SEQ ID NO：2-4任一项所示序列的多核苷酸基础上获得的突变体，本公开中的突变体在盐浓度、渗透压升高的环境下表现出增强的启动子活性，将其与目标基因可操作地连接，可以使目标基因在高盐、高渗透压的环境下高效表达，避免使用IPTG等高昂的诱导剂，为目标化合物的高效生产提供了一种新型的高盐或高渗诱导型的启动子。并且，突变体的启动子活性较野生型启动子活性显著提高，具有重要的工业应用价值。

用于解决问题的方案

本公开提供了一种具有启动子活性的多核苷酸，其中，所述多核苷酸选自如下(i)-(vi)组成的组中的任一项：

(i)包含如SEQ ID NO：2所示序列的多核苷酸的突变体，所述突变体在SEQ ID NO：2所示序列的第170-179位中的一个或多个位置处具有突变的核苷酸；所述突变体的活性高于包含如SEQ ID NO：2所示序列的多核苷酸的启动子活性，且所述突变体在SEQ ID NO：2所示序列的第170-179位中的核苷酸序列不为ACACCGAGTG；

(ii)包含如SEQ ID NO：3所示序列的多核苷酸的突变体，所述突变体在SEQ IDNO：3所示序列的第130-139位中的一个或多个位置处具有突变的核苷酸；所述突变体的活性高于包含如SEQ ID NO：3所示序列的多核苷酸的启动子活性，且所述突变体在SEQ IDNO：3所示序列的第130-139位中的核苷酸序列不为ACACCGAGTG；

(iii)包含如SEQ ID NO：4所示序列的多核苷酸的突变体，所述突变体在SEQ IDNO：4所示序列的第72-81位中的一个或多个位置处具有突变的核苷酸；所述突变体的活性高于包含如SEQ ID NO：4所示序列的多核苷酸的启动子活性，且所述突变体在SEQ ID NO：4所示序列的第72-81位中的核苷酸序列不为ACACCGAGTG；

(iv)包含与(i)至(iii)中任一项所示的核苷酸序列的反向互补序列的多核苷酸；

(v)包含在高严格性杂交条件或非常高严格性杂交条件下，能够与(i)至(iii)中任一项所示的核苷酸序列杂交的序列的反向互补序列的多核苷酸；

(vi)包含与(i)至(iii)中任一项所示的核苷酸序列具有至少90％，可选至少95％，优选至少97％，更优选至少98％，最优选至少99％序列同一性的序列的多核苷酸。

在一些实施方式中，根据本公开所述的具有启动子活性的多核苷酸，其中，所述突变体在盐浓度或渗透压升高的环境中具有提高的启动子活性；

优选地，所述突变体与包含如SEQ ID NO：2所示序列的多核苷酸相比，在盐浓度或渗透压升高的环境中具有1-8倍以上提高的启动子活性。

在一些实施方式中，根据本公开所述的具有启动子活性的多核苷酸，其中，所述突变体对应SEQ ID NO：2所示序列的第170-179位，或对应SEQ ID NO：3所示序列的第130-139位，或对应SEQ ID NO：4所示序列的第72-81位的核苷酸序列选自如下(p₁)-(p₁₂)组成的组中的任一项：

(p₁)TACTTGCAGA，

(p₂)AGTGCTGAAA，

(p₃)GCACGAAAGG，

(p₄)TATCTAGAGG，

(p₅)AGGCTTGTCG，

(p₆)CGCTTCTTTC，

(p₇)TAACTCTTGG，

(p₈)CCAAGTTCCA，

(p₉)CGGTGCCACA，

(p₁₀)AGCAGTTAGG，

(p₁₁)AGATAAATAA，

(p₁₂)ATCGATCTAG。

在一些实施方式中，根据本公开所述的具有启动子活性的多核苷酸，其中，所述突变体的核苷酸序列选自如SEQ ID NO：5-16任一项所示的序列。

本公开还提供了一种转录表达盒，其中，所述转录表达盒包含根据本公开所述的具有启动子活性的多核苷酸；可选地，所述转录表达盒还含有目标基因，所述目标基因与所述具有启动子活性的多核苷酸可操作地连接；优选地，所述目标基因为蛋白编码基因。

本公开还提供了一种重组表达载体，其中，所述重组表达载体包含根据本公开所述的具有启动子活性的多核苷酸，或本公开所述的转录表达盒。

本公开还提供了一种重组宿主细胞，其中，所述重组宿主细胞包含根据本公开所述的转录表达盒，或根据本公开所述的重组表达载体。

在一些实施方式中，根据本公开所述的重组宿主细胞，其中，所述宿主细胞来源于棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属；优选地，所述宿主细胞为谷氨酸棒杆菌或大肠杆菌；更优选地，所述宿主细胞为谷氨酸棒杆菌ATCC 13032、谷氨酸棒杆菌ATCC 13869或谷氨酸棒杆菌ATCC 14067。

本公开还提供了一种根据本公开所述的具有启动子活性的多核苷酸，根据本公开所述的转录表达盒，根据本公开所述的重组表达载体，根据本公开所述的重组宿主细胞在如下至少一种中的用途：

(a)调控基因的转录水平，或制备用于调控基因的转录水平的试剂或试剂盒；

(b)制备蛋白，或制备用于制备蛋白的试剂或试剂盒；

(c)生产目标化合物，或制备用于生产目标化合物的试剂或试剂盒。

在一些实施方式中，根据本公开所述的用途，其中，所述蛋白选自基因表达调控蛋白或与目标化合物合成相关的蛋白。

在一些实施方式中，根据本公开所述的用途，其中，所述目标化合物包括氨基酸、有机酸中的至少一种；可选地，所述氨基酸包括脯氨酸、赖氨酸、谷氨酸、苏氨酸、甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸中的至少一种，所述有机酸包括柠檬酸、琥珀酸、乳酸、醋酸、丁酸、棕榈酸、草酸、酒石酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的至少一种。

本公开还提供了一种调控目标基因转录的方法，其中，所述方法包括将根据本公开所述的具有启动子活性的多核苷酸与目标基因可操作地连接的步骤。

本公开还提供了一种制备蛋白的方法，其中，所述方法包括利用本公开所述的转录表达盒，本公开所述的重组表达载体，或本公开所述的重组宿主细胞表达所述蛋白的步骤；可选地，所述蛋白为与目标化合物合成相关的蛋白或基因表达调控蛋白；

任选地，所述方法还包括分离或纯化所述蛋白的步骤。

本公开还提供了一种生产目标化合物的方法，其中，所述方法包括利用本公开所述的转录表达盒，本公开所述的重组表达载体，或本公开所述的重组宿主细胞表达与目标化合物合成相关的蛋白或基因表达调控蛋白，在所述与目标化合物合成相关的蛋白或所述基因表达调控蛋白存在的环境下生产目标化合物的步骤；

可选地，所述目标化合物包括氨基酸、有机酸中的至少一种；可选地，所述氨基酸包括赖氨酸、谷氨酸、苏氨酸、脯氨酸、甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸中的至少一种，所述有机酸包括柠檬酸、琥珀酸、乳酸、醋酸、丁酸、棕榈酸、草酸、酒石酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的至少一种；

可选地，所述与目标化合物合成相关的蛋白为与L-氨基酸合成相关的蛋白；可选地，所与L-氨基酸合成相关的蛋白包括丙酮酸羧化酶、磷酸烯醇式丙酮酸羧化酶、γ-谷氨酰激酶、谷氨酸半醛脱氢酶、吡咯啉-5-羧酸还原酶、氨基酸运输蛋白、ptsG系统、丙酮酸脱氢酶、高丝氨酸脱氢酶、草酰乙酸脱羧酶、葡萄糖酸阻遏蛋白、葡萄糖脱氢酶、天冬氨酸激酶、天冬氨酸半醛脱氢酶、天冬氨酸氨裂合酶、二氢吡啶二羧酸合成酶、二氢吡啶甲酸还原酶、琥珀酰二氨基庚二酸氨基转移酶、四氢吡啶二羧酸酯琥珀酰酶、琥珀酰二氨基庚二酸脱酰基酶、二氨基庚二酸差向异构酶、二氨基庚二酸脱酰基酶、甘油醛-3-磷酸脱氢酶、转酮酶、二氨基庚二酸脱氢酶和丙酮酸羧化酶中的一种或两种以上的组合；

任选地，所述方法还包括分离或纯化所述目标化合物的步骤。

发明的效果

在一些实施方式中，本公开提供的具有启动子活性的多核苷酸，为在如SEQ IDNO：2-4任一项所示序列的多核苷酸基础上获得的突变体，本公开中的突变体在盐浓度或渗透压升高的环境下具有增强的启动子活性，是一种高盐、高渗透压诱导型的启动子。与tac、trc等诱导型启动子相比，本公开中的突变体不需要价格高昂并具有一定毒性的IPTG为诱导剂。与野生型启动子相比，本公开中的突变体在高盐、高渗透压环境下的启动子活性较野生型启动子进一步提高。将突变体与目标基因可操作地连接，可以提高目标基因的表达效率，进而稳定、高效的生产目标化合物。并且，在高盐或高渗透压诱导的环境下，将突变体应用于目标化合物生产的转化率高于野生型的启动子，为氨基酸、有机酸等目标化合物的工业发酵提供了一种极具应用潜力的诱导型启动子。

在一些实施方式中，本公开提供的具有启动子活性的多核苷酸，其启动子活性与野生型的启动子相比，在盐浓度或渗透压升高的环境中具有1-8倍以上提高的启动子活性。

在一些更为具体的实施方式中，本公开提供的具有启动子活性的多核苷酸，其启动子活性与野生型的启动子相比，在盐浓度或渗透压升高的环境中具有1.85-7.62倍提高的启动子活性。

在一些实施方式中，本公开提供了转录表达盒、重组表达载体、重组宿主细胞，包含上述具有启动子活性的多核苷酸。在转录表达盒、重组表达载体、重组宿主细胞中，具有启动子活性的多核苷酸与目标基因可操作地连接，能够提高目标化合物合成途径中关键基因在高盐、高渗透压的胁迫环境下的表达强度。

在一些实施方式中，本公开提供了制备蛋白的方法，能够提高与氨基酸、有机酸等合成相关的蛋白或基因表达调控蛋白的表达量，进而实现目标化合物的高效生产。

在一些实施方式中，本公开提供了生产目标化合物的方法，利用上述具有启动子活性的多核苷酸，能够提高与目标化合物合成相关的蛋白在胁迫环境下的表达，从而稳定、高效的生产目标化合物，达到提高目标化合物的代谢流、过量积累目标化合物的目的。

附图说明

图1示出了不同长度NCgl1418启动子的活性比较结果。

具体实施方式

当在权利要求和/或说明书中与术语“包含”联用时，词语“一(a)”或“一(an)”可以指“一个”，但也可以指“一个或多个”、“至少一个”以及“一个或多于一个”。

如在权利要求和说明书中所使用的，词语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的，并不排除额外的、未引述的元件或方法步骤。

在整个申请文件中，术语“约”表示：一个值包括测定该值所使用的装置或方法的误差的标准偏差。

虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”，但除非明确表示仅为替代物或替代物之间相互排斥外，权利要求中的术语“或”是指“和/或”。

当用于权利要求书或说明书时，选择/可选/优选的“数值范围”既包括范围两端的数值端点，也包括相对于前述数值端点而言，所述数值端点中间所覆盖的所有自然数。

如本公开所使用的，术语“多核苷酸”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式，也可以是更大的核苷酸序列结构的一个组成部分，其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的，能够通过标准分子生物学方法(例如，使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个DNA序列(即A、T、G、C)表示时，这也包括一个RNA序列(即A、U、G、C)，其中“U”取代“T”。换句话说，“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物，或者可以是一个较大核苷酸结构的组成部分或成分，如表达载体或多顺反子序列。多核苷酸包括DNA、RNA和cDNA序列。

如本公开所使用的，术语“野生型的”指在自然界中可以找到的对象。例如，一种存在于生物体中，可以从自然界的一个来源中分离出来并且在实验室中没有被人类有意修改的多肽或多核苷酸序列是天然存在的。如本公开所用的，“天然存在的”和“野生型的”是同义词。在一些实施方式中，本公开中野生型的启动子是指野生型NCgl1418基因的启动子，也即如SEQ ID NO：2所示序列的多核苷酸。

如本公开所使用的，术语“突变体”是指相对于“野生型”，或者“相比较的”多核苷酸或多肽，在一个或多个(例如，若干个)位置处包含改变(即，取代、插入和/或缺的多核苷酸，其中，取代是指用不同的核苷酸置换占用一个位置的核苷酸。缺失是指去除占据某一位置的核苷酸。插入是指在邻接并且紧随占据位置的核苷酸之后添加核苷酸。

在一些实施方式中，本公开的“突变”为“取代”，是由一个或多个核苷酸中的碱基被另一个不同的碱基取代所引起的突变，也称为碱基置换突变(subsititution)或点突变(point mutation)。

具体来说，SEQ ID NO：1所示的序列是NCgl1418基因启动子的核心区序列，包括-35区和-10区主要序列。本公开中的突变体是在-35区附近位置处引入的突变的核苷酸，并且发现在上述位置处引入突变后，突变体在高盐或高渗透压下的启动子活性明显增强。

在一些实施方式中，包含如SEQ ID NO：2所示序列的多核苷酸的突变体，是指包含如SEQ ID NO：2所示序列的多核苷酸的突变体，所述突变体在SEQ ID NO：2所示序列的第170-179位中的一个或多个位置处具有突变的核苷酸，且不包含SEQ ID NO：2所示序列的第170-179位突变为ACACCGAGTG的多核苷酸。与包含SEQ ID NO：2所示序列的多核苷酸相比，突变体具有提高的启动子活性。在一些更具体地实施方式中，与包含SEQ ID NO：2所示序列的多核苷酸相比，突变体在盐浓度、渗透压升高的环境下具有提高的启动子活性。

在一些实施方式中，包含如SEQ ID NO：3所示序列的多核苷酸的突变体，是指包含如SEQ ID NO：3所示序列的多核苷酸的突变体，所述突变体在SEQ ID NO：3所示序列的第130-139位中的一个或多个位置处具有突变的核苷酸，且不包含SEQ ID NO：3所示序列的第130-139位突变为ACACCGAGTG的多核苷酸。与包含SEQ ID NO：3所示序列的多核苷酸相比，突变体具有提高的启动子活性。在一些更具体地实施方式中，与包含SEQ ID NO：3所示序列的多核苷酸相比，突变体在盐浓度、渗透压升高的环境下具有提高的启动子活性。

在一些实施方式中，包含如SEQ ID NO：4所示序列的多核苷酸的突变体，是指包含如SEQ ID NO：4所示序列的多核苷酸的突变体，所述突变体在SEQ ID NO：4所示序列的第72-81位中的一个或多个位置处具有突变的核苷酸，且不包含SEQ ID NO：4所示序列的第72-81位突变为ACACCGAGTG的多核苷酸。与包含SEQ ID NO：4所示序列的多核苷酸相比，突变体具有提高的启动子活性。在一些更具体地实施方式中，与包含SEQ ID NO：4所示序列的多核苷酸相比，突变体在盐浓度、渗透压升高的环境下具有提高的启动子活性。

在一些实施方式中，本公开中的突变体，与如SEQ ID NO：2所示序列的多核苷酸相比，在盐浓度或渗透压升高的环境下具有1-8倍以上提高的启动子活性。

进一步的，突变体与SEQ ID NO：2所示序列的多核苷酸相比，在盐浓度或渗透压升高的环境下具有2.11、1.85、3.23、3.07、3.57、2.78、3.90、3.28、2.62、2.70、4.47、7.62倍的提高的启动子活性。

如本公开所使用的，术语“启动子”是指一种核酸分子，通常位于目标基因编码序列的上游，为RNA聚合酶提供识别位点，并位于mRNA转录起始位点的5’方向的上游。它是不被翻译的核酸序列，RNA聚合酶与这一核酸序列结合后启动目标基因的转录。在核糖核酸(RNA)的合成中，启动子可以和调控基因转录的转录因子产生相互作用，控制基因表达(转录)的起始时间和表达的程度，包含核心启动子区域和调控区域，就像“开关”，决定基因的活动，继而控制细胞开始生产哪一种蛋白质。

如本公开所使用的，术语“启动子核心区”是指位于原核生物启动子区的一段核酸序列，是发挥启动子功能的核心序列区，主要包括-35区、-10区、-35区和-10区之间的区域以及转录起始位点，-35区是RNA聚合酶的识别位点，-10区是RNA聚合酶的结合位点。在一些实施方式中，本公开的具有启动子活性的多核苷酸，是包含NCgl1418基因的启动子核心区，且在启动子核心区的-35区上游引入突变的突变体，以获得相比NCgl1418基因的启动子明显提高的启动子活性。

如本公开所使用的，术语“序列同一性”和“同一性百分比”指两个或更多个多核苷酸或多肽之间相同(即同一)的核苷酸或氨基酸的百分比。两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定：将多核苷酸或多肽的核苷酸或氨基酸序列对准且对经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分，且将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸(即取代或突变)或缺失核苷酸(即一个或两个多核苷酸中的核苷酸插入或核苷酸缺失)而在一个位置处不同。多肽可例如通过含有不同氨基酸(即取代或突变)或缺失氨基酸(即一个或两个多肽中的氨基酸插入或氨基酸缺失)而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言，可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。

在一些实施方式中，当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时，两个或多个序列或子序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％核苷酸的“序列同一性”或“同一性百分比”。在某些实施方案中，所述序列在任一或两个相比较的生物聚合物(例如，多核苷酸)的整个长度上基本相同。

如本公开所使用的，术语“互补的”是指在核苷酸或核苷酸之间的杂交或碱基配对，例如双链DNA分子的两条链之间或者寡核苷酸引物与被测序或扩增的单链核苷酸上的引物结合位点之间等。

如本公开所使用的，术语“高严格条件”是指，对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃处在5X SSPE(saline sodium phosphate EDTA)、0.3％SDS、200微克/ml剪切并变性的鲑精DNA和50％甲酰胺中预杂交和杂交12至24小时。最后在65℃处使用2X SSC、0.2％SDS将载体材料洗涤三次，每次15分钟。

如本公开所使用的，术语“非常高严格条件”是指，对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃处在5X SSPE(saline sodium phosphate EDTA)、0.3％SDS、200微克/ml剪切并变性的鲑精DNA和50％甲酰胺中预杂交和杂交12至24小时。最后在70℃处使用2X SSC、0.2％SDS将载体材料洗涤三次，每次15分钟。

在一些具体的实施方案中，本公开中的具有启动子活性的多核苷酸能够用于起始蛋白编码基因的表达。在另外一些实施方案中，本公开中的具有启动子活性的多核苷酸能够用于起始非编码基因的表达。

如本公开所使用的，术语“表达”包括涉及RNA产生及蛋白产生的任何步骤，包括但不限于：转录、转录后修饰、翻译、翻译后修饰和分泌。

如本公开所使用的，术语“转录表达盒”是包含具有启动子活性的多核苷酸的重组表达元件。在一些实施方式中，具有启动子活性的多核苷酸为包含如SEQ ID NO：2所示序列的第170-179位核苷酸的多核苷酸的突变体。在一些实施方式中，具有启动子活性的多核苷酸为包含如SEQ ID NO：3所示序列的第130-139位核苷酸的多核苷酸的突变体。在一些实施方式中，具有启动子活性的多核苷酸为包含如SEQ ID NO：4所示序列的第72-81位核苷酸的多核苷酸的突变体。在一些更为具体的实施方式中，转录表达盒中包括与突变体可操作地连接的目标基因，利用本公开中启动子活性提高的突变体对目标基因的表达进行调控。在一些实施方式中，对目标基因进行调控的转录调控元件除了具有启动子活性的突变体，还可以包含增强子、沉默子、绝缘子等元件。在一些实施方式中，本公开中目标基因具体为蛋白编码基因。目标基因与具有启动子活性的多核苷酸“可操作地连接”，是指将具有启动子活性的多核苷酸与目标基因功能性连接，以启动和介导目标基因的转录，所述可操作地连接的方式可以采用本领域技术人员所述的任何方式。

如本公开所使用的，术语“载体”指的是DNA构建体，其含有与合适的控制序列可操作地连接的DNA序列，从而在合适的宿主中表达目标基因。“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括，例如包含i)对基因表达具有调控作用的遗传元素的集合，例如启动子和增强子；ii)转录成mRNA并翻译成蛋白质的结构或编码序列；以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要，并可以使用任何载体，包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列，例如细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体，来自如牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。本公开中，“重组表达载体”与“重组载体”可以互换地使用。

如本公开所使用的，术语“目标基因”涉及与本公开中具有启动子活性的多核苷酸连接，以对其转录水平进行调控的任一种的基因。

在一些实施方案中，目标基因是指编码微生物中目标蛋白质的基因。示例性的，目标基因是编码与目标化合物的生物合成相关的酶的基因、编码与还原力相关的酶的基因，编码与糖酵解或TCA循环相关的酶的基因，或编码与目标化合物的释放相关的酶的基因等等。

如本公开所使用的，术语“目标化合物”可以选自氨基酸、有机酸，也可以选自本领域中可能通过生物合成得到的其他种类的化合物。

在一些实施方式中，目标化合物为“氨基酸”或“L-氨基酸”。“氨基酸”或“L-氨基酸”通常是指其中氨基和羧基结合至相同碳原子的蛋白质的基本构成单元。示例性的，氨基酸选自甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苏氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、谷氨酸、赖氨酸、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸、脯氨酸中的一种或两种以上的组合，或者是本领域中其他种类的氨基酸。

在一些实施方式中，目标化合物为有机酸。有机酸可以是具有酸性的有机化合物，例如，其中包括羧基和磺酸基的那些化合物。示例性的，有机酸包括乳酸、醋酸、琥珀酸、丁酸、棕榈酸、草酸、酒石酸、柠檬酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的一种或两种以上的组合，或者是本领域中其他种类的有机酸。

本公开中的术语“蛋白编码基因”是指能够通过一定的规则指导蛋白的合成DNA分子，蛋白编码基因指导蛋白合成的过程一般包括以双链DNA为模板的转录过程和以mRNA为模板的翻译过程。蛋白编码基因含有CDS序列(Coding Sequence)，能够指导编码蛋白质的mRNA的产生。

示例性的，蛋白编码基因包括但不限于用于编码与目标化合物合成相关的蛋白，在一些实施方式中，蛋白编码基因涉及用于编码与合成L-氨基酸的相关的蛋白。示例性的，与合成L-氨基酸的相关的蛋白包括但不限于丙酮酸羧化酶、磷酸烯醇式丙酮酸羧化酶、γ-谷氨酰激酶、谷氨酸半醛脱氢酶、吡咯啉-5-羧酸还原酶、氨基酸运输蛋白、ptsG系统、丙酮酸脱氢酶、高丝氨酸脱氢酶、草酰乙酸脱羧酶、葡萄糖酸阻遏蛋白、葡萄糖脱氢酶中的一种或两种以上的组合。在一些实施方式中，与合成L-氨基酸的相关的蛋白为与合成L-赖氨酸相关的蛋白，对于与合成L-赖氨酸的相关的蛋白，包括天冬氨酸激酶、天冬氨酸半醛脱氢酶、天冬氨酸氨裂合酶、二氢吡啶二羧酸合成酶、二氢吡啶甲酸还原酶、琥珀酰二氨基庚二酸氨基转移酶、四氢吡啶二羧酸酯琥珀酰酶、琥珀酰二氨基庚二酸脱酰基酶、二氨基庚二酸差向异构酶、二氨基庚二酸脱酰基酶、甘油醛-3-磷酸脱氢酶、赖氨酸运输蛋白、转酮酶、二氨基庚二酸脱氢酶和丙酮酸羧化酶中的一种或两种以上的组合。

在一些实施方式中，蛋白编码基因涉及用于编码与合成有机酸相关的蛋白，示例性的，蛋白编码基因用于编码与合成柠檬酸有关的蛋白，或用于编码与合成琥珀酸有关的蛋白。在一些实施方式中，蛋白编码基因涉及与基因编辑相关的蛋白，例如Cpf1蛋白。

本公开的术语“基因表达调控蛋白”包括不限于外源的基因表达调控工具蛋白，例如CRISPRi调控需要的dCas9蛋白、dCpf1蛋白，sRNA调控需要的Hfq蛋白等，以及内源或外源的转录调控因子，进而调控代谢通路中关键基因的表达。

本公开中的术语“宿主细胞”意指易于用包含本公开的多核苷酸的转录起始元件或表达载体转化、转染、转导等的任何细胞类型。术语“重组宿主细胞”涵盖导入转录起始元件或重组表达载体后不同于亲本细胞的宿主细胞，重组宿主细胞具体通过转化来实现。

本公开中的术语“转化”具有本领域技术人员普遍理解的意思，即将外源性的DNA导入宿主的过程。所述转化的方法包括任何将核酸导入细胞的方法，这些方法包括但不限于电穿孔法、磷酸钙沉淀法、氯化钙(CaCl₂)沉淀法、微注射法、聚乙二醇(PEG)法、DEAE-葡聚糖法、阳离子脂质体法以及乙酸锂-DMSO法。

本公开的宿主细胞可以是原核细胞或真核细胞，只要是能够导入本公开的具有启动子活性的多核苷酸的细胞即可。在一些实施方式中，宿主细胞指原核细胞，具体地，宿主细胞来源于适合发酵生产氨基酸、有机酸的微生物，例如棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属。作为优选地，宿主细胞是来源于棒状杆菌属的谷氨酸棒杆菌。其中，谷氨酸棒杆菌可以是谷氨酸棒杆菌ATCC 13032、谷氨酸棒杆菌ATCC 13869或谷氨酸棒杆菌ATCC 14067等。

本公开的宿主细胞的培养可以根据本领域的常规方法进行，包括但不限于孔板培养、摇瓶培养、批次培养、连续培养和分批补料培养等，并可以根据实际情况适当地调整各种培养条件如温度、时间和培养基的pH值等。

除非在本公开中另外定义或由背景清楚指示，否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。

包含NCgl1418基因的启动子核心区的突变体

本公开利用NCgl1418基因的启动子核心区序列，在NCgl1418基因的启动子-35区上游引入突变，得到包含-35区上游突变的NCgl1418基因的启动子核心区的突变体。

NCgl1418基因的启动子是一种高盐、高渗透压诱导型的启动子，在盐浓度、渗透压升高的环境下能够表现出明显增强的启动子活性，能够适应随发酵时间延长不断提高的盐浓度、渗透压等的胁迫环境，保证目标化合物合成途径中关键基因的高效表达，进而有效提高目标化合物的转化率。

本公开中的具有启动子活性的多核苷酸，通过对NCgl1418基因的启动子核心区进行突变，具体地是在NCgl1418基因的启动子核心区的-35区上游的ACACCGAGTG引入突变，获得了在高盐或高渗透压环境下启动子活性进一步提高的突变体，为发酵微生物的基因工程育种以及目标化合物的高效生产提供了新型的诱导型启动子。与NCgl1418基因的野生型启动子相比，本公开中的突变体在盐浓度或渗透压升高的环境下表现出提高的启动子活性；在应用于目标化合物的发酵时，突变体与野生型启动子相比，表现出更高的目标化合物的转化率。

此外，通过对启动子进行不同长度的截短，分别获得了具有203bp(SEQ ID NO:3)、145bp(SEQ ID NO:4)的NCgl1418启动子片段，这两个片段都具备NCgl1418启动子的核心区，在盐浓度、渗透压升高的环境下也同样能够表现出明显增强的启动子活性。因此，采用上述实施例中的启动子改造方法，即对SEQ ID NO：3所示序列的第130-139位中的一个或多个位置进行突变，或者对SEQ ID NO：4所示序列的第72-81位中的一个或多个位置进行突变，会获得同样诱导活性增强的启动子突变体。

在本公开中，“高盐环境”可以是培养基中高浓度Na₂SO₄、NaCl、K₂SO₄、KCl等无机盐离子，或是随发酵时间延长、发酵液中赖氨酸等产物或某些中间代谢物积累而增加的浓度(例如，赖氨酸硫酸盐等)，或是由于底物流加而增加的浓度(例如，硫酸铵等底物)，或是发酵液中可能出现的其他任意盐的浓度。

在一些实施方式中，突变体在对应SEQ ID NO：2所示序列的第170-179位中的1个、2个、3个、4个、5个、6个、7个、8个、9个或10个位置处具有突变的核苷酸。

在一些实施方式中，突变体在对应SEQ ID NO：3所示序列的第130-139位中的1个、2个、3个、4个、5个、6个、7个、8个、9个或10个位置处具有突变的核苷酸。

在一些实施方式中，突变体在对应SEQ ID NO：4所示序列的第72-81位中的1个、2个、3个、4个、5个、6个、7个、8个、9个或10个位置处具有突变的核苷酸。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，还包括与NCgl1418基因的启动子的突变体的核苷酸序列方向互补的多核苷酸。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，还包括在高严格性杂交条件或非常高严格性杂交条件下，与包含NCgl1418基因的启动子的突变体或杂交的序列的反向互补的多核苷酸。并且所述多核苷酸在对应SEQ ID NO：2所示序列的第170-179位中的核苷酸序列不为ACACCGAGTG，在对应SEQ ID NO：3所示序列的第130-139位的核苷酸序列不为ACACCGAGTG，在对应SEQ ID NO：4所示序列的第72-81位的核苷酸序列不为ACACCGAGTG。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，为与上述的多核苷酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性(包括这些数值之间所有范围和百分数)的序列。并且所述多核苷酸在对应SEQ ID NO：2所示序列的第170-179位中的核苷酸序列不为ACACCGAGTG，在对应SEQ ID NO：3所示序列的第130-139位的核苷酸序列不为ACACCGAGTG，在对应SEQ ID NO：4所示序列的第72-81位的核苷酸序列不为ACACCGAGTG。

在一些具体的实施方式中，所述突变体对应SEQ ID NO：2所示序列的第170-179位的核苷酸序列，在对应SEQ ID NO：3所示序列的第130-139位的核苷酸序列，在对应SEQ IDNO：4所示序列的第72-81位的核苷酸序列选自如下(p₁)-(p₁₂)组成的组中的任一项：(p₁)TACTTGCAGA，(p₂)AGTGCTGAAA，(p₃)GCACGAAAGG，(p₄)TATCTAGAGG，(p₅)AGGCTTGTCG，(p₆)CGCTTCTTTC，(p₇)TAACTCTTGG，(p₈)CCAAGTTCCA，(p₉)CGGTGCCACA，(p₁₀)AGCAGTTAGG，(p₁₁)AGATAAATAA，(p₁₂)ATCGATCTAG。

在一些具体的实施方式中，所述突变体的核苷酸序列选自如SEQ ID NO：5-16任一项所示的序列。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，与SEQ ID NO：2所示序列的多核苷酸相比，具有1-8倍以上提高的启动子活性。进一步的，与SEQ ID NO：2所示序列的多核苷酸相比，在盐浓度或渗透压升高的环境下具有2.11、1.85、3.23、3.07、3.57、2.78、3.90、3.28、2.62、2.70、4.47、7.62倍的增强启动子活性。

重组表达载体和重组宿主细胞

在一些实施方式中，本公开以ATCC13032基因组(Corynebacterium glutamicumATCC 13032，NC_003450.3))为模板，以1418-F和1418-R为引物，扩增获得NCgl1418基因启动子的DNA片段；以pXM-gfp质粒为模板，以pGFP-F和pGFP-R引物，扩增去除lacI基因和tac启动子的载体片段；将上述片段重组连接，得到重组表达载体pXM-P_NCgl1418-gfp。

在一些实施方式中，本公开以pXM-P_NCgl1418-gfp为模板，以1418mutant-F和1418mutant-R引物对pXM-P_NCgl1418-gfp进行反向PCR扩增，得到的线性化质粒片段；将线性化质粒片段进行磷酸化和连接，收集抗性克隆，得到NCgl1418基因的启动子突变体文库。

在一些实施方式中，本公开以NCgl1418基因的启动子突变体文库和pXM-Con、pXM-P_NCgl1418-gfp分别转化谷氨酸棒杆菌ATCC13032，得到重组宿主细胞。通过平板培养后筛选重组宿主细胞的荧光强度，进行启动子强度提高的突变体的筛选。

在一些实施方案中，本公开以ATCC 13032基因组为模板，利用引物1418-D-F和1418-D-R，通过PCR扩增得到NCgl1418基因的启动子序列。以pXM-07为模板，先利用引物pXM07-F1和pXM07-R1，通过PCR扩增获得带有dCpf1的载体片段一；然后利用引物pXM07-F2和pGFP-R，通过PCR扩增获得带有复制起点的载体片段二；以pEC-26为模板，利用引物pEC26-F和pEC26-R，通过PCR扩增获得靶向gltA、pgi、hom和pck基因的crRNA array片段；将上述片段回收后，进行重组连接，得到重组载体pXM-P_NCgl1418-dCpf1。

在一些具体的实施方式中，本公开以pXM-P_NCgl1418-dCpf1为模板，分别利用引物35P7-F和pXM-R，以及引物pXM-F和35P7-R1进行PCR扩增，获得两个载体片段，将上述片段进行重组连接，得到重组载体pXM-P_35P7-dCpf1。

在一些具体的实施方案中，本公开以ATCC 13032基因组为模板,利用引物1418-L-F和1418-L-R，以及引物lysE-F和lysE-R，分别通过PCR扩增得到NCgl1418基因的启动子序列和lysE基因的DNA序列。以pEC-XK99E为模板，利用引物pEC-F和pEC-R通过PCR扩增获得载体片段，将上述三个片段回收后重组连接，得到重组表达载体pEC-P_NCgl1418-lysE。

在一些具体的实施方案中，本公开以pEC-P_NCgl1418-lysE为模板，利用引物35P7-F和35P7-R2，通过PCR扩增得到带有突变启动子35P7且包含lysE基因的载体片段，然后将线性化的载体片段磷酸化，并通过自身环化构建获得pEC-P_35P7-lysE。

在另外一些实施方式中，本公开还可以根据具体的克隆需要，利用35P1、35P2、35P3、35P4、35P5、35P6、35P8、35P9、35P10、35P11、35P12的启动子序列构建所需的重组载体。

在一些实施方式中，本公开的谷氨酸棒杆菌SCgL30菌株，是将谷氨酸棒杆菌ATCC13032基因组上天冬氨酸激酶(lysC基因编码)第311位的苏氨酸突变为异亮氨酸，构建获得一株具有一定赖氨酸合成能力的菌株SCgL30。

在一些实施方式中，本公开将pEC-P_35P7-lysE转化SCgL30重组菌株，获得重组宿主细胞。在一些实施方式中，本公开将pXM-P_35P7-dCpf1转化SCgL30重组菌株，获得重组宿主细胞。在另外一些实施方式中，本公开还可以分别将包含35P1、35P2、35P3、35P4、35P5、35P6、35P8、35P9、35P10、35P11、35P12的启动子序列的重组载体转化SCgL30重组菌株，获得重组宿主细胞。

目标化合物的生产过程

(1)将具有启动子活性的多核苷酸，与目标化合物合成相关的蛋白编码基因或基因表达调控蛋白编码基因可操作的连接，得到能够与目标化合物合成相关的蛋白或基因表达调控蛋白的重组表达载体，利用重组表达载体转化宿主细胞，获得重组宿主细胞。

(2)对重组宿主细胞进行发酵培养，从重组宿主细胞或重组宿主细胞的培养液中收集目标化合物，完成目标化合物的生产过程。

上述生产过程中，由于多核苷酸具有改进的启动子活性，在重组宿主细胞中，与目标化合物合成相关的蛋白或基因表达调控蛋白的编码基因的转录活性提高，与目标化合物合成相关的蛋白或基因表达调控蛋白的表达量提高，进而使目标化合物的产量显著提升。

在一些具体的实施方案中，本公开采用的制备氨基酸的方法的步骤中，不添加诱导剂。在一个具体的实施方案中，本公开采用的制备氨基酸的方法的步骤中，不添加IPTG。

在一些实施方式中，目标化合物为氨基酸，与目标化合物合成相关的蛋白编码基因是指与合成氨基酸相关的蛋白编码基因。在一些实施方式中，目标化合物为L-氨基酸，与合成氨基酸相关的蛋白编码基因是指与合成L-氨基酸相关的蛋白编码基因。在一些具体的实施方案中，L-氨基酸为L-赖氨酸，与氨基酸合成相关的蛋白为赖氨酸转运蛋白LysE，以具有启动子活性的多核苷酸增加LysE的表达，可促进赖氨酸的胞外排放和胞外积累。在一些实施方案中，基因表达调控蛋白为dCpf1，dCpf1可以靶向调控gltA、pgi、hom或pck等目标基因；具有启动子活性的多核苷酸可以增加高盐环境条件下dCpf1的表达，提高了靶基因的弱化程度，进一步促进了赖氨酸的合成和底物利用。

在一些具体的实施方案中，宿主细胞为谷氨酸棒杆菌(Corynebacteriumglutamicum)，谷氨酸棒杆菌是用于生产L-赖氨酸的重要菌株，高盐、高渗透压诱导型的多核苷酸、转录表达盒或重组表达载体对谷氨酸棒杆菌进行改造后，谷氨酸棒杆菌内与赖氨酸合成相关的蛋白的表达量显著提高，具体为在高盐、高渗透压的环境下的表达量显著提高，使谷氨酸棒杆菌长时间发酵积累L-赖氨酸的能力大大提高。

在一些具体的实施方案中，宿主细胞是经过如下改良的谷氨酸棒杆菌：谷氨酸棒杆菌ATCC13032基因组上天冬氨酸激酶(lysC基因编码)第311位的苏氨酸突变为异亮氨酸。

在一些具体的实施方案中，重组宿主细胞的培养条件为：将重组宿主细胞接种含有相应抗生素的TSB培养基，30℃，220r/min过夜培养，按照初始OD 0.3分别转接添加或不添加0.6M硫酸钠(模拟发酵后期高浓度产物积累造成的高盐高渗环境)的赖氨酸发酵培养基，培养体系为24孔板装液1mL，30℃，800r/min培养36h后终止发酵，检测剩余葡萄糖含量、OD₆₀₀和赖氨酸产量。

对于赖氨酸发酵培养基，配方为：葡萄糖80g/L、酵母粉8g/L、尿素9g/L、K₂HPO₄1.5g/L、MOPS 42g/L、FeSO₄ 0.01g/L、MnSO₄ 0.01g/L、MgSO₄ 0.6g/L，氯霉素终浓度为5μg/mL，和/或卡那霉素终浓度为25μg/mL。

在一些具体的实施方案中，对于重组宿主细胞或重组细胞的培养液回收目标化合物，可通过本领域常用方法，包括但不限于：过滤、阴离子交换色谱、结晶或HPLC。

在本领域，用于操纵微生物的方法是已知的，如《分子生物学现代方法》(OnlineISBN：9780471142720,John Wiley and Sons,Inc.)、《微生物代谢工程：方法和规程》(Qiong Cheng Ed.,Springer)和《系统代谢工程：方法和规程》(Hal S.Alper Ed.,Springer)等出版物中被解释。

实施例

本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是，应当理解的是，详细描述和具体实施例(虽然表示本公开的具体实施方式)仅为解释性目的而给出，因为在阅读该详细说明后，在本公开的精神和范围内所作出的各种改变和修饰，对于本领域技术人员来说将变得显而易见。

本实施例中所用到的实验技术与实验方法，如无特殊说明均为常规技术方法，例如下列实施例中未注明具体条件的实验方法，通常按照常规条件如Sambrook等人，分子克隆：实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件，或按照制造厂商所建议的条件。实施例中所使用的材料、试剂等，如无特殊说明，均可通过正规商业渠道获得。

表1实施例中质粒构建所使用的引物序列如下所示：

实施例1.包含NCgl1418基因启动子序列的表征质粒构建

我们首先利用添加和不添加0.6M NaCl或赖氨酸硫酸盐的CGXII培养基培养谷氨酸棒状杆菌ATCC13032菌株，通过转录组测序分析，确定NCgl1418基因的启动子为高盐高渗诱导型启动子。此外，通过对启动子进行不同长度的截短，分别获得了具有203bp(SEQ IDNO:3)、145bp(SEQ ID NO:4)和94bp的NCgl1418启动子片段，分别比较高盐浓度(添加0.6M硫酸钠)和正常培养基条件下不同长度NCgl1418启动子的强度。结果见图1，数据显示94bp长度的NCgl1418启动子尽管包含了核心序列(-35区和-10区)，但却基本丧失了启动子的正常功能；145bp长度的启动子在高盐条件下虽然诱导强度有所下降，但仍可以达到243bp启动子活性的74％以上；203bp长度的启动子在高盐渗透压条件下基本保持了243bp启动子的活性，为243bp启动子活性的94％；以上结果表明NCgl1418启动子的启动子活性以及在高盐渗透压条件下的活性至少需要包括SEQ ID NO:3所示的145bp长度的DNA序列。

随后，根据NCBI公布的谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC 13032的基因组序列(NC_003450.3)，设计引物1418-F(SEQ ID NO:17)/1418-R(SEQ ID NO:18)。以ATCC 13032基因组为模板通过PCR扩增得到NCgl1418基因的启动子序列(SEQ ID NO:2)。同时，以文献报道的pXM-gfp为模板^[1]，利用引物pGFP-F(SEQ ID NO:19)和pGFP-R(SEQ IDNO:20)，通过PCR扩增获得去除lacI基因和tac启动子的载体片段。上述两个片段回收后，利用Vazyme Clon Express Multies一步重组试剂盒进行重组连接，获得重组载体pXM-P_NCgl1418-gfp。同时，利用T4PNK将载体片段磷酸化，并通过自身环化构建获得对照载体pXM-con。将上述重组载体转化谷氨酸棒杆菌ATCC 13032，获得重组菌株。

实施例2.NCgl1418基因启动子突变文库构建

鉴于启动子-35区前后序列对启动子的强度可能具有重要的调控作用，本实施例分别对NCgl1418基因启动子核心区(SEQ ID NO:1)的-35区前后序列进行随机突变。NCgl1418基因启动子核心区序列为：

TATTAAAGATCACACCGAGTGGTGGAATTTCCTCAAGTGATTTACCCACAATGGACTTTG，下划线处分别为启动子-35区和-10区主要序列；

具体突变序列为：

TATTAAAGATCNNNNNNNNNNGTGGAATTTCCTCAAGTGATTTACCCACAATGGACTTTG。

分别利用1418mutant-F(SEQ ID NO:34)和1418mutant-R(SEQ ID NO:35)引物对pXM-P_NCgl1418-gfp反向PCR扩增，通过对得到的线性化质粒片段进行磷酸化和连接，转化大肠杆菌T1感受态细胞，获得抗性克隆。对获得的所有克隆菌进行细胞收集并提取质粒，获得NCgl1418基因启动子的两种突变体文库。

实施例3.NCgl1418基因启动子突变文库筛选和突变启动子表征

将上述启动子突变体文库转化谷氨酸棒杆菌ATCC13032，使用菌株ATCC13032(pXM-Con)、ATCC13032(pXM-P_NCgl1418-gfp)作为空载体和野生型对照，对突变库进行正反三次筛选。首先，接种上述菌株于含有5μg/mL氯霉素的TSB培养基，30℃，220r/min培养8～10h后，按照初始OD 1分别转接添加0.6M Na₂SO₄的CGXIIY培养基，培养体系为24孔板装液1mL，30℃，800r/min培养6h后，将所得菌液用PBS缓冲液稀释50倍，然后超声处理6min后，通过流式细胞仪进行荧光分选(正向筛选，top 0.01％)。将分选得到的混合菌株接种于含有5μg/mL氯霉素的TSB培养基，30℃，220r/min过夜培养，用于下一次筛选。然后将混合菌株、空载体和野生型对照菌株接种于含有5μg/mL氯霉素的TSB培养基，30℃，220r/min培养8～10h后，按照初始OD 0.5分别转接CGXIIY培养基，培养体系为24孔板装液1mL，30℃，800r/min培养6h后，将所得菌液用PBS缓冲液稀释50倍，然后超声处理6min后，通过流式细胞仪进行荧光分选(反向筛选，bottom 1％)。最后，重复第一次正向筛选的过程。

将上述三次筛选获得的菌株及野生型NCgl1418启动子和无启动子对照菌株分别接种含有5μg/mL氯霉素的TSB培养基，30℃，220r/min过夜培养。其中，TSB液体培养基成份为(g/L)：葡萄糖，5g/L；酵母粉，5g/L；大豆蛋白胨，9g/L；尿素，3g/L；丁二酸，0.5g/L；K₂HPO₄·3H₂O，1g/L；MgSO₄·7H₂O，0.1g/L；生物素，0.01mg/L；维生素B1，0.1mg/L；MOPS，20g/L。

按照初始OD 0.5分别转接添加或不添加0.6M Na₂SO₄的CGXIIY培养基，培养体系为24孔板装液1mL，30℃，800r/min培养24h后检测不同菌株的GFP荧光强度及OD₆₀₀，利用单位菌体的荧光强度(扣除相同条件下对照菌株的单位菌体荧光强度)表征不同条件下突变启动子的相对强度。其中CGXIIY培养基配方为：葡萄糖50g/L、NH₄Cl 16.5g/L、尿素5g/L、KH₂PO₄ 1g/L、K₂HPO₄ 1g/L、MOPS 42g/L、MgSO₄ 0.25g/L、FeSO₄·2H₂O 0.01g/L、MnSO₄·H₂O0.01g/L、ZnSO₄·7H₂O 0.001g/L、CuSO₄ 0.2mg/L、NiCl·6H₂O 0.02mg/L、CaCl₂ 0.01g/L、原儿茶酸0.03g/L、生物素0.2mg/L、维生素B1 0.1mg/L，氯霉素终浓度为5μg/mL。根据检测获得的荧光强度筛选获得12个强诱导型突变启动子，高盐条件下启动子强度是野生型启动子的1.85-7.62倍，诱导活性均保持在1.64倍以上。其中35P7启动子强度是野生型启动子的3.9倍，而诱导活性达到了8.46，均显著高于野生型启动子(表2)。

表2

^a高盐条件下(添加Na₂SO₄)各启动子荧光强度/野生型启动子荧光强度

^b添加Na₂SO₄的荧光强度/不添加Na₂SO₄的荧光强度

实施例4.利用突变启动子调控dCpf1表达用于促进赖氨酸

根据NCBI公布的谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC 13032的基因组序列(NC_003450.3)，设计引物1418-D-F(SEQ ID NO:21)和1418-D-R(SEQ ID NO:22)，以ATCC 13032基因组为模板通过PCR扩增得到NCgl1418基因的启动子序列。同时，以文献报道的pXM-07为模板^[2]，先利用引物pXM07-F1(SEQ ID NO:23)和pXM07-R1(SEQ ID NO:24)，通过PCR扩增获得带有dCpf1的载体片段一；然后利用引物pXM07-F2(SEQ ID NO:25)和pGFP-R(SEQ ID NO:20)，通过PCR扩增获得带有复制起点的载体片段二。以文献报道的pEC-26为模板^[2]，利用引物pEC26-F(SEQ ID NO:26)和pEC26-R(SEQ ID NO:27)，通过PCR扩增获得靶向gltA、pgi、hom和pck基因的crRNA array片段。将上述三个片段回收后，利用VazymeClon Express Multies一步重组试剂盒进行重组连接，获得重组载体pXM-P_NCgl1418-dCpf1。同时，以pXM-07为模板，利用引物pXM07-F1(SEQ ID NO:23)和pGFP-R(SEQ ID NO:20)，通过PCR扩增获得载体片段三；将上述片段回收后与得到的NCgl1418基因的启动子序列片段通过Vazyme Clon Express Multies一步重组试剂盒进行重组连接，获得对照载体pXM-dCpf1-con。

以pXM-P_NCgl1418-dCpf1为模板，分别利用引物35P7-F(SEQ ID NO:36)和pXM-R(SEQID NO:40)，pXM-F(SEQ ID NO:39)和35P7-R1(SEQ ID NO:37)，通过PCR扩增分别获得两个载体片段(包含35P7启动子)，利用Vazyme Clon Express Multies一步重组试剂盒进行重组连接，获得重组载体pXM-P_35P7-dCpf1。类似地，以pXM-dCpf1-con为模板，利用上述相同引物和方法，构建获得相应的对照载体pXM-dCpf1-P_35P7con。

根据文献中公开的赖氨酸菌株构建方法^[3]，利用基于pK18mobsacB的同源重组技术将谷氨酸棒杆菌ATCC13032基因组上天冬氨酸激酶(lysC基因编码)第311位的苏氨酸突变为异亮氨酸，构建获得一株具有一定赖氨酸合成能力的菌株SCgL30。将上述重组载体pXM-P_35P7-dCpf1、pXM-P_NCgl1418-dCpf1、pXM-dCpf1-P_35P7con和pXM-dCpf1-con分别转化SCgL30菌株，获得重组菌株和对照菌株。将上述菌株分别接种含有5μg/mL氯霉素的TSB培养基，30℃，220r/min过夜培养，按照初始OD 0.3分别转接添加或不添加0.6M硫酸钠(模拟发酵后期高浓度产物积累造成的高盐高渗环境)的赖氨酸发酵培养基，培养体系为24孔板装液1mL，30℃，800r/min培养36h后终止发酵，检测剩余葡萄糖含量、OD₆₀₀和赖氨酸产量。其中赖氨酸发酵培养基配方为：葡萄糖80g/L、酵母粉8g/L、尿素9g/L、K₂HPO₄ 1.5g/L、MOPS 42g/L、FeSO₄ 0.01g/L、MnSO₄ 0.01g/L、MgSO₄ 0.6g/L，氯霉素终浓度为5μg/mL。检测结果见表3和表4，数据显示在不添加硫酸钠时，靶基因弱化菌株赖氨酸产量和葡萄糖转化率分别比对照菌株提高了28％和31％，均高于野生型NCgl1418启动子提升幅度为(23％和25％)。而在添加0.6M硫酸钠的高盐条件中，靶基因弱化菌株赖氨酸产量和葡萄糖转化率分别比对照菌株提高了52％和55％，明显高于野生型NCgl1418启动子提升幅度为(49％和40％)。上述结果说明高盐环境条件下dCpf1的表达强度更高，提高了靶基因的弱化程度，进一步促进了赖氨酸的合成和底物利用。

表3 35P7启动子调控dCpf1表达在赖氨酸合成中的应用效果

表4 NCgl1418野生型启动子调控dCpf1表达在赖氨酸合成中的应用效果

实施例5.利用突变启动子调控LysE表达在赖氨酸合成中的应用

根据NCBI公布的谷氨酸棒杆菌(Corynebacterium glutamicum)ATCC 13032的基因组序列NC_003450.3)，分别设计引物1418-L-F(SEQ ID NO:28)和1418-L-R(SEQ ID NO:29)，lysE-F(SEQ ID NO:30)和lysE-R(SEQ ID NO:31)。以ATCC 13032基因组为模板通过PCR扩增分别得到NCgl1418基因的启动子序列和lysE基因的DNA序列。同时，以文献报道的pEC-XK99E为模板^[4]，利用引物pEC-F(SEQ ID NO:32)和pEC-R(SEQ ID NO:33)，通过PCR扩增获得载体片段。将上述三个片段回收后，利用Vazyme Clon Express Multies一步重组试剂盒进行重组连接，并将连接产物转化到Trans T1感受态细胞，涂布卡那霉素抗性平板过夜培养，挑阳性克隆进行菌落PCR验证，并将正确转化子进行测序确认，获得的重组载体命名为pEC-P_NCgl1418-lysE。以pEC-P_NCgl1418-lysE为模板，利用引物35P7-F(SEQ ID NO:36)和35P7-R2(SEQ ID NO:38)，通过PCR扩增获得带有突变启动子35P7且包含lysE基因的载体片段。然后利用T4PNK将载体片段磷酸化，并通过自身环化构建获得pEC-P_35P7-lysE。

将上述重组载体pEC-P_NCgl1418-lysE、pEC-P_35P7-lysE和pEC-XK99E分别转化谷氨酸棒杆菌ScgL30，获得重组菌株和对照菌株。利用如实施例4的方法(抗生素替换为终浓度为25μg/mL的卡那霉素)验证NCgl1418启动子调控的LysE表达菌株在赖氨酸合成中的应用效果，结果见表5和表6。数据显示，在不添加硫酸钠时，35P7启动子调控的LysE表达菌株赖氨酸产量和葡萄糖转化率为3.00g/L和0.050g/g，分别比对照菌株提高了45％和52％，且高于野生型NCgl1418启动子38％和40％的提升幅度；而在添加0.6M硫酸钠的高盐条件下，LysE表达菌株赖氨酸产量和葡萄糖转化率达到了5.53g/L和0.128g/g，分别比对照菌株提高了124％和176％，且高于野生型NCgl1418启动子49％和59％的提升幅度，显示出良好的应用效果。

表5 35P7启动子调控LysE表达在赖氨酸合成中的应用效果

表6 野生型NCgl1418启动子调控LysE表达在赖氨酸合成中的应用效果

此外，本公开图1中证明了145bp长度的启动子在高盐渗透压条件下可以达到243bp启动子活性的74％以上；203bp长度的启动子在高盐渗透压条件下基本保持了243bp启动子的活性，为243bp启动子活性的94％；说明了由于SEQ ID NO：3和SEQ ID NO：4的启动子片段含有NCgl1418基因的启动子的核心区，SEQ ID NO：3和SEQ ID NO：4的启动子片段在盐浓度、渗透压升高的环境下也同样能够表现出明显增强的启动子活性。因此，采用上述实施例中对启动子核心区进行改造的方法，即对SEQ ID NO：3所示序列的第130-139位中的一个或多个位置进行突变，或者对SEQ ID NO：4所示序列的第72-81位中的一个或多个位置进行突变，会获得同样诱导活性增强的启动子突变体。

引用文献：

[1]Sun DH et al.,Journal of Industrial Microbiology&Biotechnology2019,46(2):203-208.

[2]Li MY et al.,Frontiers in Bioengineering and Biotechnology,2020,8:357.

[3]Becker,J.,et al.,Metab.Eng.,2011,13,159-168.

[4]O Kirchner,et al.Journal of Biotechnology,2003,104:287-299.

[5]Xu,J.Z.,et al.,Microb Cell Fact,2020,19,39.

[6]户红通等,中国酿造,2018,37(10),51-56.

本说明书公开的所有技术特征都可以任何组合方式进行组合。本说明所公开的每个特征也可以被其它具有相同、相等或相似作用的特征所替换。因此，除非特殊说明，所公开的每一特征仅仅是一系列相等或相似特征的实例。

此外，从上述描述中，本领域技术人员可从本公开中很容易清楚本公开的关键特征，在不脱离本公开的精神及范围的情况下，可对发明进行很多修改以适应各种不同的使用目的及条件，因此这类修改也旨在落入所附权利要求书的范围内。

序列表

<110> 中国科学院天津工业生物技术研究所

<120> 具有启动子活性的多核苷酸及其用途和生产目标化合物的方法

<130> 6A17-2133225I

<160> 40

<170> SIPOSequenceListing 1.0

<210> 1

<211> 60

<212> DNA

<213> Corynebacterium glutamicum

<400> 1

tattaaagat cacaccgagt ggtggaattt cctcaagtga tttacccaca atggactttg 60

<210> 2

<211> 243

<212> DNA

<213> Corynebacterium glutamicum

<400> 2

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatca caccgagtgg 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 3

<211> 203

<212> DNA

<213> Corynebacterium glutamicum

<400> 3

gacacctgtg agtttcaaac tccccattat cgccttagtc aggcggtagt ggggagtttt 60

tgtttatgca ggtggcgcga ttcttagatt tcataagggt aacagatctg tttctatgta 120

ttaaagatca caccgagtgg tggaatttcc tcaagtgatt tacccacaat ggactttgtt 180

gatacccaat tcgagaaagg cca 203

<210> 4

<211> 145

<212> DNA

<213> Corynebacterium glutamicum

<400> 4

tttgtttatg caggtggcgc gattcttaga tttcataagg gtaacagatc tgtttctatg 60

tattaaagat cacaccgagt ggtggaattt cctcaagtga tttacccaca atggactttg 120

ttgataccca attcgagaaa ggcca 145

<210> 5

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P1

<400> 5

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatct acttgcagag 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 6

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P2

<400> 6

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatca gtgctgaaag 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 7

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P3

<400> 7

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatcg cacgaaaggg 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 8

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P4

<400> 8

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatct atctagaggg 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 9

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P5

<400> 9

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatca ggcttgtcgg 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 10

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P6

<400> 10

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatcc gcttctttcg 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 11

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P7

<400> 11

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatct aactcttggg 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 12

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P8

<400> 12

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatcc caagttccag 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 13

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P9

<400> 13

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatcc ggtgccacag 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 14

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P10

<400> 14

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatca gcagttaggg 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 15

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P11

<400> 15

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatca gataaataag 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 16

<211> 243

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P12

<400> 16

taaaactcgc gatgaagtag aaaaacaacg caacacttaa gacacctgtg agtttcaaac 60

tccccattat cgccttagtc aggcggtagt ggggagtttt tgtttatgca ggtggcgcga 120

ttcttagatt tcataagggt aacagatctg tttctatgta ttaaagatca tcgatctagg 180

tggaatttcc tcaagtgatt tacccacaat ggactttgtt gatacccaat tcgagaaagg 240

cca 243

<210> 17

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> 1418-F

<400> 17

cttttcacca gtgagacggg taaaactcgc gatgaagtag 40

<210> 18

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<223> 1418-R

<400> 18

gttcttctcc tttactcatc attggccttt ctcgaattgg g 41

<210> 19

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> pGFP-F

<400> 19

atgagtaaag gagaagaact tttcac 26

<210> 20

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> pGFP-R

<400> 20

cccgtctcac tggtgaaaag 20

<210> 21

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> 1418-D-F

<400> 21

cttttcacca gtgagacggg taaaactcgc gatgaagtag 40

<210> 22

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> 1418-D-R

<400> 22

ttcttgataa attgacacca ttggcctttc tcgaattggg 40

<210> 23

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> pXM07-F1

<400> 23

gtgtcaattt atcaagaatt tgttaataaa 30

<210> 24

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> pXM07-R1

<400> 24

gcggatacat atttgaatgt atttag 26

<210> 25

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<223> pXM07-F2

<400> 25

acacgcgtct gagcagtatt catgagacaa taaccctgat aaatgc 46

<210> 26

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> pEC26-F

<400> 26

cattcaaata tgtatccgcg agagtcaatt cagggtggtg 40

<210> 27

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> pEC26-R

<400> 27

aatactgctc agacgcgtgt c 21

<210> 28

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> 1418-L-F

<400> 28

agcggcatgc atttacgttt aaaactcgcg atgaagtag 39

<210> 29

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<223> 1418-L-R

<400> 29

agatttccat gatcaccatc attggccttt ctcgaattgg g 41

<210> 30

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<223> lysE-F

<400> 30

atggtgatca tggaaatctt cattac 26

<210> 31

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> lysE-R

<400> 31

gtctgtttcc tgtgtgaaac taacccatca acatcagttt gatg 44

<210> 32

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> pEC-F

<400> 32

tttcacacag gaaacagacc atg 23

<210> 33

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> pEC-R

<400> 33

aacgtaaatg catgccgctt c 21

<210> 34

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<223> 1418mutant-F

<400> 34

nnnnnnnnnn gtggaatttc ctcaagtgat ttacc 35

<210> 35

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<223> 1418mutant-R

<400> 35

gatctttaat acatagaaac agatctgtta ccc 33

<210> 36

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P7-F

<400> 36

taactcttgg gtggaatttc ctcaagtgat ttac 34

<210> 37

<211> 51

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P7-R1

<400> 37

aaattccacc caagagttag atctttaata catagaaaca gatctgttac c 51

<210> 38

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> 35P7-R2

<400> 38

gatctttaat acatagaaac agatctgtta cc 32

<210> 39

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> pXM-F

<400> 39

caaaggcggt aatacggtta tc 22

<210> 40

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> pXM-R

<400> 40

aaccgtatta ccgcctttga g 21

Claims

1.一种具有启动子活性的多核苷酸，其中，所述多核苷酸选自如下(i)-(vi)组成的组中的任一项：

(ii)包含如SEQ ID NO：3所示序列的多核苷酸的突变体，所述突变体在SEQ ID NO：3所示序列的第130-139位中的一个或多个位置处具有突变的核苷酸；所述突变体的活性高于包含如SEQ ID NO：3所示序列的多核苷酸的启动子活性，且所述突变体在SEQ ID NO：3所示序列的第130-139位中的核苷酸序列不为ACACCGAGTG；

(iii)包含如SEQ ID NO：4所示序列的多核苷酸的突变体，所述突变体在SEQ ID NO：4所示序列的第72-81位中的一个或多个位置处具有突变的核苷酸；所述突变体的活性高于包含如SEQ ID NO：4所示序列的多核苷酸的启动子活性，且所述突变体在SEQ ID NO：4所示序列的第72-81位中的核苷酸序列不为ACACCGAGTG；

2.根据权利要求1所述的具有启动子活性的多核苷酸，其中，所述突变体在盐浓度或渗透压升高的环境中具有提高的启动子活性；

3.根据权利要求1-2任一项所述具有启动子活性的多核苷酸，其中，所述突变体对应SEQ ID NO：2所示序列的第170-179位，或对应SEQ ID NO：3所示序列的第130-139位，或对应SEQ ID NO：4所示序列的第72-81位的核苷酸序列选自如下(p₁)-(p₁₂)组成的组中的任一项：

(p₁)TACTTGCAGA，

(p₂)AGTGCTGAAA，

(p₃)GCACGAAAGG，

(p₄)TATCTAGAGG，

(p₅)AGGCTTGTCG，

(p₆)CGCTTCTTTC，

(p₇)TAACTCTTGG，

(p₈)CCAAGTTCCA，

(p₉)CGGTGCCACA，

(p₁₀)AGCAGTTAGG，

(p₁₁)AGATAAATAA，

(p₁₂)ATCGATCTAG。

4.根据权利要求1-3任一项所述的具有启动子活性的多核苷酸，其中，所述突变体的核苷酸序列选自如SEQ ID NO：5-16任一项所示的序列。

5.一种转录表达盒，其中，所述转录表达盒包含根据权利要求1-4任一项所述的具有启动子活性的多核苷酸；可选地，所述转录表达盒还含有目标基因，所述目标基因与所述具有启动子活性的多核苷酸可操作地连接；优选地，所述目标基因为蛋白编码基因。

6.一种重组表达载体，其中，所述重组表达载体包含权利要求1-4任一项所述的具有启动子活性的多核苷酸，或权利要求5所述的转录表达盒。

7.一种重组宿主细胞，其中，所述重组宿主细胞包含权利要求5所述的转录表达盒，或权利要求6所述的重组表达载体。

8.根据权利要求7所述的重组宿主细胞，其中，所述宿主细胞来源于棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属；优选地，所述宿主细胞为谷氨酸棒杆菌或大肠杆菌；更优选地，所述宿主细胞为谷氨酸棒杆菌ATCC 13032、谷氨酸棒杆菌ATCC 13869或谷氨酸棒杆菌ATCC 14067。

9.一种根据权利要求1-4任一项所述的具有启动子活性的多核苷酸，根据权利要求5所述的转录表达盒，根据权利要求6所述的重组表达载体，根据权利要求7或8所述的重组宿主细胞在如下至少一种中的用途：

(b)制备蛋白，或制备用于制备蛋白的试剂或试剂盒；

10.根据权利要求9所述的用途，其中，所述蛋白选自基因表达调控蛋白或与目标化合物合成相关的蛋白。

11.根据权利要求9或10所述的用途，其中，所述目标化合物包括氨基酸、有机酸中的至少一种；可选地，所述氨基酸包括脯氨酸、赖氨酸、谷氨酸、苏氨酸、甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸中的至少一种，所述有机酸包括柠檬酸、琥珀酸、乳酸、醋酸、丁酸、棕榈酸、草酸、酒石酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的至少一种。

12.一种调控目标基因转录的方法，其中，所述方法包括将权利要求1-4任一项所述的具有启动子活性的多核苷酸与目标基因可操作地连接的步骤。

13.一种制备蛋白的方法，其中，所述方法包括利用权利要求5所述的转录表达盒，权利要求6所述的重组表达载体，或权利要求7-8任一项所述的重组宿主细胞表达所述蛋白的步骤；可选地，所述蛋白为与目标化合物合成相关的蛋白或基因表达调控蛋白；

任选地，所述方法还包括分离或纯化所述蛋白的步骤。

14.一种生产目标化合物的方法，其中，所述方法包括利用权利要求5所述的转录表达盒，权利要求6所述的重组表达载体，或权利要求7-8任一项所述的重组宿主细胞表达与目标化合物合成相关的蛋白或基因表达调控蛋白，在所述与目标化合物合成相关的蛋白或所述基因表达调控蛋白存在的环境下生产目标化合物的步骤；