CN113201539B

CN113201539B - 具有启动子活性的多核苷酸及其在生产目标化合物中的用途

Info

Publication number: CN113201539B
Application number: CN202110236997.0A
Authority: CN
Inventors: 孙际宾; 刘娇; 郑平; 刘莫识; 孙冠男; 周文娟; 马延和
Original assignee: Tianjin Institute of Industrial Biotechnology of CAS
Current assignee: Tianjin Institute of Industrial Biotechnology of CAS
Priority date: 2021-03-03
Filing date: 2021-03-03
Publication date: 2022-09-06
Anticipated expiration: 2041-03-03
Also published as: CN113201539A

Abstract

本公开涉及具有启动子活性的多核苷酸及其在生产目标化合物中的用途。具体来说，本公开涉及具有启动子活性的多核苷酸，含有前述多核苷酸的转录表达盒、重组表达载体、重组宿主细胞，以及增强目标基因表达的方法、制备蛋白的方法和生产目标化合物的方法。本公开具有启动子活性的多核苷酸是包含如SEQ ID NO：1所示序列的多核苷酸的突变体，与SEQ ID NO：1所示序列的多核苷酸相比，突变体的启动子活性显著增强，突变体与目标基因可操作性的连接后，能够促使目标基因稳定高效表达，进而稳定、高效的生产下游的目标产物。

Description

具有启动子活性的多核苷酸及其在生产目标化合物中的用途

技术领域

本公开属于生物技术和基因工程技术领域，具体涉及一种具有启动子活性的多核苷酸，包含具有启动子活性的多核苷酸的转录表达盒、重组表达载体、重组宿主细胞，以及调控目标基因转录的方法、制备蛋白的方法和生产目标化合物的方法。

背景技术

微生物发酵法可以生产多种目标化合物，如氨基酸、有机酸、生物基材料、药物化合物等等，这些目标化合物可广泛应用于医药、健康、食品、动物饲料和化妆品等领域，具有巨大的经济价值。近年来，随着对氨基酸、有机酸、生物基材料、原料药物等市场需求的不断增加，如何提高目标化合物的产量，实现对目标化合物的工业化大规模生产，是当前亟需解决的重要问题。

选育高产的发酵微生物是提高目标化合物工业化产量的重要手段，与传统诱变育种的技术相比，基因工程选育技术由于其强的针对性和高效性获得了广泛性的应用。众多研究表明，目标合成物的合成途径关键基因的高效表达是提高目标化合物产量的关键，通过基因工程手段对合成途径中关键基因进行改造，可以获得高产目标化合物的发酵微生物。

影响基因高效表达的因素包括启动子的活性、基因翻译效率、基因拷贝数等。然而，基因拷贝数的增加会降低菌种基因组的稳定性，与此相比，通过提高启动子活性以提高关键基因的转录水平成为影响基因高效表达的关键因素。

目前，已开发或鉴定了一系列用于调控关键基因表达的启动子，例如：lac启动子、trp启动子、trc启动子、PS2启动子，以及pL启动子等。开发更多具有高活性的启动子，以增强目标化合物合成途径关键基因的表达，提高目标化合物的产量，提升工业化应用的潜能，是微生物发酵领域亟需解决的重要问题。

发明内容

发明要解决的问题

鉴于现有技术中存在的技术问题，例如，需要开发更多具有高活性的启动子，以提高目标化合物合成途径中关键基因的表达。为此，本公开提供了一种具有启动子活性的多核苷酸，其为SEQ ID NO：1所示序列的多核苷酸的突变体，与野生型启动子相比，本公开提供的突变体的启动子活性显著提高，将突变体与目标基因可操作性的连接，可有效提高目标基因的表达，进而可实现在保持基因组稳定性的条件下有效提高目标化合物的产量。

用于解决问题的方案

本公开提供了一种具有启动子活性的多核苷酸，其中，所述多核苷酸选自如下(i)-(iv)组成的组中的任一项：

(i)包含如SEQ ID NO：1所示序列的第76-85位核苷酸的多核苷酸的突变体，所述突变体在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸；

(ii)包含与(i)所示的核苷酸序列的反向互补序列的多核苷酸；

(iii)包含在高严格性杂交条件或非常高严格性杂交条件下，能够与(i)或(ii)所示的核苷酸序列杂交的序列的反向互补序列的多核苷酸，并且所述多核苷酸在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸；

(iv)与(i)或(ii)所示的核苷酸序列具有至少90％，可选至少95％，优选至少97％，更优选至少98％，最优选至少99％的序列同一性的多核苷酸，并且所述多核苷酸在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸。

在一些实施方式中，根据本公开所述的具有启动子活性的多核苷酸，所述多核苷酸选自如下(v)-(viii)组成的组中的任一项：

(v)包含如SEQ ID NO：1所示序列的多核苷酸的突变体，所述突变体在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸；

(vi)包含与(v)所示的核苷酸序列的反向互补序列的多核苷酸；

(vii)包含在高严格性杂交条件或非常高严格性杂交条件下，能够与(v)或(vi)所示的核苷酸序列杂交的序列的反向互补序列的多核苷酸，并且所述多核苷酸在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸；

(viii)与(v)或(vi)所示的核苷酸序列具有至少90％，可选至少95％，优选至少97％，更优选至少98％，最优选至少99％的序列同一性的多核苷酸，并且所述多核苷酸在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸。

在一些实施方式中，根据本公开所述的具有启动子活性的多核苷酸，其中，所述突变体与如SEQ ID NO：1所示序列的多核苷酸相比，具有1-13倍以上提高的启动子活性。

在一些实施方式中，根据本公开所述的具有启动子活性的多核苷酸，其中，所述突变体的第76-85位的核苷酸序列选自如下(p₁)-(p₃₉)组成的组中的任一项：

(p₁)GGTGTGTAGG，

(p₂)ATATATTAAG，

(p₃)GTGAGTTAAA，

(p₄)ATAAAGTAAG，

(p₅)AATGTCTATA，

(p₆)TATTGTTATG，

(p₇)TGTGGATATA，

(p₈)CCCACGTATA，

(p₉)GCCTGATAGG，

(p₁₀)CTGAGGTAAC，

(p₁₁)CCGAGTTATA，

(p₁₂)GGATGTTATT，

(p₁₃)CGGTGATACT，

(p₁₄)GTCGGGTATG，

(p₁₅)TAGTAGTATT，

(p₁₆)AAGTTATAAT，

(p₁₇)TTGGTCTACA，

(p₁₈)TTCGTATATG，

(p₁₉)ATGGGCTAAA，

(p₂₀)AACATGTAAG，

(p₂₁)GTACGGTAGT，

(p₂₂)TTAGGATATG，

(p₂₃)AGGGTGTAGT，

(p₂₄)AAGTGTTAAT，

(p₂₅)TTATTATATA，

(p₂₆)ATACTGTAGT，

(p₂₇)CTGCGTTATA，

(p₂₈)AAGTGATAGG，

(p₂₉)GTCGTATATA，

(p₃₀)CTATAGTAGA，

(p₃₁)GGGTGGTAGA，

(p₃₂)GTCTGTTATG，

(p₃₃)TTTTGCTAAA，

(p₃₄)GTCTGATATC，

(p₃₅)ACGTGTTATG，

(p₃₆)TTTTGGTATG，

(p₃₇)GGGTGGTATA，

(p₃₈)TTCTGATAGG，

(p₃₉)TTAGTGTATG。

在一些实施方式中，根据本公开所述的具有启动子活性的多核苷酸，所述多核苷酸的序列如SEQ ID NO：2-40任一项所示。

本公开还提供了一种转录表达盒，其中，所述转录表达盒包含根据本公开所述的具有启动子活性的多核苷酸；可选地，所述转录表达盒还含有目标基因，所述目标基因与所述具有启动子活性的多核苷酸可操作地连接；优选地，所述目标基因为蛋白编码基因。

本公开还提供了一种重组表达载体，其中，所述重组表达载体包含本公开所述的具有启动子活性的多核苷酸，或本公开所述的转录表达盒。

本公开还提供了一种重组宿主细胞，其中，所述重组宿主细胞包含本公开所述的转录表达盒，或本公开所述的重组表达载体。

在一些实施方式中，根据本公开所述的重组宿主细胞，其中，所述宿主细胞来源于棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属；优选地，所述宿主细胞为谷氨酸棒杆菌或大肠杆菌；更优选地，所述宿主细胞为谷氨酸棒杆菌ATCC 13032、谷氨酸棒杆菌ATCC 13869或谷氨酸棒杆菌ATCC 14067。

在一些实施方式中，根据本公开所述的具有启动子活性的多核苷酸，根据本公开所述的转录表达盒，根据本公开所述的重组表达载体，根据本公开所述的重组宿主细胞在如下至少一种中的用途：

(a)调控基因的转录水平，或制备用于调控基因的转录水平的试剂或试剂盒；

(b)制备蛋白，或制备用于制备蛋白的试剂或试剂盒；

(c)生产目标化合物，或制备用于生产目标化合物的试剂或试剂盒。

在一些实施方式中，根据本公开所述的用途，其中，所述蛋白选自基因表达调控蛋白或与目标化合物合成相关的蛋白。

在一些实施方式中，根据本公开所述的用途，其中，所述目标化合物包括氨基酸、有机酸中的至少一种；可选地，所述氨基酸包括脯氨酸、赖氨酸、谷氨酸、苏氨酸、甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸中的至少一种，所述有机酸包括柠檬酸、琥珀酸、乳酸、醋酸、丁酸、棕榈酸、草酸、酒石酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的至少一种。

本公开还提供了一种调控目标基因转录的方法，其中，所述方法包括将本公开所述的具有启动子活性的多核苷酸与目标基因可操作地连接的步骤。

本公开还提供了一种制备蛋白的方法，其中，包括利用本公开所述的转录表达盒，本公开所述的重组表达载体，或本公开所述的重组宿主细胞表达所述蛋白的步骤；可选地，所述蛋白为与目标化合物合成相关的蛋白或基因表达调控蛋白；

任选地，所述方法还包括分离或纯化所述蛋白的步骤。

本公开还提供了一种生产目标化合物的方法，其中，包括利用本公开所述的转录表达盒，本公开所述的重组表达载体，或本公开所述的重组宿主细胞表达与目标化合物合成相关的蛋白或基因表达调控蛋白，在所述与目标化合物合成相关的蛋白或所述基因表达调控蛋白存在的环境下生产目标化合物的步骤；

可选地，所述目标化合物包括氨基酸、有机酸中的至少一种；可选地，所述氨基酸包括赖氨酸、谷氨酸、苏氨酸、脯氨酸、甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸中的至少一种，所述有机酸包括柠檬酸、琥珀酸、乳酸、醋酸、丁酸、棕榈酸、草酸、酒石酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的至少一种；

可选地，所述与目标化合物合成相关的蛋白为与L-氨基酸合成相关的蛋白；可选地，所与L-氨基酸合成相关的蛋白包括丙酮酸羧化酶、磷酸烯醇式丙酮酸羧化酶、γ-谷氨酰激酶、谷氨酸半醛脱氢酶、吡咯啉-5-羧酸还原酶、氨基酸运输蛋白、ptsG系统、丙酮酸脱氢酶、高丝氨酸脱氢酶、草酰乙酸脱羧酶、葡萄糖酸阻遏蛋白、葡萄糖脱氢酶、天冬氨酸激酶、天冬氨酸半醛脱氢酶、天冬氨酸氨裂合酶、二氢吡啶二羧酸合成酶、二氢吡啶甲酸还原酶、琥珀酰二氨基庚二酸氨基转移酶、四氢吡啶二羧酸酯琥珀酰酶、琥珀酰二氨基庚二酸脱酰基酶、二氨基庚二酸差向异构酶、二氨基庚二酸脱酰基酶、甘油醛-3-磷酸脱氢酶、转酮酶、二氨基庚二酸脱氢酶和丙酮酸羧化酶中的一种或两种以上的组合；

任选地，所述方法还包括分离或纯化所述目标化合物的步骤。

发明的效果

在一些实施方式中，本公开提供了具有启动子活性的多核苷酸，是α-酮戊二酸脱氢酶基因(odhA基因)启动子的突变体，与野生型odhA基因的启动子相比，突变体的启动子活性显著提高。突变体与目标基因可操作性的连接后，可以显著提高目标基因的表达量，进而稳定、高效的生产目标化合物，为氨基酸、有机酸、生物基材料、药物化合物等的工业发酵提供了一种极具应用潜力的强启动子。

在一些实施方式中，本公开提供的具有启动子活性的多核苷酸，其启动子活性与野生型的odhA基因的启动子相比，可提高1-13倍以上。

在一些具体的实施方式中，本公开提供的具有启动子活性相对于野生型的启动子的活性，可提高1.1-12.6倍。

在一些实施方式中，本公开提供了转录表达盒、重组表达载体、重组宿主细胞，包含上述具有启动子活性的多核苷酸，能够实现目标化合物合成途径中关键性的目标基因的高效表达。

在一些实施方式中，本公开提供了制备蛋白的方法，能够提高与氨基酸、有机酸等合成相关的蛋白或基因表达调控蛋白的表达量，进而实现目标化合物的高效生产。

在一些实施方式中，本公开提供了生产目标化合物的方法，利用上述具有启动子活性的多核苷酸，可显著提高目标化合物的产量，实现对目标化合物的大规模工业化生产。

附图说明

图1示出了pEC-XK99E-P_odhA-rfp的质粒图谱；

图2示出了平板培养基上生长突变体克隆的荧光结果图；

图3示出了表达强度提高的odhA基因的启动子-10区的碱基突变结果图。

具体实施方式

当在权利要求和/或说明书中与术语“包含”联用时，词语“一(a)”或“一(an)”可以指“一个”，但也可以指“一个或多个”、“至少一个”以及“一个或多于一个”。

如在权利要求和说明书中所使用的，词语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的，并不排除额外的、未引述的元件或方法步骤。

在整个申请文件中，术语“约”表示：一个值包括测定该值所使用的装置或方法的误差的标准偏差。

虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”，但除非明确表示仅为替代物或替代物之间相互排斥外，权利要求中的术语“或”是指“和/或”。

当用于权利要求书或说明书时，选择/可选/优选的“数值范围”既包括范围两端的数值端点，也包括相对于前述数值端点而言，所述数值端点中间所覆盖的所有自然数。

如本公开所使用的，“α-酮戊二酸脱氢酶”也即2-oxoglutarate dehydrogenase，其由odhA基因编码，与sucB基因编码的二氢硫S-琥珀酰转移酶、lpd基因编码的二氢硫脱氢酶共同构成α-酮戊二酸脱氢酶复合物，参与三羧酸循环(TCA cycle)。

如本公开所使用的，术语“多核苷酸”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式，也可以是更大的核苷酸序列结构的一个组成部分，其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的，能够通过标准分子生物学方法(例如，使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个DNA序列(即A、T、G、C)表示时，这也包括一个RNA序列(即A、U、G、C)，其中“U”取代“T”。换句话说，“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物，或者可以是一个较大核苷酸结构的组成部分或成分，如表达载体或多顺反子序列。多核苷酸包括DNA、RNA和cDNA序列。

如本公开所使用的，术语“野生型的”指在自然界中可以找到的对象。例如，一种存在于生物体中，可以从自然界的一个来源中分离出来并且在实验室中没有被人类有意修改的多肽或多核苷酸序列是天然存在的。如本公开所用的，“天然存在的”和“野生型的”是同义词。在一些实施方式中，本公开中野生型的启动子是指野生型odhA基因的启动子，也即如SEQ ID NO：1所示序列的多核苷酸。

如本公开所使用的，术语“突变体”是指相对于“野生型”，或者“相比较的”多核苷酸或多肽，在一个或多个(例如，若干个)位置处包含改变(即，取代、插入和/或缺的多核苷酸，其中，取代是指用不同的核苷酸置换占用一个位置的核苷酸。缺失是指去除占据某一位置的核苷酸。插入是指在邻接并且紧随占据位置的核苷酸之后添加核苷酸。

在一些实施方式中，本公开的“突变”为“取代”，是由一个或多个核苷酸中的碱基被另一个不同的碱基取代所引起的突变，也称为碱基置换突变(subsititution)或点突变(point mutation)。

在一些实施方式中，本公开中的突变体是指包含如SEQ ID NO：1所示序列的第76-85位核苷酸的多核苷酸的突变体。在一些更为具体的实施方式中，本公开中的突变体是指包含如SEQ ID NO：1所示序列的多核苷酸的突变体，也即是野生型odhA基因的启动子的突变体。

具体而言，本公开中的突变体至少包含SEQ ID NO：1所示序列的第76-85位核苷酸，且在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，其中，突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸。SEQ ID NO：1所示序列的第76-85位核苷酸包含odhA基因的启动子-10区序列，在第82位引入突变的碱基T以及第83位引入突变的碱基A后，可使-10区特征序列“TANNNT”向3’端移动，进而使突变体获得提高的启动子活性。

在一些实施方式中，本公开的突变体在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，其中，突变的核苷酸包括对应SEQ ID NO：1所示序列的第82位的碱基突变为T的核苷酸，和对应SEQ ID NO：1所示序列的第83位的碱基突变为A的核苷酸。也即，突变体中位于第82位的核苷酸为胸腺嘧啶脱氧核苷酸(dTMP脱氧胸苷)，第83位的核苷酸为腺嘌呤脱氧核苷酸(dAMP脱氧腺苷)。包含上述突变的多核苷酸的突变体，与SEQID NO：1所示序列的多核苷酸相比，具有提高的启动子活性。

在一些实施方式中，本公开的突变体在对应SEQ ID NO：1所示序列的第76-85位的2个、3个、4个、5个、6个、7个、8个、9个、10个位置处包含突变的核苷酸。

在一些实施方式中，本公开中SEQ ID NO：1所示序列的多核苷酸的突变体，与SEQID NO：1所示序列的多核苷酸相比，具有1-13倍以上提高的启动子活性。

进一步的，SEQ ID NO：1所示序列的多核苷酸的突变体，与SEQ ID NO：1所示序列的多核苷酸相比，具有1.1、1.2、1.4、1.9、2.0、2.1、2.2、2.4、2.8、2.9、3.1、3.2、3.3、3.4、3.5、3.6、3.8、4.2、4.5、4.7、4.9、5.9、6.1、6.3、6.6、7.0、7.3、7.7、8.9、9.4、10.4、10.5、12.6倍的增强启动子活性。

如本公开所使用的，术语“启动子”是指一种核酸分子，通常位于目标基因编码序列的上游，为RNA聚合酶提供识别位点，并位于mRNA转录起始位点的5’方向的上游。它是不被翻译的核酸序列，RNA聚合酶与这一核酸序列结合后启动目标基因的转录。在核糖核酸(RNA)的合成中，启动子可以和调控基因转录的转录因子产生相互作用，控制基因表达(转录)的起始时间和表达的程度，包含核心启动子区域和调控区域，就像“开关”，决定基因的活动，继而控制细胞开始生产哪一种蛋白质。

如本公开所使用的，术语“启动子核心区”是指位于原核生物启动子区的一段核酸序列，是发挥启动子功能的核心序列区，主要包括-35区、-10区、-35区和-10区之间的区域以及转录起始位点，-35区是RNA聚合酶的识别位点，-10区是RNA聚合酶的结合位点。在一些实施方式中，本公开的具有启动子活性的多核苷酸，是在odhA基因的启动子-10区引入突变的odhA基因的启动子的突变体，以获得相比odhA基因的启动子明显提高的启动子活性。

如本公开所使用的，术语“序列同一性”和“同一性百分比”指两个或更多个多核苷酸或多肽之间相同(即同一)的核苷酸或氨基酸的百分比。两个或更多个多核苷酸或多肽之间的序列同一性可通过以下方法测定：将多核苷酸或多肽的核苷酸或氨基酸序列对准且对经对准的多核苷酸或多肽中含有相同核苷酸或氨基酸残基的位置数目进行评分，且将其与经对准的多核苷酸或多肽中含有不同核苷酸或氨基酸残基的位置数目进行比较。多核苷酸可例如通过含有不同核苷酸(即取代或突变)或缺失核苷酸(即一个或两个多核苷酸中的核苷酸插入或核苷酸缺失)而在一个位置处不同。多肽可例如通过含有不同氨基酸(即取代或突变)或缺失氨基酸(即一个或两个多肽中的氨基酸插入或氨基酸缺失)而在一个位置处不同。序列同一性可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中氨基酸残基的总数来计算。举例而言，可通过用含有相同核苷酸或氨基酸残基的位置数目除以多核苷酸或多肽中核苷酸或氨基酸残基的总数且乘以100来计算同一性百分比。

在一些实施方式中，当使用序列比较算法或通过目视检查测量以最大的对应性进行比较和比对时，两个或多个序列或子序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％核苷酸的“序列同一性”或“同一性百分比”。在某些实施方案中，所述序列在任一或两个相比较的生物聚合物(例如，多核苷酸)的整个长度上基本相同。

如本公开所使用的，术语“互补的”是指在核苷酸或核苷酸之间的杂交或碱基配对，例如双链DNA分子的两条链之间或者寡核苷酸引物与被测序或扩增的单链核苷酸上的引物结合位点之间等。

如本公开所使用的，术语“高严格条件”是指，对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃处在5X SSPE(saline sodium phosphate EDTA)、0.3％SDS、200微克/ml剪切并变性的鲑精DNA和50％甲酰胺中预杂交和杂交12至24小时。最后在65℃处使用2X SSC、0.2％SDS将载体材料洗涤三次，每次15分钟。

如本公开所使用的，术语“非常高严格条件”是指，对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃处在5X SSPE(saline sodium phosphate EDTA)、0.3％SDS、200微克/ml剪切并变性的鲑精DNA和50％甲酰胺中预杂交和杂交12至24小时。最后在70℃处使用2X SSC、0.2％SDS将载体材料洗涤三次，每次15分钟。

在一些具体的实施方案中，本公开中的具有启动子活性的多核苷酸能够用于起始蛋白编码基因的表达。在另外一些实施方案中，本公开中的具有启动子活性的多核苷酸能够用于起始非编码基因的表达。

如本公开所使用的，术语“表达”包括涉及RNA产生及蛋白产生的任何步骤，包括但不限于：转录、转录后修饰、翻译、翻译后修饰和分泌。

如本公开所使用的，术语“转录表达盒”是包含具有启动子活性的多核苷酸的重组表达元件。在一些实施方式中，具有启动子活性的多核苷酸为包含如SEQ ID NO：1所示序列的第76-85位核苷酸的多核苷酸的突变体。在一些实施方式中，具有启动子活性的多核苷酸为包含本公开中SEQ ID NO：1所示序列的多核苷酸的突变体。在一些更为具体的实施方式中，转录表达盒中包括与SEQ ID NO：1所示序列的多核苷酸的突变体可操作地连接的目标基因，利用本公开中启动子活性提高的突变体对目标基因的表达进行调控。在一些实施方式中，对目标基因进行调控的转录调控元件除了具有启动子活性的突变体，还可以包含增强子、沉默子、绝缘子等元件。在一些实施方式中，本公开中目标基因具体为蛋白编码基因。目标基因与具有启动子活性的多核苷酸“可操作地连接”，是指将具有启动子活性的多核苷酸与目标基因功能性连接，以启动和介导目标基因的转录，所述可操作地连接的方式可以采用本领域技术人员所述的任何方式。

如本公开所使用的，术语“载体”指的是DNA构建体，其含有与合适的控制序列可操作地连接的DNA序列，从而在合适的宿主中表达目标基因。“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括，例如包含i)对基因表达具有调控作用的遗传元素的集合，例如启动子和增强子；ii)转录成mRNA并翻译成蛋白质的结构或编码序列；以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要，并可以使用任何载体，包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列，例如细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体，来自如牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。

如本公开所使用的，术语“目标基因”涉及与本公开中具有启动子活性的多核苷酸连接，以对其转录水平进行调控的任一种的基因。

在一些实施方案中，目标基因是指编码微生物中目标蛋白质的基因。示例性的，目标基因是编码与目标化合物的生物合成相关的酶的基因、编码与还原力相关的酶的基因，编码与糖酵解或TCA循环相关的酶的基因，或编码与目标化合物的释放相关的酶的基因等等。

如本公开所使用的，术语“目标化合物”可以选自氨基酸、有机酸，也可以选自本领域中可能通过生物合成得到的其他种类的化合物。

在一些实施方式中，目标化合物为“氨基酸”或“L-氨基酸”。“氨基酸”或“L-氨基酸”通常是指其中氨基和羧基结合至相同碳原子的蛋白质的基本构成单元。示例性的，氨基酸选自甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苏氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、谷氨酸、赖氨酸、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸、脯氨酸中的一种或两种以上的组合，或者是本领域中其他种类的氨基酸。

在一些实施方式中，目标化合物为有机酸。有机酸可以是具有酸性的有机化合物，例如，其中包括羧基和磺酸基的那些化合物。示例性的，有机酸包括乳酸、醋酸、琥珀酸、丁酸、棕榈酸、草酸、酒石酸、柠檬酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的一种或两种以上的组合，或者是本领域中其他种类的有机酸。

本公开中的术语“蛋白编码基因”是指能够通过一定的规则指导蛋白的合成DNA分子，蛋白编码基因指导蛋白合成的过程一般包括以双链DNA为模板的转录过程和以mRNA为模板的翻译过程。蛋白编码基因含有CDS序列(Coding Sequence)，能够指导编码蛋白质的mRNA的产生。

示例性的，蛋白编码基因包括但不限于用于编码与目标化合物合成相关的蛋白，在一些实施方式中，蛋白编码基因涉及用于编码与合成L-氨基酸的相关的蛋白。示例性的，与合成L-氨基酸的相关的蛋白包括但不限于丙酮酸羧化酶、磷酸烯醇式丙酮酸羧化酶、γ-谷氨酰激酶、谷氨酸半醛脱氢酶、吡咯啉-5-羧酸还原酶、氨基酸运输蛋白、ptsG系统、丙酮酸脱氢酶、高丝氨酸脱氢酶、草酰乙酸脱羧酶、葡萄糖酸阻遏蛋白、葡萄糖脱氢酶中的一种或两种以上的组合。在一些实施方式中，与合成L-氨基酸的相关的蛋白为与合成L-赖氨酸相关的蛋白，对于与合成L-赖氨酸的相关的蛋白，包括天冬氨酸激酶、天冬氨酸半醛脱氢酶、天冬氨酸氨裂合酶、二氢吡啶二羧酸合成酶、二氢吡啶甲酸还原酶、琥珀酰二氨基庚二酸氨基转移酶、四氢吡啶二羧酸酯琥珀酰酶、琥珀酰二氨基庚二酸脱酰基酶、二氨基庚二酸差向异构酶、二氨基庚二酸脱酰基酶、甘油醛-3-磷酸脱氢酶、赖氨酸运输蛋白、转酮酶、二氨基庚二酸脱氢酶和丙酮酸羧化酶中的一种或两种以上的组合。

在一些实施方式中，蛋白编码基因涉及用于编码与合成有机酸相关的蛋白，示例性的，蛋白编码基因用于编码与合成柠檬酸有关的蛋白，或用于编码与合成琥珀酸有关的蛋白。在一些实施方案中，蛋白编码基因涉及用于编码与合成生物基材料相关的蛋白。在一些实施方式中，蛋白编码基因涉及用于编码与合成药物化合物相关的蛋白。在另外一些实施方式中，蛋白编码基因涉及与基因编辑相关的蛋白，例如Cpf1蛋白。

本公开的术语“基因表达调控蛋白”包括不限于外源的基因表达调控工具蛋白，例如CRISPRi调控需要的dCas9蛋白、dCpf1蛋白，sRNA调控需要的Hfq蛋白等，以及内源或外源的转录调控因子，进而调控代谢通路中关键基因的表达。

本公开中的术语“宿主细胞”意指易于用包含本公开的多核苷酸的转录起始元件或表达载体转化、转染、转导等的任何细胞类型。术语“重组宿主细胞”涵盖导入转录起始元件或重组表达载体后不同于亲本细胞的宿主细胞，重组宿主细胞具体通过转化来实现。

本公开中的术语“转化”具有本领域技术人员普遍理解的意思，即将外源性的DNA导入宿主的过程。所述转化的方法包括任何将核酸导入细胞的方法，这些方法包括但不限于电穿孔法、磷酸钙沉淀法、氯化钙(CaCl₂)沉淀法、微注射法、聚乙二醇(PEG)法、DEAE-葡聚糖法、阳离子脂质体法以及乙酸锂-DMSO法。

本公开的宿主细胞可以是原核细胞或真核细胞，只要是能够导入本公开的具有启动子活性的多核苷酸的细胞即可。在一些实施方式中，宿主细胞指原核细胞，具体地，宿主细胞来源于适合发酵生产氨基酸、有机酸的微生物，例如棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属。作为优选地，宿主细胞是来源于棒状杆菌属的谷氨酸棒杆菌。其中，谷氨酸棒杆菌可以是谷氨酸棒杆菌ATCC 13032、谷氨酸棒杆菌ATCC 13869或谷氨酸棒杆菌ATCC 14067等。

本公开的宿主细胞的培养可以根据本领域的常规方法进行，包括但不限于孔板培养、摇瓶培养、批次培养、连续培养和分批补料培养等，并可以根据实际情况适当地调整各种培养条件如温度、时间和培养基的pH值等。

除非在本公开中另外定义或由背景清楚指示，否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。

odhA基因的启动子的突变体

本公开利用α-酮戊二酸脱氢酶基因(odhA基因)的启动子序列，在odhA基因的启动子-10区引入突变，得到odhA基因的启动子的突变体。

需要说明的是，在本领域已报道的与odhA基因突变的相关研究中，均是通过引入odhA基因的突变，降低微生物菌株内α-酮戊二酸脱氢酶活性，以提高微生物菌株内L-谷氨酸等的氨基酸产量。例如，在专利文献CN101010423A公开的生产L-谷氨酸的微生物，通过将突变引入到编码棒状杆菌型细菌α-酮戊二酸脱氢酶复合物的Elo亚基的染色体odhA基因而获得了突变菌株，所述突变菌株具有降低的α-酮戊二酸脱氢酶活性，并且保持了几乎与野生型菌株相同的生长速率。因此，利用这样的突变菌株可以实现在降解L-谷氨酸的能力降低的同时维持正常的生长速率的突变菌株，可用于有效地生产L-谷氨酸。

而本公开中的具有启动子活性的多核苷酸，是通过对odhA基因的启动子区的突变，获得启动子活性提高的odhA基因的启动子的突变体，进而提高与目标化合物合成相关的酶等的表达量，从而增强微生物对于目标化合物的生产能力。

具体而言，odhA基因的启动子的突变体，是指对如SEQ ID NO：1所示序列的多核苷酸进行突变而得到的突变体，所述突变体在对应SEQ ID NO：1所示序列的第76-85位的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基为T的核苷酸，和位于第83位的碱基突变为A的核苷酸。通过在odhA基因的启动子引入第82位和第83位的突变，可以将-10区的特征序列“TANNNT”向3’端移动，使启动子的活性强度大大提高。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，在SEQ ID NO：1所示序列的第76-85位的2个、3个、4个、5个、6个、7个、8个、9个或10个位置处包含突变的核苷酸。且与SEQ ID NO：1所示序列的odhA基因的启动子相比，具有提高的启动子活性。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，还包括与odhA基因的启动子的突变体的核苷酸序列方向互补的多核苷酸。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，还包括在高严格性杂交条件或非常高严格性杂交条件下，与odhA基因的启动子的突变体或杂交的序列的反向互补的多核苷酸。并且所述多核苷酸在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，为与上述的多核苷酸序列具有至少80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性(包括这些数值之间所有范围和百分数)的序列。并且所述多核苷酸在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸。

在一些具体的实施方式中，SEQ ID NO：1所示序列的多核苷酸的突变体，其第76-85位的核苷酸序列选自如下(p₁)-(p₃₉)组成的组中的任一项：(p₁)GGTGTGTAGG，(p₂)ATATATTAAG，(p₃)GTGAGTTAAA，(p₄)ATAAAGTAAG，(p₅)AATGTCTATA，(p₆)TATTGTTATG，(p₇)TGTGGATATA，(p₈)CCCACGTATA，(p₉)GCCTGATAGG，(p₁₀)CTGAGGTAAC，(p₁₁)CCGAGTTATA，(p₁₂)GGATGTTATT，(p₁₃)CGGTGATACT，(p₁₄)GTCGGGTATG，(p₁₅)TAGTAGTATT，(p₁₆)AAGTTATAAT，(p₁₇)TTGGTCTACA，(p₁₈)TTCGTATATG，(p₁₉)ATGGGCTAAA，(p₂₀)AACATGTAAG，(p₂₁)GTACGGTAGT，(p₂₂)TTAGGATATG，(p₂₃)AGGGTGTAGT，(p₂₄)AAGTGTTAAT，(p₂₅)TTATTATATA，(p₂₆)ATACTGTAGT，(p₂₇)CTGCGTTATA，(p₂₈)AAGTGATAGG，(p₂₉)GTCGTATATA，(p₃₀)CTATAGTAGA，(p₃₁)GGGTGGTAGA，(p₃₂)GTCTGTTATG，(p₃₃)TTTTGCTAAA，(p₃₄)GTCTGATATC，(p₃₅)ACGTGTTATG，(p₃₆)TTTTGGTATG，(p₃₇)GGGTGGTATA，(p₃₈)TTCTGATAGG，(p₃₉)TTAGTGTATG。

在一些实施方式中，本公开中的具有启动子活性的多核苷酸，与SEQ ID NO：1所示序列的多核苷酸相比，具有1-13倍以上提高的启动子活性。进一步的，SEQ ID NO：1所示序列的多核苷酸的突变体，与SEQ ID NO：1所示序列的多核苷酸相比，具有1.1、1.2、1.4、1.9、2.0、2.1、2.2、2.4、2.8、2.9、3.1、3.2、3.3、3.4、3.5、3.6、3.8、4.2、4.5、4.7、4.9、5.9、6.1、6.3、6.6、7.0、7.3、7.7、8.9、9.4、10.4、10.5、12.6倍的增强启动子活性。

重组表达载体和重组宿主细胞

在一些实施方式中，本公开以ATCC13032基因组(Corynebacterium glutamicumATCC 13032，Gene ID:2830649)为模板，以odhA-F/R为引物，扩增获得odhA基因启动子的DNA片段；以pEC-XK99E-rfp质粒为模板，以pEC-F1/R引物，扩增pEC-XK99E质粒骨架和红色荧光蛋白基因的DNA片段；上述DNA片段重组，得到重组表达载体pEC-XK99E-P_odhA-rfp。

在一些实施方式中，本公开以pEC-XK99E-P_odhA-rfp为模板，以odhA-M1/M2和odhA-M3/M4引物对质粒骨架进行扩增，经重组连接后，对获得的所有克隆进行收集并提取质粒，得到odhA基因启动子突变体文库。

在一些实施方式中，本公开以odhA基因启动子突变体文库和pEC-XK99E-P_odhA-rfp分别转化谷氨酸棒杆菌ATCC13032，得到重组宿主细胞。通过固体平板上生长重组宿主细胞的荧光亮度，进行启动子强度提高的突变体的筛选。

在一些实施方式中，本公开以谷氨酸棒杆菌SZCgP3菌株的基因组为模板，分别以odhA-WT-1/odhA-2、odhA-32-1/odhA-2、odhA-35-1/odhA-2、odhA-39-1/odhA-2为引物，分别获得启动子片段一；以谷氨酸棒杆菌SZCgP3菌株的基因组为模板，以odhA-3/odhA-4为引物，扩增启动子片段二；根据已报道的谷氨酸棒杆菌SZCgP3菌株的基因组为模板，以proB-F和proB-R为引物扩增proB^G149K基因片段；以pEC-XK99E质粒为模板，以pEC-1/pEC-2为引物扩增质粒骨架。以上启动子片段一分别与启动子片段二、proB^G149K基因片段和质粒骨架通过重组连接，分别获得pEC-P_odhA-WT-proB^G149K、pEC-P_odhA-32-proB^G149K质粒、pEC-P_odhA-35-proB^G149K质粒和pEC-P_odhA-39-proB^G149K质粒。

在一些实施方式中，本公开将将pEC-P_odhA-WT-proB^G149K、pEC-P_odhA-32-proB^G149K质粒、pEC-P_odhA-35-proB^G149K质粒和pEC-P_odhA-39-proB^G149K质粒及分别转化至SZCgP3菌株，获得野生型启动子和突变体启动子过表达菌株SZCgP3(pEC-P_odhA-WT-proB^G149K)、SZCgP3(pEC-P_odhA-32-proB^G149K)、SZCgP3(pEC-P_odhA-35-proB^G149K)和SZCgP3(pEC-P_odhA-39-proB^G149K)。

在一些实施方式中，本公开的谷氨酸棒杆菌SZCgP3菌株，是将谷氨酸棒杆菌ATCC13032菌株γ-谷氨酰激酶ProB引入G149K突变，密码子从GGT突变为AAG而获得。

目标化合物的生产过程

(1)将具有启动子活性的多核苷酸，与目标化合物合成相关的蛋白编码基因或基因表达调控蛋白编码基因可操作的连接，得到能够与目标化合物合成相关的蛋白或基因表达调控蛋白的重组表达载体，利用重组表达载体转化宿主细胞，获得重组宿主细胞。

(2)对重组宿主细胞进行发酵培养，从重组宿主细胞或重组宿主细胞的培养液中收集目标化合物，完成目标化合物的生产过程。

上述生产过程中，由于多核苷酸具有改进的启动子活性，在重组宿主细胞中，与目标化合物合成相关的蛋白或基因表达调控蛋白的编码基因的转录活性提高，与目标化合物合成相关的蛋白或基因表达调控蛋白的表达量提高，进而使目标化合物的产量显著提升。

在一些实施方式中，目标化合物为氨基酸，与目标化合物合成相关的蛋白编码基因是指与合成氨基酸相关的蛋白编码基因。在一些更为具体的实施方式中，目标化合物为L-氨基酸，与合成氨基酸相关的蛋白编码基因是指与合成L-氨基酸相关的蛋白编码基因。更进一步的，L-氨基酸为L-脯氨酸，蛋白编码基因为解除反馈抑制的γ-谷氨酰激酶基因proB^G149K，将odhA基因启动子的突变体与proB^G149K基因可操作地连接后，可有效提高谷氨酸生产菌株内γ-谷氨酰激酶的表达量，进而提高L-脯氨酸的产量。

在一些实施方式中，宿主细胞为谷氨酸棒杆菌(Corynebacterium glutamicum)，谷氨酸棒杆菌可用于多种氨基酸、有机酸等目标化合物的发酵生产。

在一些实施方式中，对重组宿主细胞进行培养的发酵培养基成分为：发酵培养基成份为：葡萄糖，80g/L；酵母粉，1g/L；大豆蛋白胨，1g/L；NaCl，1g/L；硫酸铵，1g/L；尿素，10g/L；K₂HPO₄·3H₂O，1g/L；MgSO₄·7H₂O，0.45g/L；FeSO₄·7H₂O，0.05g/L；生物素，0.4mg/L；维生素B1，0.1mg/L；MOPS，40g/L；初始pH7.2。培养基中补加25μg/mL卡那霉素。

在一些实施方式中，对重组宿主细胞进行发酵培养的条件为：将菌株接种到TSB液体培养基中培养8h，培养物作为种子接种到每孔含有800μl发酵培养基的24孔板中，接种量为12μl，30℃培养18h，孔板摇床转速为800rpm。

在一些具体的实施方案中，对于重组宿主细胞或重组细胞的培养液回收目标化合物，可通过本领域常用方法，包括但不限于：过滤、阴离子交换色谱、结晶或HPLC。

在本领域，用于操纵微生物的方法是已知的，如《分子生物学现代方法》(OnlineISBN：9780471142720,John Wiley and Sons,Inc.)、《微生物代谢工程：方法和规程》(Qiong Cheng Ed.,Springer)和《系统代谢工程：方法和规程》(Hal S.Alper Ed.,Springer)等出版物中被解释。

实施例

本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是，应当理解的是，详细描述和具体实施例(虽然表示本公开的具体实施方式)仅为解释性目的而给出，因为在阅读该详细说明后，在本公开的精神和范围内所作出的各种改变和修饰，对于本领域技术人员来说将变得显而易见。

本实施例中所用到的实验技术与实验方法，如无特殊说明均为常规技术方法，例如下列实施例中未注明具体条件的实验方法，通常按照常规条件如Sambrook等人，分子克隆：实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件，或按照制造厂商所建议的条件。实施例中所使用的材料、试剂等，如无特殊说明，均可通过正规商业渠道获得。

实施例1.谷氨酸棒杆菌odhA基因启动子强度表征质粒的构建

为了表征谷氨酸棒杆菌odhA基因启动子的强度，本发明首先构建一个表征载体，在pEC-XK99E质粒骨架基础上，由odhA基因启动子表达红色荧光蛋白报告基因。根据已公开的谷氨酸棒杆菌ATCC13032基因组序列(Corynebacterium glutamicum ATCC 13032，GeneID:2830649)及odhA基因注释信息，设计引物odhA-F/R，以ATCC13032基因组为模板，通过PCR扩增获得odhA基因启动子的DNA片段(核苷酸序列如SEQ ID NO：1所示)。以文献报道的pEC-XK99E-rfp(王迎春等.基于时间序列转录组筛选谷氨酸棒杆菌内源高效组成型启动子[J].生物工程学报,2018,34(11):1760～1771)质粒为模板，以pEC-F1/R为引物，扩增包含pEC-XK99E质粒骨架和红色荧光蛋白基因的DNA片段。以上两个片段通过诺唯赞的一步重组试剂盒克隆连接，获得pEC-XK99E-P_odhA-rfp表征载体，质粒图谱如图1所示。以上所用引物序列如表1所示。

表1

引物	核苷酸序列	SEQ ID NO.
			odhA-F	TGCGGTATTTTCTCCCACGTTATTTTTAGGAGAACTGTC	SEQ ID NO：41
odhA-R	TTCGGAGGAAGCCATGGCAGGTACTCGCCTCTTTT	SEQ ID NO：42
			pEC-F1	ATGGCTTCCTCCGAAGACGTTATCAAAG	SEQ ID NO：43
pEC-R	GGAGAAAATACCGCATCAGGC	SEQ ID NO：44

实施例2.谷氨酸棒杆菌odhA基因启动子突变体筛选及强度表征

(1)谷氨酸棒杆菌odhA基因启动子突变体文库的构建及初步筛选

本发明对谷氨酸棒杆菌odhA基因启动子的核心区：

“TAATGCTACAACTGGGGCTTAGGCATAATCAGCCAACGACCAACGTTACAGTGGATAAAA”进行突变，其中下划线处为该启动子的-10区主要序列。本发明在以上-10区及附近序列进行突变“TAATGCTACAACTGGGGCTTAGGCATAATCAGCCAACGACCAACNNNNNNNNNNATAAAA”，分别采用odhA-M1/M2和odhA-M3/M4引物扩增质粒的两个片段，通过诺唯赞的一步重组试剂盒克隆连接，对获得的所有克隆进行收集并提取质粒，获得odhA基因启动子突变体质粒文库。将以上质粒文库和实施例1中获得的野生型对照pEC-XK99E-P_odhA-rfp质粒分别转化谷氨酸棒杆菌ATCC13032，涂布TSB补加25μg/mL卡那霉素的固体平板，通过荧光成像系统对长有数百个克隆的平板进行荧光拍照，根据克隆的荧光亮度初步筛选表达强度提高的突变体。TSB平板培养基成份为(g/L)：葡萄糖，5g/L；酵母粉，5g/L；大豆蛋白胨，9g/L；尿素，3g/L；丁二酸，0.5g/L；K₂HPO₄·3H₂O，1g/L；MgSO₄·7H₂O，0.1g/L；生物素，0.01mg/L；维生素B1，0.1mg/L；MOPS，20g/L；琼脂粉，15g/L。本发明对大于1万个克隆进行初步平板筛选，如图2所示，获得超过39个荧光强度增强的突变体。以上所用引物序列如表2所示。

表2

(2)谷氨酸棒杆菌odhA基因启动子突变体文库的表征及序列分析

对以上平板中荧光成像显示荧光亮度增强的突变体进行96孔板培养表征启动子的强度。TSB液体培养基成份为(g/L)：葡萄糖，5g/L；酵母粉，5g/L；大豆蛋白胨，9g/L；尿素，3g/L；丁二酸，0.5g/L；K₂HPO₄·3H₂O，1g/L；MgSO₄·7H₂O，0.1g/L；生物素，0.01mg/L；维生素B1，0.1mg/L；MOPS，20g/L。培养基中添加25μg/mL卡那霉素。将平板获得的荧光亮度增强的克隆和野生型启动子的对照菌株，分别用牙签接种至每孔含有200μl TSB液体培养基的96孔板中，每个菌株3个平行，孔板摇床转速为800rpm，30℃培养24h后检测菌株的荧光强度。对荧光强度较野生型对照提高菌株的突变区域进行测序分析。

结果如表3所示，最终本公开成功获得39个表达强度较野生型启动子提高的启动子突变体(对应的突变启动子的核苷酸序列为SEQ ID NO：2-40)，提高倍数范围为1.1-12.6倍，可为增强靶基因的表达提供丰富的元件。本公开对这39个活性增强的启动子突变体的序列进行分析，发现所有突变体都具有-10序列特征“TANNNT”向3’端移动4个碱基的特征，表明以上规律性突变是提高启动子表达强度的关键。也就是说，谷氨酸棒杆菌odhA启动子-10区序列“GTTACAGTGG”(即启动子的第76-85位碱基)的下划线“GT”碱基突变为“TA”碱基，是启动子活性增强的关键。

进一步，本公开通过WebLogo软件对上述获得的39条突变体序列进行碱基突变频率的统计，结果如图3所示，与前面分析结果一致，所有突变体都是odhA启动子-10区序列“GTTACAGTGG”(启动子的第76-85位碱基)的下划线“GT”碱基突变为“TA”碱基，均可以形成向3’端移动4个碱基的-10区保守序列特征“TANNNT”，表明以上模式的突变是启动子活性增强的关键。

表3

实施例4.谷氨酸棒杆菌odhA基因启动子突变体应用于L-脯氨酸生产

(1)odhA基因启动子突变体应用于L-脯氨酸生产的菌株构建

本发明首先将谷氨酸棒杆菌ATCC13032菌株γ-谷氨酰激酶ProB引入G149K突变，密码子从GGT突变为AAG，获得SZCgP3菌株。本发明进一步应用P_odhA-32、P_odhA-35和P_odhA-39启动子突变体过表达解除反馈抑制的γ-谷氨酰激酶基因proB^G149K，测试其对L-脯氨酸生产的影响。

过表达质粒构建如下：在pEC-XK99E质粒骨架基础上采用odhA基因启动子突变体过表达proB^G149K。以谷氨酸棒杆菌SZCgP3菌株的基因组为模板，分别以odhA-WT-1/odhA-2、odhA-32-1/odhA-2、odhA-35-1/odhA-2、odhA-39-1/odhA-2为引物，分别获得启动子片段一；以谷氨酸棒杆菌SZCgP3菌株的基因组为模板，以odhA-3/odhA-4为引物，分别扩增启动子片段二；以谷氨酸棒杆菌SZCgP3菌株的基因组为模板，以proB-F和proB-R为引物扩增proB^G149K基因片段；以pEC-XK99E质粒为模板，以pEC-1/pEC-2为引物扩增质粒骨架。以上启动子片段一分别与对应的启动子片段二、proB^G149K基因片段和质粒骨架通过诺唯赞的一步重组试剂盒克隆连接，分别获得pEC-P_odhA-WT-proB^G149K、pEC-P_odhA-32-proB^G149K质粒、pEC-P_odhA-35-proB^G149K质粒和pEC-P_odhA-39-proB^G149K质粒。将以上质粒分别转化至SZCgP3菌株，获得野生型启动子和突变体启动子过表达菌株SZCgP3(pEC-P_odhA-WT-proB^G149K)、SZCgP3(pEC-P_odhA-32-proB^G149K)、SZCgP3(pEC-P_odhA-35-proB^G149K)和SZCgP3(pEC-P_odhA-39-proB^G149K)。以上所用引物序列如表4所示。

表4

(2)odhA基因启动子突变体改造菌株的L-脯氨酸生产能力评价

为了测试谷氨酸棒杆菌中应用P_odhA-32、P_odhA-35和P_odhA-39启动子突变体过表达解除反馈抑制的γ-谷氨酰激酶proB^G149K对菌株产L-脯氨酸的影响，分别对SZCgP3(pEC-P_odhA-WT-proB^G149K)、SZCgP3(pEC-P_odhA-32-proB^G149K)、SZCgP3(pEC-P_odhA-35-proB^G149K)、SZCgP3(pEC-P_odhA-39-proB^G149K)进行发酵测试，发酵培养基成份为：葡萄糖，80g/L；酵母粉，1g/L；大豆蛋白胨，1g/L；NaCl，1g/L；硫酸铵，1g/L；尿素，10g/L；K₂HPO₄·3H₂O，1g/L；MgSO₄·7H₂O，0.45g/L；FeSO₄·7H₂O，0.05g/L；生物素，0.4mg/L；维生素B1，0.1mg/L；MOPS，40g/L；初始pH7.2。培养基中补加25μg/mL卡那霉素。首先将菌株接种到TSB液体培养基中培养8h，培养物作为种子接种到每孔含有800μl发酵培养基的24孔板中，接种量为12μl，30℃培养18h，孔板摇床转速为800rpm，每个菌株3个平行，发酵结束后检测L-脯氨酸产量。

L-脯氨酸的检测方法：用3％(W/V)磺基水杨酸稀释到合适浓度；取1mL稀释液，加入1mL酸合茚三酮(1.25g茚三酮溶于30mL冰醋酸和20mL 6M H₃PO₄中，70℃加热溶解)和1mL冰醋酸，100℃沸水浴反应45min；冷却后测定OD₅₂₀。采用0-50mg/L浓度的L-脯氨酸绘制标准曲线，根据标准曲线计算待测样品的浓度。

各个菌株的L-脯氨酸产量如表5所示，结果表明采用odhA启动子突变体过表达L-脯氨酸合成途径关键酶ProB^G149K均可以显著提高L-脯氨酸产量，其中应用P_odhA-32启动子突变体的产量提高达87％。

表5

菌株	L-脯氨酸产量(g/L)
		SZCgP3(pEC-P<sub>odhA-WT</sub>-proB<sup>G149K</sup>)	3.44±0.15
SZCgP3(pEC-P<sub>odhA-32</sub>-proB<sup>G149K</sup>)	6.43±0.78
		SZCgP3(pEC-P<sub>odhA-35</sub>-proB<sup>G149K</sup>)	5.76±0.40
SZCgP3(pEC-P<sub>odhA-39</sub>-proB<sup>G149K</sup>)	5.90±0.25

本说明书公开的所有技术特征都可以任何组合方式进行组合。本说明所公开的每个特征也可以被其它具有相同、相等或相似作用的特征所替换。因此，除非特殊说明，所公开的每一特征仅仅是一系列相等或相似特征的实例。

此外，从上述描述中，本领域技术人员可从本公开中很容易清楚本公开的关键特征，在不脱离本公开的精神及范围的情况下，可对发明进行很多修改以适应各种不同的使用目的及条件，因此这类修改也旨在落入所附权利要求书的范围内。

序列表

<110> 中国科学院天津工业生物技术研究所

<120> 具有启动子活性的多核苷酸及其在生产目标化合物中的用途

<130> 6A17-2113523I

<141> 2021-03-03

<160> 59

<170> SIPOSequenceListing 1.0

<210> 1

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 1

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgttac agtggataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 2

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 2

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacggtgt gtaggataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 3

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 3

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacatata ttaagataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 4

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 4

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgtgag ttaaaataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 5

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 5

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacataaa gtaagataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 6

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 6

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacaatgt ctataataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 7

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 7

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaactattg ttatgataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 8

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 8

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaactgtgg atataataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 9

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 9

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaaccccac gtataataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 10

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 10

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgcctg ataggataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 11

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 11

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacctgag gtaacataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 12

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 12

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacccgag ttataataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 13

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 13

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacggatg ttattataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 14

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 14

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaaccggtg atactataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 15

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 15

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgtcgg gtatgataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 16

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 16

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaactagta gtattataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 17

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 17

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacaagtt ataatataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 18

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 18

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacttggt ctacaataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 19

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 19

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacttcgt atatgataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 20

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 20

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacatggg ctaaaataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 21

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 21

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacaacat gtaagataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 22

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 22

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgtacg gtagtataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 23

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 23

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacttagg atatgataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 24

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 24

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacagggt gtagtataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 25

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 25

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacaagtg ttaatataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 26

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 26

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacttatt atataataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 27

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 27

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacatact gtagtataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 28

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 28

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacctgcg ttataataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 29

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 29

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacaagtg ataggataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 30

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 30

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgtcgt atataataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 31

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 31

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacctata gtagaataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 32

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 32

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgggtg gtagaataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 33

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 33

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgtctg ttatgataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 34

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 34

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacttttg ctaaaataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 35

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 35

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgtctg atatcataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 36

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 36

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacacgtg ttatgataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 37

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 37

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacttttg gtatgataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 38

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 38

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacgggtg gtataataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 39

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 39

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacttctg ataggataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 40

<211> 141

<212> DNA

<213> Artificial Sequence

<400> 40

cacgttattt ttaggagaac tgtcaacaaa ttaatgctac aactggggct taggcataat 60

cagccaacga ccaacttagt gtatgataaa acaaagctca ataaaccctc aagaagcaag 120

gaaaagaggc gagtacctgc c 141

<210> 41

<211> 39

<212> DNA

<213> Artificial Sequence

<400> 41

tgcggtattt tctcccacgt tatttttagg agaactgtc 39

<210> 42

<211> 35

<212> DNA

<213> Artificial Sequence

<400> 42

ttcggaggaa gccatggcag gtactcgcct ctttt 35

<210> 43

<211> 28

<212> DNA

<213> Artificial Sequence

<400> 43

atggcttcct ccgaagacgt tatcaaag 28

<210> 44

<211> 21

<212> DNA

<213> Artificial Sequence

<400> 44

ggagaaaata ccgcatcagg c 21

<210> 45

<211> 55

<212> DNA

<213> Artificial Sequence

<400> 45

ataatcagcc aacgaccaac nnnnnnnnnn ataaaacaaa gctcaataaa ccctc 55

<210> 46

<211> 25

<212> DNA

<213> Artificial Sequence

<400> 46

aaccttccat acgaactttg aaacg 25

<210> 47

<211> 23

<212> DNA

<213> Artificial Sequence

<400> 47

caaagttcgt atggaaggtt ccg 23

<210> 48

<211> 22

<212> DNA

<213> Artificial Sequence

<400> 48

gttggtcgtt ggctgattat gc 22

<210> 49

<211> 55

<212> DNA

<213> Artificial Sequence

<400> 49

ataatcagcc aacgaccaac gttacagtgg ataaaacaaa gctcaataaa ccctc 55

<210> 50

<211> 55

<212> DNA

<213> Artificial Sequence

<400> 50

ataatcagcc aacgaccaac gtctgttatg ataaaacaaa gctcaataaa ccctc 55

<210> 51

<211> 55

<212> DNA

<213> Artificial Sequence

<400> 51

ataatcagcc aacgaccaac acgtgttatg ataaaacaaa gctcaataaa ccctc 55

<210> 52

<211> 55

<212> DNA

<213> Artificial Sequence

<400> 52

ataatcagcc aacgaccaac ttagtgtatg ataaaacaaa gctcaataaa ccctc 55

<210> 53

<211> 34

<212> DNA

<213> Artificial Sequence

<400> 53

gatgcgctca cgcatggcag gtactcgcct cttt 34

<210> 54

<211> 39

<212> DNA

<213> Artificial Sequence

<400> 54

tgcggtattt tctcccacgt tatttttagg agaactgtc 39

<210> 55

<211> 22

<212> DNA

<213> Artificial Sequence

<400> 55

gttggtcgtt ggctgattat gc 22

<210> 56

<211> 20

<212> DNA

<213> Artificial Sequence

<400> 56

atgcgtgagc gcatctccaa 20

<210> 57

<211> 18

<212> DNA

<213> Artificial Sequence

<400> 57

ttacgcgcgg ctggcgta 18

<210> 58

<211> 34

<212> DNA

<213> Artificial Sequence

<400> 58

gccagccgcg cgtaactgca ggcatgcaag cttg 34

<210> 59

<211> 21

<212> DNA

<213> Artificial Sequence

<400> 59

ggagaaaata ccgcatcagg c 21

Claims

1.一种具有启动子活性的多核苷酸，其中，所述多核苷酸选自如下(v)-(vi)组成的组中的任一项：

(v)如SEQ ID NO：1所示序列的多核苷酸的突变体，所述突变体在SEQ ID NO：1所示序列的第76-85位中的至少两个位置处包含突变的核苷酸，所述突变的核苷酸包括位于第82位的碱基突变为T的核苷酸和位于第83位的碱基突变为A的核苷酸；

(vi)与(v)所示的核苷酸序列的反向互补序列的多核苷酸。

2.根据权利要求1所述的具有启动子活性的多核苷酸，其中，所述突变体与如SEQ IDNO：1所示序列的多核苷酸相比，具有1-13倍以上提高的启动子活性。

3.根据权利要求1或2所述的具有启动子活性的多核苷酸，其中，所述突变体的第76-85位的核苷酸序列选自如下(p₁)-(p₃₉)组成的组中的任一项：

(p₁)GGTGTGTAGG，

(p₂)ATATATTAAG，

(p₃)GTGAGTTAAA，

(p₄)ATAAAGTAAG，

(p₅)AATGTCTATA，

(p₆)TATTGTTATG，

(p₇)TGTGGATATA，

(p₈)CCCACGTATA，

(p₉)GCCTGATAGG，

(p₁₀)CTGAGGTAAC，

(p₁₁)CCGAGTTATA，

(p₁₂)GGATGTTATT，

(p₁₃)CGGTGATACT，

(p₁₄)GTCGGGTATG，

(p₁₅)TAGTAGTATT，

(p₁₆)AAGTTATAAT，

(p₁₇)TTGGTCTACA，

(p₁₈)TTCGTATATG，

(p₁₉)ATGGGCTAAA，

(p₂₀)AACATGTAAG，

(p₂₁)GTACGGTAGT，

(p₂₂)TTAGGATATG，

(p₂₃)AGGGTGTAGT，

(p₂₄)AAGTGTTAAT，

(p₂₅)TTATTATATA，

(p₂₆)ATACTGTAGT，

(p₂₇)CTGCGTTATA，

(p₂₈)AAGTGATAGG，

(p₂₉)GTCGTATATA，

(p₃₀)CTATAGTAGA，

(p₃₁)GGGTGGTAGA，

(p₃₂)GTCTGTTATG，

(p₃₃)TTTTGCTAAA，

(p₃₄)GTCTGATATC，

(p₃₅)ACGTGTTATG，

(p₃₆)TTTTGGTATG，

(p₃₇)GGGTGGTATA，

(p₃₈)TTCTGATAGG，

(p₃₉)TTAGTGTATG。

4.根据权利要求1-3任一项所述的具有启动子活性的多核苷酸，其中，所述多核苷酸的序列如SEQ ID NO：2-40任一项所示。

5.一种转录表达盒，其中，所述转录表达盒包含根据权利要求1-4任一项所述的具有启动子活性的多核苷酸。

6.根据权利要求5所述的转录表达盒，其中，所述转录表达盒还含有目标基因，所述目标基因与所述具有启动子活性的多核苷酸可操作地连接。

7.根据权利要求6所述的转录表达盒，其中，所述目标基因为蛋白编码基因。

8.一种重组表达载体，其中，所述重组表达载体包含权利要求1-4任一项所述的具有启动子活性的多核苷酸，或权利要求5-7任一项所述的转录表达盒。

9.一种重组宿主细胞，其中，所述重组宿主细胞包含权利要求5-7任一项所述的转录表达盒，或权利要求8所述的重组表达载体。

10.根据权利要求9所述的重组宿主细胞，其中，所述宿主细胞来源于棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属。

11.根据权利要求10所述的重组宿主细胞，其中，所述宿主细胞为谷氨酸棒杆菌或大肠杆菌。

12.根据权利要求11所述的重组宿主细胞，其中，所述宿主细胞为谷氨酸棒杆菌ATCC13032、谷氨酸棒杆菌ATCC 13869或谷氨酸棒杆菌ATCC 14067。

13.一种根据权利要求1-4任一项所述的具有启动子活性的多核苷酸，根据权利要求5-7任一项所述的转录表达盒，根据权利要求8所述的重组表达载体，根据权利要求9-12任一项所述的重组宿主细胞在如下至少一种中的用途：

(b)制备蛋白，或制备用于制备蛋白的试剂或试剂盒；

14.根据权利要求13所述的用途，其中，所述蛋白选自基因表达调控蛋白或与目标化合物合成相关的蛋白。

15.根据权利要求13或14所述的用途，其中，所述目标化合物包括氨基酸、有机酸中的至少一种。

16.根据权利要求15所述的用途，其中，所述氨基酸包括脯氨酸、赖氨酸、谷氨酸、苏氨酸、甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸中的至少一种，所述有机酸包括柠檬酸、琥珀酸、乳酸、醋酸、丁酸、棕榈酸、草酸、酒石酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的至少一种。

17.一种调控目标基因转录的方法，其中，所述方法包括将权利要求1-4任一项所述的具有启动子活性的多核苷酸与目标基因可操作地连接的步骤。

18.一种制备蛋白的方法，其中，所述方法包括利用权利要求5-7任一项所述的转录表达盒，权利要求8所述的重组表达载体，或权利要求9-12任一项所述的重组宿主细胞表达所述蛋白的步骤。

19.根据权利要求18所述的方法，其中，所述蛋白为与目标化合物合成相关的蛋白或基因表达调控蛋白。

20.根据权利要求18所述的方法，其中，所述方法还包括分离或纯化所述蛋白的步骤。

21.一种生产目标化合物的方法，其中，所述方法包括利用权利要求5-7任一项所述的转录表达盒，权利要求8所述的重组表达载体，或权利要求9-12任一项所述的重组宿主细胞表达与目标化合物合成相关的蛋白或基因表达调控蛋白，在所述与目标化合物合成相关的蛋白或所述基因表达调控蛋白存在的环境下生产目标化合物的步骤。

22.根据权利要求21所述的生产目标化合物的方法，其中，所述目标化合物包括氨基酸、有机酸中的至少一种。

23.根据权利要求22所述的生产目标化合物的方法，其中，所述氨基酸包括赖氨酸、谷氨酸、苏氨酸、脯氨酸、甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、半胱氨酸、谷氨酰胺、甲硫氨酸、天冬氨酸、天冬酰胺、精氨酸、组氨酸、苯丙氨酸、酪氨酸、色氨酸中的至少一种，所述有机酸包括柠檬酸、琥珀酸、乳酸、醋酸、丁酸、棕榈酸、草酸、酒石酸、丙酸、己烯酸、癸酸、辛酸、戊酸、苹果酸中的至少一种。

24.根据权利要求21所述的生产目标化合物的方法，其中，所述与目标化合物合成相关的蛋白为与L-氨基酸合成相关的蛋白。

25.根据权利要求24所述的生产目标化合物的方法，其中，所与L-氨基酸合成相关的蛋白包括丙酮酸羧化酶、磷酸烯醇式丙酮酸羧化酶、γ-谷氨酰激酶、谷氨酸半醛脱氢酶、吡咯啉-5-羧酸还原酶、氨基酸运输蛋白、ptsG系统、丙酮酸脱氢酶、高丝氨酸脱氢酶、草酰乙酸脱羧酶、葡萄糖酸阻遏蛋白、葡萄糖脱氢酶、天冬氨酸激酶、天冬氨酸半醛脱氢酶、天冬氨酸氨裂合酶、二氢吡啶二羧酸合成酶、二氢吡啶甲酸还原酶、琥珀酰二氨基庚二酸氨基转移酶、四氢吡啶二羧酸酯琥珀酰酶、琥珀酰二氨基庚二酸脱酰基酶、二氨基庚二酸差向异构酶、二氨基庚二酸脱酰基酶、甘油醛-3-磷酸脱氢酶、转酮酶、二氨基庚二酸脱氢酶和丙酮酸羧化酶中的一种或两种以上的组合。

26.根据权利要求21所述的生产目标化合物的方法，其中，所述方法还包括分离或纯化所述目标化合物的步骤。