CN1678624A - 苯甲酸盐-和邻氨基苯甲酸盐-诱导的启动子 - Google Patents
苯甲酸盐-和邻氨基苯甲酸盐-诱导的启动子 Download PDFInfo
- Publication number
- CN1678624A CN1678624A CNA038206595A CN03820659A CN1678624A CN 1678624 A CN1678624 A CN 1678624A CN A038206595 A CNA038206595 A CN A038206595A CN 03820659 A CN03820659 A CN 03820659A CN 1678624 A CN1678624 A CN 1678624A
- Authority
- CN
- China
- Prior art keywords
- promotor
- seq
- leu
- polynucleotide
- promoter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/21—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/78—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Peptides Or Proteins (AREA)
- Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)
Abstract
本发明公开了新的苯甲酸盐或邻氨基苯甲酸盐可诱导的启动子,和新的串联启动子,及其变异体和改良的突变体,用于商业的原核生物发酵系统,含有启动子的核酸构建物,使用它们的表达系统,通过使用其表达蛋白的方法和由此表达的蛋白。
Description
背景技术
细菌中的基因表达,如在任何生物体中一样,需要启动子存在于位于编码序列5’(即,上游)调控区中以引导基因转录。启动子被分为结构性启动子和可调控启动子。在商用的细菌表达系统中,可调控启动子被证明是特别有用的,因为它们可在所需基因无活性的情况下使生物体生物质量增加。这就使宿主生物体将最大的能量用于细胞分裂和生长。当可调控启动子被活化/诱导时,更多的细胞将能够表达所需的基因,从而增加所需基因产物的产量。
可调控的启动子包括:(1)可活化的启动子,即启动子一直是无活性的直至激活物蛋白与5’调控区结合;和(2)可抑制启动子,即启动子是无活性的,而5’调控区被阻遏物蛋白结合。一些基因或操作子被一个以上的机制调节。例如,一些基因和操作子同时接受活化或取阻遏调控机制,第二个调控机制,称为“代谢产物阻遏”。代谢产物阻遏,也称为“葡萄糖代谢产物阻遏”,是一种现象,其中在可调控启动子控制下的基因也可维持在不表达状态直至葡萄糖的浓度(主要的碳源)降低至阈值水平,例如直至葡萄糖饥饿的条件。换句话说,这种基因不表达直至满足两种条件:1)葡萄糖减少/饥饿和2)可调控启动子的活化或去阻遏。仅发生一种情况或另一种情况不足以完成这种基因的表达。在已经发现接受代谢产物阻遏的基因和操纵子中,许多可编码需要使用非葡萄糖碳源,即可选择碳源的酶和/或通路。
代谢产物阻遏受影响的机制仍然在激烈地探讨中。就大肠杆菌中的一些代谢产物阻遏的操纵子而言,控制的转录水平已经被指定,其中通过“可活化启动子”机制代谢产物阻遏可被克服。例如,大肠杆菌乳糖操纵子(lacZYA)维持在未转录状态直至葡萄糖饥饿可使“代谢产物激活物蛋白”与操纵子的5’调控区结合;然后,当存在乳糖时,Lac阻遏物蛋白从5’调控区中的个别位点(lac操纵子)离开,引起去阻遏,并启动转录。两种情况,即葡萄糖饥饿和乳糖的存在对于在大肠杆菌中形成lac操纵子-编码mRNA都是需要的。
在一些情况下,怀疑有翻译后控制。例如,有证据在假单胞菌和密切相关的种属中,涉及crc基因的代谢产物阻遏被翻译后介导。从bdkR调控的研究中可见此情况[Ref.7]。bdkR蛋白,一种翻译激活物,涉及假单胞菌中支链酮酸脱氢酶的表达调控。显示的数据表明,在富营养培养基中,在野生型假单胞菌中检测不到bdkR蛋白,尽管有bdkR转录物的存在。但,在突变的假单胞菌中,其中crc未配对或未活化,可检测到bkdR蛋白,bdkR转录物的水平稍低于野生菌株中发现的水平,bkdR调控基因的转录物,bdkA,被诱导了大约4倍。而且,在突变体中被鉴定的突变,其中bdkR的代谢产物阻遏被克服,已经被定位于crc基因,或其同源基因vacB。在弗氏志贺菌中,vacB蛋白可翻译后调节毒力基因,尽管少见,但这提供了crc可在翻译后发挥作用的另外证据[Ref.13]。
在商业原核生物系统中,与通过发酵产生蛋白和化学物质有关的关键技术挑战之一是转基因表达的总控制。选择用于表达目的转基因的启动子应该具有下面的性质。应该:
1.将生长与反应分开;
2.控制基因表达达到有效/最大产物产量;
3.以低/无成本诱导目的基因;和
4.在被阻遏或非诱导状态中不引起显著水平的转录。
由于这些原因,调控启动子被广泛依赖。特别是lac启动子(即,lacZ启动子)及其衍生物,特别是在DeBoer的美国专利No.4,551,433中描述的tac和trc启动子,和列举在表1中的相关启动子,是被最广泛依赖的。
表1.商用的lac启动子,衍生物和相关物 | |||
启动子 | 商用诱导物 | 细菌宿主细胞 | 参考文献 |
Ptac16 | IPTG | 大肠杆菌,假单胞菌 | 3, 4 |
Ptac17 | IPTG | 大肠杆菌,假单胞菌 | 3 |
PlacUV5 | IPTG | 大肠杆菌,假单胞菌 | 3 |
Plac | IPTG | 大肠杆菌 | 3,4 |
Plac(down) | IPTG | 大肠杆菌 | 3 |
T7 | IPTG | 大肠杆菌,假单胞菌 | 3,4 |
在典型的商业细菌发酵系统中,宿主细胞含有一种构建物,其中tac启动子可操作地连接于一个需要表达的基因或操纵子。lacI基因,是一种结构性的表达基因,编码可与lac操纵子结合的Lac阻遏物蛋白,也被包含在细菌宿主细胞中(多拷贝的lacI基因通常被包含在其中)。在生长至所需数量或密度的生物质量后,向培养中加入诱导物以去阻遏tac启动子,是所需的基因或操纵子进行表达。
在使用lac型启动子,如tac启动子的商用发酵系统,安慰诱导物,IPTG(异丙基-β-D-1-硫代吡喃半乳糖苷,也称为″异丙基硫代吡喃半乳糖苷″),是最普遍应用的。但,IPTG很昂贵,必须被谨慎控制因为它对生物系统由明显的毒性。标准的IPTG制剂现在可得到的每克大约US$18或每10克大约US$125;这些IPTG制剂也含有二氧杂环乙烷,同样对生物系统有毒。无二氧杂环乙烷的IPTG在市场上也可获得,但成本为标准IPTG价格的两倍(即,现在大约每克大约US$36或每10克大约US$250)。除了成本和其本身对发酵系统的高度毒性等问题以外,在表达产物或发酵产物被市场销售的情况下,关于IPTG的存在产生了环境卫生管理问题,因为IPTG也对人,动物和其他生物有机体有引起毒性的危险。
结果,需要同时可用于商用的发酵生产系统,以及被非或低毒性诱导物活化的启动子。
使用lac启动子和其衍生物的一个进一步缺点是这些启动子是“可泄漏的”因为即使是在天然的,被阻遏的状态,启动子仍可引起相对高的本底表达水平。因此,多拷贝的LacI阻遏物蛋白基因通常被包含在表达宿主细胞中以增加lac型启动子的阻遏程度。结果,需要的启动子同时可用于商用发酵系统,并很容易在无活性状态被严格控制直至被诱导。
根据这些考虑,已经建议几种其他的,非-lac型启动子来控制商用的原核生物发酵系统中的基因表达(见表2)。
表2.推荐的可诱导的商用非lac启动子 | |||
启动子 | 诱导物 | 细菌宿主细胞 | 参考文献 |
λPR | 高温 | 大肠杆菌,假单胞菌 | 3,4 |
λPL | 高温 | 大肠杆菌,假单胞菌 | 3,4 |
Pm | 烷基或卤代苯甲酸盐 | 假单胞菌 | 4,5 |
Pu | 烷基或卤代苯甲酸盐 | 假单胞菌 | 5 |
Psal | 水杨酸盐 | 假单胞菌 | 5 |
Para | 缺少葡萄糖时阿拉伯糖 | 大肠杆菌 | 5 |
关于表2中列举的前两个启动子,被高温诱导的启动子是由问题的:因为高温对宿主细胞培养是有害的;即使在大规模,商用发酵体积下产生温度的峰值经常也是不实际的;因为优选在较这种诱导所需温度更低的温度下操作商用的发酵装置。在表2中列举的其他4个推荐启动子,就本发明者的了解,在大规模发酵条件下并未证明可发挥良好的作用;Pu启动子的烷基和卤代甲苯诱导物对生物系统也是由明显毒性的。
因此,仍需要可用于商用发酵生产系统,被低成本,低毒性化学诱导物活化,并被严格控制的启动子。
另外,为了在普通的发酵平台中使用一种原核生物生产蛋白(和其他表达产物)和化学物质(被表达产物作用和/或宿主细胞加工),促进基因表达的控制,需要具有表达基因盒的文库。这些基因盒每个都含有多种启动子的一个或多个,具有不同的强度,和/或在不同的生长条件下或被不同的化学物质诱导。然后这些表达基因盒将被连接于多种目的基因以在有利的发酵条件下达到对这些基因的总控制。因此大量的生长相依赖性或化学可诱导的启动子的鉴定和优化对于在这种发酵平台的发酵过程中控制(转)基因的表达是很重要的。
而且,构建基因线路图已被推荐为非常精细控制基因表达的一种方式,其中第一个基因或操纵子的活化或诱导引起一个或更多个随后的基因或操纵子的阻遏或活化。线性(例如,串联和级联)和环形(例如,菊花链)基因线路图都已经被建立。见,例如,美国专利No.20010016354 A1 Cebolla Ramirez等人。这些基因线路图需要大量不同的启动子来发挥作用,在商用发酵中,基因线路图需要依赖于商用发酵条件下有效的启动子。因此,在基因线路图的领域中需要可用于商用发酵中的更多种的启动子。
如上所提到的,用于商用发酵系统的启动子应该被严格地调控这样表达仅发生在诱导过程中,优选在发酵运转中迟一些发挥效应。用来诱导启动子的化学物质必须是低成本的,对宿主细菌和其他生物体是低毒性的,必须严格地调控基因表达。根据上面的讨论,在本领域中需要新的启动子,可被轻松地调控,并使用低毒性的诱导物以低的成本被诱导。
发明概述
本发明提供了可用于商业发酵中基因表达的新启动子。在更特殊的方面,本发明提供了苯甲酸盐可诱导的启动子,邻氨基苯甲酸盐可诱导的启动子,和可用于细菌商业发酵系统中的串联启动子。
本发明提供了:
分离的和/或重组的苯甲酸盐启动子核酸,含有荧光假单胞菌天然苯甲酸盐启动子的-35区,通过一个15-20核苷酸的连接子附着在其-10区的上游;和在SEQ IDNO:1中发现的操纵性启动子核酸片段。
突变体和核苷酸序列与这种启动子核酸至少90%同源的密切相关启动子核酸;
这种启动子核酸进一步包括苯甲酸盐启动子激活物蛋白(BenR)结合位点;和
这种启动子核酸进一步包括苯甲酸盐启动子激活物蛋白编码序列,其中这种激活物蛋白编码序列编码苯甲酸盐启动子激活物蛋白,其含有的氨基酸序列与SEQID NO:2中所示的任何一条天然的、突变的、和/或截断的激活物蛋白氨基酸序列至少90%同源。
本发明也提供了:
分离的和/或重组的邻氨基苯甲酸盐启动子核酸,含有荧光假单胞菌天然邻氨基苯甲酸盐启动子的-35区,通过一个15-20核苷酸的连接子附着在其-10区的上游,;和在SEQ ID NO:7中发现的操纵启动子核酸片段;
突变体和密切相关的启动子核酸,其核苷酸序列与这种启动子核酸至少90%同源;
这种启动子核酸进一步包括邻氨基苯甲酸盐启动子激活物蛋白(AntR)结合位点;和
这种启动子核酸进一步包括邻氨基苯甲酸盐启动子激活物蛋白编码序列,其中这种激活物蛋白编码序列编码邻氨基苯甲酸盐启动子激活物蛋白,含有的氨基酸序列与SEQ ID NO:9中所示的任何一条天然的,突变的,和/或截断的激活物蛋白氨基酸序列至少90%同源。
本发明也提供了:
串联启动子包括非代谢产物阻遏的启动子,附着于(即,共价附着)天然的代谢产物阻遏的启动子的上游,直接或通过启动子间的多核苷酸连接子,其中后面的启动子的代谢产物阻遏被克服和/或显示不同的改良启动子的特性;
通过下列方法制备串联启动子,包括将原核生物非代谢产物阻遏的启动子共价附着于原核生物天然代谢产物阻遏的启动子的上游,直接或通过启动子间的多核苷酸连接子;
这种串联启动子,其中启动子间的多核苷酸连接子的长度为大约100或小于100个核苷酸;
这种串联启动子,其中构成的非代谢产物阻遏的和天然代谢产物阻遏的启动子是原核生物启动子,或细菌启动子;串联的启动子,其中构成的启动子来自相同的多个种属假单胞菌和密切相关的细菌,和/或假单胞菌属,和/或来自荧光假单胞菌;和串联启动子,其中构成的启动子来自编码可选择碳源利用酶或通路的基因或操纵子;和串联启动子,其中非代谢产物阻遏的启动子从编码邻氨基苯甲酸盐降解通路的操纵子获得,天然代谢产物阻遏的启动子从编码苯甲酸盐降解通路的操纵子获得,和/或其中邻氨基苯甲酸盐启动子和苯甲酸盐启动子选自在上述段落中总结的那些启动子;操纵串联启动子可在SEQ ID NO:13中发现,或从其中显示的构成的启动子被构建。
本发明也提供了:
通过以下方法制备的被改变的启动子,包括获得具有与任何一个被声明的启动子的碱基序列或至少SEQ ID NO:1的碱基1275-1307,至少SEQ ID NO:7的碱基1239-1274,至少SEQ ID NO:13的碱基1329-1509的任何一条序列至少90%相同和异种的碱基序列的至少一个多核苷酸;筛选多核苷酸引导在原核生物宿主细胞内转录的能力,和选择的至少一种启动子特性;并基于结果筛选至少一个启动子,选择性的具有至少一种改良的特性;和
通过下面的过程制备的改良的启动子:应用一个启动子多核苷酸,具有与任何一个被声明的启动子的碱基序列或至少SEQ ID NO:1的碱基1275-1307,至少SEQ ID NO:7的碱基1239-1274,至少SEQ ID NO:13的碱基1329-1509的任何一条序列,作为与其至少90%同源的序列改变的多核苷酸的杂交探针,或在所述的启动子多核苷酸上进行诱变和/或重组产生所述的序列改变的多核苷酸,或使用代表启动子多核苷酸的碱基序列的信息字符串进行搜索,寻找与其至少90%同源的异种字符串,提供具有所述异种字符串所代表碱基序列的序列改变的多核苷酸;或修饰这种信息字符串成为这种异种字符串,使用所述的被修饰字符串以鉴定与其相同的信息字符串,然后提供具有所述信息字符串所代表碱基序列的序列改变的多核苷酸;然后筛选序列改变的多核苷酸在原核生物细胞中引导转录的能力,和至少一种启动子特性;并基于这些结果鉴定具有至少一种改良特性的至少一种启动子。
本发明也提供了:
分离的核酸分子,含有的核酸序列,其互补体可在严格性杂交和冲洗条件下与核碱基聚合物分子杂交,该分子具有任何一个被声明启动子的碱基序列或至少SEQ ID NO:1的碱基1275-1307,至少SEQ ID NO:7的碱基1239-1274,至少SEQ IDNO:13的碱基1329-1509的任何一条序列,其中所述的分离核酸分子可在原核生物细胞中作为启动子发挥作用;和
分离的核碱基聚合物分子,具有原核生物启动子多核苷酸分子的碱基序列,具有与任何一个被声明启动子的碱基序列至少90%相同的碱基序列,或至少SEQ IDNO:1的碱基1275-1307,至少SEQ ID NO:7的碱基1239-1274,至少SEQ ID NO:13的碱基1329-1509的任何一条序列。
本发明也提供了:
重组的核酸分子可在原核生物细胞中作为表达构建物发挥作用,包括的启动子含有与任何一个被声明启动子的碱基序列至少90%相同的碱基序列或至少SEQID NO:1的碱基1275-1307,至少SEQ ID NO:7的碱基1239-1274,至少SEQ ID NO:13的碱基1329-1509的任何一个;这种重组表达构建物含有一个mRNA编码序列;这种重组表达构建物,其中表达构建物是载体;这种重组表达构建物,其中载体是质粒;遗传工程改造的原核生物宿主细胞,含有这种重组表达构建物,也优选所述重组表达构建物的启动子的相应激活物蛋白编码基因的至少1个,和多个,优选1个以上拷贝(其中所述的基因在宿主细胞中表达);表达系统含有这种遗传工程改造的原核生物宿主细胞,它们优选含有对于所述重组表达构建物启动子的相应激活物蛋白编码基因的至少一个,和多个,优选1个以上拷贝(其中所述的基因在宿主细胞中表达);这种表达系统其中所述的启动子是苯甲酸盐可诱导的启动子,激活物蛋白具有SEQ ID NO:2残基1-335或21-335的任何一个的氨基酸序列,选择性的含有Asn152;这种表达系统其中的启动子是邻氨基苯甲酸盐可诱导的启动子,激活物蛋白具有SEQ ID NO:9残基1-330或含有Ala268的SEQ ID NO:9残基1-330的氨基酸序列。
本发明也提供了:
一个制备转录产物的过程,包括生长这种遗传工程改造的原核生物宿主细胞,并诱导其中的重组表达构建物,因此可表达它们编码的转录产物;和一个制备多肽的过程,包括表达mRNA转录产物,通过使用这种制备转录产物的过程,并进一步使宿主细胞将mRNA翻译成它们编码的多肽。
本发明也提供了在原核生物细胞中可运转的转录激活物蛋白。这些包括具有的氨基酸序列与SEQ ID NO:2的残基1-335,含有Asn152的SEQ ID NO:2残基1-335,SEQ ID NO:2的残基21-335,和含有Asn152的SEQ ID NO:2残基21-335任何一条序列至少90%同源的转录激活物蛋白;和具有的氨基酸序列与SEQ ID NO:9的残基1-330,或含有Ala268的SEQ ID NO:9残基1-330任何一条序列至少90%同源的转录激活物蛋白。本发明也提供了含有编码这种转录激活物蛋白的碱基序列的多核苷酸分子。
附图描述
图1显示了pDOW1019的质粒图谱,含有Pben509的载体,根据本发明的苯甲酸盐可诱导的启动子。
图2显示了pDOW1028的质粒图谱,含有Pben278的载体,根据本发明的苯甲酸盐可诱导的启动子。
图3显示了pDOW1035的质粒图谱,含有根据本发明的邻氨基苯甲酸盐可诱导的启动子的载体,包括其激活物蛋白的编码序列。
图4显示了pDOW1057的质粒图谱,含有根据本发明的邻氨基苯甲酸盐-苯甲酸盐串联启动子的载体。
图5显示了Pben509(SEQ ID NO:1的核苷酸c994-c1502)与Pben278(SEQ IDNO:1的核苷酸g1228-c1502)苯甲酸盐可诱导的启动子的核苷酸序列比较。上游ORF的TTA翻译终止位点,和推测的-35区(TTGACG),-10区(TACGGT),和″C″转录起始位点被划线标出。Pben278中的″C″双划线指示Pben278中的突变,与Pben509和基因组序列不同;这种突变是在PCR扩增过程中导入的。
图6显示的条形图,显示了在Pben509(pDOW1019)或Pben278(pDOW1028)控制下β半乳糖苷酶的诱导,在0mm(□)或10mM(·)苯甲酸钠的存在下。pDOW1017是一个没有启动子的载体。显示的结果是诱导后24小时测定的三个孔的平均测定值(在诱导前宿主细胞生长在限定盐类的培养基)。
图7显示了4种Pant启动子的核苷酸序列比较:Pant+AntR(SEQ ID NO:13的al-c1395),Pant713(SEQ ID NO:7的核苷酸c592-c1304),Pant705(SEQID NO:7的核苷酸c592-g1288),和Pant311(SEQ ID NO:7的核苷酸c994-c1304)。双划线的核苷酸三联体(TCA和CAT)分别指示了由显示链的互补链所编码的AntR ORF的终止和起始密码子。单独双划线的″A″指示基因组序列中的突变,在两条链中都被发现,位于AntR编码序列内;这种改变引起了AntR蛋白中丙氨酸成为丝氨酸的表达转变。推测的-35区(ATAGCC),-10区(CTTAAT),和转录起始位点(″A″),和推测的核糖体结合位点(GGAGG)的互补码,所有都被划线。
图8显示了Pant713构建物(pDOW1029)与antR/Pant构建物(pDOW1035)活性比较的图表,当用5mM邻氨基苯甲酸盐或2mM 6-氯代邻氨基苯甲酸盐诱导时。在所有构建物中,启动子与β-半乳糖苷酶编码序列融合。β-半乳糖苷酶报告子的活性诱导后持续8小时的时间。结果显示诱导后pDOW1035发生的活性较pDOW1029更快和更高。
图9显示的条形图显示了Pant-Pben串联启动子构建物的诱导和构成的启动子构建物的诱导。在所有构建物中,启动子与β-半乳糖苷酶编码序列融合。显示了用苯甲酸盐或邻氨基苯甲酸盐诱导Pant-Pben串联启动子构建物(pDOW1057)与含有其中一个构成的启动子的构建物的比较:Pben启动子构建物(pDOW1028),含有Pben278,和Pant启动子构建物(pDOW1035),含有antR/Pant。图9A显示了诱导后5小时的结果,图9B显示了诱导24小时的结果。
图10显示的条形图,比较了Pben509与通过Pben509的易错PCR产生的改良突变体2d3和21b5的活性。通过将含有启动子的片段与phoA报告子基因融合形成表达构建物。含有构建物的培养物用10mM苯甲酸盐诱导,碱性磷酸酶活性在诱导后24小时测定。
图11显示了Pben509和通过易错PCR产生的其两个改良突变体:突变体2d3(SEQ ID NO:1的核苷酸c994-c1502,a1106→t1106)和突变体21b5(SEQ ID NO:1的核苷酸c994-c1502,c1223→t1223和g1302→a1302)核苷酸序列的比较。上游ORF的TTA翻译终止位点,推测的-35区(TTGACG),-10区(TACGGT),和″C″转录起始位点被下划线标出。突变以双划线显示。
图12显示了在20L发酵条件下邻氨基苯甲酸盐诱导表达的图表。antR/Pant构建物pDOW1035(·)和串联启动子构建物pDOW1057(▲)用5mM邻氨基苯甲酸盐结合1mM/小时邻氨基苯甲酸盐加料诱导。显示了每轮20L发酵的活性水平。
图13显示的图表证明了在通过单交叉敲除宿主细胞(荧光假单胞菌)的antA基因建立的antA敲除宿主中从串联启动子构建物(pDOW1057)获得了被改进的邻氨基苯甲酸盐诱导表达。显示了在大约5mM邻氨基苯甲酸盐的靶水平上诱导的20L发酵的结果,诱导后持续48小时的时间。不需要邻氨基苯甲酸盐加料。
图13A显示了从报告子基因构建物中表达的β-半乳糖苷酶活性;图13B显示了维持邻氨基苯甲酸盐浓度,证明敲除宿主细胞不能代谢邻氨基苯甲酸盐。
图14显示的条形图显示了Pben-10突变体的诱导。显示了在用0mM(□)或5mM(·)苯甲酸钠诱导24小时后,含有指示的Pben::phoA融合体的荧光假单胞菌的碱性磷酸酶活性。显示了三个样本的代表性实验。
图15显示的条形图显示了Pant-10突变体的诱导。显示了在用0mM(□)或5mM(·)邻氨基苯甲酸盐诱导24小时后,含有指示的Pant::phoA融合体的荧光假单胞菌ant::kanR的碱性磷酸酶活性。显示了三个样本的代表性实验。
图16显示的条形图指示了Pben88-10对antR-Pant311-Pben串联启动子活性的作用。显示了在用0mM(□)或5mM(·)苯甲酸钠(图16A)或邻氨基苯甲酸盐(图16B)诱导24小时后,含有指示的串联启动子::lacZ融合体的荧光假单胞菌的β半乳糖苷酶的活性。显示了三个样本的代表性实验。
图17显示了当benR以多拷贝存在于pDOW1090中时,在20L发酵过程中苯甲酸盐消耗的图表。显示的数据是HPLC分析的结果,测量了在双重发酵中两个20L发酵罐的诱导过程中苯甲酸盐的浓度,被标记的运转轮次″03021II″(●)和轮次″03021 IK″(■)。培养物用5mM苯甲酸钠诱导。
图18显示了串联启动子构建物活性比较的条形图。显示了在用0或5mM苯甲酸钠(图18A和18B,2,4和24小时时间点)或邻氨基苯甲酸盐(图18C和18D,0,2,6和24小时时间点)诱导后,含有指示的串联启动子::lacZ融合体的荧光假单胞菌的β-半乳糖苷酶活性(除了pDOW1035,是ant激活物-Pant311::1acZ;和pDOW1126,是ben激活物Pben88-10共有序列::lacZ)。显示了三个样本的代表性实验。时间点用字母“I”表示为“诱导后”。
图19显示的条形图证明了在benAB敲除株中的Pben活性分析,携带pDOW1019(Pben278::lacZ)荧光假单胞菌MB101benAB敲除株的β-半乳糖苷酶活性显示为用0mM(□)或5mM(■)苯甲酸钠诱导至24小时的结果。细胞在LB培养基中生长。
优选实施方案的详细描述
本发明提供了商用的苯甲酸盐可诱导的启动子,邻氨基苯甲酸盐可诱导的启动子,和可用于商用的发酵系统中的串联启动子。在这种系统中使用的优选细菌宿主细胞包括假单胞菌和密切相关的细菌。这些启动子的化学诱导物包括苯甲酸和邻氨基苯甲酸,其有效的化学类四五和其生物学可接受的盐类。
苯甲酸和邻氨基苯甲酸和其生物可接受的盐类,优选钠盐或钾盐,是具有低毒性的廉价化学物质,可用作细菌宿主细胞的(可选择)碳源,包括假单胞菌和密切相关的细菌。例如,这些化学诱导物可在市场上购得,低于大约每克US$0.15(相比IPTG每克大约US$18或US$36)。
本发明已经分离,测序,和定性了用于表达荧光假单胞菌苯甲酸盐(benABCD)降解基因的缺少葡萄糖时可被苯甲酸盐诱导的天然启动子,和可被邻氨基苯甲酸盐诱导的荧光假单胞菌(antABC)降解基因。(在荧光假单胞菌生物型A中,这些操纵子的表达产物分别是降解苯甲酸盐和邻氨基苯甲酸盐的分解代谢通路酶)这些启动子已经被发现,当用5mM苯甲酸钠和5mM邻氨基苯甲酸钠诱导时,分别可诱导外源基因表达大约250-倍(苯甲酸盐启动子),大约25倍至大约35倍(邻氨基苯甲酸盐启动子)。本发明人已经发现这些启动子用于商用发酵系统中足以诱导在细菌宿主细胞中产生蛋白和化学物质,包括假单胞菌和密切相关的细菌。
另外,本发明人已经建立了串联启动子构建物,其中非代谢产物阻遏的启动子被连接在天然代谢产物阻遏的启动子的上游,因此惊人地克服了后者启动子的代谢产物阻遏和/或显示了不同的改良特性(例如,诱导的强度增加或调节的紧密度增加)。串联启动子构建物的至少一个实例已经被描述用于外源基因的表达[6]。但,本实例是相同启动子Plac的两个拷贝的串联排列,参考文献显示没有证据表明串联的Plac-Plac启动子较单Plac启动子有优势。同样,已知双启动子构建物,例如可用于穿梭载体中,其中在不同种属或种类中可运转的两个启动子都可操作地连接于相同的基因这样基因可在两个不同的种属或种类中表达。
与这些串联和双重启动子构建物相比,现在建立的串联启动子构建物,其中两个不相同的启动子串联排列,已经令人惊奇地发现可保留两个启动子的优势特征。例如,邻氨基苯甲酸盐启动子,Pant和苯甲酸盐启动子,Pben的串联排列可形成串联启动子,当用邻氨基苯甲酸盐在发酵条件下诱导时,显示即不受代谢产物的阻遏(Pant的理想特征,非Pben共有)和改进的诱导强度(Pben的理想特征,非Pant享有)。因此,本发明的串联启动子可保留单个启动子元件的所需特性,这样得到的串联启动子可发挥未定性的特性;例如诱导强度增加,或调节紧密度增加(即,仅当与启动子的激活物或阻遏物蛋白的相关诱导物接触时转录);和/或缺少代谢产物阻遏。
术语表
A###(吸收)
如在此所使用,就分析检测而言,术语如″A450″的含义是“在450nm波长下的吸收”。
一个和一个(不定冠词)
如在此使用和在附加的权利要求中,单数形式″a″,″an″,和″the″包括单数和复数对象除非文中清晰地说明。因此,例如,提到“宿主细胞”在字面上是指那些仅应用于单个宿主细胞,应用于单一类型的多个宿主细胞,和多种类型的多个宿主细胞的实施例。
*(星号)
如在此所使用,就计算而言,“*”符号(星号)是指数学乘性函数。
BCIP
5-溴代-4-氯-3-吲哚磷酸盐,例如其二价盐,如二钠盐。它可与,例如四唑盐联合使用,如:氮蓝四唑(NET)的卤盐,例如双-[2-(4-yl-2-甲氧苯基)-3-(4-硝基酚)-5-苯基-四唑氯化物];或碘-硝基-四唑(INT),也称为碘蓝四唑,例如2-(4-四碘酚酞)-3-(4-硝基酚)-5-苯基四唑氯化物。
包含
如在此所使用的,术语“包含”的含义是主体含有在术语“包含”之后列举的元素以及未列举的任何其他元素。在此,术语“包括”被解释为广泛的和无限制的术语;因此,对主体“包含”的被列举元素的权利要求是要解释为包括在内的,即被解释为不限制于被列举的元素。因此,术语“包含”被认为与术语如,“具有”,“含有”,或“包括”是同义的。
如在此所述,本发明提到了使用了术语“包含”和“其特征是”。但,在更狭义地描述,限定或对本发明进行权利要求时,较这些术语具有更狭义含义的字和短语也可用来替代这些无限制的术语。
相应的
如在此所使用,关于与多核苷酸源“相应的”的序列记录,术语“相应的”的含义是包含在序列记录中的作为信息字符串的指定碱基序列,以多核苷酸源内的含核碱基序列的物质分子形式存在。
ddH2O
如在此所使用,ddH2O是指通过Milli-Q梯度系统使用Q-GARD纯化包(Millipore,Bedford,MA)纯化的蒸馏去离子水。
dNTPs
除了被指明以外,如在此所使用,就多核苷酸合成反应的试剂而言,术语“dNTP”的含义是4种脱氧核糖核苷酸三磷酸盐(dGTP,dCTP,dATP,dTTP)每种的等摩尔溶液。因此,例如,就10mM dNTP而言,是指含有10mM每种dGTP,dCTP,dATP,和dTTP的溶液。
外源的和外来的
术语“外源的”的含义是来自指定细胞或分子之外来源的“。在本发明中,如在本领域中普遍使用的,这个术语可与术语“外来的”相互交换使用,作为同义词。这些术语在此被用来表示指定物体对于指定的细胞或分子(例如,启动子多核苷酸)是外来的,即,事实上在细胞中未被发现和/或事实上没有发现具有该分子或与该分子相连。
异种的
如在此所使用,术语“异种的”的含义是序列中“不相同的”(碱基序列中非100%相同)。
在…中和在…上
如在此所使用关于使用生长培养基生长生物体,生物体可被叙述为生长“在培养基中”或“在培养基上”。在本发明的表达系统中,培养基优选是凝胶或液体培养基,更优选水凝胶或液体培养基,仍更优选的是水溶液培养基。因此,在文中,术语“在…中”和“在…上”被用作同义词,表示宿主细胞与培养基接触。
信息字符串
如在此所使用,短语“信息字符串”的含义是一系列数据元素(例如,位,字节或字母数字字符),该系列代表指定系列的核碱基的信息。
IPTG
异丙基-β-D-1-硫代吡喃半乳糖苷。
ONPG
邻硝基酚-β-D-吡喃半乳糖苷,也称为2-硝基酚-β-D-吡喃半乳糖苷。
ORF
开放可读框。
PNPP
对硝基苯磷酸盐,例如,其二价盐,如二钠盐。也称为4-硝基苯磷酸盐。
多核苷酸长度
如在此使用,术语“核苷酸”被用来描述多核苷酸的长度。但在本文中,术语的含义就单链多核苷酸而言都是指核苷酸的长度,就双链多核苷酸而言是指碱基对的长度。
多核苷酸来源
如在此所使用,短语“多核苷酸来源”的含义是含有指定核碱基序列的核酸的物质实施例的任何来源,如含有这种多核苷酸分子的核酸样品,克隆,或天然细胞。
启动子激活物蛋白的术语
指定启动子的天然激活物被指定为″R″如,BenR,AntR分别作为Pben和Pant启动子的天然激活物。
启动子的术语
″Pant″:荧光假单胞菌邻氨基苯甲酸盐操纵子的启动子。
″Pben″:荧光假单胞菌苯甲酸盐操纵子的启动子。
″Plac″:大肠杆菌乳糖操纵子的启动子。
″Ptandem″和″串联启动子″:启动子的串联排列,其中非代谢产物阻遏的启动子通过0至大约100个核苷酸的序列附着于代谢产物阻遏的启动子的上游。在此其例证是Pant-Pben串联启动子构建物。
″启动子″:含有至少25个核苷酸,更普遍的大约30个核苷酸的多核苷酸,含有原核生物的″穿过-10区的-35区″。优选,这个″穿过-10区的-35区″是从单条基因获得的″穿过-10区的-35区″,或从同源基因获得的-35区和-10区组合,该基因从至少一个原核生物,更优选至少“假单胞菌和密切相关的菌属”的一种生物体获得。优选,“穿过-10区的-35区”是σ70″穿过-10区的-35区″,和在组合中的“-35区”和“-10区”分别是σ70-35区和σ70-10区。
-35区通过一个优选大约15至大约20个核苷酸的启动子内多核苷酸连接在-10区的上游。更优选地,根据本发明启动子包含大约35个核苷酸,含有除“穿过-10区的-35区”之外,大约5至大约10个紧接的下游核苷酸片段,更优选的是6至7个紧接的下游核苷酸,在转录起始位点核苷酸处中止。在一个优选的实施方案中,这个片段从相同的基因获得,提供-35或-10区的至少一个。在一个特别优选的实施例中,启动子也含有大约20至大约250,更优选大约40至大约150个核苷酸的紧接上游区,包含一个启动子激活物蛋白结合位点,优选AraC/XylS类结合位点。在一个优选的实施方案中,结合位点区可从相同的基因获得,提供-35或-10区的至少一个。
如在此使用,术语″-35区″或″负35区″,是指在转录起始位点上游(即,其5’方向)大约35个核苷酸开始的5-6个核苷酸,转录起始位点被编为″+1″。同样,术语″-10区″或″负10区″是指转录起始位点上游(即,其5’方向)大约10个核苷酸开始的5-6个核苷酸,转录起始位点被编为″+1″。
RNA术语
如在此所使用,下列的RNA属于具有下面所列举的定义:
aRNA:反义RNA
cRNA:胞质RNA
gRNA:指引RNA(删除线粒体的前体-mRNA)
hnRNA:杂核RNA
mRNA:信使RNA
miRNA:小分子RNA(调节mRNA的表达)
mtRNA:线粒体RNA
nRNA:核RNA
ncRNA:非编码RNA
pRNA:包装RNA(进行病毒和噬菌体颗粒的组装)
rRNA:核糖体RNA
satRNA:卫星RNA
scRNA:细胞质小RNA
siRNA:小干扰RNA
snRNA:核内小分子RNA
snoRNA:核仁小分子RNA
srpRNA:信号识别颗粒RNA
stRNA:小的时相RNA(miRNA的亚群)
tRNA:转运RNA
tmRNA:转运-信使样RNA(在停止的核糖体中标记随后降解,新生的多肽)
vRNA:病毒(和/或噬菌体)RNA
搜索
如在此使用的关于信息的搜寻,术语“搜索”的含义是在已知的信息字符串和另一个信息字符串之间进行一次或多次比较(通过手工,肉眼,或自动的方法)以鉴定相同的或不同的信息字符串。
序列记录
如在此所使用,短语“序列记录”的含义是一个或多个信息字符串的储存实施例,如计算可读记录或纸的记录。
-10变异启动子的标志
″-10con″:表示变异的启动子,其中天然的-10区已经被共有的-10区序列’tataat’替代。
″-10ben″:表示变异的启动子,其中天然的-10区已经被来自荧光假单胞菌的-10区’tacggt’替代。
″-10benAc″:表示变异的启动子,其中天然的-10 region已经被来自Acinetobacter的-10区‘taaggt’替代。
″-10wt″:表示截断的天然启动子,保留了野生型-10序列。
~(代字号)
~符号(代字号)在此被用来表示“大约”。
×(倍)
×符号(乘号),如在此使用关于溶液的浓度,其含义是,例如5×制剂是5倍浓缩的1×制剂,对于相同的溶液组合物(即,对于在此所有成分相同的相对量)。
Tris
术语″Tris″在此使用的含义是Tris(羟甲基)氨基甲烷(可从FisherScientific,Pittsburgh,PA购得)。
X-gal
5-溴代-4-氯-β-吲哚-p-D-吡喃半乳糖苷
一般材料&方法
除非另外注明,分子生物学领域中的标准技术,载体,控制序列元件,和其他表达系统元件可用于进行核酸操作,转化和表达。这种标准的技术,载体和元件可见于,例如:Ausubel等人,(主编),现代分子生物学方法(1995)(John Wiley& Sons);Sambrook, Fritsch,& Maniatis(主编),分子克隆(1989)(Cold SpringHarbor Laboratory Press,NY);Berger & Kirnmel,酶学方法152:分子克隆技术指南(1987)(Academic Press);和Bukhari等人,(主编),DNA插入元件,质粒和游离体(1977)(Cold Spring Harbor Laboratory Press,NY)。
本发明的启动子包括来自荧光假单胞菌的苯甲酸盐启动子,来自荧光假单胞菌的邻氨基苯甲酸盐启动子,及其衍生物。本发明的启动子也包括串联启动子,其具有连接在天然代谢产物阻遏启动子上游的非代谢产物阻遏启动子,其中后面的启动子的代谢产物阻遏可被克服和/或显示不同的改进的启动子特性。
当用于表达系统中时,本发明的启动子一般是以DNA的形式。但启动子的核碱基序列可以DNA,RNA或任何本领域已知的核酸类似物,例如肽核酸(PNA)的形式存在。
苯甲酸盐启动子
在一个优选的实施方案中,本发明的苯甲酸盐启动子是荧光假单胞菌苯甲酸盐天然启动子或其改良的变异体。本发明已经发现这种启动子是可用苯甲酸,苯甲酸类似物(例如,m-苯甲酸),和其生物可接受的盐类(例如,苯甲酸钠)诱导的。
在一个优选的实施方案中,本发明的苯甲酸盐启动子包含荧光假单胞菌天然苯甲酸盐启动子的-35区,附着在该天然启动子的-10区上游,经一个15-20个核苷酸的连接子。在一个优选的实施方案中,连接子的长度为15个核苷酸。
在一个优选的实施方案中,本发明的苯甲酸盐启动子包括经一个15-20核苷酸连接子,附着在SEQ ID NO:1的核苷酸1296-1301上游的SEQ ID NO:1的核苷酸1275-1280。在一个优选的实施方案中,连接子为15个核苷酸长。在一个特别优选的实施例中,连接子是SEQ ID NO:1的核苷酸1281-1295,本优选实施例的苯甲酸盐启动子因此包含SEQ ID NO:1的核苷酸1275-1301。在一个优选的实施方案中,本发明的苯甲酸盐启动子包含SEQ ID NO:1的核苷酸1275-1301,紧接着附着在长度为大约6个核苷酸,优选6个核苷酸的间隔区区段上游,并中止在可作为转录起始位点发挥作用的核苷酸。在一个优选的实施方案中,间隔区片段是SEQ IDNO:1的核苷酸1302-1307,本优选实施例的苯甲酸盐启动子因此包含SEQ ID NO:1的核苷酸1275-1307。
在一个优选的实施方案中,本发明的苯甲酸盐启动子包含″-35至-10区″和苯甲酸盐启动子激活物(或阻遏物)蛋白结合位点,优选激活物蛋白结合位点。在一个优选的实施方案中, 苯发明的苯甲酸盐启动子包含SEQ ID NO:1的核苷酸1275-1301,紧接着附着于大约50个核苷酸长的间隔区的下游。在一个优选的实施方案中,本发明的苯甲酸盐启动子包含SEQ ID NO:1的核苷酸1275-1301,紧接着附着于大约45个核苷酸长的间隔区下游。在一个优选的实施方案中,间隔区具有SEQ ID NO:1中显示区域的序列,在核苷酸1275的上游大约50个核苷酸开始,在核苷酸1274结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:1中显示区域的序列,在核苷酸1275上游大约45个核苷酸开始,在核苷酸1274结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:1核苷酸1228-1274的序列,本发明的苯甲酸盐启动子因此包含核苷酸1228-1301的序列。
在一个优选的实施方案中,本发明的苯甲酸盐启动子包含SEQ ID NO:1的核苷酸1275-1301,紧接着附着于所述间隔区区段的上游和紧接着附着于所述间隔区的下游。在一个优选的实施方案中,本发明的苯甲酸盐启动子包含SEQ ID NO:1的核苷酸1228-1307。
在一个优选的实施方案中,在表达系统中,其中使用根据本发明的苯甲酸盐启动子,宿主细胞也包含和表达至少一个编码苯甲酸盐启动子激活物蛋白的核酸。即使优选的是在此使用这种Pben激活物蛋白编码核酸的多个表达拷贝。在一个优选的实施方案中,Pben激活物蛋白将具有SEQ ID NO:2的氨基酸序列或其残基152(Asn)变异体,或SEQ ID NO:1的残基21-335的氨基酸序列或其残基152(Asn)变异体。在一个优选的实施方案中,编码Pben激活物蛋白的核酸将含有SEQ ID NO:1的碱基285-1229的序列;或其碱基679突变变异体,或SEQ ID NO:1的碱基225-1229的序列或其碱基679突变变异体;或其任何之一的互补体;或其任何之一的RNA等价物。
邻氨基苯甲酸盐启动子
在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子是荧光假单胞菌天然苯甲酸盐启动子或其改良的变异体。本发明已经发现这种启动子是可用邻氨基苯甲酸,邻氨基苯甲酸类似物(例如,卤代邻氨基苯甲酸),和其生物可接受的盐类(例如,邻氨基苯甲酸钠);和o-甲苯酸盐(o-甲苯酸盐已经发现与邻氨基苯甲酸盐一样可诱导这种启动子)诱导的。
在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含荧光假单胞菌天然邻氨基苯甲酸盐启动子的-35区,附着在该天然启动子的-10区上游,经一个15-20个核苷酸的连接子,更优选16-19个核苷酸连接子。在一个优选的实施方案中,连接子的长度为19个核苷酸。
在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包括经一个15-20核苷酸连接子,附着在SEQ ID NO:7的核苷酸1264-1268上游的SEQ ID NO:1的核苷酸1239-1244。在一个优选的实施方案中,连接子为19个核苷酸长。在一个特别优选的实施例中,连接子是SEQ ID NO:7的核苷酸1245-1263,本优选实施例的邻氨基苯甲酸盐启动子因此包含SEQ ID NO:7的核苷酸1239-1268。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着在长度为大约6个核苷酸,优选6个核苷酸的间隔区区段上游,并中止在可作为转录起始位点发挥作用的核苷酸。在一个优选的实施方案中,间隔区片段是SEQ ID NO:7的核苷酸1269-1274,本优选实施例的邻氨基苯甲酸盐启动子因此包含SEQ ID NO:7的核苷酸1239-1274。
在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含″-35至-10区″和邻氨基苯甲酸盐启动子激活物(或阻遏物)蛋白结合位点,优选激活物蛋白结合位点。在一个优选的实施方案中,邻氨基苯发明的苯甲酸盐启动子包含SEQ IDNO:7的核苷酸1239-1268,紧接着附着于大约250个核苷酸长的间隔区的下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约200个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约150个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约120个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约110个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约100个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约85个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约80个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约75个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约70个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约65个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约60个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约55个核苷酸长的间隔区下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1268,紧接着附着于大约50个核苷酸长的间隔区下游。
在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约100个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约85个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约80个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约75个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约70个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约65个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约60个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约55个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7中显示区域的序列,在核苷酸1239的上游大约50个核苷酸开始,在核苷酸1238结束。在一个优选的实施方案中,间隔区具有SEQ ID NO:7核苷酸1139-1238的序列,本优选实施例的邻氨基苯甲酸盐启动子因此包含SEQ ID NO:7的核苷酸1139-1238。
在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQ ID NO:7的核苷酸1239-1274,紧接着附着于所述间隔区区段的上游和紧接着附着于所述间隔区的下游。在一个优选的实施方案中,本发明的邻氨基苯甲酸盐启动子包含SEQID NO:7的核苷酸1139-1274。
在一个优选的实施方案中,在表达系统中,其中使用根据本发明的邻氨基苯甲酸盐启动子,宿主细胞也包含和表达至少一个编码邻氨基苯甲酸盐启动子激活物蛋白的核酸。即使优选的是在此使用这种Pant激活物蛋白编码核酸的多个表达拷贝。在一个优选的实施方案中,Pant激活物蛋白将具有SEQ ID NO:9的氨基酸序列或其残基268(Ala)变异体。在一个优选的实施方案中,编码Pant激活物蛋白的核酸将含有SEQ ID NO:8的碱基1-990的序列;或其碱基802变异;或其任何之一的互补体;或其任何之一的RNA等价物。
突变体和密切相关的激活物蛋白和编码它们的多核苷酸
如下所述的用于获得突变启动子的相同方法同样可用来获得突变的激活物蛋白和其编码序列和基因。在这种情况下,编码指定激活物蛋白的基因的至少一部分,例如,其所有或部分编码序列,可用作或用来形成用于杂交探测的探针;或提供可用于形成信息字符串的碱基序列,与其相同或至少90%相同,为检测搜索数据库中结构相关的序列。同样全部或部分激活物蛋白的氨基酸序列可用作信息字符串以执行这样的搜索。然后通过杂交或生物信息搜索鉴定得到的序列被检测启动子激活活性和/或改进的特性。
因此,也包括在本发明中的是具有与下列至少90%相同和异种的氨基酸序列的转录激活物蛋白:Pben激活物蛋白,具有SEQ ID NO:2残基1-335,含有Asn152的SEQ ID NO:2残基1-335,SEQ ID NO:2残基21-335,和含有Asn152的SEQ IDNO:7残基21-335的任何一个;和Pant激活物蛋白,具有SEQ ID NO:9残基1-330和含有Ala268的SEQ ID NO:9残基1-330的任何一个的氨基酸序列。本发明也包括了编码所述突变体和密切相关转录激活物蛋白的多核苷酸。
串联启动子
在一个优选的实施方案中,本发明的串联启动子包含附着在天然代谢产物阻遏的启动子上游的(天然)非代谢产物阻遏的启动子,其中后面的启动子的代谢产物阻遏被克服和/或显示不同的改良的启动子特性。
在一个优选的实施方案中,非代谢产物阻遏的启动子和天然的代谢产物阻遏的启动子选自原核生物。在一个优选的实施方案中,非代谢产物阻遏的启动子和天然的代谢产物阻遏的启动子选自细菌。在一个优选的实施方案中,非代谢产物阻遏的启动子和天然的代谢产物阻遏的启动子选自变形菌;优选革兰氏阴性变形菌。在一个优选的实施方案中,非代谢产物阻遏的启动子和天然的代谢产物阻遏的启动子选自“假单胞菌和密切相关的细菌”或来自其亚群,如下所规定。
在一个优选的实施方案中,两个启动子都选自相同的种属。在一个优选的实施方案中,两个启动子都从一类的相同种属中获得,该类选自“假单胞菌和密切相关细菌”或其亚群中,如下所规定。在一个优选的实施方案中,两个启动子均选自假单胞菌属的生物体。在一个优选的实施方案中,两个启动子均选自假单胞菌属的相同种类。在一个优选的实施方案中,两个启动子均选自荧光假单胞菌。在一个优选的实施方案中,两个启动子均选自荧光假单胞菌生物型A。
依照本发明选择用于串联启动子中的单个启动子可以是可活化启动子,可抑制启动子或其组合物。在一个优选的实施方案中,单个启动子的至少一个和优选两个都是可活化的启动子。当可抑制的启动子在这种串联启动子中以启动子元件存在时,优选其中应用串联启动子的细胞也含有阻遏物蛋白的至少一个,优选一个以上的拷贝的可表达编码序列,该蛋白可介导启动子的调控。当可活化启动子在这种串联启动子中以启动子元件存在时,优选其中应用串联启动子的细胞也含有激活物蛋白的至少一个,优选一个以上拷贝的可表达编码序列,该蛋白可介导启动子的调控。
在一个优选的实施方案中,可获得两个启动子作为基因或操纵子的天然启动子,该基因或操纵子编码的酶和/或通路能够使细胞利用(例如,导入,导出,转运或代谢)可选择碳源。在一个优选的实施例,非代谢产物阻遏的启动子是基因或操纵子的天然启动子,该基因或操纵子编码的酶和/或通路能够生物催化降解邻氨基苯甲酸盐,即,“邻氨基苯甲酸盐启动子”。在一个优选的实施方案中,天然的代谢产物阻遏启动子是基因或操纵子的天然启动子,该基因或操纵子编码的酶和/或通路能够生物催化降解苯甲酸盐,即“苯甲酸盐启动子”。在一个优选的实施方案中,邻氨基苯甲酸盐启动子是如上所述的邻氨基苯甲酸盐启动子。在一个优选的实施方案中,苯甲酸盐启动子是如上所述的苯甲酸盐启动子。
在一个优选的实施方案中,本发明的串联启动子是通过将荧光假单胞菌天然邻氨基苯甲酸盐启动子连接于荧光假单胞菌天然苯甲酸盐启动子的上游形成的构建物。本发明者已经发现这种启动子的排列是可用邻氨基苯甲酸,邻氨基苯甲酸类似物(例如,卤代邻氨基苯甲酸)及其生物可接受的盐类(例如,邻氨基苯甲酸盐);苯甲酸和其生物可接受的盐类;和o-甲苯酸盐(o-甲苯酸盐已经发现与邻氨基苯甲酸盐一样可诱导这种启动子)诱导的。
在一个优选的实施方案中,非代谢产物阻遏的启动子紧接着附着于天然代谢产物阻遏启动子的上游。这种附着直接发生在两个启动子之间(或直接发生在含有启动子的天然核酸区段之间)或通过例如,将启动子(或区段)互相连接的多核苷酸连接子(或区段)的方式。在一个优选的实施方案中,非代谢产物阻遏的启动子附着于天然的代谢物阻遏启动子的上游,经一个启动子间连接子。优选,启动子间连接子是多核苷酸,只要多核苷酸连接子不含有可作为转录终止信号的序列。在一个优选的实施方案中,启动子间连接子是长度大约100个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度小于100个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于90个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于80个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于70个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于60个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于50个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于40个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于30个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于20个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度等于或小于10个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度为至少大约5个核苷酸,或至少大约10个核苷酸,或至少大约20个核苷酸,或至少大约30个核苷酸,或至少大约40个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度为大约5至大约50个核苷酸,或大约10至大约50个核苷酸,或大约20至大约50个核苷酸,或大约30至大约50个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子是长度为43个核苷酸的多核苷酸。在一个优选的实施方案中,启动子间连接子具有SEQ ID NO:14的序列。
在一个优选的实施方案中,串联启动子含有的邻氨基苯甲酸盐启动子序列选自SEQ ID NO:13的核苷酸1221-1365,1221-1371,1329-1365,和1329-1371,附着于苯甲酸盐启动子序列的上游,该序列包括SEQ ID NO:13的核苷酸1430-1503,1430-1509,1477-1503,和1477-1509。在一个优选的实施方案中,本发明的串联邻氨基苯甲酸盐-苯甲酸盐启动子,苯甲酸盐启动子部分包含″-35至-10区″和苯甲酸盐启动子激活物(或阻遏物)蛋白结合位点,优选激活物蛋白结合位点。在一个优选的实施方案中,串联启动子包含SEQ ID NO:13的核苷酸1329-1503。在一个优选的实施方案中,串联启动子包含SEQ ID NO:13的核苷酸1329-1509。在一个优选的实施方案中,串联启动子包含SEQ ID NO:13的核苷酸1221-1503。在一个优选的实施方案中,串联启动子包含SEQ ID NO:13的核苷酸1221-1509。在一个优选的实施方案中,串联启动子包含SEQ ID NO:13的核苷酸1329-1544。在一个优选的实施方案中,串联启动子包含SEQ ID NO:13的核苷酸1221-1544。
在一个优选的实施方案中,邻氨基苯甲酸盐激活物蛋白编码序列或苯甲酸盐激活物蛋白编码序列分别被包含和被表达在使用含有Pant或含有Pben的本发明串联启动子的系统中。当串联启动子含有Pant和Pben,优选选择邻氨基苯甲酸盐启动子激活物蛋白编码序列,例如,就Pant启动子而言,上述的邻氨基苯甲酸盐激活物蛋白(AntR)。更优选的在任何表达系统中这种被表达的编码序列以多拷贝存在。
用于构建串联启动子的天然启动子来源
依照本发明可构建串联启动子,例如通过从原核细胞,优选细菌细胞获得,从编码可选择碳源利用必需酶的基因或操纵子获得天然的启动子,即非葡萄糖的碳源。在一个优选的实施方案中,细菌细胞将选自属于“假单胞菌和密切相关细菌”的细菌细胞,或其19个亚群中的任何一种,如下所述。
能够利用广泛范围的可选择碳源的细菌是已知的。在一个优选的实施方案中,被选择用于构建串联启动子的天然启动子可从一条基因或操纵子获得,对选自下列的至少一种可选择碳源具有降解活性的酶可从其被表达:
·直链,支链,环,和脂环族同型和杂烃(饱和或未饱和的)及其衍生物;
·芳香族和烷基芳基化合物及其衍生物,例如苯,萘,蒽,菲,甲苯,二甲苯,联苯;
·杂环化合物及其衍生物,例如,类固醇,固醇,尿囊素,环萜烃,育亨宾,吲哚,咪唑,恶嗪,喹啉,吩嗪,氧杂蒽;
·乙醇&多元醇及其衍生物,例如,乙醇,苯酚,萘酚,甲酚,儿茶酚,甘油,苯甲醇,孟烷醇;
·酸,酯,酐及其衍生物,例如,醋酸盐,水杨酸盐,苯甲酸盐,羟基苯甲酸盐,邻氨基苯甲酸盐,邻苯二甲酸盐,苯基链烷酸酯,龙胆酸盐,氨基酸(例如,谷氨酸盐);单,双和三羧酸;脂肪酸,和相关化合物;
·醛,酮,乙醚及其衍生物;
·卤代有机化合物及其衍生物,例如,氯苯甲酯,氯酚,碘代萘,溴二甲苯,氯戊烷,三氯丙烷;
·有机磷化合物及其衍生物,例如,有机膦酸酯,有机磷酸酯,有机亚磷酸酯磷杂化合物,磷酸化合物;
·有机硫化合物及其衍生物,例如,有机磺酸酯,有机硫酸酯,有机亚磷酸酯,硫代化合物,含硫化合物;
·有机氮化合物及其衍生物,例如,有机硝酸酯,硝基有机物(例如,硝基苯甲酸盐,硝基酚),氰基化合物,肼,胺,亚胺,酰胺,亚胺,嘌呤,嘧啶,氮杂化合物,偶氮化合物;
·其他的杂有机化合物,例如有机硼化合物,有机硅化合物,有机金属化合物,多杂原子有机化合物;和
·多功能有机化合物。
编码这些生物降解活性的基因或操纵子可以如上所述是代谢产物阻遏的或非代谢产物阻遏的。本领域的普通技术人员可很容易通过本领域熟知的方法或的其天然启动子,例如通过分离编码这种酶的mRNA,是制备其的mRNA或cDNA的核酸序列,以探测出现相应DNA基因的细菌基因组(或其基因组序列的记录)。之后鉴定调控区,包括转录起始位点,位于紧接着编码序列的上游(即,5’端)的DNA区段中。然后形成含有这种调控区核酸序列的表达构建物,通过一种或多种可选择的碳源化合物在存在和不存在葡萄糖的情况下检测表达构建物在细菌宿主细胞中的诱导作用。这提供了代谢产物阻遏和非代谢产物阻遏的启动子,可用于构建依照本发明的串联启动子。
多种代谢产物阻遏和非代谢产物阻遏的基因和操纵子已知(a)编码利用可选择碳源的酶(例如,转运,anabolize,或分解)或(b)编码调控基因,可控制这种编码酶的基因和操纵子的表达。这种类型的典型基因或操纵子的启动子可在其依赖的转录过程中被调控,即启动子被其相关的可选择碳源或其类似化合物所诱导或阻遏。
这种代谢产物阻遏的基因和操纵子的实例包括,例如:
·荧光假单胞菌ST的styABCD操纵子,编码苯乙烯转变为乙酸苯酯所需的酶[Ref.8];
·恶臭假单胞菌mt-2的xylCMABN操纵子,编码甲苯转化为苯甲酸盐和二甲苯转化为甲苯甲酸酯所需的酶[Ref.9];
·洋葱伯克霍尔德菌的alkBFGHJKL操纵子,编码烷烃和烯烃代谢所需的酶,包括烷烃水解酶[Ref.10];
·铜绿假单胞菌基因,oprD,编码可加速碱性氨基酸和氨基甲酰抗生素,亚胺培南,噻烯霉素衍生物的摄取的特异孔蛋白[Ref.11];
·铜绿假单胞菌基因,aotJ,它是编码精氨酸和鸟氨酸转运所需酶的操纵子的一部分[Ref.12];和
·恶臭假单胞菌和铜绿假单胞菌基因,bkdR,可编码调控操作子表达的蛋白,该操纵子编码支链氨基酸代谢所需的支链酮酸脱氢酶复合体[Ref.13]。
这种非代谢产物阻遏的基因和操纵子的实例包括,例如:
·恶臭假单胞菌DOT-TIE的ttgDEF操纵子,编码第二个甲苯流出系统的酶[Ref.14];
·铜绿假单胞菌基因,gdhB,编码精氨酸诱导的NAD(+)-依赖谷氨酸脱氢酶[Ref.15];和
·恶臭假单胞菌mt-2的putA和putP基因,编码脯氨酸利用所必需的酶[Ref.16]。
多肽和启动子的突变体和密切相关的序列
从优选实施例的启动子制成的突变启动子也可使用多种本领域已知的随机和/或定向,诱变技术的任何一种来产生。在一个优选的实施方案中,可进行位点特异诱变(例如,经致突变寡核苷酸定向诱变)。在一个优选的实施方案中,未定性的突变启动子选自通过在启动子多核苷酸上进行的易错聚合酶链式反应(EP-PCR)产生的突变体文库。在从前一轮得到的多核苷酸池上或从中选择的一个或多个突变启动子上进行多轮诱变。在被改良的启动子中被鉴定的有利突变也可被组合获得改善的进一步增加(例如,累积的改进)。
除了通过上述的一种或多种技术在非突变的串联启动子(即,串联启动子中单个启动子元件是其本身的天然序列)上产生突变的串联启动子以外,单个突变的启动子可用来形成依照本发明的串联启动子。例如,两个突变启动子可被连接在一起,或突变的启动子和非突变的启动子被连接在一起,形成依照本发明的串联启动子。另外,可进行定向诱变和/或重组(例如,使用一种如在WO 91/16427中描述的技术)以便在指定的轮次中产生多个启动子-启动子组合。
可通过使用含有串联和/或天然启动子构建物和/或元件的多核苷酸作为杂交探针,在严格杂交条件下依照本领域中已知的多种方案的任何一种获得密切相关的启动子。严格杂交条件方案的一个实例如下所示。可选择地,具有这种启动子碱基序列的肽核酸(PNA),或其他核酸类似物可用作杂交探针。优选探针含有长度为至少大约6个,至少大约8个,至少10个,至少大约15个,至少大约20个,至少大约25个,至少大约30个,至少大约35个,至少大约40个,至少大约45个,或至少大约50个碱基的碱基序列。在一个优选的实施方案中,探针含有长度不超过大约100个,大约80个,大约60个,或大约50个碱基的碱基序列。在一个优选的实施方案中,探针含有长度大约20至大约50,或大约25至大约45,或大约30至大约40个碱基的碱基序列。
为了对靶核酸,例如,至少怀疑含有一个启动子的靶DNA进行杂交探测,根据标准的方案,被探测的靶DNA被变性,印迹交联至硝酸纤维素或尼龙膜上(见Sambrook等人,[Cold Spring Harbor Press],现代分子生物学方法[John Wileyand Sons,Inc.])。然后印迹被预杂交,使用标准的缓冲液,如Sambrook等人或现代方法所述,或使用商用杂交缓冲液如EXPRESSHYB(BD Biosciences Clontech,Palo Alto,CA)。预杂交可在50-65℃的温度范围内进行。
被使用的探针(例如,显示或含有,例如邻氨基苯甲酸盐或苯甲酸盐启动子片段的DNA)可被标记以鉴别特异结合的靶DNA和/或探针核酸可用作引物通过酶拷贝特异结合的靶DNA。根据本领域已知的任何技术标记探针。例如,探针可用任何可检测的标记进行标记,包括但不限于:肽标志物,免疫原部分,亲和素,生物素,荧光或发色部分,可检测的螯合物,或放射性核素部分。在一个优选的实施方案中,核酸,优选DNA,可用作探针。在一个优选的实施方案中,探针的DNA被标记。在一个优选的实施方案中,标记是放射性部分,例如含有放射性核素的化合物如γ-32P dATP。进行这种标记的试剂盒可从商业渠道中购得:例如HIGH PRIME DNA标记试剂盒(Roche Molecular Biochemicals,Indianapolis,IN),共轭了含有放射性核素的5’-三磷酸盐,如可使用γ-32P dATP。然后探针或被标记的探针被煮沸,然后加入进预杂交缓冲液中。印迹与探针在50-65℃孵育过夜,然后用2×SSC/0.5%SDS在室温下冲洗2次,每次5分钟。然后阴极用0.1×SSC/0.1%SDS在50-65℃冲洗两次,每次15分钟。然后印迹适当时被显影,以观察特异结合的标记探针。例如,如果放射性核素被用作探针上的标记,印迹可用来显示在胶片或荧光屏上进行观察。
可选择地,设计可与已知启动子元件(即,具有插入序列的-35和-10序列),或与已知的激活物蛋白结合位点杂交的一个或一组寡聚物;设计一组简并的寡聚物,至少其中之一可与目的靶序列杂交。这些可用作如上所述的Southern印迹分析的探针,或可用来启动与目的启动子同源的单链(一个寡聚物)或双链(两个寡聚物)DNA的合成。DNA的合成可用,例如Taq聚合酶(延伸在72℃进行或如生产厂商的步骤指导),或其他聚合酶进行,缓冲液由生产厂商提供,1-5mM浓度的引物,和0.2-1mM终浓度的dNTP混合物。可改变退火温度以得到最佳的扩增。根据所需产物的长度,聚合酶的延伸时间为20-60秒。如果需要,连接子可被加入至单链片段中使第二条链可进行合成和扩增。然后双链片段可使用为延伸/扩增设计的引物被测序。如果限制性位点也被设计进入寡聚物中,该片段随后可被直接克隆进标准载体上,如pUCIS,例如为进行序列分析。
已经特异结合探针的靶核酸通过选择已经被显示的探针-靶标杂交物的方式被选择。在一个优选的实施方案中,被选择的靶核酸是至少90%同源的,即在碱基序列上与探针或其互补碱基序列至少90%是相同的(为此,其中T和U被认为是相同的碱基)。在一个优选的实施方案中,被选择的靶核酸至少是大约95%同源的。在一个优选的实施方案中,被选择靶核酸是至少大约98%同源的。当这种靶核酸作为一部分被定位在一个更大的多核苷酸分子中时,靶核酸,或含有所述靶核酸的片段通过本领域中已知的任何方式被回收,包括,核酸内切酶消化和核酸外切酶消化。
可选择地,以信息字符串的形式使用探针的碱基序列来进行核苷酸序列记录的搜索,如核苷酸序列的纸记录或电子数据库记录,该核苷酸序列存在于多核苷酸源含有的多核苷酸中。搜索的参数规定成功的匹配必须是与探针信息字符串100%相同(100%同源)或小于100%相同(异种)。优选选择的搜索参数,成功的匹配必须与探针信息字符串至少90%同源,至少95%同源,或至少98%同源。优选选择的搜索参数,成功的匹配必须与探针信息字符串是异种的。一旦已经鉴定了成功的匹配,则选择与其对应的多核苷酸源。
可选择地,从代表与所述指定启动子至少90%同源的异种核碱基序列的被修饰信息字符串中通过改变代表指定启动子的核碱基序列的第一个信息字符串,产生探针信息字符串。这种被修饰的信息字符串然后被用来合成含有其碱基序列的多核苷酸分子,或被用来搜索核苷酸序列记录中如上所述的相同的信息字符串。在成功的匹配中,选择与其对应的多核苷酸源。
一旦获得了与探针序列至少90%同源的多核苷酸,则被检测,通过形成其表达构建物,将表达构建物插入进转录系统中(或转录和翻译系统),如原核宿主细胞,并筛选得到的系统中,例如被转化的细胞,多核苷酸引导转录的能力。优选筛选也涉及鉴定相对原始启动子被改善至少一个启动子特性。
同源序列的联配和搜索可使用美国国立生物技术信息中心(NCBI)程序,MegaBLAST(现存可从
http://www.ncbi.nhn.nih.gov/BLAST/获得)来执行。使用这种程序,同一性百分比的选项设定为90%将可鉴定与查询序列具有90%或更高同源性的序列。本领域中已知的其他软件也可用来联配和/或搜索同源序列,例如与含有根据本发明的启动子碱基序列或激活物蛋白编码碱基序列的信息字符串至少90%同源的序列。例如,比较鉴定与查询序列具有至少90%同源的序列的序列联配可通过使用在GCC序列分析软件包(可从Genetics Computer Group,University ofWisconsin Biotechnology Center,1710 University Avenue,Madison,Wis.53705获得)中可获得的,例如GAP,BESTFIT,BLAST,FASTA,和TFASTA程序来质性,使用在此所规定的缺省参数,以及同源性程度设定为90%的参数。例如,也可使用CLUSTAL程序(可在来自Intelligenetics,Mountain View,Cal.的PC/Gene软件包中获得)。
这些和其他序列联配方法在本领域中是熟知的,可通过手工联配,肉眼观察或手工或自动执行序列联配算法来进行,如通过上述程序所实施的任何一种方法。多种可用的算法包括,例如:W.R.Pearson & DJ.Lipman,Proc.Natl Acad.Sci.USA 85:2444-48(Apr 1988)中的相似性搜索法;T.F.Smith & M.S.Waterman,在Adv.Appl.Math.2:482-89(1981)和在J.Molec.Biol.147:195-97(1981)中所述的局部同源法;在S.B.Needleman & C.D.Wunsch,J.Molec.Biol.48(3):443-53(Mar 1970)中所述的同源联配法;和通过例如,W.R.Pearson在Genomics 11(3):635-50(Nov 1991)中所述的;W.R.Pearson在Methods Molec.Biol.24:307-31和25:365-89(1994)中所述的;和D.G.Higgins & P.M.Sharp,在Comp.Appl’ns in Biosci.5:151-53(1989)和在Gene 73(1):237-44(15 Dec1988)中所述的多种方法。
在一个优选的实施方案中,与指定启动子的碱基序列,启动子区,或含有其他非密码子或非反密码子的多核苷酸区段的碱基序列异种的,即其碱基序列是异种的,核碱基聚合物(例如,多核苷酸或多核苷酸类似物)将与其至少90%同源;优选与其大约或至少93%同源;优选与其大约或至少95%同源;优选与其大约或至少96%同源;优选与其大约或至少97%同源;优选与其大约或至少98%同源;优选与其大约或至少99%同源。
在一个优选的实施方案中,与指定多肽(或其区段)的氨基酸序列异种的,即其氨基酸是异种的,将与其至少90%同源;优选与其大约或至少93%同源;优选与其大约或至少95%同源;优选与其大约或至少96%同源;优选与其大约或至少97%同源;优选与其大约或至少98%同源;优选与其大约或至少99%同源。
在一个优选的实施方案中,与含有指定密码子或反密码子的多核苷酸(或其区段)的碱基序列异种的,即其碱基序列是异种的,核碱基聚合物(或其区段)将与其至少90%同源;优选与其大约或至少93%同源;更优选与其大约或至少95%同源;优选与其大约或至少96%同源。在一个优选的实施方案中,这种核碱基聚合物与含有指定密码子或反密码子的多核苷酸具有这种程度的同源性,由核碱基聚合物编码的氨基酸序列与指定多核苷酸的氨基酸序列至少90%同源;优选大约或至少93%同源;优选与其大约或至少95%同源;优选与其大约或至少96%同源;优选与其大约或至少97%同源;优选与其大约或至少98%同源;优选与其大约或至少99%同源。
在一个优选的实施方案中,与含有指定密码子或反密码子的多核苷酸(或其区段)的碱基序列异种的,即其碱基序列是异种的,核碱基聚合物(或其区段)将与其至少97%同源;优选与其大约或至少98%同源;更优选与其大约或至少99%同源。
表达构建物
在表达构建物中,例如基因或操纵子中,根据本发明,含有转录产物编码序列的核酸被可操作连接于依照本发明的启动子,间隔区。当转录产物是mRNA或其前体分子时,间隔区将是含有核糖体结合位点的间隔区(″RBS间隔区″)。
“转录产物编码多核苷酸”是含有转录产物编码序列的任何多核苷酸,其中所述的转录产物是任何功能或结构RNA分子,包括但不限于,例如mRNA,rRNA,tRNA,cRNA,gRNA,hnRNA,miRNA,mtRNA,nRNA,ncRNA,pRNA,satRNA,scRNA,siRNA,snRNA,snoRNA,srpRNA,stRNA,tmRNA,vRNA,反义RNA(也称为″aRNA″),适配体RNA,染色体RNA,酶抑制剂RNA,遗传控制元件RNA,质体RNA,核糖体RNA,自裂解RNA,自拼接RNA,端粒末端转移酶RNA(TER或TERC),X-染色体灭活剂RNA(XIST RNA),或任何这种RNA分子的前体RNA。在一个优选的实施方案中,转录产物是mRNA或其前体RNA分子。
其他元件可被包含在表达构建物中。这些元件包括,但不限于,例如:转录增强子序列;翻译增强子序列;引导肽编码序列,例如对于细胞内靶向肽或分泌信号肽;肽原,前肽和pre-pro-肽编码序列;其他启动子;翻译起始和终止信号;多腺苷酸化信号;转录终止子;内含子;和标记物序列,如核苷酸序列“标记物”和“标记”肽编码序列(“标记物”可促进被表达多核苷酸的鉴定,分隔,纯化或分离,为此可使用被表达多肽的核苷酸序列标记物,或可使用“标记”肽编码序列)。
最小,依照本发明的表达构建物将包括(除了可操作连接于转录产物编码序列的启动子和间隔区或RBS-间隔区),转录终止子。当转录产物是mRNA或前-mRNA,表达构建物最小将进一步包括可操作地连接于转录产物编码序列的翻译起始和终止信号。术语“可操作连接的”,如在此所使用,是指相对于编码序列的任何构象,其中转录和任何翻译调控元件共价附着于以此分布的编码序列,在宿主细胞中或通过宿主细胞的作用,调控元件可引导编码序列的表达。表达构建物中的任一调控元件必须“可操作地连接于”转录产物编码序列。在一些情况下,其中细胞在转录之前加工表达构建物或加工从表达构建物转录的前体RNA,调控元件必须被这样定位,这样细胞的加工系统可操作表达构建物或前-RNA,以便与在此所述的调控元件可操作地连接。同样,在一些情况下,其中所述的表达构建物以多核苷酸的不同区段存在,该区段,即多核苷酸分子,或集中含有调控元件和转录产物编码序列的区域,必须这样被定位,这样细胞可处理该区段以建立或重新连接表达构建物,其中所述的调控元件可操作地连接于转录产物编码序列,和/或被如此定位,这样细胞的加工系统可处理要被转录的前-RNA以可操作地连接其调控元件。
任何原核生物核糖体结合位点(RBS)可用在这种表达构建物中。优选使用细菌RBS。在一个优选的实施方案中,可使用在革兰氏阳性细菌中作用的RBS;更优选使用在革兰氏阴性细菌中作用的RBS。已知许多特异的和多种共用的RBS,例如,那些描述在下列文献和被其提及的RBS,见D.Frishman等人,细菌基因的启动:估计计算机预测的可靠性,Gene 234(2):257-65(8 Jul 1999);和B.E.Suzek等人,在细菌基因组中鉴定起始密码子的概率法,Bioinformatics 17(12):1123-30(Dec 2001)。另外,可使用天然的或合成的RBS,例如,描述在:EP 0207459(合成的RBS);O.Ikehata等人,从红球菌属的核苷酸序列推算的腈水合酶及其在大肠杆菌中的表达,Eur.J.Biochem.181(3):563-70(1989)(天然RBS序列AAGGAAG);或J.A.Wells等人,在枯草芽胞杆菌中克隆,测序和分泌液化淀粉芽胞杆菌,Nucl.Acids Res.11(22):7911-25(1983)(天然RBS序列GAGAGG)。
而且,一种或多种标记物基因或报告子基因可用在表达系统中以证实表达。许多这种有用的标记物或报告子基因在本领域中是已知的。见,例如Hemming等人的美国专利No.4,753,876,和DL Day等人,在J.Bact.157(3):937-39(Mar1984)。在一个优选的实施方案中,标记物基因选自可赋予抗生素抗性的标记物基因。在一个优选的实施方案中,标记物基因选自四环素和卡那霉素抗性基因。在一个优选的实施方案中,报告子基因选自编码下列的基因:(1)荧光蛋白(例如,GFP);(2)有色蛋白;和(3)荧光或颜色促发的或诱导的蛋白,后者类型(3)包括,例如luminases,碱性磷酸酶,和β-半乳糖苷酶。碱性磷酸酶可水解BCIP产生蓝色,水解PNPP产生黄色。β-半乳糖苷酶可水解X-gal产生蓝色的衍生物,水解ONPG产生黄色。对碱性磷酸酶和β-半乳糖苷酶也有荧光底物。
载体和翻译和转录元件和可用于本发明中的方法的其他元件的进一步实例的描述见,例如:Gilroy的美国专利No.5,055,294和Gilroy等人的美国专利No.5,128,130;Rammler等人的美国专利No.5,281,532;Barnes等人的美国专利No.4,695,455和4,861,595;Gray等人的美国专利No.4,755,465;和Wilcox的美国专利No.5,169,760。
载体
本领域中已知的大量细菌载体可用来在细菌中表达蛋白,其任何一个可用来表达依照本发明的基因。这种载体包括,例如质粒,粘粒和噬菌体表达载体。有用的质粒载体实例包括但不限于,表达质粒pMB9,pBR312,pBR322,pML122,RK2,RK6,和RSF1010。这种有用的载体的其他实例包括以下所述的那些,例如:N.Hayase,在Appl.Envir.Microbiol.60(9):3336-42(Sep 1994);A.A.Lushnikov等人,在Basic Life Sci.30:657-62(1985);S.Graupner & W.Wackernagel,在Biomolec.Eng.17(1):11-16.(Oct 2000);H.P.Schweizer,在Curr.Opin.Biotech.12(5):439-45(Oct 2001);M.Bagdasarian & K.N.Timrnis,在Curr.Topics Microbiol.Immunol.96:47-67(1982);T.Ishii等人,在FEMS MicrobiolLett.116(3):307-13(Mar 1,1994);I.N. Olekhnovich & Y.K.Fomichev,在Gene 140(1):63-65(Mar 11,1994);M.Tsuda & T.Nakazawa,在Gene136(1-2):257-62(Dec 22,1993);C.Nieto等人,在Gene 87(1):145-49(Mar1,1990);J.D.Jones & N.Gutterson,在Gene 61(3):299-306(1987);M.Bagdasarian等人,在Gene 16(1-3):237-47(Dec 1981);H.P.Schweizer等人,在Genet.Eng.(NY)23:69-81(2001);P.Mukhopadhyay等人,在J.Bact.172(1):477-80(Jan 1990);D.O.Wood等人,在J.Bact.145(3):1448-51(Mar1981);和R.Holtwick等人,在Microbiology 147(Pt 2):337-44(Feb 2001)。
有用的假单胞菌表达载体的实例包括表3中列举的那些。
表3.可用的表达载体的一些实例 | |
复制子 | 载体 |
pPS10 | PCN39,pCN51 |
RSF1010 | PKT261-3 |
PMMB66EH | |
PEB8 | |
PPLGN1 | |
PK2/RP1 | PRK415 |
PJB653 | |
PRO1600 | PUCP |
PBSP |
表达质粒,RSF1010的描述见F.Heffron等人,Proc.Natl Acad.Sci.USA72(9):3623-27(Sep 1975),和K.Nagahari & K.Salcaguchi,J.Bact.133(3):1527-29(Mar 1978)。质粒RSF1010及其衍生物是本发明中特别有用的载体。在本领域中已知的有用的RSF1010的衍生物的实例包括,例如pKT212,pKT214,pKT231和相关质粒,和pMYC1050和相关质粒(见,例如Thompson等人的美国专利No.5,527,883和5,840,554),如pMYC1803。其他有用的载体实例包括在Puhler等人的美国专利No.4,680,264中所述的载体。
在一个优选的实施方案中,表达质粒被用作表达载体。在一个优选的实施方案中,RSF1010或其衍生物被用作表达载体。在一个优选的实施方案中,pMYC1050或其衍生物,或pMYC1803或其衍生物被用作表达载体。
然后载体被转化进细菌宿主细胞中。
转化
用载体对宿主细胞的转化可使用本领域中已知的任何转化方法来执行,细菌宿主细胞可被转化为完整细胞或原生质体(即,包括细胞质)。实例的转化方法包括穿孔方法,例如,电穿孔,原生质体融合,细菌接合,和二价阳离子处理,例如氯化钙处理或CaCl/Mg2+处理。
除了表达构建物的上述元件,细菌宿主细胞也含有基因的至少一个,优选一个以上拷贝,该基因含有启动子的激活物或阻遏物蛋白的编码序列。这种基因可附着在表达构建物上,或可以是独立核酸的一部分。在一个优选的实施方案中,可使用具有SEQ ID NO:7的核苷酸4-993上显示的编码序列互补码所编码的氨基酸序列的邻氨基苯甲酸盐激活物蛋白;可使用由SEQ ID NO:1的核苷酸225-1229或核苷酸285-1229所编码的苯甲酸盐激活物蛋白。优选,激活物(或阻遏物)编码基因将在细菌宿主细胞中结构性地表达。当需要表达编码序列时(例如,外源性的),宿主细胞与激活物(或去阻遏物)化合物接触以诱导表达。在一个优选的实施方案中,分别在邻氨基苯甲酸盐和苯甲酸盐启动子的情况下,细菌宿主细胞可与邻氨基苯甲酸或苯甲酸或其生物可接受盐类(优选一种钠盐)接触。在一个优选的串联启动子实施例中,细菌宿主细胞和一种诱导化合物接触,该化合物可诱导其天然代谢产物阻遏启动子元件或(天然的)非代谢产物阻遏的启动子元件。在一个串联启动子的优选实施例中,苯甲酸,邻氨基苯甲酸或其生物可接受盐类(优选钠盐),将用作诱导化合物(激活物)。
宿主细胞
在一个优选的实施方案中,其中使用启动子的宿主细胞悬自原核生物。在一个优选的实施方案中,宿主细胞选自细菌。在一个优选的实施方案中,宿主细胞选自变形菌。在一个优选的实施方案中,宿主细胞选自″假单胞菌和密切相关细菌″或其亚群,如下所定义。在一个优选的实施方案中,宿主细胞选自假单胞菌属。特别优选的假单胞菌属是荧光假单胞菌;更优选的是荧光假单胞菌生物型A。
在一个优选的实施方案中,从中获得天然启动子的生物体和其中使用根据本发明启动子的宿主细胞均将选自原核生物。在一个优选的实施方案中,从中获得天然启动子的生物体和其中使用根据本发明启动子的宿主细胞均将选自细菌。在一个优选的实施方案中,从中获得天然启动子的细菌和其中使用根据本发明启动子的细菌宿主细胞均将选自变形菌。在一个优选的实施方案中,从中获得天然启动子的细菌和其中使用根据本发明启动子的细菌宿主细胞均将选自假单胞菌和紧密相关的细菌或其亚群,如下面定义的。
在一个优选的实施方案中,启动子来源生物体和宿主细胞均将选自相同的种属。优选地,所述种属将是原核生物;更优选地是细菌,还更优选地是变形菌。在特别优选的实施例中,启动子来源生物体和宿主细胞均将选自包括假单胞菌和紧密相关的细菌或其亚群的相同种属,如下面定义的;更优选地选自假单胞菌属。尤其优选的是荧光假单胞菌属;更优选地是A生物型荧光假单胞菌。
在一个优选的实施方案中,其中使用启动子的宿主细胞缺少有效降解以下诱导物化合物的生物催化剂:如,苯甲酸盐或邻氨基苯甲酸盐或其类似物;和/或其降解产物,如果有这些诱导物降解产物将直接造成诱导;和/或安慰诱导物化合物。这种宿主细胞易作为敲除突变体而获得。例如,本发明者发现,就邻氨基苯甲酸盐启动子来说,宿主细胞antABC操纵子的至少antA部分失活不抑制邻氨基苯甲酸盐诱导物的消耗,因而允许诱导物影响持久的诱导。antA开放阅读框编码邻氨基苯甲酸盐降解通路中使用的第一个酶的大亚单位。相似地,就苯甲酸盐启动子而言,发明者发现宿主细胞benABCD操纵子的benAB部分的失活,如通过删除或突变,不抑制苯甲酸盐诱导物的消耗,因而改善诱导的水平;至少benA的部分失活会相似地起作用,因为其编码苯甲酸盐降解通路中使用的第一个酶的大亚单位。
基因敲除可根据本领域已知的任何有效方法构建。以前曾描述过通过插入突变的基因失活。见,如,DL Roeder和A Collmer,菊欧文氏菌中果胶酸裂合酶同工酶的标记物交换诱变,J Bacteriol.164(1):51-56(1985)。简要地,基因的部分在扩增和克隆进含可选择标记物如抗生素抗性基因的载体中将被破坏,即在靶宿主中不能复制。基因的染色体拷贝和质粒中包含的靶基因间的同源重组导致基因染色体拷贝的断裂并掺入抗生素抗性标记物。可选择地,转位子诱变和选择所需的表现型(如苯甲酸盐或邻氨基苯甲酸盐不能新陈代谢)可被用来分离其中靶基因被通过插入失活的细菌菌株。见,如KNida & PP Cleary,化脓性链球菌中链球菌溶血素S表达的插入失活,JBacteriol.155(3):1156-61(1983)。特定基因的特异性突变或删除可采用基因盒诱变构建,例如,JA Wells等人所描述的,基因盒诱变:在限定位点产生多重突变的有效方法,Gene 34(2-3):315-23(1985);借此在基因的选择部分制造了直接或随意的突变,然后通过同源重组插入基因的染色体拷贝中。
假单胞菌和紧密相关细菌
″假单胞菌和紧密相关细菌,″如这里所用的,与这里以共同的范围定义为″革兰氏(-)变形菌亚群1″。″革兰氏(-)变形菌亚群1″更特异地定义为属于R.E.Buchanan和N.E.Gibbons(主编)的称为″革兰氏阴性需氧杆菌和球菌″的分类学“卷”中描述的家族和/或种属的变形菌种类,Bergey’s鉴定细菌学手册,pp.217-289(第8版,1974)(The Williams & Willcins Co.,Baltimore,MD,USA)(此后作″Bergey(1974)″),以及不动杆菌属。表4呈现了Bergey分类学″卷″中列出的生物体家族和种属。
表4.″革兰氏阴性需氧杆菌和球菌″卷中列出的家族和种属(见Bergey(1974)) | |
家族I.极毛杆菌科 | 葡萄糖酸菌假单胞菌黄单孢菌属动胶菌属 |
家族II.固氮菌科 | 氮单胞菌属固氮菌 |
贝氏固氮菌戴克斯菌属 | |
家族III.根瘤菌科 | 土壤杆菌根瘤菌 |
家族IV.甲基单胞菌科 | 甲基球菌属甲基单胞菌属 |
家族V.嗜盐菌科 | 盐杆菌属盐球菌属 |
其它种属 | 醋菌属产碱杆菌属博尔德氏杆菌布鲁氏菌弗朗西斯氏菌属栖热菌属 |
″革兰氏(-)变形菌亚群1″含有在其下分类的所有变形菌,以及所有根据形成分类学“卷”所用的标准将分类在其下的变形菌。结果,″革兰氏(-)变形菌亚群1″排除如:所有革兰氏阳性细菌;革兰氏阴性细菌如肠杆菌科,它们属于此Bergey(1974)分类法19“卷”的其它部分;此Bergey(1974)″卷″的整个″家族V.嗜盐菌科″,该家族后来被公认为是原始的非细菌家族;在此Bergey(1974)″卷″中列出的栖热菌属,该菌属后来被公认为是细菌的非变形菌属。
与此定义同样一致,″革兰氏(-)变形菌亚群1″进一步包括属于此Bergey(1974)″卷″中定义的种属(以前称为种类)和家族的变形菌属,它后来被给予了其它变形菌分类学名称。在某些情况下,这些重命名导致产生了全新的变形菌种属。例如,食酸菌属、短波单胞菌、伯克霍尔德菌、氢噬胞菌、Oceanimonas、青枯菌和嗜麦芽寡养食单胞菌种属,是通过属于Bergey(1974)中定义的假单胞菌种属(以前称为种类)的生物体重新编组产生的。同样地,如鞘氨醇单胞菌种属(以及由其来源的芽单胞菌属种属)是通过属于Bergey(1974)中定义的黄单孢菌种属(以前称为种类)的生物体重新编组产生的。相似地,如酸单胞菌种属是通过属于Bergey(1974)中定义的醋菌属种属(以前称为种类)的生物体重新编组产生的。这些后来重新指定的种类也包括在″革兰氏(-)变形菌亚群1″中,如这里所定义的。
在其它情况下,属于此Bergey(1974)″卷″中定义的种属和家族的变形菌种类被完全重分类在其它现有的变形菌种属下。例如,就假单胞菌属来说,enalia假单胞菌(ATCC 14393)、生黑色腐败假单胞菌(ATCC 19375)和腐败假单胞菌(ATCC 8071)后来被分别重分类为haloplanktis互生单胞菌、生黑色腐败互生单胞菌和腐败互生单胞菌。相似地,如食酸假单胞菌(ATCC 15668)和睾丸酮假单胞菌(ATCC 11996)后来被分别重分类为食酸丛毛单胞菌和睾丸酮丛毛单胞菌;生黑色腐败假单胞菌(ATCC 19375)和piscicida假单胞菌(ATCC 15057)后来被分别重分类为Pseudoalteromonasnigrifaciens和Pseudoal teromonas piscicida。这些后来重新指定的变形菌种类也包括在″革兰氏(-)变形菌亚群1″中,如这里所定义的。
与此定义同样一致,″革兰氏(-)变形菌亚群1″进一步包括已被发现的变形菌种属,或后来被重分类为属于此Bergey(1974)″卷″中的变形菌家族和/或种属。关于变形菌家族,″革兰氏(-)变形菌亚群1″还包括分类属于以下任一家族的变形菌:极毛杆菌科,固氮菌科(现在常命名为同义字极毛杆菌科的″固氮菌群″),根瘤菌科,和甲基单胞菌科(现在常命名为同义字″甲基球菌科″)。因此,除这里另外描述的种属之外,属于″革兰氏(-)变形菌亚群1″的变形菌种属进一步包括:1)嗜氮根瘤菌属种属的固氮菌群细菌;2)纤维弧菌、寡源杆菌和Teredinibacter种属的极毛杆菌科家族细菌;3)鳌合杆菌属、剑菌、Liberibacter(也称为″Candidates Liberibacter″)和中国根瘤菌种属的根瘤菌科家族细菌;和4)甲基细菌属、喜热嗜甲基菌属、甲基微菌属、甲基八叠球菌和甲基球菌属种属的甲基球菌科家族细菌。
在一个优选的实施方案中,细菌选自如上定义的″革兰氏(-)变形菌亚群1″。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群2″。″革兰氏(-)变形菌亚群2″定义为以下种属的变形菌群(全部数量的可公开获得的其存储菌株的列表目录显示在括弧内,除另有说明外全部存储在ATCC):酸单胞菌(2);醋菌属(93);葡萄糖酸菌(37);短波单胞菌(23);贝氏固氮菌(13);戴克斯菌属(2);布鲁氏菌(4);土壤杆菌(79);鳌合杆菌属(2);剑菌(3);根瘤菌(144);中国根瘤菌(24);芽单胞菌属(1);鞘氨醇单胞菌(27);产碱杆菌属(88);博尔德氏杆菌43);伯克霍尔德菌(73);青枯菌(33);食酸菌20);氢噬胞菌(9);动胶菌属(9);甲基细菌属(2);喜热嗜甲基菌属(NCIMB中1);甲基球菌属(2);甲基微菌属(2);甲基单胞菌属(9);甲基八叠球菌(1);甲基球菌属;氮单胞菌属(9);嗜氮根瘤菌属(5);固氮菌(64);纤维弧菌(3);寡源杆菌(5);假单胞菌(1139);弗朗西斯氏菌属(4);黄单孢菌属(229);嗜麦芽寡养单胞菌(50);Oceanimonas(4);和不动杆菌属(160)。
″革兰氏(-)变形菌亚群2″的示例种类包括但不限于以下细菌(其示例菌株的ATCC或其它存储号显示在括弧中):甲醇酸单胞菌菌(ATCC 43581);乙酸菌属(ATCC 15973);氧化葡糖杆菌(ATCC 19357);缺陷短波单胞菌(ATCC 11568);印度贝氏固氮菌(ATCC 9039and ATCC 19361);树胶戴克斯菌属(ATCC 15994);马尔他布鲁氏菌(ATCC 23456),布氏杆菌(ATCC 23448);根癌土壤杆菌(ATCC 23308),放射形土壤杆菌(ATCC 19358),生根土壤杆菌(ATCC 11325);鳌合杆菌属heintzii(ATCC 29600);Ensiferadhaerens(ATCC 33212);豆科植物根瘤菌(ATCC 10004);费式中国根瘤菌(ATCC 35423);泳池芽单胞菌(ATCC35951);少动鞘氨醇单胞菌(ATCC29837);粪产碱杆菌(ATCC8750);百日咳博德特氏菌(ATCC 9797);洋葱伯克霍尔德菌(ATCC 25416);皮氏拉斯通氏菌(ATCC 27511);敏捷食酸菌(ATCC 11228);黄色氢噬胞菌(ATCC 33667);分支菌胶团(ATCC 19544);甲基细菌属luteus(ATCC 49878);喜热嗜甲基菌属gracile(NCIMB11912);荚膜甲基球菌属(ATCC 19069);甲基微菌属agile(ATCC 35068);甲基单胞菌属methanica(ATCC 35067);Methylosarcinafibrata(ATCC 700909);甲基球菌属hansonii(ACAM 549);agilis氮单胞菌属(ATCC 7494);嗜氮根瘤菌属paspali(ATCC23833);chroococcum固氮菌(ATCC 9043);mixtus纤维弧菌(UQM 2601);寡源杆菌urethralis(ATCC 17960);绿脓假单胞菌(ATCC 10145),荧光假单胞菌(ATCC 35858);土拉热弗朗西斯氏菌(ATCC 6223);嗜麦芽寡养单胞菌maltophilia(ATCC 13637);野生黄单孢菌(ATCC 33913);Oceanimonas doudoroffii(ATCC 27123);和醋酸钙不动杆菌(ATCC 23055)。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群3″。″革兰氏(-)变形菌亚群3″定义为以下种属的变形菌群:短波单胞菌;土壤杆菌;根瘤菌;中国根瘤菌;芽单胞菌属;鞘氨醇单胞菌;产碱杆菌属;伯克氏菌属;罗尔斯通氏菌属;食酸菌;氢噬胞菌;甲基细菌属;喜热嗜甲基菌属;甲基球菌属;甲基微菌属;甲基单胞菌属;甲基八叠球菌;甲基球菌属;氮单胞菌属;嗜氮根瘤菌属;固氮菌;纤维弧菌;寡源杆菌;假单胞菌;Teredinibacter;弗朗西斯氏菌属;嗜麦芽寡养单胞菌;黄单孢菌属;Oceanimonas;和不动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群4″。″革兰氏(-)变形菌亚群4″定义为以下种属的变形菌群:短波单胞菌;芽单胞菌属;鞘氨醇单胞菌;伯克氏菌属;罗尔斯通氏菌属;食酸菌;氢噬胞菌;甲基细菌属;喜热嗜甲基菌属;甲基球菌属;甲基微菌属;甲基单胞菌属;甲基八叠球菌;甲基球菌属;氮单胞菌属;嗜氮根瘤菌属;固氮菌;纤维弧菌;寡源杆菌;假单胞菌;Teredinibacter;弗朗西斯氏菌属;嗜老芽寡养单胞菌;黄单孢菌属;Oceanimonas;和不动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群5″。″革兰氏(-)变形菌亚群5″定义为以下种属的变形菌群:甲基细菌属,喜热嗜甲基菌属;甲基球菌属;甲基微菌属;甲基单胞菌属;甲基八叠球菌;甲基球菌属;氮单胞菌属;嗜氮根瘤菌属;固氮菌;纤维弧菌;寡源杆菌;假单胞菌;Teredinibacter;弗朗西斯氏菌属;嗜麦芽寡养单胞菌;黄单孢菌属;Oceanimonas;和不动杆菌属。
在一个优选的实施方案中,宿主细胞选自″革兰氏(-)变形菌亚群6″。″革兰氏(-)变形菌亚群6″定义为以下种属的变形菌群:短波单胞菌;芽单胞菌属;鞘氨醇单胞菌;伯克氏菌属;罗尔斯通氏菌属;食酸菌;氢噬胞菌;氮单胞菌属;嗜氮根瘤菌属;固氮菌;纤维弧菌;寡源杆菌;假单胞菌;Teredinibacter;嗜麦芽寡养单胞菌;黄单孢菌属;Oceanimonas;和不动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群7″。″革兰氏(-)变形菌亚群7″定义为以下种属的变形菌群:氮单胞菌属;嗜氮根瘤菌属;固氮菌;纤维弧菌;寡源杆菌;假单胞菌;Teredinibacter;嗜麦芽寡养单胞菌;黄单孢菌属;Oceanimonas;和不动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群8″。″革兰氏(-)变形菌亚群8″定义为以下种属的变形菌群:短波单胞菌;芽单胞菌属;鞘氨醇单胞菌;伯克氏菌属;罗尔斯通氏菌属;食酸菌;氢噬胞菌;假单胞菌;嗜麦芽寡养单胞菌;黄单孢菌属;Oceanimonas;和动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群9″。″革兰氏(-)变形菌亚群9″定义为以下种属的变形菌群:短波单胞菌;伯克氏菌属;罗尔斯通氏菌属;食酸菌;氢噬胞菌;假单胞菌;嗜麦芽寡养单胞菌;Oceanimonas;和不动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群10″。″革兰氏(-)变形菌亚群10″定义为以下种属的变形菌群:伯克氏菌属;罗尔斯通氏菌属;假单胞菌;嗜麦芽寡养单胞菌;黄单孢菌属;和不动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群11″。″革兰氏(-)变形菌亚群11″定义为以下种属的变形菌群:假单胞菌;嗜麦芽寡养单胞菌;黄单孢菌属;和不动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群12″。″革兰氏(-)变形菌亚群12″定义为以下种属的变形菌群:伯克氏菌属;罗尔斯通氏菌属;假单胞菌。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群13″。″革兰氏(-)变形菌亚群13″定义为以下种属的变形菌群:伯克氏菌属;罗尔斯通氏菌属;假单胞菌;黄单孢菌属;和不动杆菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群14″。″革兰氏(-)变形菌亚群14″定义为以下种属的变形菌群:假单胞菌和黄单孢菌属。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群15″。″革兰氏(-)变形菌亚群15″定义为假单胞菌属的变形菌群。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群16″。″革兰氏(-)变形菌亚群16″定义为以下假单胞菌属的变形菌群(示例菌株的ATCC或其它存储号显示在括弧中):abietaniphila假单胞菌(ATCC 700689);绿脓假单胞菌(ATCC 10145);产碱假单胞菌(ATCC 14909);anguilliseptica假单胞菌(ATCC 33660);citronellolis假单胞菌(ATCC 13674);flavescens假单胞菌(ATCC 51555);mendocina假单胞菌(ATCC25411);假单胞菌nitroreducens(ATCC 33634);食油吸毛杆菌(ATCC 8062);类产碱假单胞菌(ATCC 17440);resinovorans假单胞菌(ATCC 14235);straminea假单胞菌(ATCC 33636);假单胞菌agarici(ATCC 25941);alcaliphila假单胞菌;alginovora假单胞菌;andersonii假单胞菌;asplenii假单胞菌(ATCC 23835);azelaica假单胞菌(ATCC 27162);假单胞菌beijerinckii(ATCC 19372);borealis假单胞菌;boreopolis假单胞菌(ATCC 33662);brassicacearum假单胞菌;butanovora假单胞菌(ATCC 43655);cellulosa假单胞菌(ATCC 55703);金黄色假单胞菌(ATCC 33663);chlororaphis假单胞菌(ATCC 9446,ATCC 13985,ATCC 17418,ATCC 17461);fragi假单胞菌(ATCC 4973);lundensis假单胞菌(ATCC 49968);taetrolens假单胞菌(ATCC4683);cissicola假单胞菌(ATCC 33616);coronafaciens假单胞菌;diterpeniphila假单胞菌;elongata假单胞菌(ATCC 10144);flectens假单胞菌(ATCC 12775);azotoformans假单胞菌;brenneri假单胞菌;cedrella假单胞菌;假单胞菌corrugata(ATCC 29736);extremorientalis假单胞菌;荧光假单胞菌(ATCC 35858);gessardii假单胞菌;libanensis假单胞菌;mandelii假单胞菌(ATCC 700871);marginalia假单胞菌(ATCC 10844,);migulae假单胞菌;mucidolens假单胞菌(ATCC4685);orientalis假单胞菌;rhodesiae假单胞菌;synxantha假单胞菌(ATCC 9890);tolaasii假单胞菌(ATCC 33618);veronii假单胞菌(ATCC 700474);frederiksbergensis假单胞菌;膝状假单胞菌(ATCC 19374);gingeri假单胞菌;graminis假单胞菌;grimontii假单胞菌;halodenitrificans假单胞菌;嗜盐假单胞菌;hibiscicola假单胞菌(ATCC 19867);huttiensis假单胞菌(ATCC 14670);hydrogenovora假单胞菌,jessenii假单胞菌(ATCC 700870);kilonensis假单胞菌;矛尖形假单胞菌(ATCC 14669);lini假单胞菌;marginata假单胞菌(ATCC 25417);mephitica假单胞菌(ATCC 33665);脱氮假单胞菌(ATCC 19244);pertucinogena假单胞菌(ATCC 190);pictorum假单胞菌(ATCC 23328);嗜寒假单胞菌;fulva假单胞菌(ATCC 31418);monteilii假单胞菌(ATCC 700476);mosselii假单胞菌;oryzihabitans假单胞菌(ATCC43272);plecoglossicida假单胞菌(ATCC 700383);恶臭假单胞菌(ATCC12633);reactans假单胞菌;有刺假单胞菌(ATCC 14606);balearica假单胞菌;luteola假单胞菌(ATCC 43273);施氏假单胞菌(ATCC 17588);假单胞菌amygdali(ATCC33614);avellanae假单胞菌(ATCC 700331);caricapapayae假单胞菌(ATCC 33615);cichorii假单胞菌(ATCC 10857);ficuserectae假单胞菌(ATCC 35104);fuscovaginae假单胞菌;meliae假单胞菌(ATCC 33050);假单胞菌(ATCC 19310);假单胞菌viridiflava(ATCC 13223);thermocarboxydovorans假单胞菌(ATCC 35961);耐热假单胞菌;thivervalensis假单胞菌;vancouverensis假单胞菌(ATCC 700688);wisconsinensis假单胞菌;和xiamenensis假单胞菌。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群17″。″革兰氏(-)变形菌亚群17″定义为本领域已知的“荧光假单胞菌”的变形菌群,如,包括那些属于以下假单胞菌种类者:azotoformans假单胞菌;brenneri假单胞菌;cedrella假单胞菌;假单胞菌corrugata;extremorientalis假单胞菌;荧光假单胞菌;gessardii假单胞菌;假单胞菌libanensis;mandelii假单胞菌;marginalis假单胞菌;migulae假单胞菌;mucidolens假单胞菌;orientalis假单胞菌;rhodesiae假单胞菌;synxantha假单胞菌;tolaasii假单胞菌;和veronii假单胞菌。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群18″。″革兰氏(-)变形菌亚群18″定义为荧光假单胞菌种类的所有亚种、变种、菌株和其它附属专有单位,如,包括那些属于以下者(示例菌株的ATCC或其它存储号显示在括弧中):A生物型荧光假单胞菌,也称为生物型1或生物型I(ATCC 13525);B生物型荧光假单胞菌,也称为生物型2或生物型II(ATCC 17816);C生物型荧光假单胞菌,也称为生物型3或生物型III(ATCC 17400);F生物型荧光假单胞菌,也称为生物型4或生物型IV(ATCC 12983);G生物型荧光假单胞菌,也称为生物型5或生物型V(ATCC 17518);和cellulosa荧光假单胞菌亚种(NCIMB 10462)。
在一个优选的实施方案中,细菌选自″革兰氏(-)变形菌亚群19″。″革兰氏(-)变形菌亚群19″定义为A生物型荧光假单胞菌的所有菌群。特别优选的此生物型菌株是荧光假单胞菌菌株MB 101(见US专利号5,169,760 to Wilcox),及其衍生物。
在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群1″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群2″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群3″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群5″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群7″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群12″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群15″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群17″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群18″。在特别优选的实施例中,细菌选自″革兰氏(-)变形菌亚群19″。
根据本发明的表达系统可以任何发酵形式培养。例如,这里可使用任何容积的成批发酵,反馈的成批发酵,半持续发酵和持续发酵模式。
在本发明中,宿主细胞的生长、培养和/或发酵在允许宿主细胞生存的温度范围内进行,优选的温度在包含大约4℃至大约55℃范围内。因此,如这里所用的,如术语″生长″(和″生长″,″成长″)、″培养″(和″繁殖″)和″发酵″(和″ferment,″″fermenting″),就本发明的宿主细胞而言,固有和必然地指在包含大约4℃至大约55℃温度范围内″生长″、″培养″和″发酵″。此外,″生长″用来指活性细胞分裂和/或增大的生物学状态,以及非分裂和/或非增大的细胞被代谢维持的生物学状态,后者使用术语″生长″与术语“维持”是同义的。
此外,″在允许表达的条件下″对于本发明的细菌宿主细胞和表达系统,当使用时,生长在这里的定义是指:(1)当控制序列中使用的可操作地与编码序列连接的启动子是结构启动子时重组体细菌宿主细胞本身的生长;和(2)当控制序列中使用的可操作地与编码序列连接的启动子是调节启动子时,(a)在存在其诱导物的情况下(即与诱导物接触)生长重组体细菌宿主细胞,和(b)在没有其诱导物的情况下生长重组体细菌宿主细胞,然后在系统中添加这种诱导物,从而使细胞和诱导物接触。
生物催化剂制备
一旦在启动子控制下的编码序列被表达,得到的基因产物和/或从基因产物表达中得到的次级产物(如,代谢物)可用本领域已知的的任何回收和/或纯化方法分离、隔离和/或纯化,如,蛋白、核酸或其它分子这样的产物所用的方法。可选择地,宿主细胞本身可被用于,如,全细胞生物反应器或其它应用。
实施例
材料和方法
启动子和启动子-质粒构建物
以下启动子核苷酸序列参考于此。
Pben509:SEQ ED NO:1的核苷酸c994-c1502。
Pben278:SEQ ID NO:1的核苷酸g1228-c1502。
Pben88:SEQ ID NO:1的核苷酸g1228-c1316,删除g1306。
Pant713:SEQ ID NO.7的核苷酸c592-c1304。
Pant705:SEQ ID NO:7的核苷酸c592-g1296。
Pant311:SEQ ID NO:7的核苷酸c994-c1304。
Pant289:SEQ ID NO:7的核苷酸994-1283,删除g1269和t1278。
AntR+Pant(同样Pant+AntR):SEQIDNO:13的al-c1395。
PTANDEM:SEQ ID NO:13。以下无启动子质粒构建物参考于此。
pDOW1017:无启动子,但携带无启动子lacZ报告子基因。
pDOW1033:无启动子,但携带无启动子pho4报告子基因。
表5和6中列出的质粒启动子构建物参考于此。
表5.质粒独立启动子构建物 | |||
启动子类型 | 质粒名称 | 启动子或激活物-启动子序列同一性 | 构建物描述 |
苯甲酸盐 | pDOW1028 | SEQ ID NO:1 N1228-N1502 | Pben278::lacZ |
pDOW1041 | SEQ ED NO:1 N1228-N1502 | Pben278::phoA | |
pDOW1019 | SEQ ID NO:1 N994-N1502 | Pben509::lacZ | |
pDOW1102 | SEQ ED NO:1 N1228-N1316,删除g1306 | Pben88::lacZ | |
pDOW1181 | SEQ ID NO:1 N1228-N1316,删除g1306 | Pben88::phoA | |
pDOW1083 | SEQ ID NO:1 N1228-N13 16,删除g1306并用’tataat’取代天然-10’tacggt’1296-1301 | Pben88(-10con)::phoA | |
pDOW1126 | SEQ ID NO:1 N1-N1316,删除g1306 | BenR-Pben88(-10con)::lacZ | |
pDOW1090 | SEQ ID NO:1 N1-N1316,删除g1306 | BenR-Pben88(-10con)::phoA | |
pDOW1100 | SEQ ID NO:1 N1228-N1316,删除g1306并用’taaggt’取代天然-10’tacggt’1296-1301 | Pben88(-10benAc)::1acZ | |
pDOW1084 | SEQ ID NO:1 N1228-N1316,删除g1306并用’taaggt’取代天然-10’tacggt’ | Pben88(-10benAc)::phoA |
1296-1301 | |||
邻氨基苯甲酸盐 | pDOW1039 | SEQ ID NO:7N1-N1304 | AntR-Pant |
pDOW1101 | SEQ ID NO:7 N994-N1304 | Pant311::lacZ | |
pDOW1035 | SEQ ID NO:7N1-N1304 | AntR-Pant::lacZ | |
pDOW1056 | SEQ ED NO:7N1-N1304 | AntR-Pant::phoA | |
pDOW1029 | SEQ ID NO:7 N592-N1304 | Pant713::lacZ | |
pDOW1095 | SEQ ID NO:7 N1-N1283,删除t1278 | AntR-Pant(-10wt)::phoA | |
pDOW1082 | SEQ ED NO:7 N994-N1283,删除g1269和t1278,并用共有的-10区’tataat’取代天然-10区’ttaat’1264-1268 | Pant289(-10con)::phoA | |
pDOW1098 | SEQ ED NO:7 N1-N1283,删除g1269和t1278,并用共有的-10区’tataat’取代天然-10区’ttaat’1264-1268 | AntR-Pant289(-10con)::phoA | |
Mosaic | pDOW1099 | SEQ ID NO:7 N1-N1283,删除g1269和t1278,并用天然Pben-10区’tacggt’取代天然Pant-10区’ttaat’1264-1268 | AntR-Pant289(-10ben)::phoA |
表6.质粒串联启动子构建物 | ||
质粒名称 | 启动子或激活物-启动子序列同一性 | 构建物描述 |
pDOW1057 | SEQ ID NO:13 | AntR-PTANDEM::lacZ |
Pdow1111 | SEQ ID NO:13 N1085-N1541 | Pant311-Pben278::lacZ |
pDOW1107 | SEQ ID NO:13 N1-N1518,删除g1508 | AntR-PTANDEM[Pben88(-10wt)] ::lacZ |
pDOW1108 | SEQ ID NO:13 N1-N1518,删除g1508并用’tataat’取代Pben天然-10’tacggt’1498-1503 | AntR-PTANDEM[Pben88(-10con)]::lacZ |
pDOW1109 | SEQ ID NO:13 N1-N1518,删除g1508并用’taaggt’取代Pben天然-10’tacggt’1498-1503 | AntR-PTANDEM[Pben88(-10benAc)]::lacZ |
表7中列出的寡核苷酸在以下实施例中使用。
表7.这里使用的寡核苷酸 | |
引物名称 | 序列(均为5’→3’列出) |
AntAKO5 | GGAATTCTTCGTGACGATGCG fSEO ID NO:16) |
AntAKO3 | CGGGATCCGCTCGCGATGCTGC(SEO ID NO:17) |
lacZPE | GGATGTGCTGCAAGGC(SEO ID NO:18) |
lacZPE2 | GTAACCATGGTCATCGC(SEO ID NO:19) |
M13正向 | CTAAAACGACGGCCAGT(SEO ID NO:20) |
M13反向 | AACAGCTATGACCATG(SEO ID NO:21) |
Bambenwtshort | CGGGATCCGTATCAGGCGCCTCACCGTACGTGCTC fSEO ID NO:22) |
Bambenconshort | CGGGATCCGTATCAGGCGCCTCATTATACGTGCTC(SEQ ID NO:23) |
BambenAcshort | CGGGATCCGTATCAGGCGCCTCACCTTACGTGCTC(SEO ID NO:24) |
Bamantwtshort | CGGGATCCGCTAACGGTGAGCCATTAAGCGGCTGC(SEO ID NO:25) |
Bamantconshort | CGGGATCCGCTAACGGTGAGCATTATAGCGGCTGC(SEO ID NO:26) |
BenactKO-for | CGCGACACATTGCTGCCCAG(SEO ID NO:27) |
BenactKO-rev | AGTATCAGCCATCGCACCTT(SEO ID NO:28) |
1803H3seq | GTCCTGCAATTTCAGCCGA(SEO ID NO:29) |
BenL278 | CCTTAATTAAGTTAAGCGACGTGCGC(SEO ID NO:30) |
3’Antactiv | CCCAAGCTTCTATCGAGGCAAGCCAG(SEO ID NO:31) |
Benact 5’ | AGCTTTGTTTAAACGCATGACGTTGTTGATTC(SEO ID NO:32) |
H3 5’BenAKOclean | CCCAAGCTTGCCATGAGGCGGAAAACGCTGC(SEO ID NO:33) |
H3 3’BenBKOclean | CCCAAGCTCGGTGATCGCCACGCTGTCGC(SEO ID NO:34) |
BenKOmega | CATACGTCATGGCCCTCCGTTGTTC(SEO ID NO:35) |
InvbenKOmega | GAACAACGGAGGGCCATGACGTATG(SEO ID NO:36) |
5’BenA Seq | CTGCTGGAAAACGCCTGCCTGGAG(SEO ID NO:37) |
Seq_3’BenB | GAGCAGTTCAAGCATCGACAGGAAC(SEO ID NO:38) |
1261-8378F | CTTCAGATCCAGACTCACCAG(SEO ID NO:39) |
1261-103R | GACCATGATTACGCCAAGCGC TSEO ID NO:40) |
M13R21 | CACACAGGAAACAGCTATGAC(SEO ID NO:41) |
宿主细胞;
大肠杆菌JM109(从Promega Corp.获得),大肠杆菌TOP10(从Invitrogen Corp.获得),和A生物型荧光假单胞菌(菌株MB101和MB214)。荧光假单胞菌MB214是菌株MB101(野生型矿质寄生的A生物型荧光假单胞菌)的衍生体。MB214已通过将大肠杆菌lacIZYA操纵子(删除lacZ启动子区)整合进菌株MB101染色体而制备,提供的宿主细胞中lac启动子及其衍生体可被乳糖或IPTG调节以促使目的转基因的可诱导表达。MB101菌株是Lac(-),而MB214菌株是Lac(+)。
诱导物化合物
如下面实施例中所用的,″邻氨基苯甲酸盐″诱导物是指邻氨基苯甲酸钠,″苯甲酸盐″诱导物是指苯甲酸钠。
转化方案
大肠杆菌:采用来自Promega(Madison,Wis.)的菌株JM109化学感应细胞,按照生产者的方案进行大肠杆菌转化。
荧光假单胞菌:通过以下方法进行荧光假单胞菌电穿孔,将1mL过夜培养物(在富集培养基中生长;本实施例使用Luria-Bertani肉汤,Miller(即LB肉汤,Miller)(可从Difco,Detroit,Mich.获得)接种进50mL LB肉汤,Miller,在30℃振荡孵育直至A600测量值处于0.4-0.6范围。得到的细胞用50mL冷双蒸水冲洗两次并重悬浮在1mL冷双蒸水中。在0.2cm裂隙电穿孔试管(Bio-RadLaboratories,Inc.,Hercules,Cal.)中,向100μL等分试样感应细胞中加入大约10ng目的质粒。用以下条件进行电穿孔:200Ohms,25μF,2.25kV。随后添加1mL冷LB肉汤。使细胞在并上恢复2分钟,然后30℃孵育2小时至过夜,不振荡。然后,细胞覆盖在选择性培养基上;本实施例使用LB琼脂Miller(Luria-Bertani)(可从Difco,Detroit,Mich.获得),其中补充了15μg/mL四环素(Fisher Scientific,Pittsburgh,PA)作为选择性培养基。
细胞生长方案:
细胞生长以诱导:目的菌株在补充了0.5%或1%(w/v)葡萄糖、1mM MgSO4和微量元素(对于微量元素,本实施例使用的溶液含钠、镁、锰、铁和钴盐,全部低于0.5mg/mL终浓度)的1×M9最小盐培养基(从购自Fisher Scientific,Pittsburgh,Pennsylvania的5×制剂稀释而来)中过夜生长(30℃,以250rpm振荡)。然后,在相同培养基中1∶4传代培养菌株至10或20mL容积,然后,用0-10mM浓度的邻氨基苯甲酸盐或苯甲酸盐诱导,如所指示的。
细胞生长以传播质粒:含目的质粒的大肠杆菌细胞在50-200mL补充了15μg/mL四环素或100μg/mL氨比西林(依据要分离的质粒)的LB肉汤,Miller中过夜生长,37℃,250rpm振荡。采用以下试剂盒进行质粒制备:NucLEoSpiN试剂盒(质粒DNA纯化″miniprep″试剂盒,培养容积5mL内使用;可从BD Biosciences Clontech,Palo Alto,Cal.获得),或NucLEOBoND试剂盒(质粒DNA纯化″midiprep″试剂盒,培养容积200ml内使用;可从BD Biosciences Clontech,Palo Alto,Cal.获得)。
诱导方案:
目的菌株在1×M9培养基中30℃过夜生长,培养基中补充了0.5%或1%(w/v)葡萄糖,1mM MgSO4,5L/L微量元素(如上所述),和可选地15μg/mL四环素。然后在相同培养基中1∶4或1∶5传代培养,然后用所示的邻氨基苯甲酸盐、苯甲酸盐或其它诱导物浓度诱导所需量的时间(如,2,4,6,8,12,或24小时,或过夜)。在指示的时间取样,检测样本的报告子基因活性。报告在诱导后指定小时数的时间点取得的结果;时间点用任一小时数的数字表示,在某些情况下此数字直接位于表示诱导后的字母″I″之前。
EP-PCR方案
以下方案用于易错PCR诱变(见″克隆DNA的诱变″,F.M.Ausubel,CurrentProtocols in Molecular Biology on CD-ROM(2002)(John Wiley & Sons,New York,NY))。组合以下试剂:63μL水,10μL 0.1M Tris(pH8.3),5μL 1M KCl,0.7μL 1MMgCl2,4μL混合dNTP(混合#1[25mM dCTP,25mM dTTP,5mM dATP,5mM dGTP]或混合#2[20mM dCTP,20mM dTTP;2mM dATP,2mM dGTP]),2μL 100μM M13正向引物(GTAAAACGACGGCCAGT)(SEQ ID NO:16),2μL 100μM M13反向引物(AACAGCTATGACCATG)(SEQ ID NO:17),1μL(~5ng)模板(由克隆进pNEB193的Pant或Pben启动子多核苷酸组成,质粒可从New England BioLabs,Beverly,Mass.获得),2μL 25mM MnCl2,和1μL Taq聚合酶(5单位/μL,从Invitrogen Corp.获得)。PCR条件如下:94℃3min.;30次循环的30秒94℃、30秒50℃和90秒72℃;4℃保存。用MCROCON YM-100或MICROCON-PCR柱(核酸纯化柱,Millipore Corp.,Bedford,Mass.),根据AMICON装置的厂商使用说明书纯化PCR产物。用BamHI和HindIII(NewEngland BioLabs)在1×NE缓冲液BAMHI+BSA(BamHI限制性核酸内切酶缓冲液,可从NewEngland BioLabs获得)中消化产物,通过凝胶提取纯化,对300bp以下片段使用QIAEXII(凝胶提取试剂盒,获自Qiagen,Valencia,Cal.),或对超过300bp的片段使用PREP-A-GENE(DNA纯化试剂盒,获自Bio-Rad Laboratories)。然后,片段被分别克隆到Pdow1017或pDOW1033的lacZ orphoA报告子基因的上游。
敲除方案
构建AntA敲除.采用引物AntAKO5(GG/L47TCTTCGTGACGATGCG)(SEQ ID NO:12)和AntAKO3(CGGGATCCGCTCGCGATGCTGC)(SEQ ID NO:13)从荧光假单胞菌基因组DNA(EcoRI和BamHI位点分别用斜体字显示)中扩增antA基因的内部片段。组合5μL 10×缓冲液(即由Invitrogen与Taq聚合酶一起提供的缓冲液,该缓冲液含200mM Tris-HCl(pH8.4)和500mM KCl),2.5μL 50mM MgCl2,1μL 10mM dNTPs,0.5μL 100μM AntKO3,0.5μL100μM AntKO5,1μL(5单位/μL)Taq聚合酶(Invitrogen Corp.,Carlsbad,Cal.),0.5μL荧光假单胞菌MB214基因组DNA(~50ng)和39μL双蒸水以形成反应混合物。PCR循环条件为:96℃2min.;30次循环的96℃30秒、52℃30秒和72℃30秒。得到的PCR产物被克隆进不能在荧光假单胞菌中复制的质粒中(使用pUC型质粒,尽管如pBR型质粒也起作用)。得到的质粒转化进电感受态荧光假单胞菌细胞,并用适当的抗生素选择转化株。由于质粒不能在荧光假单胞菌中复制,只能选择出那些质粒已整合在antA位点,导致两个平截的antA ORFs被质粒骨架分离的细菌。在M9培养基+1.0%葡萄糖,5mM邻氨基苯甲酸盐中30℃振荡培养转化株24小时,通过HPLC分析培养上清中的邻氨基苯甲酸盐浓度。
构建BenAB敲除.通常,在上述方法在荧光假单胞菌中删除AntA基因后,如下构建质粒pDOW1139以促进benAB基因的删除。用荧光假单胞菌MB214基因组DNA作为模板扩增benR基因的3’部分和benC基因的5’部分。用引物H3_5’benAKOclean和BenKOmega扩增benR区。用引物H3_3’BenBKOclean和InvbenKOmega扩增benC区。两个反应的循环条件是:95℃ 5分钟;35次(94℃30秒;55℃30秒;72℃1分钟);然后72℃5分钟。此反应采用Taq聚合酶(Invitrogen)根据生产者的方案进行。用引物H3_5’benAKOclean和H3_3’benBKOclean融合benR和benC片段,两个片段均作为模板。此融合反应使用KOD HOTSTART DNA聚合酶(Novagen),条件为:94℃2分钟;(94℃30秒;50℃30秒;68℃1.5分钟)35次;然后68℃5分钟。用QIAEXII(Qiagen)凝胶纯化预期的1.1kb片段并克隆进SrfI消化的质粒DNA中形成质粒pDOW1139。然后pDOW1139转化进荧光假单胞菌)。转化株通过覆盖在LB培养基上用四环素进行选择。由于质粒不能在荧光假单胞菌中复制,质粒整合进染色体产生了抗四环素的集落。通过PCR分析质粒整合的位点。为获得通过同源区间重组丢失了整合质粒的菌株,第一个转化株的单一集落被接种进液体LB培养基,过夜生长,然后覆盖在选择性培养基上以反相选择质粒丢失(资料未显示)。选择具有预期表现型的游离集落。采用引物5’BenA_seq,Seq_3’BenB,M13R21,1261-8378F和1261-103R,通过PCR分析来自所得菌株的DNA以确认benAB区的去除。
荧光假单胞菌染色体BenR基因的失活.benA基因上游的开放阅读框(ORF)e图)。用BenactKOfor和BenactKOrev引物通过PCR扩增含ORF部分的DNA片段,以荧光假单胞菌MB214基因组DNA作为模板。根据生产厂商的方案使用重组体Taq聚合酶(fromInvitrogen Corp.)。使用循环程序[94℃ 2min.;(94℃ 30sec,62℃ 30sec,72℃30sec)30次循环;然后72℃ 7min.]。得到的产物克隆进pCR2.1载体(来自InvitrogenCorp.)并转化进大肠杆菌Top10细胞。采用上述引物/条件通过集合PCR筛选插入的转化株,通过DNA测序进一步确认阳性集落。然后,得到的质粒被用来通过插入失活相应的染色体ORF。用NUCLEOBOND质粒midiprep试剂盒(来自Clontech Corp.)制备DNA样本,4μg质粒DNA被转化进荧光假单胞菌菌株MB101。得到的转化株再次通过集落PCR被筛选。为此,假定的敲除集落被挑选入20μl H2O中并在100℃孵育10min。使用以下PCR反应条件对得到的溶解细胞DNA进行PCR:20μl预孵育克隆,5μl 10X缓冲液,3μl25mM MgCl2,1μl 10mM dNTP,5μl 5μM BenactKO-for,5μl 5μMM13F(-40)和M13R(-21),0.5μl Taq聚合酶(5U/μl;来自Promega Corp.),和5.5μl H2O。使用的PCR反应循环条件是:94℃ 1min;(94℃,1min;50℃,30sec;72℃,2min.)30次;然后72℃ 10min,随后4℃保存。MB101基因组DNA和pDOW1 125被用作对照。此BenR基因失活导致敲除宿主细胞不能激活转基因的Pben报告子基因构建物,以及不能代谢苯甲酸盐。
位点定向的诱变方案
在列出的SEQ ID NOs:16-41中发现有用于位点定向诱变的寡核苷酸。Pben-10启动子突变体的构建按如下进行。质粒pDOW1022被用作聚合酶链式反应(PCR)的模板,使用1μM引物benL278和1uM bambenconshort、bambenwtshort或bambenAcshort。根据生产者的使用说明书使用重组体Taq聚合酶(来自Invitrogen Corp.)。反应循环方案为94℃ 2min.;(94℃ 30sec,62℃ 30sec,和72℃ 30sec)25次;然后72℃ 7min。得到的产物被克隆进pCR2.1载体(Tnvitrogen Corp.)并转化进大肠杆菌TOP10。含突变启动子的插入物用BaniKl和Pad消化,随后连接到用相同限制性酶消化的pDOW1033上,产生质粒具有启动子::phoA转录融合的pDOW1081和1083-1084。这些质粒被用作模板以再扩增突变启动子,根据生产者的使用说明书使用引物1803H3seq和bambenconshort、bambenwtshort或bambenAcshort,并使用重组体Taq聚合酶(来自Promega Corp.)。反应循环条件为94℃ 1min.,(94℃1min,50℃ 30sec,和72℃1min.)30次;然后72℃ 7min。得到的产物用HindIII和BamHI消化,随后连接到已经用相同的限制性酶消化的pDOW1017上。这样导致形成启动子::lacZ融合体pDOW1102,1106和1100。
Pant-10启动子突变体的构建按如下进行。质粒pDOW1039被用作PCR模板,使用1μM引物3’Antactiv和1μM引物bamantwtshort或bamantconshort。根据生产者的使用说明书使用重组体Taq聚合酶(来自Invitrogen Corp.)。反应循环方案为94℃ 2min.;(94℃ 30sec,60℃ 30sec,和72℃ 30sec)25次;然后72℃ 7min。得到的产物用HindIII和BamHI消化,并克隆进pDOW1033,含antR-Pant::phoA融合体的质粒pDOW1095和1098的相同位点,具有启动子-10区的变异。
DNA测序方案
采用ABI PRISM BioDYE V2.0或V3.0 DNA测序试剂盒(来自Applied Biosystems,Inc.,Foster City,Cal.)对克隆插入物测序如下:组合4μL预混合物(含缓冲液,Taq聚合酶,和染料终止物,如Applied Biosystems试剂盒所提供的),50fmol质粒模板,3.2-5pmol所需的测序引物,和2μL 5×缓冲液(如Applied Biosystems试剂盒所提供的)(至终容积20μL)。使用的PCR循环程序为:45次循环的95℃ 30sec.,50℃20sec.,和60℃ 4min。用SEPHADEX G-50(珠形,用于层析纯化核酸的右旋糖苷凝胶,来自Sigma Chemical Company,St.Louis,Missouri)纯化样本,干燥,重悬浮在甲酰胺中,然后在ABI 3100自动化DNA测序仪(16排毛细管,自动化DNA测序仪,来自Applied Biosystems,Inc.)上运行。
引物延伸方案
RNA分离.为了确定荧光假单胞菌Pant和Pben启动子控制下的转录起始位点,接着进行RNA分离步骤。使用的步骤如下。在补充了1%葡萄糖(w/v)、1mM MgSO4和微量元素(如上所述)的1×M9培养基中生长的携带了适当质粒的MB101荧光假单胞菌过夜培养物在相同培养基中1∶4(v/v)传代培养至终容积50mL。用5mM苯甲酸盐或邻氨基苯甲酸盐适当诱导培养物8或24小时。沉淀细胞并用RNEASY试剂盒(来自Qiagen,Valencia,Cal.的″maxi″细菌RNA分离试剂盒)分离总RNA。RNA重悬浮至终容积200μL,并根据生产者的方案用10单位DNA酶I(无核糖核酸酶,来自Ambion,Inc.,Austin,Texas)处理。DNA酶I处理后,用适当的(RNEASY″midi″柱用于最大1mg的RNA量;RNEASY″mini″柱用于最大100μg的RNA量)RNEASY柱(″midi″或″mini″RNA纯化柱,来自Qiagen)纯化RNA。一旦纯化,用RmoGREEN(RNA量化试剂盒,来自Molecular Probes,Inc.,Eugene,Oregon),根据生产者的方案测定RNA浓度。
引物标记:通过以下步骤实现:混合1μL 10μM引物(lacZPE,GGATGTGCTGCAAGGC(SEQ ID NO:14),或lacZPE2,GTAACCATGGTCATCGC(SEQ ID NO:15)),1μL 10×T4多核苷酸激酶缓冲液(700mM Tris-HCl(pH7.6),100mM MgCl2,50mM二硫苏糖醇(DTT)),5μL 32P-γATP(50μCi,Amersham-Pharmacia),1μL T4激酶(New England BioLabs)和2μL双蒸水;在37℃孵育得到的反应混合物30-60min。孵育后,保留5μL反应混合物用于″测序梯″分析。20μL TE(10mM Tris,ImM EDTA(pH8.0))加入另5μL并混合,获得物旋经MICROSPIN G-25柱(Amersham-Pharmacia,Piscataway,New Jersey)以去除未结合的核苷酸,因而产生0.2μM终浓度的标记引物。
测序梯:采用1皮摩尔(pmol)上述标记引物,根据与FMOL试剂盒(来自Promega Corp.的DNA测序试剂盒)一起供应的方案完成此步骤。所用的质粒模板与菌株中所含的一致,其中为延伸反应隔离了RNA。
引物延伸反应:通过以下步骤完成引物延伸反应:混合10-20μg总RNA与0.2pmol引物产生12μL终容积,随后在70℃孵育10min。然后,添加4μL5×SUPERSCRIPT II缓冲液(250mM Tris-HCl(pH8.3),375mM KCl,15mM MgCl2,可从Life Technologies,now Invitrogen Corp.,Carlsbad,Cal.获得),2μL 1M DTT,1μL 10mM dNTPs,和1μL SUPERSCRIPT II(逆转录酶,来自Life Technologies,nowInvitrogen),随后在42℃孵育1小时。然后,处理得到的混合物,或者添加5μL测序终止溶液(含甲酰胺和示踪染料,如Promega FMOL试剂盒中提供的),或者在信号弱的情况下用2μL 3M醋酸钠/40μL 100%乙醇沉淀,随后离心10分钟沉淀悬浮物质,烘干沉淀,并在4μL H2O+2μL测序终止溶液中重悬浮。然后,在含8M尿素和1.2×TBE(即Tris-Borate-EDTA,从Fisher Scientific,Pittsburgh,Pennsylvania获得的10×TBE稀释而来)的LONG RANGER凝胶(由6%预混合凝胶溶液制成,来自Biowhittaker Molecular Applications,Rockland,Maine)上,比邻测序梯电泳从引物延伸反应中得到的产物混合物,用0.6×TBE作为“跑”电泳缓冲液。干燥凝胶并曝光于荧光屏(来自Molecular Dynamics,now Amersham Biosciences,Inc.,Piscataway,New Jersey)以探测放射标记的DNA片段,并在TYPHOON PHOSPHORlMAGER(MolecularDynamics,now Amersham Biosciences,Inc.,Piscataway,New Jersey)上绘图。
用Thermoscript逆转录酶延伸引物:混合30ng总RNA,1μL 0.2μM引物和双蒸水至终容积12μL,然后在70℃孵育10min。在此混合物中加入4μL 5×cDNA合成缓冲液(250mM Tris醋酸盐(pH8.4),375mM醋酸钾,40mM醋酸镁),1μL 0.1M DTT,2μL10mM dNTPs,1μL THERMOSCRIPT RT(来自Invitrogea Corp.的逆转录酶),在55℃孵育得到的混合物1小时。沉淀反应产物,干燥并重悬浮在4μL双蒸水+2μL终止溶液(上述)中。在反应物加到上述凝胶上之前,即刻在70℃加热2分钟。凝胶如上所述运行。
微量滴定β-半乳糖苷酶试验
我们制备足够的以下试验培养基以供96孔板的每个样本孔使用(即对使用的所有孔,在每个样本的反应过程中,每个测量时间点至少一个要用的孔):152μL Z缓冲液(0.06M NaH2PO4·7H2O 0.04M NaH2PO4·H2O,0.01M KCl,0.001M MgSO4·7H2O)+8μL 1Mβ-巯基乙醇。在每900μL得到的混合物中,我们添加一滴0.1%SDS和两滴CHCl3,混合(用旋涡型搅拌器),然后在每孔中添加其144μL。然后,每孔中加入16μL细胞,用塑胶平板封闭器密封平板。然后,混合平板(通过旋涡)10秒,再平衡至孵育温度(室温)5分钟。然后添加50μL 4mg/mL ONPG。当形成显著的黄色时,加入90μL终止溶液(1M Na2CO3)并记录反应时间。然后,在A420和A550处读取得到的每个样本的颜色强度。此外每个样本中使用16μL细胞,在A600处读取每个培养物的细胞密度。Miller单位计算如下:
1000*((A420-(1.75*A550))/(时间(为分钟)*0.1*A600))。
碱性磷酸酶试验
为此试验,我们通过添加厂家提供的各片之一(PNPP和Tris各一片;贮存在-20℃)到20mL双蒸水中制备了SIGMA FAST(对硝基苯磷酸盐(PNPP)底物,来自Sigma-AldrichCorp.,St.Louis,Missouri),给出终浓度为1mg/mL PNPP和0.2M Tris。在每个时间点,每个样本,50μL SIGMA FAST底物与5μL细胞结合。然后,在室温孵育获得物30分。然后在A410处读取得到的每个样本的颜色强度。此外,每个样本中使用5μL细胞,在A600处读取每个培养物的细胞密度(即细胞培养物在96孔板中读取)。然后,计算A410/(0.1*A600)的值以表达碱性磷酸酶活性/细胞。
实施例1.苯甲酸盐-可诱导启动子的克隆和分析
苯甲酸盐是廉价的、基本上无毒的化合物,使之成为理想的诱导物选择物。克隆荧光假单胞菌DNA的509bp区。此区被发现位于假定的benA翻译起始位点上游(图5),它是苯甲酸盐加双氧酶亚单位编码序列的一部分。该克隆区被发现含有苯甲酸盐可诱导启动子(Pben),并被称为″Pben509″。
苯甲酸盐可诱导启动子活性的检测是通过融合含有Pben509或Pben278(下面所述)的推测启动子序列的DNA片段,很容易检测的报告子基因(即lacZ,编码β-半乳糖苷酶报告子基因,并用作主要的报告子基因,或phoA)的上游。得到的质粒被转化进荧光假单胞菌MB101中。添加苯甲酸钠后,用产色的底物o-硝基酚-β-D-吡喃半乳糖苷(ONPG)检测β-半乳糖苷酶活性的诱导(见图6)。用phoA报告子基因和产色底物对硝基苯磷酸盐(PNPP)进行相似的实验。携带这些构建物的荧光假单胞菌菌株在添加1-10mM苯甲酸钠情况下分别显示β-半乳糖苷酶或碱性磷酸酶活性。改变诱导物浓度和/或诱导时间引起报告子基因表达水平的改变(资料未显示)。
平截形式的启动子加报告子基因构建物,含有被称为″Pben278″的预计翻译的起始位点上游的275bp部分(图5),被发现保留与Pben509相似的活性(见图6)。
在发酵过程中,Pben509和Pben278启动子活性均被阻遏,因为存在少但显著浓度的葡萄糖。因此,这些启动子是受代谢产物阻遏的。
Northern分析表明,由Pben启动的表达仅在添加诱导物化合物(如,苯甲酸钠)的情况下发生,显示Pben的可诱导表达像lac家族启动子那样是没有泄漏的(资料未显示)。对游离自MB101诱导培养物的总RNA的引物延伸分析表明,转录起始位点是预计的benA翻译起始位点上游的196核苷酸(nt),所述培养物携带与lacZ融合的Pben509或Pben278。这表明启动子序列和阳性调节cis作用元件包含在Pben278克隆中转录起始上游的82bp。
据文献讲解,cis,cis-粘康酸盐,苯甲酸盐代谢物,起诱导其它细菌如不动杆菌种属和恶臭假单胞菌的benABCD操纵子的作用。然而,cis,cis-粘康酸盐和推测的在苯甲酸盐降解代谢已知通路上的前述化合物,即儿茶酚,均不能诱导Pben509或Pben278的活性(资料未显示)。结果,苯甲酸盐或最初的苯甲酸盐衍生物,如,2-hydro-1,2-二羟苯甲酸盐,可直接造成诱导苯甲酸盐启动子。
实施例2.邻氨基苯甲酸盐可诱导启动子的克隆和分析
邻氨基苯甲酸盐,如同苯甲酸盐,是廉价低毒的化合物,可以被荧光假单胞菌用,使之成为理想的研究诱导物的化合物。四个启动子构建物已被克隆在lacZ或phoA报告子的上游,已发现在邻氨基苯甲酸盐诱导下具有相似的活性:Pant713,Pant705,PantS 11,和Pant+antR编码序列(CDS)(图7)。Pant713和Pant705具有相同的5’末端,但Pant713含有预计的antA基因核糖体结合位点,而Pant705则不含(见显示Pant713的最终八聚物中下划线的CCTCC)。在测定邻氨基苯甲酸盐诱导活性所需的最小DNA区的工作中,Pben713构建物在5’末端被截断至311碱基对(bp)。发现Pant311构建物保留与Pant713相似的活性(资料未显示)。启动子克隆延伸以包括antA开放阅读框(ORF)的转录激活物基因5’,提高了lacZ融合体的表达水平。对Pant713和包括转录激活物的AntR的转录起始位点被绘制在预计的antA翻译起始位点上游的31核苷酸处(资料未显示;也见图7)。发现在与lacZ融合的多拷贝中存在antR可以使诱导更快和更强(见图8)。
此外,已经发现进一步增加AntR的表达引起Pant启动子启动的邻氨基苯甲酸盐可诱导表达的更多改善。例如,如图8所示,pDOW1029-和pDOW1035-构建物均在荧光假单胞菌宿主细胞中被诱导。图8显示,在24小时研究时间过程中,这些启动子的每一个获得的诱导率和最大诱导水平上相当大的差异。pDOW1029含Pant713启动子,缺少antR编码序列;pDOW1035含完整的激活物CDS。使用的荧光假单胞菌宿主细胞含活跃表达的、antR CDS染色体拷贝。因此,图8显示的pDOW1029结果是antR基因以单拷贝存在的系统,而pDOW1035的结果代表双拷贝系统。这些结果显示,antR基因额外拷贝的存在戏剧性地改善对Pant启动子的反应率和水平。这种未经证实的表达能够通过用非常强的启动子操纵antR表达而可选择地获得,或进一步增强。诱导/表达的改善也可以通过采用如下所述的宿主细胞而获得,宿主细胞中负责诱导物化合物(如,邻氨基苯甲酸盐)降解的关键基因(如,antA)已被激活。此外,激活物和/或启动子序列突变(和选择活性增加的突变体)也能够增强激活物/启动子的相互作用,因而可以更多地改善Pant启动的邻氨基苯甲酸盐可诱导表达。
发现邻氨基苯甲酸盐启动子也可被邻氨基苯甲酸盐类似物诱导,包括卤素取代的氨基苯甲酸衍生物:3-氯-,4-氯-,5-氯-和6-氯-邻氨基苯甲酸盐。6-氯邻氨基苯甲酸盐被发现作为邻氨基苯甲酸盐代谢的安慰诱导物,即它不被荧光假单胞菌新陈代谢但诱导邻氨基苯甲酸盐启动子启动的表达。例如,6-氯邻氨基苯甲酸盐被发现诱导Pant713和antR/Pant的构建(图8)。合起来看,这些结果表明,邻氨基苯甲酸盐本身诱导代谢通路;有可能使用取代的邻氨基苯甲酸盐化合物作为安慰诱导物,作为失活宿主生物体邻氨基苯甲酸盐代谢通路的可供选择的方案。
实施例3.构建和检测融合的Pant-Pben串联启动子
发现具有多拷贝antR的Pant启动子的相对强度大约是Pben278启动子大1/5。然而,与代谢产物阻遏的Pben启动子不同,Pant启动子活性在发酵过程中不被阻遏。通过将它们连接在一起产生了这两个启动子的融合,如SEQ ID NO:3所显示的,即通过克隆antR和Pant片段,Pben278启动子的上游与lacZ融合。
用邻氨基苯甲酸盐诱导的’antR/Pant‘-’Pben278’″构建物串的强度,令人吃惊地比用邻氨基苯甲酸盐诱导的单独antR/Pant″改进。发现用苯甲酸盐诱导的串联启动子的强度与单独的Pben278相似(图9)。串联启动子在添加邻氨基苯甲酸盐、存在葡萄糖的情况下,诱导出较高的β-半乳糖苷酶活性,表明串联启动子启动的转录意外地不被Pben的代谢产物阻遏所阻断,在该转录中天然的Pben位于编码序列附近。更令人吃惊的是,(1)串联启动子中Pben和Pant元件的细菌来源及(2)被检测诱导的宿主细胞是相同的:荧光假单胞菌生物型A。因此,即使Pben元件原产于宿主细胞,上游存在天然非代谢产物阻遏的启动子(Pant)能够克服天然代谢产物阻遏的启动子(Pben)的代谢产物阻遏。此外,在Pben启动子上游存在antR和Pant看起来减轻了Pben的代谢产物阻遏,因为串联启动子在发酵过程中,存在葡萄糖的情况下是有活性的(见图12和13)。
实施例4.改良的Pben509突变体
在改良Pben启动子的工作中,Pben509启动子通过易错PCR进行诱变。用10mM苯甲酸盐以振摇瓶规模诱导后筛选改良活性的突变体。鉴定的突变体显示比野生型启动子改善大约2倍(图10)。阳性采样被重新转化进荧光假单胞菌并重新检测以保证活性改善事实上是由于新的构建物。
序列分析(图11)显示,突变体2d3中有一个改变,突变体21b5中有两个改变。如附图所显示的,隔离2d3中的突变和21b5中的突变之一属于ORF上游编码区。此区不包含在Pben278构建物中。事实上,这些突变在改良的启动子突变体中是独立的,表明上游区可影响转录,尽管它们对于活化的转录不是必要的。第二个在21b5中鉴定的突变位于转录起始位点上游的5个碱基对。
实施例5.合理突变的Pben和Pant启动子
Pben-10突变体的构建和分析.在改善启动子活性的尝试中突变了天然的预期Pben的-10区。启动子本身被截断至88bp,并构建了三个-10的衍生物:野生型(TACGGTT,共有的(TATAAT),和不动杆菌属(Ac)Pben-10(TAAGGT),如材料和方法中描述的。构建引物使得先前鉴定的转录起始位点上游的1个bp(G:C)被删除,先前鉴定的转录起始位点下游的9个bp纳入其中。这些启动子与phoA报告子基因融合,并在荧光假单胞菌MB101中检测活性。图14显示Pben启动子截断至88bp足以使之具有苯甲酸盐激活的表达,尽管改变10区为共有的TATAAT或不动杆菌属Pben启动子的-10序列看起来没有显著地改善苯甲酸盐诱导的启动子活性。
Pant-10突变体的构建和分析.如上对Pben的描述,在改善启动子活性的尝试中突变了预期的Pant启动子-10区。在两个Pant-10突变体构建物中,启动子被截断至289bp。DNA、含邻氨基苯甲酸盐转录激活物的片段和启动子突变体与phoA报告子基因融合。得到的质粒被转化进MB101衍生体,其中的antA基因已经通过插入活化。图15显示,用邻氨基苯甲酸盐诱导后,启动子的3’截断至289bp不影响活性(pDOW1095)。改变假定的-10区为共有的-10(pDOW1098)使得启动子能够在即使没有诱导化合物的情况下表达。添加邻氨基苯甲酸盐确引起较高的表达,表明启动子仍然是可诱导的。
实施例6.突变体PTANDEM启动子
具有pDOW1057(SEQ ID NO:13)所示序列的串联启动子在Pben-10区如下突变以构建突变体PTANDEM启动子。含用Hind III和SmaI消化pDOW1039获得的antR和Pant的1.6kb DNA片段被凝胶纯化(用QIAEXII凝胶柱,来自Qiagen Corp.),并与pDOW1102(Pben88wt-10)、Pdow1106(Pben88con-10)和pDOW1100(Pben88Ac-10)的每一个连接,它们每一个已被用HindHl和Pmel消化。在转化进宿主细胞后,通过集落PCR鉴定阳性集落的每个质粒,然后通过DNA测序确证。得到的质粒被分别命名为pDOW1107、pDOW1108和pDOW1109。
以振摇瓶规模评估Pben突变体对PTANDEM活性的影响。如图16所示,突变对苯甲酸盐-或邻氨基苯甲酸盐诱导的PTANDEM活性没有显著的影响。pDOW1107-1109均显示为原始构建物pDOW10572倍以内的β-半乳糖苷酶活性。一个有趣的发现是,Pben88-10共有突变体单独或作为串联启动子的一部分看起来在用苯甲酸盐或邻氨基苯甲酸盐诱导之前就表达。添加苯甲酸盐作为诱导物导致Pben88-10共有突变体单独(pDOW1106),或串联体一部分(pDOW1108)引起的表达增加(图16A)。然而,添加邻氨基苯甲酸盐不导致Pben88-10共有串联构建物pDOW1108引起的lacZ表达增加(图16B)。
以20L规模分析pDOW1108显示,用2mM或5mM苯甲酸盐脉冲诱导的携带pDOW1108的MB101,在24小时时间内,不仅有活性,而且能够代谢苯甲酸盐(资料未显示)。在I0探测到相对高水平的β-半乳糖苷酶活性,很可能是″泄漏″表达的结果,如以振摇瓶规模所探测的(见图16A)。在苯甲酸盐诱导下,一致探测到活性的最初下降,但活性然后升至超过I0探测的水平。用2mM邻氨基苯甲酸盐以20L规模每隔4小时诱导pDOW1108,24小时周期显示,尽管邻氨基苯甲酸盐被有效代谢,通过β-半乳糖苷酶活性检测的克隆串联启动子表达是泄漏的,如以振摇瓶规模观察的,但实际上在添加邻氨基苯甲酸盐后是下降的(见图18)。用苯甲酸盐以20L规模对携带原始串联启动子构建物pDOW1057的荧光假单胞菌的相当诱导显示,苯甲酸盐被代谢,pDOW1108也同样。然而,β-半乳糖苷酶活性的诱导看起来比相似的2mM剂量的pDOW1108构建物诱导要延迟,同诱导后30和48小时相比,该酶活性的增加在4和24小时间测到(资料未显示)。
实施例7.在发酵期间用苯甲酸盐-和邻氨基苯甲酸盐诱导的启动子来控制基因表达
以20L规模检测Pben509 lacZ融合显示的转录调节结果以振摇瓶规模未测到。用5或10mM苯甲酸盐诱导的融合没有始终观察到(资料未显示)。也观察了苯甲酸盐消耗和Pben509活化间的相关性。存在葡萄糖被认为是抑制报告子基因表达的原因。接着这些实验,在振摇瓶实验中已观察到苯甲酸盐代谢跟随着葡萄糖消耗。苯甲酸盐可诱导的系统可用于使用碳来源而非葡萄糖的发酵过程。振摇瓶实验显示,当使用柠檬酸盐作为碳来源时观察到最高水平的诱导。此观察将适用于发酵规模。
以20L规模检测antR Pant构建物和串联启动子构建物显示的活性与以振摇瓶规模观察的相似。因为通过培养诱导物被消耗,所以在诱导过程中给予邻氨基苯甲酸盐。观察的活性随时间增加。很可能会在不能代谢诱导物的菌株中观察到较高的活性。如在振摇瓶和20L发酵实验中观察到的,串联启动子构建物比antR Pant构建物更有活性(图12)。通过插入失活的antA基因引起的邻氨基苯甲酸盐代谢丧失使串联启动子:lacZ融合在20L规模有较高的表达。如图13所示,邻氨基苯甲酸盐在诱导过程中不代谢,观察的β-半乳糖苷酶活性水平远高于代谢邻氨基苯甲酸盐的菌株中的观察。
实施例8.BenAB敲除株的特征
为证实苯甲酸盐是否事实上是Pben启动子的诱导物,而不是其下游代谢物,对荧光假单胞菌的benAB基因敲除株进行进一步定性。BenA和benB基因分别编码苯甲酸盐1,2加双氧酶的大和小亚单位。进一步如下检测两个独立的benAB敲除菌株代谢苯甲酸盐的能力。细胞在LB-脯氨酸-尿嘧啶中生长至高密度;然后,向培养物中加苯甲酸盐至终浓度~5mM,再返回孵育24hr。如HPLC检测的,残留在无细胞肉汤中的苯甲酸盐浓度显示benAB删除突变体不能代谢苯甲酸盐,而亲代未敲除菌株有效地代谢苯甲酸盐。为评价在benAB敲除菌株中Pben启动子是否仍然有活性,含Pben278::lacZ构建物的质粒被转化进菌株之一,转化株在LB培养基中生长。用0或5mM苯甲酸盐诱导转化株,lacZ活性显示苯甲酸盐确实是Pben诱导物,而非下游代谢物。见图19。
实施例9.BenR多拷贝表达的作用
从荧光假单胞菌MB214基因组DNA扩增含benA上游BenR ORF以及Pben启动子的DNA片段,采用引物Benact5’和Bambenconshort,在以下条件下进行:94℃ 1min;(94℃,1min;50℃,30sec;72℃,90sec)30个循环;然后72℃ 10min,并4℃保存。PCR产物连接进pCR2.1载体,并确证序列。用PmeI和BamHI消化插入片段,并与pDOW1033连接。得到的质粒以pDOW1090储存。相同的启动子构建物通过用BamHI和XhoI消化pDOW1090与lacZ报告子融合,融合中去除了phoA报告子并用含lacZ报告子基因的pDOW1035 3Kb BamHI-XhoI片段代替之。
benR ORF与phoA报告子基因上游的Pben启动子一起克隆以测定是否转录激活物基因多拷贝表达会改善苯甲酸盐激活的基因表达。以振摇瓶规模,用多拷贝benR没有观察到启动子活性的显著差异。由于文献中已经显示,转录激活物的过度表达可以克服代谢产物的阻遏,我们检测了携带pDOW1090的荧光假单胞菌MB101的20L发酵。以前的研究显示,携带Pben::lacZ融合的MB101在用玉米糖浆饲料的发酵期间不能代谢苯甲酸盐。我们发现,携带pDOW1090的MB101能够以20L规模代谢苯甲酸盐。发现苯甲酸盐在三倍20L发酵中始终是被代谢的,表明染色体Pben启动子是有活性的。因此,BenR多拷贝表达的存在克服了代谢产物的阻遏。见图17。
结果,我们发现了benR的过度表达使荧光假单胞菌克服了以20L规模检测仅含Pben的构建物时观察到的苯甲酸盐代谢产物的阻遏。20L规模的苯甲酸盐诱导的启动子活性的演示是一个重要的改善,因为苯甲酸盐诱导的串联启动子活化超过邻氨基苯甲酸盐以振摇瓶规模诱导的活性,即使在PTANDEM控制下邻氨基苯甲酸盐诱导的活性已经强于邻氨基苯甲酸盐诱导的Pant活性。pDOW1057和pDOW1108均被发现在20L规模是苯甲酸盐可诱导的。尽管pDOW1108构建物是“泄漏的”,因为在添加诱导物前发生了显著表达,这对于其用于蛋白表达不应当存在大的问题。此外,由于已经发现Pben在benAB敲除菌株中是有活性的,使用这种敲除菌株将改善苯甲酸盐诱导的Pben以及PTANDEM启动子活性。同样地,由于已经显示在携带通过插入失活的染色体antA基因的菌株中,用邻氨基苯甲酸盐对串联启动子构建物pDOW1057的诱导是改善的,邻氨基苯甲酸盐对Pant以及PTANDEM诱导的启动子活性将是改善的。
因此,现在邻氨基苯甲酸盐-和苯甲酸盐可诱导的启动子已经被开发用于细菌表达系统。已经发现这些启动子可以紧密地调节转录,并可以用低成本的化合物如苯甲酸盐和邻氨基苯甲酸盐诱导;现在已经发现多拷贝antR的存在也显著地改善Pant启动子的活性。此外,现在已经开发了用于细菌表达系统的新型串联启动子,举例为Pant-Pben串联启动子已经发现比Pant本身具有邻氨基苯甲酸盐诱导的基因表达水平的升高;发现苯甲酸盐可诱导的,即达到与Pben本身相同的水平;并发现意外地克服了Pben本身遇到的代谢产物阻遏。进一步,本工作显示Pant启动子(具有antR)和串联启动子构建物在发酵规模条件下(如,以20L规模)存在邻氨基苯甲酸盐可诱导的基因表达;串联启动子构建物在发酵规模条件下还具有苯甲酸盐可诱导的基因表达。
应当理解,上面描述的优选实施例仅仅是本发明的示范,这里所用的术语学只是为了阐明这些优选的实施例;因此,为以上描述选择的优选实施例并非要限制本发明的范围。被这样描述的本发明、其它实施例、方案、变化和明显变更对本领域技术人员将是浅显的,只是采用常规的实验做为那些优选实施例、方法学、方案、载体、试剂、要素和这里特别描述的组合的等价物。这些等价物被认为在本发明的范围内,并不被视为背离本发明的精神和范围。所有这些等价物均需要包括在以下权利要求书的范围内,本发明的真正范围因此被以下权利要求书所限定。
参考文献
1.J.Brosius & A.Holy,Regulation of ribosomal RNA promoters witha synthetic lac operator,Proc.Nat’1 Acad.Sci.USA,81:6929-6933(1984).
2.E.Amann等人,Vectors bearing hybrid trp-lac promoter useful forregulated expression of cloned genes in Escherichia coli,Genes 25:167-178(1983).
3.J.Sanchez-Romero & V.De Lorenzo,Genetic Engineering ofNonpathogenic
Pseudomonas strains as Biocatalysts for Industrial and EnvironmentalProcesses,in Manual of Industrial Microbiology and Biotechnology(A.Demain& J.Davies,eds.)pp.460-74(1999)(ASM Press,Washington,B.C.).
4.H.Schweizer,Vectors to express foreign genes and techniquesto monitor gene expression for Pseudomonads,Current Opinion in Biotechnology,12:439-445(2001).
5.R.Slater & R.Williams,The Expression of Foreign DNA inBacteria,in Molecular Biology and Biotechnology(J.Walker & R.Rapley,eds.)pp.125-54(2000)(The Royal Society of Chemistry,Cambridge,UK).
6.D.Goeddel等人,Direct expression in Escherichia coli of a DNAsequence coding for human growth hormone,Nature 281:544-48(1979).
7.K.L.Hester等人,Catabolite repression control by crc hi 2xYTmedium is mediated by post-transcriptional regulation of bkdR expression inPseudomonas putida,J.Bacteriol.182(4):1150-53(2000).
8.P.M.Santos等人,Physiological analysis of the expression ofthe styrene degradation gene cluster in Pseudomonas fluorescens ST,Appl.&Environ.Microbiol.66(4):1305-10(2000).
9.W.A.Duetz等人,Catabolite repression of the toluenedegradation pathway in Pseudomonas putida harboring pWWO under variousconditions of nutrient limitation hi chemostat culture,Appl.& Environ.Microbiol.62(2):601-06(1996).
10.M.M.Marin等人,The alkane hydroxylase gene of伯克氏菌属cepacia RR10 is under Catabolite repression control,J. Bacteriol.183(14):4202-09(2001).
11.M.M.Ochs等人,Amino acid-mediated induction of the basic aminoacid-specific outer membrane porin OprD from Pseudomonas aeruginosa,J.Bacteriol.181(17):5426-32(1999).
12.T.Nishijyo等人,Molecular characterization and regulation ofan operon encoding a system for transport of arginine and ornithine and theArgR regulatory protein in Pseudomonas aeruginosa,J. Bacteriol180(21):5559-66(1998).
13.K.L.Hester等人,Crc is involved in catabolite repression controlof the bkd operons of Pseudomonas putida and Pseudomonas aeruginosa,J.Bacteriol.182(4):1144-49(2000).
14.G.Mosqueda & J.L.Ramos,A set of genes encoding a second tolueneefflux system in Pseudomonas putida DOT-TIE is linked to the tod genes fortoluene metabolism,J.Bacterial.182(4):937-43(2000).
15.C.D.Lu & A.T.Abdelal,The gdhB gene of Pseudomonas aeruginosaencodes an arginine-inducible NAD(+)-dependent glutamate dehydrogenase whichis subject to allosteric regulation,J.Bacterial.183(2):490-99(2001).
16.S.Vilchez等人,Control of expression of divergent Pseudomonasputida put promoters for proline catabolism.Appl. & Environ.Microbiol.66(12):5221-25(2000).
序列表
<110>陶氏环球技术公司
<120>苯甲酸盐—和邻氨基苯甲酸盐—诱导的启动子
<130>62033A WO
<150>US 60/393,422
<151>2002-07-03
<160>41
<170>Microsoft Word 97 SR-2
<210>1
<211>5006
<212>DNA
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..5006
<223>控制benABCD的表达的苯甲酸盐操纵子
<220>
<221>CDS
<222>225..284
<223>可选择的氨基—末端—部分—编码CDS,开始于CDS编码的BenR的可选择推定引发剂编码子(ttg225-227),推定Met1->Arg335作为Pben激活物蛋白的氨基酸序列
<220>
<221>CDS
<222>285..1229
<223>编码推定Pben激活物蛋白的ORF的反义链,开始于CDS编码的BenR的推定引发剂编码子(atg285-287),推定Met21->Arg335作为Pben激活物蛋白的全长氨基酸序列
<220>
<221>突变
<222>679..679
<223>一种g679->a679的表达突变,在表达时改变agc->aac并推定Ser152->Asn152
<220>
<221>misc_feature
<222>1106..1106
<223>a1106->t1106突变,在Pben509突变体2d3中发现
<220>
<221>misc_feature
<222>1223..1223
<223>c1223->t1223突变,在Pben509突变体21b5中发现
<220>
<221>misc_信号
<222>1228..1274
<223>估计含有BenR结合位点的大致区域
<220>
<221>启动子
<222>1275..1307
<223>来自苯甲酸盐操纵子(benABCD)的推定启动子(Pben)
<220>
<221>-35_信号
<222>1275..1280
<223>Pben启动子的推定-35区域
<220>
<221>-10_信号
<222>1296..1301
<223>Pben启动子的推定-10区域
<220>
<221>misc_feature
<222>1296..1301
<223>Pben-10区域的取代突变,通过tataat形成-10con突变体,通过taaggt形成-10benAc突变体
<220>
<221>misc_feature
<222>1302..1302
<223>g1302->a1302突变,在Pben509突变体21b5中发现
<220>
<221>misc_feature
<222>1306..1306
<223>在此处从突变体启动子变异体中发现的g1306缺失
<220>
<221>misc_信号
<222>1307..1307
<223>在Pben控制下的推定的转录起始位点
<220>
<221>misc_信号
<222>1340..1342
<223>推定的天然翻译起始密码子
<220>
<221>CDS
<222>1340..2713
<223>编码苯甲酸盐1,2-双加氧酶α亚单位的BenA的开放阅读框
<220>
<221>misc_信号
<222>2714..2716
<223>BenA终止密码子
<220>
<221>CDS
<222>2713..3198
<223>编码苯甲酸盐1,2-双加氧酶β亚单位的BenB的开放阅读框
<220>
<221>misc_信号
<222>3199..3201
<223>BenB终止密码子
<220>
<221>CDS
<222>3212..4231
<223>编码苯甲酸盐1,2-双加氧酶电子转移组分的BenC的开放阅读框
<220>
<221>misc_信号
<222>4232..4234
<223>BenC终止密码子
<220>
<221>CDS
<222>4224..5003
<223>编码顺式1,2-二羟基环己基-3,5-二烯-1-羧酸盐脱氢酶的开放阅读框BenD
<220>
<221>misc_信号
<222>5004..5006
<223>BenD终止密码子
<400>1
gcatgacgtt gttgatttct catcgattct ccagcgtgcg caatgccgac cacatcatcg 60
tgctggacgg cgggcgaatc ctggaggagg gcagtcatca ccaactgatg gcggcgggtg 120
gacgctatgc cgagttgttc gatgttcagg cgcgggggta tcgctaggtc ccgagcgcca 180
cgcccgacga tacctccagg gtatccctcc agactttatc cata ttg gac gcc ccc 236
Met Asp Ala Pro
1
cta ccc aag cgt cag cct gag ccc aat aac gat aaa aga gtc gcg acc 284
Leu Pro Lys Arg Gln Pro Glu Pro Asn Asn Asp Lys Arg Val Ala Thr
5 10 15 20
atg acc gtg cta ttg agt gag cgc agc cag att ttc cag ggc gcc gat 332
Met Thr Val Leu Leu Ser Glu Arg Ser Gln Ile Phe Gln Gly Ala Asp
25 30 35
gcc tac gcg gtg tcg gac tac gtc aac cag cat gtg ggc agc cac tgc 380
Ala Tyr Ala Val Ser Asp Tyr Val Asn Gln His Val Gly Ser His Cys
40 45 50
att cgc ctg cct ccc agg ggc cag ccc cgg gca agt atc agc cat cgc 428
Ile Arg Leu Pro Pro Arg Gly Gln Pro Arg Ala Ser Ile Ser His Arg
55 60 65
acc ttc gcc agc ctg gac ctg tgc cgc atc agc tac ggc gca ccg gtg 476
Thr Phe Ala Ser Leu Asp Leu Cys Arg Ile Ser Tyr Gly Ala Pro Val
70 75 80
cgg gtc acg tcg gtg gcg ctg gag acc atc tac cac ctg cag atc ctc 524
Arg Val Thr Ser Val Ala Leu Glu Thr Ile Tyr His Leu Gln Ile Leu
85 90 95 100
ttg agc ggg cat tgc cgc tcc aac tcc cgt ggc gag gat gat gtg ttc 572
Leu Ser Gly His Cys Arg Ser Asn Ser Arg Gly Glu Asp Asp Val Phe
105 110 115
ggg ccg ggg gaa atc ctg ctg atc aat ccg gac gac ccg gta gac ctg 620
Gly Pro Gly Glu Ile Leu Leu Ile Asn Pro Asp Asp Pro Val Asp Leu
120 125 130
acc tat tcc gcc gac tgc gaa aaa ttc atc atc aaa ctg ccg gtg cgc 668
Thr Tyr Ser Ala Asp Cys Glu Lys Phe Ile Ile Lys Leu Pro Val Arg
135 140 145
ctg ctg gaa agc gcc tgc ctg gag cag cac tgg agc ctg ccg cgg gcg 716
Leu Leu Glu Ser Ala Cys Leu Glu Gln His Trp Ser Leu Pro Arg Ala
150 155 160
ggg gtc cgc ttc acg acg gcc cgc cac gcg ctc agt gaa atg ggc ggc 764
Gly Val Arg Phe Thr Thr Ala Arg His Ala Leu Ser Glu Met Gly Gly
165 170 175 180
ttc ctg ccg ttg ctc ggg ttg atc tgc cat gag gcg gaa aac gct gcc 812
Phe Leu Pro Leu Leu Gly Leu Ile Cys His Glu Ala Glu Asn Ala Ala
185 190 195
gag ccc cac atg caa ggc ctg tac gaa cgc atc gtg gcc aac aag ctg 860
Glu Pro His Met Gln Gly Leu Tyr Glu Arg Ile Val Ala Asn Lys Leu
200 205 210
ctg gca ttg ctg ggc agc aat gtg tcg cgg gtg acc ccc cgg gct gcc 908
Leu Ala Leu Leu Gly Ser Asn Val Ser Arg Val Thr Pro Arg Ala Ala
215 220 225
cac ggc ggt ggg ttt gaa gcg gtg cac gaa ttt atc cag cag cac ctg 956
His Gly Gly Gly Phe Glu Ala Val His Glu Phe Ile Gln Gln His Leu
230 235 240
ggc gat gac atc agc gtc gag cag ttg atg gcc gtg gcc aac gtc agt 1004
Gly Asp Asp Ile Ser Val Glu Gln Leu Met Ala Val Ala Asn Val Ser
245 250 255 260
gaa cgt tcg ctg tac agc ctg ttt gag cgc cag gtg ggg ctg tcg ccg 1052
Glu Arg Ser Leu Tyr Ser Leu Phe Glu Arg Gln Val Gly Leu Ser Pro
265 270 275
cgc gat tac gta tgc cgc tgc aag ctc gaa cgc gta cat gca cgc ttg 1100
Arg Asp Tyr Val Cys Arg Cys Lys Leu Glu Arg Val His Ala Arg Leu
280 285 290
caa cta agc agc acg cgc agc gtg acc gag gtg gct ttg gac cat ggg 1148
Gln Leu Ser Ser Thr Arg Ser Val Thr Glu Val Ala Leu Asp His Gly
295 300 305
ttc atg cac cta ggg cgg ttt tcc gaa gcc tat cgc aaa cgc ttc ggc 1196
Phe Met His Leu Gly Arg Phe Ser Glu Ala Tyr Arg Lys Arg Phe Gly
310 315 320
gaa ctg ccg tcg cag acc tgg aaa cgc cat cgt taagcgacgt gcgcctggcg 1249
Glu Leu Pro Ser Gln Thr Trp Lys Arg His Arg
325 330 335
gatagcgatg tgcaggcagc ggatattgac gggcagggcg agcacgtacg gtgagggcgc 1309
ctgatacaag aacaacggag ggcccgcccc atg atc agt aca ccc gac cga ctc 1363
Met Ile Ser Thr Pro Asp Arg Leu
1 5
gcc tgc caa ttg cgc gag tcc gta cag gaa gac ccc gcc act ggg gtg 1411
Ala Cys Gln Leu Arg Glu Ser Val Gln Glu Asp Pro Ala Thr Gly Val
10 15 20
ttc cgc tgc cgc cgc gac atc ttc acc gac ccc gac ctg ttt gcc ctg 1459
Phe Arg Cys Arg Arg Asp Ile Phe Thr Asp Pro Asp Leu Phe Ala Leu
25 30 35 40
gag atg aaa cac atc ttc gaa ggc ggg tgg atc tac ctg gcc cat gaa 1507
Glu Met Lys His Ile Phe Glu Gly Gly Trp Ile Tyr Leu Ala His Glu
45 50 55
agc cag gtg ccg cag atc aac gat tac ttc acc acc tgg atc ggc cgc 1555
Ser Gln Val Pro Gln Ile Asn Asp Tyr Phe Thr Thr Trp Ile Gly Arg
60 65 70
cag ccg gtg gtc atc acc cgt gac aag cac ggc gcg ctg cat ggc ctg 1603
Gln Pro Val Val Ile Thr Arg Asp Lys His Gly Ala Leu His Gly Leu
75 80 85
gtc aac gcc tgc gcg cat cgc ggc gcc atg ttg tgc cgg cgc aaa caa 1651
Val Asn Ala Cys Ala His Arg Gly Ala Met Leu Cys Arg Arg Lys Gln
90 95 100
ggc aac aag ggc tca ttc act tgc ccc ttc cat ggc tgg acg ttc agc 1699
Gly Asn Lys Gly Ser Phe Thr Cys Pro Phe His Gly Trp Thr Phe Ser
105 110 115 120
aac gcc ggc aag ctg ctc aag gta aag gac gca aag acc ggc gcc tac 1747
Asn Ala Gly Lys Leu Leu Lys Val Lys Asp Ala Lys Thr Gly Ala Tyr
125 130 135
ccg gac agc ttc gac tgc gac ggc tcc cat gac ctc aag cgc ctg gcg 1795
Pro Asp Ser Phe Asp Cys Asp Gly Ser His Asp Leu Lys Arg Leu Ala
140 145 150
cgc ttt gaa aac tac cgc ggt ttc ctg ttc gcc agc ctc agc gat gcg 1843
Arg Phe Glu Asn Tyr Arg Gly Phe Leu Phe Ala Ser Leu Ser Asp Ala
155 160 165
gtg ccg gaa ctc agc gat tac ttg ggt gaa acc cgc gtc atc atc gac 1891
Val Pro Glu Leu Ser Asp Tyr Leu Gly Glu Thr Arg Val Ile Ile Asp
170 175 180
cag atg gtc gac cag gcc cct ttg ggc ctg gag gtg ctg cgc ggc agc 1939
Gln Met Val Asp Gln Ala Pro Leu Gly Leu Glu Val Leu Arg Gly Ser
185 190 195 200
tct tcc tat gtc tat gac ggc aac tgg aag ctg caa atc gaa aac ggc 1987
Ser Ser Tyr Val Tyr Asp Gly Asn Trp Lys Leu Gln Ile Glu Asn Gly
205 210 215
gcc gac ggt tac cac gtc agc tcc gtg cac tgg aac tac tcg gcg acc 2035
Ala Asp Gly Tyr His Val Ser Ser Val His Trp Asn Tyr Ser Ala Thr
220 225 230
atg ggc cgg cgc aac tac gac gcc gaa ggc acg cgc acc gtc gac gcc 2083
Met Gly Arg Arg Asn Tyr Asp Ala Glu Gly Thr Arg Thr Val Asp Ala
235 240 245
aat ggc tgg tcg aaa agc ctg ggc ggc gtc tac gcc ttc gac cac ggg 2131
Asn Gly trp Ser Lys Ser Leu Gly Gly Val Tyr Ala Phe Asp His Gly
250 255 260
cat atc ctg ctg tgg acg cgc ctg ctt aac ccc caa gtg cgc ccg gtg 2179
His Ile Leu Leu Trp Thr Arg Leu Leu Asn Pro Gln Val Arg Pro Val
265 270 275 280
cac gct cac cgc gag gcc ttg gcc gaa cgc ctg ggc caa gcg cgc gcc 2227
His Ala His Arg Glu Ala Leu Ala Glu Arg Leu Gly Gln Ala Arg Ala
285 290 295
gac ttt atc gtc gac cag acc cgc aac ctc tgt ctc tac ccc aat gtg 2275
Asp Phe Ile Val Asp Gln Thr Arg Asn Leu Cys Leu Tyr Pro Asn Val
300 305 310
tac ctg atg gac cag ttc tcg acc cag atc cgc gtg gtg cgg ccc ctc 2323
Tyr Leu Met Asp Gln Phe Ser Thr Gln Ile Arg Val Val Arg Pro Leu
315 320 325
gcc gtg gat aaa acc gaa gtg aca atc tat tgc atg gcg ccc atc ggc 2371
Ala Val Asp Lys Thr Glu Val Thr Ile Tyr Cys Met Ala Pro Ile Gly
330 335 340
gaa agc gcc cag gag cgc gcc acg cgg att cgc cag tac gaa gac ttc 2419
Glu Ser Ala Gln Glu Arg Ala Thr Arg Ile Arg Gln Tyr Glu Asp Phe
345 350 355 360
ttc aat gtc agc ggc atg ggc acc ccg gat gac ctc gag gag ttc cgc 2467
Phe Asn Val Ser Gly Met Gly Thr Pro Asp Asp Leu Glu Glu Phe Arg
365 370 375
gcc tgc cag acc ggt tac cag ggc gcg agc acc ctg tgg aat gac ttg 2515
Ala Cys Gln Thr Gly Tyr Gln Gly Ala Ser Thr Leu Trp Asn Asp Leu
380 385 390
agc cgt ggc gcc aag cag tgg gtc gag ggt gcg gac gaa aat gcc ttg 2563
Ser Arg Gly Ala Lys Gln Trp Val Glu Gly Ala Asp Glu Asn Ala Leu
395 400 405
gcc atg ggt atg caa ccg cag ctc agc ggg gtc aag acc gag gac gag 2611
Ala Met Gly Met Gln Pro Gln Leu Ser Gly Val Lys Thr Glu Asp Glu
410 415 420
ggc ttg ttt gtg cgc cag cat gcg cac tgg gcc caa agc ctg cag cgt 2659
Gly Leu Phe Val Arg Gln His Ala His Trp Ala Gln Ser Leu Gln Arg
425 430 435 440
gca atc gag cgc gaa cag caa ggg ctg ata gcc agc gac tgt gag gtg 2707
Ala Ile Glu Arg Glu Gln Gln Gly Leu Ile Ala Ser Asp Cys Glu Val
445 450 455
ctg cca tg agc ctt gcc cgg gac cac ctg ctg gat ttt ctt tac cgt 2754
Leu Pro Ser Leu Ala Arg Asp His Leu Leu Asp Phe Leu Tyr Arg
5 10
gaa gcg cgc ctg ctc gac gac cgc caa tgg gat gaa tgg ctg gcc tgc 2802
Glu Ala Arg Leu Leu Asp Asp Arg Gln Trp Asp Glu Trp Leu Ala Cys
15 20 25 30
tat tcg ccc aag gcc gag ttc tgg atg ccc gcc tgg gac gat cac gac 2850
Tyr Ser Pro Lys Ala Glu Phe Trp Met Pro Ala Trp Asp Asp His Asp
35 40 45
act ctt acc gaa gac ccg cag cgc gaa atc tcg ctg atc tac tac ccc 2898
Thr Leu Thr Glu Asp Pro Gln Arg Glu Ile Ser Leu Ile Tyr Tyr Pro
50 55 60
aac cgt gac ggc ctg gaa gac cgc atc ttt cgc atc aag act gag cgc 2946
Asn Arg Asp Gly Leu Glu Asp Arg Ile Phe Arg Ile Lys Thr Glu Arg
65 70 75
tcc agc gcc agc acg ccc gag ccg cgc acc gtg cac atg ctg tgc aac 2994
Ser Ser Ala Ser Thr Pro Glu Pro Arg Thr Val His Met Leu Cys Asn
80 85 90
ctc gaa gtg ctg gcc gac gac ggc gcg cag gtg gac ctg cgt ttc aac 3042
Leu Glu Val Leu Ala Asp Asp Gly Ala Gln Val Asp Leu Arg Phe Asn
95 100 105 110
tgg cac acc ctc agc cac cgc tac aaa acc acc gac agt tat ttc ggt 3090
Trp His Thr Leu Ser His Arg Tyr Lys Thr Thr Asp Ser Tyr Phe Gly
115 120 125
acc tcc ttc tat cgc ctc gac atc cgt gcc gag cag ccg ttg ata acg 3138
Thr Ser Phe Tyr Arg Leu Asp Ile Arg Ala Glu Gln Pro Leu Ile Thr
130 135 140
cgc aag aag gtg gtg ctg aaa aac gat tac atc cac cag gtc atc gac 3186
Arg Lys Lys Val Val Leu Lys Asn Asp Tyr Ile His Gln Val Ile Asp
145 150 155
atc tac cat atc tgaggacacc gcc atg acg tat gcc atc gcc ttg aac 3235
Ile Tyr His Ile Met Thr Tyr Ala Ile Ala Leu Asn
160 1 5
ttc gag gat gga gtg acc cgc ttc atc gac tgc aag gtg gga gaa aag 3283
Phe Glu Asp Gly Val Thr Arg Phe Ile Asp Cys Lys Val Gly Glu Lys
10 15 20
gtg ctc gat gcg gcc ttc cgc caa cgc atc aac ctg ccc atg gac tgc 3331
Val Leu Asp Ala Ala Phe Arg Gln Arg Ile Asn Leu Pro Met Asp Cys
25 30 35 40
tcg gac ggc gtg tgc ggc acc tgc aaa tgc cgc tgt gaa acc ggc gcc 3379
Ser Asp Gly Val Cys Gly Thr Cys Lys Cys Arg Cys Glu Thr Gly Ala
45 50 55
tac gac ctg ggc gac gac ttt atc gac gac gcc ctg agc gcc gac gaa 3427
Tyr Asp Leu Gly Asp Asp Phe Ile Asp Asp Ala Leu Ser Ala Asp Glu
60 65 70
gcg cag gcg cgc cgg gtg ctg acc tgc caa atg gtg ccg cag tcc gac 3475
Ala Gln Ala Arg Arg Val Leu Thr Cys Gln Met Val Pro Gln Ser Asp
75 80 85
tgc gtg atc gcc gtg ccg gtg ccg tcc agc gcc tgc aag acc ggc acc 3523
Cys Val Ile Ala Val Pro Val Pro Ser Ser Ala Cys Lys Thr Gly Thr
90 95 100
acg cac ttt gcc gcg acg ctg gcc ggc atc acc cga cat gcc gat gcg 3571
Thr His Phe Ala Ala Thr Leu Ala Gly Ile Thr Arg His Ala Asp Ala
105 110 115 120
gcg ctg gag gtg agt ttc gaa ctg gac cag gcg ccg gta ttc ctg ccc 3619
Ala Leu Glu Val Ser Phe Glu Leu Asp Gln Ala Pro Val Phe Leu Pro
125 130 135
ggc cag tac gtg aat atc agc gtg ccc gac agt ggg cag act cgt gct 3667
Gly Gln Tyr Val Asp Ile Ser Val Pro Asp Ser Gly Gln Thr Arg Ala
140 145 150
tac tcc ttc agc agt ccc ccg ggc gac ccg cgc gcc agc ttc ctg atc 3715
Tyr Ser Phe Ser Ser Pro Pro Gly Asp Pro Arg Ala Ser Phe Leu Ile
155 160 165
aag cac gtg ccc ggc ggg ttg atg agc ggt tgg ctc gag cgc gcc cag 3763
Lys His Val Pro Gly Gly Leu Met Ser Glu Trp Leu Glu Arg Ala Gln
170 175 180
ccg ggc gac agc gtg gcg atc acc ggc cca ctg ggg agt ttc tac ctg 3811
Pro Gly Asp Ser Val Ala Ile Thr Gly Pro Leu Gly Ser Phe Tyr Leu
185 190 195 200
cgt gag gtg gcg cgg ccg ctg ctg tta ctg gcc ggt ggt acc ggc ctg 3859
Arg Glu Val Ala Arg Pro Leu Leu Leu Leu Ala Gly Gly Thr Gly Leu
205 210 215
gcg ccg ttc ctg tcg atg ctt gaa gtg ctc gcg cag cgc cag gaa acc 3907
Ala Pro Phe Leu Ser Met Leu Glu Val Leu Ala Gln Arg Gln Glu Thr
220 225 230
cgc ccg atc cgg ttg atc tac ggc gta acg cgg gat cag gac ctg gtg 3955
Arg Pro Ile Arg Leu Ile Tyr Gly Val Thr Arg Asp Gln Asp Leu Val
235 240 245
atg att gag gcg ttg cag gct ttt acc gcg cgt ttg ccc gac ttc aac 4003
Met Ile Glu Ala Leu Gln Ala Phe Thr Ala Arg Leu Pro Asp Phe Asn
250 255 260
ctg gtg acc tgc gtg gct gat ccg cac acc act cac ccg cgc cag ggc 4051
Leu Val Thr Cys Val Ala Asp Pro His Thr Thr His Pro Arg Gln Gly
265 270 275 280
tat gtg acc cag cac atg gcc gac gaa gcc ctc aat ggc ggc gat gtc 4099
Tyr Val Thr Gln His Met Ala Asp Glu Ala Leu Asn Gly Gly Asp Val
285 290 295
gac gtg tac ctg tgc ggc ccg ccg ccg atg gtc gat gcg gtg cgc gag 4147
Asp Val Tyr Leu Cys Gly Pro Pro Pro Met Val Asp Ala Val Arg Glu
300 305 310
cac ttc aag cag caa agc gtg acc ccg gcc agc ttc cat tac gag aaa 4195
His Phe Lys Gln Gln Ser Val Thr Pro Ala Ser Phe His Tyr Glu Lys
315 320 325
ttc acc cct aac gcc gtc gcc acg tgc gat gcc gcc t gag gac tgc cgc 4244
Phe Thr Pro Asn Ala Val Ala Thr Cys Asp Ala Ala Glu Asp Cys Arg
330 335 340 5
atg act caa cgg ttt aac aac aag gtc gcg ctg gtt acc ggc gct gcg 4292
Met Thr Gln Arg Phe Asn Asn Lys Val Ala Leu Val Thr Gly Ala Ala
10 15 20
caa ggc atc ggc cga cgt gtc gcc gaa cgc ttg ctg gag gag ggg gcc 4340
Gln Gly Ile Gly Arg Arg Val Ala Glu Arg Leu Leu Glu Glu Gly Ala
25 30 35
tgg ctg gtc gcg gtg gat cgc tcc gag ctc gtg cat gaa ttg cag cat 4388
Trp Leu Val Ala Val Asp Arg Ser Glu Leu Val His Glu Leu Gln His
40 45 50 55
gag cga gcg cta ctg ctg acc gcc gac ctg gaa caa tac agc gag tgc 4436
Glu Arg Ala Leu Leu Leu Thr Ala Asp Leu Glu Gln Tyr Ser Glu Cys
60 65 70
gca cgg gta atg gcc gcc gcc acg gcg cgt ttc ggg cgc ata gac gtg 4484
Ala Arg Val Met Ala Ala Ala Thr Ala Arg Phe Gly Arg Ile Asp Val
75 80 85
ctg gtc aat aac gtc ggc ggg acc atc tgg gcc aag cct ttt gag cat 4532
Leu Val Asn Asn Val Gly Gly Thr Ile Trp Ala Lys Pro Phe Glu His
90 95 100
tat gcc gag gct gaa atc gag gcc gaa gtg cgc cgc tcg ctg ttc cct 4580
Tyr Ala Glu Ala Glu Ile Glu Ala Glu Val Arg Arg Ser Leu Phe Pro
105 110 115
acg ttg tgg tgc tgc cat tgc gtg ctg ccc tat atg ctg gag cag ggc 4628
Thr Leu Trp Cys Cys His Cys Val Leu Pro Tyr Met Leu Glu Gln Gly
120 125 130 135
gcg ggc gcg atc gtc aac gtg tct tcc gtg gcc acg cgc ggg gtc aat 4676
Ala Gly Ala Ile Val Asn Val Ser Ser Val Ala Thr Arg Gly Val Asn
140 145 150
cgc gtg ccc tat ggc gca gcc aag ggc ggc gtg aat gcc ttg acg gcc 4724
Arg Val Pro Tyr Gly Ala Ala Lys Gly Gly Val Asn Ala Leu Thr Ala
155 160 165
tgc ctg gcc ctg gag act gca ggc agc ggg att cgc gtc aac gcc acc 4772
Cys Leu Ala Leu Glu Thr Ala Gly Ser Gly Ile Arg Val Asn Ala Thr
170 175 180
gcg ccc ggc ggc acc gag gca ccg cca cgg cgc atc ccg cgc aac agc 4820
Ala Pro Gly Gly Thr Glu Ala Pro Pro Arg Arg Ile Pro Arg Asn Ser
185 190 195
cag ccg cag agc gag cag gaa cgt gtg tgg tac cag cag atc gtc gac 4868
Gln Pro Gln Ser Glu Gln Glu Arg Val Trp Tyr Gln Gln Ile Val Asp
200 205 210 215
cag acc ctc gag agc agc tcg atg aaa cgc tac ggc agc atc gac gaa 4916
Gln Thr Leu Glu Ser Ser Ser Met Lys Arg Tyr Gly Ser Ile Asp Glu
220 225 230
caa gct ggc gca att ctg ttc ctg gcc tgc gac gag gcc tcc tac atc 4964
Gln Ala Gly Ala Ile Leu Phe Leu Ala Cys Asp Glu Ala Ser Tyr Ile
235 240 245
acc ggc gtg acc ttg ccg gtg ggc ggc ggc gac ctc ggc taa 5006
Thr Gly Val Thr Leu Pro Val Gly Gly Gly Asp Leu Gly
250 255 260
<210>2
<211>335
<212>PRT
<213>荧光假单胞菌
<220>
<221>INIT_MET
<222>1..1
<223>Alternative putative initiator methionine for BenR,giving Met1->Arg335 as the amino acid sequence of the Pben activator protein
<220>
<221>INIT_MET
<222>21..21
<223>Putative initiator methionine of BenR,giving Met21->Arg335 as theamino acid sequence of the Pben activator protein
<220>
<221>突变体
<222>152..152
<223>突变Ser152->Asn152
<400>2
Met Asp Ala Pro Leu Pro Lys Arg Gln Pro Glu Pro Asn Asn Asp Lys
1 5 10 15
Arg Val Ala Thr Met Thr Val Leu Leu Ser Glu Arg Ser Gln Ile Phe
20 25 30
Gln Gly Ala Asp Ala Tyr Ala Val Ser Asp Tyr Val Asn Gln His Val
35 40 45
Gly Ser His Cys Ile Arg Leu Pro Pro Arg Gly Gln Pro Arg Ala Ser
50 55 60
Ile Ser His Arg Thr Phe Ala Ser Leu Asp Leu Cys Arg Ile Ser Tyr
65 70 75 80
Gly Ala Pro Val Arg Val Thr Ser Val Ala Leu Glu Thr Ile Tyr His
85 90 95
Leu Gln Ile Leu Leu Ser Gly His Cys Arg Ser Asn Ser Arg Gly Glu
100 105 110
Asp Asp Val Phe Gly Pro Gly Glu Ile Leu Leu Ile Asn Pro Asp Asp
115 120 125
Pro Val Asp Leu Thr Tyr Ser Ala Asp Cys Glu Lys Phe Ile Ile Lys
130 135 140
Leu Pro Val Arg Leu Leu Glu Ser Ala Cys Leu Glu Gln His Trp Ser
145 150 155 160
Leu Pro Arg Ala Gly Val Arg Phe Thr Thr Ala Arg His Ala Leu Ser
165 170 175
Glu Met Gly Gly Phe Leu Pro Leu Leu Gly LeuIle Cys His Glu Ala
180 185 190
Glu Asn Ala Ala Glu Pro His Met Gln Gly Leu Tyr Glu Arg Ile Val
195 200 205
Ala Asn Lys Leu Leu Ala Leu Leu Gly Ser Asn Val Ser Arg Val Thr
210 215 220
Pro Arg Ala Ala His Gly Gly Gly Phe Glu Ala Val His Glu Phe Ile
225 230 235 240
Gln Gln His Leu Gly Asp Asp Ile Ser Val Glu Gln Leu Met Ala Val
245 250 255
Ala Asn Val Ser Glu Arg Ser Leu Tyr Ser Leu Phe Glu Arg Gln Val
260 265 270
Gly Leu Ser Pro Arg Asp Tyr Val Cys Arg Cys Lys Leu Glu Arg Val
275 280 285
His Ala Arg Leu Gln Leu Ser Ser Thr Arg Ser Val Thr Glu Val Ala
290 295 300
Leu Asp His Gly Phe Met His Leu Gly Arg Phe Ser Glu Ala Tyr Arg
305 310 315 320
Lys Arg Phe Gly Glu Leu Pro Ser Gln Thr Trp Lys Arg His Arg
325 330 335
<210>3
<211>458
<212>PRT
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..458
<223>BenA expression product,苯甲酸盐1,2-dioxygenase alpha subunit
<400>3
Met Ile Ser Thr Pro Asp Arg Leu Ala Cys Gln Leu Arg Glu Ser Val
1 5 10 15
Gln Glu Asp Pro Ala Thr Gly Val Phe Arg Cys Arg Arg Asp Ile Phe
20 25 30
Thr Asp Pro Asp Leu Phe Ala Leu Glu Met Lys His Ile Phe Glu Gly
35 40 45
Gly Trp Ile Tyr Leu Ala His Glu Ser Gln Val Pro Gln Ile Asn Asp
50 55 60
Tyr Phe Thr Thr Trp Ile Gly Arg Gln Pro Val Val Ile Thr Arg Asp
65 70 75 80
Lys His Gly Ala Leu His Gly Leu Val Asn Ala Cys Ala His Arg Gly
85 90 95
Ala Met Leu Cys Arg Arg Lys Gln Gly Asn Lys Gly Ser Phe Thr Cys
100 105 110
Pro Phe His Gly Trp Thr Phe Ser Asn Ala Gly Lys Leu Leu Lys Val
115 120 125
Lys Asp Ala Lys Thr Gly Ala Tyr Pro Asp Ser Phe Asp Cys Asp Gly
130 135 140
Ser His Asp Leu Lys Arg Leu Ala Arg Phe Glu Asn Tyr Arg Gly Phe
145 150 155 160
Leu Phe Ala Ser Leu Ser Asp Ala Val Pro Glu Leu Ser Asp Tyr Leu
165 170 175
Gly Glu Thr Arg Val Ile Ile Asp Gln Met Val Asp Gln Ala Pro Leu
180 185 190
Gly Leu Glu Val Leu Arg Gly Ser Ser Ser Tyr Val Tyr Asp Gly Asn
195 200 205
Trp Lys Leu Gln Ile Glu Asn Gly Ala Asp Gly Tyr His Val Ser Ser
210 215 220
Val His Trp Asn Tyr Ser Ala Thr Met Gly Arg Arg Asn Tyr Asp Ala
225 230 235 240
Glu Gly Thr Arg Thr Val Asp Ala Asn Gly trp Ser Lys Ser Leu Gly
245 250 255
Gly Val Tyr Ala Phe Asp His Gly His Ile Leu Leu Trp Thr Arg Leu
260 265 270
Leu Asn Pro Gln Val Arg Pro Val His Ala His Arg Glu Ala Leu Ala
275 280 285
Glu Arg Leu Gly Gln Ala Arg Ala Asp Phe Ile Val Asp Gln Thr Arg
290 295 300
Asn Leu Cys Leu Tyr Pro Asn Val Tyr Leu Met Asp Gln Phe Ser Thr
305 310 315 320
Gln Ile Arg Val Val Arg Pro Leu Ala Val Asp Lys Thr Glu Val Thr
325 330 335
Ile Tyr Cys Met Ala Pro Ile Gly Glu Ser Ala Gln Glu Arg Ala Thr
340 345 350
Arg Ile Arg Gln Tyr Glu Asp Phe Phe Asn Val Ser Gly Met Gly Thr
355 360 365
Pro Asp Asp Leu Glu Glu Phe Arg Ala Cys Gln Thr Gly Tyr Gln Gly
370 375 380
Ala Ser Thr Leu Trp Asn Asp Leu Ser Arg Gly Ala Lys Gln Trp Val
385 390 395 400
Glu Gly Ala Asp Glu Asn Ala Leu Ala Met Gly Met Gln Pro Gln Leu
405 410 415
Ser Gly Val Lys Thr Glu Asp Glu Gly Leu Phe Val Arg Gln His Ala
420 425 430
His Trp Ala Gln Ser Leu Gln Arg Ala Ile Glu Arg Glu Gln Gln Gly
435 440 445
Leu Ile Ala Ser Asp Cys Glu Val Leu Pro
450 455
<210>4
<211>162
<212>PRT
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..162
<223>BenB expression product,苯甲酸盐1,2-dioxygenase beta subunit
<400>4
Met Ser Leu Ala Arg Asp His Leu Leu Asp Phe Leu Tyr Arg Glu Ala
1 5 10 15
Arg Leu Leu Asp Asp Arg Gln Trp Asp Glu Trp Leu Ala Cys Tyr Ser
20 25 30
Pro Lys Ala Glu Phe Trp Met Pro Ala Trp Asp Asp His Asp Thr Leu
35 40 45
Thr Glu Asp Pro Gln Arg Glu Ile Ser Leu Ile Tyr Tyr Pro Asn Arg
50 55 60
Asp Gly Leu Glu Asp Arg Ile Phe Arg Ile Lys Thr Glu Arg Ser Ser
65 70 75 80
Ala Ser Thr Pro Glu Pro Arg Thr Val His Met Leu Cys Asn Leu Glu
85 90 95
Val Leu Ala Asp Asp Gly Ala Gln Val Asp Leu Arg Phe Asn Trp His
100 105 110
Thr Leu Ser His Arg Tyr Lys Thr Thr Asp Ser Tyr Phe Gly Thr Ser
115 120 125
Phe Tyr Arg Leu Asp Ile Arg Ala Glu Gln Pro Leu Ile Thr Arg Lys
130 135 140
Lys Val Val Leu Lys Asn Asp Tyr Ile His Gln Val Ile Asp Ile Tyr
145 150 155 160
His Ile
<210>5
<211>340
<212>PRT
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..340
<223>BenC expression product,苯甲酸盐1,2-dioxygenase electron transfercomponent
<400>5
Met Thr Tyr Ala Ile Ala Leu Asn Phe Glu Asp Gly Val Thr Arg Phe
1 5 10 15
Ile Asp Cys Lys Val Gly Glu Lys Val Leu Asp Ala Ala Phe Arg Gln
20 25 30
Arg Ile Asn Leu Pro Met Asp Cys Ser Asp Gly Val Cys Gly Thr Cys
35 40 45
Lys Cys Arg Cys Glu Thr Gly Ala Tyr Asp Leu Gly Asp Asp Phe Ile
50 55 60
Asp Asp Ala Leu Ser Ala Asp Glu Ala Gln Ala Arg Arg Val Leu Thr
65 70 75 80
Cys Gln Met Val Pro Gln Ser Asp Cys Val Ile Ala Val Pro Val Pro
85 90 95
Ser Ser Ala Cys Lys Thr Gly Thr Thr His Phe Ala Ala Thr Leu Ala
100 105 110
Gly Ile Thr Arg His Ala Asp Ala Ala Leu Glu Val Ser Phe Glu Leu
115 120 125
Asp Gln Ala Pro Val Phe Leu Pro Gly Gln Tyr Val Asp Ile Ser Val
130 135 140
Pro Asp Ser Gly Gln Thr Arg Ala Tyr Ser Phe Ser Ser Pro Pro Gly
145 150 155 160
Asp Pro Arg Ala Ser Phe Leu Ile Lys His Val Pro Gly Gly Leu Met
165 170 175
Ser Glu Trp Leu Glu Arg Ala Gln Pro Gly Asp Ser Val Ala Ile Thr
180 185 190
Gly Pro Leu Gly Ser Phe Tyr Leu Arg Glu Val Ala Arg Pro Leu Leu
195 200 205
Leu Leu Ala Gly Gly Thr Gly Leu Ala Pro Phe Leu Ser Met Leu Glu
210 215 220
Val Leu Ala Gln Arg Gln Glu Thr Arg Pro Ile Arg Leu Ile Tyr Gly
225 230 235 240
Val Thr Arg Asp Gln Asp Leu Val Met Ile Glu Ala Leu Gln Ala Phe
245 250 255
Thr Ala Arg Leu Pro Asp Phe Asn Leu Val Thr Cys Val Ala Asp Pro
260 265 270
His Thr Thr His Pro Arg Gln Gly Tyr Val Thr Gln His Met Ala Asp
275 280 285
Glu Ala Leu Asn Gly Gly Asp Val Asp Val Tyr Leu Cys Gly Pro Pro
290 295 300
Pro Met Val Asp Ala Val Arg Glu His Phe Lys Gln Gln Ser Val Thr
305 310 315 320
Pro Ala Ser Phe His Tyr Glu Lys Phe Thr Pro Asn Ala Val Ala Thr
325 330 335
Cys Asp Ala Ala
340
<210>6
<211>260
<212>PRT
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..260
<223>BenD expression product,cis-1,2-dihydroxycyclohexa-3,5-diene-1-carboxylate dehydrogenase
<400>6
Met Pro Pro Glu Asp Cys Arg Met Thr Gln Arg Phe Asn Asn Lys Val
1 5 10 15
Ala Leu Val Thr Gly Ala Ala Gln Gly Ile Gly Arg Arg Val Ala Glu
20 25 30
Arg Leu Leu Glu Glu Gly Ala Trp Leu Val Ala Val Asp Arg Ser Glu
35 40 45
Leu Val His Glu Leu Gln His Glu Arg Ala Leu Leu Leu Thr Ala Asp
50 55 60
Leu Glu Gln Tyr Ser Glu Cys Ala Arg Val Met Ala Ala Ala Thr Ala
65 70 75 80
Arg Phe Gly Arg Ile Asp Val Leu Val Asn Asn Val Gly Gly Thr Ile
85 90 95
Trp Ala Lys Pro Phe Glu His Tyr Ala Glu Ala Glu Ile Glu Ala Glu
100 105 110
Val Arg Arg Ser Leu Phe Pro Thr Leu Trp Cys Cys His Cys Val Leu
115 120 125
Pro Tyr Met Leu Glu Gln Gly Ala Gly Ala Ile Val Asn Val Ser Ser
130 135 140
Val Ala Thr Arg Gly Val Asn Arg Val Pro Tyr Gly Ala Ala Lys Gly
145 150 155 160
Gly Val Asn Ala Leu Thr Ala Cys Leu Ala Leu Glu Thr Ala Gly Ser
165 170 175
Gly Ile Arg Val Asn Ala Thr Ala Pro Gly Gly Thr Glu Ala Pro Pro
180 185 190
Arg Arg Ile Pro Arg Asn Ser Gln Pro Gln Ser Glu Gln Glu Arg Val
195 200 205
Trp Tyr Gln Gln Ile Val Asp Gln Thr Leu Glu Ser Ser Ser Met Lys
210 215 220
Arg Tyr Gly Ser Ile Asp Glu Gln Ala Gly Ala Ile Leu Phe Leu Ala
225 230 235 240
Cys Asp Glu Ala Ser Tyr Ile Thr Gly Val Thr Leu Pro Val Gly Gly
245 250 255
Gly Asp Leu Gly
260
<210>7
<211>4330
<212>DNA
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..4330
<223>Anthranilate操纵子controlling expression of antABC
<220>
<221>misc_信号
<222>1..3
<223>Anticodon of终止密码子for the CDS of AntR
<220>
<221>CDS
<222>4..993
<223>Antisense strand of ORF encoding AntR
<220>
<221>variation
<222>192..192
<223>突变 to A235 from native C235;resulting in the anticodon突变CGC->CGA shown at 233..235,thus codon突变GCG->TCG and amino acid突变ofAla 268 to Ser268
<220>
<221>misc_信号
<222>1130..1237
<223>Approximate region estimated to contain the AntR binding site
<220>
<221>启动子
<222>1239..1274
<223>Putative启动子(Pant)from anthranilate操纵子(antABC)
<220>
<221>-35_信号
<222>1239..1244
<223>Putative-35 region of Pant启动子
<220>
<221>-10_信号
<222>1264..1268
<223>Putative-10 region of Pant启动子
<220>
<221>misc_feature
<222>1264..1268
<223>Substitution突变of Pant -10 region by tataat to form-10conmutants
<220>
<221>misc_feature
<222>1269..1269
<223>A deletion of g1269 found in突变体启动子 突变体s herein
<220>
<221>misc_信号
<222> 1274..1274
<223>推定的转录起始位点under control of Pant
<220>
<221>misc_feature
<222>1278..1278
<223>A deletion of t1278 found in突变体启动子 突变体s herein
<220>
<221>misc_信号
<222>1305..1307
<223>Putative native translation initiator codon
<220>
<221>CDS
<222>1305..2693
<223>AntA open reading frame encoding anthranilate dioxygenase largesubunit
<220>
<221>misc_信号
<222>2694..2696
<223>AntA终止密码子
<220>
<221>CDS
<222>2696..3184
<223>AntB open reading frame encoding anthranilate dioxygenase smallsubunit
<220>
<221>misc_信号
<222>3185..3187
<223>AntB终止密码子
<220>
<221>CDS
<222>3323..4327
<223>AntC open reading frame encoding anthranilate dioxygenase reductase
<220>
<221>misc_信号
<222>4328..4330
<223>AntC终止密码子
<400>7
tca agt aat gcg cag gcg ctt gcg ctg caa tgt ctg gct ggg cga ctc 48
Thr Ile Arg Leu Arg Lys Arg Gln Leu Thr Gln Ser Pro Ser Glu
-330 -325 -320
atc gaa cag ctt gcg gta ctc cgc cga aaa ccg ccc caa atg cgt aaa 96
Asp Phe Leu Lys Arg Tyr Glu Ala Ser Phe Arg Gly Leu His Thr Phe
-315 -310 -305 -300
ccc cca acc cag ggc gat ttc aga gat ggt gcg gat cga gcc ctg ctc 144
Gly Trp Gly Leu Ala Ile Glu Ser Ile Thr Arg Ile Ser Gly Gln Glu
-295 -290 -285
cag aat ttc ttg gcg cac cgc ccc caa ccg atg ctt ctt caa ata cgc 192
Leu Ile Glu Gln Arg Val Ala Gly Leu Arg His Lys Lys Leu Tyr Ala
-280 -275 -270
cat ggg cga cag tgc gaa gta ctt gcg aaa cgc atc gaa cag ttt gaa 240
Met Pro Ser Leu Ala Phe Tyr Lys Arg Phe Ala Asp Phe Leu Lys Phe
-265 -260 -255
acg cga cac gcc cgc cgc cgc ttc cag gtc ttc cag gtg cag cgc ttc 288
Arg Ser Val Gly Ala Ala Ala Glu Leu Asp Glu Leu His Leu Ala Glu
-250 -245 -240
acg ggc gtt gtc gtg gat aaa ttg ccg cgc gcg gat cag gta gtg cgg 336
Arg Ala Asn Asp His Ile Phe Gln Arg Ala Arg Ile Leu Tyr His Pro
-235 -230 -225 -220
cag ttt cac ccc cag cac gtc gcg cag ttc ttc gga gta gtt att cgg 384
Leu Lys Val Gly Leu Val Asp Arg Leu Glu Glu Ser Tyr Asn Asn Pro
-215 -210 -205
ttg ggc cag gat cag gcc ctt gat cag cga gct ttc cag gtc gcg agt 432
Gln Ala Leu Ile Leu Gly Lys Ile Leu Ser Ser Glu Leu Asp Arg Thr
-200 -195 -190
aaa cgc cgc ctg ctc gta cag ttc gct gct gcg ctc cag ttc ggc gat 480
Phe Ala Ala Gln Glu Tyr Leu Glu Ser Ser Arg Glu Leu Glu Ala Ile
-185 -180 -175
gaa ata acg cgc cat gcg cca cca cga agc cgg tgc tcc gtc cac agc 528
Phe Tyr Arg Ala Met Arg Trp Trp Ser Ala Pro Ala Gly Asp Val Ala
-170 -165 -160
atc cat cac cga ctc aaa gcg cag cgg cgc atc aat ggg ccg ttg cag 576
Asp Met Val Ser Glu Phe Arg Leu Pro Ala AspIle Pro Arg Gln Leu
-155 -150 -145 -140
caa acc ttc cag cga ctc gct cat cgc cgc acg ggt gat tac cac ctg 624
Leu Gly Glu Leu Ser Glu Ser Met Ala Ala Arg Thr Ile Val Val Gln
-135 -130 -125
caa ctt gcg gca gtc acc gga aat cgc cag cac ctg atg ctc att ggg 672
Leu Lys Arg Cys Asp Gly Ser Ile Ala Leu Val Gln His Glu Asn Pro
-120 -115 -110
cga aat gat cac gcc ttg gtc gcg gtt gga act gag acg ttc acc gtt 720
Ser Ile Ile Val Gly Gln Asp Arg Asn Ser Ser Leu Arg Glu Gly Asn
-105 -100 -95
ctt gct cag ctc ctg ctc gcc cac cag tgg cag gct caa gct gta gct 768
Lys Ser Leu Glu Gln Glu Gly Val Leu Pro Leu Ser Leu Ser Tyr Ser
-90 -85 -80
gct gaa gtg ctc ggc gtc ttc gat gtc gat ggt cac atc agt gcc gta 816
Ser Phe His Glu Ala Asp Glu Ile Asp Ile Thr Val Asp Thr Gly Tyr
-75 -70 -65 -60
ctc gat cac gcc cag ggt ggt ggc gcg gga ttt gaa cac gtt ggc gct 864
Glu Ile Val Gly Leu Thr Thr Ala Arg Ser Lys Phe Val Asn Ala Ser
-55 -50 -45
gtg gtg aaa gcg cag gcg ctc ggg ggt tgc cgt cgc cag gcg atg ggg 912
His His Phe Arg Leu Arg Glu Pro Thr Ala Thr Ala Leu Arg His Pro
-40 -35 -30
ccc gca gat gcc gga cat cca gct gcg cgc gcc ttc cag gtc gaa gcg 960
Gly Cys Ile Gly Ser Met Trp Ser Arg Ala Gly Glu Leu Asp Phe Arg
-25 -20 -15
ttg aat atg aat atc gcg tgt ctg act agt cat cagggtgcac ccacggcggt 1013
Gln Ile His Ile Asp Arg Thr Gln Ser Thr Met
-10 -5 -1
taggcgtttg cgcgctctga cggcgcgtcg ttgaacctcg acagcaagtt ccaggccacg 1073
ccagtgcagt tctcactggg tggatagcaa cggtcgacta tgtggataaa ccccagagtt 1133
ttgcgaccat cgcccgccat cacagtagcg catgccgtca ccggcgcgca ccgtcatggg 1193
tatttgccgc ccaactttgc ggcctacgtt cccccattaa gcggatagcc cgccaccgca 1253
tcgcagccgc ttaatggctc accgtttagc catgatcaaa aggtgcctcc c atg agt 1310
Met Ser
1
ggt gca aga acc gtc gag caa tgg aaa tcc ttt atc gaa agc tgc ctg 1358
Gly Ala Arg Thr Val Glu Gln Trp Lys Ser Phe Ile Glu Ser Cys Leu
5 10 15
gac ttt cgc ccg gcg gat gaa gtg ttc cgc atc gcc cgc gac atg ttc 1406
Asp Phe Arg Pro Ala Asp Glu Val Phe Arg Ile Ala Arg Asp Met Phe
20 25 30
acc gag ccc gag ttg ttc gac ctg gag atg gag ctg atc ttc gag aag 1454
Thr Glu Pro Glu Leu Phe Asp Leu Glu Met Glu Leu Ile Phe Glu Lys
35 40 45 50
aac tgg atc tac gcc tgc cac gaa agc gaa ctg gcc aat aac cac gac 1502
Asn Trp Ile Tyr Ala Cys His Glu Ser Glu Leu Ala Asn Asn His Asp
55 60 65
ttc gtg acg atg cgc gcc ggc cgc cag ccg atg atc atc acc cgt gac 1550
Phe Val Thr Met Arg Ala Gly Arg Gln Pro Met Ile Ile Thr Arg Asp
70 75 80
ggc gaa ggc cga ctc aac gcg ttg atc aac gcc tgc cag cat cgc ggt 1598
Gly Glu Gly Arg Leu Asn Ala Leu Ile Asn Ala Cys Gln His Arg Gly
85 90 95
acc acc ctc acc cgc gtg ggc aag ggt aac cag tcc acc ttc acc tgc 1646
Thr Thr Leu Thr Arg Val Gly Lys Gly Asn Gln Ser Thr Phe Thr Cys
100 105 110
ccg ttc cac gcc tgg tgc tac aag agc gat ggc cga ctg gta aag gtc 1694
Pro Phe His Ala Trp Cys Tyr Lys Ser Asp Gly Arg Leu Val Lys Val
115 120 125 130
aag gcg ccg ggg gaa tac ccg gaa ggt ttc gac aag gcc acc cgc ggc 1742
Lys Ala Pro Gly Glu Tyr Pro Glu Gly Phe Asp Lys Ala Thr Arg Gly
135 140 145
ctg aaa aaa gcg cgc atc gaa agc tac agg ggc ttt gtg ttt atc agc 1790
Leu Lys Lys Ala Arg Ile Glu Ser Tyr Arg Gly Phe Val Phe Ile Ser
150 155 160
ctg gac gtg aac ggc acc aac agc ctg gag gac ttc ctg ggc gat gcc 1838
Leu Asp Val Asn Gly Thr Asn Ser Leu Glu Asp Phe Leu Gly Asp Ala
165 170 175
aaa gtg ttc ttc gac atg atg gtg gcg caa tcg gcc acc ggt gag ctg 1886
Lys Val Phe Phe Asp Met Met Val Ala Gln Ser Ala Thr Gly Glu Leu
180 185 190
gaa gtg ctg ccg ggc aag tcc gcc tac acc tac gac ggc aac tgg aag 1934
Glu Val Leu Pro Gly Lys Ser Ala Tyr Thr Tyr Asp Gly Asn Trp Lys
195 200 205 210
ctg caa aac gaa aac ggc ctg gac ggt tat cac gtc agc acc gtg cac 1982
Leu Gln Asn Glu Asn Gly Leu Asp Gly Tyr His Val Ser Thr Val His
215 220 225
tac aac tac gtg gcc acc gtg cag cat cgc gag cag gtc aac acc gaa 2030
Tyr Asn Tyr Val Ala Thr Val Gln His Arg Glu Gln Val Asn Thr Glu
230 235 240
aac ggc gca ggt tcc agc acg acg ttg gac tac agc aag ctc ggc gcc 2078
Asn Gly Ala Gly Ser Ser Thr Thr Leu Asp Tyr Ser Lys Leu Gly Ala
245 250 255
ggc gac gcc aat acc gac gac ggc tgg ttc gcc ttc aac aac ggc cac 2126
Gly Asp Ala Asn Thr Asp Asp Gly Trp Phe Ala Phe Asn Asn Gly His
260 265 270
agc gtg ttg ttt agc gac atg ccc aac ccc agc gtg cgc tcc ggc tac 2174
Ser Val Leu Phe Ser Asp Met Pro Asn Pro Ser Val Arg Ser Gly Tyr
275 280 285 290
gcc acc atc atg ccg cgc ctg gta gaa gaa cac ggc cag cag aag gcc 2222
Ala Thr Ile Met Pro Arg Leu Val Glu Glu His Gly Gln Gln Lys Ala
295 300 305
gag tgg atg atg cac cgc ctg cgc aac ctg aat atc tac ccc agc ctg 2270
Glu Trp Met Met His Arg Leu Arg Asn Leu Asn Ile Tyr Pro Ser Leu
310 315 320
ttt ttc ctc gac cag atc agc tcg cag ttg cgc atc atc cgc ccg gtg 2318
Phe Phe Leu Asp Gln Ile Ser Ser Gln Leu Arg Ile Ile Arg Pro Val
325 330 335
gcc tgg aac aag acc gag atc atc agc cag tgc ctg ggg gtt aag ggc 2366
Ala Trp Asn Lys Thr Glu Ile Ile Ser Gln Cys Leu Gly Val Lys Gly
340 345 350
gag tcc gac gcc gac cgc gaa aac cgg att cgt cag ttc gaa gac ttc 2414
Glu Ser Asp Ala Asp Arg Glu Asn Arg Ile Arg Gln Phe Glu Asp Phe
355 360 365 370
ttc aac gtt tca ggc atg ggc acg ccc gat gac ctg gtg gag ttt cgc 2462
Phe Asn Val Ser Gly Met Gly Thr Pro Asp Asp Leu Val Glu Phe Arg
375 380 385
gaa gcc cag cgt ggc ttt cag ggc cgc ctg gaa cgc tgg agc gac atc 2510
Glu Ala Gln Arg Gly Phe Gln Gly Arg Leu Glu Arg Trp Ser Asp Ile
390 395 400
tca cgg ggc agc cat cgc tgg gag acc ggg ccg acg cca aac agc gag 2558
Ser Arg Gly Ser His Arg Trp Glu Thr Gly Pro Trp Pro Asn Ser Glu
405 410 415
gcc atc ggc atc caa ccg gcg atg acc ggt acc gaa ttc acc cat gaa 2606
Ala Ile Gly Ile Gln Pro Ala Met Thr Gly Thr Glu Phe Thr His Glu
420 425 430
ggc ctg tac gtc aac cag cat cgc aac tgg cag cag ttc ctg cta aag 2654
Gly Leu Tyr Val Asn Gln His Arg Asn Trp Gln Gln Phe Leu Leu Lys
435 440 445 450
ggt ttg gac cag cga gcc ctg gca ctg cgg gag gtg aag tg atg aat 2701
Gly Leu Asp Gln Arg Ala Leu Ala Leu Arg Glu Val Lys Met Asn
455 460 1
gcg caa ttg cag tac cag atc gag cag ttc ttc tat cgc aag tcc gag 2749
Ala Gln Leu Gln Tyr Gln Ile Glu Gln Phe Phe Tyr Arg Lys Ser Glu
5 10 15
ctg tgc gac gcc cag gac tgg gac gcc tac gtg cag ttg ttc gac ccg 2797
Leu Cys Asp Ala Gln Asp Trp Asp Ala Tyr Val Gln Leu Phe Asp Pro
20 25 30
cag agt gaa ttc cac ctg ccg caa tgg gac tcc gaa cac gtc tac acc 2845
Gln Ser Glu Phe His Leu Pro Gln Trp Asp Ser Glu His Val Tyr Thr
35 40 45 50
caa gac ccc aag cgc gag atg tca ttg atc tac tac gcc aac cgt tcg 2893
Gln Asp Pro Lys Arg Glu Met Ser Leu Ile Tyr Tyr Ala Asn Arg Ser
55 60 65
ggc ctg gaa gac cgt gtg ttc cgc ctg cgc acc ggc aaa gcc gcc tct 2941
Gly Leu Glu Asp Arg Val Phe Arg Leu Arg Thr Glu Lys Ala Ala Ser
70 75 80
gcc acg ccg atg ccg cgc act ttg cac ctg atc aat aac gta cgc att 2989
Ala Thr Pro Met Pro Arg Thr Leu His Leu Ile Asn Asn Val Arg Ile
85 90 95
gcc gag cag gcc gat ggc acg ttg gag gtg cgt ttg aac tgg cac aca 3037
Ala Glu Gln Ala Asp Gly Thr Leu Glu Val Arg Leu Asn Trp His Thr
100 105 110
ttg ttt tat cgc ctg gcc acg tcc gag cag ttt tac ggg cat gcc acg 3085
Leu Phe Tyr Arg Leu Ala Thr Ser Glu Gln Phe Tyr Gly His Ala Thr
115 120 125 130
tac cgc ctc aag cct gcg ggc gac agc tgg ttg atc atg cgc aag cac 3133
Tyr Arg Leu Lys Pro Ala Gly Asp Ser Trp Leu Ile Met Arg Lys His
135 140 145
gcc ttg ttg ctc aac gac acc atc aac tcg gtg ctg gat ttc tac cac 3181
Ala Leu Leu Leu Asn Asp Thr Ile Asn Ser Val Leu Asp Phe Tyr His
150 155 160
ctg taacggtggt gcatcgccct gtaggagcga gcttgctcgc gaaaaacgta 3234
Leu
agtacgccgc gttcattcag gatgtcccgc gtcatcgttg acgtttttcg cgagcaaggg 3294
gttcatacct attcacggag ttatgtga atg aat cac aaa gtg gcc ttc agc 3346
Met Asn His Lys Val Ala Phe Ser
1 5
ttt gcc gat ggc aag acc ctg ttc ttc ccg gtg ggc gcc cat gaa atc 3394
Phe Ala Asp Gly Lys Thr Leu Phe Phe Pro Val Gly Ala His Glu Ile
10 15 20
ctc ctg gac gcg gcc ctg cgc aac ggc atc aag atc ccg ctc gat tgc 3442
Leu Leu Asp Ala Ala Leu Arg Asn Gly Ile Lys Ile Pro Leu Asp Cys
25 30 35 40
cgc gaa ggc gtg tgc ggc acc tgc cag ggg cgc tgt gag tcc ggc gag 3490
Arg Glu Gly Val Cys Gly Thr Cys Gln Gly Arg Cys Glu Ser Gly Glu
45 50 55
tac acc cag gac tat gtc gat gag gaa gcc ctc tcc agc ctc gac ctg 3538
Tyr Thr Gln Asp Tyr Val Asp Glu Glu Ala Leu Ser Ser Leu Asp Leu
60 65 70
caa caa cgc aag atg ctc agt tgc caa acc cgg gtg aag tcc gac gcc 3586
Gln Gln Arg Lys Met Leu Ser Cys Gln Thr Arg Val Lys Ser Asp Ala
75 80 85
acg ttt tat ttc gac ttt gac tca agc ctg tgc aac gcc cca ggc ccc 3634
Thr Phe Tyr Phe Asp Phe Asp Ser Ser Leu Cys Asn Ala Pro Gly Pro
90 95 100
gtg cag gtg cgc ggc act gtg agc gcg gtg cag cag gta tcg acc agc 3682
Val Gln Val Arg Gly Thr Val Ser Ala Val Gln Gln Val Ser Thr Ser
105 110 115 120
acc gcc att ttg cag gtg caa ctg gac cag cct ctg gat ttt ttg ccg 3730
Thr Ala Ile Leu Gln Val Gln Leu Asp Gln Pro Leu Asp Phe Leu Pro
125 130 135
ggc caa tac gcg cgt ctg tcg gtg ccc ggc acc gat agc tgg cgc tcc 3778
Gly Gln Tyr Ala Arg Leu Ser Val Pro Gly Thr Asp Ser Trp Arg Ser
140 145 150
tac tcc ttc gcc aac cgg ccg ggt aat cag ttg cag ttc ctg gta cgc 3826
Tyr Ser Phe Ala Asn Arg Pro Gly Asn Gln Leu Gln Phe Leu Val Arg
155 160 165
ctg ctg ccc gac gga gtc atg agc aac tac ctg cgt gaa cgc tgc cag 3874
Leu Leu Pro Asp Gly Val Met Ser Asn Tyr Leu Arg Glu Arg Cys Gln
170 175 180
gtg ggt gat gaa atg ctg atg gag gcg ccc ttg ggt gcg ttt tat ctg 3922
Val Gly Asp Glu Met Leu Met Glu Ala Pro Leu Gly Ala Phe Tyr Leu
185 190 195 200
cgg cac gtc acc caa ccg ctg gta ctg gtg gcg ggc ggc acc ggg ttg 3970
Arg His Val Thr Gln Pro Leu Val Leu Val Ala Gly Glu Thr Gly Leu
205 210 215
tcg gcg ttg ttg ggc atg ctc gat gag ctg gtc gtc aac ggc tgc aca 4018
Ser Ala Leu Leu Gly Met Leu Asp Glu Leu Val Val Asn Glu Cys Thr
220 225 230
caa cct gtg cac ctg tac tac ggc gtg cgc ggc gcc gaa gac tta tgt 4066
Gln Pro Val His Leu Tyr Tyr Gly Val Arg Gly Ala Glu Asp Leu Cys
235 240 245
gaa gcg gca cgt atc cac gcc tac gcg acg aaa atc ccg aac ttt cgc 4114
Glu Ala Ala Arg Ile His Ala Tyr Ala Thr Lys Ile Pro Asn Phe Arg
250 255 260
tac acc gaa gtg ctg agc gac gcc tca gtc gag tgg acg ggc aaa cgc 4162
Tyr Thr Glu Val Leu Ser Asp Ala Ser Val Glu Trp Thr Gly Lys Arg
265 270 275 280
ggc tac ctg acc gaa cat ttt gac ctg gcc gaa ttg cgg gac aga tcg 4210
Gly Tyr Leu Thr Glu His Phe Asp Leu Ala Glu Leu Arg Asp Arg Ser
285 290 295
gcg gat atg tac gtg tgc ggc ccc cct cca atg gtc gaa tcc atc caa 4258
Ala Asp Met Tyr Val Cys Gly Pro Pro Pro Met Val Glu Ser Ile Gln
300 305 310
caa tgg ctg gcg gat cag aca ctt gat ggc gtt cag ttg tat tac gaa 4306
Gln Trp Leu Ala Asp Gln Thr Leu Asp Gly Val Gln Lys Tyr Tyr Glu
315 320 325
aag ttt acc cag agt aat atc tga 4330
Lys Phe Thr Gln Ser Asn Ile
330 335
<210>8
<211>993
<212>DNA
<213>荧光假单胞菌
<220>
<221>CDS
<222>1..990
<223>Coding sequence for AntR
<220>
<221>variation
<222>802..802
<223>突变to T802 from native G802;resulting in the codon突变GCG->TCGshown at 802..804,and the amino acid突变of Ala268 to Ser268
<220>
<221>misc_信号
<222>991..993
<223>Stop codon for the CDS of AntR
<400>8
atg act agt cag aca cgc gat att cat att caa cgc ttc gac ctg gaa 48
Met Thr Ser Gln Thr Arg Asp Ile His Ile Gln Arg Phe Asp Leu Glu
1 5 10 15
ggc gcg cgc agc tgg atg tcc ggc atc tgc ggg ccc cat cgc ctg gcg 96
Gly Ala Arg Ser Trp Met Ser Gly Ile Cys Gly Pro His Arg Leu Ala
20 25 30
acg gca acc ccc gag cgc ctg cgc ttt cac cac agc gcc aac gtg ttc 144
Thr Ala Thr Pro Glu Arg Leu Arg Phe His His Ser Ala Asn Val Phe
35 40 45
aaa tcc cgc gcc acc acc ctg ggc gtg atc gag tac ggc act gat gtg 192
Lys Ser Arg Ala Thr Thr Leu Gly Val Ile Glu Tyr Gly Thr Asp Val
50 55 60
acc atc gac atc gaa gac gcc gag cac ttc agc agc tac agc ttg atc 240
Thr Ile Asp Ile Glu Asp Ala Glu His Phe Ser Ser Tyr Ser Leu Ser
65 70 75 80
ctg cca ctg gtg ggc gag cag gag ctg agc aag aac ggt gaa cgt ctc 288
Leu Pro Leu Val Gly Glu Gln Glu Leu Ser Lys Asn Gly Glu Arg Leu
85 90 95
agt tcc aac cgc gac caa ggc gtg atc att tcg ccc aat gag cat cag 336
Ser Ser Asn Arg Asp Gln Gly Val Ile Ile Ser Pro Asn Glu His Gln
100 105 110
gtg ctg gcg att tcc ggt gac tgc cgc aag ttg cag gtg gta atc acc 384
Val Leu Ala Ile Ser Gly Asp Cys Arg Lys Leu Gln Val Val Ile Thr
115 120 125
tgc gcg gcg atg agc gag tcg ctg gaa ggt ttg ctg caa cgg ccc att 432
Arg Ala Ala Met Ser Glu Ser Leu Glu Gly Leu Leu Gln Arg Pro Ile
130 135 140
gat gcg ccg ctg cgc ttt gag tcg gtg atg gat gct gtg gac gga gca 480
Asp Ala Pro Leu Arg Phe Glu Ser Val Met Asp Ala Val Asp Gly Ala
145 150 155 160
ccg gct tcg tgg tgg cgc atg gcg cgt tat ttc atc gcc gaa ctg gag 527
Pro Ala Ser Trp Trp Arg Met Ala Arg Tyr Phe Ile Ala Glu Leu Glu
165 170 175
cgc agc agc gaa ctg tac gag cag gcg gcg ttt act cgc gac ctg gaa 576
Arg Ser Ser Glu Leu Tyr Glu Gln Ala Ala Phe Thr Arg Asp Leu Glu
180 185 190
agc tcg ctg atc aag ggc ctg atc ctg gcc caa ccg aat aac tac tcc 624
Ser Ser Leu Ile Lys Gly Leu Ile Leu Ala Gln Pro Asn Asn Tyr Ser
195 200 205
gaa gaa ctg cgc gac gtg ctg ggg gtg aaa ctg ccg cac tac ctg atc 672
Glu Glu Leu Arg Asp Val Leu Gly Val Lys Leu Pro His Tyr Leu Ile
210 215 220
cgc gcg cgg caa ttt atc cac gac aac gcc cgt gaa gcg ctg cac ctg 720
Arg Ala Arg Gln Phe Ile His Asp Asn Ala Arg Glu Ala Leu His Leu
225 230 235 240
gaa gac ctg gaa gcg gcg gcg ggc gtg tcg cgt ttc aaa ctg ttc gat 768
Glu Asp Leu Glu Ala Ala Ala Gly Val Ser Arg Phe Lys Leu Phe Asp
245 250 255
gcg ttt cgc aag tac ttc gca ctg tcg ccc atg tcg tat ttg aag aag 816
Ala Phe Arg Lys Tyr Phe Ala Leu Ser Pro Met Ser Tyr Leu Lys Lys
260 265 270
cat cgg ttg ggg gcg gtg cgc caa gaa att ctg gag cag ggc tcg atc 864
His Arg Leu Gly Ala Val Arg Gln Glu Ile Leu Glu Gln Gly Ser Ile
275 280 285
cgc acc tac tct gaa atc gcc ctg ggt tgg ggg ttt acg cat ttg ggg 912
Arg Thr Ile Ser Glu Ile Ala Leu Gly Trp Gly Phe Thr His Leu Gly
290 295 300
cgg ttt tcg gcg gag tac cgc aag ctg ttc gat gag tcg ccc agc cag 960
Arg Phe Ser Ala Glu Tyr Arg Lys Leu Phe Asp Glu Ser Pro Ser Gln
305 310 315 320
aca ttg cag cgc aag cgc ctg cgc att act tga 993
Thr Leu Gln Arg Lys Arg Leu Arg Ile Thr
325 330
<210>9
<211>330
<212>PRT
<213>荧光假单胞菌
<220>
<221>INIT_MET
<222>1..1
<223>Putative initiator methionine for AntR,giving Met1->Thr330 as theamino acid sequence of the putative Pant activator protein
<220>
<221>突变体
<222>268..268
<223>突变to Ser268 from Ala268
<400>9
Met Thr Ser Gln Thr Arg Asp Ile His Ile Gln Arg Phe Asp Leu Glu
1 5 10 15
Gly Ala Arg Ser Trp Met Ser Gly Ile Cys Gly Pro His Arg Leu Ala
20 25 30
Thr Ala Thr Pro Glu Arg Leu Arg Phe His His Ser Ala Asn Val Phe
35 40 45
Lys Ser Arg Ala Thr Thr Leu Gly Val Ile Glu Tyr Gly Thr Asp Val
50 55 60
Thr Ile Asp Ile Glu Asp Ala Glu His Phe Ser Ser Tyr Ser Leu Ser
65 70 75 80
Leu Pro Leu Val Gly Glu Gln Glu Leu Ser Lys Asn Gly Glu Arg Leu
85 90 95
Ser Ser Asn Arg Asp Gln Gly Val Ile Ile Ser Pro Asn Glu His Gln
100 105 110
Val Leu Ala Ile Ser Gly Asp Cys Arg Lys Leu Gln Val Val Ile Thr
115 120 125
Arg Ala Ala Met Ser Glu Ser Leu Glu Gly Leu Leu Gln Arg Pro Ile
130 135 140
Asp Ala Pro Leu Arg Phe Glu Ser Val Met Asp Ala Val Asp Gly Ala
145 150 155 160
Pro Ala Ser Trp Trp Arg Met Ala Arg Tyr Phe Ile Ala Glu Leu Glu
165 170 175
Arg Ser Ser Glu Leu Tyr Glu Gln Ala Ala Phe Thr Arg Asp Leu Glu
180 185 190
Ser Ser Leu Ile Lys Gly Leu Ile Leu Ala Gln Pro Asn Asn Tyr Ser
195 200 205
Glu Glu Leu Arg Asp Val Leu Gly Val Lys Leu Pro His Tyr Leu Ile
210 215 220
Arg Ala Arg Gln Phe Ile His Asp Asn Ala Arg Glu Ala Leu His Leu
225 230 235 240
Glu Asp Leu Glu Ala Ala Ala Gly Val Ser Arg Phe Lys Leu Phe Asp
245 250 255
Ala Phe Arg Lys Tyr Phe Ala Leu Ser Pro Met Ser Tyr Leu Lys Lys
260 265 270
His Arg Leu Gly Ala Val Arg Gln Glu Ile Leu Glu Gln Gly Ser Ile
275 280 285
Arg Thr Ile Ser Glu Ile Ala Leu Gly Trp Gly Phe Thr His Leu Gly
290 295 300
Arg Phe Ser Ala Glu Tyr Arg Lys Leu Phe Asp Glu Ser Pro Ser Gln
305 310 315 320
Thr Leu Gln Arg Lys Arg Leu Arg Ile Thr
325 330
<210>10
<211>463
<212>PRT
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..463
<223>AntA expression product,anthranilate dioxygenase large subunit
<400>10
Met Ser Gly Ala Arg Thr Val Glu Gln Trp Lys Ser Phe Ile Glu Ser
1 5 10 15
Cys Leu Asp Phe Arg Pro Ala Asp Glu Val Phe Arg Ile Ala Arg Asp
20 25 30
Met Phe Thr Glu Pro Glu Leu Phe Asp Leu Glu Met Glu Leu Ile Phe
35 40 45
Glu Lys Asn Trp Ile Tyr Ala Cys His Glu Ser Glu Leu Ala Asn Asn
50 55 60
His Asp Phe Val Thr Met Arg Ala Gly Arg Gln Pro Met Ile Ile Thr
65 70 75 80
Arg Asp Gly Glu Gly Arg Leu Asn Ala Leu Ile Asn Ala Cys Gln His
85 90 95
Arg Gly Thr Thr Leu Thr Arg Val Gly Lys Gly Asn Gln Ser Thr Phe
100 105 110
Thr Cys Pro Phe His Ala Trp Cys Tyr Lys Ser Asp Gly Arg Leu Val
115 120 125
Lys Val Lys Ala Pro Gly Glu Tyr Pro Glu Gly Phe Asp Lys Ala Thr
130 135 140
Arg Gly Leu Lys Lys Ala Arg Ile Glu Ser Tyr Arg Gly Phe Val Phe
145 150 155 160
Ile Ser Leu Asp Val Asn Gly Thr Asn Ser Leu Glu Asp Phe Leu Gly
165 170 175
Asp Ala Lys Val Phe Phe Asp Met Met Val Ala Gln Ser Ala Thr Gly
180 185 190
Glu Leu Glu Val Leu Pro Gly Lys Ser Ala Tyr Thr Tyr Asp Gly Asn
195 200 205
Trp Lys Leu Gln Asn Glu Asn Gly Leu Asp Gly Tyr His Val Ser Thr
210 215 220
Val His Tyr Asn Tyr Val Ala Thr Val Gln His Arg Glu Gln Val Asn
225 230 235 240
Thr Glu Asn Gly Ala Gly Ser Ser Thr Thr Leu Asp Tyr Ser Lys Leu
245 250 255
Gly Ala Gly Asp Ala Asn Thr Asp Asp Gly Trp Phe Ala Phe Asn Asn
260 265 270
Gly His Ser Val Leu Phe Ser Asp Met Pro Asn Pro Ser Val Arg Ser
275 280 285
Gly Tyr Ala Thr Ile Met Pro Arg Leu Val Glu Glu His Gly Gln Gln
290 295 300
Lys Ala Glu Trp Met Met His Arg Leu Arg Asn Leu Asn Ile Tyr Pro
305 310 315 320
Ser Leu Phe Phe Leu Asp Gln Ile Ser Ser Gln Leu Arg Ile Ile Arg
325 330 335
Pro Val Ala Trp Asn Lys Thr Glu Ile Ile Ser Gln Cys Leu Gly Val
340 345 350
Lys Gly Glu Ser Asp Ala Asp Arg Glu Asn Arg Ile Arg Gln Phe Glu
355 360 365
Asp Phe Phe Asn Val Ser Gly Met Gly Thr Pro Asp Asp Leu Val Glu
370 375 380
Phe Arg Glu Ala Gln Arg Gly Phe Gln Gly Arg Leu Glu Arg Trp Ser
385 390 395 400
Asp Ile Ser Arg Gly Ser His Arg Trp Glu Thr Gly Pro Trp Pro Asn
405 410 415
Ser Glu Ala Ile Gly Ile Gln Pro Ala Met Thr Gly Thr Glu Phe Thr
420 425 430
His Glu Gly Leu Tyr Val Asn Gln His Arg Asn Trp Gln Gln Phe Leu
435 440 445
Leu Lys Gly Leu Asp Gln Arg Ala Leu Ala Leu Arg Glu Val Lys
450 455 460
<210>11
<211>163
<212>PRT
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..163
<223>AntB expression product,anthranilate dioxygenase small subunit
<400>11
Met Asn Ala Gln Leu Gln Tyr Gln Ile Glu Gln Phe Phe Tyr Arg Lys
1 5 10 15
Ser Glu Leu Cys Asp Ala Gln Asp Trp Asp Ala Tyr Val Gln Leu Phe
20 25 30
Asp Pro Gln Ser Glu Phe His Leu Pro Gln Trp Asp Ser Glu His Val
35 40 45
Tyr Thr Gln Asp Pro Lys Arg Glu Met Ser Leu Ile Tyr Tyr Ala Asn
50 55 60
Arg Ser Gly Leu Glu Asp Arg Val Phe Arg Leu Arg Thr Glu Lys Ala
65 70 75 80
Ala Ser Ala Thr Pro Met Pro Arg Thr Leu His Leu Ile Asn Asn Val
85 90 95
Arg Ile Ala Glu Gln Ala Asp Gly Thr Leu Glu Val Arg Leu Asn Trp
100 105 110
His Thr Leu Phe Tyr Arg Leu Ala Thr Ser Glu Gln Phe Tyr Gly His
115 120 125
Ala Thr Tyr Arg Leu Lys Pro Ala Gly Asp Ser Trp Leu Ile Met Arg
130 135 140
Lys His Ala Leu Leu Leu Asn Asp Thr Ile Asn Ser Val Leu Asp Phe
145 150 155 160
Tyr His Leu
<210>12
<211>335
<212>PRT
<213>荧光假单胞菌
<220>
<221>misc_feature
<222>1..335
<223>AntC expression product,anthranilate dioxygenase reductase
<400>12
Met Asn His Lys Val Ala Phe Ser Phe Ala Asp Gly Lys Thr Leu Phe
1 5 10 15
Phe Pro Val Gly Ala His Glu Ile Leu Leu Asp Ala Ala Leu Arg Asn
20 25 30
Gly Ile Lys Ile Pro Leu Asp Cys Arg Glu Gly Val Cys Gly Thr Cys
35 40 45
Gln Gly Arg Cys Glu Ser Gly Glu Tyr Thr Gln Asp Tyr Val Asp Glu
50 55 60
Glu Ala Leu Ser Ser Leu Asp Leu Gln Gln Arg Lys Met Leu Ser Cys
65 70 75 80
Gln Thr Arg Val Lys Ser Asp Ala Thr Phe Tyr Phe Asp Phe Asp Ser
85 90 95
Ser Leu Cys Asn Ala Pro Gly Pro Val Gln Val Arg Gly Thr Val Ser
100 105 110
Ala Val Gln Gln Val Ser Thr Ser Thr Ala Ile Leu Gln Val Gln Leu
115 120 125
Asp Gln Pro Leu Asp Phe Leu Pro Gly Gln Tyr Ala Arg Leu Ser Val
130 135 140
Pro Gly Thr Asp Ser Trp Arg Ser Tyr Ser Phe Ala Asn Arg Pro Gly
145 150 155 160
Asn Gln Leu Gln Phe Leu Val Arg Leu Leu Pro Asp Gly Val Met Ser
165 170 175
Asn Tyr Leu Arg Glu Arg Cys Gln Val Gly Asp Glu Met Leu Met Glu
180 185 190
Ala Pro Leu Gly Ala Phe Tyr Leu Arg His Val Thr Gln Pro Leu Val
195 200 205
Leu Val Ala Gly Glu Thr Gly Leu Ser Ala Leu Leu Gly Met Leu Asp
210 215 220
Glu Leu Val Val Asn Glu Cys Thr Gln Pro Val His Leu Tyr Tyr Gly
225 230 235 240
Val Arg Gly Ala Glu Asp Leu Cys Glu Ala Ala Arg Ile His Ala Tyr
245 250 255
Ala Thr Lys Ile Pro Asn Phe Arg Tyr Thr Glu Val Leu Ser Asp Ala
260 265 270
Ser Val Glu Trp Thr Gly Lys Arg Gly Tyr Leu Thr Glu His Phe Asp
275 280 285
Leu Ala Glu Leu Arg Asp Arg Ser Ala Asp Met Tyr Val Cys Gly Pro
290 295 300
Pro Pro Met Val Glu Ser Ile Gln Gln Trp Leu Ala Asp Gln Thr Leu
305 310 315 320
Asp Gly Val Gln Lys Tyr Tyr Glu Lys Phe Thr Gln Ser Asn Ile
325 330 335
<210>13
<211>1544
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..1544
<223>Construct containing the pDOW1057 Pant-Pben tandem启动子
<220>
<221>misc_feature
<222>95..1395
<223>Portion containing Pant with activator CDS
<220>
<221>misc_信号
<222>92..94
<223>Anticodon of终止密码子for the CDS of AntR
<220>
<221>CDS
<222>95..1084
<223>Antisense strand of ORF encoding AntR
<220>
<221>variation
<222>283..283
<223>突变to A235 from native C235;resulting in anticodon突变CGC->CGA,thus codon突变GCG->TCG and amino acid突变of Ala268 to Ser268
<220>
<221>misc_信号
<222>1221..1327
<223>Approximate region estimated to contain the AntR binding site
<220>
<221>misc_feature
<222>1329..1509
<223>Pant-Pben tandem启动子construct
<220>
<221>启动子
<222>1329..1365
<223>Putative启动子(Pant)from anthranilate操纵子(antABC)
<220>
<221>-35_信号
<222>1329..1333
<223>Putative-35 region of Pant启动子
<220>
<221>-10_信号
<222>1355..1359
<223>Putative-10 region of Pant启动子
<220>
<221>misc_信号
<222>1371..1371
<223>Putative native transcription start site under control of Pant
<220>
<221>misc_feature
<222>1396..1429
<223>连接子
<220>
<221>misc_feature
<222>1430..1541
<223>含有Pben的部分
<220>
<221>misc_信号
<222>1430-1476
<223>估计含有BenR结合位点的大致区域
<220>
<221>启动子
<222>1477-1509
<223>Putative启动子(Pben)from苯甲酸盐 操纵子(benABCD)
<220>
<221>-35_信号
<222>1477-1482
<223>Putative-35 regionof Pben启动子
<220>
<221>-10_信号
<222>1498-1503
<223>Pben启动子的推定-10区域
<220>
<221>miso_feature
<222>1498-1503
<223>Substitution突变of Pben-10 region by tataat to form-10conmutants,and by taaggt to form-10benAc mutants
<220>
<221>misc_feature
<222>1508..1508
<223>在此处的突变体启动子突变体中发现的g1508s缺失
<220>
<221>misc_信号
<222>1509..1509
<223>推定的转录起始位点
<220>
<221>misc_信号
<222>1542..1544
<223>连接到Phen的推定天然反义引发物密码子
<400>13
agcttgcatg cctgcaggtt taaacagtcg actctagact taattaacta tcgcaggcaa 60
gccagctccc acagattgtt tttcatccag ttca agt aat gcg cag gcg ctt gcg 115
Thr Ile Arg Leu Arg Lys Arg
-330 -325
ctg caa tgt ctg gct ggg cga ctc atc gaa cag ctt gcg gta ctc cgc 163
Gln Leu Thr Gln Ser Pro Ser Glu Asp Phe Leu Lys Arg Tyr Glu Ala
-320 -315 -310
cga aaa ccg ccc caa atg cgt aaa ccc cca acc cag ggc gat ttc aga 211
Ser Phe Arg Gly Leu His Thr Phe Gly Trp Gly Leu Ala Ile Glu Ser
-305 -300 -295
gat ggt gcg gat cga gcc ctg ctc cag aat ttc ttg gcg cac cgc ccc 259
Ile Thr Arg Ile Ser Gly Gln Glu Leu Ile Glu Gln Arg Val Ala Gly
-290 -285 -280
caa ccg atg ctt ctt caa ata cga cat ggg cga cag tgc gaa gta ctt 307
Leu Arg His Lys Lys Leu Tyr Ser Met Pro Ser Leu Ala Phe Tyr Lys
-275 -270 -265 -260
gcg aaa cgc atc gaa cag ttt gaa acg cga cac gcc cgc cgc cgc ttc 355
Arg Phe Ala Asp Phe Leu Lys Phe Arg Ser Val Gly Ala Ala Ala Glu
-255 -250 -245
cag gtc ttc cag gtg cag cgc ttc acg ggc gtt gtc gtg gat aaa ttg 403
Leu Asp Glu Leu His Leu Ala Glu Arg Ala Asn Asp His Ile Phe Gln
-240 -235 -230
ccg cgc gcg gat cag gta gtg cgg cag ttt cac ccc cag cac gtc gcg 451
Arg Ala Arg Ile Leu Tyr His Pro Leu Lys Val Gly Leu Val Asp Arg
-225 -220 -215
cag ttc ttc gga gta gtt att cgg ttg ggc cag gat cag gcc ctt gat 499
Leu Glu Glu Ser Tyr Asn Asn Pro Gln Ala Leu Ile Leu Gly Lys Ile
-210 -205 -200
cag cga gct ttc cag gtc gcg agt aaa cgc cgc ctg ctc gta cag ttc 547
Leu Ser Ser Glu Leu Asp Arg Thr Phe Ala Ala Gln Glu Tyr Leu Glu
-195 -190 -185 -180
gct gct gcg ctc cag ttc ggc gat gaa ata acg cgc cat gcg cca cca 595
Ser Ser Arg Glu Leu Glu Ala Ile Phe Tyr Arg Ala Met Arg Trp Trp
-175 -170 -165
cga agc cgg tgc tcc gtc cac agc atc cat cac cga ctc aaa gcg cag 643
Ser Ala Pro Ala Gly Asp Val Ala Asp Met Val Ser Glu Phe Arg Leu
-160 -155 -150
cgg cgc atc aat ggg ccg ttg cag caa acc ttc cag cga ctc gct cat 691
Pro Ala Asp Ile Pro Arg Gln Leu Leu Gly Glu Leu Ser Glu Ser Met
-145 -140 -135
cgc cgc acg ggt gat tac cac ctg caa ctt gcg gca gtc acc gga aat 739
Ala Ala Arg Thr Ile Val Val Gln Leu Lys Arg Cys Asp Gly Ser Ile
-130 -125 -120
cgc cag cac ctg atg ctc att ggg cga aat gat cac gcc ttg gtc gcg 787
Ala Leu Val Gln His Glu Asn Pro Ser Ile Ile Val Gly Gln Asp Arg
-115 -110 -105 -100
gtt gga act gag acg ttc acc gtt ctt gct cag ctc ctg ctc gcc cac 835
Asn Ser Ser Leu Arg Glu Gly Asn Lys Ser Leu Glu Gln Glu Gly Val
-95 -90 -85
cag tgg cag gct caa gct gta gct gct gaa gtg ctc ggc gtc ttc gat 883
Leu Pro Leu Ser Leu Ser Tyr Ser Ser Phe His Glu Ala Asp Glu Ile
-80 -75 -70
gtc gat ggt cac atc agt gcc gta ctc gat cac gcc cag ggt ggt ggc 931
Asp Ile Thr Val Asp Thr Gly Tyr Glu Ile Val Gly Leu Thr Thr Ala
-65 -60 -55
gcg gga ttt gaa cac gtt ggc gct gtg gtg aaa gcg cag gcg ctc ggg 979
Arg Ser Lys Phe Val Asn Ala Ser His His Phe Arg Leu Arg Glu Pro
-50 -45 -40
ggt tgc cgt cgc cag gcg atg ggg ccc gca gat gcc gga cat cca gct 1027
Thr Ala Thr Ala Leu Arg His Pro Gly Cys Ile Gly Ser Met Trp Ser
-35 -30 -25 -20
gcg cgc gcc ttc cag gtc gaa gcg ttg aat atg aat atc gcg tgt ctg 1075
Arg Ala Gly Glu Leu Asp Phe Arg GLn Ile His Ile Asp Arg Thr GLn
-15 -10 -5
act agt cat cagggtgcac ccacggcggt taggcgtttg cgcgctctga 1124
Ser Thr Met
-1
cggcgcgtcg ttgaacctcg acagcaagtt ccaggccacg ccagtgcagt tctcactggg 1184
tggatagcaa cggtcgacta tgtggataaa ccccagagtt ttgcgaccat cgcccgccat 1244
cacagtagcg catgccgtca ccggcgcgca ccgtcatggg tatttgccgc ccaactttgc 1304
ggcctacgtt cccccattaa gcggatagcc cgccaccgca tcgcagccgc ttaatggctc 1364
accgtttagc catgatcaaa aggtgcctcc cggatcccca aacagtcgac tctagactta 1424
attaagttaa gcgacgtgcg cctggcggat agcgatgtgc aggcagcgga tattgacggg 1484
cagggcgagc acgtacggtg agggcgcctg atacaagaac aacggagggc ccgcccc 1541
atg 1544
Met
1
<210>14
<211>20
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..20
<223>用于串连启动子的可选择间-启动子连接子
<400>14
ggatccggcg cgcccccatc 20
<210>15
<211>18
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..18
<223>用于连接报告子基因的连接子启动子
<400>15
actagtagga ggtaactt 18
<210>16
<211>21
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..21
<223>敲除引物AntAKO5
<220>
<221>misc_feature
<222>2..7
<223>EcoRI识别位点
<400>16
ggaattcttc gtgacgatgc g 21
<210>17
<211>22
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..22
<223>敲除引物AntAKO3
<220>
<221>misc_feature
<222>3..8
<223>BamHI识别位点
<400>17
cgggatccgc tcgcgatgct gc 22
<210>18
<211>16
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..16
<223>标记引物lacZPE
<400>18
ggatgtgctg caaggc 16
<210>19
<211>17
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..17
<223>标记 引物lacZPE2
<400>19
gtaaccatgg tcatcgc 17
<210>20
<211>17
<212>DNA
<213>人工序列
<220>
<221>misc_ feature
<222>1..17
<223>M13正义引物
<400>20
gtaaaacgac ggccagt 17
<210>21
<211>16
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..16
<223>M13反义引物
<400>21
aacagctatg accatg 16
<210>22
<211>35
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..35
<223>寡核苷酸Bambenwtshort
<400>22
cgggatccgt atcaggcgcc tcaccgtacg tgctc 35
<210>23
<211>35
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..35
<223>寡核苷酸Bambenconshort
<400>23
cgggatccgt atcaggcgcc tcattatacg tgctc 35
<210>24
<211>35
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..35
<223>寡核苷酸BambenAcshort
<400>24
cgggatccgt atcaggcgcc tcaccttacg tgctc 35
<210>25
<211>35
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..35
<223>寡核苷酸Bamantwtshort
<400>25
cgggatccgc taacggtgag ccattaagcg gctgc 35
<210>26
<211>35
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..35
<223>寡核苷酸Bamantconshort
<400>26
cgggatccgc taacggtgag cattatagcg gctgc 35
<210>27
<211>20
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..20
<223>引物BenactKO-for
<400>27
cgcgacacat tgctgcccag 20
<210>28
<211>20
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..20
<223>引物BenactKO-rev
<400>28
agtatcagcc atcgcacctt 20
<210>29
<211>19
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..19
<223>引物1803H3seq
<400>29
gtcctgcaat ttcagccga 19
<210>30
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..26
<223>寡核苷酸BenL278
<400>30
ccttaattaa gttaagcgac gtgcgc 26
<210>31
<211>26
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..26
<223>寡核苷酸3′Antactiv
<400>31
cccaagcttc tatcgaggca agccag 26
<210>32
<211>32
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..32
<223>寡核苷酸Benact5′
<400>32
agctttgttt aaacgcatga cgttgttgat tc 32
<210>33
<211>31
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..31
<223>寡核苷酸H3_5′BenAKoclean
<400>33
cccaagcttg ccatgaggcg gaaaacgctg c 31
<210>34
<211>30
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..30
<223>寡核苷酸H3_3′BenBKoclean
<400>34
cccaagcttc ggtgatcgcc acgctgtcgc 30
<210>35
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..25
<223>寡核苷酸BenKOmega
<400>35
catacgtcat ggccctccgt tgttc 25
<210>36
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..25
<223>寡核苷酸InvbenKOmega
<400>36
gaacaacgga gggccatgac gtatg 25
<210>37
<211>24
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..24
<223>寡核苷酸5′BenA_seq
<400>37
ctgctggaaa acgcctgcct ggag 24
<210>38
<211>25
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..25
<223>寡核苷酸seq_3′BenB
<400>38
gagcacttca agcatcgaca ggaac 25
<210>39
<211>21
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..21
<223>引物1261-8378F
<400>39
cttcagatcc agactcacca g 21
<210>40
<211>21
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..21
<223>引物1261-103R
<400>40
gaccatgatt acgccaagcg c 21
<210>41
<211>21
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<222>1..21
<223>引物M13R21
<400>41
cacacaggaa acagctatga c 21
Claims (72)
1.一种分离的苯甲酸盐启动子核酸,包含荧光假单胞菌天然苯甲酸盐启动子的-35区,经一个15-20核苷酸连接子附着于该天然启动子的-10区上游。
2.根据权利要求1所述的苯甲酸盐启动子核酸,其中所述的启动子进一步包含苯甲酸盐启动子激活物蛋白结合位点。
3.根据权利要求1所述的苯甲酸盐启动子核酸,其中所述的启动子进一步包含紧接着附着在上游的,天然紧接着位于天然启动子上游的大约50个核苷酸部分的天然序列。
4.根据权利要求1所述的苯甲酸盐启动子核酸,其中所述的启动子包含SEQID NO:1的核苷酸1275-1280,经一个15-20个核苷酸的连接子附着于SEQ ID NO:1的核苷酸1296-1301的上游。
5.根据权利要求1所述的苯甲酸盐启动子核酸,其中所述的启动子包含SEQID NO:1的核苷酸1275-1301,和可选择的其中列举的至少一种突变。
6.根据权利要求1所述的苯甲酸盐启动子核酸,其中所述的启动子包含SEQID NO:1的核苷酸1275-1307,和可选择的其中列举的至少一种突变。
7.根据权利要求1所述的苯甲酸盐启动子核酸,其中所述的启动子包含SEQID NO:1的核苷酸1228-1301,和可选择的其中列举的至少一种突变。
8.根据权利要求1所述的苯甲酸盐启动子核酸,其中所述的启动子包含SEQID NO:1的核苷酸1228-1307,和可选择的其中列举的至少一种突变。
9.一种通过权利要求1-8任一项所述的苯甲酸盐启动子核酸的突变获得突变的启动子而形成了突变启动子核酸,其核苷酸序列与权利要求1-8中的任何一个启动子至少90%同源并是异种的。
10.根据权利要求1-9任一项所述的苯甲酸盐启动子核酸,进一步包含苯甲酸盐启动子激活物蛋白编码序列。
11.根据权利要求10所述的苯甲酸盐启动子核酸,其中所述的苯甲酸盐启动子激活物蛋白编码序列编码的苯甲酸盐启动子激活物蛋白具有与SEQ ID NO:2的残基1-335,含有Asn152的SEQ ID NO:2残基1-335,SEQ ID NO:2的残基21-335,和含有Asn152的SEQ ID NO:2残基21-335中的任何一种至少90%同源的氨基酸序列,和可选择的其中列举的至少一种突变。
12.一种分离的邻氨基苯甲酸盐启动子核酸,包含荧光假单胞菌天然邻氨基苯甲酸盐启动子的-35区,其经一个15-20核苷酸连接子附着于该天然启动子的-10区上游。
13.根据权利要求12所述的邻氨基苯甲酸盐启动子核酸,其中所述的启动子进一步包含邻氨基苯甲酸盐启动子激活物蛋白结合位点。
14.根据权利要求12所述的邻氨基苯甲酸盐启动子核酸,其中所述的启动子紧接着附着在上游进一步包含紧接着天然位于天然启动子上游的大约110个核苷酸部分的天然序列。
15.根据权利要求12所述的邻氨基苯甲酸盐启动子核酸,其中所述的启动子包含SEQ ID NO:7的核苷酸1239-1244和1264-1268,核苷酸1239-1244经一个15-20的核苷酸连接子附着在核苷酸1264-1268的上游,和可选择的其中列举的至少一种突变。
16.根据权利要求12所述的邻氨基苯甲酸盐启动子核酸,其中所述的启动子包含SEQ ID NO:7的核苷酸1239-1268,和可选择的其中列举的至少一种突变。
17.根据权利要求12所述的邻氨基苯甲酸盐启动子核酸,其中所述的启动子包含SEQ ID NO:7的核苷酸1239-1274,和可选择的其中列举的至少一种突变。
18.根据权利要求12所述的邻氨基苯甲酸盐启动子核酸,其中所述的启动子包含SEQ ID NO:7的核苷酸1130-1268,和可选择的其中列举的至少一种突变。
19.根据权利要求12所述的邻氨基苯甲酸盐启动子核酸,其中所述的启动子包含SEQ ID NO:7的核苷酸1130-1274,和可选择的其中列举的至少一种突变。
20.一种将权利要求12-19任一项所述的邻氨基苯甲酸盐启动子核酸突变以获得突变的启动子形成的突变的邻氨基苯甲酸盐启动子核酸,其核苷酸序列与权利要求12-19中的任何一个启动子至少90%同源并是异种的。
21.根据权利要求12-20任一项所述的邻氨基苯甲酸盐启动子核酸,进一步包含邻氨基苯甲酸盐启动子激活物蛋白编码序列。
22.根据权利要求21所述的邻氨基苯甲酸盐启动子核酸,其中所述的邻氨基苯甲酸盐启动子激活物蛋白编码序列编码的邻氨基苯甲酸盐启动子激活物蛋白具有的氨基酸序列与SEQ ID NO:9的残基1-330,和含有Ala268的SEQ ID NO:9的残基1-330中任何之一至少90%同源。
23.一种串联启动子,包含附着于天然代谢产物阻遏的启动子上游的非代谢产物阻遏启动子,其中后一个启动子的代谢产物阻遏被克服或显示不同的改良的启动子特性,或两者都有。
24.根据权利要求23所述的串联启动子,其中所述的非代谢产物阻遏启动子和所述的天然代谢产物阻遏启动子都可从假单胞菌和密切相关细菌中获得。
25.根据权利要求24所述的串联启动子,其中所述的非代谢产物阻遏启动子和所述的天然代谢产物阻遏启动子都可从假单胞菌属获得。
26.根据权利要求24所述的串联启动子,其中所述的非代谢产物阻遏启动子和所述的天然代谢产物阻遏启动子都可从相同的种属中获得。
27.根据权利要求25所述的串联启动子,其中所述的非代谢产物阻遏启动子和所述的天然代谢产物阻遏启动子都可从相同的种属中获得。
28.根据权利要求27所述的串联启动子,其中所述的非代谢产物阻遏启动子和所述的天然代谢产物阻遏启动子都可从荧光假单胞菌中获得。
29.根据权利要求23-28任一项所述的串联启动子,其中所述的非代谢产物阻遏启动子和所述的天然代谢产物阻遏启动子都可从编码可选择碳源利用酶或通路的基因或操纵子中获得。
30.根据权利要求23-28任一项所述的串联启动子,其中所述的非代谢产物阻遏启动子从编码邻氨基苯甲酸盐降解通路的操纵子中获得,所述的天然代谢产物阻遏启动子从编码苯甲酸盐降解通路的操纵子中获得。
31.根据权利要求23-28任一项所述的串联启动子,其中所述的非代谢产物阻遏启动子紧接着附着于所述的天然代谢产物阻遏启动子的上游。
32.根据权利要求23-28任一项所述的串联启动子,其中所述的非代谢产物阻遏启动子经一个多核苷酸连接子附着在所述天然代谢产物阻遏启动子的上游。
33.根据权利要求32所述的串联启动子,其中所述的多核苷酸连接子具有SEQ ID NO:13的核苷酸序列g1396-a1429。
34.根据权利要求28所述的串联启动子,其中所述的非代谢产物阻遏启动子是一种邻氨基苯甲酸盐启动子,选自SEQ ID NO:13的核苷酸1221-1359,1221-1371,1328-1359,和1328-1371,以及可选择的其中列举的至少一种突变,所述的代谢产物阻遏启动子是一种苯甲酸盐启动子序列,选自SEQ ID NO:13的核苷酸1430-1503,1430-1509,1477-1503,和1477-1509,和可选择的其中列举的至少一种突变。
35.根据权利要求23所述的串联启动子,其中所述的启动子进一步包含,苯甲酸盐“-35至-10区”苯甲酸盐激活物蛋白结合位点的上游和近端,和邻氨基苯甲酸盐“-35至-10区”邻氨基苯甲酸盐激活物蛋白结合位点的上游和近端。
36.根据权利要求34所述的串联启动子,其中所述的串联启动子包含SEQ IDNO:13的核苷酸1329-1503,和可选择的其中列举的至少一种突变。
37.根据权利要求34所述的串联启动子,其中所述的串联启动子包含SEQ IDNO:13的核苷酸1329-1509,和可选择的其中列举的至少一种突变。
38.根据权利要求34所述的串联启动子,其中所述的串联启动子包含SEQ IDNO:13的核苷酸1121-1503,和可选择的其中列举的至少一种突变。
39.根据权利要求34所述的串联启动子,其中所述的串联启动子包含SEQ IDNO:13的核苷酸1121-1509,和可选择的其中列举的至少一种突变。
40.根据权利要求34所述的串联启动子,其中所述的串联启动子包含SEQ IDNO:13的核苷酸1329-1541,可选择的其中列举的至少一种突变。
41.根据权利要求34所述的串联启动子,其中所述的串联启动子包含SEQ IDNO:13的核苷酸1121-1541,和可选择的其中列举的至少一种突变。
42.一种改变的启动子,通过以下的步骤制备:
(A)获得至少一种多核苷酸,其具有的碱基序列与下列任何一种的碱基序列至少90%同源,并是异种的:
(1)权利要求1、12、23或30中的一种启动子;
(2)至少SEQ ID NO:1的碱基1275-1307;
(3)至少SEQ ID NO:7的碱基1239-1274;或
(4)至少SEQ ID NO:13的碱基1329-1509;
(B)筛选所述多核苷酸,当在表达构建物中可操作连接于转录产物编码多核苷酸时,引导其在原核生物细胞中转录的能力,和可选择的至少一种启动子特性;和
(C)根据所述筛选的结果,鉴定至少一种多核苷酸,当在表达构建物中可操作连接于转录产物编码多核苷酸时,它具有在原核宿主细胞中介导其转录的能力,并可选择的具有相对步骤(A)(1)-(A)(4)的启动子被改良的至少一种启动子特性。
43.一种改良的启动子,通过以下的步骤制备:
(A)提供
(1)一种启动子多核苷酸
(a)具有下列任何一种的碱基序列
(i)权利要求1、12、23或30中的启动子;
(ii)至少SEQ ID NO:1的碱基1275-1307;
(iii)至少SEQ ID NO:7的碱基1239-1274;或
(iv)至少SEQ ID NO:13的碱基1329-1509;和
(b)当可操作连接于转录产物编码多核苷酸时,具有介导其在原核宿主细胞中转录的能力,或
(2)代表所述启动子多核苷酸碱基序列的信息字符串;
(B)通过以下获得至少一种序列改变的多核苷酸
(1)对所述启动子多核苷酸执行至少一种诱变技术或至少一种重组技术或两种技术以产生至少一种序列改变的多核苷酸,或
(2)修饰所述的信息字符串以产生至少一种修饰的字符串,其与所述的信息字符串至少90%相同,并代表至少一条被改变的序列,和
(a)合成具有所述的改变序列的至少一种序列改变的多核苷酸,或
(b)通过以下应用所述的修饰字符串
(i)搜索至少一个序列记录中至少一种与所述被修饰字符串相同的相同字符串,所述的序列记录对应于至少一种多核苷酸源,
(ii)鉴定至少一种所述相同字符串的至少一次出现,和
(iii)选择被鉴定出现所述的相同字符串对应的多核苷酸源,因此获得至少一种序列改变的多核苷酸,或
(3)通过以下应用所述的信息字符串
(a)搜索至少一个序列记录中至少一种异种的字符串,它与所述的的信息字符串或其互补体至少90%相同,所述的异种字符串代表至少一种改变的序列,所述的序列记录对应于至少一种多核苷酸源,
(b)鉴定至少出现一次的至少一种所述的异种字符串,和
(c)选择被鉴定出现所述的异种字符串所对应的多核苷酸源,因此获得至少一种序列改变的多核苷酸,或
(4)使用所述启动子多核苷酸作为探针,通过将所述探针与至少一种异种待测多核苷酸在严格性条件下结合,该条件可使所述探针与在与所述探针的互补体至少90%相同的所述待测多核苷酸内的靶序列杂交,并选择所述探针杂交的待测多核苷酸,因此获得了至少一种序列改变的多核苷酸;
(C)筛选至少一种序列改变的多核苷酸中至少一种启动子特性,当在表达构建物中可操作附着在转录产物编码多核苷酸上时,介导其在原核宿主生物中转录的能力;和
(D)根据所述筛选的结果,鉴定至少一种序列改变的多核苷酸
(1)具有相对步骤(A)(1)的启动子多核苷酸被改良的至少一种启动子特性,和
(2)当可操作地附着于转录产物编码多核苷酸时,具有介导其在原核宿主细胞中转录的能力,因此获得一种改良的启动子。
44.一种应用权利要求43所述的改良启动子的方法,其所述的方法包含可操作地将所述改良启动子附着于转录产物编码多核苷酸以形成表达基因盒的步骤。
45.根据权利要求44所述的方法,其所述的方法进一步包含将所述表达基因盒包含进载体中的步骤。
46.根据权利要求45所述的方法,其所述的方法进一步包括用所述载体转化能够从所述表达基因盒影响表达的宿主细胞的步骤。
47.根据权利要求46所述的方法,其所述的方法进一步包含产生由所述表达基因盒通过在可诱导改良启动子的生长条件下保存所述的宿主细胞编码的表达产物的步骤。
48.根据权利要求43中的改良启动子,其中所述的在步骤(B)(4)中应用所述的启动子多核苷酸作为探针包括获得一种含有所述启动子多核苷酸碱基序列的多核苷酸或多核苷酸类似物分子,该启动子核苷酸的长度为至少10个碱基,并标记所述分子,因此提供所述的探针。
49.根据权利要求43中的改良启动子,其中所述的在步骤(B)(4)中应用所述的启动子多核苷酸作为探针包括获得一种含有所述启动子多核苷酸碱基序列的多核苷酸分子,该启动子多核苷酸的长度为至少10个碱基,并可选择地标记所述分子,因此提供所述的探针,并在探针与靶序列的所述杂交后,导致核酸的聚合,所述的探针在其中作为引物发挥作用。
50.一种分离的核酸分子,包含在严格杂交和冲洗条件下与核碱基聚合物分子杂交的核酸序列、全长互补体,上述的核碱基聚合物分子具有下列任何之一的碱基序列:
(A)权利要求1、12、23或30中的启动子;
(B)至少SEQ ID NO:1的碱基1275-1307;
(C)至少SEQ ID NO:7的碱基1239-1274 of SEQ ID NO:7;或
(D)至少SEQ ID NO:13的碱基1329-1509;和
其中所述的分离的核酸分子在原核细胞中可作为启动子发挥作用。
51.一种分离的核碱基聚合物分子,具有在原核细胞中可作为启动子作用的多核苷酸分子的碱基序列,其中所述的核碱基聚合物含有与下列任何之一的碱基序列至少90%相同的碱基序列:
(A)权利要求1、12、23或30中的启动子;
(B)至少SEQ ID NO:1的碱基1275-1307;
(C)至少SEQ ID NO:7的碱基1239-1274;或
(D)至少SEQ ID NO:13的碱基1329-1509。
52.一种在原核细胞中可作为表达构建物起作用的重组核酸分子,所述分子中包含的启动子含有与下列任何之一的碱基序列至少90%相同的碱基序列:
(A)权利要求1、12、23或30中的启动子;
(B)至少SEQ ID NO:1的碱基1275-1307;
(C)至少SEQ ID NO:7的碱基1239-1274;或
(D)至少SEQ ID NO:13的碱基1329-1509。
53.根据权利要求52中的重组表达构建物,其中所述的表达构建物包含mRNA编码序列。
54.根据权利要求52中的重组表达构建物,其中所述的表达构建物是载体。
55.根据权利要求54中的重组表达构建物,其中所述的载体是质粒,转座子或人工染色体。
56.一种遗传工程改造的原核宿主细胞,含有权利要求53-55中任何一项的重组表达构建物。
57.一种表达系统,含有根据权利要求56中的遗传工程改造的原核宿主细胞。
58.根据权利要求56中的遗传工程改造的原核宿主细胞,其中所述的宿主细胞进一步包含编码所述重组表达构建物启动子的相关激活物蛋白的基因的至少一个拷贝,优选一个以上的拷贝。
59.根据权利要求57中的表达系统,其中所述的遗传工程改造的原核宿主细胞进一步包含编码所述重组表达构建物启动子的相关激活物蛋白的基因的至少一个拷贝,优选一个以上的拷贝。
60.一种制备转录产物的方法,包括培养权利要求58的遗传工程改造的原核宿主细胞生长,诱导其中的重组表达构建物,因此表达由重组表达产物编码的转录产物。
61.一种制备多肽的方法,包括通过权利要求60的方法表达mRNA转录产物,并进一步使所述的原核宿主细胞将所述的mRNA翻译成被编码的多肽。
62.根据权利要求61的方法制备的多肽。
63.通过以下方法产生的串联启动子,包括
(A)提供
(1)非代谢产物阻遏的原核启动子多核苷酸,和
(2)代谢产物阻遏的原核启动子多核苷酸;和
(B)将所述的非代谢产物阻遏启动子共价附着于所述代谢产物阻遏启动子的上游。
64.根据权利要求63所述的串联启动子,其中所述的多核苷酸启动子间连接子可将所述的非代谢产物阻遏启动子共价附着于所述的代谢产物阻遏启动子的上游。
65.根据权利要求64所述的串联启动子,其中所述的多核苷酸启动子间连接子的长度为大约或小于100个核苷酸。
66.一种分离的转录激活物蛋白,具有SEQ ID NO:2残基1-335,或含有Asn152的SEQ ID NO:2残基1-335的氨基酸序列。
67.一种分离的转录激活物蛋白,具有SEQ ID NO:2残基21-335,或含有Asn152的SEQ ID NO:2残基21-335的氨基酸序列。
68.一种分离的转录激活物蛋白,具有SEQ ID NO:9残基1-330,或含有Ala268的SEQ ID NO:9残基1-330的氨基酸序列。
69.一种分离的转录激活物蛋白,具有与权利要求66-69中任何之一的转录激活物蛋白至少90%相同,并是异种的氨基酸序列。
70.一种分离的多核苷酸,含有的碱基序列编码根据权利要求66-69任何之一的转录激活物蛋白。
71.一种分离的多核苷酸,含有的碱基序列编码根据权利要求70的转录激活物蛋白。
72.根据权利要求59的表达系统,其中所述的激活物蛋白和所述的启动子是下列任一种:
(A)所述的激活物蛋白是一种苯甲酸盐启动子激活物蛋白,具有下列任何之一的氨基酸序列:
(1)SEQ ID NO:2的残基1-335,
(2)含有Asn152的SEQ ID NO:2残基1-335,
(3)SEQ ID NO:2的残基21-335,和
(4)含有Asn152的SEQ ID NO:2残基21-335,和所述的启动子是苯甲酸盐诱导性启动子;或
(C)所述的激活物蛋白是邻氨基苯甲酸盐启动子激活物蛋白,具有下列任何之一的氨基酸序列:
(1)SEQ ID NO:9的残基1-330,和
(2)含有Ala268的SEQ ID NO:9残基1-330,和所述的启动子是邻氨基苯甲酸盐诱导性启动子。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US39342202P | 2002-07-03 | 2002-07-03 | |
US60/393,422 | 2002-07-03 | ||
PCT/US2003/020840 WO2004005221A2 (en) | 2002-07-03 | 2003-07-03 | Benzoate- and anthranilate-inducible promoters |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1678624A true CN1678624A (zh) | 2005-10-05 |
CN1678624B CN1678624B (zh) | 2011-10-26 |
Family
ID=30115575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN038206595A Expired - Fee Related CN1678624B (zh) | 2002-07-03 | 2003-07-03 | 苯甲酸盐-和邻氨基苯甲酸盐-诱导的启动子 |
Country Status (9)
Country | Link |
---|---|
US (1) | US7794972B2 (zh) |
EP (1) | EP1539794B1 (zh) |
JP (1) | JP2006506049A (zh) |
CN (1) | CN1678624B (zh) |
AT (1) | ATE419265T1 (zh) |
AU (1) | AU2003256365B2 (zh) |
CA (1) | CA2491056A1 (zh) |
DE (1) | DE60325611D1 (zh) |
WO (1) | WO2004005221A2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109486847A (zh) * | 2018-12-17 | 2019-03-19 | 江南大学 | 基于人工串联启动子的枯草芽孢杆菌高效诱导表达系统 |
CN111748510A (zh) * | 2012-08-05 | 2020-10-09 | Absci有限责任公司 | 可诱导共表达系统 |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9453251B2 (en) | 2002-10-08 | 2016-09-27 | Pfenex Inc. | Expression of mammalian proteins in Pseudomonas fluorescens |
AU2004317306B2 (en) | 2003-11-21 | 2010-09-02 | Pelican Technology Holdings, Inc. | Improved expression systems with Sec-system secretion |
KR101183720B1 (ko) | 2004-01-16 | 2012-09-17 | 다우 글로벌 테크놀로지스 엘엘씨 | 슈도모나스 플루오레센스에서의 포유류 단백질의 발현 |
EP1720990A4 (en) | 2004-02-27 | 2008-04-30 | Dow Global Technologies Inc | HIGHLY EFFICIENT PEPTIDE PRODUCTION IN PLANT CELLS |
JP2008507294A (ja) | 2004-07-26 | 2008-03-13 | ダウ グローバル テクノロジーズ インコーポレイティド | 菌株遺伝子操作による改善されたタンパク質発現のための方法 |
WO2006121165A1 (ja) | 2005-05-12 | 2006-11-16 | Ajinomoto Co., Inc. | タンパク質の製造法 |
EP2108047B1 (en) | 2007-01-31 | 2012-10-24 | Pfenex Inc. | Bacterial leader sequences for increased expression |
EP2142651B1 (en) | 2007-04-27 | 2013-05-22 | Pfenex Inc. | Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins |
US9580719B2 (en) | 2007-04-27 | 2017-02-28 | Pfenex, Inc. | Method for rapidly screening microbial hosts to identify certain strains with improved yield and/or quality in the expression of heterologous proteins |
EP2185716B1 (en) * | 2007-08-08 | 2013-01-16 | Wayne M. Barnes | Improved t7 expression system |
US8318481B2 (en) | 2007-12-07 | 2012-11-27 | Pfenex Inc. | High copy number self-replicating plasmids in pseudomonas |
DE102008052529A1 (de) * | 2008-10-21 | 2010-04-22 | Henkel Ag & Co. Kgaa | Expressionsverstärkte Nukleinsäuren |
WO2010132341A2 (en) | 2009-05-11 | 2010-11-18 | Pfenex, Inc. | Production of recombinant proteins utilizing non-antibiotic selection methods and the incorporation of non-natural amino acids therein |
EP2851421B1 (en) | 2012-07-03 | 2018-11-28 | Kao Corporation | Useful microorganism, and method for producing substance of interest |
CA2950304A1 (en) * | 2014-06-18 | 2015-12-23 | Calysta, Inc. | Nucleic acids and vectors for use with methanotrophic bacteria |
MX2017006866A (es) | 2014-12-01 | 2017-11-15 | Pfenex Inc | Pares de unión para producción de péptidos. |
US11566250B2 (en) | 2017-10-26 | 2023-01-31 | Noroo Ic Co., Ltd. | Production and separation of 3-hydroxypropionic acid |
KR20200072543A (ko) * | 2017-10-26 | 2020-06-22 | 노루 아이씨 코포레이션 엘티디 | 3-히드록시프로피온산의 생산 및 분리 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6415739A (en) | 1987-07-09 | 1989-01-19 | Konishiroku Photo Ind | Processing of silver halide color photographic sensitive material |
US5593860A (en) * | 1987-08-14 | 1997-01-14 | Bio-Technology General Corp. | Expression plasmids containing the deo promoter, and bacterial hosts containing the plasmids |
JPH0284195A (ja) | 1988-05-31 | 1990-03-26 | Mitsubishi Kasei Corp | 天然型ヒトアポリポプロテインe様蛋白質の産生方法 |
DE68917379T2 (de) | 1988-05-31 | 1994-12-01 | Mitsubishi Chem Ind | Verfahren zur Herstellung von Proteinen, die ähnlich dem natürlich-menschlichen Apolipoprotein-E sind. |
JP2001503274A (ja) * | 1996-11-08 | 2001-03-13 | サイテル コーポレイション | 改良された発現ベクター |
US5955310A (en) | 1998-02-26 | 1999-09-21 | Novo Nordisk Biotech, Inc. | Methods for producing a polypeptide in a bacillus cell |
-
2003
- 2003-07-03 DE DE60325611T patent/DE60325611D1/de not_active Expired - Lifetime
- 2003-07-03 CN CN038206595A patent/CN1678624B/zh not_active Expired - Fee Related
- 2003-07-03 JP JP2004519773A patent/JP2006506049A/ja active Pending
- 2003-07-03 AU AU2003256365A patent/AU2003256365B2/en not_active Ceased
- 2003-07-03 CA CA002491056A patent/CA2491056A1/en not_active Abandoned
- 2003-07-03 WO PCT/US2003/020840 patent/WO2004005221A2/en active Application Filing
- 2003-07-03 EP EP03763112A patent/EP1539794B1/en not_active Expired - Lifetime
- 2003-07-03 AT AT03763112T patent/ATE419265T1/de not_active IP Right Cessation
-
2005
- 2005-01-03 US US11/028,156 patent/US7794972B2/en not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111748510A (zh) * | 2012-08-05 | 2020-10-09 | Absci有限责任公司 | 可诱导共表达系统 |
CN111748510B (zh) * | 2012-08-05 | 2023-08-15 | 艾伯赛公司 | 可诱导共表达系统 |
CN109486847A (zh) * | 2018-12-17 | 2019-03-19 | 江南大学 | 基于人工串联启动子的枯草芽孢杆菌高效诱导表达系统 |
Also Published As
Publication number | Publication date |
---|---|
ATE419265T1 (de) | 2009-01-15 |
WO2004005221A3 (en) | 2004-12-02 |
AU2003256365B2 (en) | 2010-02-18 |
AU2003256365A1 (en) | 2004-01-23 |
US7794972B2 (en) | 2010-09-14 |
EP1539794A2 (en) | 2005-06-15 |
CA2491056A1 (en) | 2004-01-15 |
WO2004005221A2 (en) | 2004-01-15 |
EP1539794A4 (en) | 2005-12-28 |
EP1539794B1 (en) | 2008-12-31 |
JP2006506049A (ja) | 2006-02-23 |
DE60325611D1 (de) | 2009-02-12 |
CN1678624B (zh) | 2011-10-26 |
US20050202544A1 (en) | 2005-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1678624A (zh) | 苯甲酸盐-和邻氨基苯甲酸盐-诱导的启动子 | |
CN1170938C (zh) | 构建产生氨基酸的细菌的方法及通过发酵该经构建的产生氨基酸的细菌以制备氨基酸的方法 | |
CN1240833C (zh) | 新型腈水合酶 | |
CN1993377A (zh) | 丙氨酸2,3氨基变位酶 | |
CN1766111A (zh) | 编码参与内环境稳定和适应的蛋白质的谷氨酸棒杆菌基因 | |
CN1906294A (zh) | 改良的蛋白表达系统 | |
CN1010414B (zh) | 能表达脱辅基水母发光蛋白的重组dna载体 | |
CN102858981B (zh) | 重组crm197的高水平表达 | |
Nærdal et al. | Analysis and manipulation of aspartate pathway genes for L-lysine overproduction from methanol by Bacillus methanolicus | |
CN1898259A (zh) | 用于编码精细化学品的代谢途径的蛋白质的基因变体 | |
JP6577666B2 (ja) | 新規なカンジダ・インファンティコーラ菌株、その変異菌株及び形質転換菌株、及びそれを用いてジオイック酸類を生産する方法 | |
CN1578834A (zh) | 编码代谢途径蛋白的基因 | |
CN88101644A (zh) | 编码脱乙酸基头孢菌素c合成酶和脱乙酰头孢菌素c合成酶的重组dna表达载体及dna化合物 | |
CN1596267A (zh) | 来自谷氨酸棒状杆菌的编码调节蛋白的基因 | |
CN1582300A (zh) | 编码新蛋白的基因 | |
CN1314941A (zh) | 丙酸杆菌载体 | |
CN1250726C (zh) | 耐热性核糖核酸酶h | |
CN1582299A (zh) | 编码与遗传稳定性、基因表达和折叠相关的蛋白质的基因 | |
CN101052707A (zh) | 生产l-氨基酸的方法 | |
CN1131889C (zh) | 质粒 | |
CN1756835A (zh) | 用作选择标记的转位酶 | |
CN1761742A (zh) | 内酯酶的制造方法及其应用 | |
CN1325444A (zh) | 经过特异性灭活丁子香酚和阿魏酸分解代谢的基因构建制备取代酚的生产菌株 | |
CN1816623A (zh) | 新型微生物、麦芽糖磷酸化酶和海藻糖磷酸化酶及其制造方法 | |
CN1636051A (zh) | 编码碳代谢和能量产生的蛋白质的基因 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20111026 Termination date: 20120703 |