CN110291192B

CN110291192B - 在可滴定氨基酸具有修饰的赖氨酸脱羧酶

Info

Publication number: CN110291192B
Application number: CN201680091428.9A
Authority: CN
Inventors: 周豪宏; 陈玲; 陆文强; 刘修才
Original assignee: Cathay R&D Center Co Ltd; CIBT America Inc
Current assignee: Cathay R&D Center Co Ltd; CIBT America Inc
Priority date: 2016-12-30
Filing date: 2016-12-30
Publication date: 2023-12-08
Anticipated expiration: 2036-12-30
Also published as: US20190330614A1; CN110291192A; WO2018120025A1; EP3562938A4; US11078473B2; EP3562938A1

Abstract

本发明提供了与野生型赖氨酸脱羧酶相比，具有在碱性pH下增加活性的突变的CadA多肽。本发明还提供产生这种突变多肽的方法，经遗传修饰以过表达所述突变多肽的微生物，以及产生这种微生物的方法。

Description

在可滴定氨基酸具有修饰的赖氨酸脱羧酶

发明背景

大多数酶由于其是两性分子而在较窄的pH范围内最佳地起作用。周围环境的pH直接影响构成酶的氨基酸的酸性和碱性基团上的电荷。这些电荷的变化影响酶的净电荷、活性位点的pKa及酶表面的电荷分布。结果，pH的变化会影响酶的活性、溶解性和稳定性。

被称为酸脱羧酶的蛋白质类别是催化碱性氨基酸(例如赖氨酸，精氨酸，鸟氨酸)的脱羧酶反应以产生多胺作为在许多微生物中酸应激反应的一部分的一组酶。大肠杆菌(Escherichia coli)具有一些PLP依赖性酸脱羧酶：CadA，LdcC，AdiA，SpeA，SpeC，SpeF，GadA和GadB。所有这些酶在窄pH范围内起作用，且酶活性在该pH范围之外明显降低(Kanjeeet al.,Biochemistry 50,9388-9398,2011)。先前已经观察到这些PLP依赖性脱羧酶二聚化形成完整活性位点。在某些情况下，如CadA，二聚体形成十聚体，聚集成为最佳功能所需的较高分子量蛋白质复合物。抑制较高分子量的蛋白质复合物形成(例如在最佳pH之外的条件下)导致功能的明显降低(Kanjee et al.,The EMBO Journal 30,931-944,2011)。

蛋白质中各个氨基酸的pKa值对于确定其生物分子功能是重要的，因为蛋白质-水溶液中的主要反应之一是某些氨基酸与蛋白质环境的质子交换。pKa是在中性和荷电状态之间自由能差异的量度，及表示氨基酸提供或接受质子的倾向。某些氨基酸具有可滴定基团，使其更容易接受和提供质子。这些氨基酸包括天冬氨酸、谷氨酸、半胱氨酸、丝氨酸、酪氨酸、苏氨酸、组氨酸、赖氨酸和精氨酸。一些氨基酸的样品pKa值为：天冬氨酸为4.0，谷氨酸为4.4，半胱氨酸为8.7，酪氨酸为9.6，组氨酸为6.3，赖氨酸为10.4，精氨酸为13.0(Nielsen JE&Vriend G,Proteins 43,403-412,2001)。根据文献资源不同，这些pKa值可以变化0.5。

可滴定基团是否接受或提供质子取决于其环境，例如pH或其附近的其它氨基酸。例如，当pH小于可滴定基团的pKa时，该基团更可能接受质子。相反，当pH大于可滴定基团的pKa时，该基团更可能提供质子。当一组可滴定的氨基酸接受或提供质子时，取决于质子交换发生前的电荷，氨基酸可以带正电荷、负电荷或中性的。当两基团彼此接近时，带电基团可以与其它带电基团相互作用。相同电荷相互排斥，相反电荷相互吸引。质子化的中性电荷基团通过氢键相互作用仍可与其它基团相互作用。

了解蛋白质可滴定基团的pKa值不仅对于理解pH如何影响多肽折叠和酶活性是重要的，而且对蛋白质-蛋白质相互作用也很重要(Jensen JE,Curr Pharm Biotechnol 9,96-102,2008)，特别是在酸脱羧酶的情况下，其四级结构由于环境pH的变化而发生显著变化。酸脱羧酶对碱性pH的耐受性是重要的，因为其作为产物产生的多胺提高反应环境的pH。因此，酸脱羧酶的活性通常随着产生更多的多胺而降低，当反应环境的pH超过野生型酸脱羧酶所耐受的pH范围时，这可导致脱羧反应过早地停止。很少有研究评估具有可滴定基团的各种氨基酸突变对酸脱羧酶功能的影响。

基于先前文献(Kanjee,et al.The EMBO Journal 30,931-944,2011)，当环境pH改变时，CadA从由十聚体和高级寡聚物组成的状态转变为主要由二聚体组成的状态。十聚体的形成是形成高级寡聚物的先决条件。已经表明，CadA在pH5.0-5.5条件下最佳地起作用(Lemonnier M&Lane D,Microbiology 144,751-760,1998)。在这种酸性pH，Kanjee等使用EM表明CadA主要以高级寡聚物存在。当pH增加到6.0以上或当存在抑制剂ppGpp时，不形成高级寡聚物，且脱羧酶功能显著降低。然而，还没有关于描述CadA高级寡聚物如何形成以及在其形成中起作用的氨基酸残基的文献。

发明概述

本发明部分基于突变的发现，所述突变提供稳定四元结构形成所需的化学相互作用的能力，以及增加的稳定性以允许突变蛋白在更宽的pH范围起作用。在更宽的pH范围起作用的能力对于保持高反应速率而不需要添加额外的化学物以维持pH值是重要的。在宽pH范围维持高反应速率可以使赖氨酸更快地转变为尸胺及减少所需的设备量。蛋白质对碱性pH的耐受性不再需要添加额外的化学物以维持pH值的需要。用于维持pH的这些化学物通常形成盐，例如(SO4^2-或Cl^-)，其进入废水中或必须使用另外的纯化步骤从生产过程中除去。因此，在比野生型更宽的pH范围内起作用的突变酸脱羧酶通过减少在该过程中形成的盐的量而降低整个过程的成本和环境中留下的痕迹。氨基酸组氨酸的pKa为6.3，这是酸脱羧酶蛋白CadA在不同寡聚状态之间转换的pH。寡聚状态的改变也改变了蛋白质的活性。CadA蛋白中至少一个组氨酸残基看起来在检测环境pH中起重要作用。pH与CadA功能之间的联系与作为酸应激反应系统一部分的CadA蛋白的功能一致。当环境的pH足够高时，不再需要CadA蛋白继续合成将进一步提高环境pH的多胺。当环境的pH降至低于组氨酸残基的pKa时，组氨酸残基可以经历可滴定基团的质子化状态的变化，导致CadA蛋白从较高的寡聚状态转变为较低的寡聚状态，从而影响CadA蛋白的活性。

来自大肠杆菌的CadA蛋白(SEQ ID NO：2)中总共有24个组氨酸残基，其中2个位于N-末端翼结构域(wing domain)(H9和H23)，1个位于接头区(H152))，11个位于PLP结合亚结构域(H193，H197，H245，H250，H282，H300，H328，H366，H379，H396，H402)，4个位于亚结构域4(H458，H474，H483，H521)及6个位于C-末端结构域(H594，H599，H600，H629，H685，H694)。来自埃希氏菌属(Escherichia)的CadA蛋白序列与来自克雷伯氏菌属(Klebsiella)，肠杆菌科(Enterobacteriaceae)和肠道沙门氏菌(Salmonella enterica)的序列比对，表明所有24个组氨酸残基除了一个残基(H521)之外都是保守的(图1)。来自肠道沙门氏菌的CadA等价蛋白在氨基酸位置521具有精氨酸残基。

一方面，本发明因此提供了CadA变体多肽，其在相应于参照SEQ ID NO：2确定的氨基酸455-483的区域中包含至少一个氨基酸取代，其中所述至少一个氨基酸取代选自位置457和/或458；及其中所述CadA变体多肽与SEQ ID NO：2-5任一个具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽在位置457和458包含取代。在一些实施方案中，所述氨基酸取代是H458A/C/E/F/G/M/P/T/V/W/Y或者D457A/C/E/F/H/I/K/L/M/N/S/W/Y。在一些实施方案中，所述氨基酸取代是H458A/C/F/M/V/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中，所述CadA变体多肽进一步在参照SEQ ID NO：2确定的位置460包含天冬氨酸取代。在一些实施方案中，所述天冬氨酸取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。在一些实施方案中，在这个段落中上述的CadA变体多肽与SEQ ID NO：2具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：2具有至少75％、至少80％、至少85％、至少90％或者至少95％的相同性。在一些实施方案中，CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少75％、至少80％、至少85％、至少90％或者至少95％的相同性。在一些实施方案中，所述CadA变体多肽包含SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的氨基酸序列，其中在位置457的天冬氨酸被取代，例如取代D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者取代D457A/C/H/K/L/M/N/S；在位置458的组氨酸被取代，例如取代H458A/C/E/F/G/M/P/T/V/W/Y或者H458A/C/F/M/V/W/Y；或者在位置460的天冬氨酸被取代，例如取代D460C/F/Q/I/S/V/W或D460F/V/W/Y。在一些实施方案中，所述CadA变体包含SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的氨基酸序列，其中在位置D457、H458和D460的氨基酸之一被取代；或者在位置D457、H458和D460的两个氨基酸被取代。在一些实施方案中，所述CadA变体包含SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5的氨基酸序列，其中所有位置D457、H458和D460均被取代。

另一方面，本发明提供了遗传修饰的宿主细胞，其包含如本文例如在前一段所述的CadA变体多肽。在典型的实施方案中，所述遗传修饰的宿主细胞经遗传修饰以过表达一或多种赖氨酸生物合成多肽。在一些实施方案中，所述宿主细胞是细菌。在进一步的实施方案中，所述宿主细胞来自埃希氏菌属，例如大肠杆菌(Escherichia coli)，或者哈夫尼菌属(Hafnia)，例如蜂房哈夫尼菌(Hafnia alvei)，或者棒杆菌属(Corynebacterium)，例如谷氨酸棒杆菌(Corynebacterium glutamicum)。

在另一方面，本发明提供了多核苷酸，其包含编码在本文例如本节前段所述的CadA变体多肽的核酸序列。在一些实施方案中，如本节前段中所述的CadA变体多肽与SEQID NO：2具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：2具有至少75％、至少80％、至少85％、至少90％或至少95％的相同性。在一些实施方案中，CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少75％、至少80％、至少85％、至少90％或至少95％的相同性。在进一步的方面，本发明另外提供了包含编码所述CadA变体的多核苷酸的表达载体和/或提供了包含所述表达载体的遗传修饰的宿主细胞。在一些实施方案中，所述宿主细胞是细菌，例如来自埃希氏菌属或哈夫尼菌属。在一些实施方案中，所述宿主细胞来自棒状杆菌属，例如谷氨酸棒杆菌。在一些实施方案中，所述遗传修饰的宿主细胞是大肠杆菌。在一些实施方案中，所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中，所述遗传修饰的宿主细胞是谷氨酸棒杆菌。

另一方面，本发明提供了包含多核苷酸的遗传修饰的宿主细胞，所述多核苷酸包含编码在本文如本节前段所述的CadA变体多肽的核酸序列，其中编码所述CadA变体多肽的核酸序列整合到宿主细胞染色体中。在一些实施方案中，所述宿主细胞是细菌，例如来自埃希氏菌属、棒杆菌属或哈夫尼菌属。在一些实施方案中，所述遗传修饰的宿主细胞是大肠杆菌。在一些实施方案中，所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中，所述遗传修饰的宿主细胞是谷氨酸棒杆菌。

另一方面，本发明提供了一种生产尸胺的方法，所述方法包括在表达CadA变体多肽的条件下培养本文如本节前段所述的遗传修饰的宿主细胞。

一方面，本发明因此提供了遗传修饰的宿主细胞，其包含在相应于参照SEQ IDNO：2确定的氨基酸455-483的区域中具有至少一个氨基酸取代的CadA变体多肽，其中所述至少一个氨基酸取代选自位置457、458和460位；其中所述CadA变体多肽与SEQ ID NO：2-5任一个具有至少70％的相同性；且其中所述宿主细胞来自哈夫尼菌属、埃希氏菌属或者棒杆菌属。在典型的实施方案中，所述遗传修饰的宿主细胞经遗传修饰以过表达一或多种赖氨酸生物合成多肽。在一些实施方案中，所述宿主细胞是蜂房哈夫尼菌。在一些实施方案中，所述宿主细胞是大肠杆菌。在一些实施方案中，所述宿主细胞是谷氨酸棒杆菌。在一些实施方案中，所述CadA变体多肽在位置457包含氨基酸取代。在一些实施方案中，所述氨基酸取代为D457A/C/E/F/H/I/K/L/M/N/S/W/Y。在一些实施方案中，所述氨基酸取代是D457A/C/H/K/L/M/N/S。在一些实施方案中，所述CadA变体多肽在位置458包含氨基酸取代。在一些实施方案中，所述氨基酸取代是H458A/C/E/F/G/M/P/T/V/W/Y。在一些实施方案中，所述氨基酸取代是H458A/C/F/M/V/W/Y。在一些实施方案中，所述CadA变体多肽在位置460包含氨基酸取代。在一些实施方案中，所述氨基酸取代是D460C/F/Q/I/S/V/W/Y。在一些实施方案中，所述氨基酸取代是D460C/F/Q/I/S/V/W。在一些实施方案中，所述氨基酸取代是D460F/V/W/Y。在一些实施方案中，所述CadA变体多肽具有选自位置457、458和460的至少两个氨基酸取代。在一些实施方案中，所述CadA变体多肽具有选自位置457/458和460的至少三个氨基酸取代。在一些实施方案中，所述CadA变体多肽具有氨基酸取代457和458。在一些实施方案中，所述CadA变体多肽具有氨基酸取代458和460。在一些实施方案中，所述CadA变体多肽具有氨基酸取代457和460。在一些实施方案中，如本段上述的CadA变体多肽与SEQ ID NO：2具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：2具有至少75％、至少80％、至少85％、至少90％或至少95％的相同性。在一些实施方案中，CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少75％、至少80％、至少85％、至少90％或至少95％的相同性。

另一方面，本发明提供了包含编码如本文例如本节前段所述的CadA变体多肽的核酸序列的多核苷酸。在一些实施方案中，如本节前段所述的CadA变体多肽与SEQ ID NO：2具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：2具有至少75％、至少80％、至少85％、至少90％或至少95％的相同性。在一些实施方案中，CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少75％、至少80％、至少85％、至少90％或至少95％的相同性。在进一步的方面，本发明另外提供了包含编码所述CadA变体的多核苷酸的表达载体和/或提供了包含所述表达载体的遗传修饰的宿主细胞。在一些实施方案中，所述宿主细胞是蜂房哈夫尼菌。在一些实施方案中，所述宿主细胞是大肠杆菌。在一些实施方案中，所述宿主细胞是谷氨酸棒杆菌。

另一方面，本发明提供了包含多核苷酸的遗传修饰的宿主细胞，所述多核苷酸包含编码CadA变体多肽的核酸序列，所述CadA变体多肽在相应于参照SEQ ID NO：2确定的氨基酸455-483的区域中具有至少一个氨基酸取代，其中至少一个氨基酸取代选自位置457、458和460；其中所述CadA变体多肽与SEQ ID NO：2-5任一个具有至少70％的相同性；其中所述宿主细胞来自哈夫尼菌属、埃希氏菌属或者棒杆菌属，及其中编码所述CadA变体多肽的核酸序列整合到宿主细胞染色体中。在一些实施方案中，所述宿主细胞来自哈夫尼菌属、埃希氏菌属或者棒杆菌属。在一些实施方案中，所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中，所述宿主细胞是大肠杆菌。在一些实施方案中，所述宿主细胞是谷氨酸棒杆菌。

另一方面，本发明提供了一种生产尸胺的方法，所述方法包括在表达CadA变体多肽的条件下培养本文例如本节前段所述的遗传修饰的宿主细胞。

附图描述

图1示出大肠杆菌CadA多肽序列SEQ ID NO：2与来自肠道沙门氏菌(WP_001540636.1)、克雷伯氏菌多物种(WP_012968785)及肠杆菌科多物种(WP_002892486.1)的CadA同系物的序列比对。

发明详述

在描述本发明之前，应理解本发明不限于所描述的特定实施方案，因为所述实施方案当然可以改变。还应理解，本文使用的术语仅用于描述特定实施方案的目的，而不是限制性的。

除非另外定义，否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文描述的那些类似或等同的任何方法和材料可用于本发明的实践或测试，但现在描述优选的方法和材料。本文提及的所有出版物和登录号均通过引用并入本文作参考，以揭示和描述与所引用的出版物相关的方法和/或材料。

术语

如在本发明所用，“CadA多肽”是指具有SEQ ID NO：2所示氨基酸序列的大肠杆菌CadA多肽，或者其具有催化L-赖氨酸脱羧产生尸胺的活性的生物活性变体。生物活性变体包括大肠杆菌CadA多肽的等位基因、突变体、片段和种间同系物。CadA在结构和功能上都已经充分鉴定。CadA结构的蛋白质数据库ID是3N75。举例的其它物种的CadA多肽包括来自克雷伯氏菌属(例如SEQ ID NO：3)、肠杆菌科(例如SEQ ID NO：5)和肠道沙门氏菌(例如SEQID NO：6)的CadA。来自其它物种的其它CadA多肽包括沙雷氏菌属(Serratia sp.)，WP033635725.1和解鸟氨酸拉乌尔菌(Raoultella ornithinolytica)，YP 007874766.1。在一些实施方案中，“CadA多肽”与SEQ ID NO：2所示CadA多肽的至少大约200、300、400、500或更多个氨基酸的区域或者全长具有至少60％的氨基酸序列相同性，通常至少65％、70％、75％、80％、85％、90％的相同性；通常至少91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的氨基酸序列相同性。在一些实施方案中，“CadA多肽”包含与包含相应于SEQID NO：2的氨基酸455-483的氨基酸残基的区域具有至少80％、至少85％、至少90％、至少95％、或者至少91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的氨基酸序列相同性的区域，其中该区域中存在的天然组氨酸或天冬氨酸如本文所述用另一非天然存在的氨基酸取代。在一些实施方案中，“CadA多肽”优选与SEQ ID NO：3、SEQ ID NO：4或SEQ IDNO：5的CadA多肽的至少大约200、300、400、500或更多个氨基酸的区域或全长具有至少60％的氨基酸序列相同性，通常至少65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的氨基酸序列相同性。

如本文所用，“CadA多核苷酸”是指编码CadA多肽的多核苷酸。编码CadA的核酸或多核苷酸是指基因、前mRNA、mRNA等，包括编码本文所述特定氨基酸序列的变体、等位基因、片段、突变体和种间同系物的核酸。

如本文所用，术语“碱性pH”是指pH大于7.5的溶液或周围环境。在一个实施方案中，碱性pH是指溶液或周围环境具有至少8.0、至少8.5或更高的pH。

如本文所用，在产生氨基酸衍生物如尸胺的语境中，术语“增强的”或“改善的”是指表达本发明CadA变体多肽的宿主细胞与对照对应细胞相比，产生的氨基酸衍生物增加，所述对照对应细胞如野生型菌株的细胞或者表达野生型CadA蛋白的相同菌株的细胞。在一个实施方案中，与表达野生型CadA的对应细胞的CadA活性相比，所述CadA变体的活性改善至少10％、15％、20％、30％、40％、50％、60％、70％、80％、90％、100％或更高，其中活性通过测量在相同条件下由所述宿主细胞和对照细胞产生的氨基酸衍生物(通常是尸胺)的生产而评估。例如，本发明的CadA变体多肽的活性可以通过评估等份的用编码所述变体CadA多肽的多核苷酸转化的宿主细胞培养物相比于相应等份的表达野生型CadA的相同菌株的对应宿主细胞培养物而确定。再进一步而言，本发明的CadA变体多肽与对应野生型CadA相比的活性可以通过评估用包含编码所述变体CadA多肽的核酸序列的载体转化的细胞(变体宿主细胞)或者包含编码野生型CadA多肽的核酸的载体转化的细胞(对照宿主细胞)产生的尸胺而确定。在表达CadA的条件下生长变体宿主细胞和对照宿主细胞并且将等份与终浓度分别为120g/L和0.1mM的赖氨酸-HCl和PLP在pH8.0温育一段时间，例如2小时。温育后测量尸胺的产生。在实施例部分中提供了示例的测定。

当在给定氨基酸或多核苷酸序列的编号的语境中使用的术语“参照编号”、或“相应于”或“参照”确定，是指当给定的氨基酸或多核苷酸序列与参考序列比较时指定参考序列的残基的编号。例如，当变体多肽以最大比对与SEQ ID NO：2比对时，变体CadA多肽序列的位置“相应于”SEQ ID NO：2中的位置。

如本文所用，与CadA多肽相关的术语“野生型”、“天然的”和“天然发生的”是指具有天然发生的序列的CadA蛋白。

在本发明的上下文中，关于突变多肽或突变多核苷酸所用术语“突变体”可与“变体”互换使用。“非天然”发生的CadA变体是指不是天然存在于细胞中及是通过遗传修饰例如对天然CadA多核苷酸或多肽使用基因工程技术或诱变技术产生的变体或突变体CadA多肽。本公开上下文中的“变体”CadA多肽包括任何包含至少一个氨基酸取代的CadA多肽，其中所述至少一个氨基酸取代是在参照SEQ ID NO：2确定的位置457、458和460的组氨酸或天冬氨酸残基的取代。本发明的变体CadA多肽相对于SEQ ID NO：2还可具有其它突变，包括进一步的取代、插入或缺失。

术语“多核苷酸”和“核酸”可互换使用，是指从5'至3'末端读取的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。用于本发明的核酸通常含有磷酸二酯键，但是在某些情况下可以使用可具有替代主链的核酸类似物，包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基亚磷酰胺键(参见Eckstein,Oligonucleotides and Analogues:APractical Approach,Oxford University Press)、正电荷主链、非离子主链和非核糖主链。核酸或多核苷酸还可包括允许聚合酶正确通读的修饰的核苷酸。“多核苷酸序列”或“核酸序列”包括核酸的有义链和反义链作为单个单链或双链体。如本领域技术人员所理解的，单链的描述也定义了互补链的序列；因此本文描述的序列也提供所述序列的互补序列。除非另有说明，否则特定核酸序列也隐含涵盖其变体(例如简并密码子取代)和互补序列，以及明确指出的序列。核酸可以是DNA-基因组DNA和cDNA、RNA或杂合体，其中核酸可以包含脱氧核糖核苷酸和核糖核苷酸的组合，以及碱基的组合，包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤次黄嘌呤、异胞嘧啶、异鸟嘌呤等。

在本发明公开的上下文中用于两个核酸或多肽的术语“基本上相同”是指与参考序列具有至少50％序列相同性的序列。相同性百分比可以是50％-100％的任何整数。一些实施方案包括：与参考序列相比具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％的相同性，使用本文所述程序、优选使用标准参数的BLAST进行，如下文描述。

如果两个序列中的核苷酸或氨基酸残基序列在如下所述进行最大对应性比对时是相同的，则称这两个核酸序列或多肽序列是“相同的”。在描述两或更多个核酸或多肽序列时，术语“相同”或“相同性”百分比是指当在对比窗进行最大对应性对比和比对时(如使用以下序列对比算法之一或通过手动比对和目测进行测量)，所述两或更多个序列或子序列是相同的，或者具有指定百分比的相同的氨基酸残基或核苷酸。

对于序列对比，通常一个序列作为参考序列，将测试序列与其对比。当使用序列对比算法时，将测试序列和参考序列输入计算机，如果需要则指定子序列坐标，及指定序列算法程序参数。可以使用默认程序参数，也可以指定替代参数。然后，序列对比算法基于程序参数计算测试序列相对于参考序列的序列相同性百分比。

可用于确定变体CadA多肽与SEQ ID NO：2或另一多肽参考序列如SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5是否具有序列相同性的算法是BLAST算法，其在Altschul etal.,1990,J.Mol.Biol.215:403-410中描述。进行BLAST分析的软件可通过国家生物技术信息中心(在全球网站ncbi.nlm.nih.gov/上)可公开获得。用于进行蛋白质序列比对的示例性软件包括ClustalW2和BLASTP。对于氨基酸序列，BLASTP程序默认使用字长(W)为3，期望阈值(E)为10和BLOSUM62评分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915(1989))。在本公开中，多肽序列相同性通常使用默认参数的BLASTP AlignSequence确定。

如本文所用，“对比窗”包括选自20-600、通常大约50至大约200、更通常大约100至大约150个连续位置的任一序列节段，其中在两个序列最佳比对后，可以将序列与相同数目的连续位置的参考序列进行对比。用于对比的序列比对方法为本领域熟知。可以通过如下方法进行最佳序列比对以进行对比，例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法，Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法，Pearson&Lipman,Proc.Nat'l.Acad.Sci.USA 85:2444(1988)的搜索相似性方法，通过这些算法的计算机执行程序(Wisconsin Genetics Software Package,GeneticsComputer Group,575Science Dr.,Madison,WI中的GAP，BESTFIT，FASTA和TFASTA)，或者通过手动比对及目测进行。最佳比对通常是使用默认参数BLASTP进行。

与参考序列基本相同的核酸或蛋白质序列包括“保守修饰的变体”。关于特定的核酸序列，保守修饰的变体是指编码相同或基本相同的氨基酸序列的那些核酸，或者在核酸不编码氨基酸序列的情况中是指基本相同的序列。由于遗传密码的简并性，大量功能相同的核酸编码任何给定的蛋白质。例如，密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此，在丙氨酸由密码子指定的每个位置，密码子可以改变为任何相应密码子而不改变编码的多肽。这种核酸变异是“沉默变异”，其是保守修饰变异的一种。本文中编码多肽的每个核酸序列也描述了核酸的每种可能的沉默变异。技术人员将认识到，可以修饰核酸中的每个密码子(除了AUG，其通常是甲硫氨酸的唯一密码子)以产生功能相同的分子。因此，编码多肽的核酸的每个沉默变异隐含在每个所述序列中。

如本文所用，术语“多肽”包括含有天然发生的氨基酸和氨基酸主链以及非天然发生的氨基酸和氨基酸类似物的多肽。

关于氨基酸序列，技术人员将认识到在核酸、肽、多肽或蛋白质序列中改变编码序列中单个氨基酸或小百分比氨基酸的各个取代是“保守修饰的变体”，其中所述改变导致一个氨基酸由化学相似的氨基酸取代。提供功能相似的氨基酸的保守取代表为本领域熟知。以这种方式定义的氨基酸组的实例可包括：“带电荷/极性组”，包括Glu(谷氨酸或E)，Asp(天冬氨酸或D)，Asn(天冬酰胺或N)，Gln(谷氨酰胺或Q)，Lys(赖氨酸或K)，Arg(精氨酸或R)和His(组氨酸或H)；“芳香族或环形组”，包括Pro(脯氨酸或P)，Phe(苯丙氨酸或F)，Tyr(酪氨酸或Y)和Trp(色氨酸或W)；及“脂肪族组”，包括Gly(甘氨酸或G)，Ala(丙氨酸或A)，Val(缬氨酸或V)，Leu(亮氨酸或L)，Ile(异亮氨酸或I)，Met(甲硫氨酸或M)，Ser(丝氨酸或S)，Thr(苏氨酸或T)和Cys(半胱氨酸或C)。在每个组中，也可以再分亚组。例如，带电荷/极性氨基酸组可以细分为亚组，包括：“正电荷亚组”包括Lys、Arg和His，“负电荷亚组”包括Glu和Asp，及“极性亚组”包括Asn和Gln。在另一个实例中，芳香族或环形组可以细分为亚组，包括：“氮环亚组”包括Pro、His和Trp，“苯基亚组”包括Phe和Tyr。在另一个实例中，脂肪族组可以细分为亚组，包括：“大脂肪族非极性亚组”包括Val、Leu和Ile，“脂肪族小极性亚组”包括Met、Ser、Thr和Cys，和“小残基亚组”包括Gly和Ala。保守突变的实例包括上述亚组内氨基酸的氨基酸取代，例如但不限于：Arg取代Lys，反之亦然，由此可以保持正电荷；Asp取代Glu，反之亦然，由此可以保持负电荷；Thr取代Ser，反之亦然，由此可以保持游离--OH；及Asn取代Gln，反之亦然，由此可以保持游离--NH2。以下六组均含有进一步提供示例的彼此保守取代的氨基酸。1)Ala，Ser，Thr；2)Asp，Glu；3)Asn，Gln；4)Arg，Lys；5)Ile，Leu，Met，Val；6)Phe，Try和Trp(参见例如Creighton,Proteins(1984))。在一些实施方案中，保守取代用于产生在除组氨酸或天冬氨酸残基之外的位点具有取代的CadA变体。

如在本公开中所用，“可滴定基团”是指由于pH变化而能提供或接受质子的氨基酸侧链。在一个实施方案中，可滴定基团可以在沿着CadA蛋白的各个氨基酸发现。在一个实施方案中，具有可滴定基团的氨基酸包括天冬氨酸、谷氨酸、半胱氨酸、丝氨酸、酪氨酸、苏氨酸、组氨酸、赖氨酸和精氨酸。虽然不希望受以下限制，但相信可滴定基团允许氨基酸侧链的旋转或定向，由此相邻氨基酸pKa(即可滴定基团的4埃内的氨基酸)可能受到可滴定基团的影响。在一个实施方案中，一个氨基酸的可滴定基团与相邻氨基酸之间小于2埃的距离被认为是强相互作用。在另一个实施方案中，一个氨基酸的可滴定基团与相邻氨基酸之间大于4埃的距离被认为是弱相互作用。

为本发明的目的，“氨基酸三元体(triad)”是指出现具有可滴定基团的一个组氨酸和两个相邻酸性氨基酸，其中组氨酸的pKa值接近于CadA在不同寡聚状态之间转变的pH值，如使用基于线性化Poisson-Boltzmann方程的pKa计算方法预测CadA蛋白中组氨酸残基的pKa值确定。在一个实施方案中，氨基酸三元体包含在参照SEQ ID NO：2确定的位置457的天冬氨酸残基、位置458的组氨酸残基和位置460的天冬氨酸残基的至少一个取代。在另一个实施方案中，氨基酸三元体包含至少两个取代，其中所述至少两个取代选自参照SEQ IDNO：2确定的位置457的天冬氨酸残基、位置458的组氨酸残基和位置460的天冬氨酸残基。在另一个实施方案中，氨基酸三元体包含在参照SEQ ID NO：2确定的位置457的天冬氨酸残基、位置458的组氨酸残基和位置460的天冬氨酸残基三个残基中每一个的取代。

如本文所用，术语“启动子”是指能够驱动细胞中核酸序列转录的多核苷酸序列。因此，在本发明的多核苷酸构建体中使用的启动子包括顺式和反式作用转录控制元件和调节序列，其参与调节或调整基因转录的时机和/或速率。例如，启动子可以是顺式作用转录控制元件，包括增强子、阻抑物结合序列等。这些顺式作用序列通常与蛋白质或其它生物分子相互作用以进行(打开/关闭、调节、调整等)基因转录。大多数情况下，核心启动子序列位于翻译起始位点的1-2kb内，更通常在翻译起始位点的1kbp内及通常在500bp或200bp或更少以内。按照惯例，启动子序列通常提供为在其控制的基因的编码链上的序列。在本申请的上下文中，启动子通常根据其天然调节表达的基因的名称而提及。用于本发明表达构建体中的启动子用基因名称提及。根据名称提及的启动子包括野生型天然启动子以及保留诱导表达能力的启动子的变体。根据名称提及的启动子不限于特定物种，还涵盖来自其它物种中相应基因的启动子。

本发明上下文中的“组成型启动子”是指在大多数条件下在细胞中能起始转录的启动子，例如在不存在诱导分子的条件下。“诱导型启动子”在存在诱导剂分子的条件下起始转录。

如果多核苷酸源自外来物种，或者如果来自相同物种，是对原始形式加以修饰的，则该多核苷酸对于生物体或第二多核苷酸序列是“异源的”。例如，当编码多肽序列的多核苷酸被称为与异源启动子可操作地连接时，意味着所述编码多肽的多核苷酸编码序列来自一个物种，而所述启动子序列来自另一个不同物种；或者，如果二者来自相同物种，则所述编码序列与所述启动子不是天然相关的(例如是基因工程化的编码序列，例如来自相同物种的不同基因，或来自不同物种的等位基因)。相似地，如果天然野生型宿主细胞不产生多肽，则所述多肽对于所述宿主细胞是“异源的”。

术语“外源的”通常是指在野生型细胞或生物体中不是天然存在的多核苷酸序列或多肽，但通常通过分子生物学技术导入细胞中，即工程化以产生重组微生物。“外源”多核苷酸的实例包括编码所需蛋白质或酶的载体、质粒和/或人造核酸构建体。

术语“内源的”是指可以在给定的野生型细胞或生物体中发现的天然存在的多核苷酸序列或多肽。在这方面，还应注意即使生物体可包含给定多核苷酸序列或基因的内源拷贝，但是导入编码该序列的质粒或载体例如以过表达或以其它方式调节编码蛋白质的表达，也代表该基因或多核苷酸序列的“外源”拷贝。本文描述的任何途径、基因或酶可以利用或依赖可以以一或多个“外源”多核苷酸序列提供的“内源”序列，或二者。

如本文所用，“重组核酸”或“重组多核苷酸”是指核酸聚合物，其中如下至少一种情况是正确的：(a)核酸序列对于给定的宿主细胞是外源的(即不是天然存在的)；(b)序列在给定的宿主细胞中可以是天然存在的，但是以非天然量(例如大于预期)存在；或者(c)核酸序列包含在自然界中彼此不存在相同关系的两或多个子序列。例如，关于情况(c)，重组核酸序列可以具有来自无关基因的两或更多个序列，排列产生新的功能性核酸。

术语“可操作地连接”是指两或更多个多核苷酸(例如DNA)节段之间的功能关系。通常，其是指转录调节序列与转录序列的功能关系。例如，如果启动子或增强子序列在合适的宿主细胞或其它表达系统中刺激或调节DNA或RNA序列的转录，则其与所述DNA或RNA序列是可操作地连接的。通常，与转录序列可操作连接的启动子转录调节序列与转录序列是物理上连续的，即其是顺式作用的。然而，一些转录调节序列如增强子与其增强转录的编码序列不需要在物理上连续或位于非常接近的位置。

术语“表达盒”或“DNA构建体”或“表达构建体”是指这样的核酸构建体，当其被导入宿主细胞时，分别导致RNA或多肽的转录和/或翻译。在表达转基因的情况下，技术人员将认识到插入的多核苷酸序列不需要是相同的，但与其衍生的基因的序列基本相同。如本文所解释的，这些基本相同的变体通过提及特定核酸序列而特别涵盖。表达盒的一个实例是多核苷酸构建体，其包含与启动子例如其天然启动子可操作地连接的编码本发明多肽的多核苷酸序列，其中所述表达盒被导入异源微生物中。在一些实施方案中，表达盒包含编码本发明多肽的多核苷酸序列，其中所述多核苷酸靶向微生物基因组中的一个位置，由此该多核苷酸序列的表达由存在于所述微生物中的启动子驱动。

在本发明上下文中所用术语“宿主细胞”是指微生物，包括可以是或已经是本发明的任何重组载体或分离的多核苷酸的受体的单个细胞或细胞培养物。宿主细胞包括单个宿主细胞的后代，且由于天然的、偶然的或有意的突变和/或改变，所述后代与原始亲本细胞不一定完全相同(在形态学上或在总DNA补体中)。宿主细胞包括其中包括通过转化、转染等已经导入了本发明的重组载体或多核苷酸的细胞。在一些实施方案中，所述宿主细胞来自埃希氏菌属、棒杆菌属或哈夫尼菌属。

术语“分离的”是指一种材料基本上或实质上没有在其天然状态下通常伴随其的成分。例如，如本文所用，“分离的多核苷酸”可以指从在其天然存在或基因组状态时位于其侧翼的序列中分离的多核苷酸，例如如通过克隆进载体中已从通常与其相邻的序列中移出的DNA片段。例如，如果将多核苷酸克隆进不是天然环境一部分的载体中，或者如果其以不同于其天然存在的状态的方式人工导入细胞的基因组中，则认为该多核苷酸是分离的。或者，如本文所用，“分离的肽”或“分离的多肽”等是指不含细胞的其它成分的多肽分子，即其与体内细胞成分不相关。

本发明采用各种常规重组核酸技术。通常，下文描述的重组DNA技术中的命名法和实验室程序是本领域通常使用的。可以获得许多提供进行重组DNA操作指导的手册，例如Sambrook&Russell,Molecular Cloning,A Laboratory Manual(3rd Ed,2001)和CurrentProtocols in Molecular Biology(Ausubel,et al.,John Wiley and Sons,New York,2009-2016)。

本发明发明某些方面的概述

一方面，本发明提供了变体CadA多肽，其包含在相应于参照SEQ ID NO：2确定的氨基酸455-483的区域中组氨酸和/或天冬氨酸残基的突变。在一个实施方案中，所述突变包括位于CadA蛋白柔性环内的参照SEQ ID NO：2确定的位置458的组氨酸残基的取代。在另一个实施方案中，组氨酸和/或天冬氨酸残基的突变包含一或多个具有可滴定基团的氨基酸。在一个实施方案中，CadA变体多肽在相应于参照SEQ ID NO：2确定的氨基酸455-483的区域中包含氨基酸取代，其中所述氨基酸取代包括具有可滴定基团的氨基酸三元体。在一个实施方案中，所述氨基酸三元体包括参照SEQ ID NO：2在位置457、458和460的氨基酸残基的取代。在一个实施方案中，所述在相应于参照SEQ ID NO：2确定的氨基酸455和483的区域中组氨酸或天冬氨酸残基的突变包括适合质子化的氨基酸。

本发明的变体CadA耐受碱性pH的能力还允许在发酵反应中使用具有较高pH值的替代氮源，例如尿素和氨(1M溶液的pH为11.6)，以产生所需产物如多胺。这些替代氮源产生较少的盐废物副产物。

CadA多肽变体

CadA是Fold Type I吡哆醛5'-磷酸(PLP)依赖性脱羧酶的亚类成员。这类蛋白质通常含有N末端翼结构域、核心结构域和C末端结构域。核心结构域由接头区、PLP结合亚结构域和亚结构域4组成。对于CadA，N-末端翼结构域(相应于参照SEQ ID NO：2确定的残基1-129)具有黄素氧还蛋白样折叠，由夹在两组两亲性α螺旋之间的五链平行β-折叠组成。核心结构域(参照SEQ ID NO：2确定的残基130-563)包括：接头区，SEQ ID NO：2的氨基酸残基130-183，其形成短螺旋束；PLP结合亚结构域，SEQ ID NO：2的氨基酸184-417，其形成由三组α-螺旋包围的七链β-折叠核心；及亚结构域4，氨基酸418-563，形成具有三个α-螺旋朝外的四链反平行β-折叠核心。C末端结构域相应于参照SEQ ID NO：2确定的氨基酸残基564-715，其形成具有α-螺旋外表面的两组β折叠(Kanjee et al.,The EMBO Journal 30,931-944 2011)。

CadA蛋白形成双重对称二聚体，完成每个单体的活性位点。五个二聚体结合形成十聚体，其由具有五重对称性的双环结构组成。十聚体与其它十聚体结合形成更高级的寡聚物。已经表明，在酸性条件下(pH5)，CadA主要以寡聚状态存在，且随着环境变得更加碱性而发现存在较少的寡聚物和十聚体。据估计，在pH 6.5，25％的酶以二聚体存在，75％以十聚体存在，而在pH 8.0，95％的酶以二聚体存在(Kanjee et al.,The EMBO Journal 30,931-944 2011)。这种寡聚物形成的降低与随着酶环境的pH增加到5.0以上观察到的脱羧酶活性降低的结果一致。

示例的来自大肠杆菌、肠道沙门氏菌、克雷伯氏菌和肠杆菌科的Cad A多肽在SEQID NO：2-5中提供，其彼此共有超过90％的序列相同性。

本领域有关于计算蛋白质pKa值各种方法的研究(Yang,et al.,Proteins 15,252-265,1993；Van Vlijmen HW,et al.,Proteins 33,145-158,1998；Rabenstein B&Knapp EW,Biophysical Journal 80,1141-1150,2001；Kieseritzky G&Knapp EW,Proteins 71,1335-1348,2008；Kilambi KP&Gray JJ,Biophysical J 103,587-595,2012)。文献中测试的大多数氨基酸残基的计算和实验pKa值之间的差异为0.5-0.75。一种方法是基于线性化Poisson-Boltzmann方程的pKa计算方法，以预测CadA蛋白中24个组氨酸残基的pKa值。本文计算的pKa值的概述示于表1。发现在参照SEQ ID NO：2的位置458的一个组氨酸残基的pKa值接近CadA在不同寡聚状态之间转换的pH。根据文献(Kanjee U,etal.The EMBO Journal,30,931-944,2011)，当环境的pH值改变时，CadA从由十聚体和高级寡聚物组成的状态转变为主要由二聚体组成的状态。因此，pH的变化可以影响其可滴定基团的pKa值与发生蛋白质寡聚化转变的pH相似的那些氨基酸。

H458位于CadA的跨越氨基酸Q455至H483的柔性环形区域。当环在三维空间中移动时，这个环的柔性允许蛋白质的相邻二级结构上的相邻氨基酸(即可滴定基团的四埃内的氨基酸)与柔性环上的氨基酸相互作用。因此，如果柔性环的运动带动H458的范围内的相邻氨基酸，则附近的其它酸性或碱性基团可能影响H458的pKa。

在一个实施方案中，本发明的CadA多肽在相应于参照SEQ ID NO：2确定的氨基酸455-483的区域中包含至少一个氨基酸取代，其中至少一个氨基酸取代选自位置457和/或458；其中CadA变体多肽与SEQ ID NO：2-5任一个具有至少70％的相同性。在一个实施方案中，所述CadA变体包含在位置458的组氨酸残基的取代。在一些实施方案中，所述氨基酸取代是H458A/C/E/F/G/M/P/T/V/W/Y或者H458A/C/F/M/V/W/Y。在另一个实施方案中，所述CadA变体包含在位置457的天冬氨酸残基的取代。在一个实施方案中，所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中，所述CadA变体多肽进一步包含在根据SEQ ID NO：2确定的位置460的天冬氨酸取代。在一些实施方案中，所述天冬氨酸取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。在一些实施方案中，如本段上述的CadA变体多肽与SEQ ID NO：2具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：2具有至少75％、至少80％、至少85％、至少90％或者至少95％的相同性。在一些实施方案中，CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少75％、至少80％、至少85％、至少90％或者至少95％的相同性。

在本公开中，取代所述组氨酸和/或天冬氨酸残基的氨基酸在天然CadA序列中在该位置不存在。因此，本发明的变体CadA多肽可包含在参照SEQ ID NO：2确定的位置D457和/或H458包含至少一个氨基酸取代。在一些实施方案中，所述CadA变体可以进一步包含在参照SEQ ID NO：2确定的位置460的氨基酸取代。

在另一个实施方案中，本发明的CadaA变体多肽在相应于参照SEQ ID NO：2确定的氨基酸455-483的区域中包含至少一个氨基酸取代，其中所述至少一个氨基酸取代选自位置457、458和460；其中所述CadA变体多肽与SEQ ID NO：2-5任一个具有至少70％的相同性；其中所述宿主细胞来自哈夫尼菌属。在一个实施方案中，所述CadA变体所包含在位置457的天冬氨酸残基的取代。在一个实施方案中，所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一个实施方案中，所述CadA变体包含在位置458的组氨酸残基的取代。在一些实施方案中，所述氨基酸取代是H458A/C/E/F/G/M/P/T/V/W/Y或者H458A/C/F/M/V/W/Y。在一个实施方案中，所述CadA变体包含在参照SEQ ID NO：2确定的位置460的天冬氨酸取代。在一些实施方案中，所述天冬氨酸取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。在一些实施方案中，所述变体CadA多肽包含在参照SEQ ID NO：2确定的位置D457、H458和D460的一个以上的氨基酸取代，例如2个、3个或更多个取代。在一个实施方案中，所述变体CadA多肽包含在参照SEQ ID NO：2确定的位置D457和H458的氨基酸取代。在一个实施方案中，所述变体CadA多肽包含在参照SEQ ID NO：2确定的位置D457和D460的氨基酸取代。在一个实施方案中，所述变体CadA多肽包含在参照SEQ ID NO：2确定的位置H458和D460的氨基酸取代。在一个实施方案中，所述变体CadA多肽包含在参照SEQ IDNO：2确定的位置D457、H458和D460的氨基酸取代。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：2具有至少75％、至少80％、至少85％、至少90％或者至少95％的相同性。在一些实施方案中，CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少70％的相同性。在一些实施方案中，所述CadA变体多肽与SEQ ID NO：3、SEQ ID NO：4或SEQ ID NO：5具有至少75％、至少80％、至少85％、至少90％或者至少95％的相同性。

在一个实施方案中，本发明的CadA多肽包含在CadA的亚结构域4(即没有确定的二级结构(α，α螺旋；β，β折叠)；η，链)(见Kanjee et al.))中组氨酸和/或天冬氨酸残基的至少一个氨基酸取代；其中氨基酸侧链(α碳周围)的旋转使D457或D460的可滴定基团在H458的4埃以内，从而促进质子供体和质子受体之间的强相互作用。

在一些实施方案中，变体CadA多肽包含在参照SEQ ID NO：2确定的位置D457、H458和D460的一个以上的氨基酸取代，例如2、3或更多个取代。在一些实施方案中，取代组氨酸或天冬氨酸的氨基酸选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸或缬氨酸，其中突变体在与野生型序列(SEQ ID NO：2、3、4或5)相同位置不具有相同氨基酸。在一些实施方案中，取代组氨酸或天冬氨酸的氨基酸具有提供氢以形成氢键的能力。例如，通常而言，氨基酸C、Y、K和R的pKa值大于8，因此当pH从5提高至8时，其质子化状态不会改变。因此，在这些位置形成的任何氢键与当这个位置存在具有酸性pKa的天冬氨酸时相比更稳定。在一些实施方案中，取代组氨酸的氨基酸选自A、C、E、F、G、M、P、T、V、W和Y。在一些实施方案中，取代组氨酸的氨基酸选自A、C、F、M、V、W和Y。在一些实施方案中，所述变体CadA多肽是来自大肠杆菌的CadA的变体，其中位置H458的组氨酸由另一氨基酸取代。在一些实施方案中，取代天冬氨酸的氨基酸选自A、C、E、F、H、I、K、L、M、N、S、W和Y。在一些实施方案中，取代天冬氨酸的氨基酸选自A、C、H、K、L、M、N和S。在一些实施方案中，所述变体CadA多肽是来自大肠杆菌的CadA的变体，其中位置D457的天冬氨酸由另一氨基酸取代。

在一些实施方案中，本发明的变体CadA多肽与SEQ ID NO：2的CadA多肽的500或更多个氨基酸长度的区域或者全长具有至少60％的氨基酸序列相同性，通常具有至少65％、70％、75％、80％或85％的相同性；通常具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的氨基酸序列相同性；且在参照SEQ ID NO：2确定的位置D457或D460的天冬氨酸残基具有取代。在一些实施方案中，所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中，在位置460的取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。

在一些实施方案中，本发明的变体CadA多肽与SEQ ID NO：3的CadA多肽的500或更多个氨基酸长度的区域或者全长具有至少60％的氨基酸序列相同性，通常具有至少65％、70％、75％、80％或85％的相同性；通常具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的氨基酸序列相同性；且在参照SEQ ID NO：3确定的位置D457或D460的天冬氨酸残基具有取代。在一些实施方案中，所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中，在位置460的取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。

在一些实施方案中，本发明的变体CadA多肽与SEQ ID NO：4的CadA多肽的500或更多个氨基酸长度的区域或者全长具有至少60％的氨基酸序列相同性，通常具有至少65％、70％、75％、80％或85％的相同性；通常具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的氨基酸序列相同性；且在参照SEQ ID NO：4确定的位置D457或D460的天冬氨酸残基具有取代。在一些实施方案中，所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或者D457A/C/H/K/L/M/N/S。在一些实施方案中，在位置460的取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或者D460F/V/W/Y。

在一些实施方案中，本发明的变体CadA多肽与SEQ ID NO：5的CadA多肽的500或更多个氨基酸长度的区域或者全长具有至少60％的氨基酸序列相同性，通常具有至少65％、70％、75％、80％或85％的相同性；通常具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％或更高的氨基酸序列相同性；且在参照SEQ ID NO：5确定的位置D457或D460的天冬氨酸残基具有取代。在一些实施方案中，所述取代是D457A/C/E/F/H/I/K/L/M/N/S/W/Y或D457A/C/H/K/L/M/N/S。在一些实施方案中，在位置460的取代是D460C/F/Q/I/S/V/W/Y、D460C/F/Q/I/S/V/W或D460F/V/W/Y。

编码CadA变体多肽的核酸

CadA多核苷酸序列的分离或产生可通过许多技术完成。在一些实施方案中，寡核苷酸探针和基于本文公开的序列可用于在cDNA或基因组DNA文库中鉴别来自所需细菌物种的希望的多核苷酸。可以使用合适的引物在CadA编码多核苷酸序列中导入希望的取代，如实施例章节所示，以在所述多核苷酸序列中掺入希望的改变。例如，PCR可用于直接从mRNA、cDNA、基因组文库或cDNA文库扩增基因序列及导入希望的取代。

用于鉴别细菌中的CadA多核苷酸的合适引物和探针可以通过对比本发明提供的序列而产生，或者基于来自另一细菌的CadA多核苷酸序列产生。关于PCR的一般概述见PCRProtocols:A Guide to Methods and Applications.(Innis,M,Gelfand,D.,Sninsky,J.and White,T.,eds.),Academic Press,San Diego(1990)。示例的引物序列在实施例章节的引物表中示出。

编码用于本发明的酸脱羧酶多肽的核酸序列包括通过使用示例的核酸序列(例如SEQ ID NO：1所示cadA多核苷酸序列)通过如杂交和/或序列分析的技术鉴别和鉴定的基因和基因产物。在一些实施方案中，宿主细胞通过导入核酸序列而被遗传修饰，所述核酸序列与酸脱羧酶多核苷酸如SEQ ID NO：1所示cadA多核苷酸具有至少60％的相同性，或至少70％、75％、80％、85％或90％的相同性，或95％或更高的相同性，其中所述核酸包含编码希望被取代的氨基酸的密码子。

赋予宿主细胞产生增多的氨基酸衍生物例如尸胺的编码本发明的CadA变体蛋白的核酸序列可以另外进行密码子优化以在希望的宿主细胞中表达。可以采用的方法和数据库为本领域已知。例如，可以根据在单个基因、一组共同功能或起源的基因、高度表达的基因中的密码子使用，整个生物体的总计蛋白质编码区中的密码子频率，相关生物体的总计蛋白质编码区中的密码子频率，或其组合而确定优选的密码子。见例如Henaut andDanchin in"Escherichia coli and Salmonella,"Neidhardt,et al.Eds.,ASM Pres,Washington D.C.(1996),pp.2047-2066；Nucleic Acids Res.20:2111-2118；Nakamura etal.,2000,Nucl.Acids Res.28:292)。

重组载体的制备

可以使用本领域熟知的方法制备用于表达变体CadA蛋白的重组载体。例如，编码CadA变体多肽的DNA序列可以与转录和其它调节序列组合，所述转录和其它调节序列在指定细胞中指导从基因序列转录，所述细胞例如是细菌细胞如蜂房哈夫尼菌、大肠杆菌或者谷氨酸棒杆菌。在一些实施方案中，包含表达盒的表达载体进一步包含与编码所述CadA变体多肽的核酸序列可操作连接的启动子，所述表达盒包含编码所述CadA变体多肽的基因。在其它实施方案中，指导编码变体Cada多肽的cadA多核苷酸转录的启动子和/或其它调节元件对于宿主细胞而言是内源的，通过例如同源重组导入包含所述cadA基因的表达盒，由此外源基因与内源启动子可操作地连接，且由内源启动子驱动表达。

如上所述，编码cadA变体多肽的多核苷酸的表达可以通过许多调节序列控制，包括启动子，其可以是组成型的或诱导型启动子；及如果需要任选地可以使用阻抑物序列。合适的启动子、特别是在细菌宿主细胞中的启动子实例是得自大肠杆菌lac操纵子的启动子及衍生自参与其它糖例如半乳糖和麦芽糖代谢的基因的其它启动子。其它实例包括启动子，例如trp启动子、bla启动子噬菌体λPL和T5。另外，可以使用合成启动子，例如tac启动子(美国专利号4,551,433)。启动子的其它实例包括天蓝色链霉菌(Streptomycescoelicolar)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因。合适的启动子也在如前文提及的Ausubel和Sambrook&Russell中描述。其它启动子包括Jensen&Hammer,Appl.Environ.Microbiol.64:82,1998、Shimada,et al.,J.Bacteriol.186:7112,2004和Miksch et al.,Appl.Microbiol.Biotechnol.69:312,2005描述的启动子。

在一些实施方案中，可以修饰影响编码本发明的CadA变体多肽的cadA基因表达的启动子以增加表达。例如，可以用提供与天然启动子相比增加的表达的启动子置换内源性CadA启动子。

表达载体也可以包含影响编码所述CadA变体多肽的多核苷酸表达的其它序列。这种序列包括增强子序列、核糖体结合位点或其它序列如转录终止序列等。

表达编码本发明的CadA变体多肽的多核苷酸的载体可以是自主复制载体，即作为染色体外实体存在的载体，其复制独立于染色体复制，例如质粒、染色体外元件、微染色体或人工染色体。载体可以包含确保自主复制的任何手段。或者，载体可以是这样的载体，当其被引入宿主时被整合进基因组中并与其整合进之中的染色体一起复制。因此，表达载体可另外含有允许载体整合进宿主基因组中的元件。

本发明的表达载体优选含有一或多个选择标记，其允许容易地选择转化的宿主。例如，表达载体可以包含赋予重组宿主生物体例如细菌细胞如大肠杆菌抗生素抗性(例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性)的基因。

虽然任何合适的表达载体均可用于掺入希望的序列，但容易获得的细菌表达载体包括但不限于：质粒如pSClO1，pBR322，pBBR1MCS-3，pUR，pET，pEX，pMR100，pCR4，pBAD24，p15a，pACYC，pUC如pUC18或pUC19，或者衍生自这些质粒的质粒；以及噬菌体如Ml3噬菌体和λ噬菌体。然而，本领域技术人员可以通过常规实验容易地确定任何特定表达载体是否适于任何给定的宿主细胞。例如，可以将表达载体导入宿主细胞中，然后监测所述载体中包含的序列的存活性和表达情况。

可以使用任何熟知的方法将本发明的表达载体导入宿主细胞中，所述方法包括基于氯化钙的方法、电穿孔或者本领域已知的任何其它方法。

宿主细胞

本发明提供了经遗传修饰的宿主细胞，其被工程化为表达本发明的CadA变体多肽。本发明的经遗传修饰的宿主菌株通常包含至少一种额外的遗传修饰，以相对于不具有这一种额外的遗传修饰的对照菌株增强氨基酸或氨基酸衍生物的产生，所述对照菌株例如是野生型菌株或者没有这一种额外的遗传修饰的相同菌株的细胞。“增强氨基酸或氨基酸衍生物的产生的额外的遗传修饰”可以是任何遗传修饰。在一些实施方案中，所述遗传修饰是导入表达参与所述氨基酸或氨基酸衍生物合成的酶的多核苷酸。在一些实施方案中，所述宿主细胞包含多种修饰以相对于野生型宿主细胞增加氨基酸或氨基酸衍生物的产生。

在一些方面，为表达CadA变体多肽对宿主细胞的遗传修饰与修饰宿主细胞以过表达一或多个赖氨酸生物合成多肽联合进行。

在一些实施方案中，宿主细胞可以被遗传修饰以表达影响赖氨酸生物合成的一或多种多肽。示例的赖氨酸生物合成多肽包括大肠杆菌基因SucA、Ppc、AspC、LysC、Asd、DapA、DapB、DapD、ArgD、DapE、DapF、LysA、Ddh、PntAB、CyoABE、GadAB、YbjE、GdhA、GltA、SucC、GadC、AcnB、PflB、ThrA、AceA、AceB、GltB、AceE、SdhA、MurE、SpeE、SpeG、PuuA、PuuP和YgjG，或者来自其它生物体的相应基因。这些基因为本领域已知(见例如Shah et al.,J.Med.Sci.2:152-157,2002；Anastassiadia,S.Recent Patents on Biotechnol.1:11-24,2007)。也见于Kind,et al.,Appl.Microbiol.Biotechnol.91:1287-1296,2011关于参与尸胺产生的基因的综述。示例的编码赖氨酸生物合成多肽的基因在下表中提供。

在一些实施方案中，可以对宿主细胞进行遗传修饰以减弱或降低影响赖氨酸生物合成的一或多种多肽的表达。这些多肽的实例包括大肠杆菌基因Pck、Pgi、DeaD、CitE、MenE、PoxB、AceA、AceB、AceE、RpoC和ThrA，或来自其它生物体的相应基因。这些基因为本领域已知(参见Shah et al.,J.Med.Sci.2:152-157,2002；Anastassiadia,S.RecentPatents on Biotechnol.1:11-24,2007)。也见于Kind,et al.,Appl.Microbiol.Biotechnol.91:1287-1296,2011关于弱化基因以增加尸胺产生的综述。示例的编码其弱化增加赖氨酸生物合成的多肽的基因在下文提供。

蛋白质	基因	EC编号	基因库登录号
				PEP羧激酶(Pck)	pck	4.1.1.49	NP_417862
葡萄糖-6-磷酸异构酶(Pgi)	pgi	5.3.1.9	NP_418449
				DEAD-盒RNA解旋酶(DeaD)	deaD		NP_417631
柠檬酸裂解酶(CitE)	citE	4.1.3.6/4.1.3.34	NP_415149
				o-琥珀酰苯甲酸-CoA连接酶(MenE)	menE	6.2.1.26	NP_416763
丙酮酸氧化酶(PoxB)	poxB	1.2.2.2	NP_415392
				异柠檬酸裂解酶(AceA)	aceA	4.1.3.1	NP_418439
苹果酸合酶A(AceB)	aceB	2.3.3.9	NP_418438
				丙酮酸脱氢酶(aceE)	aceE	1.2.4.1	NP_414656
RNA聚合酶b’亚基(RpoC)	rpoC	2.7.7.6	NP_418415
				天冬氨酸激酶I(ThrA)	thrA	2.7.2.4/1.1.1.3	NP_414543

编码赖氨酸生物合成多肽的核酸可与编码CadA变体多肽的多核苷酸一起导入宿主细胞中，例如在单个表达载体上编码，或同时以多个表达载体导入。或者，可以对宿主细胞进行遗传修饰，以在宿主细胞经遗传修饰以表达CadA变体多肽之前或之后过表达一或多种赖氨酸生物合成多肽。

经工程化以表达CadA变体多肽的宿主细胞通常是细菌宿主细胞。在典型的实施方案中，所述细菌宿主细胞是革兰氏阴性细菌宿主细胞。在本发明的一些实施方案中，所述细菌是肠细菌。在本发明的一些实施方案中，所述细菌是棒杆菌属，埃希氏菌属，假单胞菌属(Pseudomonas)，单胞发酵菌属(Zymomonas)，希瓦氏菌属(Shewanella)，沙门氏菌属(Salmonella)，志贺氏菌属(Shigella)，肠杆菌属(Enterobacter)，柠檬酸杆菌属(Citrobacter)，Cronobacter，欧文氏菌属(Erwinia)，沙雷氏菌属(Serratia)，变形杆菌属(Proteus)，哈夫尼菌属，耶尔森氏菌属(Yersinia)，摩根菌属(Morganella)，爱德华氏菌属(Edwardsiella)或克雷伯氏菌属分类学类别的物种。在一些实施方案中，所述宿主细胞是埃希氏菌属、哈夫尼菌属或者棒杆菌属的成员。在一些实施方案中，所述宿主细胞是大肠杆菌、蜂房哈夫尼菌或者谷氨酸棒杆菌宿主细胞。在一些实施方案中，所述宿主细胞是大肠杆菌。在一些实施方案中，所述宿主细胞是蜂房哈夫尼菌。在一些实施方案中，所述宿主细胞是谷氨酸棒杆菌。在一些实施方案中，来自大肠杆菌或棒杆菌属的经遗传修饰的宿主细胞包含CadA变体多肽，所述CadA变体多肽在相应于参照SEQ ID NO：2确定的氨基酸455-483的区域中具有氨基酸取代，其中所述氨基酸取代不包括参照SEQ ID NO：2在位置D460的取代。在一些实施方案中，所述遗传修饰的宿主细胞包含CadA变体多肽，其中所述CadA变体在相应于参照SEQ ID NO：2确定的氨基酸455-483的区域中在位置D457、H458或D460的至少一个位置包含氨基酸取代，其中所述宿主细胞是除了埃希氏菌属、棒杆菌属、短杆菌属(Brevibacterium)和小杆菌属(Microbacterium)之外的菌属的细胞。

在一些实施方案中，所述宿主细胞是革兰氏阳性细菌宿主细胞，如芽孢杆菌(Bacillus sp.)，例如枯草芽孢杆菌或者地衣芽孢杆菌；或者另一芽孢杆菌如嗜碱芽孢杆菌(B.alcalophilus)，嗜胺芽孢杆菌(B.aminovorans)，解淀粉芽孢杆菌，热熔芽孢杆菌(B.caldolyticus)，环状芽孢杆菌(B.circulans)，嗜热脂肪芽孢杆菌，热葡糖苷酶芽孢杆菌(B.thermoglucosidasius)，苏云金芽孢杆菌(B.thuringiensis)或者B.vulgatis.

如本文所述，可以针对增加的赖氨酸或赖氨酸衍生物如尸胺的产生筛选按照本发明修饰的宿主细胞。

在一些实施方案中，本发明的CadA变体多肽可以从表达所述变体多肽的宿主细胞回收。在一些实施方案中，可以将所述回收的变体蛋白固定在固体基质或惰性材料上以形成固定化酶。在一个实施方案中，所述固定化酶可以较可溶形式变体多肽具有改善的操作稳定性。

产生赖氨酸或者赖氨酸衍生物的方法

经遗传修饰以过表达本发明的CadA变体多肽的宿主细胞可用于产生赖氨酸或赖氨酸的衍生物。在一些实施方案中，所述宿主细胞产生尸胺。因此，例如，为了产生尸胺，可以在适于允许多肽表达和编码用于产生赖氨酸和/或尸胺的酶的基因表达的条件下培养经遗传修饰以表达如本文所述的CadA变体多肽的宿主细胞。根据本发明修饰的表达CadA变体多肽的宿主细胞相对于表达天然CadA的对应宿主细胞提供更高产量的尸胺。在一些实施方案中，与表达野生型CadA的对应宿主细胞达到的相对产量相比，尸胺的相对产量可以为至少125％。

宿主细胞可以使用熟知技术培养(见例如在实施例章节提供的示例条件)。

在一些实施方案中，宿主细胞使用不是盐(例如硫酸铵或者氯化铵)的氮源如氨或尿素培养。在细胞生长或者酶产生期间，宿主细胞可以在碱性pH培养。

赖氨酸或者赖氨酸衍生物可以使用已知技术分离和纯化。根据本发明产生的赖氨酸或者赖氨酸衍生物如尸胺随后可用于任何已知方法中，例如用于产生多胺。

在一些实施方案中，使用化学催化剂或者通过使用酶和化学催化剂可以将赖氨酸转变为己内酰胺。

本发明将通过具体实施例更详细地描述。提供以下实施例是为了说明目的，而不是以任何方式意图限制本发明。本领域技术人员将容易地认识到各种非关键参数，其可以改变或修改以产生基本相同的结果。

实施例

实施例1：计算CadA中组氨酸残基的pKa值

本领域有许多计算蛋白pKa值的方法(Yang,et al.,Proteins 15,252-265,1993；Van Vlijmen HW,et al.,Proteins 33,145-158,1998；Rabenstein B&Knapp EW,Biophysical Journal 80,1141-1150,2001；Kieseritzky G&Knapp EW,Proteins 71,1335-1348,2008；Kilambi KP&Gray JJ,Biophysical J 103,587-595,2012)。对于在文献中测试的大多数氨基酸残基在计算与实验pKa值之间差异为0.5-0.75。在此，我们使用基于线性化Poisson-Boltzmann方程的pKa计算方法预测CadA蛋白中24个组氨酸残基的pKa值。计算的pKa值的概述在表1中示出。

表1：在大肠杆菌的CadA蛋白中24个组氨酸残基的计算的pKa值

残基位置	pKa	残基位置	pKa
				9	6.2	396	2.2
23	6.4	402	-0.8
				152	0.9	458	6.6
193	>20.0	474	-3.1
				197	-6.6	483	-3.6
245	1.1	521	6.1
				250	0.2	594	1.5
282	6.3	599	6.4
				300	-6.4	600	1.8
328	>20.0	629	6.4
				366	2.9	685	6.3
379	-0.7	694	6.3

参照SEQ ID NO：2在位置458的一个组氨酸残基的pKa值与CadA在不同寡聚状态之间转换的pH值相近。根据文献((Kanjee U,et al.The EMBO Journal,30,931-944,2011)，当环境pH值改变时，CadA从由十聚体和高级寡聚物组成的状态转变为主要由二聚体组成的状态。因此，pH的变化可能影响H458，其可滴定基团的pKa值与发生CadA寡聚化转变的pH值相似。

H458具有位于其附近的酸性氨基酸(D457)和位于距离两个氨基酸残基的第二个酸性氨基酸(D460)。D457和D460的酸基团是可滴定的，如果其与H458的侧链的距离小于则可以影响H458的pKa。CadA X射线晶体结构(PDB ID：3N75)分析表明D457的可滴定基团与H458侧链的距离是D460的可滴定基团与H458的侧链的距离是然而，围绕α-碳的D457、H458或D460侧链的旋转可使D457的可滴定基团与H458的距离为与D460的距离近如这两个距离均在通常在蛋白质二级结构元件中的质子供体和受体基团之间发现的范围内。质子供体和受体对之间的典型距离为2.2至其中被认为是强相互作用，而被认为是弱相互作用。感兴趣的是，D457的侧基与H458的侧基即使是相邻的氨基酸也是位于同一面。通常，两个相邻的氨基酸具有位于相反面上的侧基(即彼此面向相反方向)。D460的侧基也位于H458的同一面上，因为其被一个氨基酸隔开。侧基的方向提示D457和D460可影响H458的pKa。假设氨基酸位置457、458和460对于CadA多肽在不同pH的功能是重要的。以下实施例表明，可滴定基团的pKa值与CadA寡聚化转变的pH值相似的一或多个氨基酸的取代可以影响CadA的活性。具体地，实施例示出位置458的组氨酸残基的氨基酸取代或者在位置457和/或460的天冬氨酸残基的氨基酸取代可以增加经遗传修饰表达CadA变体多肽的宿主细胞的尸胺产生。

实施例2：编码CadA的质粒载体的构建

使用PCR引物cadA-F和cadA-R(表11)从大肠杆菌MG1655K12基因组DNA扩增含有编码赖氨酸脱羧酶CadA(SEQ ID NO：2)的野生型大肠杆菌cadA(SEQ ID NO：1)的质粒载体，使用限制酶SacI和XbaI消化，连接到pUC18中以产生质粒pCIB60。使用PCR引物cadA-F2和cadA-R2优化cadA基因上游5'序列以产生pCIB71。

实施例3：编码在D457具有突变的CadA的质粒载体的构建

设计引物对以使用Quickchange PCR修饰pCIB71中cadA基因的位置457的氨基酸。使用DNA测序验证突变，在氨基酸位置457携带每个突变的质粒标记为pCIB71-D457X，其中X是置换天冬氨酸残基的氨基酸。

实施例4：编码在H458具有突变的CadA的质粒载体的构建

设计引物对以使用Quickchange PCR修饰pCIB71中cadA基因的位置458的氨基酸。使用DNA测序验证突变，在氨基酸位置458携带每个突变的质粒标记为pCIB71-H458X，其中X是置换组氨酸残基的氨基酸。

实施例5：编码在D460具有突变的CadA的质粒载体的构建

设计引物对以使用Quickchange PCR修饰pCIB71中cadA基因的位置460的氨基酸。使用DNA测序验证突变，在氨基酸位置460携带每个突变的质粒标记为pCIB71-D460X，其中X是置换天冬氨酸残基的氨基酸。

实施例6：具有D457X突变的突变CadA多肽的赖氨酸脱羧酶活性

将蜂房哈夫尼菌用pCIB71-D457X转化。将来自每次转化的三个单菌落在37℃在含有氨苄青霉素(100μg/mL)的4mL的LB培养基中生长过夜。第二天，将0.7mL的每个过夜培养物加入到0.3mL的赖氨酸-HCl和PLP中，其终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节至pH 8.0。将每种混合物在37℃温育2小时。使用NMR定量每个样品的尸胺产生，将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量计算产量。表2中列出了2小时后每个样品的产量相对于用pCIB71转化的蜂房哈夫尼菌的产量。

表2：表达编码在氨基酸位置457具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产量

质粒	相对产量(％)	质粒	相对产量(％)
				pCIB71	100	pCIB71-D457M	130
pCIB71-D457A	138	pCIB71-D457N	130
				pCIB71-D457C	156	pCIB71-D457P	65
pCIB71-D457E	112	pCIB71-D457Q	0
				pCIB71-D457F	116	pCIB71-D457R	0
pCIB71-D457G	69	pCIB71-D457S	170
				pCIB71-D457H	152	pCIB71-D457T	73
pCIB71-D457I	124	pCIB71-D457V	0
				pCIB71-D457K	126	pCIB71-D457W	117
pCIB71-D457L	147	pCIB71-D457Y	120

如表2所示，在氨基酸位置457的一些不同突变相对于野生型CadA(pCIB71)提高了在pH8的赖氨酸脱羧酶产量。突变D457A、D457C、D457H、D457K、D475L、D457M、D457N和D457S的产量增加25％以上。与野生型CadA相比，突变D457E、D457F、D457I、D457W和D457Y也增加了产量。突变D457G、D457P和D457T降低了产量。突变D457Q、D457R和D457V消除了赖氨酸脱羧酶活性。

实施例7：具有H458X突变的突变CadA多肽的赖氨酸脱羧酶活性

将蜂房哈夫尼菌用pCIB71-H458X转化。将来自每次转化的三个单菌落在37℃在含有氨苄青霉素(100μg/mL)的4mL的LB培养基中生长过夜。第二天，将0.7mL每个过夜培养物加入0.3mL的赖氨酸-HCl和PLP中，其终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节至pH 8.0。将每个混合物在37℃温育2小时。使用NMR定量每个样品的尸胺产生，将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量计算产量。表3示出2小时后每个样品的产量相对于用pCIB71转化的蜂房哈夫尼菌的产量。表3：表达编码在氨基酸位置458具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH 8的相对尸胺产量

质粒	相对产量(％)	质粒	相对产量(％)
				pCIB71	100	pCIB71-H458M	140
pCIB71-H458A	157	pCIB71-H458N	100
				pCIB71-H458C	126	pCIB71-H458P	111
pCIB71-H458D	91	pCIB71-H458Q	91
				pCIB71-H458E	103	pCIB71-H458R	88
pCIB71-H458F	177	pCIB71-H458S	0
				pCIB71-H458G	120	pCIB71-H458T	105
pCIB71-H458I	100	pCIB71-H458V	137
				pCIB71-H458K	89	pCIB71-H458W	165
pCIB71-H458L	94	pCIB71-H458Y	151

如表3所示，在氨基酸位置458的一些不同突变相对于野生型CadA(pCIB71)在pH8提高了尸胺产量。突变H458A、H458C、H458F、H458M、H458V、H458W和H458Y使产量增加超过25％。与野生型CadA相比，突变H458G和H458P也增加了产量。突变H458D、H458E、H458K、H458L、H458N、H458Q、H458R和H458T对产量几乎没有影响。突变H458S消除了赖氨酸脱羧酶活性。

实施例8：具有D460X突变的突变CadA多肽的赖氨酸脱羧酶活性

将蜂房哈夫尼菌用pCIB71-D460X转化。将每次转化的三个单菌落在37℃在含有氨苄青霉素(100μg/mL)的4mL的LB培养基中生长过夜。第二天，将0.7mL的每个过夜培养物加入0.3mL的赖氨酸-HCl和PLP中，其终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节至pH 8.0。将每个混合物在37℃温育2小时。使用NMR定量每个样品的尸胺产生，将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量计算产量。表4示出2小时后每个样品的产量相对于用pCIB71转化的蜂房哈夫尼菌菌株的产量。

表4：表达编码在氨基酸位置460具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH 8的相对尸胺产量

质粒	相对产量(％)	质粒	相对产量(％)
				pCIB71	100	pCIB71-D460M	97
pCIB71-D460A	93	pCIB71-D460N	0
				pCIB71-D460C	168	pCIB71-D460P	66
pCIB71-D460E	71	pCIB71-D460Q	155
				pCIB71-D460F	152	pCIB71-D460R	0
pCIB71-D460G	86	pCIB71-D460S	159
				pCIB71-D460H	77	pCIB71-D460T	75
pCIB71-D460I	169	pCIB71-D460V	175
				pCIB71-D460K	69	pCIB71-D460W	163
pCIB71-D460L	50	pCIB71-D460Y	102

如表4所示，氨基酸位置460的一些突变提高了在pH8.0的CadA多肽的活性。突变D460C、D460F、D460I、D460Q、D460S、D460I、D460V和D460W使相对尸胺产量增加超过25％。突变D460A、D460G、D460M和D460Y对产量几乎没有影响。突变D460N和D460R消除了活性。剩余的突变D460E、D460H、D460K、D460L、D460P和D460T对尸胺产量具有负面影响。

实施例9：野生型和突变CadA多肽在碱性pH条件的体外动力学分析

根据文献报道，CadA的活性在pH 8由于从高寡聚物状态至二聚体状态的结构变化而显著低于其在pH 6的活性。比较野生型和突变CadA多肽在pH 6和pH 8的活性，以确定所述突变是否可以增加CadA多肽对碱性条件的耐受性。

用弗氏压碎器裂解用pCIB71、pCIB71-D457S、pCIB71-H458F或pCIB71-D460V转化的100mL蜂房哈夫尼菌样品。将裂解的样品离心，并将上清液与沉淀物分离以进行体外实验。每个反应均在具有120g/L赖氨酸-HCl和0.1mM PLP的Tris-HCl缓冲液(50mM Tris-HCl，pH6或8，25mM NaCl，2mM EDTA)中进行。使用NMR测量每个裂解样品的反应速率，通过在PLP存在下每1.6分钟取样转变为尸胺的赖氨酸的量，共20分钟，并获取产量曲线的线性部分的斜率进行。稀释样品以使裂解样品的反应速率每体积(mmol/min/mL，U)相同。稀释样品以使每个样品的U为0.5。使用相同的U在pH 6或pH8的初始pH测量每个裂解样品的赖氨酸的动力学常数Vmax。通过对U标准化，每个样品中活性酶的浓度是相同的。两个样品的动力学分析的结果如表5所示。

表5：在不同pH条件下表达编码野生型或突变CadA多肽的质粒的蜂房哈夫尼菌的裂解样品的标准化Vmax的动力学分析

pH	pCIB71	pCIB71-D457S	pCIB71-H458F	pCIB71-D460V
					6	100％	101％	100％	102％
8	49％	72％	70％	70％

根据文献报道，野生型CadA(pCIB71)在pH8与在pH 6相比活性显著丧失。在pH 8的活性与在pH 6的活性相比降低51％。令人惊奇地，突变CadA多肽(D457S、H458F和D460V)均比野生型CadA在pH8示出更高的活性。

实施例10：突变CadA多肽的尸胺产生的时程

将蜂房哈夫尼菌用pCIB71或pCIB71-D460V转化。将每次转化的三个单菌落在37℃在含有氨苄青霉素(100μg/mL)的10mL的LB培养基中生长过夜。第二天，将每个过夜培养物等分进代表不同的时间点的8个单独的试管中，每个试管含有0.7mL过夜培养物、0.3mL赖氨酸-HCl(终浓度120g/L)和PLP(终浓度0.1mM)。用1M NaOH将每个试管中的最终混合物调节至pH 8.0。将每个混合物在37℃温育并以220rpm摇动。在每个时间点，取出每个菌落的样品进行分析。使用NMR定量每个样品产生的尸胺产生，将产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量计算产量。每个时间点的产量列于表6中。

表6：在不同时间点在pH 8.0表达编码野生型和突变CadA多肽的质粒的蜂房哈夫尼菌的尸胺产量

时间点(分钟)	pCIB71	pCIB71-D460V
			60	7.22	51.6
120	17.5	77.3
			180	30.7	97.5
240	50.4	98.1
			300	73.4	100
360	85.8	100
			420	86.0	100
480	88.5	100

如表6所示，与野生型CadA(pCIB71)相比，过表达突变体CadA D460V的细胞在pH8.0更快速地将赖氨酸转化为尸胺。240分钟后，突变体CadA转化98.1％的赖氨酸，而野生型CadA仅将50％的赖氨酸转化为尸胺。300分钟后，突变体CadA完成赖氨酸至尸胺转化，而野生型CadA即使在480分钟后也未完成转化。

表7：实施例中使用的质粒和菌株表

表8：实施例中使用的引物序列表

示例序列：

SEQ ID NO：1大肠杆菌cadA核酸序列

ATGAACGTTATTGCAATATTGAATCACATGGGGGTTTATTTTAAAGAAGAACCCATCCGTGAACTTCATCGCGCGCTTGAACGTCTGAACTTCCAGATTGTTTACCCGAACGACCGTGACGACTTATTAAAACTGATCGAAAACAATGCGCGTCTGTGCGGCGTTATTTTTGACTGGGATAAATATAATCTCGAGCTGTGCGAAGAAATTAGCAAAATGAACGAGAACCTGCCGTTGTACGCGTTCGCTAATACGTATTCCACTCTCGATGTAAGCCTGAATGACCTGCGTTTACAGATTAGCTTCTTTGAATATGCGCTGGGTGCTGCTGAAGATATTGCTAATAAGATCAAGCAGACCACTGACGAATATATCAACACTATTCTGCCTCCGCTGACTAAAGCACTGTTTAAATATGTTCGTGAAGGTAAATATACTTTCTGTACTCCTGGTCACATGGGCGGTACTGCATTCCAGAAAAGCCCGGTAGGTAGCCTGTTCTATGATTTCTTTGGTCCGAATACCATGAAATCTGATATTTCCATTTCAGTATCTGAACTGGGTTCTCTGCTGGATCACAGTGGTCCACACAAAGAAGCAGAACAGTATATCGCTCGCGTCTTTAACGCAGACCGCAGCTACATGGTGACCAACGGTACTTCCACTGCGAACAAAATTGTTGGTATGTACTCTGCTCCAGCAGGCAGCACCATTCTGATTGACCGTAACTGCCACAAATCGCTGACCCACCTGATGATGATGAGCGATGTTACGCCAATCTATTTCCGCCCGACCCGTAACGCTTACGGTATTCTTGGTGGTATCCCACAGAGTGAATTCCAGCACGCTACCATTGCTAAGCGCGTGAAAGAAACACCAAACGCAACCTGGCCGGTACATGCTGTAATTACCAACTCTACCTATGATGGTCTGCTGTACAACACCGACTTCATCAAGAAAACACTGGATGTGAAATCCATCCACTTTGACTCCGCGTGGGTGCCTTACACCAACTTCTCACCGATTTACGAAGGTAAATGCGGTATGAGCGGTGGCCGTGTAGAAGGGAAAGTGATTTACGAAACCCAGTCCACTCACAAACTGCTGGCGGCGTTCTCTCAGGCTTCCATGATCCACGTTAAAGGTGACGTAAACGAAGAAACCTTTAACGAAGCCTACATGATGCACACCACCACTTCTCCGCACTACGGTATCGTGGCGTCCACTGAAACCGCTGCGGCGATGATGAAAGGCAATGCAGGTAAGCGTCTGATCAACGGTTCTATTGAACGTGCGATCAAATTCCGTAAAGAGATCAAACGTCTGAGAACGGAATCTGATGGCTGGTTCTTTGATGTATGGCAGCCGGATCATATCGATACGACTGAATGCTGGCCGCTGCGTTCTGACAGCACCTGGCACGGCTTCAAAAACATCGATAACGAGCACATGTATCTTGACCCGATCAAAGTCACCCTGCTGACTCCGGGGATGGAAAAAGACGGCACCATGAGCGACTTTGGTATTCCGGCCAGCATCGTGGCGAAATACCTCGACGAACATGGCATCGTTGTTGAGAAAACCGGTCCGTATAACCTGCTGTTCCTGTTCAGCATCGGTATCGATAAGACCAAAGCACTGAGCCTGCTGCGTGCTCTGACTGACTTTAAACGTGCGTTCGACCTGAACCTGCGTGTGAAAAACATGCTGCCGTCTCTGTATCGTGAAGATCCTGAATTCTATGAAAACATGCGTATTCAGGAACTGGCTCAGAATATCCACAAACTGATTGTTCACCACAATCTGCCGGATCTGATGTATCGCGCATTTGAAGTGCTGCCGACGATGGTAATGACTCCGTATGCTGCATTCCAGAAAGAGCTGCACGGTATGACCGAAGAAGTTTACCTCGACGAAATGGTAGGTCGTATTAACGCCAATATGATCCTTCCGTACCCGCCGGGAGTTCCTCTGGTAATGCCGGGTGAAATGATCACCGAAGAAAGCCGTCCGGTTCTGGAGTTCCTGCAGATGCTGTGTGAAATCGGCGCTCACTATCCGGGCTTTGAAACCGATATTCACGGTGCATACCGTCAGGCTGATGGCCGCTATACCGTTAAGGTATTGAAAGAAGAAAGCAAAAAATAA

SEQ ID NO：2CadA多肽序列

MNVIAILNHMGVYFKEEPIRELHRALERLNFQIVYPNDRDDLLKLIENNARLCGVIFDWDKYNLELCEEISKMNENLPLYAFANTYSTLDVSLNDLRLQISFFEYALGAAEDIANKIKQTTDEYINTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSLFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEQYIARVFNADRSYMVTNGTSTANKIVGMYSAPAGSTILIDRNCHKSLTHLMMMSDVTPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLINGSIERAIKFRKEIKRLRTESDGWFFDVWQPDHIDTTECWPLRSDSTWHGFKNIDNEHMYLDPIKVTLLTPGMEKDGTMSDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQELAQNIHKLIVHHNLPDLMYRAFEVLPTMVMTPYAAFQKELHGMTEEVYLDEMVGRINANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQA DGRYTVKVLKEESKK

SEQ ID NO：3与大肠杆菌CadA同源的克雷伯氏菌多肽

MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDRDDLLKLIENNSRLCGVIFDWDKYNLELCEEISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGPECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQDLAQNIHKLIEHHNLPDLMFRAFEVLPSMVMTPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK

SEQ ID NO：4与大肠杆菌CadA同源的肠杆菌科多肽

MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDRDDLLKLIENNSRLCGVIFDWDKYNLELCEEISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGPECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQDLAQNIHKLIEHHNLPDLMFRAFEVLPSMVMTPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK

SEQ ID NO：5与大肠杆菌CadA同源的肠道沙门氏菌多肽

MNVIAIMNHMGVYFKEEPIRELHRALEGLNFRIVYPNDREDLLKLIENNSRLCGVIFDWDKYNLELCEEISKLNEYMPLYAFANSYSTLDVSLNDLRMQVRFFEYALGAATDIAAKIRQNTDEYIDNILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYQGKCGMSGDRVEGKIIYETQSTHKLLAAFSQASMIHVKGDINEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLINGSIERAIKFRKEIKRLKSESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTILTPGMKKDGTMDEFGIPASLVAKYLDERGIIVEKTGPYNLLFLFSIGIDKTKALSLLRALTEFKRAFDLNLRVKNILPALYREAPEFYENMRIQELAQNIHKLVEHHNLPDLMYRAFEVLPKMVMTPYTAFQKELHGETEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKENTK

序列表

<110> 上海凯赛生物技术研发中心有限公司

CIBT美国公司

<120> 在可滴定氨基酸具有修饰的赖氨酸脱羧酶

<130> P2019TC3103CB

<160> 121

<170> PatentIn version 3.5

<210> 1

<211> 2148

<212> DNA

<213> Escherichia coli

<400> 1

atgaacgtta ttgcaatatt gaatcacatg ggggtttatt ttaaagaaga acccatccgt 60

gaacttcatc gcgcgcttga acgtctgaac ttccagattg tttacccgaa cgaccgtgac 120

gacttattaa aactgatcga aaacaatgcg cgtctgtgcg gcgttatttt tgactgggat 180

aaatataatc tcgagctgtg cgaagaaatt agcaaaatga acgagaacct gccgttgtac 240

gcgttcgcta atacgtattc cactctcgat gtaagcctga atgacctgcg tttacagatt 300

agcttctttg aatatgcgct gggtgctgct gaagatattg ctaataagat caagcagacc 360

actgacgaat atatcaacac tattctgcct ccgctgacta aagcactgtt taaatatgtt 420

cgtgaaggta aatatacttt ctgtactcct ggtcacatgg gcggtactgc attccagaaa 480

agcccggtag gtagcctgtt ctatgatttc tttggtccga ataccatgaa atctgatatt 540

tccatttcag tatctgaact gggttctctg ctggatcaca gtggtccaca caaagaagca 600

gaacagtata tcgctcgcgt ctttaacgca gaccgcagct acatggtgac caacggtact 660

tccactgcga acaaaattgt tggtatgtac tctgctccag caggcagcac cattctgatt 720

gaccgtaact gccacaaatc gctgacccac ctgatgatga tgagcgatgt tacgccaatc 780

tatttccgcc cgacccgtaa cgcttacggt attcttggtg gtatcccaca gagtgaattc 840

cagcacgcta ccattgctaa gcgcgtgaaa gaaacaccaa acgcaacctg gccggtacat 900

gctgtaatta ccaactctac ctatgatggt ctgctgtaca acaccgactt catcaagaaa 960

acactggatg tgaaatccat ccactttgac tccgcgtggg tgccttacac caacttctca 1020

ccgatttacg aaggtaaatg cggtatgagc ggtggccgtg tagaagggaa agtgatttac 1080

gaaacccagt ccactcacaa actgctggcg gcgttctctc aggcttccat gatccacgtt 1140

aaaggtgacg taaacgaaga aacctttaac gaagcctaca tgatgcacac caccacttct 1200

ccgcactacg gtatcgtggc gtccactgaa accgctgcgg cgatgatgaa aggcaatgca 1260

ggtaagcgtc tgatcaacgg ttctattgaa cgtgcgatca aattccgtaa agagatcaaa 1320

cgtctgagaa cggaatctga tggctggttc tttgatgtat ggcagccgga tcatatcgat 1380

acgactgaat gctggccgct gcgttctgac agcacctggc acggcttcaa aaacatcgat 1440

aacgagcaca tgtatcttga cccgatcaaa gtcaccctgc tgactccggg gatggaaaaa 1500

gacggcacca tgagcgactt tggtattccg gccagcatcg tggcgaaata cctcgacgaa 1560

catggcatcg ttgttgagaa aaccggtccg tataacctgc tgttcctgtt cagcatcggt 1620

atcgataaga ccaaagcact gagcctgctg cgtgctctga ctgactttaa acgtgcgttc 1680

gacctgaacc tgcgtgtgaa aaacatgctg ccgtctctgt atcgtgaaga tcctgaattc 1740

tatgaaaaca tgcgtattca ggaactggct cagaatatcc acaaactgat tgttcaccac 1800

aatctgccgg atctgatgta tcgcgcattt gaagtgctgc cgacgatggt aatgactccg 1860

tatgctgcat tccagaaaga gctgcacggt atgaccgaag aagtttacct cgacgaaatg 1920

gtaggtcgta ttaacgccaa tatgatcctt ccgtacccgc cgggagttcc tctggtaatg 1980

ccgggtgaaa tgatcaccga agaaagccgt ccggttctgg agttcctgca gatgctgtgt 2040

gaaatcggcg ctcactatcc gggctttgaa accgatattc acggtgcata ccgtcaggct 2100

gatggccgct ataccgttaa ggtattgaaa gaagaaagca aaaaataa 2148

<210> 2

<211> 715

<212> PRT

<213> Escherichia coli

<400> 2

Met Asn Val Ile Ala Ile Leu Asn His Met Gly Val Tyr Phe Lys Glu

1 5 10 15

Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asn Phe Gln

20 25 30

Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn

35 40 45

Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu

50 55 60

Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Asn Leu Pro Leu Tyr

65 70 75 80

Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu

85 90 95

Arg Leu Gln Ile Ser Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp

100 105 110

Ile Ala Asn Lys Ile Lys Gln Thr Thr Asp Glu Tyr Ile Asn Thr Ile

115 120 125

Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys

130 135 140

Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys

145 150 155 160

Ser Pro Val Gly Ser Leu Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met

165 170 175

Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp

180 185 190

His Ser Gly Pro His Lys Glu Ala Glu Gln Tyr Ile Ala Arg Val Phe

195 200 205

Asn Ala Asp Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn

210 215 220

Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Ile Leu Ile

225 230 235 240

Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp

245 250 255

Val Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu

260 265 270

Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg

275 280 285

Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr

290 295 300

Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys

305 310 315 320

Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr

325 330 335

Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly

340 345 350

Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu

355 360 365

Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val

370 375 380

Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser

385 390 395 400

Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met

405 410 415

Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala

420 425 430

Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Arg Thr Glu Ser Asp Gly

435 440 445

Trp Phe Phe Asp Val Trp Gln Pro Asp His Ile Asp Thr Thr Glu Cys

450 455 460

Trp Pro Leu Arg Ser Asp Ser Thr Trp His Gly Phe Lys Asn Ile Asp

465 470 475 480

Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro

485 490 495

Gly Met Glu Lys Asp Gly Thr Met Ser Asp Phe Gly Ile Pro Ala Ser

500 505 510

Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr

515 520 525

Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr

530 535 540

Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe

545 550 555 560

Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu

565 570 575

Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn

580 585 590

Ile His Lys Leu Ile Val His His Asn Leu Pro Asp Leu Met Tyr Arg

595 600 605

Ala Phe Glu Val Leu Pro Thr Met Val Met Thr Pro Tyr Ala Ala Phe

610 615 620

Gln Lys Glu Leu His Gly Met Thr Glu Glu Val Tyr Leu Asp Glu Met

625 630 635 640

Val Gly Arg Ile Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val

645 650 655

Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val

660 665 670

Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly

675 680 685

Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr

690 695 700

Thr Val Lys Val Leu Lys Glu Glu Ser Lys Lys

705 710 715

<210> 3

<211> 715

<212> PRT

<213> Klebsiella

<400> 3

Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu

1 5 10 15

Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg

20 25 30

Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn

35 40 45

Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu

50 55 60

Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr

65 70 75 80

Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu

85 90 95

Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp

100 105 110

Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile

115 120 125

Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys

130 135 140

Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys

145 150 155 160

Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met

165 170 175

Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp

180 185 190

His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe

195 200 205

Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn

210 215 220

Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile

225 230 235 240

Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp

245 250 255

Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu

260 265 270

Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg

275 280 285

Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr

290 295 300

Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys

305 310 315 320

Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr

325 330 335

Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly

340 345 350

Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu

355 360 365

Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val

370 375 380

Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser

385 390 395 400

Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met

405 410 415

Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser

420 425 430

Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly

435 440 445

Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Pro Glu Cys

450 455 460

Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp

465 470 475 480

Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro

485 490 495

Gly Met Lys Lys Asp Gly Thr Met Asp Asp Phe Gly Ile Pro Ala Ser

500 505 510

Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr

515 520 525

Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr

530 535 540

Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe

545 550 555 560

Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu

565 570 575

Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Asp Leu Ala Gln Asn

580 585 590

Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg

595 600 605

Ala Phe Glu Val Leu Pro Ser Met Val Met Thr Pro Tyr Ala Ala Phe

610 615 620

Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met

625 630 635 640

Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val

645 650 655

Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val

660 665 670

Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly

675 680 685

Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr

690 695 700

Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys

705 710 715

<210> 4

<211> 715

<212> PRT

<213> Enterobacteriaceae

<400> 4

Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu

1 5 10 15

Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg

20 25 30

Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn

35 40 45

Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu

50 55 60

Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr

65 70 75 80

Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu

85 90 95

Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp

100 105 110

Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile

115 120 125

Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys

130 135 140

Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys

145 150 155 160

Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met

165 170 175

Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp

180 185 190

His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe

195 200 205

Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn

210 215 220

Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile

225 230 235 240

Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp

245 250 255

Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu

260 265 270

Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg

275 280 285

Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr

290 295 300

Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys

305 310 315 320

Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr

325 330 335

Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly

340 345 350

Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu

355 360 365

Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val

370 375 380

Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser

385 390 395 400

Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met

405 410 415

Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser

420 425 430

Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly

435 440 445

Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Pro Glu Cys

450 455 460

Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp

465 470 475 480

Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro

485 490 495

Gly Met Lys Lys Asp Gly Thr Met Asp Asp Phe Gly Ile Pro Ala Ser

500 505 510

Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr

515 520 525

Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr

530 535 540

Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe

545 550 555 560

Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu

565 570 575

Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Asp Leu Ala Gln Asn

580 585 590

Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg

595 600 605

Ala Phe Glu Val Leu Pro Ser Met Val Met Thr Pro Tyr Ala Ala Phe

610 615 620

Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met

625 630 635 640

Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val

645 650 655

Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val

660 665 670

Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly

675 680 685

Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr

690 695 700

Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys

705 710 715

<210> 5

<211> 714

<212> PRT

<213> Salmonella enterica

<400> 5

Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu

1 5 10 15

Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Gly Leu Asn Phe Arg

20 25 30

Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn

35 40 45

Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu

50 55 60

Glu Leu Cys Glu Glu Ile Ser Lys Leu Asn Glu Tyr Met Pro Leu Tyr

65 70 75 80

Ala Phe Ala Asn Ser Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu

85 90 95

Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Thr Asp

100 105 110

Ile Ala Ala Lys Ile Arg Gln Asn Thr Asp Glu Tyr Ile Asp Asn Ile

115 120 125

Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys

130 135 140

Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys

145 150 155 160

Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met

165 170 175

Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp

180 185 190

His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe

195 200 205

Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn

210 215 220

Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile

225 230 235 240

Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp

245 250 255

Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu

260 265 270

Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg

275 280 285

Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr

290 295 300

Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys

305 310 315 320

Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr

325 330 335

Thr Asn Phe Ser Pro Ile Tyr Gln Gly Lys Cys Gly Met Ser Gly Asp

340 345 350

Arg Val Glu Gly Lys Ile Ile Tyr Glu Thr Gln Ser Thr His Lys Leu

355 360 365

Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Ile

370 375 380

Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser

385 390 395 400

Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met

405 410 415

Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala

420 425 430

Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Ser Glu Ser Asp Gly

435 440 445

Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys

450 455 460

Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp

465 470 475 480

Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Ile Leu Thr Pro

485 490 495

Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser

500 505 510

Leu Val Ala Lys Tyr Leu Asp Glu Arg Gly Ile Ile Val Glu Lys Thr

515 520 525

Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr

530 535 540

Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Glu Phe Lys Arg Ala Phe

545 550 555 560

Asp Leu Asn Leu Arg Val Lys Asn Ile Leu Pro Ala Leu Tyr Arg Glu

565 570 575

Ala Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn

580 585 590

Ile His Lys Leu Val Glu His His Asn Leu Pro Asp Leu Met Tyr Arg

595 600 605

Ala Phe Glu Val Leu Pro Lys Met Val Met Thr Pro Tyr Thr Ala Phe

610 615 620

Gln Lys Glu Leu His Gly Glu Thr Glu Glu Val Tyr Leu Glu Glu Met

625 630 635 640

Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val

645 650 655

Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val

660 665 670

Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly

675 680 685

Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr

690 695 700

Thr Val Lys Val Leu Lys Glu Asn Thr Lys

705 710

<210> 6

<211> 52

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer cadA-F

<400> 6

ggcgagctca cacaggaaac agaccatgaa cgttattgca atattgaatc ac 52

<210> 7

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer cadA-R

<400> 7

ggctctagac cacttccctt gtacgagc 28

<210> 8

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer cadA-F2

<400> 8

atttcacaca ggaaacagct atgaacgtta ttgcaatatt gaat 44

<210> 9

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer cadA-R2

<400> 9

agctgtttcc tgtgtgaaat 20

<210> 10

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457C-F

<400> 10

tggcagccgt gtcatatcga tacgactgaa tg 32

<210> 11

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457C-R

<400> 11

atcgatatga cacggctgcc atacatcaaa g 31

<210> 12

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457A-F

<400> 12

tggcagccgg cgcatatcga tacgactgaa tg 32

<210> 13

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457A-R

<400> 13

atcgatatgc gccggctgcc atacatcaaa g 31

<210> 14

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457H-F

<400> 14

tggcagccgc atcatatcga tacgactgaa tg 32

<210> 15

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457H-R

<400> 15

atcgatatga tgcggctgcc atacatcaaa g 31

<210> 16

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457K-F

<400> 16

tggcagccga aacatatcga tacgactgaa tg 32

<210> 17

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457K-R

<400> 17

atcgatatgt ttcggctgcc atacatcaaa g 31

<210> 18

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457R-F

<400> 18

tggcagccgc gtcatatcga tacgactgaa tg 32

<210> 19

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457R-R

<400> 19

atcgatatga cgcggctgcc atacatcaaa g 31

<210> 20

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457L-F

<400> 20

tggcagccgc tgcatatcga tacgactgaa tg 32

<210> 21

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457L-R

<400> 21

atcgatatgc agcggctgcc atacatcaaa g 31

<210> 22

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457S-F

<400> 22

tggcagccga gccatatcga tacgactgaa tg 32

<210> 23

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457S-R

<400> 23

atcgatatgg ctcggctgcc atacatcaaa g 31

<210> 24

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457P-F

<400> 24

tggcagccgc cgcatatcga tacgactgaa tg 32

<210> 25

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457P-R

<400> 25

atcgatatgc ggcggctgcc atacatcaaa g 31

<210> 26

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457E-F

<400> 26

tggcagccgg aacatatcga tacgactgaa tg 32

<210> 27

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457E-R

<400> 27

atcgatatgt tccggctgcc atacatcaaa g 31

<210> 28

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457T-F

<400> 28

tggcagccga cccatatcga tacgactgaa tg 32

<210> 29

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457T-R

<400> 29

atcgatatgg gtcggctgcc atacatcaaa g 31

<210> 30

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457Y-F

<400> 30

tggcagccgt atcatatcga tacgactgaa tg 32

<210> 31

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457Y-R

<400> 31

atcgatatga tacggctgcc atacatcaaa g 31

<210> 32

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457G-F

<400> 32

tggcagccgg gccatatcga tacgactgaa tg 32

<210> 33

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457G-R

<400> 33

atcgatatgg cccggctgcc atacatcaaa g 31

<210> 34

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457V-F

<400> 34

tggcagccgg tgcatatcga tacgactgaa tg 32

<210> 35

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457V-R

<400> 35

atcgatatgc accggctgcc atacatcaaa g 31

<210> 36

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457F-F

<400> 36

tggcagccgt ttcatatcga tacgactgaa tg 32

<210> 37

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457F-R

<400> 37

atcgatatga aacggctgcc atacatcaaa g 31

<210> 38

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457N-F

<400> 38

tggcagccga accatatcga tacgactgaa tg 32

<210> 39

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457N-R

<400> 39

atcgatatgg ttcggctgcc atacatcaaa g 31

<210> 40

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457Q-F

<400> 40

tggcagccgc agcatatcga tacgactgaa tg 32

<210> 41

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457Q-R

<400> 41

atcgatatgc tgcggctgcc atacatcaaa g 31

<210> 42

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457I-F

<400> 42

tggcagccga tccatatcga tacgactgaa tg 32

<210> 43

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457I-R

<400> 43

atcgatatgg atcggctgcc atacatcaaa g 31

<210> 44

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457M-F

<400> 44

tggcagccga tgcatatcga tacgactgaa tg 32

<210> 45

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457M-R

<400> 45

atcgatatgc atcggctgcc atacatcaaa g 31

<210> 46

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457W-F

<400> 46

tggcagccgt ggcatatcga tacgactgaa tg 32

<210> 47

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D457W-R

<400> 47

atcgatatgc cacggctgcc atacatcaaa g 31

<210> 48

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460C-F

<400> 48

ggatcatatc tgcacgactg aatgctggcc gctgcgttc 39

<210> 49

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460C-R

<400> 49

attcagtcgt gcagatatga tccggctgcc atacatcaa 39

<210> 50

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460H-F

<400> 50

ggatcatatc catacgactg aatgctggcc gctgcgttc 39

<210> 51

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460H-R

<400> 51

attcagtcgt atggatatga tccggctgcc atacatcaa 39

<210> 52

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460K-F

<400> 52

ggatcatatc aaaacgactg aatgctggcc gctgcgttc 39

<210> 53

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460K-R

<400> 53

attcagtcgt tttgatatga tccggctgcc atacatcaa 39

<210> 54

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460R-F

<400> 54

ggatcatatc cgtacgactg aatgctggcc gctgcgttc 39

<210> 55

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460R-R

<400> 55

attcagtcgt acggatatga tccggctgcc atacatcaa 39

<210> 56

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460L-F

<400> 56

ggatcatatc ctgacgactg aatgctggcc gctgcgttc 39

<210> 57

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460L-R

<400> 57

attcagtcgt caggatatga tccggctgcc atacatcaa 39

<210> 58

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460S-F

<400> 58

ggatcatatc agcacgactg aatgctggcc gctgcgttc 39

<210> 59

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460S-R

<400> 59

attcagtcgt gctgatatga tccggctgcc atacatcaa 39

<210> 60

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460P-F

<400> 60

ggatcatatc ccgacgactg aatgctggcc gctgcgttc 39

<210> 61

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460P-R

<400> 61

attcagtcgt cgggatatga tccggctgcc atacatcaa 39

<210> 62

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460E-F

<400> 62

ggatcatatc gaaacgactg aatgctggcc gctgcgttc 39

<210> 63

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460E-R

<400> 63

attcagtcgt ttcgatatga tccggctgcc atacatcaa 39

<210> 64

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460T-F

<400> 64

ggatcatatc accacgactg aatgctggcc gctgcgttc 39

<210> 65

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460T-R

<400> 65

attcagtcgt ggtgatatga tccggctgcc atacatcaa 39

<210> 66

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460Y-F

<400> 66

ggatcatatc tatacgactg aatgctggcc gctgcgttc 39

<210> 67

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460Y-R

<400> 67

attcagtcgt atagatatga tccggctgcc atacatcaa 39

<210> 68

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460A-F

<400> 68

ggatcatatc gcgacgactg aatgctggcc gctgcgttc 39

<210> 69

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460A-R

<400> 69

attcagtcgt cgcgatatga tccggctgcc atacatcaa 39

<210> 70

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460G-F

<400> 70

ggatcatatc ggcacgactg aatgctggcc gctgcgttc 39

<210> 71

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460G-R

<400> 71

attcagtcgt gccgatatga tccggctgcc atacatcaa 39

<210> 72

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460V-F

<400> 72

ggatcatatc gtgacgactg aatgctggcc gctgcgttc 39

<210> 73

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460V-R

<400> 73

attcagtcgt cacgatatga tccggctgcc atacatcaa 39

<210> 74

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460F-F

<400> 74

ggatcatatc tttacgactg aatgctggcc gctgcgttc 39

<210> 75

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460F-R

<400> 75

attcagtcgt aaagatatga tccggctgcc atacatcaa 39

<210> 76

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460N-F

<400> 76

ggatcatatc aacacgactg aatgctggcc gctgcgttc 39

<210> 77

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460N-R

<400> 77

attcagtcgt gttgatatga tccggctgcc atacatcaa 39

<210> 78

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460Q-F

<400> 78

ggatcatatc cagacgactg aatgctggcc gctgcgttc 39

<210> 79

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460Q-R

<400> 79

attcagtcgt ctggatatga tccggctgcc atacatcaa 39

<210> 80

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460I-F

<400> 80

ggatcatatc atcacgactg aatgctggcc gctgcgttc 39

<210> 81

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460I-R

<400> 81

attcagtcgt gatgatatga tccggctgcc atacatcaa 39

<210> 82

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460M-F

<400> 82

ggatcatatc atgacgactg aatgctggcc gctgcgttc 39

<210> 83

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460M-R

<400> 83

attcagtcgt catgatatga tccggctgcc atacatcaa 39

<210> 84

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460W-F

<400> 84

ggatcatatc tggacgactg aatgctggcc gctgcgttc 39

<210> 85

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer D460W-R

<400> 85

attcagtcgt ccagatatga tccggctgcc atacatcaa 39

<210> 86

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458F-F

<400> 86

atggcagccg gatttcatcg atacgactga atgctg 36

<210> 87

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458F-R

<400> 87

agtcgtatcg atgaaatccg gctgccatac atcaaagaac 40

<210> 88

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458L-F

<400> 88

atggcagccg gatctaatcg atacgactga atgctg 36

<210> 89

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458L-R

<400> 89

agtcgtatcg attagatccg gctgccatac atcaaagaac 40

<210> 90

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458S-F

<400> 90

atggcagccg gattgaatcg atacgactga atgctg 36

<210> 91

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458S-R

<400> 91

agtcgtatcg attcaatccg gctgccatac atcaaagaac 40

<210> 92

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458Y-F

<400> 92

atggcagccg gattacatcg atacgactga atgctg 36

<210> 93

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458Y-R

<400> 93

agtcgtatcg atgtaatccg gctgccatac atcaaagaac 40

<210> 94

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458P-F

<400> 94

atggcagccg gatccaatcg atacgactga atgctg 36

<210> 95

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458P-R

<400> 95

agtcgtatcg attggatccg gctgccatac atcaaagaac 40

<210> 96

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458Q-F

<400> 96

atggcagccg gatcaaatcg atacgactga atgctg 36

<210> 97

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458Q-R

<400> 97

agtcgtatcg atttgatccg gctgccatac atcaaagaac 40

<210> 98

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458R-F

<400> 98

atggcagccg gatcgtatcg atacgactga atgctg 36

<210> 99

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458R-R

<400> 99

agtcgtatcg atacgatccg gctgccatac atcaaagaac 40

<210> 100

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458W-F

<400> 100

atggcagccg gattggatcg atacgactga atgctg 36

<210> 101

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458W-R

<400> 101

agtcgtatcg atccaatccg gctgccatac atcaaagaac 40

<210> 102

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458I-F

<400> 102

atggcagccg gatatcatcg atacgactga atgctg 36

<210> 103

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458I-R

<400> 103

agtcgtatcg atgatatccg gctgccatac atcaaagaac 40

<210> 104

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458T-F

<400> 104

atggcagccg gatactatcg atacgactga atgctg 36

<210> 105

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458T-R

<400> 105

agtcgtatcg atagtatccg gctgccatac atcaaagaac 40

<210> 106

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458D-F

<400> 106

atggcagccg gatgatatcg atacgactga atgctg 36

<210> 107

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458D-R

<400> 107

agtcgtatcg atatcatccg gctgccatac atcaaagaac 40

<210> 108

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458K-F

<400> 108

atggcagccg gataagatcg atacgactga atgctg 36

<210> 109

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458K-R

<400> 109

agtcgtatcg atcttatccg gctgccatac atcaaagaac 40

<210> 110

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458N-F

<400> 110

atggcagccg gataacatcg atacgactga atgctg 36

<210> 111

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458N-R

<400> 111

agtcgtatcg atgttatccg gctgccatac atcaaagaac 40

<210> 112

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458E-F

<400> 112

atggcagccg gatgaaatcg atacgactga atgctg 36

<210> 113

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458E-R

<400> 113

agtcgtatcg atttcatccg gctgccatac atcaaagaac 40

<210> 114

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458A-F

<400> 114

atggcagccg gatgctatcg atacgactga atgctg 36

<210> 115

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458A-R

<400> 115

agtcgtatcg atagcatccg gctgccatac atcaaagaac 40

<210> 116

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458G-F

<400> 116

atggcagccg gatggtatcg atacgactga atgctg 36

<210> 117

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458G-R

<400> 117

agtcgtatcg ataccatccg gctgccatac atcaaagaac 40

<210> 118

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458V-F

<400> 118

atggcagccg gatgtaatcg atacgactga atgctg 36

<210> 119

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458V-R

<400> 119

agtcgtatcg attacatccg gctgccatac atcaaagaac 40

<210> 120

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458M-F

<400> 120

atggcagccg gatatgatcg atacgactga atgctg 36

<210> 121

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer H458M-R

<400> 121

agtcgtatcg atcatatccg gctgccatac atcaaagaac 40

Claims

1.CadA变体多肽，其在SEQ ID NO：2的D457、H458或D460进行氨基酸取代，所述氨基酸取代为：H458A/C/E/F/G/M/P/T/V/W/Y、D457A/C/E/F/H/I/K/L/M/N/S/W/Y或D460C/F/Q/I/S/V/W/Y。

2.权利要求1的CadA变体多肽，其中H458的氨基酸取代是H458A/C/F/M/V/W/Y。

3.权利要求1的CadA变体多肽，其中D457的氨基酸取代是D457A/C/H/K/L/M/N/S。

4.权利要求1的CadA变体多肽，其中D460的氨基酸取代是D460C/F/Q/I/S/V/W。

5.遗传修饰的宿主细胞，其包含权利要求1-4任一项的CadA变体多肽。

6.权利要求5的遗传修饰的宿主细胞，其中所述宿主细胞被遗传修饰以过表达一或多种赖氨酸生物合成多肽。

7.权利要求5的遗传修饰的宿主细胞，其中所述宿主细胞是细菌。

8.权利要求7的遗传修饰的宿主细胞，其中所述宿主细胞来自埃希氏菌属(Escherichia)、哈夫尼菌属(Hafnia)或者棒杆菌属(Corynebacterium)。

9. 权利要求7的遗传修饰的宿主细胞，其中所述宿主细胞是大肠杆菌(Escherichia coli)。

10. 权利要求7的遗传修饰的宿主细胞，其中所述宿主细胞是谷氨酸棒杆菌(Corynebacterium glutamicum)。

11.权利要求7的遗传修饰的宿主细胞，其中所述宿主细胞是蜂房哈夫尼菌(Hafnia alvei)。

12.一种产生尸胺的方法，所述方法包括将权利要求5-11任一项的遗传修饰的宿主细胞在表达所述CadA变体多肽的条件下进行培养。

13.一种多核苷酸，其包含编码权利要求1-4任一项的CadA变体多肽的核酸序列。

14.一种表达载体，其包含权利要求13的多核苷酸。

15.一种遗传修饰的宿主细胞，其包含权利要求14的表达载体。

16.权利要求15的遗传修饰的宿主细胞，其中所述宿主细胞是细菌。

17.权利要求15的遗传修饰的宿主细胞，其中所述宿主细胞来自埃希氏菌属、哈夫尼菌属或者棒杆菌属。

18.权利要求15的遗传修饰的宿主细胞，其中所述宿主细胞是大肠杆菌。

19.权利要求15的遗传修饰的宿主细胞，其中所述宿主细胞是谷氨酸棒杆菌。

20.权利要求15的遗传修饰的宿主细胞，其中所述宿主细胞是蜂房哈夫尼菌。

21.一种遗传修饰的宿主细胞，其包含权利要求13的多核苷酸，其中编码所述CadA变体多肽的核酸序列整合进所述宿主细胞染色体中。

22.权利要求21的遗传修饰的宿主细胞，其中所述宿主细胞是细菌。

23.权利要求22的遗传修饰的宿主细胞，其中所述宿主细胞来自埃希氏菌属、哈夫尼菌属或者棒杆菌属。

24.权利要求22的遗传修饰的宿主细胞，其中所述宿主细胞是大肠杆菌。

25.权利要求22的遗传修饰的宿主细胞，其中所述宿主细胞是谷氨酸棒杆菌。

26.权利要求22的遗传修饰的宿主细胞，其中所述宿主细胞是蜂房哈夫尼菌。

27.一种生产尸胺的方法，所述方法包括将权利要求15-26任一项的遗传修饰的宿主细胞在表达所述CadA变体多肽的条件下进行培养。