CN110546255A - 对赖氨酸脱羧酶酶类的修饰 - Google Patents

对赖氨酸脱羧酶酶类的修饰 Download PDF

Info

Publication number
CN110546255A
CN110546255A CN201780089675.XA CN201780089675A CN110546255A CN 110546255 A CN110546255 A CN 110546255A CN 201780089675 A CN201780089675 A CN 201780089675A CN 110546255 A CN110546255 A CN 110546255A
Authority
CN
China
Prior art keywords
leu
glu
ile
host cell
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780089675.XA
Other languages
English (en)
Other versions
CN110546255B (zh
Inventor
周豪宏
陆文强
陈玲
于丽珺
刘修才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI KAISAI BIOTECHNOLOGY CO Ltd
CIBT America Inc
Original Assignee
SHANGHAI KAISAI BIOTECHNOLOGY CO Ltd
CIBT America Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI KAISAI BIOTECHNOLOGY CO Ltd, CIBT America Inc filed Critical SHANGHAI KAISAI BIOTECHNOLOGY CO Ltd
Publication of CN110546255A publication Critical patent/CN110546255A/zh
Application granted granted Critical
Publication of CN110546255B publication Critical patent/CN110546255B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01018Lysine decarboxylase (4.1.1.18)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines

Abstract

本发明提供了与野生型赖氨酸脱羧酶相比具有在碱性pH增加活性的突变的CadA多肽。本发明还提供了产生这种突变体多肽的方法,经遗传修饰以过表达突变体多肽的微生物,以及产生这种微生物的方法。

Description

对赖氨酸脱羧酶酶类的修饰
背景技术
大多数酶在窄的pH范围内发挥最佳功能,因为它们是兼性分子。周围环境的pH直接影响构成酶的氨基酸的酸性和碱性基团上的电荷。这些电荷的变化影响酶的净电荷、活性位点的pKa和酶表面上的电荷分布。其结果是,pH的变化会影响酶的活性、溶解性和稳定性。
被称为酸脱羧酶的一类蛋白质是一组催化碱性氨基酸(例如赖氨酸、精氨酸、鸟氨酸)的脱羧酶反应的酶,以产生多胺作为许多微生物中酸胁迫反应的一部分。大肠杆菌具有几种PLP依赖性酸脱羧酶:CadA、LdcC、AdiA、SpeA、SpeC、SpeF、GadA和GadB。所有这些酶在窄的pH范围内发挥功能,并且酶活性在该pH范围之外显著降低(Kanjee等人,Biochemistry50,9388-9398,2011)。先前已经观察到这些PLP依赖性脱羧酶二聚化以形成完整的活性位点。在某些情况下,例如CadA,二聚体形成十聚体,其聚集成发挥最佳功能所需的较高分子量蛋白质复合体。抑制较高分子量蛋白质复合体形成(例如,在最佳pH以外的条件下)导致功能的显著降低(Kanjee等人,The EMBO Journal 30,931-944,2011)。
蛋白质中各个氨基酸的pKa值对于确定其生物分子功能是重要的,因为蛋白质-水溶液中的主要反应之一是某些氨基酸与蛋白质环境的质子交换。pKa是中性和带电状态之间自由能差异的量度,并表示氨基酸提供或接受质子的倾向性。某些氨基酸具有可滴定的基团,使它们更容易接受和提供质子。这些氨基酸包括天冬氨酸、谷氨酸、半胱氨酸、丝氨酸、酪氨酸、苏氨酸、组氨酸、赖氨酸和精氨酸。一些氨基酸的示例性pKa值如下:天冬氨酸为4.0,谷氨酸为4.4,半胱氨酸为8.7,酪氨酸为9.6,组氨酸为6.3,赖氨酸为10.4,精氨酸为13.0(Nielsen JE&Vriend G,Proteins 43,403-412),2001)。根据文献来源,这些pKa值可以变化0.5。
可滴定基团是否接受或提供质子将取决于其所处环境,例如pH或其附近的其他氨基酸。例如,当pH小于可滴定基团的pKa时,该基团将更可能接受质子。相反,当pH大于可滴定基团的pKa时,该基团更可能提供质子。当氨基酸的可滴定基团接受或提供质子时,氨基酸可以带正电、带负电、或中性,这取决于质子交换发生前开始时的电荷。当两个基团彼此接近时,带电基团可以与其他带电基团相互作用。同种电荷相互排斥,相反的电荷相互吸引。质子化的中性电荷基团仍然可以通过氢键相互作用与其他基团相互作用。
了解蛋白质可滴定基团的pKa值不仅对于理解pH值是如何影响多肽折叠和酶活性重要,而且对蛋白质-蛋白质相互作用也重要(Jensen,Curr Pharm Biotechnol 9,96-102,2008),尤其是在酸脱羧酶的情况下,由于环境pH的变化,所述酸脱羧酶的四级结构发生显著变化。少有研究评估各种具有可滴定基团的氨基酸突变对酸脱羧酶的功能的影响。
基于先前的文献(Kanjee等人,EMBO Journal 30,931-944,2011),当环境pH变化时,CadA从由十聚体和高级低聚物组成的状态转变为主要由二聚体组成的状态。十聚体的形成是形成高级低聚物的先决条件。已经表明,CadA在pH为5.0-5.5时发挥最佳功能(Lemonnier&Lane,Microbiology 144,751-760,1998)。在这种酸性pH下,Kanjee等人使用EM显示CadA主要以高级低聚物存在。当pH增加到6.0以上,或当抑制剂ppGpp存在时,不形成高级低聚物,并且脱羧酶功能显著降低。然而,没有文献描述CadA高级低聚物是如何形成的,以及在其形成中起作用的氨基酸残基。
发明内容
本发明部分基于突变的发现,所述突变提供稳定四级结构形成所必需的化学相互作用的能力,并增加稳定性以允许突变酸脱羧酶蛋白在更宽的pH范围内发挥功能。在更宽的pH范围内发挥功能的能力对于保持高反应速率而不需要添加额外的化学品来维持pH是重要的。在宽的pH范围维持高反应速率可以使赖氨酸更快地转化为尸胺,并减少所需的用量。蛋白质对碱性pH的耐受性消除了添加额外化学品以维持pH的需要。用于维持pH的这些化学品通常形成盐(例如SO4 2-或Cl-),其要么进入废水中,要么必须使用额外的纯化步骤从过程中除去。因此,比野生型在更宽的pH范围内发挥功能的突变酸脱羧酶将通过减少在该过程中形成的盐的量来降低整个过程的成本和环境中留下的痕迹。
在一个方面,本发明因此提供了CadA变体多肽,其在对应于参考SEQID NO:2所确定的氨基酸276至509的区域中的赖氨酸残基处包含至少一个氨基酸取代,其中赖氨酸残基存在于蛋白质的表面,且侧链在缺乏确定的二级结构的蛋白质区段中朝向外部环境;并且其中CadA变体多肽与SEQ ID NO:2至5中的任一个具有至少70%的相同性。在一些实施方案中,CadA变体多肽在对应于参考SEQ ID NO:2所确定的氨基酸314-326的区域(包括β12的β11和α12之间的区域)中的赖氨酸残基处包含至少一个氨基酸取代;并且其中CadA变体多肽与SEQ ID NO:2至5中的任一个具有至少70%的相同性。在一些实施方案中,所述取代是在参考SEQ ID NO:2所确定的位置320或位置325的赖氨酸残基处。在一些实施方案中,相对于SEQ ID NO:2,位置320和325都被取代。在一些实施方案中,在位置320处的所述取代是K320A/C/E/G/H/I/L/M/S/V/Y。在一些实施方案中,所述取代是K320C/E/G/L/V/Y。
在一些实施方案中,在赖氨酸残基处具有取代的CadA变体多肽还在对应于参考SEQ ID NO:2所确定的氨基酸276至509的区域中的谷氨酸残基处包含至少一个氨基酸取代,其中所述谷氨酸残基存在于蛋白质表面,且侧链在缺乏确定的二级结构的蛋白质区段中朝向外部环境;并且其中CadA变体多肽与SEQ ID NO:2至5中的任一个具有至少70%的相同性。在一些实施方案中,所述取代是在选自由参考SEQ ID NO:2所确定的以下位置的谷氨酸残基处:位置291、344、355、463、482和499。在一个实施方案中,所述氨基酸取代是E291A/C/D/H/R/V/G/K/N/S、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y、或E482C/F/I/L/S/W/Y/A/H/K/M。在一些实施方案中,所述氨基酸取代是E291A/C/D/H/R/V、E355C/F/H/K/L/M/N/P/Q/R/S/T/V/Y、或E482C/F/I/L/S/W/Y。在一些实施方案中,CadA变体多肽包含选自以下的至少两个位置处的谷氨酸残基的取代:位置291、344、355、463、482和499。在一些实施方案中,CadA变体多肽包含选自以下的至少三个位置处的谷氨酸残基的取代:位置291、344、355、463、482和499。在一些实施方案中,CadA变体多肽包含选自以下的四个或五个位置处的谷氨酸残基的取代:位置291、344、355、463、482和499;或者包含在所有六个位置处的谷氨酸残基的取代。
在一些实施方案中,包含赖氨酸残基处的取代或赖氨酸残基和谷氨酸处的取代(例如,如前两段中所述)的CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。在一些实施方案中,CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。在一些实施方案中,如本文所述的CadA变体多肽与SEQ ID NO:3、SEQ IDNO:4或SEQ ID NO:5具有至少70%的相同性。在一些实施方案中,CadA变体多肽与SEQ IDNO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
在另一方面,本发明提供了遗传修饰的宿主细胞,其包含如本文所述(例如在前述段落中所述)的CadA变体多肽。在典型的实施方案中,所述遗传修饰的宿主细胞经遗传修饰以过表达一种或多种赖氨酸生物合成多肽。在一些实施方案中,所述宿主细胞是细菌。在进一步的实施方案中,所述宿主细胞来自埃希氏菌属(Escherichia)、哈夫尼菌属(Hafnia)、或棒杆菌属(Corynebacteria)。在一些实施方案中,所述遗传修饰的宿主细胞是大肠杆菌(Escherichia coli)。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌(Hafnia alvei)。在一些实施方案中,所述遗传修饰的宿主细胞是谷氨酸棒杆菌(Corynebacterium glutamicum)。
在另一方面,本发明提供了包含编码如本文所述(例如在本节的前述段落中所述)的CadA变体多肽的核酸序列的多核苷酸。在其他方面,本发明额外提供了包含编码所述CadA变体的多核苷酸的表达载体,和/或包含所述表达载体的遗传修饰的宿主细胞。在一些实施方案中,所述宿主细胞是细菌,例如来自埃希氏菌属、哈夫尼菌属、或棒杆菌属的细菌。在一些实施方案中,所述遗传修饰的宿主细胞是大肠杆菌。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述遗传修饰的宿主细胞是谷氨酸棒杆菌。
在另一方面,本发明提供了遗传修饰的宿主细胞,其包含多核苷酸,所述多核苷酸包含编码如本文所述(例如在本节的前述段落中所述)的CadA变体多肽的核酸序列,其中编码所述CadA变体多肽的核酸序列整合到宿主细胞染色体中。在一些实施方案中,所述宿主细胞是细菌,例如来自埃希氏菌属、哈夫尼菌属、或棒杆菌属的细菌。在一些实施方案中,所述遗传修饰的宿主细胞是大肠杆菌。在一些实施方案中,所述遗传修饰的宿主细胞是蜂房哈夫尼菌。在一些实施方案中,所述遗传修饰的宿主细胞是谷氨酸棒杆菌。
另一方面,本发明提供了一种产生尸胺的方法,该方法包含在表达CadA变体多肽的条件下培养如本文所述(例如在本节的前述段落中所述)的遗传修饰的宿主细胞。
附图说明
图1显示大肠杆菌CadA多肽序列SEQ ID NO:2与来自肠沙门氏菌(Salmonellaenterica)(WP_001540636.1)、克雷伯氏菌属(Klebsiella)多物种(WP_012968785)和肠杆菌科(Enterobacteriaeceae)多物种(WP_002892486.1)的CadA同源物的比对。
具体实施方式
在描述本发明之前,应理解本发明不限于所描述的特定实施方案,因此当然可以改变。还应理解,本文使用的术语仅用于描述特定实施方案的目的,而不是意图限制性的。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。尽管与本文描述的那些类似或等价的任何方法和材料可用于本发明的实践或测试,但现在描述优选的方法和材料。本文提及的所有出版物和登录号均通过援引并入本文,以公开和描述与所述出版物相关的方法和/或材料。
术语
如在本公开中所用,“CadA多肽”是指具有SEQ ID NO:2的氨基酸序列的大肠杆菌CadA多肽,或其具有活性(即催化L-赖氨酸脱羧产生尸胺)的生物学活性变体。生物学活性变体包括大肠杆菌CadA多肽的等位基因、突变体、片段和种间同源物。CadA在结构和功能上都被充分表征。CadA结构的蛋白质数据库ID是3N75。来自其他物种的示例性CadA多肽包括来自克雷伯氏菌属(例如SEQ ID NO:3)、肠杆菌科(例如SEQ ID NO:5)和肠沙门氏菌(Salmonella enterica)(例如SEQ ID NO:6)的CadA。来自其他物种的额外CadA多肽包括沙雷氏菌属物种(Serratia sp),WP 033635725.1;和Raoultella ornithinolytica,YP007874766.1。在一些实施方案中,“CadA多肽”在SEQ ID NO:2所示CadA多肽的至少约200、300、400、500或更多个氨基酸的区域上或全长具有至少60%的氨基酸序列相同性,通常具有至少65%、70%、75%、80%、85%、90%的相同性,通常具有至少91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性。在一些实施方案中,“CadA多肽”包括一个区域,该区域与包括相应于SEQ ID NO:2的氨基酸261-509的氨基酸残基的区域具有至少80%、至少85%、至少90%、至少95%或至少91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性,其中存在于该区域中的例如在位置320或位置325的天然赖氨酸如本文所述被另一种非天然存在的氨基酸取代在一些实施方案中,优选与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5的CadA多肽的至少约200、300、400、500或更多个氨基酸的区域,或全长,“CadA多肽”具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性。
如本文所用,“CadA多核苷酸”是指编码CadA多肽的多核苷酸。编码CadA的核酸或多核苷酸是指基因、前mRNA、mRNA等,包括编码本文所述特定氨基酸序列的变体、等位基因、片段、突变体和种间同源物的核酸。
如本文所用,术语“碱性pH”是指具有pH大于7.5的溶液或周围环境。在一个实施方案中,碱性pH是指溶液或周围环境具有至少8.0、至少8.5或更高的pH。
在产生氨基酸衍生物(例如尸胺)的上下文中,本文所用的术语“增强的”或“提高的”,是指与对照对应细胞(例如野生型菌株的细胞或表达野生型CadA蛋白的相同菌株的细胞)相比,由表达本发明的CadA变体多肽的宿主细胞产生的氨基酸衍生物的产生增加。在一个实施方案中,CadA变体的活性与表达野生型CadA的对应细胞的CadA活性相比,至少提高10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更高,其中通过测量在相同条件下由宿主细胞和对照细胞产生的氨基酸衍生物(通常为尸胺)的产生来评估活性。例如,本发明的CadA变体多肽的活性可以通过评估用编码变体CadA多肽的多核苷酸转化的宿主细胞培养物的等分试样与来自表达野生型CadA的相同菌株的对应宿主细胞培养物的相应等分试样进行比较来测定。通过进一步说明,与对应野生型CadA相比较的本发明的CadA变体多肽的活性可以通过评估用包含编码变体CadA多肽的核酸序列的载体所转化的细胞(变体宿主细胞)或用包含编码野生型CadA多肽的核酸的载体所转化的细胞(对照宿主细胞)的尸胺产生来确定。将在表达CadA的条件下生长的变体宿主细胞和对照宿主细胞和等份样品与终浓度分别为120g/L和0.1mM的赖氨酸-HCl和PLP一起在pH8.0孵育一段时间,例如2小时。孵育后测量尸胺产生。在实施例部分中提供了示例性测定。
当在编号给定的氨基酸或多核苷酸序列的上下文中使用时,术语“编号参考”,或“对应于”或“参考……所确定的”是指当给定的氨基酸或多核苷酸序列与特定参考序列比较时,所述参考序列的残基的编号。例如,当变体CadA多肽以最大比对与SEQ ID NO:2比对时,所述变体多肽序列的位置“对应于”SEQ ID NO:2中的位置。
关于CadA多肽的术语“野生型”、“天然”和“天然存在的”在本文中用于指具有天然存在序列的CadA蛋白。
在本发明中,关于突变体多肽或突变体多核苷酸的术语“突变体”可与“变体”互换使用。“非天然”存在的CadA变体是指不天然存在于细胞中并且通过遗传修饰(例如使用基因工程技术或诱变技术)天然CadA多核苷酸或多肽产生的变体或突变体CadA多肽。本公开中的“变体”CadA多肽包括任何非天然存在的CadA多肽,其包含至少一个氨基酸取代,例如其中所述至少一个氨基酸取代是参考SEQ ID NO:2所确定的位置320或325处赖氨酸残基的取代。本发明的变体CadA多肽还可具有相对于SEQ ID NO:2的额外突变,包括进一步的取代、插入或缺失。
术语“多核苷酸”和“核酸”可互换使用,是指从5'至3'端读取的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。用于本发明的核酸通常含有磷酸二酯键,尽管在某些情况下,可以使用可具有替换主链(包含例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯、或O-甲基亚磷酰胺键(参见Eckstei,Oligonucleotides and Analogues:A PracticalApproach,Oxford University Press));带正电的骨架(positive backbone);非离子骨架和非核糖骨架的核酸类似物。核酸或多核苷酸还可包括允许聚合酶正确连读的修饰的核苷酸。“多核苷酸序列”或“核酸序列”包括核酸的有义链和反义链,以及单独的单链或双链体。如本领域技术人员所理解的,单链的描述也定义了互补链的序列;因此,本文描述的序列也提供所述序列的互补序列。除非另有说明,否则特定核酸序列也隐含地包括其变体(例如简并密码子取代)和互补序列,以及明确指出的所述序列。核酸可以是DNA(基因组DNA和cDNA)、RNA或杂交体,其中核酸可以包含脱氧核糖核苷酸和核糖核苷酸的组合,以及碱基的组合,包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶、异鸟嘌呤等。
在本公开中用于两种核酸或多肽的术语“基本上相同”是指与参考序列具有至少50%序列相同性的序列。百分比相同性可以是50%至100%的任何整数。与使用本文所述程序的参考序列相比,一些实施方案包括至少:50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%;优选使用标准参数的BLAST,如下所述。
如果两个序列中的核苷酸或氨基酸残基的序列在如下所述进行最大对应比对时是相同的,则称两个核酸序列或多肽序列是“相同的”。在两个或更多个核酸或多肽序列的情况中,术语“相同”或百分比“相同性”是指当在比较窗口进行最大对应比较和比对时(如使用以下序列比较算法或通过人工比对和目检所测量的),两个或更多个序列或子序列是相同的或具有特定百分比的相同的氨基酸残基或核苷酸。
对于序列比较,通常一个序列充当参考序列,测试序列与其比较。当使用序列比较算法时,将测试和参考序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。可以使用默认程序参数,也可以指定替代参数。然后,基于程序参数,用序列比较算法计算测试序列相对于参考序列的百分比序列相同性。
一种可用于确定变体CadA多肽是否与SEQ ID NO:2或另一多肽参考序列如SEQ IDNO:3、SEQ ID NO:4或SEQ ID NO:5具有序列相同性的算法是BLAST算法,其描述于Altschul等人,1990,J.Mol.Biol.215:403-10。用于进行BLAST分析的软件可通过国家生物技术信息中心(National Center for Biotechnology Information,网址ncbi.nlm.nih.gov/)公开获得。用于进行蛋白质序列比对的示例性软件包括ClustalW2和BLASTP。对于氨基酸序列,BLASTP程序使用字大小(W)为3,期望阈值(E)为10和BLOSUM62评分矩阵作为默认值(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))。在本公开中,通常使用默认参数的BLASTP Align Sequence确定多肽序列相同性。
如本文所用,“比较窗口”包括指选自以下的连续位置的任何一个数量的区段:20至600,通常约50至约200,更通常约100至约150,其中在两个序列最佳比对后,可以将一个序列与相同数量连续位置的参考序列进行比较。用于比较的序列比对方法是本领域熟知的。用于比较的序列最佳比对可以例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法进行,通过Needleman&Wunsch,Mol.Biol.48:443(1970)的同源性比对算法进行,通过Pearson&Lipman,Proc.Nat'l.Acad.Sci.USA 85:2444(1988)的检索相似性方法进行,通过这些算法的计算机化实现(Wisconsin Genetics Software Package,Genetics Computer Group,575Science Dr.,Madison,WI中的GAP,BESTFIT,FASTA和TFASTA)进行,或通过人工比对和目检进行。通常使用默认参数的BLASTP进行最佳比对。
与参考序列基本上相同的核酸或蛋白质序列包括“保守修饰的变体”。关于特定核酸序列,保守修饰的变体是指那些编码相同或实质相同的氨基酸序列的核酸,或者当核酸不编码氨基酸序列时,是指实质相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在密码子指定丙氨酸的每个位置,密码子可以改变为所述的任何相应密码子而不改变编码的多肽。这种核酸变异是“沉默变异”,其是保守修饰变异的一种。本文中编码多肽的每个核酸序列也描述了所述核酸的每种可能的沉默变异。技术人员将认识到,可以修饰核酸中的每个密码子(除了AUG,其通常是甲硫氨酸的唯一密码子)以产生功能相同的分子。因此,编码多肽的核酸的每个沉默变异隐含在每个所述序列中。
如本文所用的术语“多肽”包括指含有天然存在的氨基酸和氨基酸主链以及非天然存在的氨基酸和氨基酸类似物的多肽。
关于氨基酸序列,本领域技术人员将认识到在编码序列中改变单个氨基酸或少量氨基酸的核酸、肽、多肽或蛋白质序列中的各个取代是“保守修饰的变体”,其中所述改变导致一个氨基酸被化学上相似的氨基酸取代。提供功能相似氨基酸的保守取代表是本领域熟知的。以这种方式定义的氨基酸基团的实例可包括:“带电荷/极性组”包括Glu(谷氨酸或E)、Asp(天冬氨酸或D)、Asn(天冬酰胺或N)、Gln(谷氨酰胺或Q)、Lys(赖氨酸或K)、Arg(精氨酸或R)和His(组氨酸或H);“芳香族或环状组”包括Pro(脯氨酸或P)、Phe(苯丙氨酸或F)、Tyr(酪氨酸或Y)和Trp(色氨酸或W);以及“脂肪族组”包括Gly(甘氨酸或G)、Ala(丙氨酸或A)、Val(缬氨酸或V)、Leu(亮氨酸或L)、Ile(异亮氨酸或I)、Met(甲硫氨酸或M)、Ser(丝氨酸或S)、Thr(苏氨酸或T)和Cys(半胱氨酸或C)。在每组中,也可以鉴定亚组。例如,带电荷/极性氨基酸组可以细分为亚组,包括:包含Lys、Arg和His的“带正电荷亚组”;包含Glu和Asp的“带负电亚组”;和包含Asn和Gln的“极性亚组”。在另一个实例中,芳香族或环状组可以细分为亚组,包括:包含Pro、His和Trp的“氮环亚组”;和包含Phe和Tyr的“苯基亚组”。在另一个实例中,脂肪族组可以细分为亚组,包括:包含Val、Leu和Ile的“大脂肪族非极性亚组”;包含Met、Ser、Thr和Cys的“脂肪族微极性亚组”;包含Gly和Ala的“小残基亚组”。保守突变的实例包括上述亚组内氨基酸的氨基酸取代,例如但不限于:Arg取代Lys,或反之亦然,使得可以保持正电荷;Asp取代Glu,或反之亦然,使得可以保持负电荷;Thr取代Ser,或反之亦然,使得可以保持游离的-OH;和Asn取代Gln,或反之亦然,使得可以保持游离的-NH2。以下六组各自含有氨基酸,其进一步提供彼此的示例性保守取代。1)Ala、Ser、Thr;2)Asp、Glu;3)Asn、Gln;4)Arg、Lys;5)Ile、Leu、Met、Val;和6)Phe、Try和Trp(参见例如Creighton,Proteins(1984))。在一些实施方案中,保守取代用于产生在谷氨酸残基以外的位点具有取代的Cada变体。
如本文所用,术语“启动子”是指能够驱动核酸序列在细胞中转录的多核苷酸序列。因此,在本发明的多核苷酸构建体中使用的启动子包括顺式和反式作用转录控制元件和调节序列,其参与调节或调控基因转录的时间和/或速率。例如,启动子可以是顺式作用转录控制元件,包括增强子、阻遏物结合序列等。这些顺式作用序列通常与蛋白质或其他生物分子相互作用以进行(打开/关闭、调节、调控等)基因转录。大多数情况下,核心启动子序列位于翻译起始位点的1-2kb内,更常见的是在1kbp内,并且通常位于翻译起始位点的500bp或200bp或更少以内。按照惯例,通常以启动子序列控制的基因编码链上的序列提供启动子序列。在本申请中,启动子通常通过其天然调节表达的基因的名称来指代。用于本发明的表达构建体的启动子用基因名称指代。通过名称指代启动子包括野生型、天然启动子,以及保留诱导表达能力的启动子的变体。通过名称指代启动子不限于特定物种,还包括来自其他物种中相应基因的启动子。
本发明中的“组成型启动子”是指能够在细胞中的大多数条件下,例如在不存在诱导分子的情况下启动转录的启动子。“诱导型启动子”在诱导剂分子存在时启动转录。
如果多核苷酸源自外来物种,或者如果多核苷酸来自相同物种但在其原始形式上进行修饰,则该多核苷酸对于生物体或第二多核苷酸序列是“异源的”。例如,当称编码多肽序列的多核苷酸与异源启动子可操作地连接时,它意味着编码所述多肽的所述多核苷酸编码序列衍生自一个物种,而所述启动子序列衍生自另一个不同物种;或者,如果两者都衍生自相同物种,则所述编码序列不与所述启动子天然相关(例如是基因工程化的编码序列,例如来自相同物种中的不同基因,或来自不同物种的等位基因)。类似地,如果天然野生型宿主细胞不产生多肽,则该多肽对于该宿主细胞是“异源的”。
术语“外源”通常是指不天然存在于野生型细胞或生物体中但通常通过分子生物学技术引入细胞(即工程化以产生重组微生物)的多核苷酸序列或多肽。“外源”多核苷酸的实例包括编码所需蛋白质的载体、质粒和/或人造核酸构建体。
术语“内源”是指天然存在的多核苷酸序列或多肽,其可以在给定的野生型细胞或生物体中发现。在这方面,还应注意,即使生物体可包含给定多核苷酸序列或基因的内源拷贝,引入编码该序列的质粒或载体如过表达所编码蛋白质或以其他方式调节所编码蛋白质的表达代表了该基因或多核苷酸序列的“外源”拷贝。本文描述的任何通路、基因或酶可以利用或依赖“内源”序列,其可以一种或多种“外源”多核苷酸序列提供,或以两种提供。
如本文所用的“重组核酸”或“重组多核苷酸”是指核酸聚合物,其中以下的至少一种是真实的:(a)核酸序列对于给定的宿主细胞是外源的(即在给定宿主细胞中并非天然发现的);(b)该序列可以在给定的宿主细胞中天然存在,但是以非天然(例如大于预期)的量存在;或(c)核酸序列包含两个或更多个在自然界中彼此没有相同关系的子序列。例如,对于(c)情况,重组核酸序列可以具有来自无关基因的两个或更多个序列,其被排列以产生新的功能性核酸。
术语“可操作地连接”是指两个或更多个多核苷酸(例如DNA)区段之间的功能关系。通常,它指转录调节序列与转录序列的功能关系。例如,如果启动子或增强子序列在合适的宿主细胞或其他表达系统中刺激或调控DNA或RNA序列的转录,则所述启动子或增强子序列与所述DNA或RNA序列可操作地连接。通常,与转录序列可操作地连接的启动子转录调节序列与所述转录序列是物理地邻近,即它们是顺式作用的。然而,一些转录调节序列如增强子不需要物理地邻近或不需要位于与其增强转录的编码序列非常接近的位置。
术语“表达盒”或“DNA构建体”或“表达构建体”是指核酸构建体,当其被引入宿主细胞时,分别导致RNA或多肽的转录和/或翻译。在表达转基因的情况下,技术人员将认识到插入的多核苷酸序列不需要是相同的,但可以仅与衍生它的基因的序列基本上相同。如本文所解释的,这些基本上相同的变体在提及特定核酸序列时被特别涵盖。表达盒的一个实例是多核苷酸构建体,其包含编码与启动子(例如其天然启动子)可操作地连接的本发明多肽的多核苷酸序列,其中表达盒被引入异源微生物中。在一些实施方案中,表达盒包含编码本发明多肽的多核苷酸序列,其中所述多核苷酸靶向微生物基因组中的位置,使得所述多核苷酸序列的表达由存在于所述微生物中的启动子驱动。
在本发明中使用的术语“宿主细胞”是指微生物并且包括可以是或已经是本发明的任何(一或多个)重组载体或(一或多个)分离的多核苷酸的受体的单个细胞或细胞培养物。宿主细胞包括单个宿主细胞的后代,并且由于天然的、偶然的、或有意的突变和/或变化,后代可能不一定与原始亲本细胞完全相同(在形态学或在总DNA互补序列上)。宿主细胞包括已经引入了本发明的重组载体或多核苷酸的细胞,所述引入包括通过转化、转染等。
术语“分离的”是指基本上或实质上不含有在其天然状态下通常伴随其的组分的材料。例如,如本文所用,“分离的多核苷酸”可以指与在其天然存在状态或基因组状态时在其侧翼的序列分离的多核苷酸,例如DNA片段,其从通常与该片段相邻的序列取出,例如通过克隆到载体中。例如,如果将多核苷酸克隆到不是自然环境一部分的载体中,或者如果以与其天然存在状态不同的方式人工引入到细胞的基因组中,则认为多核苷酸是分离的。或者,如本文所用,“分离的肽”或“分离的多肽”等可以指不含细胞其他组分的多肽分子,即它与体内细胞物质不相关。
本发明采用各种常规重组核酸技术。通常,下文描述的重组DNA技术中的命名法和实验室程序是本领域通常采用的。可以获得许多提供进行重组DNA操作指导的手册,例如Sambrook&Russell,Molecular Cloning,A Laboratory Manual(3rd Ed,2001);和CurrentProtocols in Molecular Biology(Ausubel等人,John Wiley and Sons,New York,2009-2016)。
本公开某些方面的概述
在一个方面,本发明提供了变体CadA多肽,其包含位于核心结构域中的蛋白质部分之一中的位置处的赖氨酸的突变,在那些结构域内所述蛋白质部分没有确定的二级结构(α,α螺旋;β,β折叠;η,链)(见Kanjee等人)。这些部分是包括η4和α11的β10和β11之间的氨基酸276-299,包括β12的β11和α12之间的氨基酸314-326,η6和β14之间的氨基酸344-357,包括β17的β16和β18之间的氨基酸454-483,以及β19和α17之间的氨基酸494-509,其中氨基酸的位置参考SEQ ID NO:2确定。在一些实施方案中,突变位于参考SEQ ID NO:2确定的区域276-509中的赖氨酸残基处,其中赖氨酸是位于核心结构域中的蛋白质区段之一的位置处的赖氨酸,如上所述,所述蛋白质区段没有确定的二级结构,并且其中赖氨酸位于蛋白质的表面,其中侧链朝向外部环境。
本发明的变体CadA耐受碱性pH的能力还允许在发酵反应中使用具有较高pH值的替代氮源,例如尿素和氨(1M溶液具有pH 11.6)以产生所需产物,例如多胺。这些替代氮源产生较少的盐废物副产物。
Cad多肽变体
CadA是Fold I型吡哆醛5'-磷酸(PLP)依赖性脱羧酶亚类的成员。这类蛋白质通常含有N末端翼结构域、核心结构域和C末端结构域。核心结构域具有接头区域、PLP结合亚结构域、和亚结构域4。对于CadA,N-末端翼结构域(对应于参考SEQ ID NO:2所确定的残基1至129)具有黄素氧还蛋白样折叠,其由夹在两组两亲性α-螺旋之间的五链平行β-折叠组成。核心结构域(参考SEQ ID NO:2的563所确定的残基130至563)包括:接头区域,SEQ ID NO:2的氨基酸残基130至183(其形成短螺旋束);PLP结合亚结构域(形成由三组α-螺旋包围的七链β-折叠核心的SEQ ID NO:2的氨基酸184至417);和亚结构域4(形成具有朝外的三个α-螺旋的四链反平行β-折叠核心的氨基酸418至563)。C末端结构域对应于参考SEQ ID NO:2所确定的氨基酸残基564至715,其形成具有α-螺旋外表面的两组β折叠(Kanjee等人,TheEMBO Journal 30,931-944 2011)。
CadA蛋白形成两重对称二聚体,其完成每个单体的活性位点。五个二聚体结合形成十聚体,其由具有五重对称性的双环结构组成。十聚体与其他十聚体结合形成更高级的低聚物。已经表明,在酸性条件(pH5)中,CadA主要以低聚状态存在,并且随着环境变得更加碱性,发现更少的低聚物和十聚体。据估计,在pH6.5,25%的酶以二聚体存在,75%以十聚体存在,而在pH8.0,95%的酶以二聚体存在(Kanjee等人,The EMBO Journal 30,931-9442011)。这种低聚物形成的减少与观察到的随着酶环境的pH增加到5.0以上脱羧酶活性的降低一致。
来自大肠杆菌、肠沙门氏菌、克雷伯氏菌属和肠杆菌科的示例性CadA多肽在SEQID NO:2-5中提供,它们彼此具有大于90%的序列相同性。
本发明的CadA多肽包含至少一个用另一氨基酸取代赖氨酸,所述赖氨酸在核心结构域中的蛋白质区段之一的位置处,所述区段没有确定的二级结构(α,α螺旋;β,β折叠;η,链)(参见Kanjee等人,同上);并且其中赖氨酸位于蛋白质表面,其中侧链朝向外部环境。在本公开中,取代赖氨酸的氨基酸不存在于天然CadA序列的相应位置。在一些实施方案中,参考SEQ ID NO:2所确定的位置287、290、319、320、325、346、357、381、477或500的至少一个位置处的赖氨酸被不存在于天然CadA序列的相应位置的氨基酸取代。在一些实施方案中,这种本发明的CadA变体多肽在长度为500或更多个氨基酸的区域上,或在SEQ ID NO:2的CadA多肽的长度上,具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%、或85%相同性,并且通常至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性。
在一些实施方案中,根据本发明的变体CadA多肽包含对应于SEQ ID NO:2的氨基酸314-326(包括β12的β11和α12之间)的区域中的赖氨酸处的取代,其中赖氨酸位于蛋白质表面并且侧链朝向外部环境。在一些实施方案中,变体CadA多肽包含参考SEQ ID NO:2所确定的位置K320或位置K325处的氨基酸取代。在一些实施方案中,变体CadA多肽包含多于一个的氨基酸取代,例如,参考SEQ ID NO:2所确定的位置320和325两处的取代。在一些实施方案中,取代赖氨酸的氨基酸选自:丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸或缬氨酸,其中突变体不具有与野生型序列(SEQ ID NO:2、3、4或5)在相同位置相同的氨基酸。在一些实施方案中,取代赖氨酸的氨基酸是甲硫氨酸。甲硫氨酸的硫可以充当亲核物质或亲电子物质,并且不需要质子与其他氨基酸基团相互作用。因此,甲硫氨酸可以进一步稳定该位点处的蛋白质-蛋白质相互作用。在一些实施方案中,取代(例如在对应于K320或K325的位置处)赖氨酸的氨基酸选自:C、H、E、S、A、F、L、M、N、R、V、Y、D、G、I、P、Q、T和W。在一些实施方案中,取代赖氨酸的氨基酸选自:A、C、E、G、H、I、L、M、S、V和Y。在一些实施方案中,取代赖氨酸的氨基酸选自:C、E、G、L、V和Y。
在一些实施方案中,变体CadA多肽是来自大肠杆菌的CadA的变体,其中位置K320和K325处的至少一个或两个赖氨酸残基被另一氨基酸取代。
在一些实施方案中,本发明的变体CadA多肽在长度为500或更多个氨基酸的区域上,或在SEQ ID NO:2的CadA多肽的长度上,具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%或85%相同性,并且通常至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;并且在参考SEQ ID NO:2所确定的位置K320或K325的至少一个位置的赖氨酸残基处具有取代。在一些实施方案中,取代位于位置K320。在一些实施方案中,取代K320的氨基酸是A、C、E、H、G、I、L、M、S、V或Y。在其他实施方案中,取代赖氨酸的氨基酸是C、E、G、L、V或Y。
在一些实施方案中,本发明的变体CadA多肽在长度为500或更多个氨基酸的区域上,或在SEQ ID NO:3的CadA多肽的长度上,具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%或85%相同性,并且通常至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;并且在参考SEQ ID NO:3所确定的位置K320或K325的至少一个位置的赖氨酸残基处具有取代。在一些实施方案中,取代位于位置K320。在一些实施方案中,取代K320的氨基酸是A、C、E、H、G、I、L、M、S、V或Y。在其他实施方案中,取代赖氨酸的氨基酸是C、E、G、L、V或Y。
在一些实施方案中,本发明的变体CadA多肽在长度为500或更多个氨基酸的区域上,或在SEQ ID NO:4的CadA多肽的长度上,具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%或85%相同性,并且通常至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;并且在参考SEQ ID NO:4所确定的位置K320或K325的至少一个位置的赖氨酸残基处具有取代。在一些实施方案中,取代位于位置K320。在一些实施方案中,取代K320的氨基酸是A、C、E、H、G、I、L、M、S、V或Y。在其他实施方案中,取代赖氨酸的氨基酸是C、E、G、L、V或Y。
在一些实施方案中,本发明的变体CadA多肽在长度为500或更多个氨基酸的区域上,或在SEQ ID NO:5的CadA多肽的长度上,具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%或85%相同性,并且通常至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;并且在参考SEQ ID NO:5所确定的位置K320或K325的至少一个位置的赖氨酸残基处具有取代。在一些实施方案中,取代K320的氨基酸是A、C、E、H、G、I、L、M、S、V或Y。在其他实施方案中,取代赖氨酸的氨基酸是C、E、G、L、V或Y。
在一些实施方案中,如本文所述在赖氨酸残基处具有取代的任何一种CadA多肽变体还在参考SEQ ID NO:2所确定的位置E291、E344、E355、E463、E482和E499的谷氨酸处包含至少一个取代。在一些实施方案中,如本文所述在赖氨酸残基处具有取代的CadA变体多肽在参考SEQ ID NO:2所确定的位置E291、E344、E355、E463、E482和E499处包含多于一个的氨基酸取代,例如2、3或更多个取代。在一些实施方案中,如本文所述在赖氨酸残基处具有取代的任何一种CadA多肽变体在参考SEQ ID NO:2所确定的位置E291或E355处进一步包含至少一个在谷氨酸(在本文中也称为谷氨酸盐)处的取代。在一些实施方案中,取代谷氨酸的氨基酸选自:丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸或缬氨酸,其中突变体在相同位置不具有与野生型序列(SEQ ID NO:2、3、4或5)相同的氨基酸。在一些实施方案中,取代谷氨酸的氨基酸具有提供氢以形成氢键的能力。例如,C、Y、K和N的pKa值大于7,因此当pH从5增加到8时,它们的质子化状态不会改变。因此,与当谷氨酸(其具有酸性pKa)存在于那些位置时相比,在这些位置形成的任何氢键都更稳定。M的硫可以充当亲核物质或亲电子物质,并且不需要质子与其他氨基酸基团相互作用。因此,M可以进一步稳定该位点处的蛋白质-蛋白质相互作用。在一些实施方案中,取代谷氨酸的氨基酸选自:C、H、K、S、A、F、L、M、N、R、V、Y、D、G、I、P、Q、T和W。在一些实施方案中,取代谷氨酸的氨基酸选自:C、H、K、S、A、F、L、M、N、R、V和Y。在一些实施方案中,取代谷氨酸的氨基酸选自:C、Y、K、S、H、R、M和N。在一些实施方案中,取代谷氨酸的氨基酸选自C、H、K和S。
在一些实施方案中,本发明的变体CadA多肽在长度为500或更多个氨基酸的区域上,或在SEQ ID NO:2的CadA多肽的长度上,具有至少60%的氨基酸序列相同性,通常至少65%、70%、75%、80%或85%相同性,并且通常至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的氨基酸序列相同性;在参考SEQ ID NO:2所确定的位置K320或K325中的至少一个位置的赖氨酸残基处具有取代;并且还包含在位置E291、E344、E355、E463、E482和E499处的取代,例如如前段所述。在一些实施方案中,取代位于E291或E355。在一些实施方案中,CadA变体包含在K320和E355处的取代。在一些实施方案中,CadA变体包含在参考SEQ ID NO:2所确定的位置320处取代赖氨酸的C和在参考SEQ ID NO:2所确定的位置355处取代谷氨酸的C。
编码CadA变体多肽的核酸
可通过多种技术完成CadA多核苷酸序列的分离或产生。在一些实施方案中,寡核苷酸探针和基于本文公开的序列可用于鉴定来自所需细菌物种的cDNA或基因组DNA文库中的所需多核苷酸。可以使用合适的引物(如实施例部分所示)将所需的取代引入编码CadA的多核苷酸序列中,以将所需的变化掺入多核苷酸序列中。例如,PCR可用于直接从mRNA、cDNA、基因组文库或cDNA文库扩增基因的序列,并引入所需的取代。
用于鉴定细菌中的CadA多核苷酸的合适的引物和探针可以通过比较本文提供的序列产生,或基于来自另一细菌的CadA多核苷酸序列产生。有关PCR的一般综述,请参阅PCRProtocols:A Guide to Methods and Applications.(Innis,M,Gelfand,D.,Sninsky,J.and White,T.,eds.),Academic Press,San Diego(1990)。示例性引物序列示于实施例部分的引物表中。
编码用于本公开的酸脱羧酶多肽的核酸序列包括使用示例性核酸序列,例如SEQID NO:1的cadA多核苷酸序列,通过技术例如杂交和/或序列分析鉴定和表征的基因和基因产物。在一些实施方案中,通过引入与酸脱羧酶多核苷酸(例如SEQ ID NO:1的cadA多核苷酸)具有至少60%相同性,或至少70%、75%、80%、85%或90%相同性,或95%相同性或更高的核酸序列来对宿主细胞进行遗传修饰,其中所述核酸包含编码待取代的所需氨基酸的密码子。
编码根据本发明的CadA变体蛋白的核酸序列,其赋予宿主细胞增加的氨基酸衍生物(例如尸胺)的产生,可以另外进行密码子优化以在所需宿主细胞中表达。可以采用的方法和数据库是本领域已知的。例如,可以确定与单个基因、一组共同功能或起源的基因、高表达的基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区密码子频率或其组合相关的优选密码子。参见例如Henaut and Danchin的“Escherichia coli and Salmonella”,Neidhardt,et al.Eds.,ASM Pres,WashingtonD.C.(1996),pp.2047-2066;Nucleic Acids Res.20:2111-2118;Nakamura等人,2000,Nucl.Acids Res.28:292)。
重组载体的制备
可以使用本领域熟知的方法制备用于表达变体CadA蛋白的重组载体。例如,编码CadA变体多肽的DNA序列可以与转录和其他调节序列组合,所述调节序列将会指导来自基因的序列在预期细胞(例如细菌细胞如蜂房哈夫尼菌、大肠杆菌、或谷氨酸棒杆菌)中的转录。在一些实施方案中,包含表达盒的表达载体还包含与编码CadA变体多肽的核酸序列可操作地连接的启动子,所述表达盒包含编码CadA变体多肽的基因。在其他实施方案中,指导编码变体Cada多肽的cadA多核苷酸的转录的启动子和/或其他调节元件对宿主细胞来说是内源的,并且例如通过同源重组引入包含cadA基因的表达盒,使得外源基因与内源启动子可操作地连接,并且由内源启动子驱动表达。
如上所述,编码CadA变体多肽的多核苷酸的表达可以通过许多调节序列(包括启动子,其可以是组成型或诱导型;并且,任选地,如果需要,可以包括阻遏物序列)控制。合适的启动子,特别是在细菌宿主细胞中的实例是从大肠杆菌lac操纵子获得的启动子,和衍生自参与其他糖(例如半乳糖和麦芽糖)代谢的基因的其他启动子。额外的实例包括启动子,例如trp启动子、bla启动子噬菌体λPL和T5。另外,可以使用合成启动子,例如tac启动子(美国专利号4,551,433)。启动子的其他实例包括天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)产麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌(Bacillus licheniformis)青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因。Ausubel和Sambrook&Russell(同上)中描述了合适的启动子。额外的启动子包括Jensen&Hammer,Appl.Environ.Microbiol.64:82,1998;Shimada,等人,J.Bacteriol.186:7112,2004;和Miksch等人,Appl.Microbiol.Biotechnol.69:312,2005描述的启动子。
在一些实施方案中,可以修饰影响编码本发明的CadA变体多肽的cadA基因表达的启动子以增加表达。例如,内源性CadA启动子可以被与天然启动子相比提供增加的表达的启动子所替代。
表达载体还可以包含影响编码CadA变体多肽的多核苷酸的表达的额外序列。此类序列包括增强子序列、核糖体结合位点或其他序列,例如转录终止序列等。
表达编码本发明的CadA变体多肽的多核苷酸的载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何方法。或者,载体可以是这样的载体,当其被引入宿主时,整合到基因组中并与其整合进的(一或多个)染色体一起复制。因此,表达载体可另外含有允许载体整合到宿主基因组中的元件。
本发明的表达载体优选含有一个或多个选择标记,其允许容易地选择转化的宿主。例如,表达载体可以包含赋予重组宿主生物体(例如细菌细胞,如大肠杆菌、蜂房哈夫尼菌或谷氨酸棒杆菌)抗生素抗性(例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性)的基因。
尽管可以使用任何合适的表达载体以掺入所需序列,但容易获得的细菌表达载体包括但不限于:质粒如pSClO1、pBR322、pBBR1MCS-3、pUR、pET、pEX、pMR1OO、pCR4、pBAD24、p15a、pACYC、pUC例如pUC18或pUC19,或衍生自这些质粒的质粒;以及噬菌体,如M1 3噬菌体和λ噬菌体。然而,本领域普通技术人员可以通过常规实验容易地确定任何特定表达载体是否适合于任何给定的宿主细胞。例如,可以将表达载体引入宿主细胞,然后监测载体中含有的序列的存活力和表达。
可以使用任何数量熟知的方法将本发明的表达载体引入宿主细胞,包括基于氯化钙的方法、电穿孔或本领域已知的任何其他方法。
宿主细胞
本发明提供了经遗传修饰的宿主细胞,其被工程化以表达本发明的CadA变体多肽。相对于不具有一种额外遗传修饰的对照菌株(例如野生型菌株、或没有一种额外遗传修饰的相同菌株的细胞),本发明的遗传修饰的宿主菌株通常包含至少一种额外的遗传修饰以增强氨基酸或氨基酸衍生物的产生。“增强氨基酸或氨基酸衍生物产生的额外的遗传修饰”可以是任何遗传修饰。在一些实施方案中,遗传修饰是引入表达参与氨基酸或氨基酸衍生物合成的酶的多核苷酸。在一些实施方案中,宿主细胞包含多种修饰,以相对于野生型宿主细胞增加氨基酸或氨基酸衍生物的产生。
在一些方面,遗传修饰宿主细胞以表达CadA变体多肽与修饰宿主细胞以过表达一种或多种赖氨酸生物合成多肽一起进行。
在一些实施方案中,可以对宿主细胞进行遗传修饰以表达影响赖氨酸生物合成的一种或多种多肽。赖氨酸生物合成多肽的实例包括大肠杆菌基因SucA、Ppc、AspC、LysC、Asd、DapA、DapB、DapD、ArgD、DapE、DapF、LysA、Ddh、PntAB、CyoABE、GadAB、YbjE、GdhA、GltA、SucC、GadC、AcnB、PflB、ThrA、AceA、AceB、GltB、AceE、SdhA、MurE、SpeE、SpeG、PuuA、PuuP和YgjG,或来自其他生物体的相应基因。这些基因是本领域已知的(参见例如Shah等人,J.Med.Sci.2:152-157,2002;Anastassiadia,S.Recent Patents on Biotechnol.1:11-24,2007)。还参见Kind,等人,Appl.Microbiol.Biotechnol.91:1287-1296,2011,其综述与尸胺产生有关的基因。编码赖氨酸生物合成多肽的示例性基因如下。
在一些实施方案中,可以对宿主细胞进行遗传修饰以减弱或降低影响赖氨酸生物合成的一种或多种多肽的表达。此类多肽的实例包括大肠杆菌基因Pck、Pgi、DeaD、CitE、MenE、PoxB、AceA、AceB、AceE、RpoC和ThrA,或来自其他生物体的相应基因。这些基因是本领域已知的(参见例如Shah等人,J.Med.Sci.2:152-157,2002;Anastassiadia,S.RecentPatents on Biotechnol.1:11-24,2007)。还参见Kind等人,Appl.Microbiol.Biotechnol.91:1287-1296,2011,其综述基因减弱以增加尸胺产成。编码多肽(其减弱增加赖氨酸生物合成)的示例性基因如下。
蛋白 基因 EC编号 GenBank登录号
PEP羧激酶(Pck) pck 4.1.1.49 NP_417862
葡萄糖-6-磷酸异构酶(Pgi) pgi 5.3.1.9 NP_418449
DEAD-盒RNA解旋酶(DeaD) deaD NP_417631
柠檬酸裂合酶(CitE) citE 4.1.3.6/4.1.3.34 NP_415149
o-琥珀酰苯甲酸-CoA连接酶(MenE) menE 6.2.1.26 NP_416763
丙酮酸氧化酶(PoxB) poxB 1.2.2.2 NP_415392
异柠檬酸裂合酶(AceA) aceA 4.1.3.1 NP_418439
苹果酸合酶A(AceB) aceB 2.3.3.9 NP_418438
丙酮酸脱氢酶(aceE) aceE 1.2.4.1 NP_414656
RNA聚合酶b’亚基(RpoC) rpoC 2.7.7.6 NP_418415
天冬氨酸激酶I(ThrA) thrA 2.7.2.4/1.1.1.3 NP_414543
编码赖氨酸生物合成多肽的核酸可与编码CadA变体多肽的多核苷酸一起引入宿主细胞中,例如,在单一表达载体上编码,或以多个表达载体同时引入。或者,可以在遗传修饰宿主细胞表达CadA变体多肽之前或之后,对宿主细胞进行遗传修饰过表达一种或多种赖氨酸生物合成多肽。
工程化以表达CadA变体多肽的宿主细胞通常是细菌宿主细胞。在典型的实施方案中,细菌宿主细胞是革兰氏阴性细菌宿主细胞。在本发明的一些实施方案中,细菌是肠细菌。在本发明的一些实施方案中,细菌是棒杆菌属(Corynebacterium)、埃希氏菌属(Escherichia)、假单胞菌属(Pseudomonas)、发酵单胞菌属(Zymomonas)、希瓦氏菌属(Shewanella)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、肠杆菌属(Enterobacter)、柠檬酸杆菌属(Citrobacter)、Cronobacter、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、变形杆菌属(Proteus)、哈夫尼菌属(Hafnia)、耶尔森氏菌属(Yersinia)、摩根氏菌属(Morganella)、爱德华氏菌属(Edwardsiella)或克雷伯氏菌属(Klebsiella)分类学纲的物种。在一些实施方案中,宿主细胞是埃希氏菌属(Shewanella)、哈夫尼菌属(Hafnia)或棒杆菌属(Corynebacterium)的成员。在一些实施方案中,宿主细胞是大肠杆菌(Escherichia coli)、蜂房哈夫尼菌(Hafnia alvei)、谷氨酸棒杆菌(Corynebacterium glutamicum)宿主细胞。在一些实施方案中,宿主细胞是大肠杆菌(Escherichia coli)。在一些实施方案中,宿主细胞是蜂房哈夫尼菌(Hafnia alvei)。在一些实施方案中,宿主细胞是谷氨酸棒杆菌(Corynebacterium glutamicum)。
在一些实施方案中,宿主细胞是革兰氏阳性细菌宿主细胞,例如芽孢杆菌属物种(Bacillus sp.),例如枯草芽孢杆菌(Bacillus subtilis)或地衣芽孢杆菌(Bacilluslicheniformis);或另一芽孢杆菌属物种,例如嗜碱芽孢杆菌(Bacillus alcalophilus)、B.amovovorans、解淀粉芽孢杆菌(B.amyloliquefaciens)、B.caldolyticus、环状芽孢杆菌(B.circulans)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、热葡糖苷酶芽孢杆菌(B.thermoglucosidasius),苏云金芽孢杆菌(B.thuringiensis)或B.vulgatis。
如本文所述,可以针对增加的赖氨酸或赖氨酸衍生物(例如尸胺)的产生筛选根据本发明修饰的宿主细胞。
在一些实施方案中,可以从表达变体多肽的宿主细胞中回收本发明的CadA变体多肽。在一些实施方案中,可以将回收的变体蛋白固定在固体基质或惰性材料上以形成固定化酶。在一个实施方案中,相比于可溶形式的融合蛋白,固定化酶可以具有改善的操作稳定性。
产生赖氨酸或赖氨酸衍生物的方法
经遗传修饰以过表达本发明的CadA变体多肽的宿主细胞可用于产生赖氨酸或赖氨酸衍生物。在一些实施方案中,宿主细胞产生尸胺。因此,例如,为了产生尸胺,经遗传修饰以表达如本文所述的CadA变体多肽的宿主细胞可在适于允许多肽表达以及表达编码用于产生赖氨酸和/或尸胺的酶的基因的条件下培养。根据本发明修饰的表达CadA变体多肽的宿主细胞,相对于表达天然CadA的对应宿主细胞,提供了更高的尸胺产率。
可以使用熟知的技术培养宿主细胞(参见例如实施例部分中提供的示例性条件)。
在一些实施方案中,使用非盐(例如硫酸铵或氯化铵)的氮源(例如氨或尿素)培养宿主细胞。在细胞生长或酶产生期间,宿主细胞可以在碱性pH培养。
然后使用已知技术分离和纯化赖氨酸或赖氨酸衍生物。根据本发明生产的赖氨酸或赖氨酸衍生物例如尸胺,然后可以用于任何已知方法,例如生产聚酰胺。
在一些实施方案中,可以使用化学催化剂,或通过使用酶和化学催化剂,将赖氨酸转化为己内酰胺。
本发明将通过具体实施例被更详细地描述。提供以下实施例用于说明目的,并不旨在以任何方式限制本发明。本领域技术人员将容易地认识到各种非关键参数,其可以被改变或修改以产生基本相同的结果。
实施例
我们假设十聚体-十聚体界面含有核心结构域中的蛋白质区段,并且是由在这些结构域内没有确定的二级结构(α,α螺旋;β,β折叠;η,链)的蛋白质部分组成(参见Kanjee等人)。这些部分是包括η4和α11的β10和β11之间的氨基酸276-299,包括β12的β11和α12之间的氨基酸314-326,η6和β14之间的氨基酸344-357,包括β17的β16和β18之间的氨基酸454-483,以及β19和α17之间的氨基酸494-509。这些实施例表明,在这些位置的赖氨酸残基可被取代,以增加经遗传修饰表达CadA变体多肽的宿主细胞的尸胺产生。
实施例1:构建编码CadA的质粒载体
含有野生型大肠杆菌cadA(SEQ ID NO:1)(其编码赖氨酸脱羧酶CadA(SEQ ID NO:2))的质粒载体使用PCR引物cadA-F和cadA-R(图1)从大肠杆菌MG1655 K12基因组DNA中扩增,使用限制酶SacI和XbaI消化该质粒,并连接到pUC18中以产生质粒pCIB60。使用PCR引物cadA-F2和cadA-R2优化cadA基因上游的5'序列以产生pCIB71。
实施例2:构建编码在预测的界面氨基酸残基处具有半胱氨酸突变的CadA的质粒载体。
设计引物对以将突变引入pCIB71的CadA基因,以使用Quickchange PCR将CadA的位置287、290、319、320、325、346、357、381、477或500处的氨基酸修饰为半胱氨酸。使用DNA测序验证突变,并且携带半胱氨酸突变的质粒标记为pCIB71-K287C、pCIB71-K290C、pCIB71-K319C、pCIB71-K320C、pCIB71-K325C、pCIB71-K346C、pCIB71-K357C、pCIB71-K381C、pCIB71-K477C或pCIB71-K500C。
实施例3:在预测的界面氨基酸残基处具有半胱氨酸突变的突变体CadA多肽的赖氨酸脱羧酶活性。
用pCIB71-K287C、pCIB71-K290C、pCIB71-K319C、pCIB71-K320C、pCIB71-K325C、pCIB71-K346C、pCIB71-K357C、pCIB71-K381C、pCIB71-K477C或pCIB71-K500C转化入蜂房哈夫尼菌。将来自每次转化的三个单菌落在37℃于4mL含有氨苄青霉素(100μg/mL)的LB培养基中生长过夜。第二天,将0.7mL的每种过夜培养物加入到0.3mL赖氨酸-HCl和PLP中至终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节为pH8.0。将每种混合物在37℃孵育2小时。使用NMR对来自每个样品的尸胺生产进行定量,并通过将所产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量来计算产率。表1中列出了2小时后,每个样品相对于用pCIB71转化的蜂房哈夫尼菌的平均产率的平均产率。
表1.表达编码在预测的界面氨基酸残基处具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产率。
质粒 相对产率(%)
pCIB71 100
pCIB71-K287C 84
pCIB71-K290C 93
pCIB71-K319C 74
pCIB71-K320C 187
pCIB71-K325C 106
pCIB71-K346C 89
pCIB71-K357C 87
pCIB71-K381C 100
pCIB71-K477C 77
pCIB71-K500C 87
如表1所示,两种突变在pH8.0提高了CadA多肽的活性。突变K320C使相对产率显著增加超过30%。突变K325C使产率增加6%。
实施例4:构建编码在K320具有突变的CadA的质粒载体。
设计引物对以引入所需突变,使用Quickchange PCR来修饰pCIB71中cadA基因的位置320处的氨基酸。使用DNA测序验证突变,并且在氨基酸位置320处携带每个突变的质粒标记为pCIB71-K320X,其中X是替换赖氨酸残基的氨基酸。
实施例5:具有K320X突变的突变体CadA多肽的赖氨酸脱羧酶活性。
用质粒pCIB71-K320X转化蜂房哈夫尼菌。将来自每次转化的三个单菌落在37℃于4mL含有氨苄青霉素(100μg/mL)的LB培养基中生长过夜。第二天,将0.7mL的每种过夜培养物加入到0.3mL赖氨酸-HCl和PLP中至终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节至pH8.0。将每种混合物在37℃孵育2小时。使用NMR对来自每个样品的尸胺生产进行定量,并通过将所产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量来计算产率。表2中列出了2小时后,每个样品相对于用pCIB71转化的蜂房哈夫尼菌的平均产率的产率。
表2.表达编码在氨基酸位置320处具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产率。
质粒 相对产率(%) 质粒 相对产率(%)
pCIB71 100 pCIB71-K320M 113
pCIB71-K320A 117 pCIB71-K320N 87
pCIB71-K320C 191 pCIB71-K320P 57
pCIB71-K320D 98 pCIB71-K320Q 68
pCIB71-K320E 126 pCIB71-K320R 94
pCIB71-K320F 100 pCIB71-K320S 111
pCIB71-K320G 140 pCIB71-K320T 96
pCIB71-K320H 115 pCIB71-K320V 126
pCIB71-K320I 117 pCIB71-K320W 87
pCIB71-K320L 148 pCIB71-K320Y 129
如表2所示,在氨基酸位置291处的几个突变在pH8.0提高了CadA多肽的活性。突变K320C、K320E、K320G,K320L、K320V和K320Y使相对产率增加超过25%。突变K320A、K320H、K320I、K320M和K320S也增加了产率。突变K320D、K320F、K320R和K320T对产率几乎没有影响。剩余的突变K320N、K320P、K320Q和K320W降低了产率。
实施例6:在碱性pH条件突变体CadA多肽的体外动力学分析
用弗氏压碎器裂解100ml用pCIB71、pCIB71-K320C、pCIB71-K320G和pCIB71-K320L任一转化的蜂房哈夫尼菌样品。将裂解的样品离心,并将上清液与沉淀物分离,以进行体外实验。每个反应在含有120g/L赖氨酸-HCl和0.1mM PLP的Tris-HCl缓冲液(50mM Tris-HCl,pH6或8,25mM NaCl,2mM EDTA)中进行。使用NMR测定各裂解样品的反应速率:通过在PLP存在下每1.6分钟(总共20分钟)取样转化成尸胺的赖氨酸的量,并取得收率曲线的线性部分的斜率。稀释样品使得每个样品的反应速率U(mmol/min/mL)为4。使用相同的U在初始pH6或者pH8测量每个裂解的样品的赖氨酸的动力学常数Vmax和Km。两种样品的动力学分析结果如表3所示。
表3.在不同pH条件下表达编码野生型或突变体CadA多肽的质粒的蜂房哈夫尼菌的裂解样品的归一化Vmax的动力学分析
如表3中所示,与pH6相比,野生型CadA(pCIB71)在pH8损失了24%的活性。令人惊讶的是,尽管在pH6野生型和突变体之间的活性没有显示出显著差异,但与野生型CadA多肽相比,突变体CadA多肽(pCIB71-K320C、pCIB71-K320G和pCIB71-K320L)在pH8显示出显著更高的活性。
实施例7:构建编码在位置320和在位置291或355具有突变的CadA的质粒载体。
设计引物对来修饰质粒pCIB71-E291C和pCIB71-E355C中的cadA基因,以在CadA多肽的氨基酸320处引入突变。使用如实施例2中所述的方法,产生质粒pCIB71-E291C和pCIB81-E255C,其分别含有编码突变E291C和E355C的cadA基因构建体。采用如实施例2和4中所示的方法,使用Quickchange PCR在位置320引入所需的突变。使用DNA测序验证突变,并且在氨基酸位置320处携带每个突变的质粒标记为pCIB71-E291C-K320X和pCIB71-E355C-K320X,其中X是取代赖氨酸残基的氨基酸。
实施例8:在320处具有突变和E291C或E355C的CadA多肽的赖氨酸脱羧酶活性。
用pCIB71、pCIB71-E291C-K320X和pCIB71-E355C-K320X转化蜂房哈夫尼菌中。将来自每次转化的三个单菌落在37℃于4mL含有氨苄青霉素(100μg/mL)的LB培养基中生长过夜。第二天,将0.7mL的每种过夜培养物加入到0.3mL赖氨酸-HCl和PLP中至终浓度分别为120g/L和0.1mM。用1M NaOH将最终混合物调节至pH8.0。将每种混合物在37℃孵育2小时。使用NMR对来自每个样品的尸胺生产进行定量,并通过将所产生的尸胺的摩尔量除以加入的赖氨酸的摩尔量来计算产率。表4中列出了2小时后,每个样品相对于用pCIB71转化的蜂房哈夫尼菌的平均产率的产率。
表4.表达编码在氨基酸位置468处具有突变的CadA多肽的质粒的蜂房哈夫尼菌菌株在pH8的相对尸胺产率
质粒 相对产率(%)
pCIB71 100
pCIB71-E291C-K320C 78
pCIB71-E291C-K320G 113
pCIB71-E291C-K320L 115
pCIB71-E355C-K320C 220
pCIB71-E355C-K320G 131
pCIB71-E355C-K320L 146
如表4所示,除了E291C-K320C突变体之外,大多数具有两个突变的突变体CadA多肽相对于野生型CadA多肽在pH8增加了产率。令人惊讶的是,在pH8,与野生型多肽相比,双突变体E355C-K320C示出超过2倍的产率。
实施例9:酶浓度对赖氨酸脱羧酶活性保留的影响
根据文献,由于从高低聚物状态到低低聚物状态的结构变化,在pH8时CadA的活性显著低于其在pH6时的活性。在pH6和pH8比较野生型和突变体CadA多肽的活性,以确定突变是否可以在碱性pH条件下增加CadA多肽的活性。
用弗氏压碎器裂解100mL用pCIB71和pCIB71-K320C任一转化的蜂房哈夫尼菌样品。将裂解的样品离心,并将上清液与沉淀物分离,以进行体外实验。每个反应在含有120g/L赖氨酸-HCl和0.1mM PLP的Tris-HCl缓冲液(50mM Tris-HCl,pH6或8,25mM NaCl,2mMEDTA)中进行。使用NMR,通过在PLP存在下每1.6分钟(总共20分钟)取样转化成尸胺的赖氨酸的量,并取得收率曲线的线性部分的斜率来测量每个裂解样品的反应速率。稀释样品,使得裂解样品的每体积反应速率(mmol/min/mL,U)相同。使用相同的U在初始pH6或者pH8测量每个裂解的样品的动力学常数Vmax。通过归一化U,每个样品中活性酶的浓度是相同的。两种样品的动力学分析结果如下。
表5.通过测量U,在不同浓度的酶裂解物中,表达编码野生型CadA或突变体多肽的质粒的蜂房哈夫尼菌的裂解样品从pH6至8时Vmax的百分比变化。
U pCIB71 pCIB71-K320C
0.5 -48% -26%
1 -37% -27%
2 -30% -23%
4 -26% -15%
8 -27% -17%
基于表5中的数据,从pH6到pH8的活性损失是浓度依赖性的。与较高浓度的多肽相比,在较低浓度的野生型(pCIB71)或突变体(pCIB71-K320C)CadA多肽中,酶对碱性pH更敏感。这表现为当从pH6变到pH8时,对于野生型多肽,与8U的损失仅为27%相比,0.5U的活性损失48%。然而,在所有酶浓度下,与野生型多肽相比,突变体CadA多肽显示出降低的活性损失。当从pH6变到pH8时,突变体多肽在0.5U时仅损失26%的活性,在8U时仅损失17%的活性。
实施例10.固定化的CadA赖氨酸脱羧酶的活性
制备固定在环氧树脂上的CadA多肽,首先从发酵液中收获酶溶液,使用0.2M柠檬酸缓冲液稀释酶溶液至浓度为500U/g,并将稀释的溶液调节至pH为7.5-8.0。然后将环氧树脂加入稀释的酶溶液中,充分混合,同时在20℃孵育3天。使用前将固定化的酶混合物用水洗涤。
在几天内测定一定量的相当于10,000U活性的固定化野生型CadA和突变体CadAK320C,以测试它们在赖氨酸转化为尸胺期间的稳定性。将野生型和突变体固定化酶包装在单独的玻璃柱中。将含有10,000U固定化酶、120g/L赖氨酸-HCl和0.1mM PLP的400g溶液循环3小时。使用NMR测量溶液的尸胺产率。然后用水洗涤柱,并将含有赖氨酸和PLP的新溶液循环通过柱。该过程重复总共23次。含有固定化野生型或突变体CadA的柱的每轮从赖氨酸转化为尸胺的产率如表6所示。
表6.固定化的野生型和突变体CadA多肽的尸胺产率
如表6中所示,固定化的突变体CadA(pCIB71-K320C)多肽能够在24轮赖氨酸转化反应中维持96%至99%的尸胺产率。然而,固定化的野生型CadA多肽(pCIB71)仅能够在24轮中维持76%至99%的尸胺产率。第23次重复使用后,具有固定化的野生型CadA的柱的产率下降了23%(99%-76%),而具有固定化的突变体CadA的产率仅下降了3%(99%-96%)。具有固定化的野生型CadA的柱在24轮中平均产率为86%,而具有固定化的突变体CadA的平均产率为98%。
表7.实施例中用于赖氨酸突变的质粒和菌株表
表8.实施例中使用的引物序列(赖氨酸突变)表
示例性的CadA核酸和多肽序列:
SEQ ID NO:1大肠杆菌(Escherichia coli)cadA核酸序列
ATGAACGTTATTGCAATATTGAATCACATGGGGGTTTATTTTAAAGAAGAACCCATCCGTGAACTTCATCGCGCGCTTGAACGTCTGAACTTCCAGATTGTTTACCCGAACGACCGTGACGACTTATTAAAACTGATCGAAAACAATGCGCGTCTGTGCGGCGTTATTTTTGACTGGGATAAATATAATCTCGAGCTGTGCGAAGAAATTAGCAAAATGAACGAGAACCTGCCGTTGTACGCGTTCGCTAATACGTATTCCACTCTCGATGTAAGCCTGAATGACCTGCGTTTACAGATTAGCTTCTTTGAATATGCGCTGGGTGCTGCTGAAGATATTGCTAATAAGATCAAGCAGACCACTGACGAATATATCAACACTATTCTGCCTCCGCTGACTAAAGCACTGTTTAAATATGTTCGTGAAGGTAAATATACTTTCTGTACTCCTGGTCACATGGGCGGTACTGCATTCCAGAAAAGCCCGGTAGGTAGCCTGTTCTATGATTTCTTTGGTCCGAATACCATGAAATCTGATATTTCCATTTCAGTATCTGAACTGGGTTCTCTGCTGGATCACAGTGGTCCACACAAAGAAGCAGAACAGTATATCGCTCGCGTCTTTAACGCAGACCGCAGCTACATGGTGACCAACGGTACTTCCACTGCGAACAAAATTGTTGGTATGTACTCTGCTCCAGCAGGCAGCACCATTCTGATTGACCGTAACTGCCACAAATCGCTGACCCACCTGATGATGATGAGCGATGTTACGCCAATCTATTTCCGCCCGACCCGTAACGCTTACGGTATTCTTGGTGGTATCCCACAGAGTGAATTCCAGCACGCTACCATTGCTAAGCGCGTGAAAGAAACACCAAACGCAACCTGGCCGGTACATGCTGTAATTACCAACTCTACCTATGATGGTCTGCTGTACAACACCGACTTCATCAAGAAAACACTGGATGTGAAATCCATCCACTTTGACTCCGCGTGGGTGCCTTACACCAACTTCTCACCGATTTACGAAGGTAAATGCGGTATGAGCGGTGGCCGTGTAGAAGGGAAAGTGATTTACGAAACCCAGTCCACTCACAAACTGCTGGCGGCGTTCTCTCAGGCTTCCATGATCCACGTTAAAGGTGACGTAAACGAAGAAACCTTTAACGAAGCCTACATGATGCACACCACCACTTCTCCGCACTACGGTATCGTGGCGTCCACTGAAACCGCTGCGGCGATGATGAAAGGCAATGCAGGTAAGCGTCTGATCAACGGTTCTATTGAACGTGCGATCAAATTCCGTAAAGAGATCAAACGTCTGAGAACGGAATCTGATGGCTGGTTCTTTGATGTATGGCAGCCGGATCATATCGATACGACTGAATGCTGGCCGCTGCGTTCTGACAGCACCTGGCACGGCTTCAAAAACATCGATAACGAGCACATGTATCTTGACCCGATCAAAGTCACCCTGCTGACTCCGGGGATGGAAAAAGACGGCACCATGAGCGACTTTGGTATTCCGGCCAGCATCGTGGCGAAATACCTCGACGAACATGGCATCGTTGTTGAGAAAACCGGTCCGTATAACCTGCTGTTCCTGTTCAGCATCGGTATCGATAAGACCAAAGCACTGAGCCTGCTGCGTGCTCTGACTGACTTTAAACGTGCGTTCGACCTGAACCTGCGTGTGAAAAACATGCTGCCGTCTCTGTATCGTGAAGATCCTGAATTCTATGAAAACATGCGTATTCAGGAACTGGCTCAGAATATCCACAAACTGATTGTTCACCACAATCTGCCGGATCTGATGTATCGCGCATTTGAAGTGCTGCCGACGATGGTAATGACTCCGTATGCTGCATTCCAGAAAGAGCTGCACGGTATGACCGAAGAAGTTTACCTCGACGAAATGGTAGGTCGTATTAACGCCAATATGATCCTTCCGTACCCGCCGGGAGTTCCTCTGGTAATGCCGGGTGAAATGATCACCGAAGAAAGCCGTCCGGTTCTGGAGTTCCTGCAGATGCTGTGTGAAATCGGCGCTCACTATCCGGGCTTTGAAACCGATATTCACGGTGCATACCGTCAGGCTGATGGCCGCTATACCGTTAAGGTATTGAAAGAAGAAAGCAAAAAATAA
SEQ ID NO:2大肠杆菌(E.coli)CadA多肽序列。位置320和325处的赖氨酸残基加下划线并以粗体表示。
MNVIAILNHMGVYFKEEPIRELHRALERLNFQIVYPNDRDDLLKLIENNARLCGVIFDWDKYNLELCEEISKMNENLPLYAFANTYSTLDVSLNDLRLQISFFEYALGAAEDIANKIKQTTDEYINTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSLFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEQYIARVFNADRSYMVTNGTSTANKIVGMYSAPAGSTILIDRNCHKSLTHLMMMSDVTPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLINGSIERAIKFRKEIKRLRTESDGWFFDVWQPDHIDTTECWPLRSDSTWHGFKNIDNEHMYLDPIKVTLLTPGMEKDGTMSDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQELAQNIHKLIVHHNLPDLMYRAFEVLPTMVMTPYAAFQKELHGMTEEVYLDEMVGRINANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEESKK
SEQ ID NO:3与大肠杆菌CadA同源的来自克雷伯氏菌属(Klebsiella)的多肽
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDRDDLLKLIENNSRLCGVIFDWDKYNLELCEEISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGPECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQDLAQNIHKLIEHHNLPDLMFRAFEVLPSMVMTPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:4与大肠杆菌CadA同源的来自肠杆菌科(Enterobacteriaceae)的多肽
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDRDDLLKLIENNSRLCGVIFDWDKYNLELCEEISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGPECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRIQDLAQNIHKLIEHHNLPDLMFRAFEVLPSMVMTPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:5与大肠杆菌CadA同源的来自肠沙门氏菌(Salmonella enterica)的多肽
MNVIAIMNHMGVYFKEEPIRELHRALEGLNFRIVYPNDREDLLKLIENNSRLCGVIFDWDKYNLELCEEISKLNEYMPLYAFANSYSTLDVSLNDLRMQVRFFEYALGAATDIAAKIRQNTDEYIDNILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYQGKCGMSGDRVEGKIIYETQSTHKLLAAFSQASMIHVKGDINEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLINGSIERAIKFRKEIKRLKSESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTILTPGMKKDGTMDEFGIPASLVAKYLDERGIIVEKTGPYNLLFLFSIGIDKTKALSLLRALTEFKRAFDLNLRVKNILPALYREAPEFYENMRIQELAQNIHKLVEHHNLPDLMYRAFEVLPKMVMTPYTAFQKELHGETEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKENTK
序列表
<110> 上海凯赛生物技术股份有限公司
CIBT美国公司
<120> 对赖氨酸脱羧酶酶类的修饰
<130> P2017TC363
<160> 51
<170> PatentIn version 3.5
<210> 1
<211> 2148
<212> DNA
<213> Escherichia coli
<400> 1
atgaacgtta ttgcaatatt gaatcacatg ggggtttatt ttaaagaaga acccatccgt 60
gaacttcatc gcgcgcttga acgtctgaac ttccagattg tttacccgaa cgaccgtgac 120
gacttattaa aactgatcga aaacaatgcg cgtctgtgcg gcgttatttt tgactgggat 180
aaatataatc tcgagctgtg cgaagaaatt agcaaaatga acgagaacct gccgttgtac 240
gcgttcgcta atacgtattc cactctcgat gtaagcctga atgacctgcg tttacagatt 300
agcttctttg aatatgcgct gggtgctgct gaagatattg ctaataagat caagcagacc 360
actgacgaat atatcaacac tattctgcct ccgctgacta aagcactgtt taaatatgtt 420
cgtgaaggta aatatacttt ctgtactcct ggtcacatgg gcggtactgc attccagaaa 480
agcccggtag gtagcctgtt ctatgatttc tttggtccga ataccatgaa atctgatatt 540
tccatttcag tatctgaact gggttctctg ctggatcaca gtggtccaca caaagaagca 600
gaacagtata tcgctcgcgt ctttaacgca gaccgcagct acatggtgac caacggtact 660
tccactgcga acaaaattgt tggtatgtac tctgctccag caggcagcac cattctgatt 720
gaccgtaact gccacaaatc gctgacccac ctgatgatga tgagcgatgt tacgccaatc 780
tatttccgcc cgacccgtaa cgcttacggt attcttggtg gtatcccaca gagtgaattc 840
cagcacgcta ccattgctaa gcgcgtgaaa gaaacaccaa acgcaacctg gccggtacat 900
gctgtaatta ccaactctac ctatgatggt ctgctgtaca acaccgactt catcaagaaa 960
acactggatg tgaaatccat ccactttgac tccgcgtggg tgccttacac caacttctca 1020
ccgatttacg aaggtaaatg cggtatgagc ggtggccgtg tagaagggaa agtgatttac 1080
gaaacccagt ccactcacaa actgctggcg gcgttctctc aggcttccat gatccacgtt 1140
aaaggtgacg taaacgaaga aacctttaac gaagcctaca tgatgcacac caccacttct 1200
ccgcactacg gtatcgtggc gtccactgaa accgctgcgg cgatgatgaa aggcaatgca 1260
ggtaagcgtc tgatcaacgg ttctattgaa cgtgcgatca aattccgtaa agagatcaaa 1320
cgtctgagaa cggaatctga tggctggttc tttgatgtat ggcagccgga tcatatcgat 1380
acgactgaat gctggccgct gcgttctgac agcacctggc acggcttcaa aaacatcgat 1440
aacgagcaca tgtatcttga cccgatcaaa gtcaccctgc tgactccggg gatggaaaaa 1500
gacggcacca tgagcgactt tggtattccg gccagcatcg tggcgaaata cctcgacgaa 1560
catggcatcg ttgttgagaa aaccggtccg tataacctgc tgttcctgtt cagcatcggt 1620
atcgataaga ccaaagcact gagcctgctg cgtgctctga ctgactttaa acgtgcgttc 1680
gacctgaacc tgcgtgtgaa aaacatgctg ccgtctctgt atcgtgaaga tcctgaattc 1740
tatgaaaaca tgcgtattca ggaactggct cagaatatcc acaaactgat tgttcaccac 1800
aatctgccgg atctgatgta tcgcgcattt gaagtgctgc cgacgatggt aatgactccg 1860
tatgctgcat tccagaaaga gctgcacggt atgaccgaag aagtttacct cgacgaaatg 1920
gtaggtcgta ttaacgccaa tatgatcctt ccgtacccgc cgggagttcc tctggtaatg 1980
ccgggtgaaa tgatcaccga agaaagccgt ccggttctgg agttcctgca gatgctgtgt 2040
gaaatcggcg ctcactatcc gggctttgaa accgatattc acggtgcata ccgtcaggct 2100
gatggccgct ataccgttaa ggtattgaaa gaagaaagca aaaaataa 2148
<210> 2
<211> 715
<212> PRT
<213> Escherichia coli
<400> 2
Met Asn Val Ile Ala Ile Leu Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asn Phe Gln
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Asn Leu Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Leu Gln Ile Ser Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Thr Thr Asp Glu Tyr Ile Asn Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Leu Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Gln Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Asp Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Ile Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Val Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Arg Thr Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Asp His Ile Asp Thr Thr Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Thr Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Glu Lys Asp Gly Thr Met Ser Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Val His His Asn Leu Pro Asp Leu Met Tyr Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Met Thr Glu Glu Val Tyr Leu Asp Glu Met
625 630 635 640
Val Gly Arg Ile Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Ser Lys Lys
705 710 715
<210> 3
<211> 715
<212> PRT
<213> Klebsiella
<400> 3
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Pro Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Asp Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Ser Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 4
<211> 715
<212> PRT
<213> Enterobacteriaceae
<400> 4
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Pro Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Asp Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Ser Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 5
<211> 714
<212> PRT
<213> Salmonella enterica
<400> 5
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Gly Leu Asn Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Leu Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Ser Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Thr Asp
100 105 110
Ile Ala Ala Lys Ile Arg Gln Asn Thr Asp Glu Tyr Ile Asp Asn Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Gln Gly Lys Cys Gly Met Ser Gly Asp
340 345 350
Arg Val Glu Gly Lys Ile Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Ile
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Ser Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Ile Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Leu Val Ala Lys Tyr Leu Asp Glu Arg Gly Ile Ile Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Glu Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Ile Leu Pro Ala Leu Tyr Arg Glu
565 570 575
Ala Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Val Glu His His Asn Leu Pro Asp Leu Met Tyr Arg
595 600 605
Ala Phe Glu Val Leu Pro Lys Met Val Met Thr Pro Tyr Thr Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Glu Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Asn Thr Lys
705 710
<210> 6
<211> 52
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer cadA-F
<400> 6
ggcgagctca cacaggaaac agaccatgaa cgttattgca atattgaatc ac 52
<210> 7
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer cadA-R
<400> 7
ggctctagac cacttccctt gtacgagc 28
<210> 8
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer cadA-F2
<400> 8
atttcacaca ggaaacagct atgaacgtta ttgcaatatt gaat 44
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer cadA-R2
<400> 9
agctgtttcc tgtgtgaaat 20
<210> 10
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320A-F
<400> 10
accgacttca tcaaggcaac actggatgtg aaatccatc 39
<210> 11
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320A-R
<400> 11
gatttcacat ccagtgttgc cttgatgaag tcggtgttg 39
<210> 12
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320C-F
<400> 12
accgacttca tcaagtgcac actggatgtg aaatccatc 39
<210> 13
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320C-R
<400> 13
gatttcacat ccagtgtgca cttgatgaag tcggtgttg 39
<210> 14
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320D-F
<400> 14
accgacttca tcaaggacac actggatgtg aaatccatc 39
<210> 15
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320D-R
<400> 15
gatttcacat ccagtgtgtc cttgatgaag tcggtgttg 39
<210> 16
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320E-F
<400> 16
accgacttca tcaaggaaac actggatgtg aaatccatc 39
<210> 17
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320E-R
<400> 17
gatttcacat ccagtgtttc cttgatgaag tcggtgttg 39
<210> 18
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320F-F
<400> 18
accgacttca tcaagttcac actggatgtg aaatccatc 39
<210> 19
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320F-R
<400> 19
gatttcacat ccagtgtgaa cttgatgaag tcggtgttg 39
<210> 20
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320G-F
<400> 20
accgacttca tcaagggaac actggatgtg aaatccatc 39
<210> 21
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320G-R
<400> 21
gatttcacat ccagtgttcc cttgatgaag tcggtgttg 39
<210> 22
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320H-F
<400> 22
accgacttca tcaagcatac actggatgtg aaatccatc 39
<210> 23
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320H-R
<400> 23
gatttcacat ccagtgtatg cttgatgaag tcggtgttg 39
<210> 24
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320I-F
<400> 24
accgacttca tcaagatcac actggatgtg aaatccatc 39
<210> 25
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320I-R
<400> 25
gatttcacat ccagtgtgat cttgatgaag tcggtgttg 39
<210> 26
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320L-F
<400> 26
accgacttca tcaagctgac actggatgtg aaatccatc 39
<210> 27
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320L-R
<400> 27
gatttcacat ccagtgtcag cttgatgaag tcggtgttg 39
<210> 28
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320M-F
<400> 28
accgacttca tcaagatgac actggatgtg aaatccatc 39
<210> 29
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320M-R
<400> 29
gatttcacat ccagtgtcat cttgatgaag tcggtgttg 39
<210> 30
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320N-F
<400> 30
accgacttca tcaagaacac actggatgtg aaatccatc 39
<210> 31
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320N-R
<400> 31
gatttcacat ccagtgtgtt cttgatgaag tcggtgttg 39
<210> 32
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320P-F
<400> 32
accgacttca tcaagccaac actggatgtg aaatccatc 39
<210> 33
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320P-R
<400> 33
gatttcacat ccagtgttgg cttgatgaag tcggtgttg 39
<210> 34
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320Q-F
<400> 34
accgacttca tcaagcaaac actggatgtg aaatccatc 39
<210> 35
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320Q-R
<400> 35
gatttcacat ccagtgtttg cttgatgaag tcggtgttg 39
<210> 36
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320R-F
<400> 36
accgacttca tcaagcgtac actggatgtg aaatccatc 39
<210> 37
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320R-R
<400> 37
gatttcacat ccagtgtacg cttgatgaag tcggtgttg 39
<210> 38
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320S-F
<400> 38
accgacttca tcaagtcaac actggatgtg aaatccatc 39
<210> 39
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320S-R
<400> 39
gatttcacat ccagtgttga cttgatgaag tcggtgttg 39
<210> 40
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320T-F
<400> 40
accgacttca tcaagacaac actggatgtg aaatccatc 39
<210> 41
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320T-R
<400> 41
gatttcacat ccagtgttgt cttgatgaag tcggtgttg 39
<210> 42
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320V-F
<400> 42
accgacttca tcaaggtaac actggatgtg aaatccatc 39
<210> 43
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320V-R
<400> 43
gatttcacat ccagtgttac cttgatgaag tcggtgttg 39
<210> 44
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320W-F
<400> 44
accgacttca tcaagtggac actggatgtg aaatccatc 39
<210> 45
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320W-R
<400> 45
gatttcacat ccagtgtcca cttgatgaag tcggtgttg 39
<210> 46
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320Y-F
<400> 46
accgacttca tcaagtacac actggatgtg aaatccatc 39
<210> 47
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer K320Y-R
<400> 47
gatttcacat ccagtgtgta cttgatgaag tcggtgttg 39
<210> 48
<211> 714
<212> PRT
<213> SALMONELLA ENTERICA
<400> 48
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Gly Leu Asn Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Leu Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Ser Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Thr Asp
100 105 110
Ile Ala Ala Lys Ile Arg Gln Asn Thr Asp Glu Tyr Ile Asp Asn Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Gln Gly Lys Cys Gly Met Ser Gly Asp
340 345 350
Arg Val Glu Gly Lys Ile Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Ile
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Ser Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Ile Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Leu Val Ala Lys Tyr Leu Asp Glu Arg Gly Ile Ile Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Glu Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Ile Leu Pro Ala Leu Tyr Arg Glu
565 570 575
Ala Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Val Glu His His Asn Leu Pro Asp Leu Met Tyr Arg
595 600 605
Ala Phe Glu Val Leu Pro Lys Met Val Met Thr Pro Tyr Thr Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Glu Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Asn Thr Lys
705 710
<210> 49
<211> 715
<212> PRT
<213> ESCHERICHIA
<400> 49
Met Asn Val Ile Ala Ile Leu Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asn Phe Gln
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Asn Leu Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Leu Gln Ile Ser Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Thr Thr Asp Glu Tyr Ile Asn Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Leu Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Gln Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Asp Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Ile Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Val Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Arg Thr Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Asp His Ile Asp Thr Thr Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Thr Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Glu Lys Asp Gly Thr Met Ser Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Val His His Asn Leu Pro Asp Leu Met Tyr Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Met Thr Glu Glu Val Tyr Leu Asp Glu Met
625 630 635 640
Val Gly Arg Ile Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Ser Lys Lys
705 710 715
<210> 50
<211> 715
<212> PRT
<213> KLEBSIELLA
<400> 50
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Pro Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Asp Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Ser Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 51
<211> 715
<212> PRT
<213> ENTEROBACTERIAECEAE
<400> 51
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ser Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Pro Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Asp Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Asp Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Ser Met Val Met Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715

Claims (47)

1.一种CadA变体多肽,其在对应于参考SEQ ID NO:2所确定的氨基酸276至509的区域中的赖氨酸残基处包含至少一个氨基酸取代,其中所述赖氨酸残基存在于蛋白质的表面,具有的侧链在缺乏确定的二级结构的蛋白质区段中朝向外部环境;并且其中所述CadA变体多肽与SEQ ID NO:2至5中的任一个具有至少70%的相同性。
2.权利要求1的CadA变体多肽,其中所述赖氨酸残基位于对应于氨基酸314至326的区域。
3.权利要求2的CadA变体多肽,其中所述取代位于位置K320或K325。
4.权利要求3的CadA变体多肽,其包含在K320和K325处的取代。
5.权利要求3的CadA变体多肽,其中所述取代位于K320。
6.权利要求5的CadA变体多肽,其中所述氨基酸取代是K320A/C/E/G/H/I/L/M/S/V/Y。
7.权利要求6的CadA变体多肽,其中所述氨基酸取代是K320C/E/G/L/V/Y。
8.权利要求1的CadA变体多肽,其进一步包含在E291或E355处的取代。
9.权利要求5的CadA变体多肽,其进一步包含在E291或E355处的取代。
10.权利要求9的CadA变体多肽,其中所述取代位于E355。
11.权利要求5的CadA变体,其中所述变体包含取代E355C和K320C。
12.权利要求1-11任一项的CadA变体多肽,其中所述CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。
13.权利要求1-11任一项的CadA变体多肽,其中所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
14.权利要求1-11任一项的CadA变体多肽,其中所述CadA变体多肽与SEQ ID NO:3、SEQID NO:4或SEQ ID NO:5具有至少70%的相同性。
15.权利要求1-11任一项的CadA变体多肽,其中所述CadA变体多肽与SEQ ID NO:3、SEQID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
16.权利要求1-15的CadA变体多肽,其被固定在固体支持物上。
17.一种遗传修饰的宿主细胞,其包含权利要求1-15任一项的CadA变体多肽。
18.权利要求17的遗传修饰的宿主细胞,其中所述CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。
19.权利要求17的遗传修饰的宿主细胞,其中所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
20.权利要求17的遗传修饰的宿主细胞,其中所述CadA变体多肽与SEQ ID NO:3、SEQID NO:4或SEQ ID NO:5具有至少70%的相同性。
21.权利要求17的遗传修饰的宿主细胞,其中所述CadA变体多肽与SEQ ID NO:3、SEQID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
22.权利要求17的遗传修饰的宿主细胞,其中所述宿主细胞经遗传修饰以过表达一种或多种赖氨酸生物合成多肽。
23.权利要求17至22任一项的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。
24.权利要求23的遗传修饰的宿主细胞,其中所述宿主细胞来自埃希氏菌属(Escherichia)、哈夫尼菌属(Hafnia)或棒杆菌属(Corynebacteria)。
25.权利要求23的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌(Escherichiacoli)。
26.权利要求23的遗传修饰的宿主细胞,其中所述宿主细胞是蜂房哈夫尼菌(Hafniaalvei)。
27.权利要求23的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌(Corynebacterium glutamicum)。
28.一种产生尸胺的方法,所述方法包括在表达CadA变体多肽的条件下培养权利要求17-27任一项的遗传修饰的宿主细胞。
29.一种多核苷酸,其包含编码权利要求1-15任一项的CadA变体多肽的核酸序列。
30.权利要求29的多核苷酸,其中所述CadA变体多肽与SEQ ID NO:2具有至少70%的相同性。
31.权利要求29的多核苷酸,其中所述CadA变体多肽与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
32.权利要求29的多核苷酸,其中所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少70%的相同性。
33.权利要求29的多核苷酸,其中所述CadA变体多肽与SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5具有至少75%、至少80%、至少85%、至少90%或至少95%的相同性。
34.一种表达载体,其包含权利要求29至33任一项的多核苷酸。
35.一种遗传修饰的宿主细胞,其包含权利要求34的表达载体。
36.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。
37.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是埃希氏菌属、哈夫尼菌属或棒杆菌属。
38.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌。
39.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是蜂房哈夫尼菌。
40.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌。
41.一种遗传修饰的宿主细胞,其包含权利要求29至33任一项的多核苷酸,其中编码CadA变体多肽的核酸序列整合到宿主细胞染色体中。
42.权利要求41的遗传修饰的宿主细胞,其中所述宿主细胞是细菌。
43.权利要求42的遗传修饰的宿主细胞,其中所述宿主细胞来自埃希氏菌属、哈夫尼菌属或棒杆菌属。
44.权利要求42的遗传修饰的宿主细胞,其中所述宿主细胞是大肠杆菌。
45.权利要求42的遗传修饰的宿主细胞,其中所述宿主细胞是哈夫尼菌。
46.权利要求35的遗传修饰的宿主细胞,其中所述宿主细胞是谷氨酸棒杆菌。
47.一种产生尸胺的方法,所述方法包括在表达CadA变体多肽的条件下培养权利要求35-46任一项的遗传修饰的宿主细胞。
CN201780089675.XA 2017-05-16 2017-05-16 对赖氨酸脱羧酶酶类的修饰 Active CN110546255B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2017/084540 WO2018209563A1 (en) 2017-05-16 2017-05-16 Modifications to lysine decarboxylase enzymes

Publications (2)

Publication Number Publication Date
CN110546255A true CN110546255A (zh) 2019-12-06
CN110546255B CN110546255B (zh) 2023-07-04

Family

ID=64273117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780089675.XA Active CN110546255B (zh) 2017-05-16 2017-05-16 对赖氨酸脱羧酶酶类的修饰

Country Status (4)

Country Link
US (1) US11512302B2 (zh)
EP (1) EP3625339A4 (zh)
CN (1) CN110546255B (zh)
WO (1) WO2018209563A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113881657A (zh) * 2020-07-02 2022-01-04 中国科学院过程工程研究所 一种用于合成戊二胺的赖氨酸脱羧酶及其应用
CN113881719A (zh) * 2020-07-02 2022-01-04 中国科学院过程工程研究所 一种全细胞催化合成1,5-戊二胺的方法
CN114621984A (zh) * 2020-12-14 2022-06-14 中国科学院过程工程研究所 一种离子液体强化赖氨酸脱羧酶合成1,5-戊二胺的方法
CN115125229A (zh) * 2021-03-25 2022-09-30 中国科学院过程工程研究所 一种用于合成戊二胺的赖氨酸脱羧酶突变体

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150132808A1 (en) * 2012-01-18 2015-05-14 Mitsui Chemicals, Inc. Method for producing 1,5-pentamethylenediamine, mutant lysine decarboxylase, method for producing 1,5-pentamethylene diisocyanate and method for producing polyisocyanate composition
CN106536716A (zh) * 2014-06-26 2017-03-22 上海凯赛生物技术研发中心有限公司 参与赖氨酸脱羧作用的多肽的表达及其方法和应用
CN107074915A (zh) * 2015-01-30 2017-08-18 上海凯赛生物技术研发中心有限公司 参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103789292B (zh) 2013-12-26 2015-10-21 南京工业大学 一种赖氨酸脱羧酶、制备方法及其应用
CN104762336B (zh) * 2014-01-06 2019-10-29 上海凯赛生物技术股份有限公司 1,5-戊二胺的制备方法
EP3118312B1 (en) 2014-03-11 2018-12-26 Ajinomoto Co., Inc. Method for producing 1,5-pentadiamine using increased-thermal-stability lysine decarboxylase mutant
KR101791837B1 (ko) 2015-08-06 2017-10-31 서울대학교산학협력단 라이신 디카르복실라아제의 변이주 개발 방법 및 그의 응용

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150132808A1 (en) * 2012-01-18 2015-05-14 Mitsui Chemicals, Inc. Method for producing 1,5-pentamethylenediamine, mutant lysine decarboxylase, method for producing 1,5-pentamethylene diisocyanate and method for producing polyisocyanate composition
CN106536716A (zh) * 2014-06-26 2017-03-22 上海凯赛生物技术研发中心有限公司 参与赖氨酸脱羧作用的多肽的表达及其方法和应用
CN107074915A (zh) * 2015-01-30 2017-08-18 上海凯赛生物技术研发中心有限公司 参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
GENBANK ACCESSION NO. WP_044698312.1: ""lysine decarboxylase LdcC [Escherichia coli]", 《NCBI REFERENCE SEQUENCE》 *
GENBANK ACCESSION NO.CBE70874.1: "unnamed protein product [Salmonella enterica subsp. enterica serovar Typhimurium]", 《NCBI GENBANK》 *
GENBANK ACCESSION NO.CBG14132.1: "unnamed protein product [Vibrio parahaemolyticus]", 《NCBI GENBANK》 *
KOU FENGYU ET AL: "Characterization of a new lysine decarboxylase fromAliivibrio salmonicidafor cadaverine production at alkaline pH", 《JOURNAL OF MOLECULAR CATALYSIS B: ENZYMATIC》 *
SEO HYUNG-MIN ET AL: "In situ immobilization of lysine decarboxylase on a biopolymer by fusion with phasin Immobilization of CadA on intracellular PHA", 《PROCESS BIOCHEMISTRY》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113881657A (zh) * 2020-07-02 2022-01-04 中国科学院过程工程研究所 一种用于合成戊二胺的赖氨酸脱羧酶及其应用
CN113881719A (zh) * 2020-07-02 2022-01-04 中国科学院过程工程研究所 一种全细胞催化合成1,5-戊二胺的方法
WO2022001121A1 (zh) * 2020-07-02 2022-01-06 中国科学院过程工程研究所 一种用于合成戊二胺的赖氨酸脱羧酶及其应用
CN113881657B (zh) * 2020-07-02 2024-02-02 中国科学院过程工程研究所 一种用于合成戊二胺的赖氨酸脱羧酶及其应用
CN114621984A (zh) * 2020-12-14 2022-06-14 中国科学院过程工程研究所 一种离子液体强化赖氨酸脱羧酶合成1,5-戊二胺的方法
CN115125229A (zh) * 2021-03-25 2022-09-30 中国科学院过程工程研究所 一种用于合成戊二胺的赖氨酸脱羧酶突变体
CN115125229B (zh) * 2021-03-25 2023-11-14 中国科学院过程工程研究所 一种用于合成戊二胺的赖氨酸脱羧酶突变体

Also Published As

Publication number Publication date
US20210155962A1 (en) 2021-05-27
CN110546255B (zh) 2023-07-04
EP3625339A1 (en) 2020-03-25
EP3625339A4 (en) 2021-01-20
US11512302B2 (en) 2022-11-29
WO2018209563A1 (en) 2018-11-22

Similar Documents

Publication Publication Date Title
CN110546255B (zh) 对赖氨酸脱羧酶酶类的修饰
US20230295602A1 (en) Method of improving acid decarboxylase activity in vitro under alkaline ph
CN108368477B (zh) 修饰的膜渗透性
CN110291101B (zh) 修饰的赖氨酸脱羧酶
CN110997899B (zh) 嗜热赖氨酸脱羧酶的异源表达及其用途
CN111315866B (zh) 碳水化合物结合模块的异源表达及其用于尸胺生产的用途
CN109790557B (zh) 控制生物膜分散以产生氨基酸或氨基酸衍生产物
CN111406104B (zh) 减少为了生产氨基酸或氨基酸衍生产物的亚胺/烯胺的积累
CN110291192B (zh) 在可滴定氨基酸具有修饰的赖氨酸脱羧酶
CN111770993A (zh) 调节csr系统以生产赖氨酸和赖氨酸衍生产物
KR20210068923A (ko) 신규 이소부탄올 내성 유전자 및 그의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant