附图简述
图1:表中示出在下面的实施例章节中描述的用于产生构建体的引物。
图2:表中示出本文描述的菌株、质粒、酶、基因、启动子和核糖体结合位点(RBS)脱氧核糖核酸(DNA)序列。
图3:分批发酵结果。将菌株LN20(白色)和CIB60(黑色)使用分批发酵进行生长,并检测培养物将赖氨酸-HCl转化为尸胺的能力。在每个时间点取样以测量OD600(方框)、葡萄糖(圆形)及活性(三角形)。
图4:补料分批发酵结果。将菌株LN24以补料分批发酵进行生长,并检测培养物将赖氨酸-HCl转化为尸胺的能力。在每个时间点取样以测量OD600(白色方框)及活性(黑色菱形)。
图5:分批发酵结果。将LN24(黑色)和LN3014(白色)使用分批发酵进行生长,并检测培养物将赖氨酸-HCl转化为尸胺的能力。在每个时间点取样以测量OD600(方框)、葡萄糖(圆形)及活性(三角形)。
图6:补料分批发酵结果。将菌株LN3014以补料分批发酵进行生长,并检测培养物将赖氨酸-HCl转化为尸胺的能力。在每个时间点取样以测量OD600(白色方框)及活性(白色三角形)。
发明详述
如下描述提供了彻底理解及能够实施本发明实施方案的具体详细描述。然而,本领域技术人员理解不借助于这些详细描述也可以实施本发明。在其它情况中,未详细示出或描述熟知的结构和功能以避免不必要的模糊关于本发明实施方案的描述。
产酸克雷伯氏菌(K.oxytoca)是一种革兰氏阴性棒状细菌。产酸克雷伯氏菌E718基因组序列含有产酸克雷伯氏菌赖氨酸脱羧酶基因ldc,其编码赖氨酸脱羧酶多肽产酸克雷伯氏菌Ldc。如本文所用,产酸克雷伯氏菌ldc的核苷酸序列被称作“产酸克雷伯氏菌ldc”、“ldc”、“产酸克雷伯氏菌ldc多核苷酸”或者“产酸克雷伯氏菌ldc核苷酸序列”,其具有SEQ ID NO:1的核苷酸序列。如本文所用,产酸克雷伯氏菌Ldc多肽被称作“产酸克雷伯氏菌Ldc”、“Ldc”、“产酸克雷伯氏菌Ldc多肽”或者“产酸克雷伯氏菌Ldc蛋白质”,其具有SEQID NO:2的氨基酸序列。
本发明的一方面涉及赖氨酸脱羧酶多肽,其包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段,其中所述突变体或片段与SEQ ID NO:2具有至少95%序列相同性。
在某些实施方案中,SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)或其片段因此与SEQ ID NO:2可具有至少大约90%、至少大约91%、至少大约92%、至少大约93%、至少大约94%、至少大约95%、至少大约96%、至少大约97%、至少大约98%、至少大约99%、大约90%~99.999%、大约91%~99.999%、大约92%~99.999%、大约93%~99.999%、大约94%~99.999%、大约95%~99.999%、大约96%~99.999%、大约97%~99.999%、大约98%~99.999%或者大约99%~99.999%的序列相同性。
如本文所用,术语“大约”是指在指定数值或数值范围的5%或10%内。
在某些实施方案中,SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)可包含含有一个或多个突变的SEQ ID NO:2的氨基酸序列、由包含一个或多个突变的SEQ IDNO:2的氨基酸序列组成或者基本上由包含一个或多个突变的SEQ ID NO:2的氨基酸序列组成。SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)可包含在SEQ ID NO:2内的一个或多个氨基酸的一个或多个缺失、取代、添加和/或插入,其中SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)提供了与产酸克雷伯氏菌Ldc基本相同的赖氨酸脱羧酶活性(即产酸克雷伯氏菌Ldc的突变体与产酸克雷伯氏菌Ldc相比具有大约80%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比大约90%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比大约95%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比大约97%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc对比大约99%或更高的赖氨酸脱羧酶活性;或者与产酸克雷伯氏菌Ldc对比大约100%或更高的赖氨酸脱羧酶活性)。
优选的SEQ ID NO:2突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于:SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S),SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G),SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)和SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。另外的SEQ ID NO:2突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于包含如下的氨基酸序列、由如下的氨基酸序列组成或者基本上由如下的氨基酸序列组成:包含选自如下的一个或多个突变的SEQ IDNO:2:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌Ldc K287X1);SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌Ldc T398X2);SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3);SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4);及SEQ ID NO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸,以及X5不是苯丙氨酸。如本文所用,同源多肽与指定的多肽序列可具有至少大约90%、至少大约91%、至少大约92%、至少大约93%、至少大约94%、至少大约95%、至少大约96%、至少大约97%、至少大约98%、至少大约99%、大约90%~99.999%、大约91%~99.999%、大约92%~99.999%、大约93%~99.999%、大约94%~99.999%、大约95%~99.999%、大约96%~99.999%、大约97%~99.999%、大约98%~99.999%或者大约99%~99.999%的序列同源性。
在某些实施方案中,如本文所用,多肽的片段提供了与该片段从中衍生的完整未突变多肽基本相同的功能。在这些实施方案中,产酸克雷伯氏菌Ldc的片段或者产酸克雷伯氏菌Ldc的突变体具有与产酸克雷伯氏菌Ldc或者其从中衍生的产酸克雷伯氏菌的突变体基本相同的功能(例如赖氨酸脱羧酶活性)。
本发明的另一方面涉及DNA多核苷酸,其包含本文描述的一个或多个赖氨酸脱羧酶核苷酸序列、由本文描述的一个或多个赖氨酸脱羧酶核苷酸序列组成或者基本上由本文描述的一个或多个赖氨酸脱羧酶核苷酸序列组成。在某些实施方案中,DNA多核苷酸可包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列:SEQ ID NO:1(即产酸克雷伯氏菌ldc)及其片段,及SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ ID NO:3具有至少95%序列相同性,并且其中所述多核苷酸编码一种或多种赖氨酸脱羧酶多肽,其包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段。
在某些实施方案中,所述赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc和产酸克雷伯氏菌Ldc的突变体与前文描述的相同。当存在多个多肽时,每个多肽可以是相同或不同的,所述一种或多种多肽可以单独表达或者作为融合蛋白表达。
优选的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S),SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G),SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)及SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。另外的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于包含如下的氨基酸序列、由如下的氨基酸组成或者基本上由如下的氨基酸序列组成的突变体:包含选自如下的一个或多个突变的SEQ ID NO:2:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌LdcK287X1);SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌Ldc T398X2);SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3);SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4);及SEQID NO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸,以及X5不是苯丙氨酸。
在某些实施方案中,所述DNA多核苷酸序列可包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,及SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段)。SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)在包含SEQID NO:1或SEQ ID NO:3的核苷酸序列中可包括一个或多个核苷酸的一个或多个缺失、取代、添加和/或插入,而由所述核苷酸序列编码的赖氨酸脱羧酶多肽提供了与产酸克雷伯氏菌Ldc基本相同的功能(即由产酸克雷伯氏菌ldc的突变体编码的赖氨酸脱羧酶多肽与产酸克雷伯氏菌Ldc相比具有大约80%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比具有大约90%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc对比具有大约95%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比具有大约97%或更高的赖氨酸脱羧酶活性;与产酸克雷伯氏菌Ldc相比具有大约99%或更高的赖氨酸脱羧酶活性;或者与产酸克雷伯氏菌Ldc相比具有大约100%或更高的赖氨酸脱羧酶活性)。
在某些实施方案中,SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)或其片段与SEQ ID NO:1或SEQ ID NO:3可具有至少大约90%、至少大约91%、至少大约92%、至少大约93%、至少大约94%、至少大约95%、至少大约96%、至少大约97%、至少大约98%、至少大约99%、大约90%~99.999%、大约91%~99.999%、大约92%~99.999%、大约93%~99.999%、大约94%~99.999%、大约95%~99.999%、大约96%~99.999%、大约97%~99.999%、大约98%~99.999%或者大约99%~99.999%的序列相同性。
SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于SEQ ID NO:1(即产酸克雷伯氏菌ldc)的核苷酸序列,其已经经密码子优化以在大肠杆菌中表达(即产酸克雷伯氏菌ldc-co1,SEQ ID NO:3)且其编码SEQ ID NO:2(即产酸克雷伯氏菌Ldc)的氨基酸序列。其它的SEQID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于这样的赖氨酸脱羧酶核苷酸序列,其编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列。编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的优选的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子包括但不限于SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1A859G),SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1C1193G),SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1C1306G),SEQ IDNO:10(即产酸克雷伯氏菌ldc-co1C1521G)和SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1T1820A)。
编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的另外的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于:包含含有选自如下的一个或多个突变的SEQ IDNO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或基本上由包含选自如下的一个或多个突变的SEQID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,在核苷酸位置1820处突变为Z5的突变,和/或这些突变的任意组合;包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为G(鸟嘌呤)的突变,在核苷酸位置1193处突变为G的突变,在核苷酸位置1306处突变为G的突变,在核苷酸位置1521处突变为G或A(腺嘌呤)的突变,在核苷酸位置1820处突变为A的突变,和/或这些突变的任意组合;产酸克雷伯氏菌ldc A859G或产酸克雷伯氏菌ldc-co1A859G的同源核苷酸序列(例如产酸克雷伯氏菌ldc A859Z1或产酸克雷伯氏菌ldc-co1A859Z1);产酸克雷伯氏菌ldc C1193G或产酸克雷伯氏菌ldc-co1C1193G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1193Z2或产酸克雷伯氏菌ldc-co1C1193Z2);产酸克雷伯氏菌ldc C1306G或产酸克雷伯氏菌ldc-co1C1306G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1306Z3或产酸克雷伯氏菌ldc-co1C1306Z3);产酸克雷伯氏菌ldc C1521G或产酸克雷伯氏菌ldc-co1C1521G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1521Z4或产酸克雷伯氏菌ldc-co1C1521Z4);及产酸克雷伯氏菌ldc T1820A或产酸克雷伯氏菌ldc-co1T1820A的同源核苷酸序列(例如产酸克雷伯氏菌ldc T1820Z5或产酸克雷伯氏菌ldc-co1T1820Z5)。Z1、Z2、Z3、Z4和Z5各自独立地选自A、G、C(胞嘧啶)和T(胸腺嘧啶),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,以及Z5不是T。如本文所用,同源核苷酸序列与指定的核苷酸序列可具有至少大约90%、至少大约91%、至少大约92%、至少大约93%、至少大约94%、至少大约95%、至少大约96%、至少大约97%、至少大约98%、至少大约99%、大约90%~99.999%、大约91%~99.999%、大约92%~99.999%、大约93%~99.999%、大约94%~99.999%、大约95%~99.999%、大约96%~99.999%、大约97%~99.999%、大约98%~99.999%或大约99%~99.999%的同源性。
在某些实施方案中,所述DNA多核苷酸可以是重组或非天然存在的多核苷酸。在某些实施方案中,所述DNA多核苷酸可以是cDNA。在某些实施方案中,所述DNA多核苷酸可以通过密码子优化获得以用于在特定微生物(例如大肠杆菌、蜂房哈夫尼菌(H.alvei)或产酸克雷伯氏菌)中的最佳多肽表达。
如本文所用,核苷酸序列、多肽和DNA分子不限于功能区,可包括表达抑制区、编码区、前导序列、外显子、内含子和表达盒中的至少一个(见例如Papadakis et al.,"Promoters and Control Elements:Designing ExpressionCassettes for GeneTherapy,"Current Gene Therapy(2004),4,89-113)。而且,核苷酸序列或多核苷酸可包括双链DNA或者单链DNA(即组成双链DNA的有义链和反义链),或者核糖核酸(RNA)。含有核苷酸序列的多核苷酸可包括该核苷酸序列的片段和/或突变体。核苷酸序列的片段是指核苷酸序列的一部分,其编码提供与完整多核苷酸编码的多肽基本相同功能的多肽。核苷酸序列的突变体的例子包括天然存在的等位基因突变体,人工突变体,及通过在所述核苷酸序列中缺失、取代、添加和/或插入一个或多个核苷酸获得的核苷酸序列。应理解这种核苷酸序列的片段和/或突变体编码与原始核苷酸序列编码的多肽具有基本相同功能的多肽。例如,产酸克雷伯氏菌ldc的片段和/或突变体编码与产酸克雷伯氏菌Ldc具有基本相同功能(即赖氨酸脱羧酶活性)的多肽。
密码子优化是可用于通过增加感兴趣基因的翻译效率使生物体中蛋白质表达最大化的一种技术。不同的生物体由于突变倾向和天然选择而通常示出对于编码相同氨基酸的一些密码子之一的特殊偏好性。例如,在快速生长的微生物如大肠杆菌中,优化密码子反映出其各自的基因组tRNA库的组成。因此,在快速生长的微生物中,氨基酸的低频率密码子可以用用于相同氨基酸的但高频率的密码子置换。因此,优化的DNA序列的表达在快速生长的微生物中得以改良。见例如http://www.guptalab.org/shubhg/pdf/shubhra_codon.pdf关于密码子优化技术的综述,将其全部内容并入本文作参考。如本文所提供,多核苷酸序列可以是经密码子优化的,以用于在特定微生物中的最佳多肽表达,所述微生物包括但不限于大肠杆菌、蜂房哈夫尼菌和产酸克雷伯氏菌。
在某些实施方案中,核苷酸序列的突变体可得自核苷酸序列的密码子优化,以降低其G和C核苷酸含量用于改良的蛋白质表达。如果大约50%或以上的碱基是G或C,则认为该基因组是GC富集的。感兴趣的核苷酸序列中的高GC含量可导致mRNA中形成二级结构,这可导致中断的翻译及较低水平的表达。因此,将编码序列中的G和C残基改变为A和T残基而不改变氨基酸可提供更高水平的表达。
在某些实施方案中,本文描述的DNA多核苷酸可进一步包含一个或多个核糖体结合位点(RBS)DNA核苷酸序列。如本文所用,RBS DNA核苷酸序列可称作“RBS DNA”、“RBS DNA序列”、“RBS DNA核苷酸序列”或者“RBS DNA多核苷酸序列”。RBS是在信使RNA(mRNA)中发现的一个RNA序列,核糖体可与其结合并起始翻译。在原核生物中,RBS被称作Shine-Dalgarno序列,位于待翻译的RNA序列起始密码子的上游。RBS序列中的突变在原核生物中可减少或增加翻译。本发明提供的RBS DNA核苷酸序列具有与RBS序列相同的碱基序列,除了在RBS序列的RNA序列中的尿嘧啶(U)由胸腺嘧啶(T)置换。例如,如果RBS序列是“GGAGAU”,则相应的RBS DNA核苷酸序列是“GGAGAT”。如在下文实施例中示出,产酸克雷伯氏菌Ldc及其突变体从不同RBS序列的表达导致不同水平的尸胺生产活性(见实施例7)。如下文实施例7提供,质粒pUC18-KOldc-co1-Pbad含有位于产酸克雷伯氏菌ldc-co1序列上游的RBS DNA核苷酸序列“GGAGAT”(RBS DNA-1,SEQ ID NO:14)。制备RBS DNA文库用于筛选导致尸胺生产增加的用于产酸克雷伯氏菌Ldc蛋白表达的最佳RBS序列。与含有RBS DNA核苷酸序列RBS DNA-1(SEQ ID NO:14)的质粒相比,具有突变的RBS DNA核苷酸序列的至少5个质粒当转化进大肠杆菌K12中时产生更高水平的尸胺。含有RBS DNA核苷酸序列“TGGAGG”(RBS DNA-5,SEQ IDNO:18)的质粒(pLN637)产生最高的尸胺产量(见实施例7)。
如本文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBSDNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBS DNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5)和SEQ IDNO:19(即RBS DNA-6)。在某些优选的实施方案中,所述一个或多个RBSDNA核苷酸序列可包含SEQ ID NO:18(即RBS DNA-5)、由SEQ ID NO:18(即RBS DNA-5)组成或者基本上由SEQ ID NO:18(即RBS DNA-5)组成。在某些实施方案中,所述RBS DNA核苷酸序列可位于SEQ ID NO:1的赖氨酸脱羧酶核苷酸序列(即产酸克雷伯氏菌ldc)及其片段以及SEQID NO:1(即产酸克雷伯氏菌ldc)的突变体及其片段的上游。
如本文所提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个启动子核苷酸序列:SEQ ID NO:20(即Plac启动子序列),SEQ ID NO:21(即Pbad启动子序列)及SEQ ID NO:22(即Ptac启动子序列)。启动子是起始DNA转录的DNA区域。启动子位于被转录的DNA的上游。在某些优选实施方案中,所述一个或多个启动子核苷酸序列可包含SEQ ID NO:21(即Pbad启动子序列)、由SEQ ID NO:21(即Pbad启动子序列)组成或者基本上由SEQ ID NO:21(即Pbad启动子序列)组成。在某些实施方案中,所述启动子核苷酸序列可位于SEQ ID NO:1的赖氨酸脱羧酶核苷酸序列(即产酸克雷伯氏菌ldc)或其片段及SEQ ID NO:1(即产酸克雷伯氏菌ldc)的突变体或其片段的上游。当DNA多核苷酸包含一个或多个RBS DNA核苷酸序列及一个或多个启动子核苷酸序列时,所述一个或多个启动子核苷酸序列可位于赖氨酸脱羧酶核苷酸序列和RBS DNA核苷酸序列的上游。
本发明的另一方面涉及表达质粒载体,其包含如下多核苷酸、由如下多核苷酸组成或者基本上由如下多核苷酸组成:
包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列、由选自如下的一个或多个赖氨酸脱羧酶核苷酸序列组成或基本上由选自如下的一个或多个赖氨酸脱羧酶核苷酸序列组成的DNA多核苷酸:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,及SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ IDNO:1或SEQ ID NO:3具有至少95%序列相同性,及其中所述多核苷酸编码一种或多种赖氨酸脱羧酶多肽,该多肽包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸序列组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段;及
能在宿主细胞中自主复制的骨架质粒,
其中所述表达质粒载体用于生产赖氨酸衍生产物。
所述DNA多核苷酸、赖氨酸脱羧酶核苷酸序列、产酸克雷伯氏菌ldc及其突变体和片段、赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc及其突变体和片段与前文描述的相同。当存在多个多肽时,每个多肽可以相同或不同,所述一个或多个多肽可以单独表达或者作为融合蛋白表达。
SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于SEQ ID NO:1(即产酸克雷伯氏菌ldc)的核苷酸序列,其已经经密码子优化以在大肠杆菌中表达(即产酸克雷伯氏菌ldc-co1,SEQ ID NO:3),且其编码SEQ ID NO:2(即产酸克雷伯氏菌Ldc)的氨基酸序列。其它的SEQID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于赖氨酸脱羧酶核苷酸序列,其编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列。编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的优选的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子包括但不限于SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1A859G),SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1C1193G),SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1C1306G),SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1C1521G)和SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1T1820A)。
编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的另外的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,在核苷酸位置1820处突变为Z5的突变,和/或其任意组合;包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为G(鸟嘌呤)的突变,在核苷酸位置1193处突变为G的突变,在核苷酸位置1306处突变为G的突变,在核苷酸位置1521处突变为G或A(腺嘌呤)的突变,在核苷酸位置1820处突变为A的突变,和/或其任意组合;产酸克雷伯氏菌ldc A859G或产酸克雷伯氏菌ldc-co1A859G的同源核苷酸序列(例如产酸克雷伯氏菌ldcA859Z1或产酸克雷伯氏菌ldc-co1A859Z1);产酸克雷伯氏菌ldc C1193G或产酸克雷伯氏菌ldc-co1C1193G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1193Z2或产酸克雷伯氏菌ldc-co1C1193Z2);产酸克雷伯氏菌ldcC1306G或产酸克雷伯氏菌ldc-co1C1306G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1306Z3或产酸克雷伯氏菌ldc-co1C1306Z3);产酸克雷伯氏菌ldc C1521G或产酸克雷伯氏菌ldc-co1C1521G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1521Z4或产酸克雷伯氏菌ldc-co1C1521Z4);及产酸克雷伯氏菌ldc T1820A或产酸克雷伯氏菌ldc-co1T1820A的同源核苷酸序列(例如产酸克雷伯氏菌ldc T1820Z5或产酸克雷伯氏菌ldc-co1T1820Z5)。Z1、Z2、Z3、Z4和Z5各自独立地选自A、G、C(胞嘧啶)及T(胸腺嘧啶),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,以及Z5不是T。
优选的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E)、SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S)、SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G)、SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)和SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。另外的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于包含含有选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列、由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成或基本上由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成的突变体:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌Ldc K287X1);SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌LdcT398X2);SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3);SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4);及SEQ IDNO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸及X5不是苯丙氨酸。
如本文所用,术语“宿主细胞”是指微生物细胞,其可以是可以用表达质粒载体转化的任何细胞(例如埃希氏菌属(例如大肠杆菌),克雷伯氏菌属(例如产酸克雷伯氏菌),假单胞菌属(例如铜绿假单胞菌(P.aeruginosa)),棒杆菌属(例如谷氨酸棒杆菌(Corynebacterium glutamicum)),芽孢杆菌(Bacilli),哈夫尼菌属(例如蜂房哈夫尼菌(Hafnia alvei)),短杆菌属(Brevibacterium),乳杆菌属(Lactobacillus)(例如戊糖乳杆菌(Lactobacilluspentosus),植物乳杆菌(Lactobacillus plantarum),Lactobacillussaerimneri),乳球菌属(Lactococcus)(例如乳酸乳球菌(Lactococcus lactis),乳酸乳球菌乳脂亚种(Lactococcus lactis ssp.Cremoris),乳酸乳球菌乳亚种(Lactococcuslactis ssp.lactis))以及链球菌属(Streptococcus)(例如嗜热链球菌(Streptococcusthermophilus)))。
大肠杆菌细胞可以是衍生自大肠杆菌K12(例如MG1655、W3110、DH10b、DH1、BW2952及衍生自其的菌株)或大肠杆菌B的任何大肠杆菌菌株,或者衍生自其的菌株。
如本文所用,赖氨酸衍生产物可以是尸胺。例如,本文描述的表达质粒载体可用于生产尸胺。
在某些实施方案中,所述宿主细胞可含有一个或多个内源质粒。在某些实施方案中,所述宿主细胞不含内源质粒。如本文所用,术语“治愈”是指从宿主细胞中去除一个或多个内源质粒。在某些实施方案中,可以通过从宿主细胞去除所有内源质粒来“治愈”宿主细胞的所有内源质粒。在某些实施方案中,可以通过仅去除从细胞靶向去除的一个或多个内源质粒来“治愈”宿主细胞的一个或多个内源质粒。
在某些实施方案中,所述宿主细胞可以是原核细胞(例如是蜂房哈夫尼菌),其含有编码特异性毒素/抗毒素基因对的内源质粒。这种毒素/抗毒素基因对在维持遗传信息及应激反应中起作用(见Wertz et al.“Chimeric nature of two plasmids of Hafniaalvei encoding the bacteriocins alveicins A and B.”Journal of Bacteriology,(2004)186:1598-1605)。只要细胞具有一个或多个包含抗毒素基因的质粒,则该毒素被所述一个或多个质粒持续表达的抗毒素中和以保持细胞存活。在某些原核生物中,所述抗毒素蛋白比毒素蛋白更快降解。如果包含抗毒素基因的质粒从细胞中丢失,则细胞中毒素蛋白将比抗毒素蛋白存在更长时间并杀死细胞或者抑制细胞生长。因此,优选保留包含抗毒素或者毒素/抗毒素基因的质粒以保持宿主细胞存活。
如本文所用,毒素/抗毒素基因对具有两个基因,一个是毒素基因,其表达对于宿主细胞具有毒性的多肽,另一个是抗毒素基因,其中和宿主细胞中的毒性多肽。所述毒素/抗毒素基因对的例子包括但不限于abt/abi基因对和aat/aai基因对、其片段及其突变体。在一些实施方案中,所述毒素多核苷酸序列包含SEQ ID NO:23或SEQ ID NO:25的核苷酸序列、其片段或突变体,由SEQ ID NO:23或SEQ ID NO:25的核苷酸序列、其片段或突变体组成,或者基本上由SEQ ID NO:23或SEQ ID NO:25的核苷酸序列、其片段或突变体组成。在一些实施方案中,所述抗毒素多核苷酸序列包含SEQ ID NO:24或SEQ ID NO:26的核苷酸序列、其片段或突变体,由SEQ ID NO:24或SEQ ID NO:26的核苷酸序列、其片段或突变体组成,或者基本上由SEQ ID NO:24或SEQ ID NO:26的核苷酸序列、其片段或突变体组成。
在某些实施方案中,所述宿主细胞可以是任何蜂房哈夫尼菌菌株,例如没有内源质粒的蜂房哈夫尼菌菌株或者含有内源质粒的蜂房哈夫尼菌菌株。例如,所述宿主细胞可以是含有一个或多个pAlvA质粒的蜂房哈夫尼菌菌株,或者其经治愈的菌株(pAlvA-菌株),或者含有一个或多个pAlvB质粒的蜂房哈夫尼菌菌株及其经治愈的菌株(pAlvB-菌株)。
在某些实施方案中,本发明揭示的表达质粒载体(例如表达质粒载体)可进一步包含选自abi基因,aai基因及其突变体及片段的一个或多个抗毒素基因,和/或选自abt/abi基因对和aat/aai基因对及其突变体和片段的一个或多个毒素/抗毒素基因对。例如,在某些实施方案中,表达质粒载体(例如所述表达质粒载体)可进一步包含抵消对宿主细胞有害的毒素多肽的抗毒素多核苷酸以及编码所述毒素多肽的毒素多核苷酸序列。
在某些实施方案中,所述宿主细胞可以是适用于工业规模或大规模生产的工业菌株。例如,工业菌株可以在发酵罐中培养。培养规模可以从数百升至数百万升。另一方面,实验室菌株通常在数升或更少中培养。在某些实施方案中,工业菌株可以比实验室菌株在更简单或更经济的培养基中生长。
能在宿主细胞中自主复制的骨架质粒可以是在宿主细胞中可以复制的任何质粒。在一个实施方案中,表达质粒载体包含在大肠杆菌中可以复制的骨架质粒。在另一个实施方案中,表达质粒载体包含在蜂房哈夫尼菌中可以复制的骨架质粒。骨架质粒的例子包括但不限于在大肠杆菌中可以复制的骨架质粒,例如pUC(例如pUC18和pUC19质粒),pBR322,pSC101,pET,p15a和pACYC质粒,及从其衍生的质粒。
在某些实施方案中,所述表达质粒载体可用于生产如本文描述的赖氨酸衍生产物。在某些实施方案中,赖氨酸衍生产物可是如本文描述的尸胺。
如上文所提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBS DNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBSDNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5)和SEQ ID NO:19(即RBS DNA-6)。在某些优选的实施方案中,所述一个或多个RBSDNA核苷酸序列可包含SEQ ID NO:18(即RBS DNA-5)、由SEQID NO:18(即RBS DNA-5)组成或者基本上由SEQ ID NO:18(即RBSDNA-5)组成。
如本文所提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自SEQ ID NO:20(即Plac启动子序列)、SEQ ID NO:21(即Pbad启动子序列)和SEQ ID NO:22(即Ptac启动子序列)的一个或多个启动子核苷酸序列。在某些优选的实施方案中,所述一个或多个启动子核苷酸序列可包含SEQ ID NO:21(即Pbad启动子序列)、由SEQ ID NO:21(即Pbad启动子序列)组成或者基本上由SEQ ID NO:21(即Pbad启动子序列)组成。
本发明的另一方面涉及转化体,其包含在宿主细胞中的一个或多个表达质粒载体、由在宿主细胞中的一个或多个表达质粒载体组成或者基本上由在宿主细胞中的一个或多个表达质粒载体组成,所述表达质粒载体包含如下多核苷酸、由如下多核苷酸组成或者基本上由如下多核苷酸组成:
包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列、由选自如下的一个或多个赖氨酸脱羧酶核苷酸序列组成或者基本上由选自如下的一个或多个赖氨酸脱羧酶核苷酸序列组成的DNA多核苷酸:SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ ID NO:3具有至少95%序列相同性,及其中所述多核苷酸编码一种或多种赖氨酸脱羧酶多肽,所述赖氨酸脱羧酶多肽包含选自如下的氨基酸序列、由选自如下的氨基酸序列组成或者基本上由选自如下的氨基酸组成:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段;及
能载宿主细胞中自主复制的骨架质粒,
其中所述表达质粒载体用于生产赖氨酸衍生产物。
所述表达质粒载体、宿主细胞、骨架质粒、DNA多核苷酸、赖氨酸脱羧酶核苷酸序列、产酸克雷伯氏菌ldc及其突变体和片段、赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc及其突变体和片段与前文的描述相同。
SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于SEQ ID NO:1(即产酸克雷伯氏菌ldc)的核苷酸序列,其已经经密码子优化以在大肠杆菌中表达(即产酸克雷伯氏菌ldc-co1,SEQ ID NO:3)且其编码SEQ ID NO:2(即产酸克雷伯氏菌Ldc)的氨基酸序列。其它的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的赖氨酸脱羧酶核苷酸序列。编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的优选的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子包括但不限于SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1 A859G)、SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1 C1193G)、SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1C1306G)、SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1C1521G)和SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1T1820A)。
另外的编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于:包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,在核苷酸位置1820处突变为Z5的突变,和/或其任意组合;包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为G(鸟嘌呤)的突变,在核苷酸位置1193处突变为G的突变,在核苷酸位置1306处突变为G的突变,在核苷酸位置1521处突变为G或A(腺嘌呤)的突变,在核苷酸位置1820处突变为A的突变,和/或其任意组合;产酸克雷伯氏菌ldc A859G或产酸克雷伯氏菌ldc-co1 A859G的同源核苷酸序列(例如产酸克雷伯氏菌ldc A859Z1或产酸克雷伯氏菌ldc-co1A859Z1);产酸克雷伯氏菌ldc C1193G或产酸克雷伯氏菌ldc-co1 C1193G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1193Z2或产酸克雷伯氏菌ldc-co1 C1193Z2);产酸克雷伯氏菌ldc C1306G或产酸克雷伯氏菌ldc-co1 C1306G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1306Z3或产酸克雷伯氏菌ldc-co1 C1306Z3);产酸克雷伯氏菌ldc C1521G或产酸克雷伯氏菌ldc-co1 C1521G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1521Z4或产酸克雷伯氏菌ldc-co1 C1521Z4);及产酸克雷伯氏菌ldc T1820A或产酸克雷伯氏菌ldc-co1 T1820A的同源核苷酸序列(例如产酸克雷伯氏菌ldc T1820Z5或产酸克雷伯氏菌ldc-co1 T1820Z5)。Z1、Z2、Z3、Z4和Z5各自独立地选自A、G、C(胞嘧啶)和T(胸腺嘧啶),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,及Z5不是T。
优选的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E),SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S),SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G),SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)和SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。另外的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于:包含含有选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列、由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成的突变体:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌Ldc K287X1),SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌LdcT398X2),SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3),SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4),及SEQ IDNO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸,及X5不是苯丙氨酸。
如上文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBS DNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBS DNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5),和SEQ ID NO:19(即RBS DNA-6)。在某些优选的实施方案中,所述一个或多个RBSDNA核苷酸序列可包含SEQ ID NO:18(即RBS DNA-5)、由SEQ ID NO:18(即RBS DNA-5)组成或者基本上由SEQ ID NO:18(即RBS DNA-5)组成。
如上文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个启动子核苷酸序列:SEQ ID NO:20(即Plac启动子序列),SEQ ID NO:21(即Pbad启动子序列)和SEQ ID NO:22(即Ptac启动子序列)。在某些优选的实施方案中,所述一个或多个启动子核苷酸序列可包含SEQ ID NO:21(即Pbad启动子序列)、由SEQ ID NO:21(即Pbad启动子序列)组成或者基本上由SEQ ID NO:21(即Pbad启动子序列)组成。
如本文所用,转化体可以是通过在宿主细胞中导入一个或多个表达质粒载体而改变的宿主细胞。在某些实施方案中,所述转化体可以通过转化向对质粒载体呈现出感受态的宿主细胞中导入所述表达质粒载体而获得。
在某些实施方案中,所述转化体可用于生产如本文描述的赖氨酸衍生产物。在某些实施方案中,赖氨酸衍生产物可以是如本文描述的尸胺。
本发明的另一方面涉及突变宿主细胞,其包含如下多核苷酸、由如下多核苷酸组成或者基本上由如下多核苷酸组成:
包含选自如下的一个或多个赖氨酸脱羧酶核苷酸序列的DNA多核苷酸:SEQ IDNO:1的突变体(即产酸克雷伯氏菌ldc的突变体)及其片段,及SEQ ID NO:1的片段(即产酸克雷伯氏菌ldc的片段),其中所述赖氨酸脱羧酶核苷酸序列与SEQ ID NO:1或SEQ ID NO:3具有至少95%序列相同性,及其中所述多核苷酸编码包含选自如下的氨基酸序列的一种或多种赖氨酸脱羧酶多肽:SEQ ID NO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段。
所述宿主细胞、DNA多核苷酸、赖氨酸脱羧酶核苷酸序列、产酸克雷伯氏菌ldc及其片段和突变体、赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc及其片段和突变体与前文描述的相同。
SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于SEQ ID NO:1(即产酸克雷伯氏菌ldc)的核苷酸序列,其已经经密码子优化以在大肠杆菌中表达(即产酸克雷伯氏菌ldc-co1,SEQ ID NO:3)且其编码SEQ ID NO:2(即产酸克雷伯氏菌Ldc)的氨基酸序列。其它的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的赖氨酸脱羧酶核苷酸序列。编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的优选的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子包括但不限于SEQ ID NO:4(即产酸克雷伯氏菌ldc-co1 A859G)、SEQ ID NO:6(即产酸克雷伯氏菌ldc-co1 C1193G)、SEQ ID NO:8(即产酸克雷伯氏菌ldc-co1 C1306G)、SEQ ID NO:10(即产酸克雷伯氏菌ldc-co1 C1521G)和SEQ ID NO:12(即产酸克雷伯氏菌ldc-co1T1820A)。
其它的编码SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的氨基酸序列的SEQ ID NO:1的突变体(即产酸克雷伯氏菌ldc的突变体)的例子可包括但不限于:包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为Z1的突变,在核苷酸位置1193处突变为Z2的突变,在核苷酸位置1306处突变为Z3的突变,在核苷酸位置1521处突变为Z4的突变,在核苷酸位置1820处突变为Z5的突变,和/或其任意组合;包含含有选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3、由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:1或SEQ ID NO:3组成的赖氨酸脱羧酶核苷酸序列:在核苷酸位置859处突变为G(鸟嘌呤)的突变,在核苷酸位置1193处突变为G的突变,在核苷酸位置1306处突变为G的突变,在核苷酸位置1521处突变为G或A(腺嘌呤)的突变,在核苷酸位置1820处突变为A的突变,和/或其任意组合;产酸克雷伯氏菌ldc A859G或产酸克雷伯氏菌ldc-co1 A859G的同源核苷酸序列(例如产酸克雷伯氏菌ldc A859Z1或产酸克雷伯氏菌ldc-co1A859Z1;产酸克雷伯氏菌ldc C1193G或产酸克雷伯氏菌ldc-co1 C1193G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1193Z2或产酸克雷伯氏菌ldc-co1 C1193Z2);产酸克雷伯氏菌ldcC1306G或产酸克雷伯氏菌ldc-co1 C1306G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1306Z3或产酸克雷伯氏菌ldc-co1 C1306Z3);产酸克雷伯氏菌ldc C1521G或产酸克雷伯氏菌ldc-co1 C1521G的同源核苷酸序列(例如产酸克雷伯氏菌ldc C1521Z4或产酸克雷伯氏菌ldc-co1 C1521Z4);及产酸克雷伯氏菌ldc T1820A或产酸克雷伯氏菌ldc-co1 T1820A的同源核苷酸序列(例如产酸克雷伯氏菌ldc T1820Z5或产酸克雷伯氏菌ldc-co1 T1820Z5)。Z1、Z2、Z3、Z4和Z5各自独立地选自A、G、C(胞嘧啶)和T(胸腺嘧啶),条件是Z1不是A,Z2不是C,Z3不是C,Z4不是C或T,及Z5不是T。
优选的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于SEQ ID NO:5(即产酸克雷伯氏菌Ldc K287E)、SEQ ID NO:7(即产酸克雷伯氏菌LdcT398S)、SEQ ID NO:9(即产酸克雷伯氏菌LdcR436G)、SEQ ID NO:11(即产酸克雷伯氏菌LdcF507L)及SEQ ID NO:13(即产酸克雷伯氏菌Ldc F607Y)。其它的SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)的例子包括但不限于包含含有选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列、由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成或者基本上由包含选自如下的一个或多个突变的SEQ ID NO:2的氨基酸序列组成的突变体:在氨基酸位置287处突变为X1的突变,在氨基酸位置398处突变为X2的突变,在氨基酸位置436处突变为X3的突变,在氨基酸位置507处突变为X4的突变,在氨基酸位置607处突变为X5的突变;SEQ ID NO:5的同源多肽(例如产酸克雷伯氏菌Ldc K287X1);SEQ ID NO:7的同源多肽(例如产酸克雷伯氏菌Ldc T398X2);SEQ ID NO:9的同源多肽(例如产酸克雷伯氏菌Ldc R436X3);SEQ ID NO:11的同源多肽(例如产酸克雷伯氏菌Ldc F507X4);SEQ IDNO:13的同源多肽(例如产酸克雷伯氏菌Ldc F607X5)。X1、X2、X3、X4和X5各自独立地选自丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸,条件是X1不是赖氨酸,X2不是苏氨酸,X3不是精氨酸,X4不是苯丙氨酸及X5不是苯丙氨酸。
如上文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个RBS DNA核苷酸序列:SEQ ID NO:14(即RBS DNA-1),SEQ ID NO:15(即RBSDNA-2),SEQ ID NO:16(即RBS DNA-3),SEQ ID NO:17(即RBS DNA-4),SEQ ID NO:18(即RBSDNA-5),和SEQ ID NO:19(即RBS DNA-6)。
如上文提供,在某些实施方案中,本文描述的DNA多核苷酸可进一步包含选自如下的一个或多个启动子核苷酸序列、由选自如下的一个或多个启动子核苷酸序列组成或者基本上由选自如下的一个或多个启动子核苷酸序列组成:SEQ ID NO:20(即Plac启动子序列),SEQ ID NO:21(即Pbad启动子序列),及SEQ ID NO:22(即Ptac启动子序列)。在某些优选的实施方案中,所述一个或多个启动子核苷酸序列可包含SEQ ID NO:21(即Pbad启动子序列)、由SEQ ID NO:21(即Pbad启动子序列)组成或者基本上由SEQ ID NO:21(即Pbad启动子序列)组成。
在某些实施方案中,所述突变宿主细胞可用于生产如本文描述的赖氨酸衍生产物。在某些实施方案中,赖氨酸衍生产物可是如本文描述的尸胺。
在某些实施方案中,根据PCR介导的基因置换方法可以将所述DNA多核苷酸整合进宿主细胞染色体中(见例如Datsenko,2000关于PCR介导的基因置换方法的综述,该文献以其全部内容并入本文作参考)。整合的染色体也可以通过其它合适方法产生。
本发明的另一方面涉及一种生产如本文描述的一种或多种赖氨酸脱羧酶多肽的方法,包括:
获得如本文描述的突变宿主细胞和/或转化体;
在使所述一种或多种赖氨酸脱羧酶多肽有效表达的条件下培养所述突变宿主细胞和/或转化体;及
收获所述一种或多种赖氨酸脱羧酶多肽。
所述赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc及其突变体和片段、突变宿主细胞和/或转化体与前文描述的相同。
在某些实施方案中,所述转化体和/或突变宿主细胞可以是如本文描述的任何那些转化体和/或突变宿主细胞。例如,用于生产一种或多种赖氨酸脱羧酶多肽的转化体可以通过将如本文描述的一种或多种表达质粒载体转化进宿主细胞中而获得。
所述转化体和/或突变宿主细胞可以使用含有碳源和非碳营养源的培养基培养。碳源的例子包括但不限于糖(例如碳水化合物如葡萄糖和果糖)、油和/或脂肪、脂肪酸,和/或其衍生物。油和脂肪可含有饱和和/或不饱和的脂肪酸,其具有10或更多个碳原子,例如椰子油、棕榈油、棕榈仁油等。脂肪酸可以是饱和和/或不饱和脂肪酸,例如己酸、辛酸、癸酸、月桂酸、油酸、棕榈酸、亚油酸、亚麻酸、肉豆蔻酸等。脂肪酸衍生物的例子包括但不限于其酯及盐。非碳源的例子包括但不限于氮源、无机盐,及其它有机营养源。
例如,培养基可含有能被转化体和/或突变宿主细胞同化的碳源,任选具有选自氮源、无机盐及其它有机营养源的一种或多种其它来源。在某些实施方案中,氮源的重量百分比是培养基的大约0.01%至大约0.1%。氮源的例子可包含氨、铵盐(例如氯化铵、硫酸铵和磷酸铵)、蛋白胨、肉膏、酵母提取物等。无机盐的例子包括但不限于磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠等。其它有机营养源的例子包括但不限于氨基酸(例如甘氨酸、丙氨酸、丝氨酸、苏氨酸和脯氨酸)、维生素(例如维生素B1、维生素B12和维生素C)等。
培养可以在只要细胞可以生长的任何温度进行,优选大约20℃至大约40℃,或者大约35℃。培养时间可以是大约1天、大约2天、大约3天、大约4天、大约5天、大约6天、大约7天、大约8天、大约9天或者大约10天。
在一个实施方案中,所述转化体和/或突变宿主细胞是在含有肽、蛋白胨、维生素(例如维生素B)、微量元素(例如氮、硫、镁)和矿物质的培养基中培养。这种培养基的例子包括但不限于通常已知的Lysogeny broth(LB)培养基,其包含悬浮于水(例如蒸馏水或去离子水)中的胰蛋白胨、酵母提取物和NaCl。
本发明的另一方面涉及一种生产尸胺(1,5-戊二胺)的方法,包括如下步骤、由如下步骤组成或者基本上由如下步骤组成:
1a)培养本文揭示的转化体和/或突变宿主细胞,
1b)使用得自步骤1a的培养物使赖氨酸脱羧而生产尸胺,及
1c)使用得自步骤1b的培养物提取及纯化尸胺。
在某些实施方案中,所述转化体和/或突变宿主细胞可以是本文描述的任何那些转化体和/或突变宿主细胞。
培养所述转化体和/或突变宿主细胞可包括前述培养所述转化体的步骤。
例如,所述转化体和/或突变宿主细胞可以使用含有碳源和非碳源营养源的培养基培养。碳源的例子包括但不限于糖(例如碳水化合物如葡萄糖和果糖)、油和/或脂肪,脂肪酸、和/或其衍生物。油和脂肪可含有饱和和/或不饱和脂肪酸,其具有10或更多个碳原子,例如椰子油、棕榈油、棕榈仁油等。所述脂肪酸可以是饱和和/或不饱和脂肪酸,例如己酸、辛酸、癸酸、月桂酸、油酸、棕榈酸、亚油酸、亚麻酸、肉豆蔻酸等。脂肪酸衍生物的例子包括但不限于其酯及其盐。非碳源的例子包括但不限于氮源、无机盐,及其它有机营养源。
例如,培养基可含有能被转化体和/或突变宿主细胞同化的碳源,任选具有选自氮源、无机盐及其它有机营养源的一种或多种其它来源。在某些实施方案中,氮源的重量百分比是培养基的大约0.01%至大约0.1%。氮源的例子可包含氨、铵盐(例如氯化铵、硫酸铵和磷酸铵)、蛋白胨、肉膏、酵母提取物等。无机盐的例子包括但不限于磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠等。其它有机营养源的例子包括但不限于氨基酸(例如甘氨酸、丙氨酸、丝氨酸、苏氨酸和脯氨酸)、维生素(例如维生素B1、维生素B12和维生素C)等。
培养可以在只要细胞可以生长的任何温度进行,优选大约20℃至大约40℃,或者大约35℃。培养时间可以是大约1天、大约2天、大约3天、大约4天、大约5天、大约6天、大约7天、大约8天、大约9天或者大约10天。
在一个实施方案中,所述转化体和/或突变宿主细胞是在含有肽、蛋白胨、维生素(例如维生素B)、微量元素(例如氮、硫、镁)和矿物质的培养基中培养。这种培养基的例子包括但不限于通常已知的Lysogeny broth(LB)培养基,其包含悬浮于水(例如蒸馏水或去离子水)中的胰蛋白胨、酵母提取物和NaCl。
如本文所用,“使用得自步骤1a的培养物”可包括进一步处理得自步骤1a的培养物。例如使用缓冲溶液稀释所述培养物,离心所述培养物以收集细胞,将细胞重悬浮于缓冲溶液中,或者将细胞裂解为细胞裂解物,和/或从细胞裂解物中纯化赖氨酸脱羧酶。
在另一个实施方案中,所述方法的步骤1c进一步包括如下步骤:
1d)分离得自步骤1b的反应的固体与液体成分;
1e)将得自步骤1d的液体成分的pH调节为大约14或更高;
1f)从得自步骤1e的液体成分中除去水;及
1g)回收尸胺。
在步骤1d中,步骤1b的反应的固体与液体成分的分离可以通过常规离心和/或过滤方法实现。
在步骤1e中,步骤1d的液体成分的pH值可以通过加入碱例如NaOH调节。NaOH可以作为固体和/或溶液(例如水溶液)加入。
在步骤1f中,水可以通过在环境压力或真空蒸馏而除去。
在步骤1g中,尸胺可以通过在环境压力或真空蒸馏而回收。
本发明的另一方面涉及一种生产尸胺(1,5-戊二胺)的方法,包括如下步骤、由如下步骤组成或者基本上由如下步骤组成:
2a)获得包含选自如下的氨基酸序列的一种或多种赖氨酸脱羧酶多肽:SEQ IDNO:2(即产酸克雷伯氏菌Ldc)及其片段,及SEQ ID NO:2的突变体(即产酸克雷伯氏菌Ldc的突变体)及其片段;及
2b)使用在步骤2a中获得的一种或多种赖氨酸脱羧酶多肽使赖氨酸脱羧而生产尸胺。
所述赖氨酸脱羧酶多肽、产酸克雷伯氏菌Ldc、其突变体和片段与前文描述的相同。
在某些实施方案中,所述生产尸胺的方法可进一步包括包含提取和纯化步骤2b中产生的尸胺的步骤2c。在另一个实施方案中,所述方法的步骤2c进一步包括如下步骤:
2d)分离得自步骤2b的反应的固体和液体成分;
2e)将得自步骤2d的液体成分的pH调节为大约14或更高;
2f)从得自步骤2e的液体成分中除去水;及
2g)回收尸胺。
在步骤2d中,步骤2b的固体与液体成分的分离可以通过常规的离心和/或过滤方法实现。
在步骤2e中,步骤2d的液体成分的pH可以通过加入碱例如NaOH进行调节。NaOH可以作为固体和/或溶液(例如水溶液)形式加入。
在步骤2f中,水可以通过在环境压力或真空蒸馏而除去。
在步骤2g中,尸胺可以通过在环境压力或真空蒸馏而回收。
在某些实施方案中,所述用于生产尸胺的一种或多种赖氨酸脱羧酶多肽可以是固定化的。在某些实施方案中,所述一种或多种赖氨酸脱羧酶多肽可以局限于基质上。在某些实施方案中,所述一种或多种赖氨酸脱羧酶多肽可以使用本领域技术人员已知的任何合适方法固定。固定技术的例子包括但不限于吸附(例如通过离子或疏水性相互作用)、共价结合、亲和性固定(例如将基质与一种或多种赖氨酸脱羧酶多肽的亲和性配体偶联,或者将所述一种或多种赖氨酸脱羧酶多肽与对基质具有亲和性的分子缀合),及捕获(即通过与基质共价或非共价相互作用锁定所述一种或多种赖氨酸脱羧酶多肽)。可用作基质的材料的例子包括但不限于藻酸盐、壳聚糖、壳多糖、胶原、角叉菜胶、明胶、纤维素、淀粉、果胶、琼脂糖、沸石、陶瓷、硅藻土、二氧化硅、玻璃、活性炭及木炭。
本发明的另一方面涉及根据本发明揭示的方法制备的生物基尸胺。
如本文所用,“生物基”化合物是指在Standard ASTM D6866下认为化合物是生物基的。
本发明的另一方面涉及具有如下结构1的结构的聚酰胺,包括其立体异构体:
其中
m=4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22;
n=4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22;
j=大约100-大约1000000;及
所述聚酰胺是从碳原子数为m的一个或多个二胺及碳原子数目为n的一个或多个二羧酸制备的,至少一个所述二胺和二羧酸包含在Standard ASTM D6866下的生物基碳,并且每个二胺或二羧酸的m或n可以相同或不同。
在一个实施方案中,所述二胺是生物基尸胺,更优选是根据本发明方法制备的生物基尸胺。二羧酸的例子包括但不限于C10二羧酸、C11二羧酸、C12二羧酸、C13二羧酸、C14二羧酸、C16二羧酸、C18二羧酸及其任意组合。在某些实施方案中,所有或部分Cn二羧酸是生物基的。
在另一实施方案中,所述聚酰胺具有上述结构,其中:
所述聚酰胺是通过生物基尸胺与一个或多个二羧酸反应形成的,更优选所述生物基尸胺是根据本发明的方法制备的;
n=4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22;
j=大约100-大约1000000、大约1000-大约100000,或者大约1000-大约10000;及
所述二羧酸包含在Standard ASTM D6866下的生物基碳。
本发明的另一方面涉及一种生产本发明揭示的聚酰胺的方法,包括根据本发明的方法制备生物基尸胺如Cm二胺。
在一个实施方案中,所述方法进一步包括制备一种或多种生物基Cn二羧酸。
在另一个实施方案中,所述方法进一步包括通过将生物基尸胺与一种或多种生物基Cn二羧酸反应制备聚酰胺。
本发明的另一方面涉及包含本发明揭示的一种或多种聚酰胺的组合物。
在一个实施方案中,所述二胺是生物基尸胺,优选是根据本发明的方法制备的生物基尸胺。二羧酸的例子包括但不限于C10二羧酸、C11二羧酸、C12二羧酸、C13二羧酸、C14二羧酸、C16二羧酸、C18二羧酸及其任意组合。在某些实施方案中,所有或部分Cn二羧酸是生物基的。
在另一个实施方案中,所述聚酰胺具有上述结构,其中:
所述聚酰胺是通过将生物基尸胺与一种或多种二羧酸反应形成的,优选所述生物基尸胺是根据本发明的方法制备的;
n=4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22;
j=大约100-大约1000000、大约1000-大约100000,或者大约1000-大约10000;及
所述二羧酸包含在Standard ASTM D6866下的生物基碳。
本发明的另一方面涉及一种制备1,5-二异氰酸戊烷的方法,包括:
3a)制备本发明揭示的生物基尸胺;及
3b)将得自步骤3a的生物基尸胺转化为1,5-二异氰酸戊烷。
步骤3b可包括使用任何已知方法将二胺转化为异氰酸酯。所述方法的一个实例是传统光气法,包括一步高温光气法(即在高温下混合光气与二胺以获得异氰酸盐/酯)、改良的两步光气法,及三光气法,其中使用三光气代替光气。还有不使用光气作为原料的其它方法。所述方法的一个实例是使用CO2代替光气的己二胺羰基化:将CO2添加至伯胺和有机碱的溶液中,然后将适当量的磷亲电试剂添加至反应溶液中以起始放热的脱水反应,获得异氰酸盐/酯。另一实例是氨基甲酸酯热分解法,其中将伯胺转化为氨基甲酸酯,然后将氨基甲酸酯加热至分解并产生异氰酸盐/酯。
用于氨基酸、多肽、碱基序列和核酸的缩写基于在IUPAC-IUB Communication onBiochemical Nomenclature,Eur.J.Biochem.,138:9(1984),"Guideline for PreparingSpecifications Including Base Sequences and Amino Acid Sequences"(UnitedStates Patent and Trademark Office)中指定的缩写及在本技术领域中常用的那些。
除非上下文另有明确要求,在整个说明书和权利要求书中,单词“包含”、“包括”等在包容的意义上解释(即在“包括但不限于”的意义上),与排他性或穷尽性意义相反。在本申请中使用时,单词“本文”、“以上”、“以下”、“上文”和相似输入的单词指作为整体的本申请,不是指本申请的任何特定部分。在上下文允许时,上文详细描述中使用单数或复数的单词还可以分别包括复数或单数。关于两个或更多个项目的列表的单词“或”和“和/或”涵盖单词的所有以下解释:列表中的任何项目,列表中的所有项目,以及列表中的项目的任何组合。
以下实施例意图说明本发明的多种实施方案。因此,讨论的具体实施方案不应当理解为限制本发明的范围。本领域技术人员会清楚可以进行各种等价、改变和修改而不背离本发明的范围,并且应当理解这类等价实施方案包括在本文中。此外,本公开中引用的所有参考文献均以其全文加入本文参考,就如在本文中完整示出一样。
实施例10:在补料分批发酵期间表达产酸克雷伯氏菌Ldc F507L的菌株的尸胺生产
如实施例6提供的相同方式进行表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014,图2)的补料分批发酵。数据在图6中示出。表达产酸克雷伯氏菌Ldc F507L的细胞(菌株LN3014)在补料分批发酵中检测58小时。在58小时后,OD600达到大约82,对于测定的10g样品观测到最大活性,为每分钟1.56%(0.156%/min/g)(见图6,在58小时时间点,分别为方框和三角形)。
参考文献
下文列举的参考文献、专利和公开的专利申请及上文说明书中引用的所有参考文献在此均以其全部内容并入作参考,就如在本文示出一样。
1.Wertz et al.Chimeric nature of two plasmids of H.alvei encoding thebacteriocins alveicins A and B.Journal of Bacteriology,(2004)186:1598-1605.
2.Datsenko KA&Wanner BL.One-step inactivation of chromosomal genes inEscherichia coli K-12using PCR products.PNAS,(2000)6640-6645.
3.Papadakis et al.Promoters and Control Elements:Designing ExpressionCassettes for Gene Therapy.Current Gene Therapy,(2004)4:89-113.
序列表
SEQ ID NO:1(产酸克雷伯氏菌ldc核苷酸序列)
ATGAACGTTATCGCAATCATGAATCACATGGGTGTCTACTTCAAAGAAGAACCCATCCGTGAACTGCATCGCGCCCTCGAACGCCTGGACTTCCGTATTGTCTACCCGAACGACCGTGAAGACTTATTAAAACTTATCGAAAACAATGCGCGTCTGTGCGGCGTGATCTTCGACTGGGATAAATATAATCTCGAACTGTGCGAAGACATCAGCAAAATGAACGAATACATGCCGCTGTACGCCTTTGCGAACACTTACTCAACGCTGGACGTGAGCCTCAACGATCTGCGGATGCAGGTTCGCTTCTTCGAATATGCGCTGGGCGCAGCGGAAGACATTGCCAACAAAATCAAACAGAATACCGACGAGTATATCGACACCATTCTGCCGCCGCTGACCAAAGCGCTGTTTAAATACGTGCGTGAAGGCAAATACACCTTCTGTACCCCAGGCCATATGGGCGGTACCGCGTTCCAGAAAAGCCCAGTCGGCAGCATCTTCTACGATTTCTTTGGTTCCAATACCATGAAATCCGATATCTCGATTTCGGTTTCTGAACTCGGTTCTCTGCTGGACCACAGCGGCCCGCACAAAGAAGCGGAAGAGTACATCGCCCGCGTCTTCAACGCGGAACGCAGCTACATGGTGACCAACGGGACCTCTACCGCCAACAAAATTGTCGGCATGTATTCCGCCCCGGCCGGTAGCACCGTGCTGATTGACCGTAACTGCCATAAATCGCTGACCCATCTGATGATGATGAGCGACATTACGCCAATCTACTTCCGCCCGACCCGCAACGCCTACGGTATCCTCGGCGGTATCCCGCAGAGCGAATTCCAGCATGCGACCATCGCGAAGCGCGTGAAAGAAACCCCGAACGCGACCTGGCCGGTGCACGCGGTTATCACCAACTCCACCTATGACGGTCTGCTGTACAACACGGACTACATCAAGAAAACCCTGGATGTGAAATCCATCCACTTTGACTCCGCGTGGGTGCCTTACACCAACTTCTCGCCGATTTATGAAGGCAAATGCGGGATGAGCGGCGGCCGCGTCGAAGGGAAAGTGATTTACGAAACCCAGTCCACGCACAAACTGCTGGCGGCGTTCTCTCAGGCCTCGATGATTCACGTTAAAGGCGACGTGAACGAAGAGACCTTTAACGAAGCCTACATGATGCACACCACCACTTCTCCGCACTACGGCGTGGTGGCCTCGACGGAAACCGCGGCGGCGATGATGAAAGGCAACGCCGGTAAGCGCCTGATTGACGGCTCTATCGAACGTTCAATCAAGTTCCGTAAAGAGATCAAACGTCTGAAAGGCGAGTCCGACGGCTGGTTCTTCGACGTCTGGCAGCCGGAACATATCGATGGCGCTGAATGCTGGCCGCTGCGCTCCGACAGCGCGTGGCACGGCTTCAAAAACATCGATAACGAGCACATGTATCTCGACCCGATTAAAGTCACGCTGCTGACTCCGGGGATGAAGAAAGACGGCACCATGGATGAGTTCGGTATTCCGGCGAGCATCGTGGCGAAGTATCTCGACGAGCACGGTATCGTGGTCGAAAAAACCGGTCCGTACAACCTGCTGTTCCTGTTCAGTATCGGTATCGACAAAACCAAAGCGCTGAGCCTGCTGCGTGCGCTGACCGATTTCAAACGCGCGTTCGACCTGAACCTGCGGGTGAAAAACATGCTGCCGTCGCTGTATCGTGAAGATCCGGAATTCTACGAAAACATGCGCGTTCAGGAACTGGCGCAGAACATTCATAAACTGATTGAGCACCACAACCTGCCGGATCTGATGTTCCGCGCGTTCGAAGTGCTGCCGACCATGATGATCACGCCGTACGCCGCGTTCCAGAAAGAGCTGCACGGTCAGACCGAAGAGGTGTATCTCGAAGAGATGGTGGGCCGCGTCAACGCCAATATGATCCTGCCGTATCCTCCGGGAGTGCCGCTGGTGATGCCGGGTGAAATGATCACCGAAGAGAGCCGTCCGGTGCTGGAGTTCCTGCAGATGCTGTGCGAAATCGGCGCCCACTATCCGGGCTTCGAAACCGATATCCACGGCGCCTATCGTCAGGCGGATGGTCGTTACACCGTTAAAGTGCTGAAAGAAGAAAATAACAAATAA
SEQ ID NO:2(产酸克雷伯氏菌Ldc氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:3(产酸克雷伯氏菌ldc-co1核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:4(产酸克雷伯氏菌ldc-co1A859G核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTGAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:5(产酸克雷伯氏菌Ldc K287E氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAERVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:6(产酸克雷伯氏菌ldc-co1C1193G核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCAGCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:7(产酸克雷伯氏菌Ldc T398S氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTSTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:8(产酸克雷伯氏菌ldc-co1C1306G核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTGGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:9(产酸克雷伯氏菌Ldc R436G氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFGKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:10(产酸克雷伯氏菌ldc-co1C1521G核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTGGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTTCCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:11(产酸克雷伯氏菌Ldc F507L氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDELGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:12(产酸克雷伯氏菌ldc-co1T1820A核苷酸序列)
ATGAATGTTATTGCGATTATGAACCACATGGGCGTATACTTCAAGGAGGAACCGATCCGCGAACTGCATCGTGCCCTGGAACGTCTGGATTTCCGCATCGTCTATCCAAATGACCGTGAGGATCTCCTCAAGCTCATCGAGAATAATGCGCGCCTGTGTGGTGTTATCTTTGACTGGGACAAATACAATCTGGAACTGTGCGAGGACATCTCTAAGATGAACGAATATATGCCGCTGTACGCGTTTGCCAACACCTACTCTACCCTCGACGTTAGCCTGAATGACCTGCGCATGCAGGTTCGTTTCTTTGAATACGCGCTGGGTGCGGCGGAAGACATTGCAAACAAGATCAAACAAAACACCGACGAGTACATTGATACGATCCTCCCTCCTCTCACCAAAGCTCTGTTCAAGTACGTCCGCGAGGGCAAGTACACTTTTTGCACCCCTGGTCATATGGGCGGCACTGCGTTTCAGAAAAGCCCGGTTGGTTCCATTTTCTATGACTTTTTTGGTTCTAATACGATGAAATCTGATATCTCTATCTCTGTTTCCGAACTCGGCTCCCTGCTGGACCACTCTGGTCCGCATAAAGAAGCAGAAGAATACATCGCGCGTGTTTTCAACGCGGAACGCTCTTACATGGTAACGAACGGCACCAGCACCGCGAATAAGATTGTTGGTATGTATAGCGCTCCAGCGGGCTCTACCGTACTCATTGACCGTAACTGCCATAAAAGCCTGACTCACCTCATGATGATGTCCGACATCACTCCAATTTACTTCCGTCCGACCCGTAATGCCTATGGCATCCTGGGTGGCATTCCTCAGTCTGAATTTCAACACGCCACTATTGCTAAGCGTGTAAAGGAGACTCCAAACGCTACGTGGCCTGTCCACGCCGTTATCACCAACTCCACCTACGACGGTCTCCTGTACAATACTGATTACATCAAAAAAACCCTGGATGTAAAATCCATTCACTTCGATAGCGCATGGGTTCCTTACACTAACTTCAGCCCAATCTATGAGGGTAAGTGCGGTATGAGCGGTGGTCGTGTCGAAGGCAAAGTTATCTACGAGACGCAAAGCACTCACAAACTCCTGGCAGCGTTCTCTCAAGCGTCCATGATTCATGTTAAGGGTGACGTGAATGAAGAGACCTTCAACGAAGCGTACATGATGCATACCACCACCTCTCCGCACTACGGTGTCGTTGCGTCCACGGAAACGGCGGCTGCTATGATGAAAGGTAATGCGGGTAAACGCCTGATCGACGGTTCTATTGAGCGTAGCATCAAATTTCGTAAAGAAATCAAACGTCTCAAAGGTGAAAGCGACGGCTGGTTTTTCGATGTGTGGCAGCCAGAACATATTGATGGTGCTGAATGCTGGCCGCTGCGTTCTGACTCCGCTTGGCACGGTTTCAAAAACATCGACAATGAACACATGTACCTGGACCCGATCAAGGTTACGCTCCTGACCCCAGGTATGAAAAAAGACGGTACTATGGATGAATTCGGTATTCCGGCCTCCATCGTGGCGAAGTATCTCGACGAACATGGCATTGTTGTGGAGAAGACGGGTCCGTATAACCTGCTGTTTCTGTTTTCCATCGGCATTGACAAAACGAAAGCGCTGTCTCTGCTGCGTGCGCTGACCGACTTTAAACGTGCGTTCGACCTGAATCTCCGTGTTAAGAACATGCTCCCGTCTCTGTACCGTGAAGACCCGGAATTCTACGAAAACATGCGTGTTCAGGAACTGGCGCAGAATATCCACAAGCTGATTGAGCATCACAACCTCCCGGATCTCATGTACCGTGCCTTTGAAGTTCTCCCAACGATGATGATTACTCCGTATGCGGCGTTCCAAAAAGAGCTGCATGGCCAAACGGAAGAGGTGTACCTCGAAGAAATGGTCGGTCGCGTTAATGCTAATATGATTCTCCCGTATCCACCTGGTGTGCCTCTCGTTATGCCAGGCGAAATGATCACTGAAGAGTCCCGCCCAGTGCTCGAATTTCTGCAAATGCTGTGTGAAATTGGCGCCCACTACCCAGGCTTCGAAACCGATATTCATGGCGCTTACCGCCAAGCAGATGGTCGCTACACGGTTAAAGTACTCAAGGAAGAGAACAACAAATAA
SEQ ID NO:13(产酸克雷伯氏菌Ldc F607Y氨基酸序列)
MNVIAIMNHMGVYFKEEPIRELHRALERLDFRIVYPNDREDLLKLIENNARLCGVIFDWDKYNLELCEDISKMNEYMPLYAFANTYSTLDVSLNDLRMQVRFFEYALGAAEDIANKIKQNTDEYIDTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSIFYDFFGSNTMKSDISISVSELGSLLDHSGPHKEAEEYIARVFNAERSYMVTNGTSTANKIVGMYSAPAGSTVLIDRNCHKSLTHLMMMSDITPIYFRPTRNAYGILGGIPQSEFQHATIAKRVKETPNATWPVHAVITNSTYDGLLYNTDYIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVEGKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGVVASTETAAAMMKGNAGKRLIDGSIERSIKFRKEIKRLKGESDGWFFDVWQPEHIDGAECWPLRSDSAWHGFKNIDNEHMYLDPIKVTLLTPGMKKDGTMDEFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKNMLPSLYREDPEFYENMRVQELAQNIHKLIEHHNLPDLMFRAFEVLPTMMITPYAAFQKELHGQTEEVYLEEMVGRVNANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQADGRYTVKVLKEENNK
SEQ ID NO:14(RBS DNA-1)
GGAGAT
SEQ ID NO:15(RBS DNA-2)
AGGACT
SEQ ID NO:16(RBS DNA-3)
GAGGAG
SEQ ID NO:17(RBS DNA-4)
GAGGAA
SEQ ID NO:18(RBS DNA-5)
TGGAGG
SEQ ID NO:19(RBS DNA-6)
CAGGAG
SEQ ID NO:20(Plac启动子核苷酸序列)
TTTACACTTTATGCTTCCGGCTCGTATGTTG
SEQ ID NO:21(Pbad启动子核苷酸序列)
GACGCTTTTTATCGCAACTCTCTACTGT
SEQ ID NO:22(Ptac启动子核苷酸序列)
TTGACAATTAATCATCGGCTCGTATAATG
SEQ ID NO:23(aat核苷酸序列)
>gb|AY271828.1|:385-1717H.alvei质粒pAlvA,完整序列
SEQ ID NO:24(aai核苷酸序列)
>gb|AY271828.1|:1734-2069H.alvei质粒pAlvA,完整序列
SEQ ID NO:25(abt核苷酸序列)
>gb|AY271829.1|:384-1566H.alvei质粒pAlvB,完整序列
SEQ ID NO:26(abi核苷酸序列)
>gb|AY271829.1|:1583-1918H.alvei质粒pAlvB,完整序列
序列表
<110> 上海凯赛生物技术研发中心有限公司
凯赛生物产业有限公司
<120> 参与赖氨酸脱羧作用的产酸克雷伯氏菌多肽的表达及其方法和应用
<130> 77705-8007.WO00
<160> 26
<170> PatentIn version 3.5
<210> 1
<211> 2148
<212> DNA
<213> Klebsiella oxytoca
<400> 1
atgaacgtta tcgcaatcat gaatcacatg ggtgtctact tcaaagaaga acccatccgt 60
gaactgcatc gcgccctcga acgcctggac ttccgtattg tctacccgaa cgaccgtgaa 120
gacttattaa aacttatcga aaacaatgcg cgtctgtgcg gcgtgatctt cgactgggat 180
aaatataatc tcgaactgtg cgaagacatc agcaaaatga acgaatacat gccgctgtac 240
gcctttgcga acacttactc aacgctggac gtgagcctca acgatctgcg gatgcaggtt 300
cgcttcttcg aatatgcgct gggcgcagcg gaagacattg ccaacaaaat caaacagaat 360
accgacgagt atatcgacac cattctgccg ccgctgacca aagcgctgtt taaatacgtg 420
cgtgaaggca aatacacctt ctgtacccca ggccatatgg gcggtaccgc gttccagaaa 480
agcccagtcg gcagcatctt ctacgatttc tttggttcca ataccatgaa atccgatatc 540
tcgatttcgg tttctgaact cggttctctg ctggaccaca gcggcccgca caaagaagcg 600
gaagagtaca tcgcccgcgt cttcaacgcg gaacgcagct acatggtgac caacgggacc 660
tctaccgcca acaaaattgt cggcatgtat tccgccccgg ccggtagcac cgtgctgatt 720
gaccgtaact gccataaatc gctgacccat ctgatgatga tgagcgacat tacgccaatc 780
tacttccgcc cgacccgcaa cgcctacggt atcctcggcg gtatcccgca gagcgaattc 840
cagcatgcga ccatcgcgaa gcgcgtgaaa gaaaccccga acgcgacctg gccggtgcac 900
gcggttatca ccaactccac ctatgacggt ctgctgtaca acacggacta catcaagaaa 960
accctggatg tgaaatccat ccactttgac tccgcgtggg tgccttacac caacttctcg 1020
ccgatttatg aaggcaaatg cgggatgagc ggcggccgcg tcgaagggaa agtgatttac 1080
gaaacccagt ccacgcacaa actgctggcg gcgttctctc aggcctcgat gattcacgtt 1140
aaaggcgacg tgaacgaaga gacctttaac gaagcctaca tgatgcacac caccacttct 1200
ccgcactacg gcgtggtggc ctcgacggaa accgcggcgg cgatgatgaa aggcaacgcc 1260
ggtaagcgcc tgattgacgg ctctatcgaa cgttcaatca agttccgtaa agagatcaaa 1320
cgtctgaaag gcgagtccga cggctggttc ttcgacgtct ggcagccgga acatatcgat 1380
ggcgctgaat gctggccgct gcgctccgac agcgcgtggc acggcttcaa aaacatcgat 1440
aacgagcaca tgtatctcga cccgattaaa gtcacgctgc tgactccggg gatgaagaaa 1500
gacggcacca tggatgagtt cggtattccg gcgagcatcg tggcgaagta tctcgacgag 1560
cacggtatcg tggtcgaaaa aaccggtccg tacaacctgc tgttcctgtt cagtatcggt 1620
atcgacaaaa ccaaagcgct gagcctgctg cgtgcgctga ccgatttcaa acgcgcgttc 1680
gacctgaacc tgcgggtgaa aaacatgctg ccgtcgctgt atcgtgaaga tccggaattc 1740
tacgaaaaca tgcgcgttca ggaactggcg cagaacattc ataaactgat tgagcaccac 1800
aacctgccgg atctgatgtt ccgcgcgttc gaagtgctgc cgaccatgat gatcacgccg 1860
tacgccgcgt tccagaaaga gctgcacggt cagaccgaag aggtgtatct cgaagagatg 1920
gtgggccgcg tcaacgccaa tatgatcctg ccgtatcctc cgggagtgcc gctggtgatg 1980
ccgggtgaaa tgatcaccga agagagccgt ccggtgctgg agttcctgca gatgctgtgc 2040
gaaatcggcg cccactatcc gggcttcgaa accgatatcc acggcgccta tcgtcaggcg 2100
gatggtcgtt acaccgttaa agtgctgaaa gaagaaaata acaaataa 2148
<210> 2
<211> 715
<212> PRT
<213> Klebsiella oxytoca
<400> 2
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 3
<211> 2148
<212> DNA
<213> synthetic
<400> 3
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 4
<211> 2148
<212> DNA
<213> synthetic
<400> 4
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctga gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 5
<211> 715
<212> PRT
<213> synthetic
<400> 5
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Glu Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 6
<211> 2148
<212> DNA
<213> synthetic
<400> 6
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac cagcacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 7
<211> 715
<212> PRT
<213> synthetic
<400> 7
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Ser Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 8
<211> 2148
<212> DNA
<213> synthetic
<400> 8
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttggtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 9
<211> 715
<212> PRT
<213> synthetic
<400> 9
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Gly Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 10
<211> 2148
<212> DNA
<213> synthetic
<400> 10
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt gggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgtt ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 11
<211> 715
<212> PRT
<213> synthetic
<400> 11
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Leu Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 12
<211> 2148
<212> DNA
<213> synthetic
<400> 12
atgaatgtta ttgcgattat gaaccacatg ggcgtatact tcaaggagga accgatccgc 60
gaactgcatc gtgccctgga acgtctggat ttccgcatcg tctatccaaa tgaccgtgag 120
gatctcctca agctcatcga gaataatgcg cgcctgtgtg gtgttatctt tgactgggac 180
aaatacaatc tggaactgtg cgaggacatc tctaagatga acgaatatat gccgctgtac 240
gcgtttgcca acacctactc taccctcgac gttagcctga atgacctgcg catgcaggtt 300
cgtttctttg aatacgcgct gggtgcggcg gaagacattg caaacaagat caaacaaaac 360
accgacgagt acattgatac gatcctccct cctctcacca aagctctgtt caagtacgtc 420
cgcgagggca agtacacttt ttgcacccct ggtcatatgg gcggcactgc gtttcagaaa 480
agcccggttg gttccatttt ctatgacttt tttggttcta atacgatgaa atctgatatc 540
tctatctctg tttccgaact cggctccctg ctggaccact ctggtccgca taaagaagca 600
gaagaataca tcgcgcgtgt tttcaacgcg gaacgctctt acatggtaac gaacggcacc 660
agcaccgcga ataagattgt tggtatgtat agcgctccag cgggctctac cgtactcatt 720
gaccgtaact gccataaaag cctgactcac ctcatgatga tgtccgacat cactccaatt 780
tacttccgtc cgacccgtaa tgcctatggc atcctgggtg gcattcctca gtctgaattt 840
caacacgcca ctattgctaa gcgtgtaaag gagactccaa acgctacgtg gcctgtccac 900
gccgttatca ccaactccac ctacgacggt ctcctgtaca atactgatta catcaaaaaa 960
accctggatg taaaatccat tcacttcgat agcgcatggg ttccttacac taacttcagc 1020
ccaatctatg agggtaagtg cggtatgagc ggtggtcgtg tcgaaggcaa agttatctac 1080
gagacgcaaa gcactcacaa actcctggca gcgttctctc aagcgtccat gattcatgtt 1140
aagggtgacg tgaatgaaga gaccttcaac gaagcgtaca tgatgcatac caccacctct 1200
ccgcactacg gtgtcgttgc gtccacggaa acggcggctg ctatgatgaa aggtaatgcg 1260
ggtaaacgcc tgatcgacgg ttctattgag cgtagcatca aatttcgtaa agaaatcaaa 1320
cgtctcaaag gtgaaagcga cggctggttt ttcgatgtgt ggcagccaga acatattgat 1380
ggtgctgaat gctggccgct gcgttctgac tccgcttggc acggtttcaa aaacatcgac 1440
aatgaacaca tgtacctgga cccgatcaag gttacgctcc tgaccccagg tatgaaaaaa 1500
gacggtacta tggatgaatt cggtattccg gcctccatcg tggcgaagta tctcgacgaa 1560
catggcattg ttgtggagaa gacgggtccg tataacctgc tgtttctgtt ttccatcggc 1620
attgacaaaa cgaaagcgct gtctctgctg cgtgcgctga ccgactttaa acgtgcgttc 1680
gacctgaatc tccgtgttaa gaacatgctc ccgtctctgt accgtgaaga cccggaattc 1740
tacgaaaaca tgcgtgttca ggaactggcg cagaatatcc acaagctgat tgagcatcac 1800
aacctcccgg atctcatgta ccgtgccttt gaagttctcc caacgatgat gattactccg 1860
tatgcggcgt tccaaaaaga gctgcatggc caaacggaag aggtgtacct cgaagaaatg 1920
gtcggtcgcg ttaatgctaa tatgattctc ccgtatccac ctggtgtgcc tctcgttatg 1980
ccaggcgaaa tgatcactga agagtcccgc ccagtgctcg aatttctgca aatgctgtgt 2040
gaaattggcg cccactaccc aggcttcgaa accgatattc atggcgctta ccgccaagca 2100
gatggtcgct acacggttaa agtactcaag gaagagaaca acaaataa 2148
<210> 13
<211> 715
<212> PRT
<213> synthetic
<400> 13
Met Asn Val Ile Ala Ile Met Asn His Met Gly Val Tyr Phe Lys Glu
1 5 10 15
Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asp Phe Arg
20 25 30
Ile Val Tyr Pro Asn Asp Arg Glu Asp Leu Leu Lys Leu Ile Glu Asn
35 40 45
Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu
50 55 60
Glu Leu Cys Glu Asp Ile Ser Lys Met Asn Glu Tyr Met Pro Leu Tyr
65 70 75 80
Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu
85 90 95
Arg Met Gln Val Arg Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp
100 105 110
Ile Ala Asn Lys Ile Lys Gln Asn Thr Asp Glu Tyr Ile Asp Thr Ile
115 120 125
Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys
130 135 140
Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys
145 150 155 160
Ser Pro Val Gly Ser Ile Phe Tyr Asp Phe Phe Gly Ser Asn Thr Met
165 170 175
Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp
180 185 190
His Ser Gly Pro His Lys Glu Ala Glu Glu Tyr Ile Ala Arg Val Phe
195 200 205
Asn Ala Glu Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn
210 215 220
Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Val Leu Ile
225 230 235 240
Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp
245 250 255
Ile Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu
260 265 270
Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg
275 280 285
Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr
290 295 300
Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Tyr Ile Lys Lys
305 310 315 320
Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr
325 330 335
Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly
340 345 350
Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu
355 360 365
Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val
370 375 380
Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser
385 390 395 400
Pro His Tyr Gly Val Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met
405 410 415
Lys Gly Asn Ala Gly Lys Arg Leu Ile Asp Gly Ser Ile Glu Arg Ser
420 425 430
Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Lys Gly Glu Ser Asp Gly
435 440 445
Trp Phe Phe Asp Val Trp Gln Pro Glu His Ile Asp Gly Ala Glu Cys
450 455 460
Trp Pro Leu Arg Ser Asp Ser Ala Trp His Gly Phe Lys Asn Ile Asp
465 470 475 480
Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro
485 490 495
Gly Met Lys Lys Asp Gly Thr Met Asp Glu Phe Gly Ile Pro Ala Ser
500 505 510
Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr
515 520 525
Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr
530 535 540
Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe
545 550 555 560
Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu
565 570 575
Asp Pro Glu Phe Tyr Glu Asn Met Arg Val Gln Glu Leu Ala Gln Asn
580 585 590
Ile His Lys Leu Ile Glu His His Asn Leu Pro Asp Leu Met Phe Arg
595 600 605
Ala Phe Glu Val Leu Pro Thr Met Met Ile Thr Pro Tyr Ala Ala Phe
610 615 620
Gln Lys Glu Leu His Gly Gln Thr Glu Glu Val Tyr Leu Glu Glu Met
625 630 635 640
Val Gly Arg Val Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val
645 650 655
Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val
660 665 670
Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly
675 680 685
Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr
690 695 700
Thr Val Lys Val Leu Lys Glu Glu Asn Asn Lys
705 710 715
<210> 14
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 14
nnggagatnn 10
<210> 15
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 15
nnaggactnn 10
<210> 16
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 16
nngaggagnn 10
<210> 17
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 17
nngaggaann 10
<210> 18
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 18
nntggaggnn 10
<210> 19
<211> 10
<212> DNA
<213> synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (9)..(10)
<223> n is a, c, g, or t
<400> 19
nncaggagnn 10
<210> 20
<211> 31
<212> DNA
<213> synthetic
<400> 20
tttacacttt atgcttccgg ctcgtatgtt g 31
<210> 21
<211> 28
<212> DNA
<213> synthetic
<400> 21
gacgcttttt atcgcaactc tctactgt 28
<210> 22
<211> 29
<212> DNA
<213> synthetic
<400> 22
ttgacaatta atcatcggct cgtataatg 29
<210> 23
<211> 1333
<212> DNA
<213> Hafnia alvei
<400> 23
ttgactttgt taaaagtcag gcataagatc aaaatactgt atatataaca atgtatttat 60
atacagtatt ttatactttt tatctaacgt cagagagggc aatattatga gtggtggaga 120
tggcaagggt cacaatagtg gagcacatga ttccggtggc agcattaatg gaacttctgg 180
gaaaggtggg ccatcaagcg gaggagcatc agataattct gggtggagtt cggaaaataa 240
cccgtggggc ggtggtaact cgggaatgat tggtggcagt caaggaggta acggagctaa 300
tcatggtggc gaaaatacat cttctaacta tgggaaagat gtatcacgcc aaatcggtga 360
tgcgatagcc agaaaggaag gcatcaatcc gaaaatattc actgggtact ttatccgttc 420
agatggatat ttgatcggaa taacgccact tgtcagtggt gatgcctttg gcgttaatct 480
tggcctgttc aataacaatc aaaatagtag tagtgaaaat aagggatgga atggaaggaa 540
tggagatggc attaaaaata gtagccaagg tggatggaag attaaaacta atgaacttac 600
ttcaaaccaa gtagctgctg ctaaatccgt tccagaacct aaaaatagta aatattataa 660
gtccatgaga gaagctagcg atgaggttat taattctaat ttaaaccaag ggcatggagt 720
tggtgaggca gctagagctg aaagagatta cagagaaaaa gtaaagaacg caatcaatga 780
taatagtccc aatgtgctac aggatgctat taaatttaca gcagattttt ataaggaagt 840
ttttaacgct tacggagaaa aagccgaaaa actagccaag ttattagctg atcaagctaa 900
aggtaaaaag atccgcaatg tagaagatgc attgaaatct tatgaaaaac acaaggctaa 960
cattaacaaa aaaatcaatg cgaaagatcg cgaagctatc gccaaggctt tggagtctat 1020
ggatgtagaa aaagccgcaa aaaatatatc caagttcagc aaaggactag gttgggttgg 1080
cccagctatc gatataactg attggtttac agaattatac aaagcagtga aaactgataa 1140
ttggagatct ctttatgtta aaactgaaac tattgcagta gggctagctg caacccatgt 1200
caccgcctta gcattcagtg ctgtcttggg tgggcctata ggtattttag gttatggttt 1260
gattatggct ggggttgggg cgttagttaa cgagacaata gttgacgagg caaataaggt 1320
cattgggatt taa 1333
<210> 24
<211> 336
<212> DNA
<213> Hafnia alvei
<400> 24
ctatatttta gcggtcacat tttttatttc aaaacaaaca gaaagaacac caataggaat 60
tgatgtcata aaaataaaaa taaaatacaa agtcattaaa tatgtttttg gcacaccatc 120
cttaaaaaaa cctgttttcc aaaattcttt tttcgtatat ctaagcgctg ctttctctat 180
tagaaaccga gagaaaggaa atagaatagc gctagccaaa ccaaagattc tgagcgcaat 240
tattttaggt tcgtcatcac cataactggc gtaaagaata caagcagcca taaagtatcc 300
ccaaaacata ttatgtatgt aatatttcct tgtcat 336
<210> 25
<211> 1077
<212> DNA
<213> Hafnia alvei
<400> 25
atgagtggtg gagacggtaa aggtcacaat agtggagcac atgattccgg tggcagcatt 60
aatggaactt cggggaaagg tggacctgat tctggtggcg gatattggga caaccatcca 120
catattacaa tcaccggtgg acgggaagta ggtcaagggg gagctggtat caactggggt 180
ggtggttctg gtcatggtaa cggcgggggc tcagttgcca tccaagaata taacacgagt 240
aaatatccta acacgggagg atttcctcct cttggagacg ctagctggct gttaaatcct 300
ccaaaatggt cggttattga agtaaaatca gaaaactcag catggcgctc ttatattact 360
catgttcaag gtcatgttta caaattgact tttgatggta cgggtaagct cattgatacc 420
gcgtatgtta attatgaacc cagtgatgat actcgttgga gcccgcttaa aagttttaaa 480
tataataaag gaaccgctga aaaacaggtt agggatgcca ttaacaatga aaaagaagca 540
gttaaggacg ctgttaaatt tactgcagac ttctataaag aggtttttaa ggtttacgga 600
gaaaaagccg agaagctcgc taagttatta gcagatcaag ctaaaggcaa aaaggttcgc 660
aacgtagaag atgccttgaa atcttatgaa aaatataaga ctaacattaa caaaaaaatc 720
aatgcgaaag atcgcgaagc tattgctaaa gccttggagt ctatggatgt aggaaaagcc 780
gcaaaaaata tagccaagtt cagtaaagga ctaggttggg ttggccctgc tatcgatata 840
actgattggt ttacagaatt atacaaggca gtggaaactg ataattggag atctttttat 900
gttaaaactg aaactattgc agtagggcta gctgcaaccc atgttgccgc cttggcattc 960
agcgctgtct tgggtgggcc tgtaggtatt ttgggttatg gtttgattat ggctggggtt 1020
ggggcgttag ttaatgagac aatagttgac gaggcaaata aggttattgg gctttaa 1077
<210> 26
<211> 336
<212> DNA
<213> Hafnia alvei
<400> 26
ctataattta gcggtcacat tttttatttc aaaaaaaaca gaaataacac ctataggaat 60
tgatgtcata aaaataaaaa ttaaatacaa agtcattaaa tatgtttttg gcacgccatc 120
cttaaaaaaa ccagtttccc aaaattcttt tttcgtatat ctaagcgcgg ttttctctat 180
taaaaaccga gagaaaggga ataggatagc actagccaaa ccaaagattc tgagcgcaat 240
tattttaggt tcgttatccc cataactggc gtaaagaata caaacagcca taaagtaccc 300
ccaaaacata ttatgtatat aatatttcct tgtcat 336