CN106795209B

CN106795209B - 重组四环素外排泵用于生产赖氨酸或赖氨酸衍生产物

Info

Publication number: CN106795209B
Application number: CN201480082442.3A
Authority: CN
Inventors: 周豪宏; 刘修才
Original assignee: Cathay R&D Center Co Ltd; CIBT America Inc
Current assignee: Cathay R&D Center Co Ltd; CIBT America Inc
Priority date: 2014-10-09
Filing date: 2014-10-09
Publication date: 2021-06-25
Anticipated expiration: 2034-10-09
Also published as: WO2016054792A1; US20190338323A1; EP3204405A4; EP3204405A1; US11098329B2; EP3204405B1; US20180163239A1; US10400257B2; CN106795209A

Abstract

本发明提供了包含大肠杆菌四环素外排泵A(TetA)的氨基酸序列的突变多肽以及编码所述多肽的多核苷酸。本发明提供了包含一个或多个第一多核苷酸、一个或多个第二多核苷酸的第一表达质粒载体和包含所述表达质粒载体的转化体，所述第一多核苷酸编码四环素外排泵，所述第二多核苷酸独立地选自第三多核苷酸和第四多核苷酸，所述第三多核苷酸编码包含赖氨酸脱羧酶多肽，所述第四多核苷酸编码包含赖氨酸生物合成多肽。本发明提供了包含一个或多个整合进宿主细胞染色体中的本发明所述的第一、第三或第四多核苷酸的宿主细胞。本发明还提供了使用所述转化体和/或突变宿主细胞生产赖氨酸或尸胺的方法。

Description

重组四环素外排泵用于生产赖氨酸或赖氨酸衍生产物

发明背景

目前改良赖氨酸生产和赖氨酸衍生产物如尸胺生产的方法专注于参与细胞代谢的蛋白质的过表达或弱化。然而，迄今为止获得的产量未令人满意。因此，需要可以获得更高产量赖氨酸和尸胺的新技术。

发明概述

本发明一方面涉及第一多肽，其包含四环素外排泵(tetracycline efflux pump)多肽、其片段或其突变体，由四环素外排泵多肽、其片段或其突变体组成，或基本上由四环素外排泵多肽、其片段或其突变体组成。如本文所用，大肠杆菌(E.coli)四环素外排泵A称作“TetA”，具有SEQ ID NO: 2的氨基酸序列。TetA突变体的例子包括但不限于TetA的截短形式，如具有SEQ ID NO:30的多肽序列的TetA(aa1-185)及具有SEQ ID NO:32的多肽序列的TetA(aa1-96)。如本文所用，“aa”指氨基酸。

本发明另一方面涉及非天然存在的第一多核苷酸，其编码一个或多个本发明揭示的第一多肽。如本文所用，大肠杆菌四环素外排泵A基因称作“大肠杆菌tetA”，包含SEQ IDNO:1的多核苷酸序列、由SEQ ID NO:1 的多核苷酸序列组成或基本上由SEQ ID NO:1的多核苷酸序列组成。tetA 突变体的例子包括但不限于tetA的截短形式，如具有SEQ ID NO:29的多核苷酸序列的tetA(nt 1-558)及具有SEQ ID NO:31的多核苷酸序列的tetA (nt 1-291)。如本文所用，“nt”指核苷酸。

本发明另一方面涉及第一表达质粒载体，其包含一个或多个本文揭示的第一多核苷酸和能在宿主细胞中自主复制的骨架质粒，由一个或多个本文揭示的第一多核苷酸和能在宿主细胞中自主复制的骨架质粒组成或基本上由一个或多个本文揭示的第一多核苷酸和能在宿主细胞中自主复制的骨架质粒组成，其中所述第一表达质粒载体用于生产赖氨酸或赖氨酸衍生产物。在某些实施方案中，所述第一表达质粒载体进一步包含一个或多个选自第三多核苷酸及第四多核苷酸的第二多核苷酸，所述第三多核苷酸编码包含赖氨酸脱羧酶多肽的第三多肽、其片段或其突变体，所述第四多核苷酸编码包含赖氨酸生物合成多肽的第四多肽、其片段或其突变体。

本发明另一方面涉及转化体，其包含一个或多个在宿主细胞中的本文所述的第一表达质粒载体、由一个或多个在宿主细胞中的本文所述的第一表达质粒载体组成或基本上由一个或多个在宿主细胞中的本文所述的第一表达质粒载体组成。在某些实施方案中，本文所述的转化体进一步包含一个或多个第二表达质粒载体和能在宿主细胞中自主复制的骨架质粒、由一个或多个第二表达质粒载体和能在宿主细胞中自主复制的骨架质粒组成或基本上由一个或多个第二表达质粒载体和能在宿主细胞中自主复制的骨架质粒组成，所述第二表达质粒载体包含一个或多个选自如下的第五多核苷酸、由一个或多个选自如下的第五多核苷酸组成或基本上由一个或多个选自如下的第五多核苷酸组成：本文揭示的第一多核苷酸、本文揭示的第三多核苷酸及本文揭示的第四多核苷酸，其中所述一个或多个第二表达质粒载体用于生产赖氨酸或赖氨酸衍生产物。

本发明另一方面涉及突变宿主细胞，其包含一个或多个整合进宿主细胞染色体中的本文揭示的第一多核苷酸、由一个或多个整合进宿主细胞染色体中的本文揭示的第一多核苷酸组成或基本上由一个或多个整合进宿主细胞染色体中的本文揭示的第一多核苷酸组成。在某些实施方案中，突变宿主细胞进一步包含一个或多个第二多核苷酸、由一个或多个第二多核苷酸组成或基本上由一个或多个第二多核苷酸组成，所述第二多核苷酸选自本文揭示的第三多核苷酸及本文揭示的第四多核苷酸。

本发明另一方面涉及一种生产赖氨酸的方法，包括获得本文揭示的转化体和/或突变宿主细胞，在使赖氨酸有效表达的条件下培养所述转化体和 /或突变宿主细胞，及收获赖氨酸。

本发明另一方面涉及生产尸胺(1,5-戊二胺)的方法，包括培养本文揭示的转化体和/或突变宿主细胞，使用由此获得的培养物使赖氨酸脱羧而产生尸胺，及使用由此获得的培养物提取并纯化尸胺。

本发明的其它方面涉及从生物基尸胺制备的聚酰胺和1,5-二异氰酸戊烷及其组合物和制备方法。

附图简述

图1：根据本发明一个实施方案用于构建重组表达质粒载体的聚合酶链反应(PCR)引物序列。图中提供了用于克隆和截短tetA、cadA及参与赖氨酸生物合成途径的多个基因的引物序列。

图2：除了过表达的相应酶及编码所述酶的基因之外，示出用于实施例中的质粒和菌株的表。

发明详述

如下描述提供了彻底理解及能够描述本发明实施方案的具体细节。然而，本领域技术人员理解本发明可以不用这些细节而实施。在其它情况中，熟知的结构和功能未示出或详细描述以避免不必要地模糊对本发明的实施方案的描述。

如本文所揭示，发现四环素外排泵的表达导致出乎意料的赖氨酸和尸胺高产量。进一步地，出乎意料地发现四环素外排泵的多种突变体的表达导致高尸胺产量。

如本文所用，术语“一个或多个”项目(例如但不限于多核苷酸、多肽、表达质粒载体、氨基酸、核苷酸、突变、质粒、酶、蛋白质、来源、二胺、二羧酸及聚酰胺)是指当存在多个项目时，所述项目可以是相同或不同的。

本发明一方面涉及第一多肽，其包含四环素外排泵多肽、其片段或其突变体，由四环素外排泵多肽、其片段或其突变体组成，或基本上由四环素外排泵多肽、其片段或其突变体组成。在某些实施方案中，所述四环素外排泵多肽包含SEQ ID NO:2(TetA)的氨基酸序列、其片段或其突变体，由SEQ ID NO:2(TetA)的氨基酸序列、其片段或其突变体组成，或基本上由SEQ ID NO:2(TetA)的氨基酸序列、其片段或其突变体组成。

在某些实施方案中，所述第一多肽包含选自如下的四环素外排泵多肽： Tet、TetA、TetB、TetC、TetD、TetE、TetF、TetG、TetH、TetJ、TetK、TetL、 TetM、TetO、TetP(A)、TetP(B)、TetQ、TetS、TetT、TetU、TetV、TetW、 TetX、TetY、TetZ、TetA30、其片段或其突变体。例如但不限于，所述第一多肽可包含表1中列出的任何四环素外排泵多肽、其片段或其突变体。

表1：编码四环素外排泵的基因及相应种属

在某些实施方案中，所述第一多肽包含SEQ ID NO:2(TetA)的氨基酸序列、其片段或其突变体，由SEQ ID NO:2(TetA)的氨基酸序列、其片段或其突变体组成或基本上由SEQID NO:2(TetA)的氨基酸序列、其片段或其突变体组成。TetA的突变体可包括在SEQ ID NO:2的氨基酸序列中缺失、取代、添加和/或插入一个或多个氨基酸，同时TetA的突变体提供与TetA基本相同的功能(即TetA的突变体与TetA相比具有大约80％或更高的四环素外排泵活性；与TetA相比具有大约90％或更高的四环素外排泵活性；与TetA相比具有大约95％或更高的四环素外排泵活性；与TetA相比具有大约97％或更高的四环素外排泵活性；与TetA相比具有大约99％或更高的四环素外排泵活性；或与TetA相比具有大约100％或更高的四环素外排泵活性)。

TetA的突变体的例子包括但不限于SEQ ID NO:30(TetA(aa1-185，其中“aa”指氨基酸))和SEQ ID NO:32(TetA(aa1-96))。其它TetA突变体的例子可包括这样的TetA突变体，其在TetA多肽内连接α螺旋的结构环区域被截短。在某些实施方案中，TetA突变体可包括在TetA蛋白的环3中产生的任何截短形式，如TetA aa1-97、TetA aa 1-98、TetA aa 1-99、TetA aa 1-100、TetA aa 1-101、TetA aa 1-102、TetA aa 1-103或TetA aa 1-104。在某些实施方案中，TetA突变体可包括在TetA蛋白的环4中产生的任何截短形式，如TetAaa1-124、TetA aa 1-125、TetA aa 1-126、TetA aa 1-127、TetA aa 1-128、TetA aa 1-129、TetA aa 1-130、TetA aa 1-131、TetA aa 1-132或TetA aa 1-133。在某些实施方案中，TetA突变体可包括在TetA蛋白的环5中产生的任何截短形式，如TetA aa1-155、TetA aa1-156、TetA aa 1-157、TetA aa 1-158、TetA aa 1-159、TetA aa 1-160、TetA aa 1-161或TetA aa 1-162。在某些实施方案中，TetA突变体可包括在TetA蛋白的环6中产生的任何截短形式，如TetA aa1-182、TetA aa 1-183、TetA aa 1-184、TetA aa 1-185、TetA aa 1-186、TetA aa 1-187、TetA aa 1-188、TetA aa 1-189、TetA aa 1-190、TetA aa1-191、TetAaa 1-192、TetA aa 1-193、TetA aa 1-194、TetA aa 1-195、TetA aa 1-196、TetA aa 1-197、TetA aa 1-198、TetA aa 1-199、TetA aa1-200、TetA aa 1-201、TetA aa 1-202、TetAaa 1-203、TetA aa 1-204、TetA aa 1-205、TetA aa 1-206、TetA aa 1-207、TetA aa 1-208、TetA aa 1-209、TetA aa 1-210、TetA aa 1-211、TetA aa 1-212、TetA aa 1-213或TetA aa 1-214。在某些实施方案中，TetA突变体可包括在TetA蛋白的环7中产生的任何截短形式，如TetA aa1-237、TetA aa 1-238、TetA aa 1-239、TetA aa 1-240、TetA aa 1-241、TetA aa 1-242、TetA aa 1-243、TetA aa 1-244或TetA aa 1-245。在某些实施方案中，TetA突变体可包括在TetA蛋白的环8中产生的任何截短形式，如TetA aa1-268、TetA aa1-269、TetA aa 1-270、TetA aa 1-271、TetA aa 1-272、TetA aa 1-273、TetA aa 1-274、TetA aa 1-275、TetA aa 1-276、TetA aa 1-277或TetA aa 1-278。在某些实施方案中，TetA突变体可包括在TetA蛋白的环9中产生的任何截短形式，如TetA aa1-321、TetA aa 1-322、TetA aa 1-323、TetA aa 1-324、TetA aa 1-325、TetA aa 1-326、TetA aa 1-327、TetA aa 1-328、TetA aa 1-329、TetA aa 1-330、TetA aa 1-331、TetA aa 1-332、TetA aa1-333、TetA aa 1-334、TetA aa 1-335、TetA aa 1-336、TetA aa 1-337、TetA aa 1-338或TetA aa 1-339。在某些实施方案中，TetA突变体可包括在TetA蛋白的环10中产生的任何截短形式，如TetA aa1-360、TetA aa 1-361、TetA aa 1-362、TetA aa 1-363、TetA aa 1-364、TetA aa 1-365、TetA aa 1-366或TetA aa 1-367。

如本文所用，包含特定多肽序列的多肽可包括所述特定多肽序列的片段和/或突变体，同时仍提供与完整的原始未突变的特定多肽序列基本相同的功能。多肽的片段是指多肽的一部分，其提供与完整多肽基本相同的功能。特定多肽序列的突变体的例子包括在特定多肽序列中一个或多个氨基酸的缺失、取代、添加和/或插入。例如，TetA的片段或突变体具有与TetA 多肽基本相同的功能(例如四环素外排泵活性)。

本发明另一方面涉及第一多核苷酸，其编码如本文所述相同或不同的一个或多个第一多肽。在一个实施方案中，所述第一多肽包含四环素外排泵多肽、其片段或其突变体，由四环素外排泵多肽、其片段或其突变体组成或基本上由四环素外排泵多肽、其片段或其突变体组成。当存在多个所述第一多肽时，每个第一多肽可以相同或不同，且可以单独表达或作为融合蛋白表达。

在某些实施方案中，所述第一多核苷酸序列优选包含一个或多个大肠杆菌四环素外排泵基因tetA(SEQ ID NO:1)、其片段和/或其突变体。在某些实施方案中，所述第一多核苷酸可编码如本文揭示的任何四环素外排泵。在某些实施方案中，所述第一多核苷酸序列可选自SEQ ID NO:29(tetA(nt 1-558))、SEQ ID NO:31(tetA(nt 1-291)及密码子优化的tetA’s。

在某些实施方案中，所述第一多核苷酸序列包含1、2、3、4、5、6、7、 8、9或10个四环素外排泵基因，其独立地选自tet、tetA、tetB、tetC、tetD、 tetE、tetF、tetG、tetH、tetJ、tetK、tetL、tetM、tetO、tetP(A)、tetP(B)、tetQ、 tetS、tetT、tetU、tetV、tetW、tetX、tetY、tetZ、tetA30、其片段或其突变体。例如，所述第一多核苷酸序列可包含但不限于表1中列举的任何四环素外排泵基因、其片段或其突变体。在某些实施方案中，所述四环素外排泵基因非限制地可来自表1中列举的任何相应种属。

在某些实施方案中，所述第一多核苷酸包含多核苷酸四环素外排泵基因tetA(SEQID NO:1)、其突变体或其片段，由多核苷酸四环素外排泵基因 tetA(SEQ ID NO:1)、其突变体或其片段组成或基本上由多核苷酸四环素外排泵基因tetA(SEQ ID NO:1)、其突变体或其片段组成。tetA的突变体可包括在SEQ ID NO:1的多核苷酸序列中一个或多个核苷酸的缺失、取代、添加和/或插入，而由tetA的突变体编码的蛋白质具有与TetA基本相同的功能(即TetA的突变体与TetA相比具有大约80％或更高的四环素外排泵活性；TetA的突变体与TetA相比具有大约90％或更高的四环素外排泵活性； TetA的突变体与TetA相比具有大约95％或更高的四环素外排泵活性；TetA 的突变体与TetA相比具有大约97％或更高的四环素外排泵活性；TetA的突变体与TetA相比具有大约99％或更高的四环素外排泵活性；或TetA的突变体与TetA相比具有大约100％或更高的四环素外排泵活性)。

在某些实施方案中，所述第一多核苷酸可以是重组或非天然存在的多核苷酸。在某些实施方案中，所述第一多核苷酸可以是cDNA。在某些实施方案中，所述第一多核苷酸可以通过密码子优化以在特定微生物(例如大肠杆菌、蜂房哈夫尼菌(H.alvei))或铜绿假单胞菌(P.aeruginosa))中最佳多肽表达而获得。

如本文所用，核苷酸序列、多核苷酸和DNA分子不限于功能区，可包括表达抑制区、编码区、前导序列、外显子、内含子和表达盒中至少之一(见例如Papadakis et al.,"Promoters and Control Elements:Designing Expression Cassettes for GeneTherapy,"Current Gene Therapy(2004),4,89-113)。此外，核苷酸序列或多核苷酸可包括双链DNA或单链DNA(即组成双链DNA的有义链和反义链)或RNA。含有特定多核苷酸序列的多核苷酸可包括该特定多核苷酸序列的片段和/或突变体。多核苷酸的片段是指多核苷酸的一部分，其编码提供与完整多核苷酸编码的多肽基本相同功能的多肽。特定多核苷酸序列的突变体的例子包括天然存在的等位基因突变体、人工突变体及通过在所述特定多核苷酸序列中缺失、取代、添加和/或插入一个或多个核苷酸而获得的多核苷酸序列。应理解特定多核苷酸序列的这种片段和/或突变体编码与由原始的特定多核苷酸序列编码的多肽具有基本相同功能的多肽。例如，tetA的片段或突变体编码具有基本相同TetA功能(例如四环素外排泵活性)的多肽。

密码子优化是一种通过增加感兴趣基因的翻译效力而可用于使生物体中蛋白质表达最大化的技术。不同的生物体由于突变偏向和天然选择性而通常示出对于编码相同氨基酸的一些密码子之一的特别优选性。例如，在快速生长的微生物如大肠杆菌中，最佳密码子反映出其各自基因组tRNA 库的组成。因此，氨基酸的低频率密码子可以由在快速生长微生物中用于相同氨基酸但是高频率的密码子置换。因此，优化的DNA序列的表达在快速生长微生物中得以改良。见例如http://www.guptalab.org/shubhg/pdf/ shubhra_codon.pdf关于密码子优化技术的综述，其全部内容并入本文作参考。如本文提供，多核苷酸序列可以经密码子优化以用于在特定微生物中的最佳多肽表达，所述微生物包括但不限于大肠杆菌、蜂房哈夫尼菌和铜绿假单胞菌。

在某些实施方案中，多核苷酸的突变体可以得自多核苷酸的密码子优化，以降低其鸟嘌呤(G)和胞嘧啶(C)多核苷酸含量，用于改良蛋白质表达。如果基因组的大约50％或更多碱基是G或C，则认为其是GC富集的。感兴趣的多核苷酸序列中高GC含量可导致mRNA中二级结构形成，其可导致翻译中断及较低水平的表达。因此，将编码序列中的G和C残基改变为 A和T残基而不改变氨基酸可提供更高的表达水平。

本发明另一方面涉及第一表达质粒载体，其包含如下、由如下组成或基本上由如下组成：

一个或多个第一多核苷酸，其相同或不同，每个编码一个或多个第一多肽，所述多肽相同或不同且每个包含四环素外排泵多肽,其片段或其突变体，由四环素外排泵多肽,其片段或其突变体组成或基本上由四环素外排泵多肽,其片段或其突变体组成；及

骨架质粒，其能在宿主细胞中自主复制，

其中所述第一表达质粒载体用于生产赖氨酸或赖氨酸衍生产物。

在一个实施方案中，存在多个所述第一多肽，每个第一多肽可以相同或不同，及可以单独表达或作为融合蛋白表达。

如本文所用，术语“宿主细胞”是指微生物细胞，其可以用表达质粒载体转化的任何细胞(例如假单胞菌(例如铜绿假单胞菌)、埃希氏菌属(例如大肠杆菌)、棒杆菌属(例如谷氨酸棒杆菌(Corynebacterium glutamicum))、芽孢杆菌、哈夫尼菌属(例如蜂房哈夫尼菌)、短杆菌属、乳杆菌属(例如戊糖乳杆菌(Lactobacillus pentosus)、植物乳杆菌(Lactobacillus plantarum)、 Lactobacillus saerimneri)、乳球菌属(例如乳酸如球菌(Lactococcus lactis)、乳酸如球菌乳脂亚种(Lactococcus lactis ssp.Cremoris),乳酸如球菌乳亚种 (Lactococcus lactis ssp.lactis))及链球菌属(例如嗜热链球菌(Streptococcus thermophilus)))。

大肠杆菌细胞可以是衍生自大肠杆菌K12的大肠杆菌菌株(例如 MG1655、W3110、DH10b、DH1、BW2952及衍生自其的菌株)或大肠杆菌 B的任何大肠杆菌菌株或衍生自其的菌株。

在某些实施方案中，所述宿主细胞可含有一个或多个内源质粒。在某些实施方案中，所述宿主细胞不含有内源质粒。如本文所用，术语“治愈 (cure)”是指从宿主细胞中除去一个或多个内源质粒。在某些实施方案中，宿主细胞通过从宿主细胞中除去所有内源质粒而可以“治愈”所有内源质粒。在某些实施方案中，宿主细胞通过从细胞中靶向除去仅一个或多个内源质粒而可以“治愈”所述一个或多个内源质粒。

在某些实施方案中，宿主细胞可以是原核细胞(例如是蜂房哈夫尼菌)，其含有编码特定毒素/抗毒素基因对的内源质粒。这种毒素/抗毒素基因对在维持遗传信息及应激反应中起作用(见Wertz et al.“Chimeric nature of two plasmids of Hafnia alveiencoding the bacteriocins alveicins A and B.”Journal of Bacteriology,(2004)186:1598-1605)。只要细胞具有包含抗毒素基因的一个或多个质粒，则毒素被由所述一个或多个质粒持续表达的抗毒素中和，以保持细胞存活。在某些原核生物中，所述抗毒素蛋白比毒素蛋白更快速降解。如果包含抗毒素基因的质粒从细胞中丧失，则毒素蛋白将比抗毒素蛋白在细胞中存在更长时间并杀死或抑制细胞生长。因此，优选维持包含抗毒素或毒素/抗毒素基因的质粒以保持宿主细胞存活。

如本文所用，毒素/抗毒素对有两个基因，一个是表达对宿主细胞有毒性的多肽的毒素基因，另一个是在宿主细胞中中和毒性多肽的抗毒素基因。毒素/抗毒素基因对的例子包括但不限于abt/abi基因对和aat/aai基因对，其片段或其突变体。在一些实施方案中，毒素多核苷酸序列包含SEQ ID NO: 12或SEQ ID NO:14的核苷酸序列、其片段或其突变体，由SEQ ID NO:12 或SEQ ID NO:14的核苷酸序列、其片段或其突变体组成或基本上由SEQ IDNO:12或SEQ ID NO:14的核苷酸序列、其片段或其突变体组成。在一些实施方案中，抗毒素多核苷酸序列包含SEQ ID NO:13或SEQ ID NO:15 的核苷酸序列、其片段或其突变体，由SEQ ID NO:13或SEQ ID NO:15 的核苷酸序列、其片段或其突变体组成或基本上由SEQ IDNO:13或SEQ ID NO:15的核苷酸序列、其片段或其突变体组成。

在某些实施方案中，所述宿主细胞可以是任何蜂房哈夫尼菌菌株，例如无内源质粒的蜂房哈夫尼菌菌株或含有内源质粒的蜂房哈夫尼菌菌株。例如，所述宿主细胞可以是含有一个或多个质粒的蜂房哈夫尼菌菌株或其治愈的菌株(pAlvA-菌株)，或含有一个或多个pAlvB质粒的蜂房哈夫尼菌菌株及其治愈的菌株(pAlvB-菌株)。

在某些实施方案中，本文揭示的表达质粒载体(例如所述第一表达质粒载体)可进一步包含独立地选自abi基因、aai基因、其突变体和其片段的一个或多个抗毒素基因，和/或独立地选自abt/abi基因对和aat/aai基因对及其突变和其片段的一个或多个毒素/抗毒素基因对。例如，在某些实施方案中，表达质粒载体(例如所述第一表达质粒载体)可进一步包含中和对于宿主细胞有害的毒素多肽的抗毒素多核苷酸，及编码所述毒素多肽的毒素多核苷酸序列。

在某些实施方案中，所述宿主细胞是在工业规模或大规模生产中适用的工业菌株。例如，工业菌株可以在发酵罐中培养。培养规模可以从数百升至数百万升。另一方面，实验室菌株通常在数升或更低中培养。在某些实施方案中，工业菌株可以在比实验室菌株更简便或更经济的培养基中生长。

在宿主细胞中能自主复制的骨架质粒可以是在宿主细胞中可以复制的任何质粒。在一个实施方案中，表达质粒载体包含在大肠杆菌中可以复制的骨架质粒。在另一个实施方案中，表达质粒载体包含在蜂房哈夫尼菌中可以复制的骨架质粒。骨架质粒的例子包括但不限于在大肠杆菌菌株中可以复制的骨架质粒，例如pUC(例如pUC18和pUC19质粒)、pBR322、 pSC101、p15a、pACYC、pET和pSC101质粒，以及衍生自其的质粒。

在某些实施方案中，所述多核苷酸的突变体可以得自针对特定微生物 (例如大肠杆菌、蜂房哈夫尼菌或铜绿假单胞菌)增强多肽表达而进行的多核苷酸密码子优化。

在某些实施方案中，所述第一表达质粒载体可用于生产本文所述的赖氨酸或赖氨酸衍生产物。在某些实施方案中，赖氨酸衍生产物可以是本文描述的尸胺。

在某些实施方案中，所述第一表达质粒载体进一步包含一个或多个第六多核苷酸，其相同或不同且每个均编码第六多肽，所述第六多肽包含抗生素抗性蛋白、其片段或突变体，由抗生素抗性蛋白、其片段或突变体组成或基本上由抗生素抗性蛋白、其片段或突变体组成。当存在多个所述第六多核苷酸时，由所述第六多核苷酸编码的第六多肽可以相同或不同，及可以单独表达或作为融合蛋白表达。

在某些实施方案中，所述抗生素抗性蛋白可以是四环素抗性蛋白或土霉素抗性蛋白。在某些实施方案中，所述抗生素抗性蛋白可以选自包含如下的一组中、由如下组成的一组中或基本由如下组成的一组中：OtrA、OtrB、 OtrC、Tcr3、其片段和/或突变体。在某些实施方案中，OtrA可以得自分枝杆菌属或链霉菌属。在某些实施方案中，OtrB、OtrC和Tcr3可以来自链霉菌属。在某些实施方案中，所述第六多核苷酸可以选自包含如下的一组中、由如下组成的一组中或基本由如下组成的一组中：otrA、otrB、otrC、tcr3、其片段和/或突变体。在某些实施方案中，otrA可以来自分枝杆菌属或链霉菌属。在某些实施方案中，otrB、otrC和tcr3可以来自链霉菌属。

在某些实施方案中，所述第一表达质粒载体包含如下多核苷酸、由如下多核苷酸组成或基本上由如下多核苷酸组成：

一个或多个第一多核苷酸，其相同或不同且每个均编码一个或多个第一多肽，该第一多肽是相同或不同的且每个均包含四环素外排泵多肽、其片段或其突变体，由四环素外排泵多肽、其片段或其突变体组成或基本上由四环素外排泵多肽、其片段或其突变体组成；

一个或多个第二多核苷酸，其是相同或不同的且独立地选自：

编码第三多肽的第三多核苷酸，所述第三多肽包含赖氨酸脱羧酶多肽、其片段或其突变体，由赖氨酸脱羧酶多肽、其片段或其突变体组成或基本上由赖氨酸脱羧酶多肽、其片段或其突变体组成，及

编码第四多肽的第四多核苷酸，所述第四多肽包含赖氨酸生物合成多肽、其片段或其突变体，由赖氨酸生物合成多肽、其片段或其突变体组成或基本上由赖氨酸生物合成多肽、其片段或其突变体组成；及

能在宿主细胞中自主复制的骨架质粒，

在某些实施方案中，当存在多个所述第二多核苷酸时，每个第三多核苷酸可以相同或不同且每个第四多肽可以相同或不同；所述第三和第四多肽可以单独表达或作为融合蛋白表达。

在某些实施方案中，所述第三多核苷酸编码第三多肽，所述第三多肽包含赖氨酸脱羧酶多肽、其片段或其突变体，由赖氨酸脱羧酶多肽、其片段或其突变体组成或基本上由赖氨酸脱羧酶多肽、其片段或其突变体组成。

在某些实施方案中，所述第三多核苷酸可选自包含如下的组中、由如下组成的组中或基本由如下组成的组中：SEQ ID NO:41(cadA)，SEQ ID NO:42(ldcC)，SEQ ID NO:8(ldc2)，其片段和其突变体。在某些实施方案中，第三多核苷酸选自包含如下的组中、由如下组成的组中或基本由如下组成的组中：SEQ ID NO:10(ldc2 co-1)，SEQ ID NO:34(ldc2co-1 C332G)， SEQ ID NO:35(ldc2 co-1 A785C)，SEQ ID NO:36(ldc2 co-1 A795C)，SEQID NO:37(ldc2 co-1 C332G/A785C)，SEQ ID NO:38(ldc2 co-1 C332G/ A795C)，SEQ IDNO:39(ldc2 co-1 A785C/A795C)及SEQ ID NO:40(ldc2 co-1 C332G/A785C/A795C)。

在某些实施方案中，所述第三多肽可包含如下、由如下组成或基本上由如下组成：大肠杆菌CadA(SEQ ID NO:6)、大肠杆菌LdcC(SEQ ID NO: 7)、铜绿假单胞菌Ldc2(SEQ IDNO:9)、其片段或其突变体。在某些实施方案中，赖氨酸脱羧酶可以是来自与大肠杆菌LdcC或CadA同源的物种的赖氨酸脱羧酶。例如，赖氨酸脱羧酶可以是宋内氏志贺菌(Shigellasonnei)CadA或肠道沙门氏菌(Salmonella enterica)赖氨酸脱羧酶、其片段或其突变体。

Ldc2的突变体的例子包括但不限于SEQ ID NO:11(Ldc2 S111C)、SEQ ID NO:16(Ldc2 N262T)、SEQ ID NO:17(Ldc2 K265N)、SEQ ID NO:18 (Ldc2 S111C/N262T)、SEQ IDNO:19(Ldc2 S111C/K265N)、SEQ ID NO:20 (Ldc2 N262T/K265N)及SEQ ID NO:21(Ldc2S111C/N262T/K265N)，Ldc2 的同源多肽，Ldc2 S111C的同源多肽(例如Ldc2 S111X)，Ldc2N262T的同源多肽(例如Ldc2 N262X’)，Ldc2 K265N的同源多肽(例如Ldc2 K265X’)， Ldc2S111C/N262T的同源多肽(例如Ldc2 S111X/N262X’)，Ldc2 S111C/K265N的同源多肽(例如Ldc2 S111X/K265X”)，Ldc2 N262T/K265N 的同源多肽(例如Ldc2 N262X’/K265X”)，及Ldc2S111C/N262T/K265N的同源多肽(例如Ldc2 S111X/N262X’/K265X”)。X是不是丝氨酸的任何氨基酸，X’是不是天冬酰胺的任何氨基酸，及X”是不是赖氨酸的任何氨基酸。如本文所用，同源多肽与所述多肽是至少大约90％、至少大约95％、至少大约97％、至少大约98％或至少大约99％同源的。当Ldc2突变体具有多个突变时，每个突变可以相同或不同。

在某些实施方案中，所述第三多肽是Ldc2的突变体，且编码所述第三多肽的相应第三多核苷酸是编码Ldc2的多核苷酸(例如ldc2(SEQ ID NO: 8))、密码子优化的ldc2(例如ldc2-co1,SEQ ID NO:10))，其含有一个或多个合适的核苷酸突变，所述突变相同或不同且独立地选自：在核苷酸位置 331处的突变，在核苷酸位置332处的突变，在核苷酸位置333处的突变，在核苷酸位置784处的突变，在核苷酸位置785处的突变，在核苷酸位置 786处的突变，在核苷酸位置793处的突变，在核苷酸位置794处的突变，及在核苷酸位置795处的突变。

在某些实施方案中，所述第三多肽是Ldc2的突变体，且编码所述第三多肽的相应第三多核苷酸是编码Ldc2的多核苷酸(例如ldc2(SEQ ID NO: 8))、密码子优化的ldc2(例如ldc2-co1,SEQ ID NO:10))，其含有一个或多个合适的核苷酸突变，所述突变相同或不同且独立地选自：在核苷酸位置 332处的突变，在核苷酸位置785处的突变，及在核苷酸位置795处的突变。在某些实例中，不限制地，在位置332处的核苷酸可以突变为G，在位置 785处的核苷酸可以突变为C，及在位置795处的核苷酸可以突变为T或C。

在某些实施方案中，赖氨酸脱羧酶多肽可包括在赖氨酸脱羧酶多肽的氨基酸序列中一个或多个氨基酸的缺失、取代、添加和/或插入，同时赖氨酸脱羧酶多肽的突变体提供与赖氨酸脱羧酶多肽基本相同的功能(即赖氨酸脱羧酶多肽的突变体与赖氨酸脱羧酶多肽相比具有大约80％或更高的赖氨酸脱羧酶活性，与赖氨酸脱羧酶多肽相比具有大约90％或更高的赖氨酸脱羧酶活性，与赖氨酸脱羧酶多肽相比具有大约95％或更高的赖氨酸脱羧酶活性，与赖氨酸脱羧酶多肽相比具有大约97％或更高的赖氨酸脱羧酶活性，与赖氨酸脱羧酶多肽相比具有大约99％或更高的赖氨酸脱羧酶活性，或与赖氨酸脱羧酶多肽相比具有大约100％或更高的赖氨酸脱羧酶活性)。

在某些实施方案中，所述第四多核苷酸编码第四多肽，所述第四多肽包含赖氨酸生物合成多肽、其片段或其突变体，由赖氨酸生物合成多肽、其片段或其突变体组成或基本上由赖氨酸生物合成多肽、其片段或其突变体组成。在某些实施方案中，所述第四多核苷酸可以是选自如下的基因： sucA，ppc，aspC，lysC，asd，dapA，dapB，dapD，argD，dapE，dapF，lysA，ddh，pntAB，cyoABE，gadAB，ybjE，gdhA，gltA，sucC，gadC，acnB， pflB，thrA，aceA，aceB，gltB，aceE，sdhA，murE，speE，speG，puuA， puuP，ygjG，其片段和其突变体。例如但不限制地，所述第四多核苷酸可包含表2中列出的任一大肠杆菌基因、其片段或其突变体的序列。

在某些实施方案中，所述第四多核苷酸可包含参与赖氨酸生物合成的、与表2中列出的任一基因同源的基因的序列。例如，所述第四多核苷酸可包含参与赖氨酸生物合成的、来自除了大肠杆菌之外的物种的基因的序列。在某些实施方案中，所述第四多核苷酸可包含解码来自变铅青链霉菌 (Streptomyces lividans)的天冬氨酸激酶LysC(GenBankEOY48571.1)的多核苷酸序列的序列。如本文所用，与大肠杆菌基因同源的基因具有与大肠杆菌基因的多核苷酸序列具有至少大约90％、至少大约95％、至少大约97％、至少大约98％或至少大约99％序列同源性的多核苷酸序列。

表2：参与赖氨酸生物合成的大肠杆菌蛋白/基因

在某些实施方案中，所述第四多肽包含赖氨酸生物合成多肽、其片段或其突变体，由赖氨酸生物合成多肽、其片段或其突变体组成或基本上由赖氨酸生物合成多肽、其片段或其突变体组成。在某些实施方案中，所述第四多肽可以选自SucA、Ppc、AspC、LysC、Asd、DapA、DapB、DapD、 ArgD、DapE、DapF、LysA、Ddh、PntAB、CyoABE、GadAB、YbjE、GdhA、 GltA、SucC、GadC、AcnB、PflB、ThrA、AceA、AceB、GltB、AceE、SdhA、 MurE、SpeE、SpeG、PuuA、PuuP和YgjG、其片段和其突变体。例如但不限制地，所述第四多肽可以是表2列出的任一蛋白。在某些实施方案中，所述第四多肽可含有一个或多个突变。例如，所述第四多肽可包含具有SEQID NO:26的序列的、具有如下突变的大肠杆菌天冬氨酸激酶III(LysC或 AKIII)多肽的序列：在位置318处的甲硫氨酸突变为异亮氨酸及在位置323 处的甘氨酸突变为天冬氨酸(LysC-1(M318I，G323D))。在某些实施方案中，所述第四多肽可包含具有SEQ ID NO:27的序列的、具有如下突变的大肠杆菌LysC多肽的序列：在位置344处的苏氨酸突变为甲硫氨酸及在位置 352处的苏氨酸突变为异亮氨酸(LysC-1(T344M，T352I))。

在某些实施方案中，所述第四多肽可包含参与赖氨酸生物合成的、与表2列出的任一蛋白同源的蛋白的序列。在某些实施方案中，所述第四多核苷酸可包含参与赖氨酸生物合成的、来自除了大肠杆菌之外的物种的蛋白的序列。例如，所述第四多肽可包含来自变铅青链霉菌的具有SEQ ID NO: 28的序列的天冬氨酸激酶蛋白LysC(GenBank EOY48571.1)的序列。如本文所用，与大肠杆菌蛋白同源的多肽具有与大肠杆菌蛋白的多肽序列具有至少大约90％、至少大约95％、至少大约97％、至少大约98％或至少大约99％序列同源性的多肽序列。

在某些实施方案中，参与赖氨酸生物合成的蛋白质是天冬氨酸激酶 (LysC)、二氢吡啶二羧酸合酶(DapA)、二氨基庚二酸脱羧酶(LysA)、其片段和/或突变体中的一个或多个。在某些实施方案中，参与赖氨酸生物合成的蛋白质来自埃希氏菌属。在某些实施方案中，参与赖氨酸生物合成的蛋白质来自大肠杆菌种。例如，所述蛋白质可以是大肠杆菌天冬氨酸激酶(LysC 或AKIII)蛋白(SEQ ID NO:3)，其由lysC基因的多核苷酸序列编码。在一些实施方案中，所述蛋白质可以是大肠杆菌二氢吡啶二羧酸合酶(DapA或 DHDPS)蛋白(SEQID NO:4)，其由dapA基因的多核苷酸序列编码。在某些实施方案中，所述蛋白质可以是大肠杆菌二氨基庚二酸脱羧酶(LysA)蛋白(SEQ ID NO:5)，其由lysA基因的多核苷酸序列编码。在某些实施方案中，参与赖氨酸生物合成的蛋白质是表2中列出的一种或多种蛋白质、其片段和/或突变体。

在某些实施方案中，所述第一表达质粒载体可用于产生本文所述的赖氨酸衍生产物。在某些实施方案中，赖氨酸衍生产物可以是本文所述尸胺。

在某些实施方案中，所述第二、第三和/或第四多核苷酸可以是重组或非天然存在的多核苷酸。在某些实施方案中，所述第二多核苷酸可以是 cDNA。在某些实施方案中，所述第二、第三和/或第四多核苷酸可以通过密码子优化获得以用于在特定微生物(例如大肠杆菌、蜂房哈夫尼菌或铜绿假单胞菌)中的最佳多肽表达。

本发明另一方面涉及转化体，其在宿主细胞中包含一个或多个第一表达质粒载体，所述载体是相同或不同的并且如本文所揭示。

所述第一表达质粒载体、宿主细胞、骨架质粒及对所述第一表达质粒载体的进一步添加与前文描述的相同。

如本文所用，转化体是已经通过在宿主细胞中导入一个或多个表达质粒载体而被改变的宿主细胞，其中所述一个或多个表达质粒载体是相同或不同的。在某些实施方案中，所述转化体通过在对表达质粒载体展示感受态的宿主细胞中通过转化导入所述质粒载体而获得。

在某些实施方案中，所述转化体用于生产本文所述的赖氨酸或赖氨酸衍生产物。在某些实施方案中，赖氨酸衍生产物可以是本文所述的尸胺。

本发明另一方面涉及转化体，其在宿主细胞中包含相同或不同的及如本文揭示的一个或多个第一表达质粒载体，所述转化体进一步包含如下、由如下组成或基本上由如下组成：

一个或多个第二表达质粒载体，其是相同或不同的，并且每个均包含如下多核苷酸、由如下多核苷酸组成或基本上由如下多核苷酸组成：

一个或多个第五多核苷酸，其是相同或不同的及独立地选自如下多核苷酸：第一多核苷酸，其编码第一多肽，所述第一多肽包含四环素外排泵多肽、其片段或其突变体，由四环素外排泵多肽、其片段或其突变体组成或基本上由四环素外排泵多肽、其片段或其突变体组成；第三多核苷酸，其编码第三多肽，所述第三多肽包含赖氨酸脱羧酶多肽、其片段或其突变体，由赖氨酸脱羧酶多肽、其片段或其突变体组成或基本上由赖氨酸脱羧酶多肽、其片段或其突变体组成；及第四多核苷酸，其编码第四多肽，所述第四多肽包含赖氨酸生物合成多肽、其片段或其突变体，由赖氨酸生物合成多肽、其片段或其突变体组成或基本上由赖氨酸生物合成多肽、其片段或其突变体组成；及

能载宿主细胞中自主复制的骨架质粒，

其中所述一个或多个第一和第二表达质粒载体用于生产赖氨酸或赖氨酸衍生产物。

所述第一表达质粒载体、第一多核苷酸及其片段和突变体、第一多肽及其片段和突变体、四环素外排泵多肽及其片段和突变体、第三多核苷酸及其片段和突变体、第三多肽及其片段和突变体、赖氨酸脱羧酶多肽及其片段和突变体、第四多核苷酸及其片段和突变体、第四多肽及其片段和突变体、赖氨酸生物合成多肽及其片段和突变体、宿主细胞、骨架质粒及对所述第一表达质粒载体的进一步添加与前文描述的相同。

在某些实施方案中，所述第二表达质粒载体进一步包含一个或多个第六多核苷酸，其是相同或不同的且每个均编码第六多肽，所述第六多肽包含抗生素抗性蛋白、其片段或其突变体，由抗生素抗性蛋白、其片段或其突变体组成或基本上由抗生素抗性蛋白、其片段或其突变体组成。在某些实施方案中，所述抗生素抗性蛋白可以是四环素抗性蛋白或土霉素抗性蛋白。在某些实施方案中，所述抗生素抗性蛋白可以选自包含如下的组中、由如下组成的组中或基本由如下组成的组中：OtrA、OtrB、OtrC、Tcr3、其片段和/或突变体。在某些实施方案中，OtrA可以得自分枝杆菌属或链霉菌属。在某些实施方案中，OtrB、OtrC和Tcr3可以来自链霉菌属。在某些实施方案中，所述第六多核苷酸可以选自包含如下的组中、由如下组成的组中或基本由如下组成的组中：otrA、otrB、otrC、tcr3、其片段或突变体。在某些实施方案中，otrA可以来自分枝杆菌属或链霉菌属。在某些实施方案中，otrB、otrC和tcr3可以来自链霉菌属。

在某些实施方案中，所述转化体可用于生产本文所述的赖氨酸或赖氨酸衍生产物。在某些实施方案中，赖氨酸衍生产物可以是本文所述尸胺。

本发明另一方面涉及突变宿主细胞，其包含如下多核苷酸、由如下多核苷酸组成或基本上由如下多核苷酸组成：

一个或多个第一多核苷酸，其是相同或不同的且整合进宿主细胞染色体中，其中所述一个或多个第一多核苷酸的每个均编码一个或多个第一多肽，所述多肽是相同或不同的且每个均包含四环素外排泵多肽、其片段或其突变体，由四环素外排泵多肽、其片段或其突变体组成或基本上由四环素外排泵多肽、其片段或其突变体组成。

所述第一多核苷酸及其片段和突变体、第一多肽及其片段和突变体、四环素外排泵多肽及其片段和突变体及宿主细胞与前文描述的相同。

在某些实施方案中，所述突变宿主细胞可用于生产本文所述的赖氨酸或赖氨酸衍生产物。在某些实施方案中，赖氨酸衍生产物可以是本文所述尸胺。

在某些实施方案中，根据PCR介导的基因置换方法可以将所述第一多核苷酸整合进宿主细胞染色体(见例如Datsenko,2000关于PCR介导的基因置换方法的综述，其全部内容并入本文作参考)。整合的染色体也可以通过其它合适方法产生。

整合进宿主细胞染色体中的一个或多个第一多核苷酸，其中所述一个或多个第一多核苷酸是相同或不同的并且所述一个或多个第一多核苷酸的每个均编码一个或多个第一多肽，所述多肽是相同或不同的并且每个均包含四环素外排泵多肽、其片段或其突变体，由四环素外排泵多肽、其片段或其突变体组成或基本上由四环素外排泵多肽、其片段或其突变体组成；

整合进宿主细胞染色体中的一个或多个第二多核苷酸，其中所述一个或多个第二多核苷酸是相同或不同的并且独立地选自：

编码第四多肽的第四多核苷酸，所述第四多肽包含赖氨酸生物合成多肽、其片段或其突变体，由赖氨酸生物合成多肽、其片段或其突变体组成或基本上由赖氨酸生物合成多肽、其片段或其突变体组成。

所述第一多核苷酸、第一多肽、四环素外排泵多肽及其片段和突变体、第二多核苷酸、第三多核苷酸、第三多肽、赖氨酸脱羧酶多肽及其片段和突变体、第四多核苷酸、第四多肽、赖氨酸生物合成多肽及其片段和突变体及宿主细胞与前文描述的相同。

在某些实施方案中，但存在多个所述第一多肽时，每个第一多肽可以相同或不同并且可以单独表达或作为融合蛋白表达。

在某些实施方案中，当存在多个所述第二多核苷酸时，每个第三多肽可以相同或不同且每个第四多肽可以相同或不同，所述第三和第四多肽可以单独表达或作为融合蛋白表达。

在某些实施方案中，根据PCR介导的基因置换方法可以将所述第一和第二多核苷酸整合进宿主细胞染色体(见例如Datsenko,2000关于PCR介导的基因置换方法的综述，其全部内容并入本文作参考)。整合的染色体也可以通过其它合适方法产生。

在某些实施方案中，所述突变宿主细胞可用于生产本文所述的赖氨酸或赖氨酸衍生产物。在某些实施方案中，赖氨酸衍生物可以是本文所述的尸胺。

本发明另一方面涉及一种生产赖氨酸的方法，包括：

获得本文所揭示的转化体和/或突变宿主细胞；

在有效表达赖氨酸的条件下培养所述转化体和/或突变宿主细胞；及

收获赖氨酸。

在某些实施方案中，所述转化体和/或突变宿主细胞可以是如本文所述的任何那些转化体和/或突变宿主细胞。例如，所述用于生产赖氨酸的转化体可以通过在宿主细胞中转化相同或不同的及如本文揭示的一个或多个表达质粒载体而获得。

所述转化体和/或突变宿主细胞可以使用含有碳源和非碳源营养源的培养基培养。碳源的例子包括但不限于糖(例如碳水化合物如葡萄糖和果糖)、油和/或脂肪、脂肪酸、和/或其衍生物。所述油和脂肪可含有具有10 或更多个碳原子的饱和和/或不饱和脂肪酸，例如椰子油、棕榈油、棕榈仁油等。所述脂肪酸可以是饱和和/或不饱和脂肪酸，例如己酸、辛酸、癸酸、月桂酸、油酸、棕榈酸、亚油酸、亚麻酸、肉豆蔻酸等。脂肪酸的衍生物的例子包括但不限于其酯及盐。非碳源的例子包括但不限于氮源、无机盐及其它有机营养源。

例如，培养基可含有被所述转化体和/或突变宿主细胞可同化的碳源，任选具有独立地选自如下的一种或多种其它来源：氮源、无机盐及另一有机营养源。在某些实施方案中，氮源的重量百分比是培养基的大约0.01％至大约0.1％。氮源的例子可包括氨、铵盐(例如氯化铵、硫酸铵和磷酸铵)、蛋白胨、肉膏、酵母提取物等。无机盐的例子包括但不限于磷酸二氢钾、磷酸氢二钾、磷酸镁、硫酸镁、氯化钠等。其它有机营养源的例子包括但不限于氨基酸(例如甘氨酸、丙氨酸、丝氨酸、苏氨酸和脯氨酸)、维生素(例如维生素B1、维生素B12和维生素C)等。

培养可以在任何温度下进行，只要细胞可以生长即可，优选在大约 20℃-大约40℃或大约35℃进行。培养时间可以是大约1天、大约2天、大约3天、大约4天、大约5天、大约6天、大约7天、大约8天、大约9 天或大约10天。

在一个实施方案中，将所述转化体和/或突变宿主细胞在含有肽、蛋白胨、维生素(例如维生素B)、微量元素(例如氮、硫、镁)和矿物质的培养基中培养。这种培养基的例子包括但不限于通常已知的Lysogeny broth(LB) 培养基，其包含悬浮于水(例如蒸馏水或去离子水)中的胰蛋白胨、酵母提取物和NaCl。

本发明另一方面涉及一种生产尸胺(1,5-戊二胺)的方法，包括如下步骤、由如下步骤组成或基本上由如下步骤组成：

1a)培养本文揭示的所述转化体和/或突变宿主细胞，

1b)使用得自步骤1a的培养物使赖氨酸脱羧而生产尸胺，及

1c)使用得自步骤1b的培养物提取和纯化尸胺。

在某些实施方案中，所述转化体和/或突变宿主细胞可以是本文所述的任何转化体和/或突变宿主细胞。

培养所述转化体可包括如前文所述培养转化体的步骤。

如本文所用，“使用得自步骤1a的培养物”可包括对得自步骤1a的培养物的进一步处理。例如，使用缓冲溶液稀释所述培养物，离心所述培养物以收集细胞，将所述细胞重悬浮于缓冲溶液中，或将所述细胞裂解为细胞裂解物，或/和从所述细胞裂解物中纯化赖氨酸脱羧酶。

在另一个实施方案中，所述方法的步骤1c进一步包括如下步骤：

1d)分离得自1b的反应的固体与液体成分；

1e)将得自步骤1d的液体成分的pH调节为大约14或更高；

1f)将得自步骤1e的液体成分除去水；及

1g)回收尸胺。

在步骤1d中，得自步骤1b的反应的固体与液体成分的分离可以通过常规离心和/或过滤实现。

在步骤1e中，步骤1d的液体成分的pH可以通过加入碱如NaOH而调节。NaOH可以以固体和/或溶液(例如水溶液)形式加入。

在步骤1f中，水可以通过在环境压力或在真空下蒸馏而除去。

在步骤1g中，尸胺可以通过在环境压力或在真空下蒸馏而回收。

本发明另一方面涉及根据本发明的方法制备的生物基尸胺。

如本文所用，“生物基”化合物是指在Standard ASTM D6866下所述化合物被认为是生物基的。

本发明另一方面涉及聚酰胺，其具有结构1所示结构，包括其立体异构体：

其中：

m＝4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21或22；

n＝4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21或22；

j＝大约100–大约1000000；及

所述聚酰胺从一个或多个碳数为m的二胺及一个或多个碳数为n的二羧酸制备，所述二胺和二羧酸中至少一个包含在Standard ASTM D6866下的生物基碳，每个二胺或二羧酸的m或n可以相同或不同。

在一个实施方案中，所述二胺是生物基尸胺，更优选是根据本发明方法制备的生物基尸胺。二羧酸的例子包括但不限于C₁₀二羧酸、C₁₁二羧酸、 C₁₂二羧酸、C₁₃二羧酸、C₁₄二羧酸、C₁₆二羧酸、C₁₈二羧酸及其任意组合。在某些实施方案中，所有或部分C_n二羧酸是生物基的。

在另一实施方案中，所述聚酰胺具有上述结构，其中：

所述聚酰胺通过生物基尸胺与一个或多个二羧酸反应形成，更优选所述生物基尸胺是根据本发明的方法制备的：

n＝4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22；

j＝大约100-大约1000000、大约1000-大约100000，或大约1000-大约10000；及

所述二羧酸包括在Standard ASTM D6866下的生物基碳。

本发明另一方面涉及一种制备本文揭示的聚酰胺的方法，包括根据本发明的方法制备生物基尸胺如Cm二胺。

在一个实施方案中，所述方法进一步包括制备一种或多种生物基Cn 二羧酸。

在另一个实施方案中，所述方法进一步包括通过将生物基尸胺与一种或多种生物基Cn二羧酸反应制备聚酰胺。

本发明另一方面涉及包含本文揭示的一种或多种聚酰胺的组合物。

在一个实施方案中，所述二胺是生物基尸胺，更优选根据本发明方法制备的生物基尸胺。二羧酸的例子包括但不限于C10二羧酸、C11二羧酸、 C12二羧酸、C13二羧酸、C14二羧酸、C16二羧酸、C18二羧酸、及其任意组合。在某些实施方案中，所有或部分Cn二羧酸是生物基的。

在另一个实施方案中，所述聚酰胺具有上述结构，其中：

所述聚酰胺是通过将生物基尸胺与一种或多种二羧酸反应而形成的，更优选所述生物基尸胺是根据本发明的方法制备的，

j＝大约100-大约1000000、大约1000-大约100000或大约1000-大约 10000；及

所述二羧酸包含在Standard ASTM D6866下的生物基碳。

本发明另一方面涉及一种制备1,5-二异氰酸戊烷的方法，包括：

2a)制备本文揭示的生物基尸胺；及

2b)将得自步骤2a的生物基尸胺转变为1,5-二异氰酸戊烷。

步骤2b可包括使用任何已知方法将二胺转变为异氰酸盐/酯。所述方法的一个实例是传统光气法，包括一步高温光气法(即将光气与二胺在高温下混合以获得异氰酸盐/酯)，改良的两步光气法，以及三光气法，其中使用三光气代替光气。还有不使用光气作为原材料的其它方法。所述方法的一个实例是己二胺羰基化，使用CO₂代替光气：将CO₂加入伯胺与有机碱的溶液中，然后将适量磷亲电子试剂加入反应溶液中开始放热脱水反应，获得异氰酸盐/酯。另一实例是氨基甲酸酯热分解法，其中伯胺被转变为氨基甲酸酯，然后加热氨基甲酸酯使其分解并产生异氰酸盐/酯。

用于氨基酸、多肽、碱基序列和核酸的缩写基于IUPAC-IUB Communication onBiochemical Nomenclature,Eur.J.Biochem.,138:9(1984), "Guideline for PreparingSpecifications Including Base Sequences and Amino Acid Sequences"(UnitedStates Patent and Trademark Office)中指定的缩写及本技术领域中常用的缩写。

除非上下文另外明确指出，在本说明书和权利要求书中，单词“包含”、“包括”等应理解为包含在内的含义(即“包括但不限于”之意)，与排除或穷举含义相反。单词“本文”、“上述”、“下文”、“前文”和相似词语，当在本申请书中使用时，是指就这个申请书整体而言而不是指任何特定部分。在上下文允许时，在上文“发明详述”中使用的单数或复数词语也可以分别包括其复数和单数形式。在提及两或更多个项目时使用的词语“或”和“和/或”涵盖该词语如下解释的所有项目：列出的任何项目、列出的所有项目，以及列出的项目的任意组合。

在大肠杆菌中，已知赖氨酸通过三个途径跨膜转运进细胞：一个途径通过赖氨酸特异性透性酶LysP介导，另一个途径通过也识别精氨酸和鸟氨酸的ArgT ABC转运蛋白介导，第三个途径通过赖氨酸/尸胺反向转运蛋白 CadB介导。细菌使用泵将抗生素转运出细胞及将营养素转运进细胞。四环素是终止蛋白质合成及抑制细胞生长的抗生素。许多革兰氏阳性和革兰氏阴性细菌已经进化为表达将四环素泵出细胞的蛋白质。迄今为止，已经在产生或不产生四环素的细菌中对61个四环素抗性基因进行了测序。在实验室中最常用的四环素外排泵是TetA，这是位于内膜并催化单阳离子镁-四环素螯合物从细胞内与细胞外质子交换的蛋白。

本发明揭示了使得大肠杆菌将赖氨酸和赖氨酸衍生产物转运穿过膜的机制。如下文实施例所示，四环素外排泵蛋白TetA的表达增加导致在大肠杆菌中赖氨酸的产生增多。此外，TetA在大肠杆菌和蜂房哈夫尼菌中的表达增加导致更高的尸胺产量，尸胺是衍生自赖氨酸的一种代谢物。因此，本文提供的数据表明四环素外排泵可用于增加赖氨酸和/或赖氨酸衍生产物的产量。

如下实施例用于举例说明本发明的不同实施方案。因此，讨论的特定实施方案不应解释为对本发明范围的限制。技术人员显然了解在不偏离本发明范围的前提下可以产生本发明的各种等价、改变和修改，及理解这种等价实施方案包含在本发明范围内。此外，文中引用的所有参考文献均以其全部内容并入本文作参考，就如同其在本文示出一样。

实施例

实施例1：构建含有编码四环素外排泵的质粒载体的菌株

使用PCR引物tetA-F和tetA-R从大肠杆菌克隆载体pBR322扩增编码四环素外排泵TetA(SEQ ID NO:2)的大肠杆菌基因tetA(SEQ ID NO:1)(图 1)。扩增的DNA用限制酶SacI和XbaI消化，连接进pUC18质粒载体和 pCIB10质粒载体中，分别产生pCIB17和pCIB20(图2)。将pCIB17转化进大肠杆菌和蜂房哈夫尼菌中，分别产生菌株CIB17-EC和CIB17-HA(图2)。

实施例2：构建含有编码野生型CadA或无活性CadA突变体的质粒载体的菌株

通过将野生型cadA克隆进pUC18产生阳性对照pCIB60构建含有编码赖氨酸脱羧酶CadA(SEQ ID NO:6)的野生型大肠杆菌cadA的质粒载体(图 2)。通过导入不成熟终止密码子截短cadA的C末端，导致在CadA的氨基酸位置566处的突变及截短的CadA蛋白(CadA(aa1-565)(其中“aa”是氨基酸)(SEQ ID NO:33)而构建含有无活性突变体cadA的质粒载体。引物cadAm1-F和cadAm1-R(图1)用于扩增cadA的片段。将扩增的突变体cadA 和pCIB60质粒用限制酶XhoI和SphI消化。然后将消化的突变体cadA连接进消化的pCIB60质粒载体中，用突变体cadA置换野生型cadA。表达所述截短的cadA基因的质粒载体命名为pCIB63(图2)。将pCIB60转化进大肠杆菌和蜂房哈夫尼菌中，分别产生菌株CIB60-EC和CIB60-HA。将 pCIB63转化进大肠杆菌和蜂房哈夫尼菌中，分别产生菌株CIB63-EC和 CIB63-HA(图2)。

实施例3：表达重组四环素外排泵的大肠杆菌和蜂房哈夫尼菌的尸胺生产

将每个菌株的单一菌落在具有氨苄青霉素(100μg/mL)的LB培养基的 2.5mL培养物中在29℃生长过夜。将用空白载体pUC18转化的大肠杆菌和蜂房哈夫尼菌用作阴性对照。在第二天，为2.5mL基本培养基补充氨苄青霉素(100μg/mL)，及赖氨酸-HCl和PLP至终浓度分别为20g/L和0.1mM。将每个培养物在37℃保温5小时和21小时。在第5小时和21小时时间点，从每个培养物中取1mL样品，使用核磁共振法(NMR)定量尸胺产量。表达突变体CadA(aa1-565)、野生型CadA或TetA的菌株在这两个时间点的尸胺生产示于表3。

表3：表达CadA或TetA的大肠杆菌和蜂房哈夫尼菌的尸胺生产

如表3所示，与阴性对照(无酶)和突变体CadA(aa1-565)相比，TetA在大肠杆菌中的表达获得更高产量的尸胺(5小时：5.14g/kg，对比分别0.20 g/kg和2.99g/kg；21小时：11.1g/kg，对比分别为N.A.和3.78g/kg)。同样，与阴性对照(无酶)和突变体CadA(aa1-565)相比，TetA在蜂房哈夫尼菌中的表达获得更高尸胺产量(5小时：9.28g/kg，对比分别为1.27g/kg和0.24 g/kg)。

实施例4：共表达重组赖氨酸脱羧酶和重组四环素外排泵的大肠杆菌菌株的尸胺生产

将tetA基因克隆进pCIB60质粒载体中cadA基因之后。首先，使用引物tetA-F2和tetA-R2从pBR322扩增tetA(图1)。接着，将扩增的PCR产物和pCIB60质粒载体用限制酶XbaI和HindIII消化，及将产物连接在一起产生pCIB77。将pCIB77转化进大肠杆菌MG1655 K12中，产生菌株CIB77 (图2)。

将每个菌株的单一菌落在具有氨苄青霉素(100μg/mL)的LB培养基的 2.5mL培养物中在29℃生长过夜。第二天，为基本培养基补充氨苄青霉素 (100μg/mL)，及赖氨酸-HCl和PLP至终浓度分别为20g/L和0.1mM。将每个培养物在37℃保温3小时和6小时。在第3小时和6小时时间点取1 mL样品，使用NMR定量尸胺产量。在这两个时间点表达CadA或TetA和CadA的菌株的尸胺生产在表4中示出。

表4：表达CadA或CadA和TetA的大肠杆菌的尸胺生产

表4示出当与仅表达CadA相比，在大肠杆菌中TetA与CadA一起表达获得更高的尸胺产量(3小时：5.54g/kg，对比为4.38g/kg；6小时：8.06 g/kg，对比为6.20g/kg)。

实施例5：共表达重组四环素外排泵和赖氨酸生物合成途径的重组蛋白(LysC、DapA、LysA)的菌株的赖氨酸生产

来自大肠杆菌的三个基因lysC、dapA和lysA编码参与大肠杆菌赖氨酸生物合成途径的蛋白质：天冬氨酸激酶(LysC或AKIII，由lysC编码)、二氢吡啶二羧酸合酶(DapA或DHDPS，由dapA编码)，及二氨基庚二酸脱羧酶(LysA，由lysA编码)。将这三个基因克隆进表达载体中并将三种蛋白质 LysC(SEQ ID NO:3)、DapA(SEQ ID NO:4)和LysA(SEQ ID NO:5)在大肠杆菌中过表达。使用引物lysC-F和lysC-R从大肠杆菌MG1655 K12基因组 DNA扩增基因lysC(图1)，扩增的片段用SacI和BamHI消化，并连接进 pUC18中产生pCIB7(图2)。使用引物dapA-F和dapA-R从大肠杆菌 MG1655 K12基因组DNA扩增基因dapA(图1)，扩增的片段用BamHI和 XbaI消化，并连接进pCIB7中产生pCIB8(图2)。使用引物lysA-F和lysA-R 从大肠杆菌MG1655 K12基因组DNA扩增基因lysA(图1)，扩增的片段用 XbaI和SalI消化，并连接进pCIB8中产生pCIB9。使用引物lysC-F和lysA-R 从pCIB9扩增三基因操纵子(图1)。扩增的产物用SacI和SalI消化，将消化的片段连接进pCIB10中产生pCIB32(图2)。将pCIB32转化进大肠杆菌中产生菌株CIB32。将CIB32用含有tetA基因的质粒pCIB20进一步转化。

将单一菌落在37℃在含有4％葡萄糖、0.1％KH₂PO₄、0.1％MgSO₄、 1.6％(NH₄)₂SO₄、0.001％FeSO₄、0.001％MnSO₄、0.2％酵母提取物、0.05％ L-甲硫氨酸、0.01％L-苏氨酸、0.005％L-异亮氨酸、氨苄青霉素(100μg/mL) 和四环素(10μg/mL)的3mL培养基中生长过夜。第二天，将每个培养物接种于具有氨苄青霉素(100μg/mL)和四环素(10μg/mL)的100mL新鲜培养基中，在37℃生长21小时，确定每个培养物中在该时间点的赖氨酸浓度(表 5)。

表5：表达TetA和赖氨酸生物合成途径蛋白质的大肠杆菌中赖氨酸的生产

如表5所示，TetA与参与赖氨酸生物合成的蛋白质的表达(即CIB32+ pCIB20)与参与赖氨酸生物合成途径的蛋白质表达而无TetA表达(即CIB32) 相比获得更高的赖氨酸产量(对比为2.46mg/g与1.47mg/g)。

实施例6：共表达重组四环素外排泵和赖氨酸生物合成途径的重组蛋白质(LysC、DapA、LysA、DapB、DapD、AspC、Asd)的菌株的赖氨酸生产

接下来，增强参与大肠杆菌的赖氨酸生物合成途径的四个另外的基因 asd、dapB、dapD和aspC的表达。这些基因编码如下酶：天冬氨酸半醛脱氢酶(Asd(SEQ ID NO:22)，由asd编码)，二氢吡啶二羧酸还原酶(DapB或 DHDPR(SEQ ID NO:23)，由dapB编码)，四氢吡啶二羧酸琥珀酰酶(DapD (SEQ ID NO:24)，由dapD编码)，及天冬氨酸转氨酶(AspC(SEQ IDNO: 25)，由aspC编码)。使用引物asd-F和asd-R从大肠杆菌MG1655 K12基因组DNA扩增基因asd(图1)，扩增的片段用SacI和BamHI消化，并连接进pUC18中产生pCIB12(图2)。使用引物dapB-F和dapB-R从大肠杆菌 MG1655 K12基因组DNA扩增基因dapB(图1)，扩增的片段用BamHI和 XbaI消化，并连接进pCIB12中产生pCIB13(图2)。使用引物dapD-F和 dapD-R从大肠杆菌MG1655 K12基因组DNA扩增基因dapD(图1)，扩增的片段用XbaI和SalI消化，并连接进pCIB13中产生pCIB14(图2)。相似地，使用引物aspC-F和aspC-R从大肠杆菌MG1655 K12基因组DNA扩增基因aspC(图1)，扩增的片段用XbaI和SalI消化，并连接进pCIB13中产生pCIB31(图2)。使用引物tetA-F3和tetA-R3从pCIB20扩增基因tetA(图 1)，扩增的片段用XhoI和SphI消化并连接进pCIB14和pCIB31中分别产生质粒pCIB15和pCIB59(图2)。将pCIB59和pCIB15均转化进菌株CIB32 中。

单一菌落在37℃在含有4％葡萄糖、0.1％KH₂PO₄、0.1％MgSO₄、1.6％ (NH₄)₂SO₄、0.001％FeSO₄、0.001％MnSO₄、0.2％酵母提取物、0.05％L- 甲硫氨酸、0.01％L-苏氨酸、0.005％L-异亮氨酸、氨苄青霉素(100μg/mL) 和四环素(10μg/mL)的3mL培养基中生长过夜。第二天，将每个培养物接种于具有氨苄青霉素(100μg/mL)和四环素(10μg/mL)的100mL新鲜培养基中，在37℃生长21小时，确定在该时间点每个培养物中赖氨酸的浓度(表 6)。

表6：表达TetA和赖氨酸生物合成途径的蛋白质的大肠杆菌中的赖氨酸生产

如表6所示，TetA与参与赖氨酸生物合成途径的蛋白质一起表达(即 CIB32+pCIB20，CIB32+pCIB15和CIB32+pCIB59)与参与赖氨酸生物合成途径的蛋白质表达而无TetA表达(即CIB32)相比，获得更高产量的赖氨酸(对比为1.03mg/g、1.16mg/g和1.14mg/g与0.61mg/g)。

实施例7：共表达重组四环素外排泵与不同天冬氨酸激酶的菌株的赖氨酸生产

表达不同天冬氨酸激酶以增加赖氨酸生产。选择两对突变，该突变使得大肠杆菌天冬氨酸激酶III(LysC或AKIII，由lysC编码，SEQ ID NO:3) 对赖氨酸具有增加的反馈抗性。编码第一突变体LysC-1(M318I，G323D) (SEQ.ID NO:26)的基因使用引物318-F、318-R、323-F、323-R构建(图1)。编码第二突变体LysC-2(T344M，T352I)(SEQ.ID NO:27)的基因使用引物 344-F、344-R、352-F、352-R构建(图1)。将编码LysC-1(M318I，G323D) 和LysC-2(T344M，T352I)的基因克隆进pCIB32中并置换野生型大肠杆菌天冬氨酸激酶LysC，分别产生质粒pCIB43和pCIB44(图2)。先前提示但未证实来自能产生聚赖氨酸的链霉菌属菌株的天冬氨酸激酶与大肠杆菌天冬氨酸激酶相比，对于赖氨酸的反馈抗性更强。因此，将来自变铅青链霉菌的天冬氨酸激酶基因进行密码子优化、合成并克隆以代替pCIB32中野生型lysC，使用引物SlysC-F和SlysC-R产生质粒CIB55(图1)。所得表达的天冬氨酸激酶蛋白命名为S-LysC(SEQ ID NO:28)。将pCIB43、pCIB44和 pCIB55转化进大肠杆菌MG1655中，分别产生菌株CIB43、CIB44和CIB55 (图2)。将pCIB59也转化进CIB55中。

将单一菌落在37℃在含有4％葡萄糖、0.1％KH₂PO₄、0.1％MgSO₄、 1.6％(NH₄)₂SO₄、0.001％FeSO₄、0.001％MnSO₄、0.2％酵母提取物、0.05％ L-甲硫氨酸、0.01％L-苏氨酸、0.005％L-异亮氨酸、氨苄青霉素(100μg/mL) 和四环素(10μg/mL)的3mL培养基中生长过夜。第二天，将每个培养物接种于具有氨苄青霉素(在CIB55+pCIB59情况中具有氨苄青霉素和四环素) 的100mL新鲜培养基中，生长63小时，确定在该时间点每个培养物中赖氨酸的浓度。

表7：表达TetA和赖氨酸生物合成途径的蛋白质的大肠杆菌中的赖氨酸生产

实施例8：大肠杆菌中赖氨酸的生产

将由基因S-lysC、dapA、lysA、asd、dapB和aspC组成的两个赖氨酸操纵子组合在一个载体中。使用引物SAL-F和SAL-R扩增由基因S-lysC、 dapA和lysA组成的pCIB55的操纵子(图1)。使用引物ABC-F和ABC-R扩增由基因asd、dapB和aspC组成的pCIB31的操纵子(图1)。使用引物ABC-F 和ABCT-R扩增由基因asd、dapB和aspC及tetA基因组成的pCIB59的操纵子(图1)。将产物用限制酶ApaI和KpnI消化。连接pCIB55和pCIB31 的消化产物形成pCIB92，连接pCIB55和pCIB59的消化产物形成pCIB103 (图2)。

大肠杆菌用作宿主生产赖氨酸。将质粒pUC18、pCIB92和pCIB103 独立地与pCIB110共转化进大肠杆菌中。将每个转化的两个菌落在37℃在补充氨苄青霉素(100mg/L)的3mL的LB培养基中过夜生长18小时。第二天，使用NMR分析每个培养物的尸胺。赖氨酸生产在表8中示出。

表8：表达TetA和赖氨酸生物合成途径的蛋白质的大肠杆菌中尸胺的生产

如表8所示，Tet与参与赖氨酸生物合成途径的蛋白质一起表达(即 pCIB103)与参与赖氨酸生物合成途径的蛋白质表达而无TetA表达(即 pCIB92)相比，获得更高产量的尸胺(1.70±0.01g/kg对比1.62±0.02g/kg)。

实施例9：蜂房哈夫尼菌中尸胺的生产

蜂房哈夫尼菌用作宿主生产尸胺，在细胞中不加入任何额外的赖氨酸。将质粒pUC18、pCIB92和p103独立地转化进蜂房哈夫尼菌中。将每个转化的两个菌落在37℃在补充氨苄青霉素(100mg/L)的3mL LB培养基中过夜生长18小时。第二天，使用MR确定每个培养物的尸胺。尸胺生产在表8中示出。

表9：表达TetA和赖氨酸生物合成途径的蛋白质的蜂房哈夫尼菌中尸胺的生产

如表8所示，TetA与参与赖氨酸生物合成途径的蛋白质一起表达(即 pCIB103)与参与赖氨酸生物合成途径的蛋白质表达而无TetA表达(即 pCIB92)相比，获得更高产量的尸胺(0.36g/kg对比0.11g/kg)。

实施例10：在突变体TetA中增加的尸胺生产

全长TetA蛋白的长度是396个氨基酸。在tetA多核苷酸序列中导入 Amber突变(终止密码子)以截短TetA，以确定完整的TetA蛋白质是否为增加尸胺生产所必需。产生两个截短形式的TetA蛋白。第一截短形式TetA (aa1-185)通过使用引物tetAm1-F、tetAm1-R、tetA-F2和tetA-R2进行重叠延伸PCR(SOEing PCR)剪接产生(图1)。这样在tetA多核苷酸序列(tetA(nt 1-558)，其中“nt”是核苷酸，SEQ ID NO:29)的核苷酸555后面插入一个 T，产生不成熟终止密码子，导致在氨基酸186处的突变及具有氨基酸1-185 的截短形式TetA(SEQ ID NO:30)。将扩增的产物使用限制酶XbaI和HindIII 克隆进pCIB60(含有CadA)中，将产物连接在一起产生pCIB97(图2)。第二截短形式的TetA(aa1-96)使用引物tetAm2-F、tetAm2-R、tetA-F2和tetA-R2 通过SOEing PCR产生(图1)。这样在tetA多核苷酸序列(tetA(nt 1-291)，SEQ ID NO:31)中核苷酸289后插入两个核苷酸(AA)以导入不成熟终止密码子，导致在氨基酸97处的突变及具有氨基酸1-96的截短形式的TetA(SEQ ID NO:32)。将扩增的产物克隆进pCIB60中产生pCIB98。将质粒pCIB97和 pCIB98转化进大肠杆菌MG1655中，分别产生CIB97和CIB98(图2)。

将每个菌株的单一菌落在具有氨苄青霉素(100μg/mL)的LB培养基的 2mL培养物中在29℃生长过夜。第二天，在0.9mL培养物中加入100μL 赖氨酸-HCL和5μL PLP至终浓度分别为40g/L和0.1mM。将每个培养物在37℃保温2小时。使用NMR定量每个样品的尸胺生产(表9)。

表9：表达TetA和赖氨酸生物合成途径的蛋白质的大肠杆菌中尸胺的生产

如表9所示，与单独的CadA表达相比，TetA与CadA及截短形式TetA 与CadA的表达获得增加的尸胺生产(2.0g/kg(CIB77)、1.8g/kg(CIB97)和 2.6g/kg(CIB98)与1.1g/kg(CIB60)对比)。两种TetA突变体(TetA(aa1-185) 和TetA(aa1-96))的表达产生的尸胺的量与表达野生型TetA(2.0g/kg)产生的尸胺的量相似，表达TetA(aa1-96)的细胞产生最多的尸胺(2.6g/kg)。

序列表

SEQ ID NO:1(大肠杆菌tetA多核苷酸序列)

ATGAAATCTAACAATGCGCTCATCGTCATCCTCGGCACCGTCACCCTGGATGCTGTAGGCATAGGCTTGGT TATGCCGGTACTGCCGGGCCTCTTGCGGGATATCGTCCATTCCGACAGCATCGCCAGTCACTATGGCGTGCTGCTAGCGCTATATGCGTTGATGCAATTTCTATGCGCACCCGTTCTCGGAGCACTGTCCGACCGCTTTGGC CGCCGCCCAGTCCTGCTCGCTTCGCTACTTGGAGCCACTATCGACTACGCGATCATGGCGACCACACCCGT CCTGTGGATCCTCTACGCCGGACGCATCGTGGCCGGCATCACCGGCGCCACAGGTGCGGTTGCTGGCGCCT ATATCGCCGACATCACCGATGGGGAAGATCGGGCTCGCCACTTCGGGCTCATGAGCGCTTGTTTCGGCGTG GGTATGGTGGCAGGCCCCGTGGCCGGGGGACTGTTGGGCGCCATCTCCTTGCATGCACCATTCCTTGCGGC GGCGGTGCTCAACGGCCTCAACCTACTACTGGGCTGCTTCCTAATGCAGGAGTCGCATAAGGGAGAGCGTC GACCGATGCCCTTGAGAGCCTTCAACCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGCC GCACTTATGACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTGGGTCATTTTCGG CGAGGACCGCTTTCGCTGGAGCGCGACGATGATCGGCCTGTCGCTTGCGGTATTCGGAATCTTGCACGCCC TCGCTCAAGCCTTCGTCACTGGTCCCGCCACCAAACGTTTCGGCGAGAAGCAGGCCATTATCGCCGGCATG GCGGCCGACGCGCTGGGCTACGTCTTGCTGGCGTTCGCGACGCGAGGCTGGATGGCCTTCCCCATTATGAT TCTTCTCGCTTCCGGCGGCATCGGGATGCCCGCGTTGCAGGCCATGCTGTCCAGGCAGGTAGATGACGACC ATCAGGGACAGCTTCAAGGATCGCTCGCGGCTCTTACCAGCCTAACTTCGATCATTGGACCGCTGATCGTC ACGGCGATTTATGCCGCCTCGGCGAGCACATGGAACGGGTTGGCATGGATTGTAGGCGCCGCCCTATACCT TGTCTGCCTCCCCGCGTTGCGTCGCGGTGCATGGAGCCGGGCCACCTCGACCTGA

SEQ ID NO:2(大肠杆菌TetA多肽序列，由tetA基因编码)

MKSNNALIVILGTVTLDAVGIGLVMPVLPGLLRDIVHSDSIASHYGVLLALYALMQFLCAPVLGALSDRFG RRPVLLASLLGATIDYAIMATTPVLWILYAGRIVAGITGATGAVAGAYIADITDGEDRARHFGLMSACFGVGMVAGPVAGGLLGAISLHAPFLAAAVLNGLNLLLGCFLMQESHKGERRPMPLRAFNPVSSFRWARGMTIVA ALMTVFFIMQLVGQVPAALWVIFGEDRFRWSATMIGLSLAVFGILHALAQAFVTGPATKRFGEKQAIIAGM AADALGYVLLAFATRGWMAFPIMILLASGGIGMPALQAMLSRQVDDDHQGQLQGSLAALTSLTSIIGPLIV TAIYAASASTWNGLAWIVGAALYLVCLPALRRGAWSRATST

SEQ ID NO:3(大肠杆菌天冬氨酸激酶III多肽序列，LysC，由lysC基因编码)

MSEIVVSKFGGTSVADFDAMNRSADIVLSDANVRLVVLSASAGITNLLVALAEGLEPGERFEKLDAIRNIQ FAILERLRYPNVIREEIERLLENITVLAEAAALATSPALTDELVSHGELMSTLLFVEILRERDVQAQWFDVRKVMRTNDRFGRAEPDIAALAELAALQLLPRLNEGLVITQGFIGSENKGRTTTLGRGGSDYTAALLAEALH ASRVDIWTDVPGIYTTDPRVVSAAKRIDEIAFAEAAEMATFGAKVLHPATLLPAVRSDIPVFVGSSKDPRA GGTLVCNKTENPPLFRALALRRNQTLLTLHSLNMLHSRGFLAEVFGILARHNISVDLITTSEVSVALTLDT TGSTSTGDTLLTQSLLMELSALCRVEVEEGLALVALIGNDLSKACGVGKEVFGVLEPFNIRMICYGASSHNLCFLVPGEDAEQVVQKLHSNLFE

SEQ ID NO:4(大肠杆菌二氢吡啶二羧酸合酶多肽序列，DapA，由dapA基因编码)

MFTGSIVAIVTPMDEKGNVCRASLKKLIDYHVASGTSAIVSVGTTGESATLNHDEHADVVMMTLDLADGRI PVIAGTGANATAEAISLTQRFNDSGIVGCLTVTPYYNRPSQEGLYQHFKAIAEHTDLPQILYNVPSRTGCDLLPETVGRLAKVKNIIGIKEATGNLTRVNQIKELVSDDFVLLSGDDASALDFMQLGGHGVISVTANVAARD MAQMCKLAAEGHFAEARVINQRLMPLHNKLFVEPNPIPVKWACKELGLVATDTLRLPMTPITDSGRETVRA ALKHAGLL

SEQ ID NO:5(大肠杆菌内消旋-二氨基庚二酸脱羧酶多肽序列，LysA，由lysA基因编码) MPHSLFSTDTDLTAENLLRLPAEFGCPVWVYDAQIIRRQIAALKQFDVVRFAQKACSNIHILRLMREQGVKVDSVSLGEIERALAAGYNPQTHPDDIVFTADVIDQATLERVSELQIPVNAGSVDMLDQLGQVSPGHRVWLR VNPGFGHGHSQKTNTGGENSKHGIWYTDLPAALDVIQRHHLQLVGIHMHIGSGVDYAHLEQVCGAMVRQVI EFGQDLQAISAGGGLSVPYQQGEEAVDTEHYYGLWNAAREQIARHLGHPVKLEIEPGRFLVAQSGVLITQV RSVKQMGSRHFVLVDAGFNDLMRPAMYGSYHHISALAADGRSLEHAPTVETVVAGPLCESGDVFTQQEGGN VETRALPEVKAGDYLVLHDTGAYGASMSSNYNSRPLLPEVLFDNGQARLIRRRQTIEELLALELL

SEQ ID NO:6(大肠杆菌CadA多肽序列，由cadA基因编码)

MNVIAILNHMGVYFKEEPIRELHRALERLNFQIVYPNDRDDLLKLIENNARLCGVIFDWDKYNLELCEEIS KMNENLPLYAFANTYSTLDVSLNDLRLQISFFEYALGAAEDIANKIKQTTDEYINTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSLFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEQYIARVFNADRS YMVTNGTSTANKIVGMYSAPAGSTILIDRNCHKSLTHLMMMSDVTPIYFRPTRNAYGILGGIPQSEFQHAT IAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVE GKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIN GSIERAIKFRKEIKRLRTESDGWFFDVWQPDHIDTTECWPLRSDSTWHGFKNIDNEHMYLDPIKVTLLTPG MEKDGTMSDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLRVKN MLPSLYREDPEFYENMRIQELAQNIHKLIVHHNLPDLMYRAFEVLPTMVMTPYAAFQKELHGMTEEVYLDE MVGRINANMILPYPPGVPLVMPGEMITEESRPVLEFLQMLCEIGAHYPGFETDIHGAYRQA DGRYTVKVLKEESKK

SEQ ID NO:7(大肠杆菌LdcC多肽序列(由ldcC基因编码))

MNIIAIMGPHGVFYKDEPIKELESALVAQGFQIIWPQNSVDLLKFIEHNPRICGVIFDWDEYSLDLCSDIN QLNEYLPLYAFINTHSTMDVSVQDMRMALWFFEYALGQAEDIAIRMRQYTDEYLDNITPPFTKALFTYVKERKYTFCTPGHMGGTAYQKSPVGCLFYDFFGGNTLKADVSISVTELGSLLDHTGPHLEAEEYIARTFGAEQS YIVTNGTSTSNKIVGMYAAPSGSTLLIDRNCHKSLAHLLMMNDVVPVWLKPTRNALGILGGIPRREFTRDS IEEKVAATTQAQWPVHAVITNSTYDGLLYNTDWIKQTLDVPSIHFDSAWVPYTHFHPIYQGKSGMSGERVA GKVIFETQSTHKMLAALSQASLIHIKGEYDEEAFNEAFMMHTTTSPSYPIVASVETAAAMLRGNPGKRLIN RSVERALHFRKEVQRLREESDGWFFDIWQPPQVDEAECWPVAPGEQWHGFNDADADHMFLDPVKVTILTPG MDEQGNMSEEGIPAALVAKFLDERGIVVEKTGPYNLLFLFSIGIDKTKAMGLLRGLTEFKRSYDLNLRIKN MLPDLYAEDPDFYRNMRIQDLAQGIHKLIRKHDLPGLMLRAFDTLPEMIMTPHQAWQRQIKGEVETIALEQ LVGRVSANMILPYPPGVPLLMPGEMLTKESRTVLDFLLMLCSVGQHYPGFETDIHGAKQDEDGVYRVRVLK MAG

SEQ ID NO:8(铜绿假单胞菌ldc2多核苷酸序列)

ATGTATAAAGACCTCAAATTTCCCGTCCTCATCGTCCATCGCGACATCAAGGCCGACACCGTTGCCGGCGA ACGCGTGCGGGGCATCGCCCACGAACTGGAGCAGGACGGCTTCAGCATTCTCTCCACCGCCAGCTCCGCCGAGGGGCGCATCGTCGCTTCCACCCACCACGGCCTGGCCTGCATTCTGGTCGCCGCCGAAGGTGCCGGGGAA AACCAGCGCCTGCTGCAGGATGTGGTCGAACTGATCCGCGTGGCCCGCGTGCGGGCGCCGCAATTGCCGAT CTTCGCCCTCGGCGAGCAGGTGACCATCGAGAACGCGCCGGCCGAGTCCATGGCCGACCTGCACCAGTTGC GCGGCATCCTCTACCTGTTCGAAGACACCGTGCCGTTCCTCGCCCGCCAGGTCGCCCGGGCGGCGCGCAAC TACCTGGCCGGGCTGCTGCCGCCATTCTTCCGTGCGCTGGTCGAGCACACCGCGCAGTCCAACTATTCCTG GCATACGCCGGGCCACGGCGGCGGTGTCGCCTATCGCAAGAGTCCGGTGGGACAGGCGTTCCACCAGTTCT TCGGGGAGAACACGCTGCGTTCCGACCTGTCGGTCTCGGTCCCCGAGCTGGGATCGCTGCTCGACCATACC GGCCCCCTGGCCGAGGCCGAGGACCGTGCCGCGCGCAATTTCGGCGCCGACCATACCTTCTTCGTGATCAA TGGCACTTCCACCGCGAACAAGATCGTCTGGCACTCCATGGTCGGTCGCGAAGACCTGGTGCTGGTGGACC GCAACTGCCACAAGTCGATCCTCCACTCGATCATCATGACCGGGGCGATACCGCTCTACCTGACTCCGGAA CGCAACGAACTGGGGATCATCGGGCCGATCCCGCTGAGCGAATTCAGCAAGCAGTCGATCGCCGCGAAGAT CGCCGCCAGCCCGCTGGCGCGCGGCCGCGAGCCGAAGGTGAAGCTGGCGGTGGTGACTAACTCCACCTACG ACGGCCTGTGCTACAACGCCGAGCTGATCAAGCAGACCCTCGGCGACAGCGTCGAGGTGTTGCACTTCGAC GAGGCTTGGTACGCCTATGCCGCGTTCCACGAGTTCTACGACGGACGCTATGGCATGGGCACCTCGCGCAG CGAGGAGGGACCCCTGGTGTTCGCCACCCACTCCACGCACAAGATGCTCGCCGCCTTCAGCCAGGCCTCGA TGATCCACGTGCAGGATGGCGGGACCCGGAAGCTGGACGTGGCGCGCTTCAACGAAGCCTTCATGATGCAC ATCTCGACCTCGCCGCAGTACGGCATCATCGCTTCGCTGGACGTGGCTTCGGCGATGATGGAAGGGCCCGC CGGGCGTTCGCTGATCCAGGAGACCTTCGACGAGGCCCTCAGCTTCCGCCGGGCCCTGGCCAACGTACGGC AGAACCTGGACCGGAACGACTGGTGGTTCGGCGTCTGGCAGCCGGAGCAGGTGGAGGGCACCGACCAGGTCGGCACCCATGACTGGGTGCTGGAGCCGAGCGCCGACTGGCACGGCTTCGGCGATATCGCCGAAGACTACGT GCTGCTCGACCCGATCAAGGTCACCCTGACCACCCCGGGCCTGAGCGCTGGCGGCAAGCTCAGCGAGCAGG GGATTCCGGCCGCCATCGTCAGCCGCTTCCTCTGGGAGCGCGGGCTGGTGGTGGAGAAAACCGGTCTCTAC TCCTTCCTGGTGCTGTTCTCGATGGGCATCACCAAGGGCAAGTGGAGCACCCTGGTCACCGAACTGCTCGA ATTCAAGCGCTGTTACGACGCCAACCTGCCGCTGCTTGACGTCTTGCCCTCCGTGGCCCAGGCCGGCGGCA AGCGCTACAACGGAGTGGGCCTGCGCGACCTCAGCGACGCCATGCACGCCAGCTACCGCGACAACGCCACG GCGAAGGCCATGAAGCGCATGTACACGGTGCTGCCGGAGGTCGCGATGCGGCCGTCCGAGGCCTACGACAA GCTGGTGCGCGGCGAGGTCGAGGCGGTACCGATCGCTCGGTTGGAAGGGCGCATCGCGGCCGTCATGCTGG TACCCTATCCGCCGGGTATCCCGCTGATCATGCCGGGTGAGCGCTTCACCGAGGCGACCCGCTCGATCCTC GACTATCTCGAGTTCGCGCGGACCTTCGAGCGCGCCTTCCCTGGTTTCGACTCCGATGTGCATGGCCTGCA GCATCAGGACGGACCGTCCGGGCGCTGCTATACCGTTGAATGCATAAAGGAATGA

SEQ ID NO:9(铜绿假单胞菌Ldc2多肽序列(由ldc2基因编码))

MYKDLKFPVLIVHRDIKADTVAGERVRGIAHELEQDGFSILSTASSAEGRIVASTHHGLACILVAAEGAGE NQRLLQDVVELIRVARVRAPQLPIFALGEQVTIENAPAESMADLHQLRGILYLFEDTVPFLARQVARAARNYLAGLLPPFFRALVEHTAQSNYSWHTPGHGGGVAYRKSPVGQAFHQFFGENTLRSDLSVSVPELGSLLDHT GPLAEAEDRAARNFGADHTFFVINGTSTANKIVWHSMVGREDLVLVDRNCHKSILHSIIMTGAIPLYLTPE RNELGIIGPIPLSEFSKQSIAAKIAASPLARGREPKVKLAVVTNSTYDGLCYNAELIKQTLGDSVEVLHFD EAWYAYAAFHEFYDGRYGMGTSRSEEGPLVFATHSTHKMLAAFSQASMIHVQDGGTRKLDVARFNEAFMMH ISTSPQYGIIASLDVASAMMEGPAGRSLIQETFDEALSFRRALANVRQNLDRNDWWFGVWQPEQVEGTDQV GTHDWVLEPSADWHGFGDIAEDYVLLDPIKVTLTTPGLSAGGKLSEQGIPAAIVSRFLWERGLVVEKTGLY SFLVLFSMGITKGKWSTLVTELLEFKRCYDANLPLLDVLPSVAQAGGKRYNGVGLRDLSDAMHASYRDNAT AKAMKRMYTVLPEVAMRPSEAYDKLVRGEVEAVPIARLEGRIAAVMLVPYPPGIPLIMPGERFTEATRSIL DYLEFARTFERAFPGFDSDVHGLQHQDGPSGRCYTVECIKE

SEQ ID NO:10(铜绿假单胞菌(ldc2-co1DNA序列))

ATGTACAAAGATCTGAAATTCCCTGTTCTGATTGTACACCGCGATATCAAGGCGGACACGGTAGCCGGCGA GCGTGTTCGCGGTATTGCCCACGAACTCGAACAAGACGGCTTTAGCATTCTCTCTACGGCGTCTTCTGCGGAAGGCCGCATTGTGGCTAGCACGCACCACGGTCTCGCCTGCATCCTCGTGGCAGCTGAGGGTGCGGGTGAG AATCAGCGTCTGCTCCAAGACGTGGTTGAGCTGATCCGTGTAGCTCGCGTCCGTGCGCCACAGCTCCCGAT CTTCGCGCTGGGCGAACAGGTGACTATTGAAAACGCGCCTGCCGAATCTATGGCCGACCTGCACCAGCTCC GCGGCATTCTGTATCTCTTCGAGGATACTGTCCCGTTCCTGGCACGTCAGGTTGCACGCGCAGCGCGTAAC TACCTCGCTGGCCTCCTCCCGCCATTCTTCCGTGCACTCGTGGAGCACACGGCCCAAAGCAATTACTCTTG GCACACCCCGGGTCACGGTGGTGGTGTCGCTTACCGTAAATCTCCGGTAGGTCAAGCTTTCCACCAGTTCT TTGGCGAGAATACCCTCCGCTCTGACCTGTCTGTTAGCGTTCCAGAGCTGGGCAGCCTGCTGGATCACACT GGCCCTCTCGCGGAAGCAGAGGATCGTGCCGCTCGCAATTTCGGTGCGGACCACACCTTCTTTGTCATCAA TGGTACCTCTACTGCGAACAAAATCGTTTGGCACTCTATGGTTGGTCGCGAGGACCTGGTGCTGGTCGATC GTAACTGTCACAAATCTATTCTGCACTCCATTATCATGACGGGTGCTATCCCACTGTACCTGACTCCGGAA CGCAACGAACTGGGTATTATCGGCCCTATTCCACTCTCCGAGTTTTCTAAACAATCTATCGCAGCAAAAAT TGCCGCCTCCCCACTCGCGCGTGGTCGTGAACCGAAAGTTAAACTGGCTGTCGTTACCAACTCTACCTATG ACGGTCTGTGTTACAACGCGGAACTGATCAAACAAACCCTCGGCGACTCTGTCGAGGTACTGCATTTCGAC GAGGCTTGGTATGCTTATGCGGCGTTTCACGAGTTCTACGACGGCCGCTACGGTATGGGCACTTCTCGTTC CGAAGAGGGTCCGCTGGTCTTTGCTACCCATTCTACCCACAAGATGCTCGCGGCTTTTTCCCAAGCTAGCA TGATTCACGTTCAGGATGGTGGTACGCGCAAGCTGGACGTCGCCCGCTTTAACGAAGCCTTTATGATGCAC ATCAGCACCTCTCCACAGTACGGCATCATTGCGTCTCTCGATGTCGCAAGCGCTATGATGGAAGGTCCTGC CGGTCGTAGCCTGATCCAAGAGACGTTCGATGAGGCGCTGTCCTTCCGTCGTGCTCTGGCGAATGTCCGTC AGAACCTGGACCGTAATGATTGGTGGTTCGGTGTCTGGCAACCGGAGCAGGTTGAGGGCACCGACCAGGTAGGTACTCACGACTGGGTTCTCGAGCCTAGCGCGGACTGGCATGGTTTTGGTGACATTGCGGAGGATTACGT TCTCCTCGATCCTATCAAAGTTACCCTGACCACCCCAGGTCTGAGCGCTGGCGGTAAACTCTCTGAACAAG GCATCCCGGCAGCTATCGTTAGCCGTTTCCTGTGGGAACGTGGTCTGGTGGTCGAGAAAACGGGTCTGTAC TCTTTCCTGGTTCTGTTCTCCATGGGTATCACGAAAGGCAAATGGTCTACTCTGGTTACCGAGCTGCTCGA ATTCAAACGCTGTTACGACGCGAATCTGCCACTCCTGGATGTGCTGCCTTCTGTAGCGCAGGCGGGTGGTA AACGCTATAACGGTGTAGGTCTGCGTGATCTGTCCGATGCCATGCACGCTTCTTATCGTGACAATGCCACG GCGAAGGCCATGAAGCGTATGTATACGGTGCTCCCGGAAGTAGCCATGCGCCCGTCCGAAGCTTATGATAA GCTCGTACGCGGTGAAGTCGAAGCTGTTCCTATTGCACGTCTCGAGGGTCGTATTGCGGCGGTTATGCTGG TTCCGTACCCGCCAGGTATCCCGCTCATTATGCCGGGTGAACGTTTTACTGAAGCTACCCGCTCCATTCTG GACTATCTGGAGTTTGCCCGTACCTTCGAGCGCGCGTTCCCGGGCTTTGACTCTGATGTTCACGGCCTCCA ACATCAAGATGGCCCGTCTGGCCGTTGTTATACCGTTGAATGCATCAAGGAATAA

SEQ ID NO:11(铜绿假单胞菌突变体Ldc2 S111C多肽序列(由突变体ldc2基因编码)) MYKDLKFPVLIVHRDIKADTVAGERVRGIAHELEQDGFSILSTASSAEGRIVASTHHGLACILVAAEGAGENQRLLQDVVELIRVARVRAPQLPIFALGEQVTIENAPAECMADLHQLRGILYLFEDTVPFLARQVARAARN YLAGLLPPFFRALVEHTAQSNYSWHTPGHGGGVAYRKSPVGQAFHQFFGENTLRSDLSVSVPELGSLLDHT GPLAEAEDRAARNFGADHTFFVINGTSTANKIVWHSMVGREDLVLVDRNCHKSILHSIIMTGAIPLYLTPE RNELGIIGPIPLSEFSKQSIAAKIAASPLARGREPKVKLAVVTNSTYDGLCYNAELIKQTLGDSVEVLHFD EAWYAYAAFHEFYDGRYGMGTSRSEEGPLVFATHSTHKMLAAFSQASMIHVQDGGTRKLDVARFNEAFMMH ISTSPQYGIIASLDVASAMMEGPAGRSLIQETFDEALSFRRALANVRQNLDRNDWWFGVWQPEQVEGTDQV GTHDWVLEPSADWHGFGDIAEDYVLLDPIKVTLTTPGLSAGGKLSEQGIPAAIVSRFLWERGLVVEKTGLY SFLVLFSMGITKGKWSTLVTELLEFKRCYDANLPLLDVLPSVAQAGGKRYNGVGLRDLSDAMHASYRDNAT AKAMKRMYTVLPEVAMRPSEAYDKLVRGEVEAVPIARLEGRIAAVMLVPYPPGIPLIMPGERFTEATRSIL DYLEFARTFERAFPGFDSDVHGLQHQDGPSGRCYTVECIKE

SEQ ID NO:12(aat)

>gb|AY271828.1|:385-1717蜂房哈夫尼菌质粒pAlvA,完整序列

SEQ ID NO:13(aai)

>gb|AY271828.1|:1734-2069蜂房哈夫尼菌质粒pAlvA,完整序列

SEQ ID NO:14(abt)

>gb|AY271829.1|:384-1566蜂房哈夫尼菌质粒pAlvB,完整序列

SEQ ID NO:15(abi)

>gb|AY271829.1|:1583-1918蜂房哈夫尼菌质粒pAlvB,完整序列

SEQ ID NO:16(Ldc2 N262T蛋白质序列)

MYKDLKFPVLIVHRDIKADTVAGERVRGIAHELEQDGFSILSTASSAEGRIVASTHHGLACILVAAEGAGE NQRLLQDVVELIRVARVRAPQLPIFALGEQVTIENAPAESMADLHQLRGILYLFEDTVPFLARQVARAARNYLAGLLPPFFRALVEHTAQSNYSWHTPGHGGGVAYRKSPVGQAFHQFFGENTLRSDLSVSVPELGSLLDHT GPLAEAEDRAARNFGADHTFFVINGTSTANKIVWHSMVGREDLVLVDRTCHKSILHSIIMTGAIPLYLTPE RNELGIIGPIPLSEFSKQSIAAKIAASPLARGREPKVKLAVVTNSTYDGLCYNAELIKQTLGDSVEVLHFD EAWYAYAAFHEFYDGRYGMGTSRSEEGPLVFATHSTHKMLAAFSQASMIHVQDGGTRKLDVARFNEAFMMH ISTSPQYGIIASLDVASAMMEGPAGRSLIQETFDEALSFRRALANVRQNLDRNDWWFGVWQPEQVEGTDQV GTHDWVLEPSADWHGFGDIAEDYVLLDPIKVTLTTPGLSAGGKLSEQGIPAAIVSRFLWERGLVVEKTGLY SFLVLFSMGITKGKWSTLVTELLEFKRCYDANLPLLDVLPSVAQAGGKRYNGVGLRDLSDAMHASYRDNAT AKAMKRMYTVLPEVAMRPSEAYDKLVRGEVEAVPIARLEGRIAAVMLVPYPPGIPLIMPGERFTEATRSIL DYLEFARTFERAFPGFDSDVHGLQHQDGPSGRCYTVECIKE

SEQ ID NO:17(Ldc2 K265N蛋白质序列)

MYKDLKFPVLIVHRDIKADTVAGERVRGIAHELEQDGFSILSTASSAEGRIVASTHHGLACILVAAEGAGE NQRLLQDVVELIRVARVRAPQLPIFALGEQVTIENAPAESMADLHQLRGILYLFEDTVPFLARQVARAARNYLAGLLPPFFRALVEHTAQSNYSWHTPGHGGGVAYRKSPVGQAFHQFFGENTLRSDLSVSVPELGSLLDHT GPLAEAEDRAARNFGADHTFFVINGTSTANKIVWHSMVGREDLVLVDRNCHNSILHSIIMTGAIPLYLTPE RNELGIIGPIPLSEFSKQSIAAKIAASPLARGREPKVKLAVVTNSTYDGLCYNAELIKQTLGDSVEVLHFD EAWYAYAAFHEFYDGRYGMGTSRSEEGPLVFATHSTHKMLAAFSQASMIHVQDGGTRKLDVARFNEAFMMH ISTSPQYGIIASLDVASAMMEGPAGRSLIQETFDEALSFRRALANVRQNLDRNDWWFGVWQPEQVEGTDQV GTHDWVLEPSADWHGFGDIAEDYVLLDPIKVTLTTPGLSAGGKLSEQGIPAAIVSRFLWERGLVVEKTGLY SFLVLFSMGITKGKWSTLVTELLEFKRCYDANLPLLDVLPSVAQAGGKRYNGVGLRDLSDAMHASYRDNAT AKAMKRMYTVLPEVAMRPSEAYDKLVRGEVEAVPIARLEGRIAAVMLVPYPPGIPLIMPGERFTEATRSIL DYLEFARTFERAFPGFDSDVHGLQHQDGPSGRCYTVECIKE

SEQ ID NO:18(Ldc2 S111C/N262T蛋白质序列)

MYKDLKFPVLIVHRDIKADTVAGERVRGIAHELEQDGFSILSTASSAEGRIVASTHHGLACILVAAEGAGE NQRLLQDVVELIRVARVRAPQLPIFALGEQVTIENAPAECMADLHQLRGILYLFEDTVPFLARQVARAARNYLAGLLPPFFRALVEHTAQSNYSWHTPGHGGGVAYRKSPVGQAFHQFFGENTLRSDLSVSVPELGSLLDHT GPLAEAEDRAARNFGADHTFFVINGTSTANKIVWHSMVGREDLVLVDRTCHKSILHSIIMTGAIPLYLTPE RNELGIIGPIPLSEFSKQSIAAKIAASPLARGREPKVKLAVVTNSTYDGLCYNAELIKQTLGDSVEVLHFD EAWYAYAAFHEFYDGRYGMGTSRSEEGPLVFATHSTHKMLAAFSQASMIHVQDGGTRKLDVARFNEAFMMH ISTSPQYGIIASLDVASAMMEGPAGRSLIQETFDEALSFRRALANVRQNLDRNDWWFGVWQPEQVEGTDQV GTHDWVLEPSADWHGFGDIAEDYVLLDPIKVTLTTPGLSAGGKLSEQGIPAAIVSRFLWERGLVVEKTGLY SFLVLFSMGITKGKWSTLVTELLEFKRCYDANLPLLDVLPSVAQAGGKRYNGVGLRDLSDAMHASYRDNAT AKAMKRMYTVLPEVAMRPSEAYDKLVRGEVEAVPIARLEGRIAAVMLVPYPPGIPLIMPGERFTEATRSIL DYLEFARTFERAFPGFDSDVHGLQHQDGPSGRCYTVECIKE

SEQ ID NO:19(Ldc2 S111C/K265N蛋白质序列)

MYKDLKFPVLIVHRDIKADTVAGERVRGIAHELEQDGFSILSTASSAEGRIVASTHHGLACILVAAEGAGE NQRLLQDVVELIRVARVRAPQLPIFALGEQVTIENAPAECMADLHQLRGILYLFEDTVPFLARQVARAARNYLAGLLPPFFRALVEHTAQSNYSWHTPGHGGGVAYRKSPVGQAFHQFFGENTLRSDLSVSVPELGSLLDHT GPLAEAEDRAARNFGADHTFFVINGTSTANKIVWHSMVGREDLVLVDRNCHNSILHSIIMTGAIPLYLTPE RNELGIIGPIPLSEFSKQSIAAKIAASPLARGREPKVKLAVVTNSTYDGLCYNAELIKQTLGDSVEVLHFD EAWYAYAAFHEFYDGRYGMGTSRSEEGPLVFATHSTHKMLAAFSQASMIHVQDGGTRKLDVARFNEAFMMH ISTSPQYGIIASLDVASAMMEGPAGRSLIQETFDEALSFRRALANVRQNLDRNDWWFGVWQPEQVEGTDQV GTHDWVLEPSADWHGFGDIAEDYVLLDPIKVTLTTPGLSAGGKLSEQGIPAAIVSRFLWERGLVVEKTGLY SFLVLFSMGITKGKWSTLVTELLEFKRCYDANLPLLDVLPSVAQAGGKRYNGVGLRDLSDAMHASYRDNAT AKAMKRMYTVLPEVAMRPSEAYDKLVRGEVEAVPIARLEGRIAAVMLVPYPPGIPLIMPGERFTEATRSIL DYLEFARTFERAFPGFDSDVHGLQHQDGPSGRCYTVECIKE

SEQ ID NO:20(Ldc2 N262T/K265N蛋白质序列)

MYKDLKFPVLIVHRDIKADTVAGERVRGIAHELEQDGFSILSTASSAEGRIVASTHHGLACILVAAEGAGE NQRLLQDVVELIRVARVRAPQLPIFALGEQVTIENAPAESMADLHQLRGILYLFEDTVPFLARQVARAARNYLAGLLPPFFRALVEHTAQSNYSWHTPGHGGGVAYRKSPVGQAFHQFFGENTLRSDLSVSVPELGSLLDHT GPLAEAEDRAARNFGADHTFFVINGTSTANKIVWHSMVGREDLVLVDRTCHNSILHSIIMTGAIPLYLTPE RNELGIIGPIPLSEFSKQSIAAKIAASPLARGREPKVKLAVVTNSTYDGLCYNAELIKQTLGDSVEVLHFD EAWYAYAAFHEFYDGRYGMGTSRSEEGPLVFATHSTHKMLAAFSQASMIHVQDGGTRKLDVARFNEAFMMH ISTSPQYGIIASLDVASAMMEGPAGRSLIQETFDEALSFRRALANVRQNLDRNDWWFGVWQPEQVEGTDQV GTHDWVLEPSADWHGFGDIAEDYVLLDPIKVTLTTPGLSAGGKLSEQGIPAAIVSRFLWERGLVVEKTGLY SFLVLFSMGITKGKWSTLVTELLEFKRCYDANLPLLDVLPSVAQAGGKRYNGVGLRDLSDAMHASYRDNAT AKAMKRMYTVLPEVAMRPSEAYDKLVRGEVEAVPIARLEGRIAAVMLVPYPPGIPLIMPGERFTEATRSIL DYLEFARTFERAFPGFDSDVHGLQHQDGPSGRCYTVECIKE

SEQ ID NO:21(Ldc2 S111C/N262T/K265N蛋白质序列)

MYKDLKFPVLIVHRDIKADTVAGERVRGIAHELEQDGFSILSTASSAEGRIVASTHHGLACILVAAEGAGE NQRLLQDVVELIRVARVRAPQLPIFALGEQVTIENAPAECMADLHQLRGILYLFEDTVPFLARQVARAARNYLAGLLPPFFRALVEHTAQSNYSWHTPGHGGGVAYRKSPVGQAFHQFFGENTLRSDLSVSVPELGSLLDHT GPLAEAEDRAARNFGADHTFFVINGTSTANKIVWHSMVGREDLVLVDRTCHNSILHSIIMTGAIPLYLTPE RNELGIIGPIPLSEFSKQSIAAKIAASPLARGREPKVKLAVVTNSTYDGLCYNAELIKQTLGDSVEVLHFD EAWYAYAAFHEFYDGRYGMGTSRSEEGPLVFATHSTHKMLAAFSQASMIHVQDGGTRKLDVARFNEAFMMH ISTSPQYGIIASLDVASAMMEGPAGRSLIQETFDEALSFRRALANVRQNLDRNDWWFGVWQPEQVEGTDQV GTHDWVLEPSADWHGFGDIAEDYVLLDPIKVTLTTPGLSAGGKLSEQGIPAAIVSRFLWERGLVVEKTGLY SFLVLFSMGITKGKWSTLVTELLEFKRCYDANLPLLDVLPSVAQAGGKRYNGVGLRDLSDAMHASYRDNAT AKAMKRMYTVLPEVAMRPSEAYDKLVRGEVEAVPIARLEGRIAAVMLVPYPPGIPLIMPGERFTEATRSIL DYLEFARTFERAFPGFDSDVHGLQHQDGPSGRCYTVECIKE

SEQ ID NO:22(大肠杆菌Asd多肽序列(由asd基因编码))

MKNVGFIGWRGMVGSVLMQRMVEERDFDAIRPVFFSTSQLGQAAPSFGGTTGTLQDAFDLEALKALDIIVT CQGGDYTNEIYPKLRESGWQGYWIDAASSLRMKDDAIIILDPVNQDVITDGLNNGIRTFVGGNCTVSLMLMSLGGLFANDLVDWVSVATYQAASGGGARHMRELLTQMGHLYGHVADELATPSSAILDIERKVTTLTRSGEL PVDNFGVPLAGSLIPWIDKQLDNGQSREEWKGQAETNKILNTSSVIPVDGLCVRVGALRCHSQAFTIKLKK DVSIPTVEELLAAHNPWAKVVPNDREITMRELTPAAVTGTLTTPVGRLRKLNMGPEFLSAFTVGDQLLWGA AEPLRRMLRQLA

SEQ ID NO:23(大肠杆菌DapB多肽序列(由dapB基因编码))

MHDANIRVAIAGAGGRMGRQLIQAALALEGVQLGAALEREGSSLLGSDAGELAGAGKTGVTVQSSLDAVKD DFDVFIDFTRPEGTLNHLAFCRQHGKGMVIGTTGFDEAGKQAIRDAAADIAIVFAANFSVGVNVMLKLLEKAAKVMGDYTDIEIIEAHHRHKVDAPSGTALAMGEAIAHALDKDLKDCAVYSREGHTGERVPGTIGFATVRA GDIVGEHTAMFADIGERLEITHKASSRMTFANGAVRSALWLSGKESGLFDMRDVLDLNNL

SEQ ID NO:24(大肠杆菌DapD多肽序列(由dapD基因编码))

MQQLQNIIETAFERRAEITPANADTVTREAVNQVIALLDSGALRVAEKIDGQWVTHQWLKKAVLLSFRIND NQVIEGAESRYFDKVPMKFADYDEARFQKEGFRVVPPAAVRQGAFIARNTVLMPSYVNIGAYVDEGTMVDTWATVGSCAQIGKNVHLSGGVGIGGVLEPLQANPTIIEDNCFIGARSEVVEGVIVEEGSVISMGVYIGQSTR IYDRETGEIHYGRVPAGSVVVSGNLPSKDGKYSLYCAVIVKKVDAKTRGKVGINELLRTID

SEQ ID NO:25(大肠杆菌AspC多肽序列(由aspC基因编码))

MFENITAAPADPILGLADLFRADERPGKINLGIGVYKDETGKTPVLTSVKKAEQYLLENETTKNYLGIDGI PEFGRCTQELLFGKGSALINDKRARTAQTPGGTGALRVAADFLAKNTSVKRVWVSNPSWPNHKSVFNSAGLEVREYAYYDAENHTLDFDALINSLNEAQAGDVVLFHGCCHNPTGIDPTLEQWQTLAQLSVEKGWLPLFDFA YQGFARGLEEDAEGLRAFAAMHKELIVASSYSKNFGLYNERVGACTLVAADSETVDRAFSQMKAAIRANYS NPPAHGASVVATILSNDALRAIWEQELTDMRQRIQRMRQLFVNTLQEKGANRDFSFIIKQNGMFSFSGLTK EQVLRLREEFGVYAVASGRVNVAGMTPDNMAPLCEAIVAVL

SEQ ID NO:26(大肠杆菌突变体天冬氨酸激酶III多肽序列，LysC-1(M318I,G323D)) MSEIVVSKFGGTSVADFDAMNRSADIVLSDANVRLVVLSASAGITNLLVALAEGLEPGERFEKLDAIRNIQ FAILERLRYPNVIREEIERLLENITVLAEAAALATSPALTDELVSHGELMSTLLFVEILRERDVQAQWFDVRKVMRTNDRFGRAEPDIAALAELAALQLLPRLNEGLVITQGFIGSENKGRTTTLGRGGSDYTAALLAEALH ASRVDIWTDVPGIYTTDPRVVSAAKRIDEIAFAEAAEMATFGAKVLHPATLLPAVRSDIPVFVGSSKDPRA GGTLVCNKTENPPLFRALALRRNQTLLTLHSLNILHSRDFLAEVFGILARHNISVDLITTSEVSVALTLDT TGSTSTGDTLLTQSLLMELSALCRVEVEEGLALVALIGNDLSKACGVGKEVFGVLEPFNIRMICYGASSHNLCFLVPGEDAEQVVQKLHSNLFE

SEQ ID NO:27(大肠杆菌突变体天冬氨酸激酶III多肽序列，LysC-2(T344M,T352I)) MSEIVVSKFGGTSVADFDAMNRSADIVLSDANVRLVVLSASAGITNLLVALAEGLEPGERFEKLDAIRNIQ FAILERLRYPNVIREEIERLLENITVLAEAAALATSPALTDELVSHGELMSTLLFVEILRERDVQAQWFDVRKVMRTNDRFGRAEPDIAALAELAALQLLPRLNEGLVITQGFIGSENKGRTTTLGRGGSDYTAALLAEALH ASRVDIWTDVPGIYTTDPRVVSAAKRIDEIAFAEAAEMATFGAKVLHPATLLPAVRSDIPVFVGSSKDPRA GGTLVCNKTENPPLFRALALRRNQTLLTLHSLNMLHSRGFLAEVFGILARHNISVDLITMSEVSVALILDT TGSTSTGDTLLTQSLLMELSALCRVEVEEGLALVALIGNDLSKACGVGKEVFGVLEPFNIRMICYGASSHNLCFLVPGEDAEQVVQKLHSNLFE

SEQ ID NO:28(变铅青链霉菌天冬氨酸激酶III多肽序列，S-LysC)

MGLVVQKYGGSSVADAEGIKRVAKRIVEAKKNGNQVVAVVSAMGDTTDELIDLAEQVSPIPAGRELDMLLT AGERISMALLAMAIKNLGHEAQSFTGSQAGVITDSVHNKARIIDVTPGRIRTSVDEGNVAIVAGFQGVSQDSKDITTLGRGGSDTTAVALAAALDADVCEIYTDVDGVFTADPRVVPKAKKIDWISFEDMLELAASGSKVLL HRCVEYARRYNIPIHVRSSFSGLQGTWVSSEPIKQGEKHVEQALISGVAHDTSEAKVTVVGVPDKPGEAAA IFRAIADAQVNIDMVVQNVSAASTGLTDISFTLPKSEGRKAIDALEKNRPGIGFDSLRYDDQIGKISLVGA GMKSNPGVTADFFTALSDAGVNIELISTSEIRISVVTRKDDVNEAVRAVHTAFGLDSDSDEAVVYGGTGR

SEQ ID NO:29(大肠杆菌tetA多核苷酸序列，核苷酸1-558，tetA(nt 1-558))

ATGAAATCTAACAATGCGCTCATCGTCATCCTCGGCACCGTCACCCTGGATGCTGTAGGCATAGGCTTGGT TATGCCGGTACTGCCGGGCCTCTTGCGGGATATCGTCCATTCCGACAGCATCGCCAGTCACTATGGCGTGCTGCTAGCGCTATATGCGTTGATGCAATTTCTATGCGCACCCGTTCTCGGAGCACTGTCCGACCGCTTTGGC CGCCGCCCAGTCCTGCTCGCTTCGCTACTTGGAGCCACTATCGACTACGCGATCATGGCGACCACACCCGT CCTGTGGATCCTCTACGCCGGACGCATCGTGGCCGGCATCACCGGCGCCACAGGTGCGGTTGCTGGCGCCT ATATCGCCGACATCACCGATGGGGAAGATCGGGCTCGCCACTTCGGGCTCATGAGCGCTTGTTTCGGCGTG GGTATGGTGGCAGGCCCCGTGGCCGGGGGACTGTTGGGCGCCATCTCCTTGCATGCACCATTCCTTGCGGC GGCGGTGCTCAACGGCCTCAACCTACTACTGGGCTGCTTCCTAATGCAGGAGTCGCATTAAGGGAGAGCGT CGACCGATGCCCTTGAGAGCCTTCAACCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCGC CGCACTTATGACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTGGGTCATTTTCG GCGAGGACCGCTTTCGCTGGAGCGCGACGATGATCGGCCTGTCGCTTGCGGTATTCGGAATCTTGCACGCC CTCGCTCAAGCCTTCGTCACTGGTCCCGCCACCAAACGTTTCGGCGAGAAGCAGGCCATTATCGCCGGCAT GGCGGCCGACGCGCTGGGCTACGTCTTGCTGGCGTTCGCGACGCGAGGCTGGATGGCCTTCCCCATTATGA TTCTTCTCGCTTCCGGCGGCATCGGGATGCCCGCGTTGCAGGCCATGCTGTCCAGGCAGGTAGATGACGAC CATCAGGGACAGCTTCAAGGATCGCTCGCGGCTCTTACCAGCCTAACTTCGATCATTGGACCGCTGATCGT CACGGCGATTTATGCCGCCTCGGCGAGCACATGGAACGGGTTGGCATGGATTGTAGGCGCCGCCCTATACC TTGTCTGCCTCCCCGCGTTGCGTCGCGGTGCATGGAGCCGGGCCACCTCGACCTGA

SEQ ID NO:30(大肠杆菌TetA多肽序列，氨基酸1-185，TetA(aa1-185))

MKSNNALIVILGTVTLDAVGIGLVMPVLPGLLRDIVHSDSIASHYGVLLALYALMQFLCAPVLGALSDRFG RRPVLLASLLGATIDYAIMATTPVLWILYAGRIVAGITGATGAVAGAYIADITDGEDRARHFGLMSACFGVGMVAGPVAGGLLGAISLHAPFLAAAVLNGLNLLLGCFLMQESH

SEQ ID NO:31(大肠杆菌tetA多核苷酸序列，核苷酸1-291，tetA(nt 1-291))

ATGAAATCTAACAATGCGCTCATCGTCATCCTCGGCACCGTCACCCTGGATGCTGTAGGCATAGGCTTGGT TATGCCGGTACTGCCGGGCCTCTTGCGGGATATCGTCCATTCCGACAGCATCGCCAGTCACTATGGCGTGCTGCTAGCGCTATATGCGTTGATGCAATTTCTATGCGCACCCGTTCTCGGAGCACTGTCCGACCGCTTTGGC CGCCGCCCAGTCCTGCTCGCTTCGCTACTTGGAGCCACTATCGACTACGCGATCATGGCGACCACACCCGT CCTGTAAGGATCCTCTACGCCGGACGCATCGTGGCCGGCATCACCGGCGCCACAGGTGCGGTTGCTGGCGC CTATATCGCCGACATCACCGATGGGGAAGATCGGGCTCGCCACTTCGGGCTCATGAGCGCTTGTTTCGGCG TGGGTATGGTGGCAGGCCCCGTGGCCGGGGGACTGTTGGGCGCCATCTCCTTGCATGCACCATTCCTTGCG GCGGCGGTGCTCAACGGCCTCAACCTACTACTGGGCTGCTTCCTAATGCAGGAGTCGCATAAGGGAGAGCG TCGACCGATGCCCTTGAGAGCCTTCAACCCAGTCAGCTCCTTCCGGTGGGCGCGGGGCATGACTATCGTCG CCGCACTTATGACTGTCTTCTTTATCATGCAACTCGTAGGACAGGTGCCGGCAGCGCTCTGGGTCATTTTC GGCGAGGACCGCTTTCGCTGGAGCGCGACGATGATCGGCCTGTCGCTTGCGGTATTCGGAATCTTGCACGC CCTCGCTCAAGCCTTCGTCACTGGTCCCGCCACCAAACGTTTCGGCGAGAAGCAGGCCATTATCGCCGGCA TGGCGGCCGACGCGCTGGGCTACGTCTTGCTGGCGTTCGCGACGCGAGGCTGGATGGCCTTCCCCATTATG ATTCTTCTCGCTTCCGGCGGCATCGGGATGCCCGCGTTGCAGGCCATGCTGTCCAGGCAGGTAGATGACGA CCATCAGGGACAGCTTCAAGGATCGCTCGCGGCTCTTACCAGCCTAACTTCGATCATTGGACCGCTGATCG TCACGGCGATTTATGCCGCCTCGGCGAGCACATGGAACGGGTTGGCATGGATTGTAGGCGCCGCCCTATAC CTTGTCTGCCTCCCCGCGTTGCGTCGCGGTGCATGGAGCCGGGCCACCTCGACCTGA

SEQ ID NO:32(大肠杆菌TetA多肽序列，氨基酸1-96,TetA(aa1-96))

MKSNNALIVILGTVTLDAVGIGLVMPVLPGLLRDIVHSDSIASHYGVLLALYALMQFLCAPVLGALSDRFG RRPVLLASLLGATIDYAIMATTPVL

SEQ ID NO:33(大肠杆菌CadA多肽序列，氨基酸1-565，CadA(aa1-565))

MNVIAILNHMGVYFKEEPIRELHRALERLNFQIVYPNDRDDLLKLIENNARLCGVIFDWDKYNLELCEEIS KMNENLPLYAFANTYSTLDVSLNDLRLQISFFEYALGAAEDIANKIKQTTDEYINTILPPLTKALFKYVREGKYTFCTPGHMGGTAFQKSPVGSLFYDFFGPNTMKSDISISVSELGSLLDHSGPHKEAEQYIARVFNADRS YMVTNGTSTANKIVGMYSAPAGSTILIDRNCHKSLTHLMMMSDVTPIYFRPTRNAYGILGGIPQSEFQHAT IAKRVKETPNATWPVHAVITNSTYDGLLYNTDFIKKTLDVKSIHFDSAWVPYTNFSPIYEGKCGMSGGRVE GKVIYETQSTHKLLAAFSQASMIHVKGDVNEETFNEAYMMHTTTSPHYGIVASTETAAAMMKGNAGKRLIN GSIERAIKFRKEIKRLRTESDGWFFDVWQPDHIDTTECWPLRSDSTWHGFKNIDNEHMYLDPIKVTLLTPG MEKDGTMSDFGIPASIVAKYLDEHGIVVEKTGPYNLLFLFSIGIDKTKALSLLRALTDFKRAFDLNLR

SEQ ID NO:34(ldc2-co1 C332G DNA序列)

ATGTACAAAGATCTGAAATTCCCTGTTCTGATTGTACACCGCGATATCAAGGCGGACACGGTAGCCGGCGA GCGTGTTCGCGGTATTGCCCACGAACTCGAACAAGACGGCTTTAGCATTCTCTCTACGGCGTCTTCTGCGGAAGGCCGCATTGTGGCTAGCACGCACCACGGTCTCGCCTGCATCCTCGTGGCAGCTGAGGGTGCGGGTGAG AATCAGCGTCTGCTCCAAGACGTGGTTGAGCTGATCCGTGTAGCTCGCGTCCGTGCGCCACAGCTCCCGAT CTTCGCGCTGGGCGAACAGGTGACTATTGAAAACGCGCCTGCCGAATGTATGGCCGACCTGCACCAGCTCC GCGGCATTCTGTATCTCTTCGAGGATACTGTCCCGTTCCTGGCACGTCAGGTTGCACGCGCAGCGCGTAAC TACCTCGCTGGCCTCCTCCCGCCATTCTTCCGTGCACTCGTGGAGCACACGGCCCAAAGCAATTACTCTTG GCACACCCCGGGTCACGGTGGTGGTGTCGCTTACCGTAAATCTCCGGTAGGTCAAGCTTTCCACCAGTTCT TTGGCGAGAATACCCTCCGCTCTGACCTGTCTGTTAGCGTTCCAGAGCTGGGCAGCCTGCTGGATCACACT GGCCCTCTCGCGGAAGCAGAGGATCGTGCCGCTCGCAATTTCGGTGCGGACCACACCTTCTTTGTCATCAA TGGTACCTCTACTGCGAACAAAATCGTTTGGCACTCTATGGTTGGTCGCGAGGACCTGGTGCTGGTCGATC GTAACTGTCACAAATCTATTCTGCACTCCATTATCATGACGGGTGCTATCCCACTGTACCTGACTCCGGAA CGCAACGAACTGGGTATTATCGGCCCTATTCCACTCTCCGAGTTTTCTAAACAATCTATCGCAGCAAAAAT TGCCGCCTCCCCACTCGCGCGTGGTCGTGAACCGAAAGTTAAACTGGCTGTCGTTACCAACTCTACCTATG ACGGTCTGTGTTACAACGCGGAACTGATCAAACAAACCCTCGGCGACTCTGTCGAGGTACTGCATTTCGAC GAGGCTTGGTATGCTTATGCGGCGTTTCACGAGTTCTACGACGGCCGCTACGGTATGGGCACTTCTCGTTC CGAAGAGGGTCCGCTGGTCTTTGCTACCCATTCTACCCACAAGATGCTCGCGGCTTTTTCCCAAGCTAGCA TGATTCACGTTCAGGATGGTGGTACGCGCAAGCTGGACGTCGCCCGCTTTAACGAAGCCTTTATGATGCAC ATCAGCACCTCTCCACAGTACGGCATCATTGCGTCTCTCGATGTCGCAAGCGCTATGATGGAAGGTCCTGC CGGTCGTAGCCTGATCCAAGAGACGTTCGATGAGGCGCTGTCCTTCCGTCGTGCTCTGGCGAATGTCCGTC AGAACCTGGACCGTAATGATTGGTGGTTCGGTGTCTGGCAACCGGAGCAGGTTGAGGGCACCGACCAGGTAGGTACTCACGACTGGGTTCTCGAGCCTAGCGCGGACTGGCATGGTTTTGGTGACATTGCGGAGGATTACGT TCTCCTCGATCCTATCAAAGTTACCCTGACCACCCCAGGTCTGAGCGCTGGCGGTAAACTCTCTGAACAAG GCATCCCGGCAGCTATCGTTAGCCGTTTCCTGTGGGAACGTGGTCTGGTGGTCGAGAAAACGGGTCTGTAC TCTTTCCTGGTTCTGTTCTCCATGGGTATCACGAAAGGCAAATGGTCTACTCTGGTTACCGAGCTGCTCGA ATTCAAACGCTGTTACGACGCGAATCTGCCACTCCTGGATGTGCTGCCTTCTGTAGCGCAGGCGGGTGGTA AACGCTATAACGGTGTAGGTCTGCGTGATCTGTCCGATGCCATGCACGCTTCTTATCGTGACAATGCCACG GCGAAGGCCATGAAGCGTATGTATACGGTGCTCCCGGAAGTAGCCATGCGCCCGTCCGAAGCTTATGATAA GCTCGTACGCGGTGAAGTCGAAGCTGTTCCTATTGCACGTCTCGAGGGTCGTATTGCGGCGGTTATGCTGG TTCCGTACCCGCCAGGTATCCCGCTCATTATGCCGGGTGAACGTTTTACTGAAGCTACCCGCTCCATTCTG GACTATCTGGAGTTTGCCCGTACCTTCGAGCGCGCGTTCCCGGGCTTTGACTCTGATGTTCACGGCCTCCA ACATCAAGATGGCCCGTCTGGCCGTTGTTATACCGTTGAATGCATCAAGGAATAA

SEQ ID NO:35(ldc2-co1A785C DNA序列)

ATGTACAAAGATCTGAAATTCCCTGTTCTGATTGTACACCGCGATATCAAGGCGGACACGGTAGCCGGCGA GCGTGTTCGCGGTATTGCCCACGAACTCGAACAAGACGGCTTTAGCATTCTCTCTACGGCGTCTTCTGCGGAAGGCCGCATTGTGGCTAGCACGCACCACGGTCTCGCCTGCATCCTCGTGGCAGCTGAGGGTGCGGGTGAG AATCAGCGTCTGCTCCAAGACGTGGTTGAGCTGATCCGTGTAGCTCGCGTCCGTGCGCCACAGCTCCCGAT CTTCGCGCTGGGCGAACAGGTGACTATTGAAAACGCGCCTGCCGAATCTATGGCCGACCTGCACCAGCTCC GCGGCATTCTGTATCTCTTCGAGGATACTGTCCCGTTCCTGGCACGTCAGGTTGCACGCGCAGCGCGTAAC TACCTCGCTGGCCTCCTCCCGCCATTCTTCCGTGCACTCGTGGAGCACACGGCCCAAAGCAATTACTCTTG GCACACCCCGGGTCACGGTGGTGGTGTCGCTTACCGTAAATCTCCGGTAGGTCAAGCTTTCCACCAGTTCT TTGGCGAGAATACCCTCCGCTCTGACCTGTCTGTTAGCGTTCCAGAGCTGGGCAGCCTGCTGGATCACACT GGCCCTCTCGCGGAAGCAGAGGATCGTGCCGCTCGCAATTTCGGTGCGGACCACACCTTCTTTGTCATCAA TGGTACCTCTACTGCGAACAAAATCGTTTGGCACTCTATGGTTGGTCGCGAGGACCTGGTGCTGGTCGATC GTACCTGTCACAAATCTATTCTGCACTCCATTATCATGACGGGTGCTATCCCACTGTACCTGACTCCGGAA CGCAACGAACTGGGTATTATCGGCCCTATTCCACTCTCCGAGTTTTCTAAACAATCTATCGCAGCAAAAAT TGCCGCCTCCCCACTCGCGCGTGGTCGTGAACCGAAAGTTAAACTGGCTGTCGTTACCAACTCTACCTATG ACGGTCTGTGTTACAACGCGGAACTGATCAAACAAACCCTCGGCGACTCTGTCGAGGTACTGCATTTCGAC GAGGCTTGGTATGCTTATGCGGCGTTTCACGAGTTCTACGACGGCCGCTACGGTATGGGCACTTCTCGTTC CGAAGAGGGTCCGCTGGTCTTTGCTACCCATTCTACCCACAAGATGCTCGCGGCTTTTTCCCAAGCTAGCA TGATTCACGTTCAGGATGGTGGTACGCGCAAGCTGGACGTCGCCCGCTTTAACGAAGCCTTTATGATGCAC ATCAGCACCTCTCCACAGTACGGCATCATTGCGTCTCTCGATGTCGCAAGCGCTATGATGGAAGGTCCTGC CGGTCGTAGCCTGATCCAAGAGACGTTCGATGAGGCGCTGTCCTTCCGTCGTGCTCTGGCGAATGTCCGTC AGAACCTGGACCGTAATGATTGGTGGTTCGGTGTCTGGCAACCGGAGCAGGTTGAGGGCACCGACCAGGTAGGTACTCACGACTGGGTTCTCGAGCCTAGCGCGGACTGGCATGGTTTTGGTGACATTGCGGAGGATTACGT TCTCCTCGATCCTATCAAAGTTACCCTGACCACCCCAGGTCTGAGCGCTGGCGGTAAACTCTCTGAACAAG GCATCCCGGCAGCTATCGTTAGCCGTTTCCTGTGGGAACGTGGTCTGGTGGTCGAGAAAACGGGTCTGTAC TCTTTCCTGGTTCTGTTCTCCATGGGTATCACGAAAGGCAAATGGTCTACTCTGGTTACCGAGCTGCTCGA ATTCAAACGCTGTTACGACGCGAATCTGCCACTCCTGGATGTGCTGCCTTCTGTAGCGCAGGCGGGTGGTA AACGCTATAACGGTGTAGGTCTGCGTGATCTGTCCGATGCCATGCACGCTTCTTATCGTGACAATGCCACG GCGAAGGCCATGAAGCGTATGTATACGGTGCTCCCGGAAGTAGCCATGCGCCCGTCCGAAGCTTATGATAA GCTCGTACGCGGTGAAGTCGAAGCTGTTCCTATTGCACGTCTCGAGGGTCGTATTGCGGCGGTTATGCTGG TTCCGTACCCGCCAGGTATCCCGCTCATTATGCCGGGTGAACGTTTTACTGAAGCTACCCGCTCCATTCTG GACTATCTGGAGTTTGCCCGTACCTTCGAGCGCGCGTTCCCGGGCTTTGACTCTGATGTTCACGGCCTCCA ACATCAAGATGGCCCGTCTGGCCGTTGTTATACCGTTGAATGCATCAAGGAATAA

SEQ ID NO:36(ldc2-co1 A795C DNA序列)

ATGTACAAAGATCTGAAATTCCCTGTTCTGATTGTACACCGCGATATCAAGGCGGACACGGTAGCCGGCGA GCGTGTTCGCGGTATTGCCCACGAACTCGAACAAGACGGCTTTAGCATTCTCTCTACGGCGTCTTCTGCGGAAGGCCGCATTGTGGCTAGCACGCACCACGGTCTCGCCTGCATCCTCGTGGCAGCTGAGGGTGCGGGTGAG AATCAGCGTCTGCTCCAAGACGTGGTTGAGCTGATCCGTGTAGCTCGCGTCCGTGCGCCACAGCTCCCGAT CTTCGCGCTGGGCGAACAGGTGACTATTGAAAACGCGCCTGCCGAATCTATGGCCGACCTGCACCAGCTCC GCGGCATTCTGTATCTCTTCGAGGATACTGTCCCGTTCCTGGCACGTCAGGTTGCACGCGCAGCGCGTAAC TACCTCGCTGGCCTCCTCCCGCCATTCTTCCGTGCACTCGTGGAGCACACGGCCCAAAGCAATTACTCTTG GCACACCCCGGGTCACGGTGGTGGTGTCGCTTACCGTAAATCTCCGGTAGGTCAAGCTTTCCACCAGTTCT TTGGCGAGAATACCCTCCGCTCTGACCTGTCTGTTAGCGTTCCAGAGCTGGGCAGCCTGCTGGATCACACT GGCCCTCTCGCGGAAGCAGAGGATCGTGCCGCTCGCAATTTCGGTGCGGACCACACCTTCTTTGTCATCAA TGGTACCTCTACTGCGAACAAAATCGTTTGGCACTCTATGGTTGGTCGCGAGGACCTGGTGCTGGTCGATC GTAACTGTCACAACTCTATTCTGCACTCCATTATCATGACGGGTGCTATCCCACTGTACCTGACTCCGGAA CGCAACGAACTGGGTATTATCGGCCCTATTCCACTCTCCGAGTTTTCTAAACAATCTATCGCAGCAAAAAT TGCCGCCTCCCCACTCGCGCGTGGTCGTGAACCGAAAGTTAAACTGGCTGTCGTTACCAACTCTACCTATG ACGGTCTGTGTTACAACGCGGAACTGATCAAACAAACCCTCGGCGACTCTGTCGAGGTACTGCATTTCGAC GAGGCTTGGTATGCTTATGCGGCGTTTCACGAGTTCTACGACGGCCGCTACGGTATGGGCACTTCTCGTTC CGAAGAGGGTCCGCTGGTCTTTGCTACCCATTCTACCCACAAGATGCTCGCGGCTTTTTCCCAAGCTAGCA TGATTCACGTTCAGGATGGTGGTACGCGCAAGCTGGACGTCGCCCGCTTTAACGAAGCCTTTATGATGCAC ATCAGCACCTCTCCACAGTACGGCATCATTGCGTCTCTCGATGTCGCAAGCGCTATGATGGAAGGTCCTGC CGGTCGTAGCCTGATCCAAGAGACGTTCGATGAGGCGCTGTCCTTCCGTCGTGCTCTGGCGAATGTCCGTC AGAACCTGGACCGTAATGATTGGTGGTTCGGTGTCTGGCAACCGGAGCAGGTTGAGGGCACCGACCAGGTAGGTACTCACGACTGGGTTCTCGAGCCTAGCGCGGACTGGCATGGTTTTGGTGACATTGCGGAGGATTACGT TCTCCTCGATCCTATCAAAGTTACCCTGACCACCCCAGGTCTGAGCGCTGGCGGTAAACTCTCTGAACAAG GCATCCCGGCAGCTATCGTTAGCCGTTTCCTGTGGGAACGTGGTCTGGTGGTCGAGAAAACGGGTCTGTAC TCTTTCCTGGTTCTGTTCTCCATGGGTATCACGAAAGGCAAATGGTCTACTCTGGTTACCGAGCTGCTCGA ATTCAAACGCTGTTACGACGCGAATCTGCCACTCCTGGATGTGCTGCCTTCTGTAGCGCAGGCGGGTGGTA AACGCTATAACGGTGTAGGTCTGCGTGATCTGTCCGATGCCATGCACGCTTCTTATCGTGACAATGCCACG GCGAAGGCCATGAAGCGTATGTATACGGTGCTCCCGGAAGTAGCCATGCGCCCGTCCGAAGCTTATGATAA GCTCGTACGCGGTGAAGTCGAAGCTGTTCCTATTGCACGTCTCGAGGGTCGTATTGCGGCGGTTATGCTGG TTCCGTACCCGCCAGGTATCCCGCTCATTATGCCGGGTGAACGTTTTACTGAAGCTACCCGCTCCATTCTG GACTATCTGGAGTTTGCCCGTACCTTCGAGCGCGCGTTCCCGGGCTTTGACTCTGATGTTCACGGCCTCCA ACATCAAGATGGCCCGTCTGGCCGTTGTTATACCGTTGAATGCATCAAGGAATAA

SEQ ID NO:37(ldc2-co1 C332G/A785C DNA序列)

ATGTACAAAGATCTGAAATTCCCTGTTCTGATTGTACACCGCGATATCAAGGCGGACACGGTAGCCGGCGA GCGTGTTCGCGGTATTGCCCACGAACTCGAACAAGACGGCTTTAGCATTCTCTCTACGGCGTCTTCTGCGGAAGGCCGCATTGTGGCTAGCACGCACCACGGTCTCGCCTGCATCCTCGTGGCAGCTGAGGGTGCGGGTGAG AATCAGCGTCTGCTCCAAGACGTGGTTGAGCTGATCCGTGTAGCTCGCGTCCGTGCGCCACAGCTCCCGAT CTTCGCGCTGGGCGAACAGGTGACTATTGAAAACGCGCCTGCCGAATGTATGGCCGACCTGCACCAGCTCC GCGGCATTCTGTATCTCTTCGAGGATACTGTCCCGTTCCTGGCACGTCAGGTTGCACGCGCAGCGCGTAAC TACCTCGCTGGCCTCCTCCCGCCATTCTTCCGTGCACTCGTGGAGCACACGGCCCAAAGCAATTACTCTTG GCACACCCCGGGTCACGGTGGTGGTGTCGCTTACCGTAAATCTCCGGTAGGTCAAGCTTTCCACCAGTTCT TTGGCGAGAATACCCTCCGCTCTGACCTGTCTGTTAGCGTTCCAGAGCTGGGCAGCCTGCTGGATCACACT GGCCCTCTCGCGGAAGCAGAGGATCGTGCCGCTCGCAATTTCGGTGCGGACCACACCTTCTTTGTCATCAA TGGTACCTCTACTGCGAACAAAATCGTTTGGCACTCTATGGTTGGTCGCGAGGACCTGGTGCTGGTCGATC GTACCTGTCACAAATCTATTCTGCACTCCATTATCATGACGGGTGCTATCCCACTGTACCTGACTCCGGAA CGCAACGAACTGGGTATTATCGGCCCTATTCCACTCTCCGAGTTTTCTAAACAATCTATCGCAGCAAAAAT TGCCGCCTCCCCACTCGCGCGTGGTCGTGAACCGAAAGTTAAACTGGCTGTCGTTACCAACTCTACCTATG ACGGTCTGTGTTACAACGCGGAACTGATCAAACAAACCCTCGGCGACTCTGTCGAGGTACTGCATTTCGAC GAGGCTTGGTATGCTTATGCGGCGTTTCACGAGTTCTACGACGGCCGCTACGGTATGGGCACTTCTCGTTC CGAAGAGGGTCCGCTGGTCTTTGCTACCCATTCTACCCACAAGATGCTCGCGGCTTTTTCCCAAGCTAGCA TGATTCACGTTCAGGATGGTGGTACGCGCAAGCTGGACGTCGCCCGCTTTAACGAAGCCTTTATGATGCAC ATCAGCACCTCTCCACAGTACGGCATCATTGCGTCTCTCGATGTCGCAAGCGCTATGATGGAAGGTCCTGC CGGTCGTAGCCTGATCCAAGAGACGTTCGATGAGGCGCTGTCCTTCCGTCGTGCTCTGGCGAATGTCCGTC AGAACCTGGACCGTAATGATTGGTGGTTCGGTGTCTGGCAACCGGAGCAGGTTGAGGGCACCGACCAGGTAGGTACTCACGACTGGGTTCTCGAGCCTAGCGCGGACTGGCATGGTTTTGGTGACATTGCGGAGGATTACGT TCTCCTCGATCCTATCAAAGTTACCCTGACCACCCCAGGTCTGAGCGCTGGCGGTAAACTCTCTGAACAAG GCATCCCGGCAGCTATCGTTAGCCGTTTCCTGTGGGAACGTGGTCTGGTGGTCGAGAAAACGGGTCTGTAC TCTTTCCTGGTTCTGTTCTCCATGGGTATCACGAAAGGCAAATGGTCTACTCTGGTTACCGAGCTGCTCGA ATTCAAACGCTGTTACGACGCGAATCTGCCACTCCTGGATGTGCTGCCTTCTGTAGCGCAGGCGGGTGGTA AACGCTATAACGGTGTAGGTCTGCGTGATCTGTCCGATGCCATGCACGCTTCTTATCGTGACAATGCCACG GCGAAGGCCATGAAGCGTATGTATACGGTGCTCCCGGAAGTAGCCATGCGCCCGTCCGAAGCTTATGATAA GCTCGTACGCGGTGAAGTCGAAGCTGTTCCTATTGCACGTCTCGAGGGTCGTATTGCGGCGGTTATGCTGG TTCCGTACCCGCCAGGTATCCCGCTCATTATGCCGGGTGAACGTTTTACTGAAGCTACCCGCTCCATTCTG GACTATCTGGAGTTTGCCCGTACCTTCGAGCGCGCGTTCCCGGGCTTTGACTCTGATGTTCACGGCCTCCA ACATCAAGATGGCCCGTCTGGCCGTTGTTATACCGTTGAATGCATCAAGGAATAA

SEQ ID NO:38(ldc2-co1 C332G/A795C DNA序列)

ATGTACAAAGATCTGAAATTCCCTGTTCTGATTGTACACCGCGATATCAAGGCGGACACGGTAGCCGGCGA GCGTGTTCGCGGTATTGCCCACGAACTCGAACAAGACGGCTTTAGCATTCTCTCTACGGCGTCTTCTGCGGAAGGCCGCATTGTGGCTAGCACGCACCACGGTCTCGCCTGCATCCTCGTGGCAGCTGAGGGTGCGGGTGAG AATCAGCGTCTGCTCCAAGACGTGGTTGAGCTGATCCGTGTAGCTCGCGTCCGTGCGCCACAGCTCCCGAT CTTCGCGCTGGGCGAACAGGTGACTATTGAAAACGCGCCTGCCGAATGTATGGCCGACCTGCACCAGCTCC GCGGCATTCTGTATCTCTTCGAGGATACTGTCCCGTTCCTGGCACGTCAGGTTGCACGCGCAGCGCGTAAC TACCTCGCTGGCCTCCTCCCGCCATTCTTCCGTGCACTCGTGGAGCACACGGCCCAAAGCAATTACTCTTG GCACACCCCGGGTCACGGTGGTGGTGTCGCTTACCGTAAATCTCCGGTAGGTCAAGCTTTCCACCAGTTCT TTGGCGAGAATACCCTCCGCTCTGACCTGTCTGTTAGCGTTCCAGAGCTGGGCAGCCTGCTGGATCACACT GGCCCTCTCGCGGAAGCAGAGGATCGTGCCGCTCGCAATTTCGGTGCGGACCACACCTTCTTTGTCATCAA TGGTACCTCTACTGCGAACAAAATCGTTTGGCACTCTATGGTTGGTCGCGAGGACCTGGTGCTGGTCGATC GTAACTGTCACAACTCTATTCTGCACTCCATTATCATGACGGGTGCTATCCCACTGTACCTGACTCCGGAA CGCAACGAACTGGGTATTATCGGCCCTATTCCACTCTCCGAGTTTTCTAAACAATCTATCGCAGCAAAAAT TGCCGCCTCCCCACTCGCGCGTGGTCGTGAACCGAAAGTTAAACTGGCTGTCGTTACCAACTCTACCTATG ACGGTCTGTGTTACAACGCGGAACTGATCAAACAAACCCTCGGCGACTCTGTCGAGGTACTGCATTTCGAC GAGGCTTGGTATGCTTATGCGGCGTTTCACGAGTTCTACGACGGCCGCTACGGTATGGGCACTTCTCGTTC CGAAGAGGGTCCGCTGGTCTTTGCTACCCATTCTACCCACAAGATGCTCGCGGCTTTTTCCCAAGCTAGCA TGATTCACGTTCAGGATGGTGGTACGCGCAAGCTGGACGTCGCCCGCTTTAACGAAGCCTTTATGATGCAC ATCAGCACCTCTCCACAGTACGGCATCATTGCGTCTCTCGATGTCGCAAGCGCTATGATGGAAGGTCCTGC CGGTCGTAGCCTGATCCAAGAGACGTTCGATGAGGCGCTGTCCTTCCGTCGTGCTCTGGCGAATGTCCGTC AGAACCTGGACCGTAATGATTGGTGGTTCGGTGTCTGGCAACCGGAGCAGGTTGAGGGCACCGACCAGGTAGGTACTCACGACTGGGTTCTCGAGCCTAGCGCGGACTGGCATGGTTTTGGTGACATTGCGGAGGATTACGT TCTCCTCGATCCTATCAAAGTTACCCTGACCACCCCAGGTCTGAGCGCTGGCGGTAAACTCTCTGAACAAG GCATCCCGGCAGCTATCGTTAGCCGTTTCCTGTGGGAACGTGGTCTGGTGGTCGAGAAAACGGGTCTGTAC TCTTTCCTGGTTCTGTTCTCCATGGGTATCACGAAAGGCAAATGGTCTACTCTGGTTACCGAGCTGCTCGA ATTCAAACGCTGTTACGACGCGAATCTGCCACTCCTGGATGTGCTGCCTTCTGTAGCGCAGGCGGGTGGTA AACGCTATAACGGTGTAGGTCTGCGTGATCTGTCCGATGCCATGCACGCTTCTTATCGTGACAATGCCACG GCGAAGGCCATGAAGCGTATGTATACGGTGCTCCCGGAAGTAGCCATGCGCCCGTCCGAAGCTTATGATAA GCTCGTACGCGGTGAAGTCGAAGCTGTTCCTATTGCACGTCTCGAGGGTCGTATTGCGGCGGTTATGCTGG TTCCGTACCCGCCAGGTATCCCGCTCATTATGCCGGGTGAACGTTTTACTGAAGCTACCCGCTCCATTCTG GACTATCTGGAGTTTGCCCGTACCTTCGAGCGCGCGTTCCCGGGCTTTGACTCTGATGTTCACGGCCTCCA ACATCAAGATGGCCCGTCTGGCCGTTGTTATACCGTTGAATGCATCAAGGAATAA

SEQ ID NO:39(ldc2-co1 A785C/A795C DNA序列)

ATGTACAAAGATCTGAAATTCCCTGTTCTGATTGTACACCGCGATATCAAGGCGGACACGGTAGCCGGCGA GCGTGTTCGCGGTATTGCCCACGAACTCGAACAAGACGGCTTTAGCATTCTCTCTACGGCGTCTTCTGCGGAAGGCCGCATTGTGGCTAGCACGCACCACGGTCTCGCCTGCATCCTCGTGGCAGCTGAGGGTGCGGGTGAG AATCAGCGTCTGCTCCAAGACGTGGTTGAGCTGATCCGTGTAGCTCGCGTCCGTGCGCCACAGCTCCCGAT CTTCGCGCTGGGCGAACAGGTGACTATTGAAAACGCGCCTGCCGAATCTATGGCCGACCTGCACCAGCTCC GCGGCATTCTGTATCTCTTCGAGGATACTGTCCCGTTCCTGGCACGTCAGGTTGCACGCGCAGCGCGTAAC TACCTCGCTGGCCTCCTCCCGCCATTCTTCCGTGCACTCGTGGAGCACACGGCCCAAAGCAATTACTCTTG GCACACCCCGGGTCACGGTGGTGGTGTCGCTTACCGTAAATCTCCGGTAGGTCAAGCTTTCCACCAGTTCT TTGGCGAGAATACCCTCCGCTCTGACCTGTCTGTTAGCGTTCCAGAGCTGGGCAGCCTGCTGGATCACACT GGCCCTCTCGCGGAAGCAGAGGATCGTGCCGCTCGCAATTTCGGTGCGGACCACACCTTCTTTGTCATCAA TGGTACCTCTACTGCGAACAAAATCGTTTGGCACTCTATGGTTGGTCGCGAGGACCTGGTGCTGGTCGATC GTACCTGTCACAACTCTATTCTGCACTCCATTATCATGACGGGTGCTATCCCACTGTACCTGACTCCGGAA CGCAACGAACTGGGTATTATCGGCCCTATTCCACTCTCCGAGTTTTCTAAACAATCTATCGCAGCAAAAAT TGCCGCCTCCCCACTCGCGCGTGGTCGTGAACCGAAAGTTAAACTGGCTGTCGTTACCAACTCTACCTATG ACGGTCTGTGTTACAACGCGGAACTGATCAAACAAACCCTCGGCGACTCTGTCGAGGTACTGCATTTCGAC GAGGCTTGGTATGCTTATGCGGCGTTTCACGAGTTCTACGACGGCCGCTACGGTATGGGCACTTCTCGTTC CGAAGAGGGTCCGCTGGTCTTTGCTACCCATTCTACCCACAAGATGCTCGCGGCTTTTTCCCAAGCTAGCA TGATTCACGTTCAGGATGGTGGTACGCGCAAGCTGGACGTCGCCCGCTTTAACGAAGCCTTTATGATGCAC ATCAGCACCTCTCCACAGTACGGCATCATTGCGTCTCTCGATGTCGCAAGCGCTATGATGGAAGGTCCTGC CGGTCGTAGCCTGATCCAAGAGACGTTCGATGAGGCGCTGTCCTTCCGTCGTGCTCTGGCGAATGTCCGTC AGAACCTGGACCGTAATGATTGGTGGTTCGGTGTCTGGCAACCGGAGCAGGTTGAGGGCACCGACCAGGTAGGTACTCACGACTGGGTTCTCGAGCCTAGCGCGGACTGGCATGGTTTTGGTGACATTGCGGAGGATTACGT TCTCCTCGATCCTATCAAAGTTACCCTGACCACCCCAGGTCTGAGCGCTGGCGGTAAACTCTCTGAACAAG GCATCCCGGCAGCTATCGTTAGCCGTTTCCTGTGGGAACGTGGTCTGGTGGTCGAGAAAACGGGTCTGTAC TCTTTCCTGGTTCTGTTCTCCATGGGTATCACGAAAGGCAAATGGTCTACTCTGGTTACCGAGCTGCTCGA ATTCAAACGCTGTTACGACGCGAATCTGCCACTCCTGGATGTGCTGCCTTCTGTAGCGCAGGCGGGTGGTA AACGCTATAACGGTGTAGGTCTGCGTGATCTGTCCGATGCCATGCACGCTTCTTATCGTGACAATGCCACG GCGAAGGCCATGAAGCGTATGTATACGGTGCTCCCGGAAGTAGCCATGCGCCCGTCCGAAGCTTATGATAA GCTCGTACGCGGTGAAGTCGAAGCTGTTCCTATTGCACGTCTCGAGGGTCGTATTGCGGCGGTTATGCTGG TTCCGTACCCGCCAGGTATCCCGCTCATTATGCCGGGTGAACGTTTTACTGAAGCTACCCGCTCCATTCTG GACTATCTGGAGTTTGCCCGTACCTTCGAGCGCGCGTTCCCGGGCTTTGACTCTGATGTTCACGGCCTCCA ACATCAAGATGGCCCGTCTGGCCGTTGTTATACCGTTGAATGCATCAAGGAATAA

SEQ ID NO:40(ldc2-co1 C332G/A785C/A795C DNA序列)

ATGTACAAAGATCTGAAATTCCCTGTTCTGATTGTACACCGCGATATCAAGGCGGACACGGTAGCCGGCGA GCGTGTTCGCGGTATTGCCCACGAACTCGAACAAGACGGCTTTAGCATTCTCTCTACGGCGTCTTCTGCGGAAGGCCGCATTGTGGCTAGCACGCACCACGGTCTCGCCTGCATCCTCGTGGCAGCTGAGGGTGCGGGTGAG AATCAGCGTCTGCTCCAAGACGTGGTTGAGCTGATCCGTGTAGCTCGCGTCCGTGCGCCACAGCTCCCGAT CTTCGCGCTGGGCGAACAGGTGACTATTGAAAACGCGCCTGCCGAATGTATGGCCGACCTGCACCAGCTCC GCGGCATTCTGTATCTCTTCGAGGATACTGTCCCGTTCCTGGCACGTCAGGTTGCACGCGCAGCGCGTAAC TACCTCGCTGGCCTCCTCCCGCCATTCTTCCGTGCACTCGTGGAGCACACGGCCCAAAGCAATTACTCTTG GCACACCCCGGGTCACGGTGGTGGTGTCGCTTACCGTAAATCTCCGGTAGGTCAAGCTTTCCACCAGTTCT TTGGCGAGAATACCCTCCGCTCTGACCTGTCTGTTAGCGTTCCAGAGCTGGGCAGCCTGCTGGATCACACT GGCCCTCTCGCGGAAGCAGAGGATCGTGCCGCTCGCAATTTCGGTGCGGACCACACCTTCTTTGTCATCAA TGGTACCTCTACTGCGAACAAAATCGTTTGGCACTCTATGGTTGGTCGCGAGGACCTGGTGCTGGTCGATC GTACCTGTCACAACTCTATTCTGCACTCCATTATCATGACGGGTGCTATCCCACTGTACCTGACTCCGGAA CGCAACGAACTGGGTATTATCGGCCCTATTCCACTCTCCGAGTTTTCTAAACAATCTATCGCAGCAAAAAT TGCCGCCTCCCCACTCGCGCGTGGTCGTGAACCGAAAGTTAAACTGGCTGTCGTTACCAACTCTACCTATG ACGGTCTGTGTTACAACGCGGAACTGATCAAACAAACCCTCGGCGACTCTGTCGAGGTACTGCATTTCGAC GAGGCTTGGTATGCTTATGCGGCGTTTCACGAGTTCTACGACGGCCGCTACGGTATGGGCACTTCTCGTTC CGAAGAGGGTCCGCTGGTCTTTGCTACCCATTCTACCCACAAGATGCTCGCGGCTTTTTCCCAAGCTAGCA TGATTCACGTTCAGGATGGTGGTACGCGCAAGCTGGACGTCGCCCGCTTTAACGAAGCCTTTATGATGCAC ATCAGCACCTCTCCACAGTACGGCATCATTGCGTCTCTCGATGTCGCAAGCGCTATGATGGAAGGTCCTGC CGGTCGTAGCCTGATCCAAGAGACGTTCGATGAGGCGCTGTCCTTCCGTCGTGCTCTGGCGAATGTCCGTC AGAACCTGGACCGTAATGATTGGTGGTTCGGTGTCTGGCAACCGGAGCAGGTTGAGGGCACCGACCAGGTAGGTACTCACGACTGGGTTCTCGAGCCTAGCGCGGACTGGCATGGTTTTGGTGACATTGCGGAGGATTACGT TCTCCTCGATCCTATCAAAGTTACCCTGACCACCCCAGGTCTGAGCGCTGGCGGTAAACTCTCTGAACAAG GCATCCCGGCAGCTATCGTTAGCCGTTTCCTGTGGGAACGTGGTCTGGTGGTCGAGAAAACGGGTCTGTAC TCTTTCCTGGTTCTGTTCTCCATGGGTATCACGAAAGGCAAATGGTCTACTCTGGTTACCGAGCTGCTCGA ATTCAAACGCTGTTACGACGCGAATCTGCCACTCCTGGATGTGCTGCCTTCTGTAGCGCAGGCGGGTGGTA AACGCTATAACGGTGTAGGTCTGCGTGATCTGTCCGATGCCATGCACGCTTCTTATCGTGACAATGCCACG GCGAAGGCCATGAAGCGTATGTATACGGTGCTCCCGGAAGTAGCCATGCGCCCGTCCGAAGCTTATGATAA GCTCGTACGCGGTGAAGTCGAAGCTGTTCCTATTGCACGTCTCGAGGGTCGTATTGCGGCGGTTATGCTGG TTCCGTACCCGCCAGGTATCCCGCTCATTATGCCGGGTGAACGTTTTACTGAAGCTACCCGCTCCATTCTG GACTATCTGGAGTTTGCCCGTACCTTCGAGCGCGCGTTCCCGGGCTTTGACTCTGATGTTCACGGCCTCCA ACATCAAGATGGCCCGTCTGGCCGTTGTTATACCGTTGAATGCATCAAGGAATAA

SEQ ID NO:41(cadA DNA序列)

ATGAACGTTATTGCAATATTGAATCACATGGGGGTTTATTTTAAAGAAGAACCCATCCGTGAACTTCATCG CGCGCTTGAACGTCTGAACTTCCAGATTGTTTACCCGAACGACCGTGACGACTTATTAAAACTGATCGAAAACAATGCGCGTCTGTGCGGCGTTATTTTTGACTGGGATAAATATAATCTCGAGCTGTGCGAAGAAATTAGC AAAATGAACGAGAACCTGCCGTTGTACGCGTTCGCTAATACGTATTCCACTCTCGATGTAAGCCTGAATGA CCTGCGTTTACAGATTAGCTTCTTTGAATATGCGCTGGGTGCTGCTGAAGATATTGCTAATAAGATCAAGC AGACCACTGACGAATATATCAACACTATTCTGCCTCCGCTGACTAAAGCACTGTTTAAATATGTTCGTGAA GGTAAATATACTTTCTGTACTCCTGGTCACATGGGCGGTACTGCATTCCAGAAAAGCCCGGTAGGTAGCCT GTTCTATGATTTCTTTGGTCCGAATACCATGAAATCTGATATTTCCATTTCAGTATCTGAACTGGGTTCTC TGCTGGATCACAGTGGTCCACACAAAGAAGCAGAACAGTATATCGCTCGCGTCTTTAACGCAGACCGCAGC TACATGGTGACCAACGGTACTTCCACTGCGAACAAAATTGTTGGTATGTACTCTGCTCCAGCAGGCAGCAC CATTCTGATTGACCGTAACTGCCACAAATCGCTGACCCACCTGATGATGATGAGCGATGTTACGCCAATCT ATTTCCGCCCGACCCGTAACGCTTACGGTATTCTTGGTGGTATCCCACAGAGTGAATTCCAGCACGCTACC ATTGCTAAGCGCGTGAAAGAAACACCAAACGCAACCTGGCCGGTACATGCTGTAATTACCAACTCTACCTA TGATGGTCTGCTGTACAACACCGACTTCATCAAGAAAACACTGGATGTGAAATCCATCCACTTTGACTCCG CGTGGGTGCCTTACACCAACTTCTCACCGATTTACGAAGGTAAATGCGGTATGAGCGGTGGCCGTGTAGAA GGGAAAGTGATTTACGAAACCCAGTCCACTCACAAACTGCTGGCGGCGTTCTCTCAGGCTTCCATGATCCA CGTTAAAGGTGACGTAAACGAAGAAACCTTTAACGAAGCCTACATGATGCACACCACCACTTCTCCGCACT ACGGTATCGTGGCGTCCACTGAAACCGCTGCGGCGATGATGAAAGGCAATGCAGGTAAGCGTCTGATCAAC GGTTCTATTGAACGTGCGATCAAATTCCGTAAAGAGATCAAACGTCTGAGAACGGAATCTGATGGCTGGTT CTTTGATGTATGGCAGCCGGATCATATCGATACGACTGAATGCTGGCCGCTGCGTTCTGACAGCACCTGGC ACGGCTTCAAAAACATCGATAACGAGCACATGTATCTTGACCCGATCAAAGTCACCCTGCTGACTCCGGGGATGGAAAAAGACGGCACCATGAGCGACTTTGGTATTCCGGCCAGCATCGTGGCGAAATACCTCGACGAACA TGGCATCGTTGTTGAGAAAACCGGTCCGTATAACCTGCTGTTCCTGTTCAGCATCGGTATCGATAAGACCA AAGCACTGAGCCTGCTGCGTGCTCTGACTGACTTTAAACGTGCGTTCGACCTGAACCTGCGTGTGAAAAAC ATGCTGCCGTCTCTGTATCGTGAAGATCCTGAATTCTATGAAAACATGCGTATTCAGGAACTGGCTCAGAA TATCCACAAACTGATTGTTCACCACAATCTGCCGGATCTGATGTATCGCGCATTTGAAGTGCTGCCGACGA TGGTAATGACTCCGTATGCTGCATTCCAGAAAGAGCTGCACGGTATGACCGAAGAAGTTTACCTCGACGAA ATGGTAGGTCGTATTAACGCCAATATGATCCTTCCGTACCCGCCGGGAGTTCCTCTGGTAATGCCGGGTGA AATGATCACCGAAGAAAGCCGTCCGGTTCTGGAGTTCCTGCAGATGCTGTGTGAAATCGGCGCTCACTATC CGGGCTTTGAAACCGATATTCACGGTGCATACCGTCAGGCTGATGGCCGCTATACCGTTAAGGTATTGAAA GAAGAAAGCAAAAAATAA

SEQ ID NO:42(ldcC DNA序列)

ATGAACATCATTGCCATTATGGGACCGCATGGCGTCTTTTATAAAGATGAGCCCATCAAAGAACTGGAGTC GGCGCTGGTGGCGCAAGGCTTTCAGATTATCTGGCCACAAAACAGCGTTGATTTGCTGAAATTTATCGAGCATAACCCTCGAATTTGCGGCGTGATTTTTGACTGGGATGAGTACAGTCTCGATTTATGTAGCGATATCAAT CAGCTTAATGAATATCTCCCGCTTTATGCCTTCATCAACACCCACTCGACGATGGATGTCAGCGTGCAGGA TATGCGGATGGCGCTCTGGTTTTTTGAATATGCGCTGGGGCAGGCGGAAGATATCGCCATTCGTATGCGTC AGTACACCGACGAATATCTTGATAACATTACACCGCCGTTCACGAAAGCCTTGTTTACCTACGTCAAAGAG CGGAAGTACACCTTTTGTACGCCGGGGCATATGGGCGGCACCGCATATCAAAAAAGCCCGGTTGGCTGTCT GTTTTATGATTTTTTCGGCGGGAATACTCTTAAGGCTGATGTCTCTATTTCGGTCACCGAGCTTGGTTCGT TGCTCGACCACACCGGGCCACACCTGGAAGCGGAAGAGTACATCGCGCGGACTTTTGGCGCGGAACAGAGT TATATCGTTACCAACGGAACATCGACGTCGAACAAAATTGTGGGTATGTACGCCGCGCCATCCGGCAGTAC GCTGTTGATCGACCGCAATTGTCATAAATCGCTGGCGCATCTGTTGATGATGAACGATGTAGTGCCAGTCT GGCTGAAACCGACGCGTAATGCGTTGGGGATTCTTGGTGGGATCCCGCGCCGTGAATTTACTCGCGACAGC ATCGAAGAGAAAGTCGCTGCTACCACGCAAGCACAATGGCCGGTTCATGCGGTGATCACCAACTCCACCTA TGATGGCTTGCTCTACAACACCGACTGGATCAAACAGACGCTGGATGTCCCGTCGATTCACTTCGATTCTG CCTGGGTGCCGTACACCCATTTTCATCCGATCTACCAGGGTAAAAGTGGTATGAGCGGCGAGCGTGTTGCG GGAAAAGTGATCTTCGAAACGCAATCGACCCACAAAATGCTGGCGGCGTTATCGCAGGCTTCGCTGATCCA CATTAAAGGCGAGTATGACGAAGAGGCCTTTAACGAAGCCTTTATGATGCATACCACCACCTCGCCCAGTT ATCCCATTGTTGCTTCGGTTGAGACGGCGGCGGCGATGCTGCGTGGTAATCCGGGCAAACGGCTGATTAAC CGTTCAGTAGAACGAGCTCTGCATTTTCGCAAAGAGGTCCAGCGGCTGCGGGAAGAGTCTGACGGTTGGTT TTTCGATATCTGGCAACCGCCGCAGGTGGATGAAGCCGAATGCTGGCCCGTTGCGCCTGGCGAACAGTGGC ACGGCTTTAACGATGCGGATGCCGATCATATGTTTCTCGATCCGGTTAAAGTCACTATTTTGACACCGGGGATGGACGAGCAGGGCAATATGAGCGAGGAGGGGATCCCGGCGGCGCTGGTAGCAAAATTCCTCGACGAACG TGGGATCGTAGTAGAGAAAACCGGCCCTTATAACCTGCTGTTTCTCTTTAGTATTGGCATCGATAAAACCA AAGCAATGGGATTATTGCGTGGGTTGACGGAATTCAAACGCTCTTACGATCTCAACCTGCGGATCAAAAAT ATGCTACCCGATCTCTATGCAGAAGATCCCGATTTCTACCGCAATATGCGTATTCAGGATCTGGCACAAGG GATCCATAAGCTGATTCGTAAACACGATCTTCCCGGTTTGATGTTGCGGGCATTCGATACTTTGCCGGAGA TGATCATGACGCCACATCAGGCATGGCAACGACAAATTAAAGGCGAAGTAGAAACCATTGCGCTGGAACAA CTGGTCGGTAGAGTATCGGCAAATATGATCCTGCCTTATCCACCGGGCGTACCGCTGTTGATGCCTGGAGA AATGCTGACCAAAGAGAGCCGCACAGTACTCGATTTTCTACTGATGCTTTGTTCCGTCGGGCAACATTACC CCGGTTTTGAAACGGATATTCACGGCGCGAAACAGGACGAAGACGGCGTTTACCGCGTACGAGTCCTAAAA ATGGCGGGATAA

参考文献

下文列举的参考文献、专利和公开的专利申请以及在说明书中引用的所有参考文献均以其全部内容并入本文作参考，就如同其在本文示出一样。

1.Wertz et al.“Chimeric nature of two plasmids of Hafnia alveiencoding the bacteriocins alveicins A and B.”Journal of Bacteriology,(2004)186: 1598-1605).

序列表

<110> 凯赛生物产业有限公司

<120> 用于生产赖氨酸或赖氨酸衍生产物的重组四环素外排泵的表达及其方法和应用

<130> 77705-8006

<160> 42

<170> PatentIn version 3.5

<210> 1

<211> 1191

<212> DNA

<213> Escherichia coli

<400> 1

atgaaatcta acaatgcgct catcgtcatc ctcggcaccg tcaccctgga tgctgtaggc 60

ataggcttgg ttatgccggt actgccgggc ctcttgcggg atatcgtcca ttccgacagc 120

atcgccagtc actatggcgt gctgctagcg ctatatgcgt tgatgcaatt tctatgcgca 180

cccgttctcg gagcactgtc cgaccgcttt ggccgccgcc cagtcctgct cgcttcgcta 240

cttggagcca ctatcgacta cgcgatcatg gcgaccacac ccgtcctgtg gatcctctac 300

gccggacgca tcgtggccgg catcaccggc gccacaggtg cggttgctgg cgcctatatc 360

gccgacatca ccgatgggga agatcgggct cgccacttcg ggctcatgag cgcttgtttc 420

ggcgtgggta tggtggcagg ccccgtggcc gggggactgt tgggcgccat ctccttgcat 480

gcaccattcc ttgcggcggc ggtgctcaac ggcctcaacc tactactggg ctgcttccta 540

atgcaggagt cgcataaggg agagcgtcga ccgatgccct tgagagcctt caacccagtc 600

agctccttcc ggtgggcgcg gggcatgact atcgtcgccg cacttatgac tgtcttcttt 660

atcatgcaac tcgtaggaca ggtgccggca gcgctctggg tcattttcgg cgaggaccgc 720

tttcgctgga gcgcgacgat gatcggcctg tcgcttgcgg tattcggaat cttgcacgcc 780

ctcgctcaag ccttcgtcac tggtcccgcc accaaacgtt tcggcgagaa gcaggccatt 840

atcgccggca tggcggccga cgcgctgggc tacgtcttgc tggcgttcgc gacgcgaggc 900

tggatggcct tccccattat gattcttctc gcttccggcg gcatcgggat gcccgcgttg 960

caggccatgc tgtccaggca ggtagatgac gaccatcagg gacagcttca aggatcgctc 1020

gcggctctta ccagcctaac ttcgatcatt ggaccgctga tcgtcacggc gatttatgcc 1080

gcctcggcga gcacatggaa cgggttggca tggattgtag gcgccgccct ataccttgtc 1140

tgcctccccg cgttgcgtcg cggtgcatgg agccgggcca cctcgacctg a 1191

<210> 2

<211> 396

<212> PRT

<213> Escherichia coli

<400> 2

Met Lys Ser Asn Asn Ala Leu Ile Val Ile Leu Gly Thr Val Thr Leu

1 5 10 15

Asp Ala Val Gly Ile Gly Leu Val Met Pro Val Leu Pro Gly Leu Leu

20 25 30

Arg Asp Ile Val His Ser Asp Ser Ile Ala Ser His Tyr Gly Val Leu

35 40 45

Leu Ala Leu Tyr Ala Leu Met Gln Phe Leu Cys Ala Pro Val Leu Gly

50 55 60

Ala Leu Ser Asp Arg Phe Gly Arg Arg Pro Val Leu Leu Ala Ser Leu

65 70 75 80

Leu Gly Ala Thr Ile Asp Tyr Ala Ile Met Ala Thr Thr Pro Val Leu

85 90 95

Trp Ile Leu Tyr Ala Gly Arg Ile Val Ala Gly Ile Thr Gly Ala Thr

100 105 110

Gly Ala Val Ala Gly Ala Tyr Ile Ala Asp Ile Thr Asp Gly Glu Asp

115 120 125

Arg Ala Arg His Phe Gly Leu Met Ser Ala Cys Phe Gly Val Gly Met

130 135 140

Val Ala Gly Pro Val Ala Gly Gly Leu Leu Gly Ala Ile Ser Leu His

145 150 155 160

Ala Pro Phe Leu Ala Ala Ala Val Leu Asn Gly Leu Asn Leu Leu Leu

165 170 175

Gly Cys Phe Leu Met Gln Glu Ser His Lys Gly Glu Arg Arg Pro Met

180 185 190

Pro Leu Arg Ala Phe Asn Pro Val Ser Ser Phe Arg Trp Ala Arg Gly

195 200 205

Met Thr Ile Val Ala Ala Leu Met Thr Val Phe Phe Ile Met Gln Leu

210 215 220

Val Gly Gln Val Pro Ala Ala Leu Trp Val Ile Phe Gly Glu Asp Arg

225 230 235 240

Phe Arg Trp Ser Ala Thr Met Ile Gly Leu Ser Leu Ala Val Phe Gly

245 250 255

Ile Leu His Ala Leu Ala Gln Ala Phe Val Thr Gly Pro Ala Thr Lys

260 265 270

Arg Phe Gly Glu Lys Gln Ala Ile Ile Ala Gly Met Ala Ala Asp Ala

275 280 285

Leu Gly Tyr Val Leu Leu Ala Phe Ala Thr Arg Gly Trp Met Ala Phe

290 295 300

Pro Ile Met Ile Leu Leu Ala Ser Gly Gly Ile Gly Met Pro Ala Leu

305 310 315 320

Gln Ala Met Leu Ser Arg Gln Val Asp Asp Asp His Gln Gly Gln Leu

325 330 335

Gln Gly Ser Leu Ala Ala Leu Thr Ser Leu Thr Ser Ile Ile Gly Pro

340 345 350

Leu Ile Val Thr Ala Ile Tyr Ala Ala Ser Ala Ser Thr Trp Asn Gly

355 360 365

Leu Ala Trp Ile Val Gly Ala Ala Leu Tyr Leu Val Cys Leu Pro Ala

370 375 380

Leu Arg Arg Gly Ala Trp Ser Arg Ala Thr Ser Thr

385 390 395

<210> 3

<211> 449

<212> PRT

<213> Escherichia coli

<400> 3

Met Ser Glu Ile Val Val Ser Lys Phe Gly Gly Thr Ser Val Ala Asp

1 5 10 15

Phe Asp Ala Met Asn Arg Ser Ala Asp Ile Val Leu Ser Asp Ala Asn

20 25 30

Val Arg Leu Val Val Leu Ser Ala Ser Ala Gly Ile Thr Asn Leu Leu

35 40 45

Val Ala Leu Ala Glu Gly Leu Glu Pro Gly Glu Arg Phe Glu Lys Leu

50 55 60

Asp Ala Ile Arg Asn Ile Gln Phe Ala Ile Leu Glu Arg Leu Arg Tyr

65 70 75 80

Pro Asn Val Ile Arg Glu Glu Ile Glu Arg Leu Leu Glu Asn Ile Thr

85 90 95

Val Leu Ala Glu Ala Ala Ala Leu Ala Thr Ser Pro Ala Leu Thr Asp

100 105 110

Glu Leu Val Ser His Gly Glu Leu Met Ser Thr Leu Leu Phe Val Glu

115 120 125

Ile Leu Arg Glu Arg Asp Val Gln Ala Gln Trp Phe Asp Val Arg Lys

130 135 140

Val Met Arg Thr Asn Asp Arg Phe Gly Arg Ala Glu Pro Asp Ile Ala

145 150 155 160

Ala Leu Ala Glu Leu Ala Ala Leu Gln Leu Leu Pro Arg Leu Asn Glu

165 170 175

Gly Leu Val Ile Thr Gln Gly Phe Ile Gly Ser Glu Asn Lys Gly Arg

180 185 190

Thr Thr Thr Leu Gly Arg Gly Gly Ser Asp Tyr Thr Ala Ala Leu Leu

195 200 205

Ala Glu Ala Leu His Ala Ser Arg Val Asp Ile Trp Thr Asp Val Pro

210 215 220

Gly Ile Tyr Thr Thr Asp Pro Arg Val Val Ser Ala Ala Lys Arg Ile

225 230 235 240

Asp Glu Ile Ala Phe Ala Glu Ala Ala Glu Met Ala Thr Phe Gly Ala

245 250 255

Lys Val Leu His Pro Ala Thr Leu Leu Pro Ala Val Arg Ser Asp Ile

260 265 270

Pro Val Phe Val Gly Ser Ser Lys Asp Pro Arg Ala Gly Gly Thr Leu

275 280 285

Val Cys Asn Lys Thr Glu Asn Pro Pro Leu Phe Arg Ala Leu Ala Leu

290 295 300

Arg Arg Asn Gln Thr Leu Leu Thr Leu His Ser Leu Asn Met Leu His

305 310 315 320

Ser Arg Gly Phe Leu Ala Glu Val Phe Gly Ile Leu Ala Arg His Asn

325 330 335

Ile Ser Val Asp Leu Ile Thr Thr Ser Glu Val Ser Val Ala Leu Thr

340 345 350

Leu Asp Thr Thr Gly Ser Thr Ser Thr Gly Asp Thr Leu Leu Thr Gln

355 360 365

Ser Leu Leu Met Glu Leu Ser Ala Leu Cys Arg Val Glu Val Glu Glu

370 375 380

Gly Leu Ala Leu Val Ala Leu Ile Gly Asn Asp Leu Ser Lys Ala Cys

385 390 395 400

Gly Val Gly Lys Glu Val Phe Gly Val Leu Glu Pro Phe Asn Ile Arg

405 410 415

Met Ile Cys Tyr Gly Ala Ser Ser His Asn Leu Cys Phe Leu Val Pro

420 425 430

Gly Glu Asp Ala Glu Gln Val Val Gln Lys Leu His Ser Asn Leu Phe

435 440 445

Glu

<210> 4

<211> 292

<212> PRT

<213> Escherichia coli

<400> 4

Met Phe Thr Gly Ser Ile Val Ala Ile Val Thr Pro Met Asp Glu Lys

1 5 10 15

Gly Asn Val Cys Arg Ala Ser Leu Lys Lys Leu Ile Asp Tyr His Val

20 25 30

Ala Ser Gly Thr Ser Ala Ile Val Ser Val Gly Thr Thr Gly Glu Ser

35 40 45

Ala Thr Leu Asn His Asp Glu His Ala Asp Val Val Met Met Thr Leu

50 55 60

Asp Leu Ala Asp Gly Arg Ile Pro Val Ile Ala Gly Thr Gly Ala Asn

65 70 75 80

Ala Thr Ala Glu Ala Ile Ser Leu Thr Gln Arg Phe Asn Asp Ser Gly

85 90 95

Ile Val Gly Cys Leu Thr Val Thr Pro Tyr Tyr Asn Arg Pro Ser Gln

100 105 110

Glu Gly Leu Tyr Gln His Phe Lys Ala Ile Ala Glu His Thr Asp Leu

115 120 125

Pro Gln Ile Leu Tyr Asn Val Pro Ser Arg Thr Gly Cys Asp Leu Leu

130 135 140

Pro Glu Thr Val Gly Arg Leu Ala Lys Val Lys Asn Ile Ile Gly Ile

145 150 155 160

Lys Glu Ala Thr Gly Asn Leu Thr Arg Val Asn Gln Ile Lys Glu Leu

165 170 175

Val Ser Asp Asp Phe Val Leu Leu Ser Gly Asp Asp Ala Ser Ala Leu

180 185 190

Asp Phe Met Gln Leu Gly Gly His Gly Val Ile Ser Val Thr Ala Asn

195 200 205

Val Ala Ala Arg Asp Met Ala Gln Met Cys Lys Leu Ala Ala Glu Gly

210 215 220

His Phe Ala Glu Ala Arg Val Ile Asn Gln Arg Leu Met Pro Leu His

225 230 235 240

Asn Lys Leu Phe Val Glu Pro Asn Pro Ile Pro Val Lys Trp Ala Cys

245 250 255

Lys Glu Leu Gly Leu Val Ala Thr Asp Thr Leu Arg Leu Pro Met Thr

260 265 270

Pro Ile Thr Asp Ser Gly Arg Glu Thr Val Arg Ala Ala Leu Lys His

275 280 285

Ala Gly Leu Leu

290

<210> 5

<211> 420

<212> PRT

<213> Escherichia coli

<400> 5

Met Pro His Ser Leu Phe Ser Thr Asp Thr Asp Leu Thr Ala Glu Asn

1 5 10 15

Leu Leu Arg Leu Pro Ala Glu Phe Gly Cys Pro Val Trp Val Tyr Asp

20 25 30

Ala Gln Ile Ile Arg Arg Gln Ile Ala Ala Leu Lys Gln Phe Asp Val

35 40 45

Val Arg Phe Ala Gln Lys Ala Cys Ser Asn Ile His Ile Leu Arg Leu

50 55 60

Met Arg Glu Gln Gly Val Lys Val Asp Ser Val Ser Leu Gly Glu Ile

65 70 75 80

Glu Arg Ala Leu Ala Ala Gly Tyr Asn Pro Gln Thr His Pro Asp Asp

85 90 95

Ile Val Phe Thr Ala Asp Val Ile Asp Gln Ala Thr Leu Glu Arg Val

100 105 110

Ser Glu Leu Gln Ile Pro Val Asn Ala Gly Ser Val Asp Met Leu Asp

115 120 125

Gln Leu Gly Gln Val Ser Pro Gly His Arg Val Trp Leu Arg Val Asn

130 135 140

Pro Gly Phe Gly His Gly His Ser Gln Lys Thr Asn Thr Gly Gly Glu

145 150 155 160

Asn Ser Lys His Gly Ile Trp Tyr Thr Asp Leu Pro Ala Ala Leu Asp

165 170 175

Val Ile Gln Arg His His Leu Gln Leu Val Gly Ile His Met His Ile

180 185 190

Gly Ser Gly Val Asp Tyr Ala His Leu Glu Gln Val Cys Gly Ala Met

195 200 205

Val Arg Gln Val Ile Glu Phe Gly Gln Asp Leu Gln Ala Ile Ser Ala

210 215 220

Gly Gly Gly Leu Ser Val Pro Tyr Gln Gln Gly Glu Glu Ala Val Asp

225 230 235 240

Thr Glu His Tyr Tyr Gly Leu Trp Asn Ala Ala Arg Glu Gln Ile Ala

245 250 255

Arg His Leu Gly His Pro Val Lys Leu Glu Ile Glu Pro Gly Arg Phe

260 265 270

Leu Val Ala Gln Ser Gly Val Leu Ile Thr Gln Val Arg Ser Val Lys

275 280 285

Gln Met Gly Ser Arg His Phe Val Leu Val Asp Ala Gly Phe Asn Asp

290 295 300

Leu Met Arg Pro Ala Met Tyr Gly Ser Tyr His His Ile Ser Ala Leu

305 310 315 320

Ala Ala Asp Gly Arg Ser Leu Glu His Ala Pro Thr Val Glu Thr Val

325 330 335

Val Ala Gly Pro Leu Cys Glu Ser Gly Asp Val Phe Thr Gln Gln Glu

340 345 350

Gly Gly Asn Val Glu Thr Arg Ala Leu Pro Glu Val Lys Ala Gly Asp

355 360 365

Tyr Leu Val Leu His Asp Thr Gly Ala Tyr Gly Ala Ser Met Ser Ser

370 375 380

Asn Tyr Asn Ser Arg Pro Leu Leu Pro Glu Val Leu Phe Asp Asn Gly

385 390 395 400

Gln Ala Arg Leu Ile Arg Arg Arg Gln Thr Ile Glu Glu Leu Leu Ala

405 410 415

Leu Glu Leu Leu

420

<210> 6

<211> 715

<212> PRT

<213> Escherichia coli

<400> 6

Met Asn Val Ile Ala Ile Leu Asn His Met Gly Val Tyr Phe Lys Glu

1 5 10 15

Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asn Phe Gln

20 25 30

Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn

35 40 45

Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu

50 55 60

Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Asn Leu Pro Leu Tyr

65 70 75 80

Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu

85 90 95

Arg Leu Gln Ile Ser Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp

100 105 110

Ile Ala Asn Lys Ile Lys Gln Thr Thr Asp Glu Tyr Ile Asn Thr Ile

115 120 125

Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys

130 135 140

Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys

145 150 155 160

Ser Pro Val Gly Ser Leu Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met

165 170 175

Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp

180 185 190

His Ser Gly Pro His Lys Glu Ala Glu Gln Tyr Ile Ala Arg Val Phe

195 200 205

Asn Ala Asp Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn

210 215 220

Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Ile Leu Ile

225 230 235 240

Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp

245 250 255

Val Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu

260 265 270

Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg

275 280 285

Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr

290 295 300

Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys

305 310 315 320

Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr

325 330 335

Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly

340 345 350

Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu

355 360 365

Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val

370 375 380

Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser

385 390 395 400

Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met

405 410 415

Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala

420 425 430

Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Arg Thr Glu Ser Asp Gly

435 440 445

Trp Phe Phe Asp Val Trp Gln Pro Asp His Ile Asp Thr Thr Glu Cys

450 455 460

Trp Pro Leu Arg Ser Asp Ser Thr Trp His Gly Phe Lys Asn Ile Asp

465 470 475 480

Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro

485 490 495

Gly Met Glu Lys Asp Gly Thr Met Ser Asp Phe Gly Ile Pro Ala Ser

500 505 510

Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr

515 520 525

Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr

530 535 540

Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe

545 550 555 560

Asp Leu Asn Leu Arg Val Lys Asn Met Leu Pro Ser Leu Tyr Arg Glu

565 570 575

Asp Pro Glu Phe Tyr Glu Asn Met Arg Ile Gln Glu Leu Ala Gln Asn

580 585 590

Ile His Lys Leu Ile Val His His Asn Leu Pro Asp Leu Met Tyr Arg

595 600 605

Ala Phe Glu Val Leu Pro Thr Met Val Met Thr Pro Tyr Ala Ala Phe

610 615 620

Gln Lys Glu Leu His Gly Met Thr Glu Glu Val Tyr Leu Asp Glu Met

625 630 635 640

Val Gly Arg Ile Asn Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val

645 650 655

Pro Leu Val Met Pro Gly Glu Met Ile Thr Glu Glu Ser Arg Pro Val

660 665 670

Leu Glu Phe Leu Gln Met Leu Cys Glu Ile Gly Ala His Tyr Pro Gly

675 680 685

Phe Glu Thr Asp Ile His Gly Ala Tyr Arg Gln Ala Asp Gly Arg Tyr

690 695 700

Thr Val Lys Val Leu Lys Glu Glu Ser Lys Lys

705 710 715

<210> 7

<211> 713

<212> PRT

<213> Escherichia coli

<400> 7

Met Asn Ile Ile Ala Ile Met Gly Pro His Gly Val Phe Tyr Lys Asp

1 5 10 15

Glu Pro Ile Lys Glu Leu Glu Ser Ala Leu Val Ala Gln Gly Phe Gln

20 25 30

Ile Ile Trp Pro Gln Asn Ser Val Asp Leu Leu Lys Phe Ile Glu His

35 40 45

Asn Pro Arg Ile Cys Gly Val Ile Phe Asp Trp Asp Glu Tyr Ser Leu

50 55 60

Asp Leu Cys Ser Asp Ile Asn Gln Leu Asn Glu Tyr Leu Pro Leu Tyr

65 70 75 80

Ala Phe Ile Asn Thr His Ser Thr Met Asp Val Ser Val Gln Asp Met

85 90 95

Arg Met Ala Leu Trp Phe Phe Glu Tyr Ala Leu Gly Gln Ala Glu Asp

100 105 110

Ile Ala Ile Arg Met Arg Gln Tyr Thr Asp Glu Tyr Leu Asp Asn Ile

115 120 125

Thr Pro Pro Phe Thr Lys Ala Leu Phe Thr Tyr Val Lys Glu Arg Lys

130 135 140

Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Tyr Gln Lys

145 150 155 160

Ser Pro Val Gly Cys Leu Phe Tyr Asp Phe Phe Gly Gly Asn Thr Leu

165 170 175

Lys Ala Asp Val Ser Ile Ser Val Thr Glu Leu Gly Ser Leu Leu Asp

180 185 190

His Thr Gly Pro His Leu Glu Ala Glu Glu Tyr Ile Ala Arg Thr Phe

195 200 205

Gly Ala Glu Gln Ser Tyr Ile Val Thr Asn Gly Thr Ser Thr Ser Asn

210 215 220

Lys Ile Val Gly Met Tyr Ala Ala Pro Ser Gly Ser Thr Leu Leu Ile

225 230 235 240

Asp Arg Asn Cys His Lys Ser Leu Ala His Leu Leu Met Met Asn Asp

245 250 255

Val Val Pro Val Trp Leu Lys Pro Thr Arg Asn Ala Leu Gly Ile Leu

260 265 270

Gly Gly Ile Pro Arg Arg Glu Phe Thr Arg Asp Ser Ile Glu Glu Lys

275 280 285

Val Ala Ala Thr Thr Gln Ala Gln Trp Pro Val His Ala Val Ile Thr

290 295 300

Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Trp Ile Lys Gln

305 310 315 320

Thr Leu Asp Val Pro Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr

325 330 335

Thr His Phe His Pro Ile Tyr Gln Gly Lys Ser Gly Met Ser Gly Glu

340 345 350

Arg Val Ala Gly Lys Val Ile Phe Glu Thr Gln Ser Thr His Lys Met

355 360 365

Leu Ala Ala Leu Ser Gln Ala Ser Leu Ile His Ile Lys Gly Glu Tyr

370 375 380

Asp Glu Glu Ala Phe Asn Glu Ala Phe Met Met His Thr Thr Thr Ser

385 390 395 400

Pro Ser Tyr Pro Ile Val Ala Ser Val Glu Thr Ala Ala Ala Met Leu

405 410 415

Arg Gly Asn Pro Gly Lys Arg Leu Ile Asn Arg Ser Val Glu Arg Ala

420 425 430

Leu His Phe Arg Lys Glu Val Gln Arg Leu Arg Glu Glu Ser Asp Gly

435 440 445

Trp Phe Phe Asp Ile Trp Gln Pro Pro Gln Val Asp Glu Ala Glu Cys

450 455 460

Trp Pro Val Ala Pro Gly Glu Gln Trp His Gly Phe Asn Asp Ala Asp

465 470 475 480

Ala Asp His Met Phe Leu Asp Pro Val Lys Val Thr Ile Leu Thr Pro

485 490 495

Gly Met Asp Glu Gln Gly Asn Met Ser Glu Glu Gly Ile Pro Ala Ala

500 505 510

Leu Val Ala Lys Phe Leu Asp Glu Arg Gly Ile Val Val Glu Lys Thr

515 520 525

Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr

530 535 540

Lys Ala Met Gly Leu Leu Arg Gly Leu Thr Glu Phe Lys Arg Ser Tyr

545 550 555 560

Asp Leu Asn Leu Arg Ile Lys Asn Met Leu Pro Asp Leu Tyr Ala Glu

565 570 575

Asp Pro Asp Phe Tyr Arg Asn Met Arg Ile Gln Asp Leu Ala Gln Gly

580 585 590

Ile His Lys Leu Ile Arg Lys His Asp Leu Pro Gly Leu Met Leu Arg

595 600 605

Ala Phe Asp Thr Leu Pro Glu Met Ile Met Thr Pro His Gln Ala Trp

610 615 620

Gln Arg Gln Ile Lys Gly Glu Val Glu Thr Ile Ala Leu Glu Gln Leu

625 630 635 640

Val Gly Arg Val Ser Ala Asn Met Ile Leu Pro Tyr Pro Pro Gly Val

645 650 655

Pro Leu Leu Met Pro Gly Glu Met Leu Thr Lys Glu Ser Arg Thr Val

660 665 670

Leu Asp Phe Leu Leu Met Leu Cys Ser Val Gly Gln His Tyr Pro Gly

675 680 685

Phe Glu Thr Asp Ile His Gly Ala Lys Gln Asp Glu Asp Gly Val Tyr

690 695 700

Arg Val Arg Val Leu Lys Met Ala Gly

705 710

<210> 8

<211> 2256

<212> DNA

<213> Pseudomonas aeruginosa

<400> 8

atgtataaag acctcaaatt tcccgtcctc atcgtccatc gcgacatcaa ggccgacacc 60

gttgccggcg aacgcgtgcg gggcatcgcc cacgaactgg agcaggacgg cttcagcatt 120

ctctccaccg ccagctccgc cgaggggcgc atcgtcgctt ccacccacca cggcctggcc 180

tgcattctgg tcgccgccga aggtgccggg gaaaaccagc gcctgctgca ggatgtggtc 240

gaactgatcc gcgtggcccg cgtgcgggcg ccgcaattgc cgatcttcgc cctcggcgag 300

caggtgacca tcgagaacgc gccggccgag tccatggccg acctgcacca gttgcgcggc 360

atcctctacc tgttcgaaga caccgtgccg ttcctcgccc gccaggtcgc ccgggcggcg 420

cgcaactacc tggccgggct gctgccgcca ttcttccgtg cgctggtcga gcacaccgcg 480

cagtccaact attcctggca tacgccgggc cacggcggcg gtgtcgccta tcgcaagagt 540

ccggtgggac aggcgttcca ccagttcttc ggggagaaca cgctgcgttc cgacctgtcg 600

gtctcggtcc ccgagctggg atcgctgctc gaccataccg gccccctggc cgaggccgag 660

gaccgtgccg cgcgcaattt cggcgccgac cataccttct tcgtgatcaa tggcacttcc 720

accgcgaaca agatcgtctg gcactccatg gtcggtcgcg aagacctggt gctggtggac 780

cgcaactgcc acaagtcgat cctccactcg atcatcatga ccggggcgat accgctctac 840

ctgactccgg aacgcaacga actggggatc atcgggccga tcccgctgag cgaattcagc 900

aagcagtcga tcgccgcgaa gatcgccgcc agcccgctgg cgcgcggccg cgagccgaag 960

gtgaagctgg cggtggtgac taactccacc tacgacggcc tgtgctacaa cgccgagctg 1020

atcaagcaga ccctcggcga cagcgtcgag gtgttgcact tcgacgaggc ttggtacgcc 1080

tatgccgcgt tccacgagtt ctacgacgga cgctatggca tgggcacctc gcgcagcgag 1140

gagggacccc tggtgttcgc cacccactcc acgcacaaga tgctcgccgc cttcagccag 1200

gcctcgatga tccacgtgca ggatggcggg acccggaagc tggacgtggc gcgcttcaac 1260

gaagccttca tgatgcacat ctcgacctcg ccgcagtacg gcatcatcgc ttcgctggac 1320

gtggcttcgg cgatgatgga agggcccgcc gggcgttcgc tgatccagga gaccttcgac 1380

gaggccctca gcttccgccg ggccctggcc aacgtacggc agaacctgga ccggaacgac 1440

tggtggttcg gcgtctggca gccggagcag gtggagggca ccgaccaggt cggcacccat 1500

gactgggtgc tggagccgag cgccgactgg cacggcttcg gcgatatcgc cgaagactac 1560

gtgctgctcg acccgatcaa ggtcaccctg accaccccgg gcctgagcgc tggcggcaag 1620

ctcagcgagc aggggattcc ggccgccatc gtcagccgct tcctctggga gcgcgggctg 1680

gtggtggaga aaaccggtct ctactccttc ctggtgctgt tctcgatggg catcaccaag 1740

ggcaagtgga gcaccctggt caccgaactg ctcgaattca agcgctgtta cgacgccaac 1800

ctgccgctgc ttgacgtctt gccctccgtg gcccaggccg gcggcaagcg ctacaacgga 1860

gtgggcctgc gcgacctcag cgacgccatg cacgccagct accgcgacaa cgccacggcg 1920

aaggccatga agcgcatgta cacggtgctg ccggaggtcg cgatgcggcc gtccgaggcc 1980

tacgacaagc tggtgcgcgg cgaggtcgag gcggtaccga tcgctcggtt ggaagggcgc 2040

atcgcggccg tcatgctggt accctatccg ccgggtatcc cgctgatcat gccgggtgag 2100

cgcttcaccg aggcgacccg ctcgatcctc gactatctcg agttcgcgcg gaccttcgag 2160

cgcgccttcc ctggtttcga ctccgatgtg catggcctgc agcatcagga cggaccgtcc 2220

gggcgctgct ataccgttga atgcataaag gaatga 2256

<210> 9

<211> 751

<212> PRT

<213> Pseudomonas aeruginosa

<400> 9

Met Tyr Lys Asp Leu Lys Phe Pro Val Leu Ile Val His Arg Asp Ile

1 5 10 15

Lys Ala Asp Thr Val Ala Gly Glu Arg Val Arg Gly Ile Ala His Glu

20 25 30

Leu Glu Gln Asp Gly Phe Ser Ile Leu Ser Thr Ala Ser Ser Ala Glu

35 40 45

Gly Arg Ile Val Ala Ser Thr His His Gly Leu Ala Cys Ile Leu Val

50 55 60

Ala Ala Glu Gly Ala Gly Glu Asn Gln Arg Leu Leu Gln Asp Val Val

65 70 75 80

Glu Leu Ile Arg Val Ala Arg Val Arg Ala Pro Gln Leu Pro Ile Phe

85 90 95

Ala Leu Gly Glu Gln Val Thr Ile Glu Asn Ala Pro Ala Glu Ser Met

100 105 110

Ala Asp Leu His Gln Leu Arg Gly Ile Leu Tyr Leu Phe Glu Asp Thr

115 120 125

Val Pro Phe Leu Ala Arg Gln Val Ala Arg Ala Ala Arg Asn Tyr Leu

130 135 140

Ala Gly Leu Leu Pro Pro Phe Phe Arg Ala Leu Val Glu His Thr Ala

145 150 155 160

Gln Ser Asn Tyr Ser Trp His Thr Pro Gly His Gly Gly Gly Val Ala

165 170 175

Tyr Arg Lys Ser Pro Val Gly Gln Ala Phe His Gln Phe Phe Gly Glu

180 185 190

Asn Thr Leu Arg Ser Asp Leu Ser Val Ser Val Pro Glu Leu Gly Ser

195 200 205

Leu Leu Asp His Thr Gly Pro Leu Ala Glu Ala Glu Asp Arg Ala Ala

210 215 220

Arg Asn Phe Gly Ala Asp His Thr Phe Phe Val Ile Asn Gly Thr Ser

225 230 235 240

Thr Ala Asn Lys Ile Val Trp His Ser Met Val Gly Arg Glu Asp Leu

245 250 255

Val Leu Val Asp Arg Asn Cys His Lys Ser Ile Leu His Ser Ile Ile

260 265 270

Met Thr Gly Ala Ile Pro Leu Tyr Leu Thr Pro Glu Arg Asn Glu Leu

275 280 285

Gly Ile Ile Gly Pro Ile Pro Leu Ser Glu Phe Ser Lys Gln Ser Ile

290 295 300

Ala Ala Lys Ile Ala Ala Ser Pro Leu Ala Arg Gly Arg Glu Pro Lys

305 310 315 320

Val Lys Leu Ala Val Val Thr Asn Ser Thr Tyr Asp Gly Leu Cys Tyr

325 330 335

Asn Ala Glu Leu Ile Lys Gln Thr Leu Gly Asp Ser Val Glu Val Leu

340 345 350

His Phe Asp Glu Ala Trp Tyr Ala Tyr Ala Ala Phe His Glu Phe Tyr

355 360 365

Asp Gly Arg Tyr Gly Met Gly Thr Ser Arg Ser Glu Glu Gly Pro Leu

370 375 380

Val Phe Ala Thr His Ser Thr His Lys Met Leu Ala Ala Phe Ser Gln

385 390 395 400

Ala Ser Met Ile His Val Gln Asp Gly Gly Thr Arg Lys Leu Asp Val

405 410 415

Ala Arg Phe Asn Glu Ala Phe Met Met His Ile Ser Thr Ser Pro Gln

420 425 430

Tyr Gly Ile Ile Ala Ser Leu Asp Val Ala Ser Ala Met Met Glu Gly

435 440 445

Pro Ala Gly Arg Ser Leu Ile Gln Glu Thr Phe Asp Glu Ala Leu Ser

450 455 460

Phe Arg Arg Ala Leu Ala Asn Val Arg Gln Asn Leu Asp Arg Asn Asp

465 470 475 480

Trp Trp Phe Gly Val Trp Gln Pro Glu Gln Val Glu Gly Thr Asp Gln

485 490 495

Val Gly Thr His Asp Trp Val Leu Glu Pro Ser Ala Asp Trp His Gly

500 505 510

Phe Gly Asp Ile Ala Glu Asp Tyr Val Leu Leu Asp Pro Ile Lys Val

515 520 525

Thr Leu Thr Thr Pro Gly Leu Ser Ala Gly Gly Lys Leu Ser Glu Gln

530 535 540

Gly Ile Pro Ala Ala Ile Val Ser Arg Phe Leu Trp Glu Arg Gly Leu

545 550 555 560

Val Val Glu Lys Thr Gly Leu Tyr Ser Phe Leu Val Leu Phe Ser Met

565 570 575

Gly Ile Thr Lys Gly Lys Trp Ser Thr Leu Val Thr Glu Leu Leu Glu

580 585 590

Phe Lys Arg Cys Tyr Asp Ala Asn Leu Pro Leu Leu Asp Val Leu Pro

595 600 605

Ser Val Ala Gln Ala Gly Gly Lys Arg Tyr Asn Gly Val Gly Leu Arg

610 615 620

Asp Leu Ser Asp Ala Met His Ala Ser Tyr Arg Asp Asn Ala Thr Ala

625 630 635 640

Lys Ala Met Lys Arg Met Tyr Thr Val Leu Pro Glu Val Ala Met Arg

645 650 655

Pro Ser Glu Ala Tyr Asp Lys Leu Val Arg Gly Glu Val Glu Ala Val

660 665 670

Pro Ile Ala Arg Leu Glu Gly Arg Ile Ala Ala Val Met Leu Val Pro

675 680 685

Tyr Pro Pro Gly Ile Pro Leu Ile Met Pro Gly Glu Arg Phe Thr Glu

690 695 700

Ala Thr Arg Ser Ile Leu Asp Tyr Leu Glu Phe Ala Arg Thr Phe Glu

705 710 715 720

Arg Ala Phe Pro Gly Phe Asp Ser Asp Val His Gly Leu Gln His Gln

725 730 735

Asp Gly Pro Ser Gly Arg Cys Tyr Thr Val Glu Cys Ile Lys Glu

740 745 750

<210> 10

<211> 2256

<212> DNA

<213> synthetic

<400> 10

atgtacaaag atctgaaatt ccctgttctg attgtacacc gcgatatcaa ggcggacacg 60

gtagccggcg agcgtgttcg cggtattgcc cacgaactcg aacaagacgg ctttagcatt 120

ctctctacgg cgtcttctgc ggaaggccgc attgtggcta gcacgcacca cggtctcgcc 180

tgcatcctcg tggcagctga gggtgcgggt gagaatcagc gtctgctcca agacgtggtt 240

gagctgatcc gtgtagctcg cgtccgtgcg ccacagctcc cgatcttcgc gctgggcgaa 300

caggtgacta ttgaaaacgc gcctgccgaa tctatggccg acctgcacca gctccgcggc 360

attctgtatc tcttcgagga tactgtcccg ttcctggcac gtcaggttgc acgcgcagcg 420

cgtaactacc tcgctggcct cctcccgcca ttcttccgtg cactcgtgga gcacacggcc 480

caaagcaatt actcttggca caccccgggt cacggtggtg gtgtcgctta ccgtaaatct 540

ccggtaggtc aagctttcca ccagttcttt ggcgagaata ccctccgctc tgacctgtct 600

gttagcgttc cagagctggg cagcctgctg gatcacactg gccctctcgc ggaagcagag 660

gatcgtgccg ctcgcaattt cggtgcggac cacaccttct ttgtcatcaa tggtacctct 720

actgcgaaca aaatcgtttg gcactctatg gttggtcgcg aggacctggt gctggtcgat 780

cgtaactgtc acaaatctat tctgcactcc attatcatga cgggtgctat cccactgtac 840

ctgactccgg aacgcaacga actgggtatt atcggcccta ttccactctc cgagttttct 900

aaacaatcta tcgcagcaaa aattgccgcc tccccactcg cgcgtggtcg tgaaccgaaa 960

gttaaactgg ctgtcgttac caactctacc tatgacggtc tgtgttacaa cgcggaactg 1020

atcaaacaaa ccctcggcga ctctgtcgag gtactgcatt tcgacgaggc ttggtatgct 1080

tatgcggcgt ttcacgagtt ctacgacggc cgctacggta tgggcacttc tcgttccgaa 1140

gagggtccgc tggtctttgc tacccattct acccacaaga tgctcgcggc tttttcccaa 1200

gctagcatga ttcacgttca ggatggtggt acgcgcaagc tggacgtcgc ccgctttaac 1260

gaagccttta tgatgcacat cagcacctct ccacagtacg gcatcattgc gtctctcgat 1320

gtcgcaagcg ctatgatgga aggtcctgcc ggtcgtagcc tgatccaaga gacgttcgat 1380

gaggcgctgt ccttccgtcg tgctctggcg aatgtccgtc agaacctgga ccgtaatgat 1440

tggtggttcg gtgtctggca accggagcag gttgagggca ccgaccaggt aggtactcac 1500

gactgggttc tcgagcctag cgcggactgg catggttttg gtgacattgc ggaggattac 1560

gttctcctcg atcctatcaa agttaccctg accaccccag gtctgagcgc tggcggtaaa 1620

ctctctgaac aaggcatccc ggcagctatc gttagccgtt tcctgtggga acgtggtctg 1680

gtggtcgaga aaacgggtct gtactctttc ctggttctgt tctccatggg tatcacgaaa 1740

ggcaaatggt ctactctggt taccgagctg ctcgaattca aacgctgtta cgacgcgaat 1800

ctgccactcc tggatgtgct gccttctgta gcgcaggcgg gtggtaaacg ctataacggt 1860

gtaggtctgc gtgatctgtc cgatgccatg cacgcttctt atcgtgacaa tgccacggcg 1920

aaggccatga agcgtatgta tacggtgctc ccggaagtag ccatgcgccc gtccgaagct 1980

tatgataagc tcgtacgcgg tgaagtcgaa gctgttccta ttgcacgtct cgagggtcgt 2040

attgcggcgg ttatgctggt tccgtacccg ccaggtatcc cgctcattat gccgggtgaa 2100

cgttttactg aagctacccg ctccattctg gactatctgg agtttgcccg taccttcgag 2160

cgcgcgttcc cgggctttga ctctgatgtt cacggcctcc aacatcaaga tggcccgtct 2220

ggccgttgtt ataccgttga atgcatcaag gaataa 2256

<210> 11

<211> 751

<212> PRT

<213> synthetic

<400> 11

Met Tyr Lys Asp Leu Lys Phe Pro Val Leu Ile Val His Arg Asp Ile

1 5 10 15

Lys Ala Asp Thr Val Ala Gly Glu Arg Val Arg Gly Ile Ala His Glu

20 25 30

Leu Glu Gln Asp Gly Phe Ser Ile Leu Ser Thr Ala Ser Ser Ala Glu

35 40 45

Gly Arg Ile Val Ala Ser Thr His His Gly Leu Ala Cys Ile Leu Val

50 55 60

Ala Ala Glu Gly Ala Gly Glu Asn Gln Arg Leu Leu Gln Asp Val Val

65 70 75 80

Glu Leu Ile Arg Val Ala Arg Val Arg Ala Pro Gln Leu Pro Ile Phe

85 90 95

Ala Leu Gly Glu Gln Val Thr Ile Glu Asn Ala Pro Ala Glu Cys Met

100 105 110

Ala Asp Leu His Gln Leu Arg Gly Ile Leu Tyr Leu Phe Glu Asp Thr

115 120 125

Val Pro Phe Leu Ala Arg Gln Val Ala Arg Ala Ala Arg Asn Tyr Leu

130 135 140

Ala Gly Leu Leu Pro Pro Phe Phe Arg Ala Leu Val Glu His Thr Ala

145 150 155 160

Gln Ser Asn Tyr Ser Trp His Thr Pro Gly His Gly Gly Gly Val Ala

165 170 175

Tyr Arg Lys Ser Pro Val Gly Gln Ala Phe His Gln Phe Phe Gly Glu

180 185 190

Asn Thr Leu Arg Ser Asp Leu Ser Val Ser Val Pro Glu Leu Gly Ser

195 200 205

Leu Leu Asp His Thr Gly Pro Leu Ala Glu Ala Glu Asp Arg Ala Ala

210 215 220

Arg Asn Phe Gly Ala Asp His Thr Phe Phe Val Ile Asn Gly Thr Ser

225 230 235 240

Thr Ala Asn Lys Ile Val Trp His Ser Met Val Gly Arg Glu Asp Leu

245 250 255

Val Leu Val Asp Arg Asn Cys His Lys Ser Ile Leu His Ser Ile Ile

260 265 270

Met Thr Gly Ala Ile Pro Leu Tyr Leu Thr Pro Glu Arg Asn Glu Leu

275 280 285

Gly Ile Ile Gly Pro Ile Pro Leu Ser Glu Phe Ser Lys Gln Ser Ile

290 295 300

Ala Ala Lys Ile Ala Ala Ser Pro Leu Ala Arg Gly Arg Glu Pro Lys

305 310 315 320

Val Lys Leu Ala Val Val Thr Asn Ser Thr Tyr Asp Gly Leu Cys Tyr

325 330 335

Asn Ala Glu Leu Ile Lys Gln Thr Leu Gly Asp Ser Val Glu Val Leu

340 345 350

His Phe Asp Glu Ala Trp Tyr Ala Tyr Ala Ala Phe His Glu Phe Tyr

355 360 365

Asp Gly Arg Tyr Gly Met Gly Thr Ser Arg Ser Glu Glu Gly Pro Leu

370 375 380

Val Phe Ala Thr His Ser Thr His Lys Met Leu Ala Ala Phe Ser Gln

385 390 395 400

Ala Ser Met Ile His Val Gln Asp Gly Gly Thr Arg Lys Leu Asp Val

405 410 415

Ala Arg Phe Asn Glu Ala Phe Met Met His Ile Ser Thr Ser Pro Gln

420 425 430

Tyr Gly Ile Ile Ala Ser Leu Asp Val Ala Ser Ala Met Met Glu Gly

435 440 445

Pro Ala Gly Arg Ser Leu Ile Gln Glu Thr Phe Asp Glu Ala Leu Ser

450 455 460

Phe Arg Arg Ala Leu Ala Asn Val Arg Gln Asn Leu Asp Arg Asn Asp

465 470 475 480

Trp Trp Phe Gly Val Trp Gln Pro Glu Gln Val Glu Gly Thr Asp Gln

485 490 495

Val Gly Thr His Asp Trp Val Leu Glu Pro Ser Ala Asp Trp His Gly

500 505 510

Phe Gly Asp Ile Ala Glu Asp Tyr Val Leu Leu Asp Pro Ile Lys Val

515 520 525

Thr Leu Thr Thr Pro Gly Leu Ser Ala Gly Gly Lys Leu Ser Glu Gln

530 535 540

Gly Ile Pro Ala Ala Ile Val Ser Arg Phe Leu Trp Glu Arg Gly Leu

545 550 555 560

Val Val Glu Lys Thr Gly Leu Tyr Ser Phe Leu Val Leu Phe Ser Met

565 570 575

Gly Ile Thr Lys Gly Lys Trp Ser Thr Leu Val Thr Glu Leu Leu Glu

580 585 590

Phe Lys Arg Cys Tyr Asp Ala Asn Leu Pro Leu Leu Asp Val Leu Pro

595 600 605

Ser Val Ala Gln Ala Gly Gly Lys Arg Tyr Asn Gly Val Gly Leu Arg

610 615 620

Asp Leu Ser Asp Ala Met His Ala Ser Tyr Arg Asp Asn Ala Thr Ala

625 630 635 640

Lys Ala Met Lys Arg Met Tyr Thr Val Leu Pro Glu Val Ala Met Arg

645 650 655

Pro Ser Glu Ala Tyr Asp Lys Leu Val Arg Gly Glu Val Glu Ala Val

660 665 670

Pro Ile Ala Arg Leu Glu Gly Arg Ile Ala Ala Val Met Leu Val Pro

675 680 685

Tyr Pro Pro Gly Ile Pro Leu Ile Met Pro Gly Glu Arg Phe Thr Glu

690 695 700

Ala Thr Arg Ser Ile Leu Asp Tyr Leu Glu Phe Ala Arg Thr Phe Glu

705 710 715 720

Arg Ala Phe Pro Gly Phe Asp Ser Asp Val His Gly Leu Gln His Gln

725 730 735

Asp Gly Pro Ser Gly Arg Cys Tyr Thr Val Glu Cys Ile Lys Glu

740 745 750

<210> 12

<211> 1333

<212> DNA

<213> Hafnia alvei

<400> 12

ttgactttgt taaaagtcag gcataagatc aaaatactgt atatataaca atgtatttat 60

atacagtatt ttatactttt tatctaacgt cagagagggc aatattatga gtggtggaga 120

tggcaagggt cacaatagtg gagcacatga ttccggtggc agcattaatg gaacttctgg 180

gaaaggtggg ccatcaagcg gaggagcatc agataattct gggtggagtt cggaaaataa 240

cccgtggggc ggtggtaact cgggaatgat tggtggcagt caaggaggta acggagctaa 300

tcatggtggc gaaaatacat cttctaacta tgggaaagat gtatcacgcc aaatcggtga 360

tgcgatagcc agaaaggaag gcatcaatcc gaaaatattc actgggtact ttatccgttc 420

agatggatat ttgatcggaa taacgccact tgtcagtggt gatgcctttg gcgttaatct 480

tggcctgttc aataacaatc aaaatagtag tagtgaaaat aagggatgga atggaaggaa 540

tggagatggc attaaaaata gtagccaagg tggatggaag attaaaacta atgaacttac 600

ttcaaaccaa gtagctgctg ctaaatccgt tccagaacct aaaaatagta aatattataa 660

gtccatgaga gaagctagcg atgaggttat taattctaat ttaaaccaag ggcatggagt 720

tggtgaggca gctagagctg aaagagatta cagagaaaaa gtaaagaacg caatcaatga 780

taatagtccc aatgtgctac aggatgctat taaatttaca gcagattttt ataaggaagt 840

ttttaacgct tacggagaaa aagccgaaaa actagccaag ttattagctg atcaagctaa 900

aggtaaaaag atccgcaatg tagaagatgc attgaaatct tatgaaaaac acaaggctaa 960

cattaacaaa aaaatcaatg cgaaagatcg cgaagctatc gccaaggctt tggagtctat 1020

ggatgtagaa aaagccgcaa aaaatatatc caagttcagc aaaggactag gttgggttgg 1080

cccagctatc gatataactg attggtttac agaattatac aaagcagtga aaactgataa 1140

ttggagatct ctttatgtta aaactgaaac tattgcagta gggctagctg caacccatgt 1200

caccgcctta gcattcagtg ctgtcttggg tgggcctata ggtattttag gttatggttt 1260

gattatggct ggggttgggg cgttagttaa cgagacaata gttgacgagg caaataaggt 1320

cattgggatt taa 1333

<210> 13

<211> 336

<212> DNA

<213> Hafnia alvei

<400> 13

ctatatttta gcggtcacat tttttatttc aaaacaaaca gaaagaacac caataggaat 60

tgatgtcata aaaataaaaa taaaatacaa agtcattaaa tatgtttttg gcacaccatc 120

cttaaaaaaa cctgttttcc aaaattcttt tttcgtatat ctaagcgctg ctttctctat 180

tagaaaccga gagaaaggaa atagaatagc gctagccaaa ccaaagattc tgagcgcaat 240

tattttaggt tcgtcatcac cataactggc gtaaagaata caagcagcca taaagtatcc 300

ccaaaacata ttatgtatgt aatatttcct tgtcat 336

<210> 14

<211> 1077

<212> DNA

<213> Hafnia alvei

<400> 14

atgagtggtg gagacggtaa aggtcacaat agtggagcac atgattccgg tggcagcatt 60

aatggaactt cggggaaagg tggacctgat tctggtggcg gatattggga caaccatcca 120

catattacaa tcaccggtgg acgggaagta ggtcaagggg gagctggtat caactggggt 180

ggtggttctg gtcatggtaa cggcgggggc tcagttgcca tccaagaata taacacgagt 240

aaatatccta acacgggagg atttcctcct cttggagacg ctagctggct gttaaatcct 300

ccaaaatggt cggttattga agtaaaatca gaaaactcag catggcgctc ttatattact 360

catgttcaag gtcatgttta caaattgact tttgatggta cgggtaagct cattgatacc 420

gcgtatgtta attatgaacc cagtgatgat actcgttgga gcccgcttaa aagttttaaa 480

tataataaag gaaccgctga aaaacaggtt agggatgcca ttaacaatga aaaagaagca 540

gttaaggacg ctgttaaatt tactgcagac ttctataaag aggtttttaa ggtttacgga 600

gaaaaagccg agaagctcgc taagttatta gcagatcaag ctaaaggcaa aaaggttcgc 660

aacgtagaag atgccttgaa atcttatgaa aaatataaga ctaacattaa caaaaaaatc 720

aatgcgaaag atcgcgaagc tattgctaaa gccttggagt ctatggatgt aggaaaagcc 780

gcaaaaaata tagccaagtt cagtaaagga ctaggttggg ttggccctgc tatcgatata 840

actgattggt ttacagaatt atacaaggca gtggaaactg ataattggag atctttttat 900

gttaaaactg aaactattgc agtagggcta gctgcaaccc atgttgccgc cttggcattc 960

agcgctgtct tgggtgggcc tgtaggtatt ttgggttatg gtttgattat ggctggggtt 1020

ggggcgttag ttaatgagac aatagttgac gaggcaaata aggttattgg gctttaa 1077

<210> 15

<211> 336

<212> DNA

<213> Hafnia alvei

<400> 15

ctataattta gcggtcacat tttttatttc aaaaaaaaca gaaataacac ctataggaat 60

tgatgtcata aaaataaaaa ttaaatacaa agtcattaaa tatgtttttg gcacgccatc 120

cttaaaaaaa ccagtttccc aaaattcttt tttcgtatat ctaagcgcgg ttttctctat 180

taaaaaccga gagaaaggga ataggatagc actagccaaa ccaaagattc tgagcgcaat 240

tattttaggt tcgttatccc cataactggc gtaaagaata caaacagcca taaagtaccc 300

ccaaaacata ttatgtatat aatatttcct tgtcat 336

<210> 16

<211> 751

<212> PRT

<213> synthetic

<400> 16

Met Tyr Lys Asp Leu Lys Phe Pro Val Leu Ile Val His Arg Asp Ile

1 5 10 15

Lys Ala Asp Thr Val Ala Gly Glu Arg Val Arg Gly Ile Ala His Glu

20 25 30

Leu Glu Gln Asp Gly Phe Ser Ile Leu Ser Thr Ala Ser Ser Ala Glu

35 40 45

Gly Arg Ile Val Ala Ser Thr His His Gly Leu Ala Cys Ile Leu Val

50 55 60

Ala Ala Glu Gly Ala Gly Glu Asn Gln Arg Leu Leu Gln Asp Val Val

65 70 75 80

Glu Leu Ile Arg Val Ala Arg Val Arg Ala Pro Gln Leu Pro Ile Phe

85 90 95

Ala Leu Gly Glu Gln Val Thr Ile Glu Asn Ala Pro Ala Glu Ser Met

100 105 110

Ala Asp Leu His Gln Leu Arg Gly Ile Leu Tyr Leu Phe Glu Asp Thr

115 120 125

Val Pro Phe Leu Ala Arg Gln Val Ala Arg Ala Ala Arg Asn Tyr Leu

130 135 140

Ala Gly Leu Leu Pro Pro Phe Phe Arg Ala Leu Val Glu His Thr Ala

145 150 155 160

Gln Ser Asn Tyr Ser Trp His Thr Pro Gly His Gly Gly Gly Val Ala

165 170 175

Tyr Arg Lys Ser Pro Val Gly Gln Ala Phe His Gln Phe Phe Gly Glu

180 185 190

Asn Thr Leu Arg Ser Asp Leu Ser Val Ser Val Pro Glu Leu Gly Ser

195 200 205

Leu Leu Asp His Thr Gly Pro Leu Ala Glu Ala Glu Asp Arg Ala Ala

210 215 220

Arg Asn Phe Gly Ala Asp His Thr Phe Phe Val Ile Asn Gly Thr Ser

225 230 235 240

Thr Ala Asn Lys Ile Val Trp His Ser Met Val Gly Arg Glu Asp Leu

245 250 255

Val Leu Val Asp Arg Thr Cys His Lys Ser Ile Leu His Ser Ile Ile

260 265 270

Met Thr Gly Ala Ile Pro Leu Tyr Leu Thr Pro Glu Arg Asn Glu Leu

275 280 285

Gly Ile Ile Gly Pro Ile Pro Leu Ser Glu Phe Ser Lys Gln Ser Ile

290 295 300

Ala Ala Lys Ile Ala Ala Ser Pro Leu Ala Arg Gly Arg Glu Pro Lys

305 310 315 320

Val Lys Leu Ala Val Val Thr Asn Ser Thr Tyr Asp Gly Leu Cys Tyr

325 330 335

Asn Ala Glu Leu Ile Lys Gln Thr Leu Gly Asp Ser Val Glu Val Leu

340 345 350

His Phe Asp Glu Ala Trp Tyr Ala Tyr Ala Ala Phe His Glu Phe Tyr

355 360 365

Asp Gly Arg Tyr Gly Met Gly Thr Ser Arg Ser Glu Glu Gly Pro Leu

370 375 380

Val Phe Ala Thr His Ser Thr His Lys Met Leu Ala Ala Phe Ser Gln

385 390 395 400

Ala Ser Met Ile His Val Gln Asp Gly Gly Thr Arg Lys Leu Asp Val

405 410 415

Ala Arg Phe Asn Glu Ala Phe Met Met His Ile Ser Thr Ser Pro Gln

420 425 430

Tyr Gly Ile Ile Ala Ser Leu Asp Val Ala Ser Ala Met Met Glu Gly

435 440 445

Pro Ala Gly Arg Ser Leu Ile Gln Glu Thr Phe Asp Glu Ala Leu Ser

450 455 460

Phe Arg Arg Ala Leu Ala Asn Val Arg Gln Asn Leu Asp Arg Asn Asp

465 470 475 480

Trp Trp Phe Gly Val Trp Gln Pro Glu Gln Val Glu Gly Thr Asp Gln

485 490 495

Val Gly Thr His Asp Trp Val Leu Glu Pro Ser Ala Asp Trp His Gly

500 505 510

Phe Gly Asp Ile Ala Glu Asp Tyr Val Leu Leu Asp Pro Ile Lys Val

515 520 525

Thr Leu Thr Thr Pro Gly Leu Ser Ala Gly Gly Lys Leu Ser Glu Gln

530 535 540

Gly Ile Pro Ala Ala Ile Val Ser Arg Phe Leu Trp Glu Arg Gly Leu

545 550 555 560

Val Val Glu Lys Thr Gly Leu Tyr Ser Phe Leu Val Leu Phe Ser Met

565 570 575

Gly Ile Thr Lys Gly Lys Trp Ser Thr Leu Val Thr Glu Leu Leu Glu

580 585 590

Phe Lys Arg Cys Tyr Asp Ala Asn Leu Pro Leu Leu Asp Val Leu Pro

595 600 605

Ser Val Ala Gln Ala Gly Gly Lys Arg Tyr Asn Gly Val Gly Leu Arg

610 615 620

Asp Leu Ser Asp Ala Met His Ala Ser Tyr Arg Asp Asn Ala Thr Ala

625 630 635 640

Lys Ala Met Lys Arg Met Tyr Thr Val Leu Pro Glu Val Ala Met Arg

645 650 655

Pro Ser Glu Ala Tyr Asp Lys Leu Val Arg Gly Glu Val Glu Ala Val

660 665 670

Pro Ile Ala Arg Leu Glu Gly Arg Ile Ala Ala Val Met Leu Val Pro

675 680 685

Tyr Pro Pro Gly Ile Pro Leu Ile Met Pro Gly Glu Arg Phe Thr Glu

690 695 700

Ala Thr Arg Ser Ile Leu Asp Tyr Leu Glu Phe Ala Arg Thr Phe Glu

705 710 715 720

Arg Ala Phe Pro Gly Phe Asp Ser Asp Val His Gly Leu Gln His Gln

725 730 735

Asp Gly Pro Ser Gly Arg Cys Tyr Thr Val Glu Cys Ile Lys Glu

740 745 750

<210> 17

<211> 751

<212> PRT

<213> synthetic

<400> 17

Met Tyr Lys Asp Leu Lys Phe Pro Val Leu Ile Val His Arg Asp Ile

1 5 10 15

Lys Ala Asp Thr Val Ala Gly Glu Arg Val Arg Gly Ile Ala His Glu

20 25 30

Leu Glu Gln Asp Gly Phe Ser Ile Leu Ser Thr Ala Ser Ser Ala Glu

35 40 45

Gly Arg Ile Val Ala Ser Thr His His Gly Leu Ala Cys Ile Leu Val

50 55 60

Ala Ala Glu Gly Ala Gly Glu Asn Gln Arg Leu Leu Gln Asp Val Val

65 70 75 80

Glu Leu Ile Arg Val Ala Arg Val Arg Ala Pro Gln Leu Pro Ile Phe

85 90 95

Ala Leu Gly Glu Gln Val Thr Ile Glu Asn Ala Pro Ala Glu Ser Met

100 105 110

Ala Asp Leu His Gln Leu Arg Gly Ile Leu Tyr Leu Phe Glu Asp Thr

115 120 125

Val Pro Phe Leu Ala Arg Gln Val Ala Arg Ala Ala Arg Asn Tyr Leu

130 135 140

Ala Gly Leu Leu Pro Pro Phe Phe Arg Ala Leu Val Glu His Thr Ala

145 150 155 160

Gln Ser Asn Tyr Ser Trp His Thr Pro Gly His Gly Gly Gly Val Ala

165 170 175

Tyr Arg Lys Ser Pro Val Gly Gln Ala Phe His Gln Phe Phe Gly Glu

180 185 190

Asn Thr Leu Arg Ser Asp Leu Ser Val Ser Val Pro Glu Leu Gly Ser

195 200 205

Leu Leu Asp His Thr Gly Pro Leu Ala Glu Ala Glu Asp Arg Ala Ala

210 215 220

Arg Asn Phe Gly Ala Asp His Thr Phe Phe Val Ile Asn Gly Thr Ser

225 230 235 240

Thr Ala Asn Lys Ile Val Trp His Ser Met Val Gly Arg Glu Asp Leu

245 250 255

Val Leu Val Asp Arg Asn Cys His Asn Ser Ile Leu His Ser Ile Ile

260 265 270

Met Thr Gly Ala Ile Pro Leu Tyr Leu Thr Pro Glu Arg Asn Glu Leu

275 280 285

Gly Ile Ile Gly Pro Ile Pro Leu Ser Glu Phe Ser Lys Gln Ser Ile

290 295 300

Ala Ala Lys Ile Ala Ala Ser Pro Leu Ala Arg Gly Arg Glu Pro Lys

305 310 315 320

Val Lys Leu Ala Val Val Thr Asn Ser Thr Tyr Asp Gly Leu Cys Tyr

325 330 335

Asn Ala Glu Leu Ile Lys Gln Thr Leu Gly Asp Ser Val Glu Val Leu

340 345 350

His Phe Asp Glu Ala Trp Tyr Ala Tyr Ala Ala Phe His Glu Phe Tyr

355 360 365

Asp Gly Arg Tyr Gly Met Gly Thr Ser Arg Ser Glu Glu Gly Pro Leu

370 375 380

Val Phe Ala Thr His Ser Thr His Lys Met Leu Ala Ala Phe Ser Gln

385 390 395 400

Ala Ser Met Ile His Val Gln Asp Gly Gly Thr Arg Lys Leu Asp Val

405 410 415

Ala Arg Phe Asn Glu Ala Phe Met Met His Ile Ser Thr Ser Pro Gln

420 425 430

Tyr Gly Ile Ile Ala Ser Leu Asp Val Ala Ser Ala Met Met Glu Gly

435 440 445

Pro Ala Gly Arg Ser Leu Ile Gln Glu Thr Phe Asp Glu Ala Leu Ser

450 455 460

Phe Arg Arg Ala Leu Ala Asn Val Arg Gln Asn Leu Asp Arg Asn Asp

465 470 475 480

Trp Trp Phe Gly Val Trp Gln Pro Glu Gln Val Glu Gly Thr Asp Gln

485 490 495

Val Gly Thr His Asp Trp Val Leu Glu Pro Ser Ala Asp Trp His Gly

500 505 510

Phe Gly Asp Ile Ala Glu Asp Tyr Val Leu Leu Asp Pro Ile Lys Val

515 520 525

Thr Leu Thr Thr Pro Gly Leu Ser Ala Gly Gly Lys Leu Ser Glu Gln

530 535 540

Gly Ile Pro Ala Ala Ile Val Ser Arg Phe Leu Trp Glu Arg Gly Leu

545 550 555 560

Val Val Glu Lys Thr Gly Leu Tyr Ser Phe Leu Val Leu Phe Ser Met

565 570 575

Gly Ile Thr Lys Gly Lys Trp Ser Thr Leu Val Thr Glu Leu Leu Glu

580 585 590

Phe Lys Arg Cys Tyr Asp Ala Asn Leu Pro Leu Leu Asp Val Leu Pro

595 600 605

Ser Val Ala Gln Ala Gly Gly Lys Arg Tyr Asn Gly Val Gly Leu Arg

610 615 620

Asp Leu Ser Asp Ala Met His Ala Ser Tyr Arg Asp Asn Ala Thr Ala

625 630 635 640

Lys Ala Met Lys Arg Met Tyr Thr Val Leu Pro Glu Val Ala Met Arg

645 650 655

Pro Ser Glu Ala Tyr Asp Lys Leu Val Arg Gly Glu Val Glu Ala Val

660 665 670

Pro Ile Ala Arg Leu Glu Gly Arg Ile Ala Ala Val Met Leu Val Pro

675 680 685

Tyr Pro Pro Gly Ile Pro Leu Ile Met Pro Gly Glu Arg Phe Thr Glu

690 695 700

Ala Thr Arg Ser Ile Leu Asp Tyr Leu Glu Phe Ala Arg Thr Phe Glu

705 710 715 720

Arg Ala Phe Pro Gly Phe Asp Ser Asp Val His Gly Leu Gln His Gln

725 730 735

Asp Gly Pro Ser Gly Arg Cys Tyr Thr Val Glu Cys Ile Lys Glu

740 745 750

<210> 18

<211> 751

<212> PRT

<213> synthetic

<400> 18

Met Tyr Lys Asp Leu Lys Phe Pro Val Leu Ile Val His Arg Asp Ile

1 5 10 15

Lys Ala Asp Thr Val Ala Gly Glu Arg Val Arg Gly Ile Ala His Glu

20 25 30

Leu Glu Gln Asp Gly Phe Ser Ile Leu Ser Thr Ala Ser Ser Ala Glu

35 40 45

Gly Arg Ile Val Ala Ser Thr His His Gly Leu Ala Cys Ile Leu Val

50 55 60

Ala Ala Glu Gly Ala Gly Glu Asn Gln Arg Leu Leu Gln Asp Val Val

65 70 75 80

Glu Leu Ile Arg Val Ala Arg Val Arg Ala Pro Gln Leu Pro Ile Phe

85 90 95

Ala Leu Gly Glu Gln Val Thr Ile Glu Asn Ala Pro Ala Glu Cys Met

100 105 110

Ala Asp Leu His Gln Leu Arg Gly Ile Leu Tyr Leu Phe Glu Asp Thr

115 120 125

Val Pro Phe Leu Ala Arg Gln Val Ala Arg Ala Ala Arg Asn Tyr Leu

130 135 140

Ala Gly Leu Leu Pro Pro Phe Phe Arg Ala Leu Val Glu His Thr Ala

145 150 155 160

Gln Ser Asn Tyr Ser Trp His Thr Pro Gly His Gly Gly Gly Val Ala

165 170 175

Tyr Arg Lys Ser Pro Val Gly Gln Ala Phe His Gln Phe Phe Gly Glu

180 185 190

Asn Thr Leu Arg Ser Asp Leu Ser Val Ser Val Pro Glu Leu Gly Ser

195 200 205

Leu Leu Asp His Thr Gly Pro Leu Ala Glu Ala Glu Asp Arg Ala Ala

210 215 220

Arg Asn Phe Gly Ala Asp His Thr Phe Phe Val Ile Asn Gly Thr Ser

225 230 235 240

Thr Ala Asn Lys Ile Val Trp His Ser Met Val Gly Arg Glu Asp Leu

245 250 255

Val Leu Val Asp Arg Thr Cys His Lys Ser Ile Leu His Ser Ile Ile

260 265 270

Met Thr Gly Ala Ile Pro Leu Tyr Leu Thr Pro Glu Arg Asn Glu Leu

275 280 285

Gly Ile Ile Gly Pro Ile Pro Leu Ser Glu Phe Ser Lys Gln Ser Ile

290 295 300

Ala Ala Lys Ile Ala Ala Ser Pro Leu Ala Arg Gly Arg Glu Pro Lys

305 310 315 320

Val Lys Leu Ala Val Val Thr Asn Ser Thr Tyr Asp Gly Leu Cys Tyr

325 330 335

Asn Ala Glu Leu Ile Lys Gln Thr Leu Gly Asp Ser Val Glu Val Leu

340 345 350

His Phe Asp Glu Ala Trp Tyr Ala Tyr Ala Ala Phe His Glu Phe Tyr

355 360 365

Asp Gly Arg Tyr Gly Met Gly Thr Ser Arg Ser Glu Glu Gly Pro Leu

370 375 380

Val Phe Ala Thr His Ser Thr His Lys Met Leu Ala Ala Phe Ser Gln

385 390 395 400

Ala Ser Met Ile His Val Gln Asp Gly Gly Thr Arg Lys Leu Asp Val

405 410 415

Ala Arg Phe Asn Glu Ala Phe Met Met His Ile Ser Thr Ser Pro Gln

420 425 430

Tyr Gly Ile Ile Ala Ser Leu Asp Val Ala Ser Ala Met Met Glu Gly

435 440 445

Pro Ala Gly Arg Ser Leu Ile Gln Glu Thr Phe Asp Glu Ala Leu Ser

450 455 460

Phe Arg Arg Ala Leu Ala Asn Val Arg Gln Asn Leu Asp Arg Asn Asp

465 470 475 480

Trp Trp Phe Gly Val Trp Gln Pro Glu Gln Val Glu Gly Thr Asp Gln

485 490 495

Val Gly Thr His Asp Trp Val Leu Glu Pro Ser Ala Asp Trp His Gly

500 505 510

Phe Gly Asp Ile Ala Glu Asp Tyr Val Leu Leu Asp Pro Ile Lys Val

515 520 525

Thr Leu Thr Thr Pro Gly Leu Ser Ala Gly Gly Lys Leu Ser Glu Gln

530 535 540

Gly Ile Pro Ala Ala Ile Val Ser Arg Phe Leu Trp Glu Arg Gly Leu

545 550 555 560

Val Val Glu Lys Thr Gly Leu Tyr Ser Phe Leu Val Leu Phe Ser Met

565 570 575

Gly Ile Thr Lys Gly Lys Trp Ser Thr Leu Val Thr Glu Leu Leu Glu

580 585 590

Phe Lys Arg Cys Tyr Asp Ala Asn Leu Pro Leu Leu Asp Val Leu Pro

595 600 605

Ser Val Ala Gln Ala Gly Gly Lys Arg Tyr Asn Gly Val Gly Leu Arg

610 615 620

Asp Leu Ser Asp Ala Met His Ala Ser Tyr Arg Asp Asn Ala Thr Ala

625 630 635 640

Lys Ala Met Lys Arg Met Tyr Thr Val Leu Pro Glu Val Ala Met Arg

645 650 655

Pro Ser Glu Ala Tyr Asp Lys Leu Val Arg Gly Glu Val Glu Ala Val

660 665 670

Pro Ile Ala Arg Leu Glu Gly Arg Ile Ala Ala Val Met Leu Val Pro

675 680 685

Tyr Pro Pro Gly Ile Pro Leu Ile Met Pro Gly Glu Arg Phe Thr Glu

690 695 700

Ala Thr Arg Ser Ile Leu Asp Tyr Leu Glu Phe Ala Arg Thr Phe Glu

705 710 715 720

Arg Ala Phe Pro Gly Phe Asp Ser Asp Val His Gly Leu Gln His Gln

725 730 735

Asp Gly Pro Ser Gly Arg Cys Tyr Thr Val Glu Cys Ile Lys Glu

740 745 750

<210> 19

<211> 751

<212> PRT

<213> synthetic

<400> 19

Met Tyr Lys Asp Leu Lys Phe Pro Val Leu Ile Val His Arg Asp Ile

1 5 10 15

Lys Ala Asp Thr Val Ala Gly Glu Arg Val Arg Gly Ile Ala His Glu

20 25 30

Leu Glu Gln Asp Gly Phe Ser Ile Leu Ser Thr Ala Ser Ser Ala Glu

35 40 45

Gly Arg Ile Val Ala Ser Thr His His Gly Leu Ala Cys Ile Leu Val

50 55 60

Ala Ala Glu Gly Ala Gly Glu Asn Gln Arg Leu Leu Gln Asp Val Val

65 70 75 80

Glu Leu Ile Arg Val Ala Arg Val Arg Ala Pro Gln Leu Pro Ile Phe

85 90 95

Ala Leu Gly Glu Gln Val Thr Ile Glu Asn Ala Pro Ala Glu Cys Met

100 105 110

Ala Asp Leu His Gln Leu Arg Gly Ile Leu Tyr Leu Phe Glu Asp Thr

115 120 125

Val Pro Phe Leu Ala Arg Gln Val Ala Arg Ala Ala Arg Asn Tyr Leu

130 135 140

Ala Gly Leu Leu Pro Pro Phe Phe Arg Ala Leu Val Glu His Thr Ala

145 150 155 160

Gln Ser Asn Tyr Ser Trp His Thr Pro Gly His Gly Gly Gly Val Ala

165 170 175

Tyr Arg Lys Ser Pro Val Gly Gln Ala Phe His Gln Phe Phe Gly Glu

180 185 190

Asn Thr Leu Arg Ser Asp Leu Ser Val Ser Val Pro Glu Leu Gly Ser

195 200 205

Leu Leu Asp His Thr Gly Pro Leu Ala Glu Ala Glu Asp Arg Ala Ala

210 215 220

Arg Asn Phe Gly Ala Asp His Thr Phe Phe Val Ile Asn Gly Thr Ser

225 230 235 240

Thr Ala Asn Lys Ile Val Trp His Ser Met Val Gly Arg Glu Asp Leu

245 250 255

Val Leu Val Asp Arg Asn Cys His Asn Ser Ile Leu His Ser Ile Ile

260 265 270

Met Thr Gly Ala Ile Pro Leu Tyr Leu Thr Pro Glu Arg Asn Glu Leu

275 280 285

Gly Ile Ile Gly Pro Ile Pro Leu Ser Glu Phe Ser Lys Gln Ser Ile

290 295 300

Ala Ala Lys Ile Ala Ala Ser Pro Leu Ala Arg Gly Arg Glu Pro Lys

305 310 315 320

Val Lys Leu Ala Val Val Thr Asn Ser Thr Tyr Asp Gly Leu Cys Tyr

325 330 335

Asn Ala Glu Leu Ile Lys Gln Thr Leu Gly Asp Ser Val Glu Val Leu

340 345 350

His Phe Asp Glu Ala Trp Tyr Ala Tyr Ala Ala Phe His Glu Phe Tyr

355 360 365

Asp Gly Arg Tyr Gly Met Gly Thr Ser Arg Ser Glu Glu Gly Pro Leu

370 375 380

Val Phe Ala Thr His Ser Thr His Lys Met Leu Ala Ala Phe Ser Gln

385 390 395 400

Ala Ser Met Ile His Val Gln Asp Gly Gly Thr Arg Lys Leu Asp Val

405 410 415

Ala Arg Phe Asn Glu Ala Phe Met Met His Ile Ser Thr Ser Pro Gln

420 425 430

Tyr Gly Ile Ile Ala Ser Leu Asp Val Ala Ser Ala Met Met Glu Gly

435 440 445

Pro Ala Gly Arg Ser Leu Ile Gln Glu Thr Phe Asp Glu Ala Leu Ser

450 455 460

Phe Arg Arg Ala Leu Ala Asn Val Arg Gln Asn Leu Asp Arg Asn Asp

465 470 475 480

Trp Trp Phe Gly Val Trp Gln Pro Glu Gln Val Glu Gly Thr Asp Gln

485 490 495

Val Gly Thr His Asp Trp Val Leu Glu Pro Ser Ala Asp Trp His Gly

500 505 510

Phe Gly Asp Ile Ala Glu Asp Tyr Val Leu Leu Asp Pro Ile Lys Val

515 520 525

Thr Leu Thr Thr Pro Gly Leu Ser Ala Gly Gly Lys Leu Ser Glu Gln

530 535 540

Gly Ile Pro Ala Ala Ile Val Ser Arg Phe Leu Trp Glu Arg Gly Leu

545 550 555 560

Val Val Glu Lys Thr Gly Leu Tyr Ser Phe Leu Val Leu Phe Ser Met

565 570 575

Gly Ile Thr Lys Gly Lys Trp Ser Thr Leu Val Thr Glu Leu Leu Glu

580 585 590

Phe Lys Arg Cys Tyr Asp Ala Asn Leu Pro Leu Leu Asp Val Leu Pro

595 600 605

Ser Val Ala Gln Ala Gly Gly Lys Arg Tyr Asn Gly Val Gly Leu Arg

610 615 620

Asp Leu Ser Asp Ala Met His Ala Ser Tyr Arg Asp Asn Ala Thr Ala

625 630 635 640

Lys Ala Met Lys Arg Met Tyr Thr Val Leu Pro Glu Val Ala Met Arg

645 650 655

Pro Ser Glu Ala Tyr Asp Lys Leu Val Arg Gly Glu Val Glu Ala Val

660 665 670

Pro Ile Ala Arg Leu Glu Gly Arg Ile Ala Ala Val Met Leu Val Pro

675 680 685

Tyr Pro Pro Gly Ile Pro Leu Ile Met Pro Gly Glu Arg Phe Thr Glu

690 695 700

Ala Thr Arg Ser Ile Leu Asp Tyr Leu Glu Phe Ala Arg Thr Phe Glu

705 710 715 720

Arg Ala Phe Pro Gly Phe Asp Ser Asp Val His Gly Leu Gln His Gln

725 730 735

Asp Gly Pro Ser Gly Arg Cys Tyr Thr Val Glu Cys Ile Lys Glu

740 745 750

<210> 20

<211> 751

<212> PRT

<213> synthetic

<400> 20

Met Tyr Lys Asp Leu Lys Phe Pro Val Leu Ile Val His Arg Asp Ile

1 5 10 15

Lys Ala Asp Thr Val Ala Gly Glu Arg Val Arg Gly Ile Ala His Glu

20 25 30

Leu Glu Gln Asp Gly Phe Ser Ile Leu Ser Thr Ala Ser Ser Ala Glu

35 40 45

Gly Arg Ile Val Ala Ser Thr His His Gly Leu Ala Cys Ile Leu Val

50 55 60

Ala Ala Glu Gly Ala Gly Glu Asn Gln Arg Leu Leu Gln Asp Val Val

65 70 75 80

Glu Leu Ile Arg Val Ala Arg Val Arg Ala Pro Gln Leu Pro Ile Phe

85 90 95

Ala Leu Gly Glu Gln Val Thr Ile Glu Asn Ala Pro Ala Glu Ser Met

100 105 110

Ala Asp Leu His Gln Leu Arg Gly Ile Leu Tyr Leu Phe Glu Asp Thr

115 120 125

Val Pro Phe Leu Ala Arg Gln Val Ala Arg Ala Ala Arg Asn Tyr Leu

130 135 140

Ala Gly Leu Leu Pro Pro Phe Phe Arg Ala Leu Val Glu His Thr Ala

145 150 155 160

Gln Ser Asn Tyr Ser Trp His Thr Pro Gly His Gly Gly Gly Val Ala

165 170 175

Tyr Arg Lys Ser Pro Val Gly Gln Ala Phe His Gln Phe Phe Gly Glu

180 185 190

Asn Thr Leu Arg Ser Asp Leu Ser Val Ser Val Pro Glu Leu Gly Ser

195 200 205

Leu Leu Asp His Thr Gly Pro Leu Ala Glu Ala Glu Asp Arg Ala Ala

210 215 220

Arg Asn Phe Gly Ala Asp His Thr Phe Phe Val Ile Asn Gly Thr Ser

225 230 235 240

Thr Ala Asn Lys Ile Val Trp His Ser Met Val Gly Arg Glu Asp Leu

245 250 255

Val Leu Val Asp Arg Thr Cys His Asn Ser Ile Leu His Ser Ile Ile

260 265 270

Met Thr Gly Ala Ile Pro Leu Tyr Leu Thr Pro Glu Arg Asn Glu Leu

275 280 285

Gly Ile Ile Gly Pro Ile Pro Leu Ser Glu Phe Ser Lys Gln Ser Ile

290 295 300

Ala Ala Lys Ile Ala Ala Ser Pro Leu Ala Arg Gly Arg Glu Pro Lys

305 310 315 320

Val Lys Leu Ala Val Val Thr Asn Ser Thr Tyr Asp Gly Leu Cys Tyr

325 330 335

Asn Ala Glu Leu Ile Lys Gln Thr Leu Gly Asp Ser Val Glu Val Leu

340 345 350

His Phe Asp Glu Ala Trp Tyr Ala Tyr Ala Ala Phe His Glu Phe Tyr

355 360 365

Asp Gly Arg Tyr Gly Met Gly Thr Ser Arg Ser Glu Glu Gly Pro Leu

370 375 380

Val Phe Ala Thr His Ser Thr His Lys Met Leu Ala Ala Phe Ser Gln

385 390 395 400

Ala Ser Met Ile His Val Gln Asp Gly Gly Thr Arg Lys Leu Asp Val

405 410 415

Ala Arg Phe Asn Glu Ala Phe Met Met His Ile Ser Thr Ser Pro Gln

420 425 430

Tyr Gly Ile Ile Ala Ser Leu Asp Val Ala Ser Ala Met Met Glu Gly

435 440 445

Pro Ala Gly Arg Ser Leu Ile Gln Glu Thr Phe Asp Glu Ala Leu Ser

450 455 460

Phe Arg Arg Ala Leu Ala Asn Val Arg Gln Asn Leu Asp Arg Asn Asp

465 470 475 480

Trp Trp Phe Gly Val Trp Gln Pro Glu Gln Val Glu Gly Thr Asp Gln

485 490 495

Val Gly Thr His Asp Trp Val Leu Glu Pro Ser Ala Asp Trp His Gly

500 505 510

Phe Gly Asp Ile Ala Glu Asp Tyr Val Leu Leu Asp Pro Ile Lys Val

515 520 525

Thr Leu Thr Thr Pro Gly Leu Ser Ala Gly Gly Lys Leu Ser Glu Gln

530 535 540

Gly Ile Pro Ala Ala Ile Val Ser Arg Phe Leu Trp Glu Arg Gly Leu

545 550 555 560

Val Val Glu Lys Thr Gly Leu Tyr Ser Phe Leu Val Leu Phe Ser Met

565 570 575

Gly Ile Thr Lys Gly Lys Trp Ser Thr Leu Val Thr Glu Leu Leu Glu

580 585 590

Phe Lys Arg Cys Tyr Asp Ala Asn Leu Pro Leu Leu Asp Val Leu Pro

595 600 605

Ser Val Ala Gln Ala Gly Gly Lys Arg Tyr Asn Gly Val Gly Leu Arg

610 615 620

Asp Leu Ser Asp Ala Met His Ala Ser Tyr Arg Asp Asn Ala Thr Ala

625 630 635 640

Lys Ala Met Lys Arg Met Tyr Thr Val Leu Pro Glu Val Ala Met Arg

645 650 655

Pro Ser Glu Ala Tyr Asp Lys Leu Val Arg Gly Glu Val Glu Ala Val

660 665 670

Pro Ile Ala Arg Leu Glu Gly Arg Ile Ala Ala Val Met Leu Val Pro

675 680 685

Tyr Pro Pro Gly Ile Pro Leu Ile Met Pro Gly Glu Arg Phe Thr Glu

690 695 700

Ala Thr Arg Ser Ile Leu Asp Tyr Leu Glu Phe Ala Arg Thr Phe Glu

705 710 715 720

Arg Ala Phe Pro Gly Phe Asp Ser Asp Val His Gly Leu Gln His Gln

725 730 735

Asp Gly Pro Ser Gly Arg Cys Tyr Thr Val Glu Cys Ile Lys Glu

740 745 750

<210> 21

<211> 751

<212> PRT

<213> synthetic

<400> 21

Met Tyr Lys Asp Leu Lys Phe Pro Val Leu Ile Val His Arg Asp Ile

1 5 10 15

Lys Ala Asp Thr Val Ala Gly Glu Arg Val Arg Gly Ile Ala His Glu

20 25 30

Leu Glu Gln Asp Gly Phe Ser Ile Leu Ser Thr Ala Ser Ser Ala Glu

35 40 45

Gly Arg Ile Val Ala Ser Thr His His Gly Leu Ala Cys Ile Leu Val

50 55 60

Ala Ala Glu Gly Ala Gly Glu Asn Gln Arg Leu Leu Gln Asp Val Val

65 70 75 80

Glu Leu Ile Arg Val Ala Arg Val Arg Ala Pro Gln Leu Pro Ile Phe

85 90 95

Ala Leu Gly Glu Gln Val Thr Ile Glu Asn Ala Pro Ala Glu Cys Met

100 105 110

Ala Asp Leu His Gln Leu Arg Gly Ile Leu Tyr Leu Phe Glu Asp Thr

115 120 125

Val Pro Phe Leu Ala Arg Gln Val Ala Arg Ala Ala Arg Asn Tyr Leu

130 135 140

Ala Gly Leu Leu Pro Pro Phe Phe Arg Ala Leu Val Glu His Thr Ala

145 150 155 160

Gln Ser Asn Tyr Ser Trp His Thr Pro Gly His Gly Gly Gly Val Ala

165 170 175

Tyr Arg Lys Ser Pro Val Gly Gln Ala Phe His Gln Phe Phe Gly Glu

180 185 190

Asn Thr Leu Arg Ser Asp Leu Ser Val Ser Val Pro Glu Leu Gly Ser

195 200 205

Leu Leu Asp His Thr Gly Pro Leu Ala Glu Ala Glu Asp Arg Ala Ala

210 215 220

Arg Asn Phe Gly Ala Asp His Thr Phe Phe Val Ile Asn Gly Thr Ser

225 230 235 240

Thr Ala Asn Lys Ile Val Trp His Ser Met Val Gly Arg Glu Asp Leu

245 250 255

Val Leu Val Asp Arg Thr Cys His Asn Ser Ile Leu His Ser Ile Ile

260 265 270

Met Thr Gly Ala Ile Pro Leu Tyr Leu Thr Pro Glu Arg Asn Glu Leu

275 280 285

Gly Ile Ile Gly Pro Ile Pro Leu Ser Glu Phe Ser Lys Gln Ser Ile

290 295 300

Ala Ala Lys Ile Ala Ala Ser Pro Leu Ala Arg Gly Arg Glu Pro Lys

305 310 315 320

Val Lys Leu Ala Val Val Thr Asn Ser Thr Tyr Asp Gly Leu Cys Tyr

325 330 335

Asn Ala Glu Leu Ile Lys Gln Thr Leu Gly Asp Ser Val Glu Val Leu

340 345 350

His Phe Asp Glu Ala Trp Tyr Ala Tyr Ala Ala Phe His Glu Phe Tyr

355 360 365

Asp Gly Arg Tyr Gly Met Gly Thr Ser Arg Ser Glu Glu Gly Pro Leu

370 375 380

Val Phe Ala Thr His Ser Thr His Lys Met Leu Ala Ala Phe Ser Gln

385 390 395 400

Ala Ser Met Ile His Val Gln Asp Gly Gly Thr Arg Lys Leu Asp Val

405 410 415

Ala Arg Phe Asn Glu Ala Phe Met Met His Ile Ser Thr Ser Pro Gln

420 425 430

Tyr Gly Ile Ile Ala Ser Leu Asp Val Ala Ser Ala Met Met Glu Gly

435 440 445

Pro Ala Gly Arg Ser Leu Ile Gln Glu Thr Phe Asp Glu Ala Leu Ser

450 455 460

Phe Arg Arg Ala Leu Ala Asn Val Arg Gln Asn Leu Asp Arg Asn Asp

465 470 475 480

Trp Trp Phe Gly Val Trp Gln Pro Glu Gln Val Glu Gly Thr Asp Gln

485 490 495

Val Gly Thr His Asp Trp Val Leu Glu Pro Ser Ala Asp Trp His Gly

500 505 510

Phe Gly Asp Ile Ala Glu Asp Tyr Val Leu Leu Asp Pro Ile Lys Val

515 520 525

Thr Leu Thr Thr Pro Gly Leu Ser Ala Gly Gly Lys Leu Ser Glu Gln

530 535 540

Gly Ile Pro Ala Ala Ile Val Ser Arg Phe Leu Trp Glu Arg Gly Leu

545 550 555 560

Val Val Glu Lys Thr Gly Leu Tyr Ser Phe Leu Val Leu Phe Ser Met

565 570 575

Gly Ile Thr Lys Gly Lys Trp Ser Thr Leu Val Thr Glu Leu Leu Glu

580 585 590

Phe Lys Arg Cys Tyr Asp Ala Asn Leu Pro Leu Leu Asp Val Leu Pro

595 600 605

Ser Val Ala Gln Ala Gly Gly Lys Arg Tyr Asn Gly Val Gly Leu Arg

610 615 620

Asp Leu Ser Asp Ala Met His Ala Ser Tyr Arg Asp Asn Ala Thr Ala

625 630 635 640

Lys Ala Met Lys Arg Met Tyr Thr Val Leu Pro Glu Val Ala Met Arg

645 650 655

Pro Ser Glu Ala Tyr Asp Lys Leu Val Arg Gly Glu Val Glu Ala Val

660 665 670

Pro Ile Ala Arg Leu Glu Gly Arg Ile Ala Ala Val Met Leu Val Pro

675 680 685

Tyr Pro Pro Gly Ile Pro Leu Ile Met Pro Gly Glu Arg Phe Thr Glu

690 695 700

Ala Thr Arg Ser Ile Leu Asp Tyr Leu Glu Phe Ala Arg Thr Phe Glu

705 710 715 720

Arg Ala Phe Pro Gly Phe Asp Ser Asp Val His Gly Leu Gln His Gln

725 730 735

Asp Gly Pro Ser Gly Arg Cys Tyr Thr Val Glu Cys Ile Lys Glu

740 745 750

<210> 22

<211> 367

<212> PRT

<213> Escherichia coli

<400> 22

Met Lys Asn Val Gly Phe Ile Gly Trp Arg Gly Met Val Gly Ser Val

1 5 10 15

Leu Met Gln Arg Met Val Glu Glu Arg Asp Phe Asp Ala Ile Arg Pro

20 25 30

Val Phe Phe Ser Thr Ser Gln Leu Gly Gln Ala Ala Pro Ser Phe Gly

35 40 45

Gly Thr Thr Gly Thr Leu Gln Asp Ala Phe Asp Leu Glu Ala Leu Lys

50 55 60

Ala Leu Asp Ile Ile Val Thr Cys Gln Gly Gly Asp Tyr Thr Asn Glu

65 70 75 80

Ile Tyr Pro Lys Leu Arg Glu Ser Gly Trp Gln Gly Tyr Trp Ile Asp

85 90 95

Ala Ala Ser Ser Leu Arg Met Lys Asp Asp Ala Ile Ile Ile Leu Asp

100 105 110

Pro Val Asn Gln Asp Val Ile Thr Asp Gly Leu Asn Asn Gly Ile Arg

115 120 125

Thr Phe Val Gly Gly Asn Cys Thr Val Ser Leu Met Leu Met Ser Leu

130 135 140

Gly Gly Leu Phe Ala Asn Asp Leu Val Asp Trp Val Ser Val Ala Thr

145 150 155 160

Tyr Gln Ala Ala Ser Gly Gly Gly Ala Arg His Met Arg Glu Leu Leu

165 170 175

Thr Gln Met Gly His Leu Tyr Gly His Val Ala Asp Glu Leu Ala Thr

180 185 190

Pro Ser Ser Ala Ile Leu Asp Ile Glu Arg Lys Val Thr Thr Leu Thr

195 200 205

Arg Ser Gly Glu Leu Pro Val Asp Asn Phe Gly Val Pro Leu Ala Gly

210 215 220

Ser Leu Ile Pro Trp Ile Asp Lys Gln Leu Asp Asn Gly Gln Ser Arg

225 230 235 240

Glu Glu Trp Lys Gly Gln Ala Glu Thr Asn Lys Ile Leu Asn Thr Ser

245 250 255

Ser Val Ile Pro Val Asp Gly Leu Cys Val Arg Val Gly Ala Leu Arg

260 265 270

Cys His Ser Gln Ala Phe Thr Ile Lys Leu Lys Lys Asp Val Ser Ile

275 280 285

Pro Thr Val Glu Glu Leu Leu Ala Ala His Asn Pro Trp Ala Lys Val

290 295 300

Val Pro Asn Asp Arg Glu Ile Thr Met Arg Glu Leu Thr Pro Ala Ala

305 310 315 320

Val Thr Gly Thr Leu Thr Thr Pro Val Gly Arg Leu Arg Lys Leu Asn

325 330 335

Met Gly Pro Glu Phe Leu Ser Ala Phe Thr Val Gly Asp Gln Leu Leu

340 345 350

Trp Gly Ala Ala Glu Pro Leu Arg Arg Met Leu Arg Gln Leu Ala

355 360 365

<210> 23

<211> 273

<212> PRT

<213> Escherichia coli

<400> 23

Met His Asp Ala Asn Ile Arg Val Ala Ile Ala Gly Ala Gly Gly Arg

1 5 10 15

Met Gly Arg Gln Leu Ile Gln Ala Ala Leu Ala Leu Glu Gly Val Gln

20 25 30

Leu Gly Ala Ala Leu Glu Arg Glu Gly Ser Ser Leu Leu Gly Ser Asp

35 40 45

Ala Gly Glu Leu Ala Gly Ala Gly Lys Thr Gly Val Thr Val Gln Ser

50 55 60

Ser Leu Asp Ala Val Lys Asp Asp Phe Asp Val Phe Ile Asp Phe Thr

65 70 75 80

Arg Pro Glu Gly Thr Leu Asn His Leu Ala Phe Cys Arg Gln His Gly

85 90 95

Lys Gly Met Val Ile Gly Thr Thr Gly Phe Asp Glu Ala Gly Lys Gln

100 105 110

Ala Ile Arg Asp Ala Ala Ala Asp Ile Ala Ile Val Phe Ala Ala Asn

115 120 125

Phe Ser Val Gly Val Asn Val Met Leu Lys Leu Leu Glu Lys Ala Ala

130 135 140

Lys Val Met Gly Asp Tyr Thr Asp Ile Glu Ile Ile Glu Ala His His

145 150 155 160

Arg His Lys Val Asp Ala Pro Ser Gly Thr Ala Leu Ala Met Gly Glu

165 170 175

Ala Ile Ala His Ala Leu Asp Lys Asp Leu Lys Asp Cys Ala Val Tyr

180 185 190

Ser Arg Glu Gly His Thr Gly Glu Arg Val Pro Gly Thr Ile Gly Phe

195 200 205

Ala Thr Val Arg Ala Gly Asp Ile Val Gly Glu His Thr Ala Met Phe

210 215 220

Ala Asp Ile Gly Glu Arg Leu Glu Ile Thr His Lys Ala Ser Ser Arg

225 230 235 240

Met Thr Phe Ala Asn Gly Ala Val Arg Ser Ala Leu Trp Leu Ser Gly

245 250 255

Lys Glu Ser Gly Leu Phe Asp Met Arg Asp Val Leu Asp Leu Asn Asn

260 265 270

Leu

<210> 24

<211> 274

<212> PRT

<213> Escherichia coli

<400> 24

Met Gln Gln Leu Gln Asn Ile Ile Glu Thr Ala Phe Glu Arg Arg Ala

1 5 10 15

Glu Ile Thr Pro Ala Asn Ala Asp Thr Val Thr Arg Glu Ala Val Asn

20 25 30

Gln Val Ile Ala Leu Leu Asp Ser Gly Ala Leu Arg Val Ala Glu Lys

35 40 45

Ile Asp Gly Gln Trp Val Thr His Gln Trp Leu Lys Lys Ala Val Leu

50 55 60

Leu Ser Phe Arg Ile Asn Asp Asn Gln Val Ile Glu Gly Ala Glu Ser

65 70 75 80

Arg Tyr Phe Asp Lys Val Pro Met Lys Phe Ala Asp Tyr Asp Glu Ala

85 90 95

Arg Phe Gln Lys Glu Gly Phe Arg Val Val Pro Pro Ala Ala Val Arg

100 105 110

Gln Gly Ala Phe Ile Ala Arg Asn Thr Val Leu Met Pro Ser Tyr Val

115 120 125

Asn Ile Gly Ala Tyr Val Asp Glu Gly Thr Met Val Asp Thr Trp Ala

130 135 140

Thr Val Gly Ser Cys Ala Gln Ile Gly Lys Asn Val His Leu Ser Gly

145 150 155 160

Gly Val Gly Ile Gly Gly Val Leu Glu Pro Leu Gln Ala Asn Pro Thr

165 170 175

Ile Ile Glu Asp Asn Cys Phe Ile Gly Ala Arg Ser Glu Val Val Glu

180 185 190

Gly Val Ile Val Glu Glu Gly Ser Val Ile Ser Met Gly Val Tyr Ile

195 200 205

Gly Gln Ser Thr Arg Ile Tyr Asp Arg Glu Thr Gly Glu Ile His Tyr

210 215 220

Gly Arg Val Pro Ala Gly Ser Val Val Val Ser Gly Asn Leu Pro Ser

225 230 235 240

Lys Asp Gly Lys Tyr Ser Leu Tyr Cys Ala Val Ile Val Lys Lys Val

245 250 255

Asp Ala Lys Thr Arg Gly Lys Val Gly Ile Asn Glu Leu Leu Arg Thr

260 265 270

Ile Asp

<210> 25

<211> 396

<212> PRT

<213> Escherichia coli

<400> 25

Met Phe Glu Asn Ile Thr Ala Ala Pro Ala Asp Pro Ile Leu Gly Leu

1 5 10 15

Ala Asp Leu Phe Arg Ala Asp Glu Arg Pro Gly Lys Ile Asn Leu Gly

20 25 30

Ile Gly Val Tyr Lys Asp Glu Thr Gly Lys Thr Pro Val Leu Thr Ser

35 40 45

Val Lys Lys Ala Glu Gln Tyr Leu Leu Glu Asn Glu Thr Thr Lys Asn

50 55 60

Tyr Leu Gly Ile Asp Gly Ile Pro Glu Phe Gly Arg Cys Thr Gln Glu

65 70 75 80

Leu Leu Phe Gly Lys Gly Ser Ala Leu Ile Asn Asp Lys Arg Ala Arg

85 90 95

Thr Ala Gln Thr Pro Gly Gly Thr Gly Ala Leu Arg Val Ala Ala Asp

100 105 110

Phe Leu Ala Lys Asn Thr Ser Val Lys Arg Val Trp Val Ser Asn Pro

115 120 125

Ser Trp Pro Asn His Lys Ser Val Phe Asn Ser Ala Gly Leu Glu Val

130 135 140

Arg Glu Tyr Ala Tyr Tyr Asp Ala Glu Asn His Thr Leu Asp Phe Asp

145 150 155 160

Ala Leu Ile Asn Ser Leu Asn Glu Ala Gln Ala Gly Asp Val Val Leu

165 170 175

Phe His Gly Cys Cys His Asn Pro Thr Gly Ile Asp Pro Thr Leu Glu

180 185 190

Gln Trp Gln Thr Leu Ala Gln Leu Ser Val Glu Lys Gly Trp Leu Pro

195 200 205

Leu Phe Asp Phe Ala Tyr Gln Gly Phe Ala Arg Gly Leu Glu Glu Asp

210 215 220

Ala Glu Gly Leu Arg Ala Phe Ala Ala Met His Lys Glu Leu Ile Val

225 230 235 240

Ala Ser Ser Tyr Ser Lys Asn Phe Gly Leu Tyr Asn Glu Arg Val Gly

245 250 255

Ala Cys Thr Leu Val Ala Ala Asp Ser Glu Thr Val Asp Arg Ala Phe

260 265 270

Ser Gln Met Lys Ala Ala Ile Arg Ala Asn Tyr Ser Asn Pro Pro Ala

275 280 285

His Gly Ala Ser Val Val Ala Thr Ile Leu Ser Asn Asp Ala Leu Arg

290 295 300

Ala Ile Trp Glu Gln Glu Leu Thr Asp Met Arg Gln Arg Ile Gln Arg

305 310 315 320

Met Arg Gln Leu Phe Val Asn Thr Leu Gln Glu Lys Gly Ala Asn Arg

325 330 335

Asp Phe Ser Phe Ile Ile Lys Gln Asn Gly Met Phe Ser Phe Ser Gly

340 345 350

Leu Thr Lys Glu Gln Val Leu Arg Leu Arg Glu Glu Phe Gly Val Tyr

355 360 365

Ala Val Ala Ser Gly Arg Val Asn Val Ala Gly Met Thr Pro Asp Asn

370 375 380

Met Ala Pro Leu Cys Glu Ala Ile Val Ala Val Leu

385 390 395

<210> 26

<211> 449

<212> PRT

<213> synthetic

<400> 26

Met Ser Glu Ile Val Val Ser Lys Phe Gly Gly Thr Ser Val Ala Asp

1 5 10 15

Phe Asp Ala Met Asn Arg Ser Ala Asp Ile Val Leu Ser Asp Ala Asn

20 25 30

Val Arg Leu Val Val Leu Ser Ala Ser Ala Gly Ile Thr Asn Leu Leu

35 40 45

Val Ala Leu Ala Glu Gly Leu Glu Pro Gly Glu Arg Phe Glu Lys Leu

50 55 60

Asp Ala Ile Arg Asn Ile Gln Phe Ala Ile Leu Glu Arg Leu Arg Tyr

65 70 75 80

Pro Asn Val Ile Arg Glu Glu Ile Glu Arg Leu Leu Glu Asn Ile Thr

85 90 95

Val Leu Ala Glu Ala Ala Ala Leu Ala Thr Ser Pro Ala Leu Thr Asp

100 105 110

Glu Leu Val Ser His Gly Glu Leu Met Ser Thr Leu Leu Phe Val Glu

115 120 125

Ile Leu Arg Glu Arg Asp Val Gln Ala Gln Trp Phe Asp Val Arg Lys

130 135 140

Val Met Arg Thr Asn Asp Arg Phe Gly Arg Ala Glu Pro Asp Ile Ala

145 150 155 160

Ala Leu Ala Glu Leu Ala Ala Leu Gln Leu Leu Pro Arg Leu Asn Glu

165 170 175

Gly Leu Val Ile Thr Gln Gly Phe Ile Gly Ser Glu Asn Lys Gly Arg

180 185 190

Thr Thr Thr Leu Gly Arg Gly Gly Ser Asp Tyr Thr Ala Ala Leu Leu

195 200 205

Ala Glu Ala Leu His Ala Ser Arg Val Asp Ile Trp Thr Asp Val Pro

210 215 220

Gly Ile Tyr Thr Thr Asp Pro Arg Val Val Ser Ala Ala Lys Arg Ile

225 230 235 240

Asp Glu Ile Ala Phe Ala Glu Ala Ala Glu Met Ala Thr Phe Gly Ala

245 250 255

Lys Val Leu His Pro Ala Thr Leu Leu Pro Ala Val Arg Ser Asp Ile

260 265 270

Pro Val Phe Val Gly Ser Ser Lys Asp Pro Arg Ala Gly Gly Thr Leu

275 280 285

Val Cys Asn Lys Thr Glu Asn Pro Pro Leu Phe Arg Ala Leu Ala Leu

290 295 300

Arg Arg Asn Gln Thr Leu Leu Thr Leu His Ser Leu Asn Ile Leu His

305 310 315 320

Ser Arg Asp Phe Leu Ala Glu Val Phe Gly Ile Leu Ala Arg His Asn

325 330 335

Ile Ser Val Asp Leu Ile Thr Thr Ser Glu Val Ser Val Ala Leu Thr

340 345 350

Leu Asp Thr Thr Gly Ser Thr Ser Thr Gly Asp Thr Leu Leu Thr Gln

355 360 365

Ser Leu Leu Met Glu Leu Ser Ala Leu Cys Arg Val Glu Val Glu Glu

370 375 380

Gly Leu Ala Leu Val Ala Leu Ile Gly Asn Asp Leu Ser Lys Ala Cys

385 390 395 400

Gly Val Gly Lys Glu Val Phe Gly Val Leu Glu Pro Phe Asn Ile Arg

405 410 415

Met Ile Cys Tyr Gly Ala Ser Ser His Asn Leu Cys Phe Leu Val Pro

420 425 430

Gly Glu Asp Ala Glu Gln Val Val Gln Lys Leu His Ser Asn Leu Phe

435 440 445

Glu

<210> 27

<211> 449

<212> PRT

<213> synthetic

<400> 27

Met Ser Glu Ile Val Val Ser Lys Phe Gly Gly Thr Ser Val Ala Asp

1 5 10 15

Phe Asp Ala Met Asn Arg Ser Ala Asp Ile Val Leu Ser Asp Ala Asn

20 25 30

Val Arg Leu Val Val Leu Ser Ala Ser Ala Gly Ile Thr Asn Leu Leu

35 40 45

Val Ala Leu Ala Glu Gly Leu Glu Pro Gly Glu Arg Phe Glu Lys Leu

50 55 60

Asp Ala Ile Arg Asn Ile Gln Phe Ala Ile Leu Glu Arg Leu Arg Tyr

65 70 75 80

Pro Asn Val Ile Arg Glu Glu Ile Glu Arg Leu Leu Glu Asn Ile Thr

85 90 95

Val Leu Ala Glu Ala Ala Ala Leu Ala Thr Ser Pro Ala Leu Thr Asp

100 105 110

Glu Leu Val Ser His Gly Glu Leu Met Ser Thr Leu Leu Phe Val Glu

115 120 125

Ile Leu Arg Glu Arg Asp Val Gln Ala Gln Trp Phe Asp Val Arg Lys

130 135 140

Val Met Arg Thr Asn Asp Arg Phe Gly Arg Ala Glu Pro Asp Ile Ala

145 150 155 160

Ala Leu Ala Glu Leu Ala Ala Leu Gln Leu Leu Pro Arg Leu Asn Glu

165 170 175

Gly Leu Val Ile Thr Gln Gly Phe Ile Gly Ser Glu Asn Lys Gly Arg

180 185 190

Thr Thr Thr Leu Gly Arg Gly Gly Ser Asp Tyr Thr Ala Ala Leu Leu

195 200 205

Ala Glu Ala Leu His Ala Ser Arg Val Asp Ile Trp Thr Asp Val Pro

210 215 220

Gly Ile Tyr Thr Thr Asp Pro Arg Val Val Ser Ala Ala Lys Arg Ile

225 230 235 240

Asp Glu Ile Ala Phe Ala Glu Ala Ala Glu Met Ala Thr Phe Gly Ala

245 250 255

Lys Val Leu His Pro Ala Thr Leu Leu Pro Ala Val Arg Ser Asp Ile

260 265 270

Pro Val Phe Val Gly Ser Ser Lys Asp Pro Arg Ala Gly Gly Thr Leu

275 280 285

Val Cys Asn Lys Thr Glu Asn Pro Pro Leu Phe Arg Ala Leu Ala Leu

290 295 300

Arg Arg Asn Gln Thr Leu Leu Thr Leu His Ser Leu Asn Met Leu His

305 310 315 320

Ser Arg Gly Phe Leu Ala Glu Val Phe Gly Ile Leu Ala Arg His Asn

325 330 335

Ile Ser Val Asp Leu Ile Thr Met Ser Glu Val Ser Val Ala Leu Ile

340 345 350

Leu Asp Thr Thr Gly Ser Thr Ser Thr Gly Asp Thr Leu Leu Thr Gln

355 360 365

Ser Leu Leu Met Glu Leu Ser Ala Leu Cys Arg Val Glu Val Glu Glu

370 375 380

Gly Leu Ala Leu Val Ala Leu Ile Gly Asn Asp Leu Ser Lys Ala Cys

385 390 395 400

Gly Val Gly Lys Glu Val Phe Gly Val Leu Glu Pro Phe Asn Ile Arg

405 410 415

Met Ile Cys Tyr Gly Ala Ser Ser His Asn Leu Cys Phe Leu Val Pro

420 425 430

Gly Glu Asp Ala Glu Gln Val Val Gln Lys Leu His Ser Asn Leu Phe

435 440 445

Glu

<210> 28

<211> 425

<212> PRT

<213> Streptomyces lividans

<400> 28

Met Gly Leu Val Val Gln Lys Tyr Gly Gly Ser Ser Val Ala Asp Ala

1 5 10 15

Glu Gly Ile Lys Arg Val Ala Lys Arg Ile Val Glu Ala Lys Lys Asn

20 25 30

Gly Asn Gln Val Val Ala Val Val Ser Ala Met Gly Asp Thr Thr Asp

35 40 45

Glu Leu Ile Asp Leu Ala Glu Gln Val Ser Pro Ile Pro Ala Gly Arg

50 55 60

Glu Leu Asp Met Leu Leu Thr Ala Gly Glu Arg Ile Ser Met Ala Leu

65 70 75 80

Leu Ala Met Ala Ile Lys Asn Leu Gly His Glu Ala Gln Ser Phe Thr

85 90 95

Gly Ser Gln Ala Gly Val Ile Thr Asp Ser Val His Asn Lys Ala Arg

100 105 110

Ile Ile Asp Val Thr Pro Gly Arg Ile Arg Thr Ser Val Asp Glu Gly

115 120 125

Asn Val Ala Ile Val Ala Gly Phe Gln Gly Val Ser Gln Asp Ser Lys

130 135 140

Asp Ile Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala

145 150 155 160

Leu Ala Ala Ala Leu Asp Ala Asp Val Cys Glu Ile Tyr Thr Asp Val

165 170 175

Asp Gly Val Phe Thr Ala Asp Pro Arg Val Val Pro Lys Ala Lys Lys

180 185 190

Ile Asp Trp Ile Ser Phe Glu Asp Met Leu Glu Leu Ala Ala Ser Gly

195 200 205

Ser Lys Val Leu Leu His Arg Cys Val Glu Tyr Ala Arg Arg Tyr Asn

210 215 220

Ile Pro Ile His Val Arg Ser Ser Phe Ser Gly Leu Gln Gly Thr Trp

225 230 235 240

Val Ser Ser Glu Pro Ile Lys Gln Gly Glu Lys His Val Glu Gln Ala

245 250 255

Leu Ile Ser Gly Val Ala His Asp Thr Ser Glu Ala Lys Val Thr Val

260 265 270

Val Gly Val Pro Asp Lys Pro Gly Glu Ala Ala Ala Ile Phe Arg Ala

275 280 285

Ile Ala Asp Ala Gln Val Asn Ile Asp Met Val Val Gln Asn Val Ser

290 295 300

Ala Ala Ser Thr Gly Leu Thr Asp Ile Ser Phe Thr Leu Pro Lys Ser

305 310 315 320

Glu Gly Arg Lys Ala Ile Asp Ala Leu Glu Lys Asn Arg Pro Gly Ile

325 330 335

Gly Phe Asp Ser Leu Arg Tyr Asp Asp Gln Ile Gly Lys Ile Ser Leu

340 345 350

Val Gly Ala Gly Met Lys Ser Asn Pro Gly Val Thr Ala Asp Phe Phe

355 360 365

Thr Ala Leu Ser Asp Ala Gly Val Asn Ile Glu Leu Ile Ser Thr Ser

370 375 380

Glu Ile Arg Ile Ser Val Val Thr Arg Lys Asp Asp Val Asn Glu Ala

385 390 395 400

Val Arg Ala Val His Thr Ala Phe Gly Leu Asp Ser Asp Ser Asp Glu

405 410 415

Ala Val Val Tyr Gly Gly Thr Gly Arg

420 425

<210> 29

<211> 1192

<212> DNA

<213> synthetic

<400> 29

atgaaatcta acaatgcgct catcgtcatc ctcggcaccg tcaccctgga tgctgtaggc 60

ataggcttgg ttatgccggt actgccgggc ctcttgcggg atatcgtcca ttccgacagc 120

atcgccagtc actatggcgt gctgctagcg ctatatgcgt tgatgcaatt tctatgcgca 180

cccgttctcg gagcactgtc cgaccgcttt ggccgccgcc cagtcctgct cgcttcgcta 240

cttggagcca ctatcgacta cgcgatcatg gcgaccacac ccgtcctgtg gatcctctac 300

gccggacgca tcgtggccgg catcaccggc gccacaggtg cggttgctgg cgcctatatc 360

gccgacatca ccgatgggga agatcgggct cgccacttcg ggctcatgag cgcttgtttc 420

ggcgtgggta tggtggcagg ccccgtggcc gggggactgt tgggcgccat ctccttgcat 480

gcaccattcc ttgcggcggc ggtgctcaac ggcctcaacc tactactggg ctgcttccta 540

atgcaggagt cgcattaagg gagagcgtcg accgatgccc ttgagagcct tcaacccagt 600

cagctccttc cggtgggcgc ggggcatgac tatcgtcgcc gcacttatga ctgtcttctt 660

tatcatgcaa ctcgtaggac aggtgccggc agcgctctgg gtcattttcg gcgaggaccg 720

ctttcgctgg agcgcgacga tgatcggcct gtcgcttgcg gtattcggaa tcttgcacgc 780

cctcgctcaa gccttcgtca ctggtcccgc caccaaacgt ttcggcgaga agcaggccat 840

tatcgccggc atggcggccg acgcgctggg ctacgtcttg ctggcgttcg cgacgcgagg 900

ctggatggcc ttccccatta tgattcttct cgcttccggc ggcatcggga tgcccgcgtt 960

gcaggccatg ctgtccaggc aggtagatga cgaccatcag ggacagcttc aaggatcgct 1020

cgcggctctt accagcctaa cttcgatcat tggaccgctg atcgtcacgg cgatttatgc 1080

cgcctcggcg agcacatgga acgggttggc atggattgta ggcgccgccc tataccttgt 1140

ctgcctcccc gcgttgcgtc gcggtgcatg gagccgggcc acctcgacct ga 1192

<210> 30

<211> 185

<212> PRT

<213> synthetic

<400> 30

Met Lys Ser Asn Asn Ala Leu Ile Val Ile Leu Gly Thr Val Thr Leu

1 5 10 15

Asp Ala Val Gly Ile Gly Leu Val Met Pro Val Leu Pro Gly Leu Leu

20 25 30

Arg Asp Ile Val His Ser Asp Ser Ile Ala Ser His Tyr Gly Val Leu

35 40 45

Leu Ala Leu Tyr Ala Leu Met Gln Phe Leu Cys Ala Pro Val Leu Gly

50 55 60

Ala Leu Ser Asp Arg Phe Gly Arg Arg Pro Val Leu Leu Ala Ser Leu

65 70 75 80

Leu Gly Ala Thr Ile Asp Tyr Ala Ile Met Ala Thr Thr Pro Val Leu

85 90 95

Trp Ile Leu Tyr Ala Gly Arg Ile Val Ala Gly Ile Thr Gly Ala Thr

100 105 110

Gly Ala Val Ala Gly Ala Tyr Ile Ala Asp Ile Thr Asp Gly Glu Asp

115 120 125

Arg Ala Arg His Phe Gly Leu Met Ser Ala Cys Phe Gly Val Gly Met

130 135 140

Val Ala Gly Pro Val Ala Gly Gly Leu Leu Gly Ala Ile Ser Leu His

145 150 155 160

Ala Pro Phe Leu Ala Ala Ala Val Leu Asn Gly Leu Asn Leu Leu Leu

165 170 175

Gly Cys Phe Leu Met Gln Glu Ser His

180 185

<210> 31

<211> 1193

<212> DNA

<213> synthetic

<400> 31

atgaaatcta acaatgcgct catcgtcatc ctcggcaccg tcaccctgga tgctgtaggc 60

ataggcttgg ttatgccggt actgccgggc ctcttgcggg atatcgtcca ttccgacagc 120

atcgccagtc actatggcgt gctgctagcg ctatatgcgt tgatgcaatt tctatgcgca 180

cccgttctcg gagcactgtc cgaccgcttt ggccgccgcc cagtcctgct cgcttcgcta 240

cttggagcca ctatcgacta cgcgatcatg gcgaccacac ccgtcctgta aggatcctct 300

acgccggacg catcgtggcc ggcatcaccg gcgccacagg tgcggttgct ggcgcctata 360

tcgccgacat caccgatggg gaagatcggg ctcgccactt cgggctcatg agcgcttgtt 420

tcggcgtggg tatggtggca ggccccgtgg ccgggggact gttgggcgcc atctccttgc 480

atgcaccatt ccttgcggcg gcggtgctca acggcctcaa cctactactg ggctgcttcc 540

taatgcagga gtcgcataag ggagagcgtc gaccgatgcc cttgagagcc ttcaacccag 600

tcagctcctt ccggtgggcg cggggcatga ctatcgtcgc cgcacttatg actgtcttct 660

ttatcatgca actcgtagga caggtgccgg cagcgctctg ggtcattttc ggcgaggacc 720

gctttcgctg gagcgcgacg atgatcggcc tgtcgcttgc ggtattcgga atcttgcacg 780

ccctcgctca agccttcgtc actggtcccg ccaccaaacg tttcggcgag aagcaggcca 840

ttatcgccgg catggcggcc gacgcgctgg gctacgtctt gctggcgttc gcgacgcgag 900

gctggatggc cttccccatt atgattcttc tcgcttccgg cggcatcggg atgcccgcgt 960

tgcaggccat gctgtccagg caggtagatg acgaccatca gggacagctt caaggatcgc 1020

tcgcggctct taccagccta acttcgatca ttggaccgct gatcgtcacg gcgatttatg 1080

ccgcctcggc gagcacatgg aacgggttgg catggattgt aggcgccgcc ctataccttg 1140

tctgcctccc cgcgttgcgt cgcggtgcat ggagccgggc cacctcgacc tga 1193

<210> 32

<211> 96

<212> PRT

<213> synthetic

<400> 32

Met Lys Ser Asn Asn Ala Leu Ile Val Ile Leu Gly Thr Val Thr Leu

1 5 10 15

Asp Ala Val Gly Ile Gly Leu Val Met Pro Val Leu Pro Gly Leu Leu

20 25 30

Arg Asp Ile Val His Ser Asp Ser Ile Ala Ser His Tyr Gly Val Leu

35 40 45

Leu Ala Leu Tyr Ala Leu Met Gln Phe Leu Cys Ala Pro Val Leu Gly

50 55 60

Ala Leu Ser Asp Arg Phe Gly Arg Arg Pro Val Leu Leu Ala Ser Leu

65 70 75 80

Leu Gly Ala Thr Ile Asp Tyr Ala Ile Met Ala Thr Thr Pro Val Leu

85 90 95

<210> 33

<211> 565

<212> PRT

<213> synthetic

<400> 33

Met Asn Val Ile Ala Ile Leu Asn His Met Gly Val Tyr Phe Lys Glu

1 5 10 15

Glu Pro Ile Arg Glu Leu His Arg Ala Leu Glu Arg Leu Asn Phe Gln

20 25 30

Ile Val Tyr Pro Asn Asp Arg Asp Asp Leu Leu Lys Leu Ile Glu Asn

35 40 45

Asn Ala Arg Leu Cys Gly Val Ile Phe Asp Trp Asp Lys Tyr Asn Leu

50 55 60

Glu Leu Cys Glu Glu Ile Ser Lys Met Asn Glu Asn Leu Pro Leu Tyr

65 70 75 80

Ala Phe Ala Asn Thr Tyr Ser Thr Leu Asp Val Ser Leu Asn Asp Leu

85 90 95

Arg Leu Gln Ile Ser Phe Phe Glu Tyr Ala Leu Gly Ala Ala Glu Asp

100 105 110

Ile Ala Asn Lys Ile Lys Gln Thr Thr Asp Glu Tyr Ile Asn Thr Ile

115 120 125

Leu Pro Pro Leu Thr Lys Ala Leu Phe Lys Tyr Val Arg Glu Gly Lys

130 135 140

Tyr Thr Phe Cys Thr Pro Gly His Met Gly Gly Thr Ala Phe Gln Lys

145 150 155 160

Ser Pro Val Gly Ser Leu Phe Tyr Asp Phe Phe Gly Pro Asn Thr Met

165 170 175

Lys Ser Asp Ile Ser Ile Ser Val Ser Glu Leu Gly Ser Leu Leu Asp

180 185 190

His Ser Gly Pro His Lys Glu Ala Glu Gln Tyr Ile Ala Arg Val Phe

195 200 205

Asn Ala Asp Arg Ser Tyr Met Val Thr Asn Gly Thr Ser Thr Ala Asn

210 215 220

Lys Ile Val Gly Met Tyr Ser Ala Pro Ala Gly Ser Thr Ile Leu Ile

225 230 235 240

Asp Arg Asn Cys His Lys Ser Leu Thr His Leu Met Met Met Ser Asp

245 250 255

Val Thr Pro Ile Tyr Phe Arg Pro Thr Arg Asn Ala Tyr Gly Ile Leu

260 265 270

Gly Gly Ile Pro Gln Ser Glu Phe Gln His Ala Thr Ile Ala Lys Arg

275 280 285

Val Lys Glu Thr Pro Asn Ala Thr Trp Pro Val His Ala Val Ile Thr

290 295 300

Asn Ser Thr Tyr Asp Gly Leu Leu Tyr Asn Thr Asp Phe Ile Lys Lys

305 310 315 320

Thr Leu Asp Val Lys Ser Ile His Phe Asp Ser Ala Trp Val Pro Tyr

325 330 335

Thr Asn Phe Ser Pro Ile Tyr Glu Gly Lys Cys Gly Met Ser Gly Gly

340 345 350

Arg Val Glu Gly Lys Val Ile Tyr Glu Thr Gln Ser Thr His Lys Leu

355 360 365

Leu Ala Ala Phe Ser Gln Ala Ser Met Ile His Val Lys Gly Asp Val

370 375 380

Asn Glu Glu Thr Phe Asn Glu Ala Tyr Met Met His Thr Thr Thr Ser

385 390 395 400

Pro His Tyr Gly Ile Val Ala Ser Thr Glu Thr Ala Ala Ala Met Met

405 410 415

Lys Gly Asn Ala Gly Lys Arg Leu Ile Asn Gly Ser Ile Glu Arg Ala

420 425 430

Ile Lys Phe Arg Lys Glu Ile Lys Arg Leu Arg Thr Glu Ser Asp Gly

435 440 445

Trp Phe Phe Asp Val Trp Gln Pro Asp His Ile Asp Thr Thr Glu Cys

450 455 460

Trp Pro Leu Arg Ser Asp Ser Thr Trp His Gly Phe Lys Asn Ile Asp

465 470 475 480

Asn Glu His Met Tyr Leu Asp Pro Ile Lys Val Thr Leu Leu Thr Pro

485 490 495

Gly Met Glu Lys Asp Gly Thr Met Ser Asp Phe Gly Ile Pro Ala Ser

500 505 510

Ile Val Ala Lys Tyr Leu Asp Glu His Gly Ile Val Val Glu Lys Thr

515 520 525

Gly Pro Tyr Asn Leu Leu Phe Leu Phe Ser Ile Gly Ile Asp Lys Thr

530 535 540

Lys Ala Leu Ser Leu Leu Arg Ala Leu Thr Asp Phe Lys Arg Ala Phe

545 550 555 560

Asp Leu Asn Leu Arg

565

<210> 34

<211> 2256

<212> DNA

<213> synthetic

<400> 34

atgtacaaag atctgaaatt ccctgttctg attgtacacc gcgatatcaa ggcggacacg 60

gtagccggcg agcgtgttcg cggtattgcc cacgaactcg aacaagacgg ctttagcatt 120

ctctctacgg cgtcttctgc ggaaggccgc attgtggcta gcacgcacca cggtctcgcc 180

tgcatcctcg tggcagctga gggtgcgggt gagaatcagc gtctgctcca agacgtggtt 240

gagctgatcc gtgtagctcg cgtccgtgcg ccacagctcc cgatcttcgc gctgggcgaa 300

caggtgacta ttgaaaacgc gcctgccgaa tgtatggccg acctgcacca gctccgcggc 360

attctgtatc tcttcgagga tactgtcccg ttcctggcac gtcaggttgc acgcgcagcg 420

cgtaactacc tcgctggcct cctcccgcca ttcttccgtg cactcgtgga gcacacggcc 480

caaagcaatt actcttggca caccccgggt cacggtggtg gtgtcgctta ccgtaaatct 540

ccggtaggtc aagctttcca ccagttcttt ggcgagaata ccctccgctc tgacctgtct 600

gttagcgttc cagagctggg cagcctgctg gatcacactg gccctctcgc ggaagcagag 660

gatcgtgccg ctcgcaattt cggtgcggac cacaccttct ttgtcatcaa tggtacctct 720

actgcgaaca aaatcgtttg gcactctatg gttggtcgcg aggacctggt gctggtcgat 780

cgtaactgtc acaaatctat tctgcactcc attatcatga cgggtgctat cccactgtac 840

ctgactccgg aacgcaacga actgggtatt atcggcccta ttccactctc cgagttttct 900

aaacaatcta tcgcagcaaa aattgccgcc tccccactcg cgcgtggtcg tgaaccgaaa 960

gttaaactgg ctgtcgttac caactctacc tatgacggtc tgtgttacaa cgcggaactg 1020

atcaaacaaa ccctcggcga ctctgtcgag gtactgcatt tcgacgaggc ttggtatgct 1080

tatgcggcgt ttcacgagtt ctacgacggc cgctacggta tgggcacttc tcgttccgaa 1140

gagggtccgc tggtctttgc tacccattct acccacaaga tgctcgcggc tttttcccaa 1200

gctagcatga ttcacgttca ggatggtggt acgcgcaagc tggacgtcgc ccgctttaac 1260

gaagccttta tgatgcacat cagcacctct ccacagtacg gcatcattgc gtctctcgat 1320

gtcgcaagcg ctatgatgga aggtcctgcc ggtcgtagcc tgatccaaga gacgttcgat 1380

gaggcgctgt ccttccgtcg tgctctggcg aatgtccgtc agaacctgga ccgtaatgat 1440

tggtggttcg gtgtctggca accggagcag gttgagggca ccgaccaggt aggtactcac 1500

gactgggttc tcgagcctag cgcggactgg catggttttg gtgacattgc ggaggattac 1560

gttctcctcg atcctatcaa agttaccctg accaccccag gtctgagcgc tggcggtaaa 1620

ctctctgaac aaggcatccc ggcagctatc gttagccgtt tcctgtggga acgtggtctg 1680

gtggtcgaga aaacgggtct gtactctttc ctggttctgt tctccatggg tatcacgaaa 1740

ggcaaatggt ctactctggt taccgagctg ctcgaattca aacgctgtta cgacgcgaat 1800

ctgccactcc tggatgtgct gccttctgta gcgcaggcgg gtggtaaacg ctataacggt 1860

gtaggtctgc gtgatctgtc cgatgccatg cacgcttctt atcgtgacaa tgccacggcg 1920

aaggccatga agcgtatgta tacggtgctc ccggaagtag ccatgcgccc gtccgaagct 1980

tatgataagc tcgtacgcgg tgaagtcgaa gctgttccta ttgcacgtct cgagggtcgt 2040

attgcggcgg ttatgctggt tccgtacccg ccaggtatcc cgctcattat gccgggtgaa 2100

cgttttactg aagctacccg ctccattctg gactatctgg agtttgcccg taccttcgag 2160

cgcgcgttcc cgggctttga ctctgatgtt cacggcctcc aacatcaaga tggcccgtct 2220

ggccgttgtt ataccgttga atgcatcaag gaataa 2256

<210> 35

<211> 2256

<212> DNA

<213> synthetic

<400> 35

atgtacaaag atctgaaatt ccctgttctg attgtacacc gcgatatcaa ggcggacacg 60

gtagccggcg agcgtgttcg cggtattgcc cacgaactcg aacaagacgg ctttagcatt 120

ctctctacgg cgtcttctgc ggaaggccgc attgtggcta gcacgcacca cggtctcgcc 180

tgcatcctcg tggcagctga gggtgcgggt gagaatcagc gtctgctcca agacgtggtt 240

gagctgatcc gtgtagctcg cgtccgtgcg ccacagctcc cgatcttcgc gctgggcgaa 300

caggtgacta ttgaaaacgc gcctgccgaa tctatggccg acctgcacca gctccgcggc 360

attctgtatc tcttcgagga tactgtcccg ttcctggcac gtcaggttgc acgcgcagcg 420

cgtaactacc tcgctggcct cctcccgcca ttcttccgtg cactcgtgga gcacacggcc 480

caaagcaatt actcttggca caccccgggt cacggtggtg gtgtcgctta ccgtaaatct 540

ccggtaggtc aagctttcca ccagttcttt ggcgagaata ccctccgctc tgacctgtct 600

gttagcgttc cagagctggg cagcctgctg gatcacactg gccctctcgc ggaagcagag 660

gatcgtgccg ctcgcaattt cggtgcggac cacaccttct ttgtcatcaa tggtacctct 720

actgcgaaca aaatcgtttg gcactctatg gttggtcgcg aggacctggt gctggtcgat 780

cgtacctgtc acaaatctat tctgcactcc attatcatga cgggtgctat cccactgtac 840

ctgactccgg aacgcaacga actgggtatt atcggcccta ttccactctc cgagttttct 900

aaacaatcta tcgcagcaaa aattgccgcc tccccactcg cgcgtggtcg tgaaccgaaa 960

gttaaactgg ctgtcgttac caactctacc tatgacggtc tgtgttacaa cgcggaactg 1020

atcaaacaaa ccctcggcga ctctgtcgag gtactgcatt tcgacgaggc ttggtatgct 1080

tatgcggcgt ttcacgagtt ctacgacggc cgctacggta tgggcacttc tcgttccgaa 1140

gagggtccgc tggtctttgc tacccattct acccacaaga tgctcgcggc tttttcccaa 1200

gctagcatga ttcacgttca ggatggtggt acgcgcaagc tggacgtcgc ccgctttaac 1260

gaagccttta tgatgcacat cagcacctct ccacagtacg gcatcattgc gtctctcgat 1320

gtcgcaagcg ctatgatgga aggtcctgcc ggtcgtagcc tgatccaaga gacgttcgat 1380

gaggcgctgt ccttccgtcg tgctctggcg aatgtccgtc agaacctgga ccgtaatgat 1440

tggtggttcg gtgtctggca accggagcag gttgagggca ccgaccaggt aggtactcac 1500

gactgggttc tcgagcctag cgcggactgg catggttttg gtgacattgc ggaggattac 1560

gttctcctcg atcctatcaa agttaccctg accaccccag gtctgagcgc tggcggtaaa 1620

ctctctgaac aaggcatccc ggcagctatc gttagccgtt tcctgtggga acgtggtctg 1680

gtggtcgaga aaacgggtct gtactctttc ctggttctgt tctccatggg tatcacgaaa 1740

ggcaaatggt ctactctggt taccgagctg ctcgaattca aacgctgtta cgacgcgaat 1800

ctgccactcc tggatgtgct gccttctgta gcgcaggcgg gtggtaaacg ctataacggt 1860

gtaggtctgc gtgatctgtc cgatgccatg cacgcttctt atcgtgacaa tgccacggcg 1920

aaggccatga agcgtatgta tacggtgctc ccggaagtag ccatgcgccc gtccgaagct 1980

tatgataagc tcgtacgcgg tgaagtcgaa gctgttccta ttgcacgtct cgagggtcgt 2040

attgcggcgg ttatgctggt tccgtacccg ccaggtatcc cgctcattat gccgggtgaa 2100

cgttttactg aagctacccg ctccattctg gactatctgg agtttgcccg taccttcgag 2160

cgcgcgttcc cgggctttga ctctgatgtt cacggcctcc aacatcaaga tggcccgtct 2220

ggccgttgtt ataccgttga atgcatcaag gaataa 2256

<210> 36

<211> 2256

<212> DNA

<213> synthetic

<400> 36

atgtacaaag atctgaaatt ccctgttctg attgtacacc gcgatatcaa ggcggacacg 60

gtagccggcg agcgtgttcg cggtattgcc cacgaactcg aacaagacgg ctttagcatt 120

ctctctacgg cgtcttctgc ggaaggccgc attgtggcta gcacgcacca cggtctcgcc 180

tgcatcctcg tggcagctga gggtgcgggt gagaatcagc gtctgctcca agacgtggtt 240

gagctgatcc gtgtagctcg cgtccgtgcg ccacagctcc cgatcttcgc gctgggcgaa 300

caggtgacta ttgaaaacgc gcctgccgaa tctatggccg acctgcacca gctccgcggc 360

attctgtatc tcttcgagga tactgtcccg ttcctggcac gtcaggttgc acgcgcagcg 420

cgtaactacc tcgctggcct cctcccgcca ttcttccgtg cactcgtgga gcacacggcc 480

caaagcaatt actcttggca caccccgggt cacggtggtg gtgtcgctta ccgtaaatct 540

ccggtaggtc aagctttcca ccagttcttt ggcgagaata ccctccgctc tgacctgtct 600

gttagcgttc cagagctggg cagcctgctg gatcacactg gccctctcgc ggaagcagag 660

gatcgtgccg ctcgcaattt cggtgcggac cacaccttct ttgtcatcaa tggtacctct 720

actgcgaaca aaatcgtttg gcactctatg gttggtcgcg aggacctggt gctggtcgat 780

cgtaactgtc acaactctat tctgcactcc attatcatga cgggtgctat cccactgtac 840

ctgactccgg aacgcaacga actgggtatt atcggcccta ttccactctc cgagttttct 900

aaacaatcta tcgcagcaaa aattgccgcc tccccactcg cgcgtggtcg tgaaccgaaa 960

gttaaactgg ctgtcgttac caactctacc tatgacggtc tgtgttacaa cgcggaactg 1020

atcaaacaaa ccctcggcga ctctgtcgag gtactgcatt tcgacgaggc ttggtatgct 1080

tatgcggcgt ttcacgagtt ctacgacggc cgctacggta tgggcacttc tcgttccgaa 1140

gagggtccgc tggtctttgc tacccattct acccacaaga tgctcgcggc tttttcccaa 1200

gctagcatga ttcacgttca ggatggtggt acgcgcaagc tggacgtcgc ccgctttaac 1260

gaagccttta tgatgcacat cagcacctct ccacagtacg gcatcattgc gtctctcgat 1320

gtcgcaagcg ctatgatgga aggtcctgcc ggtcgtagcc tgatccaaga gacgttcgat 1380

gaggcgctgt ccttccgtcg tgctctggcg aatgtccgtc agaacctgga ccgtaatgat 1440

tggtggttcg gtgtctggca accggagcag gttgagggca ccgaccaggt aggtactcac 1500

gactgggttc tcgagcctag cgcggactgg catggttttg gtgacattgc ggaggattac 1560

gttctcctcg atcctatcaa agttaccctg accaccccag gtctgagcgc tggcggtaaa 1620

ctctctgaac aaggcatccc ggcagctatc gttagccgtt tcctgtggga acgtggtctg 1680

gtggtcgaga aaacgggtct gtactctttc ctggttctgt tctccatggg tatcacgaaa 1740

ggcaaatggt ctactctggt taccgagctg ctcgaattca aacgctgtta cgacgcgaat 1800

ctgccactcc tggatgtgct gccttctgta gcgcaggcgg gtggtaaacg ctataacggt 1860

gtaggtctgc gtgatctgtc cgatgccatg cacgcttctt atcgtgacaa tgccacggcg 1920

aaggccatga agcgtatgta tacggtgctc ccggaagtag ccatgcgccc gtccgaagct 1980

tatgataagc tcgtacgcgg tgaagtcgaa gctgttccta ttgcacgtct cgagggtcgt 2040

attgcggcgg ttatgctggt tccgtacccg ccaggtatcc cgctcattat gccgggtgaa 2100

cgttttactg aagctacccg ctccattctg gactatctgg agtttgcccg taccttcgag 2160

cgcgcgttcc cgggctttga ctctgatgtt cacggcctcc aacatcaaga tggcccgtct 2220

ggccgttgtt ataccgttga atgcatcaag gaataa 2256

<210> 37

<211> 2256

<212> DNA

<213> synthetic

<400> 37

atgtacaaag atctgaaatt ccctgttctg attgtacacc gcgatatcaa ggcggacacg 60

gtagccggcg agcgtgttcg cggtattgcc cacgaactcg aacaagacgg ctttagcatt 120

ctctctacgg cgtcttctgc ggaaggccgc attgtggcta gcacgcacca cggtctcgcc 180

tgcatcctcg tggcagctga gggtgcgggt gagaatcagc gtctgctcca agacgtggtt 240

gagctgatcc gtgtagctcg cgtccgtgcg ccacagctcc cgatcttcgc gctgggcgaa 300

caggtgacta ttgaaaacgc gcctgccgaa tgtatggccg acctgcacca gctccgcggc 360

attctgtatc tcttcgagga tactgtcccg ttcctggcac gtcaggttgc acgcgcagcg 420

cgtaactacc tcgctggcct cctcccgcca ttcttccgtg cactcgtgga gcacacggcc 480

caaagcaatt actcttggca caccccgggt cacggtggtg gtgtcgctta ccgtaaatct 540

ccggtaggtc aagctttcca ccagttcttt ggcgagaata ccctccgctc tgacctgtct 600

gttagcgttc cagagctggg cagcctgctg gatcacactg gccctctcgc ggaagcagag 660

gatcgtgccg ctcgcaattt cggtgcggac cacaccttct ttgtcatcaa tggtacctct 720

actgcgaaca aaatcgtttg gcactctatg gttggtcgcg aggacctggt gctggtcgat 780

cgtacctgtc acaaatctat tctgcactcc attatcatga cgggtgctat cccactgtac 840

ctgactccgg aacgcaacga actgggtatt atcggcccta ttccactctc cgagttttct 900

aaacaatcta tcgcagcaaa aattgccgcc tccccactcg cgcgtggtcg tgaaccgaaa 960

gttaaactgg ctgtcgttac caactctacc tatgacggtc tgtgttacaa cgcggaactg 1020

atcaaacaaa ccctcggcga ctctgtcgag gtactgcatt tcgacgaggc ttggtatgct 1080

tatgcggcgt ttcacgagtt ctacgacggc cgctacggta tgggcacttc tcgttccgaa 1140

gagggtccgc tggtctttgc tacccattct acccacaaga tgctcgcggc tttttcccaa 1200

gctagcatga ttcacgttca ggatggtggt acgcgcaagc tggacgtcgc ccgctttaac 1260

gaagccttta tgatgcacat cagcacctct ccacagtacg gcatcattgc gtctctcgat 1320

gtcgcaagcg ctatgatgga aggtcctgcc ggtcgtagcc tgatccaaga gacgttcgat 1380

gaggcgctgt ccttccgtcg tgctctggcg aatgtccgtc agaacctgga ccgtaatgat 1440

tggtggttcg gtgtctggca accggagcag gttgagggca ccgaccaggt aggtactcac 1500

gactgggttc tcgagcctag cgcggactgg catggttttg gtgacattgc ggaggattac 1560

gttctcctcg atcctatcaa agttaccctg accaccccag gtctgagcgc tggcggtaaa 1620

ctctctgaac aaggcatccc ggcagctatc gttagccgtt tcctgtggga acgtggtctg 1680

gtggtcgaga aaacgggtct gtactctttc ctggttctgt tctccatggg tatcacgaaa 1740

ggcaaatggt ctactctggt taccgagctg ctcgaattca aacgctgtta cgacgcgaat 1800

ctgccactcc tggatgtgct gccttctgta gcgcaggcgg gtggtaaacg ctataacggt 1860

gtaggtctgc gtgatctgtc cgatgccatg cacgcttctt atcgtgacaa tgccacggcg 1920

aaggccatga agcgtatgta tacggtgctc ccggaagtag ccatgcgccc gtccgaagct 1980

tatgataagc tcgtacgcgg tgaagtcgaa gctgttccta ttgcacgtct cgagggtcgt 2040

attgcggcgg ttatgctggt tccgtacccg ccaggtatcc cgctcattat gccgggtgaa 2100

cgttttactg aagctacccg ctccattctg gactatctgg agtttgcccg taccttcgag 2160

cgcgcgttcc cgggctttga ctctgatgtt cacggcctcc aacatcaaga tggcccgtct 2220

ggccgttgtt ataccgttga atgcatcaag gaataa 2256

<210> 38

<211> 2256

<212> DNA

<213> synthetic

<400> 38

atgtacaaag atctgaaatt ccctgttctg attgtacacc gcgatatcaa ggcggacacg 60

gtagccggcg agcgtgttcg cggtattgcc cacgaactcg aacaagacgg ctttagcatt 120

ctctctacgg cgtcttctgc ggaaggccgc attgtggcta gcacgcacca cggtctcgcc 180

tgcatcctcg tggcagctga gggtgcgggt gagaatcagc gtctgctcca agacgtggtt 240

gagctgatcc gtgtagctcg cgtccgtgcg ccacagctcc cgatcttcgc gctgggcgaa 300

caggtgacta ttgaaaacgc gcctgccgaa tgtatggccg acctgcacca gctccgcggc 360

attctgtatc tcttcgagga tactgtcccg ttcctggcac gtcaggttgc acgcgcagcg 420

cgtaactacc tcgctggcct cctcccgcca ttcttccgtg cactcgtgga gcacacggcc 480

caaagcaatt actcttggca caccccgggt cacggtggtg gtgtcgctta ccgtaaatct 540

ccggtaggtc aagctttcca ccagttcttt ggcgagaata ccctccgctc tgacctgtct 600

gttagcgttc cagagctggg cagcctgctg gatcacactg gccctctcgc ggaagcagag 660

gatcgtgccg ctcgcaattt cggtgcggac cacaccttct ttgtcatcaa tggtacctct 720

actgcgaaca aaatcgtttg gcactctatg gttggtcgcg aggacctggt gctggtcgat 780

cgtaactgtc acaactctat tctgcactcc attatcatga cgggtgctat cccactgtac 840

ctgactccgg aacgcaacga actgggtatt atcggcccta ttccactctc cgagttttct 900

aaacaatcta tcgcagcaaa aattgccgcc tccccactcg cgcgtggtcg tgaaccgaaa 960

gttaaactgg ctgtcgttac caactctacc tatgacggtc tgtgttacaa cgcggaactg 1020

atcaaacaaa ccctcggcga ctctgtcgag gtactgcatt tcgacgaggc ttggtatgct 1080

tatgcggcgt ttcacgagtt ctacgacggc cgctacggta tgggcacttc tcgttccgaa 1140

gagggtccgc tggtctttgc tacccattct acccacaaga tgctcgcggc tttttcccaa 1200

gctagcatga ttcacgttca ggatggtggt acgcgcaagc tggacgtcgc ccgctttaac 1260

gaagccttta tgatgcacat cagcacctct ccacagtacg gcatcattgc gtctctcgat 1320

gtcgcaagcg ctatgatgga aggtcctgcc ggtcgtagcc tgatccaaga gacgttcgat 1380

gaggcgctgt ccttccgtcg tgctctggcg aatgtccgtc agaacctgga ccgtaatgat 1440

tggtggttcg gtgtctggca accggagcag gttgagggca ccgaccaggt aggtactcac 1500

gactgggttc tcgagcctag cgcggactgg catggttttg gtgacattgc ggaggattac 1560

gttctcctcg atcctatcaa agttaccctg accaccccag gtctgagcgc tggcggtaaa 1620

ctctctgaac aaggcatccc ggcagctatc gttagccgtt tcctgtggga acgtggtctg 1680

gtggtcgaga aaacgggtct gtactctttc ctggttctgt tctccatggg tatcacgaaa 1740

ggcaaatggt ctactctggt taccgagctg ctcgaattca aacgctgtta cgacgcgaat 1800

ctgccactcc tggatgtgct gccttctgta gcgcaggcgg gtggtaaacg ctataacggt 1860

gtaggtctgc gtgatctgtc cgatgccatg cacgcttctt atcgtgacaa tgccacggcg 1920

aaggccatga agcgtatgta tacggtgctc ccggaagtag ccatgcgccc gtccgaagct 1980

tatgataagc tcgtacgcgg tgaagtcgaa gctgttccta ttgcacgtct cgagggtcgt 2040

attgcggcgg ttatgctggt tccgtacccg ccaggtatcc cgctcattat gccgggtgaa 2100

cgttttactg aagctacccg ctccattctg gactatctgg agtttgcccg taccttcgag 2160

cgcgcgttcc cgggctttga ctctgatgtt cacggcctcc aacatcaaga tggcccgtct 2220

ggccgttgtt ataccgttga atgcatcaag gaataa 2256

<210> 39

<211> 2256

<212> DNA

<213> synthetic

<400> 39

atgtacaaag atctgaaatt ccctgttctg attgtacacc gcgatatcaa ggcggacacg 60

gtagccggcg agcgtgttcg cggtattgcc cacgaactcg aacaagacgg ctttagcatt 120

ctctctacgg cgtcttctgc ggaaggccgc attgtggcta gcacgcacca cggtctcgcc 180

tgcatcctcg tggcagctga gggtgcgggt gagaatcagc gtctgctcca agacgtggtt 240

gagctgatcc gtgtagctcg cgtccgtgcg ccacagctcc cgatcttcgc gctgggcgaa 300

caggtgacta ttgaaaacgc gcctgccgaa tctatggccg acctgcacca gctccgcggc 360

attctgtatc tcttcgagga tactgtcccg ttcctggcac gtcaggttgc acgcgcagcg 420

cgtaactacc tcgctggcct cctcccgcca ttcttccgtg cactcgtgga gcacacggcc 480

caaagcaatt actcttggca caccccgggt cacggtggtg gtgtcgctta ccgtaaatct 540

ccggtaggtc aagctttcca ccagttcttt ggcgagaata ccctccgctc tgacctgtct 600

gttagcgttc cagagctggg cagcctgctg gatcacactg gccctctcgc ggaagcagag 660

gatcgtgccg ctcgcaattt cggtgcggac cacaccttct ttgtcatcaa tggtacctct 720

actgcgaaca aaatcgtttg gcactctatg gttggtcgcg aggacctggt gctggtcgat 780

cgtacctgtc acaactctat tctgcactcc attatcatga cgggtgctat cccactgtac 840

ctgactccgg aacgcaacga actgggtatt atcggcccta ttccactctc cgagttttct 900

aaacaatcta tcgcagcaaa aattgccgcc tccccactcg cgcgtggtcg tgaaccgaaa 960

gttaaactgg ctgtcgttac caactctacc tatgacggtc tgtgttacaa cgcggaactg 1020

atcaaacaaa ccctcggcga ctctgtcgag gtactgcatt tcgacgaggc ttggtatgct 1080

tatgcggcgt ttcacgagtt ctacgacggc cgctacggta tgggcacttc tcgttccgaa 1140

gagggtccgc tggtctttgc tacccattct acccacaaga tgctcgcggc tttttcccaa 1200

gctagcatga ttcacgttca ggatggtggt acgcgcaagc tggacgtcgc ccgctttaac 1260

gaagccttta tgatgcacat cagcacctct ccacagtacg gcatcattgc gtctctcgat 1320

gtcgcaagcg ctatgatgga aggtcctgcc ggtcgtagcc tgatccaaga gacgttcgat 1380

gaggcgctgt ccttccgtcg tgctctggcg aatgtccgtc agaacctgga ccgtaatgat 1440

tggtggttcg gtgtctggca accggagcag gttgagggca ccgaccaggt aggtactcac 1500

gactgggttc tcgagcctag cgcggactgg catggttttg gtgacattgc ggaggattac 1560

gttctcctcg atcctatcaa agttaccctg accaccccag gtctgagcgc tggcggtaaa 1620

ctctctgaac aaggcatccc ggcagctatc gttagccgtt tcctgtggga acgtggtctg 1680

gtggtcgaga aaacgggtct gtactctttc ctggttctgt tctccatggg tatcacgaaa 1740

ggcaaatggt ctactctggt taccgagctg ctcgaattca aacgctgtta cgacgcgaat 1800

ctgccactcc tggatgtgct gccttctgta gcgcaggcgg gtggtaaacg ctataacggt 1860

gtaggtctgc gtgatctgtc cgatgccatg cacgcttctt atcgtgacaa tgccacggcg 1920

aaggccatga agcgtatgta tacggtgctc ccggaagtag ccatgcgccc gtccgaagct 1980

tatgataagc tcgtacgcgg tgaagtcgaa gctgttccta ttgcacgtct cgagggtcgt 2040

attgcggcgg ttatgctggt tccgtacccg ccaggtatcc cgctcattat gccgggtgaa 2100

cgttttactg aagctacccg ctccattctg gactatctgg agtttgcccg taccttcgag 2160

cgcgcgttcc cgggctttga ctctgatgtt cacggcctcc aacatcaaga tggcccgtct 2220

ggccgttgtt ataccgttga atgcatcaag gaataa 2256

<210> 40

<211> 2256

<212> DNA

<213> synthetic

<400> 40

atgtacaaag atctgaaatt ccctgttctg attgtacacc gcgatatcaa ggcggacacg 60

gtagccggcg agcgtgttcg cggtattgcc cacgaactcg aacaagacgg ctttagcatt 120

ctctctacgg cgtcttctgc ggaaggccgc attgtggcta gcacgcacca cggtctcgcc 180

tgcatcctcg tggcagctga gggtgcgggt gagaatcagc gtctgctcca agacgtggtt 240

gagctgatcc gtgtagctcg cgtccgtgcg ccacagctcc cgatcttcgc gctgggcgaa 300

caggtgacta ttgaaaacgc gcctgccgaa tgtatggccg acctgcacca gctccgcggc 360

attctgtatc tcttcgagga tactgtcccg ttcctggcac gtcaggttgc acgcgcagcg 420

cgtaactacc tcgctggcct cctcccgcca ttcttccgtg cactcgtgga gcacacggcc 480

caaagcaatt actcttggca caccccgggt cacggtggtg gtgtcgctta ccgtaaatct 540

ccggtaggtc aagctttcca ccagttcttt ggcgagaata ccctccgctc tgacctgtct 600

gttagcgttc cagagctggg cagcctgctg gatcacactg gccctctcgc ggaagcagag 660

gatcgtgccg ctcgcaattt cggtgcggac cacaccttct ttgtcatcaa tggtacctct 720

actgcgaaca aaatcgtttg gcactctatg gttggtcgcg aggacctggt gctggtcgat 780

cgtacctgtc acaactctat tctgcactcc attatcatga cgggtgctat cccactgtac 840

ctgactccgg aacgcaacga actgggtatt atcggcccta ttccactctc cgagttttct 900

aaacaatcta tcgcagcaaa aattgccgcc tccccactcg cgcgtggtcg tgaaccgaaa 960

gttaaactgg ctgtcgttac caactctacc tatgacggtc tgtgttacaa cgcggaactg 1020

atcaaacaaa ccctcggcga ctctgtcgag gtactgcatt tcgacgaggc ttggtatgct 1080

tatgcggcgt ttcacgagtt ctacgacggc cgctacggta tgggcacttc tcgttccgaa 1140

gagggtccgc tggtctttgc tacccattct acccacaaga tgctcgcggc tttttcccaa 1200

gctagcatga ttcacgttca ggatggtggt acgcgcaagc tggacgtcgc ccgctttaac 1260

gaagccttta tgatgcacat cagcacctct ccacagtacg gcatcattgc gtctctcgat 1320

gtcgcaagcg ctatgatgga aggtcctgcc ggtcgtagcc tgatccaaga gacgttcgat 1380

gaggcgctgt ccttccgtcg tgctctggcg aatgtccgtc agaacctgga ccgtaatgat 1440

tggtggttcg gtgtctggca accggagcag gttgagggca ccgaccaggt aggtactcac 1500

gactgggttc tcgagcctag cgcggactgg catggttttg gtgacattgc ggaggattac 1560

gttctcctcg atcctatcaa agttaccctg accaccccag gtctgagcgc tggcggtaaa 1620

ctctctgaac aaggcatccc ggcagctatc gttagccgtt tcctgtggga acgtggtctg 1680

gtggtcgaga aaacgggtct gtactctttc ctggttctgt tctccatggg tatcacgaaa 1740

ggcaaatggt ctactctggt taccgagctg ctcgaattca aacgctgtta cgacgcgaat 1800

ctgccactcc tggatgtgct gccttctgta gcgcaggcgg gtggtaaacg ctataacggt 1860

gtaggtctgc gtgatctgtc cgatgccatg cacgcttctt atcgtgacaa tgccacggcg 1920

aaggccatga agcgtatgta tacggtgctc ccggaagtag ccatgcgccc gtccgaagct 1980

tatgataagc tcgtacgcgg tgaagtcgaa gctgttccta ttgcacgtct cgagggtcgt 2040

attgcggcgg ttatgctggt tccgtacccg ccaggtatcc cgctcattat gccgggtgaa 2100

cgttttactg aagctacccg ctccattctg gactatctgg agtttgcccg taccttcgag 2160

cgcgcgttcc cgggctttga ctctgatgtt cacggcctcc aacatcaaga tggcccgtct 2220

ggccgttgtt ataccgttga atgcatcaag gaataa 2256

<210> 41

<211> 2148

<212> DNA

<213> Escherichia coli

<400> 41

atgaacgtta ttgcaatatt gaatcacatg ggggtttatt ttaaagaaga acccatccgt 60

gaacttcatc gcgcgcttga acgtctgaac ttccagattg tttacccgaa cgaccgtgac 120

gacttattaa aactgatcga aaacaatgcg cgtctgtgcg gcgttatttt tgactgggat 180

aaatataatc tcgagctgtg cgaagaaatt agcaaaatga acgagaacct gccgttgtac 240

gcgttcgcta atacgtattc cactctcgat gtaagcctga atgacctgcg tttacagatt 300

agcttctttg aatatgcgct gggtgctgct gaagatattg ctaataagat caagcagacc 360

actgacgaat atatcaacac tattctgcct ccgctgacta aagcactgtt taaatatgtt 420

cgtgaaggta aatatacttt ctgtactcct ggtcacatgg gcggtactgc attccagaaa 480

agcccggtag gtagcctgtt ctatgatttc tttggtccga ataccatgaa atctgatatt 540

tccatttcag tatctgaact gggttctctg ctggatcaca gtggtccaca caaagaagca 600

gaacagtata tcgctcgcgt ctttaacgca gaccgcagct acatggtgac caacggtact 660

tccactgcga acaaaattgt tggtatgtac tctgctccag caggcagcac cattctgatt 720

gaccgtaact gccacaaatc gctgacccac ctgatgatga tgagcgatgt tacgccaatc 780

tatttccgcc cgacccgtaa cgcttacggt attcttggtg gtatcccaca gagtgaattc 840

cagcacgcta ccattgctaa gcgcgtgaaa gaaacaccaa acgcaacctg gccggtacat 900

gctgtaatta ccaactctac ctatgatggt ctgctgtaca acaccgactt catcaagaaa 960

acactggatg tgaaatccat ccactttgac tccgcgtggg tgccttacac caacttctca 1020

ccgatttacg aaggtaaatg cggtatgagc ggtggccgtg tagaagggaa agtgatttac 1080

gaaacccagt ccactcacaa actgctggcg gcgttctctc aggcttccat gatccacgtt 1140

aaaggtgacg taaacgaaga aacctttaac gaagcctaca tgatgcacac caccacttct 1200

ccgcactacg gtatcgtggc gtccactgaa accgctgcgg cgatgatgaa aggcaatgca 1260

ggtaagcgtc tgatcaacgg ttctattgaa cgtgcgatca aattccgtaa agagatcaaa 1320

cgtctgagaa cggaatctga tggctggttc tttgatgtat ggcagccgga tcatatcgat 1380

acgactgaat gctggccgct gcgttctgac agcacctggc acggcttcaa aaacatcgat 1440

aacgagcaca tgtatcttga cccgatcaaa gtcaccctgc tgactccggg gatggaaaaa 1500

gacggcacca tgagcgactt tggtattccg gccagcatcg tggcgaaata cctcgacgaa 1560

catggcatcg ttgttgagaa aaccggtccg tataacctgc tgttcctgtt cagcatcggt 1620

atcgataaga ccaaagcact gagcctgctg cgtgctctga ctgactttaa acgtgcgttc 1680

gacctgaacc tgcgtgtgaa aaacatgctg ccgtctctgt atcgtgaaga tcctgaattc 1740

tatgaaaaca tgcgtattca ggaactggct cagaatatcc acaaactgat tgttcaccac 1800

aatctgccgg atctgatgta tcgcgcattt gaagtgctgc cgacgatggt aatgactccg 1860

tatgctgcat tccagaaaga gctgcacggt atgaccgaag aagtttacct cgacgaaatg 1920

gtaggtcgta ttaacgccaa tatgatcctt ccgtacccgc cgggagttcc tctggtaatg 1980

ccgggtgaaa tgatcaccga agaaagccgt ccggttctgg agttcctgca gatgctgtgt 2040

gaaatcggcg ctcactatcc gggctttgaa accgatattc acggtgcata ccgtcaggct 2100

gatggccgct ataccgttaa ggtattgaaa gaagaaagca aaaaataa 2148

<210> 42

<211> 2142

<212> DNA

<213> Escherichia coli

<400> 42

atgaacatca ttgccattat gggaccgcat ggcgtctttt ataaagatga gcccatcaaa 60

gaactggagt cggcgctggt ggcgcaaggc tttcagatta tctggccaca aaacagcgtt 120

gatttgctga aatttatcga gcataaccct cgaatttgcg gcgtgatttt tgactgggat 180

gagtacagtc tcgatttatg tagcgatatc aatcagctta atgaatatct cccgctttat 240

gccttcatca acacccactc gacgatggat gtcagcgtgc aggatatgcg gatggcgctc 300

tggttttttg aatatgcgct ggggcaggcg gaagatatcg ccattcgtat gcgtcagtac 360

accgacgaat atcttgataa cattacaccg ccgttcacga aagccttgtt tacctacgtc 420

aaagagcgga agtacacctt ttgtacgccg gggcatatgg gcggcaccgc atatcaaaaa 480

agcccggttg gctgtctgtt ttatgatttt ttcggcggga atactcttaa ggctgatgtc 540

tctatttcgg tcaccgagct tggttcgttg ctcgaccaca ccgggccaca cctggaagcg 600

gaagagtaca tcgcgcggac ttttggcgcg gaacagagtt atatcgttac caacggaaca 660

tcgacgtcga acaaaattgt gggtatgtac gccgcgccat ccggcagtac gctgttgatc 720

gaccgcaatt gtcataaatc gctggcgcat ctgttgatga tgaacgatgt agtgccagtc 780

tggctgaaac cgacgcgtaa tgcgttgggg attcttggtg ggatcccgcg ccgtgaattt 840

actcgcgaca gcatcgaaga gaaagtcgct gctaccacgc aagcacaatg gccggttcat 900

gcggtgatca ccaactccac ctatgatggc ttgctctaca acaccgactg gatcaaacag 960

acgctggatg tcccgtcgat tcacttcgat tctgcctggg tgccgtacac ccattttcat 1020

ccgatctacc agggtaaaag tggtatgagc ggcgagcgtg ttgcgggaaa agtgatcttc 1080

gaaacgcaat cgacccacaa aatgctggcg gcgttatcgc aggcttcgct gatccacatt 1140

aaaggcgagt atgacgaaga ggcctttaac gaagccttta tgatgcatac caccacctcg 1200

cccagttatc ccattgttgc ttcggttgag acggcggcgg cgatgctgcg tggtaatccg 1260

ggcaaacggc tgattaaccg ttcagtagaa cgagctctgc attttcgcaa agaggtccag 1320

cggctgcggg aagagtctga cggttggttt ttcgatatct ggcaaccgcc gcaggtggat 1380

gaagccgaat gctggcccgt tgcgcctggc gaacagtggc acggctttaa cgatgcggat 1440

gccgatcata tgtttctcga tccggttaaa gtcactattt tgacaccggg gatggacgag 1500

cagggcaata tgagcgagga ggggatcccg gcggcgctgg tagcaaaatt cctcgacgaa 1560

cgtgggatcg tagtagagaa aaccggccct tataacctgc tgtttctctt tagtattggc 1620

atcgataaaa ccaaagcaat gggattattg cgtgggttga cggaattcaa acgctcttac 1680

gatctcaacc tgcggatcaa aaatatgcta cccgatctct atgcagaaga tcccgatttc 1740

taccgcaata tgcgtattca ggatctggca caagggatcc ataagctgat tcgtaaacac 1800

gatcttcccg gtttgatgtt gcgggcattc gatactttgc cggagatgat catgacgcca 1860

catcaggcat ggcaacgaca aattaaaggc gaagtagaaa ccattgcgct ggaacaactg 1920

gtcggtagag tatcggcaaa tatgatcctg ccttatccac cgggcgtacc gctgttgatg 1980

cctggagaaa tgctgaccaa agagagccgc acagtactcg attttctact gatgctttgt 2040

tccgtcgggc aacattaccc cggttttgaa acggatattc acggcgcgaa acaggacgaa 2100

gacggcgttt accgcgtacg agtcctaaaa atggcgggat aa 2142

Claims

1.一种第一表达质粒载体，其包含：

一个或多个第一多核苷酸和一个或多个第三多核苷酸，所述第一多核苷酸编码四环素外排泵多肽片段的第一多肽，所述第三多核苷酸编码赖氨酸脱羧酶多肽的第三多肽，及

骨架质粒，其能在宿主细胞中自主复制，

其中所述第一表达质粒载体用于生产赖氨酸或赖氨酸衍生产物，

其中所述赖氨酸衍生产物是尸胺，

其中所述第一多肽选自SEQ ID NO: 30 (TetA (aa1-185))和SEQ ID NO: 32 (TetA(aa1-96))。

2.权利要求1的第一表达质粒载体，其由所述一个或多个第一多核苷酸、一个或多个第三多核苷酸及骨架质粒组成。

3.权利要求1的第一表达质粒载体，进一步包含第四多核苷酸，其编码赖氨酸生物合成多肽的第四多肽。

4.一种转化体，其在宿主细胞中包含一个或多个权利要求1-3任一项的第一表达质粒载体。

5.权利要求4的转化体，进一步包含一个或多个第二表达质粒载体，所述第二表达质粒载体包含一个或多个第五多核苷酸，所述第五多核苷酸独立地选自：第一多核苷酸，其编码四环素外排泵多肽片段的第一多肽；第三多核苷酸，其编码赖氨酸脱羧酶多肽的第三多肽；及第四多核苷酸，其编码赖氨酸生物合成多肽的第四多肽；及

骨架质粒，其能在宿主细胞中自主复制，其中所述一个或多个第二表达质粒载体用于生产赖氨酸或赖氨酸衍生产物，

其中所述赖氨酸衍生产物是尸胺，

6.权利要求4的转化体或权利要求1的第一表达质粒载体，其中所述骨架质粒是大肠杆菌表达质粒载体。

7.权利要求6的转化体或第一表达质粒载体，其中所述骨架质粒选自pUC18、pUC19、pBR322、pACYC、pET、pSC101及其任何衍生质粒。

8.权利要求4的转化体或权利要求1的第一表达质粒载体，其中所述表达质粒载体进一步包含一个或多个第六多核苷酸，所述第六多核苷酸编码抗生素抗性蛋白的第六多肽。

9.权利要求8的转化体或第一表达质粒载体，其中所述抗生素抗性蛋白包括四环素抗性蛋白质或土霉素抗性蛋白。

10.权利要求9的转化体或表达质粒载体，其中所述抗生素抗性蛋白选自OtrA、OtrB、OtrC和Tcr3。

11.一种突变宿主细胞，其包含整合进宿主细胞染色体中的一个或多个第一多核苷酸，其中所述第一多核苷酸编码四环素外排泵多肽片段的第一多肽，

进一步包含整合进宿主细胞染色体中的一个或多个第三多核苷酸，其编码赖氨酸脱羧酶多肽的第三多肽，

12.权利要求11所述的突变宿主细胞，进一步包含整合进宿主细胞染色体中的一个或多个第四多核苷酸，其编码赖氨酸生物合成多肽的第四多肽。

13.权利要求11所述的突变宿主细胞，其中所述一个或多个多核苷酸序列通过PCR介导的基因置换方法整合进宿主细胞的染色体中。

14.权利要求1的表达质粒载体、权利要求4的转化体或权利要求11所述的突变宿主细胞，其中所述第一多核苷酸选自SEQ ID NO: 29 (tetA (nt 1-558))和SEQ ID NO: 31(tetA (nt 1-291))。

15.权利要求1的表达质粒载体、权利要求4的转化体或权利要求11所述的突变宿主细胞，其中：

所述第三多核苷酸选自SEQ ID NO: 41 (cadA)、SEQ ID NO: 42 (ldcC)、SEQ ID NO:8 (ldc2)。

16.权利要求3的表达质粒载体或权利要求12所述的突变宿主细胞，其中：

所述第四多核苷酸选自sucA、ppc、aspC、lysC、asd、dapA、dapB、dapD、argD、dapE、dapF、lysA、ddh、pntAB、cyoABE、gadAB、ybjE、gdhA、gltA、sucC、gadC、acnB、pflB、thrA、aceA、aceB、gltB、aceE、sdhA、murE、speE、speG、puuA、puuP、ygjG。

17.权利要求3的表达质粒载体或权利要求12的突变宿主细胞，其中：

所述第三多肽选自SEQ ID NO: 6 (CadA)、SEQ ID NO: 7 (LdcC)、SEQ ID NO: 9(Ldc2)，及

所述第四多肽选自SucA、Ppc、AspC、LysC、Asd、DapA、DapB、DapD、ArgD、DapE、DapF、LysA、Ddh、PntAB、CyoABE、GadAB、YbjE、GdhA、GltA、SucC、GadC、AcnB、PflB、ThrA、AceA、AceB、GltB、AceE、SdhA、MurE、SpeE、SpeG、PuuA、PuuP和YgjG。

18.权利要求3的表达质粒载体或权利要求12的突变宿主细胞，其中所述第四多肽选自SEQ ID NO: 3 (LysC)、SEQ ID NO: 4 (DapA)、SEQ ID NO: 5 (LysA)、SEQ ID NO: 22(Asd)、SEQ ID NO: 23 (DapB)、SEQ ID NO: 24 (DapD)、SEQ ID NO: 25 (AspC)、SEQ IDNO: 26 (LysC-1)、SEQ ID NO: 27 (LysC-2)和SEQ ID NO: 28 (S-LysC)。

19.权利要求1-18任一项的表达质粒载体、转化体或突变宿主细胞，其中所述宿主细胞来自哈夫尼菌属(Hafnia)、埃希氏菌属(Escherichia)或棒杆菌属(Corynebacterium)。

20.权利要求19的表达质粒载体、转化体或突变宿主细胞，其中所述宿主细胞来自蜂房哈夫尼菌(Hafnia alvei)、大肠杆菌(Escherichia coli)或谷氨酸棒杆菌(Corynebacterium glutamicum)。

21.一种生产赖氨酸的方法，包括：

获得权利要求4-10、14-15和19-20任一项的转化体和/或权利要求11-20任一项的突变宿主细胞；

收获赖氨酸。

22.一种生产尸胺(1,5-戊二胺)的方法，包括：

1a) 培养权利要求4-10、14-15和19-20任一项的转化体和/或权利要求11-20任一项的突变宿主细胞；

1b) 使用得自步骤1a)的培养物使赖氨酸脱羧而生产尸胺；及

1c) 使用得自步骤1b)的培养物提取和纯化尸胺。