CN112823165B

CN112823165B - 新型l-色氨酸输出蛋白变体及使用其生产l-色氨酸的方法

Info

Publication number: CN112823165B
Application number: CN202080004146.7A
Authority: CN
Inventors: 郑武泳; 金贤雅; 徐昌一; 李任相; 金智元; 金泰延; 孙晟光; 丁起龙
Original assignee: CJ CheilJedang Corp
Current assignee: CJ CheilJedang Corp
Priority date: 2019-04-05
Filing date: 2020-03-20
Publication date: 2024-03-26
Anticipated expiration: 2040-03-20
Also published as: JP2021525108A; JP7539871B2; WO2020204427A1; CN112823165A; RU2763603C1; JP2022185040A; MX2021000685A; KR20200118334A; EP3789398A4; CA3105666C; US11524981B2; CA3105666A1; US20220009973A1; EP3789398A1; KR102205717B1; BR112021000765B1; BR112021000765A2

Abstract

本申请涉及具有色氨酸输出活性的蛋白质变体、生产L‑色氨酸和表达蛋白质变体的微生物、以及使用该微生物生产L‑色氨酸的方法。

Description

新型L-色氨酸输出蛋白变体及使用其生产L-色氨酸的方法

技术领域

本公开涉及具有色氨酸输出活性的新型蛋白质变体、表达该蛋白质变体的生产L-色氨酸的微生物、以及使用该微生物生产L-色氨酸的方法。

背景技术

色氨酸(其是一种必需氨基酸)已被广泛用作饲料添加剂、药物(例如输液溶液)、保健食品材料等的原料。目前，使用微生物的直接发酵方法主要用于生产L-色氨酸。

以前，通过化学或物理突变表现出对类似物抗性的选择菌株已主要被用作生产L-色氨酸的微生物。然而，随着20世纪90年代基因重组技术的快速发展和分子水平调控机制被鉴定，主要通过利用基因工程技术使用重组菌株。

同时，能够输出特定氨基酸的基因的表达已有助于增加微生物中相应氨基酸的产率。棒杆菌属(genus Corynebacterium)微生物中L-赖氨酸输出基因(lysE)的表达增强已提高了赖氨酸的产率(WO9723597A2)。另外，大肠杆菌(E.coli)中rhtC基因的增强已提高了对L-苏氨酸的抗性，并同时也已提高了L-高丝氨酸、L-苏氨酸和L-亮氨酸的产率(EP1013765A1)。另外，专利号EP1016710B1公开了通过增强yahN、yeaS、yfiK和yggA基因提高了L-谷氨酸、L-赖氨酸、L-苏氨酸、L-丙氨酸、L-组氨酸、L-脯氨酸、L-精氨酸、L-缬氨酸和L-异亮氨酸的产率，这些基因的功能尚未在大肠杆菌中被鉴定。

然而，直到最近尚未报道对L-色氨酸显示出特异性的输出蛋白。尽管大肠杆菌的yddG基因是已知的，但它对L-苯丙氨酸比对L-色氨酸显示出更高的特异性(FEMSMicrobiol Lett 275(2007),312至318)。另外，在主要用作生产L-氨基酸发酵菌株的棒杆菌属的微生物中，尚未报道输出L-色氨酸或芳香族氨基酸的基因(J Ind MicrobiolBiotechnol.2015May；42(5):787至797)。

发明内容

[技术问题]

本公开的发明人已成功地在生产L-色氨酸的微生物中表达了对L-色氨酸具有特异性的新型色氨酸输出蛋白，且结果，他们已经发现L-色氨酸生产量显著提高了。此外，通过突变的引入进一步提高了输出相应膜蛋白的能力，他们已经确认了L-色氨酸生产量显著提高了。由此，已经完成了本公开。

[技术方案]

本公开的目的是提供具有L-色氨酸输出活性的蛋白质变体，其中选自与SEQ IDNO:1的氨基酸序列中第79位至第83位的氨基酸对应的氨基酸中的至少一个氨基酸被疏水性或脂肪族氨基酸取代。

本公开的另一目的是提供编码变体的多核苷酸；和包含多核苷酸的载体。

本公开的又一目的是提供表达蛋白质变体的生产L-色氨酸的微生物。

本公开的又一目的是提供生产L-色氨酸的方法，其包括在培养基中培养微生物。

本公开的又一目的是提供蛋白质变体的用于增加L-色氨酸生产的用途。

[技术效果]

本公开的发明人已经发现了对L-色氨酸具有特异性的新型的输出基因，并且已经尝试在生产L-色氨酸的微生物中表达该基因。结果，他们已经确认了该微生物与其中不表达该基因的其亲本菌株相比，能够显著提高L-色氨酸的生成量，并且也已经发现了由该基因编码的蛋白质变体，该变体允许该微生物更显著地提高L-色氨酸生产量，从而确认L-色氨酸可以通过其有效地生产。

附图说明

图1显示根据葡萄糖消耗的谷氨酸棒杆菌(Corynebacterium glutamicum)的修饰菌株CA04-8352和CA04-8405中的色氨酸胞内浓度。

具体实施方式

在下文中，将更详细描述本公开。同时，本公开所公开的每个描述和实施方式可以应用于不同的描述和实施方式中的每个。换句话说，本公开中所公开的各种组成部分的所有组合都被包括在本公开的范围内。进一步地，本公开的范围不应受下面提供的详细描述的限制。

本公开的一个方面提供了具有L-色氨酸输出能力的蛋白质变体，其中蛋白质变体包含SEQ ID NO:1的氨基酸序列中的至少一个突变。

突变可以包括其中选自从SEQ ID NO:1的氨基酸序列的N-端的第79个氨基酸至第83个氨基酸中的至少一个氨基酸被不同的氨基酸取代的突变。

蛋白质变体可以是具有L-色氨酸输出活性的蛋白质变体，其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位氨基酸中的至少一个氨基酸被不同的氨基酸取代。具体地，蛋白质变体可以是具有L-色氨酸输出活性的蛋白质变体，其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被疏水性氨基酸或脂肪族氨基酸取代。

如本文所用，术语“L-色氨酸”(其是α-氨基酸中的一种)是指不在体内合成的必需氨基酸，并且它是具有化学式C₁₁H₁₂N₂O₂的芳香族L-氨基酸。

在本公开中，“具有L-色氨酸输出能力的蛋白质”或“具有L-色氨酸输出活性的蛋白质”是指具有在细胞外特异性地输出L-色氨酸的活性的膜蛋白。

具有L-色氨酸输出活性的蛋白质可以是具有L-色氨酸输出活性的源自根际草螺菌(Herbaspirillum rhizosphaerae)的蛋白质。具有L-色氨酸输出活性的源自根际草螺菌的蛋白质可以是例如包含SEQ ID NO:1的氨基酸序列的蛋白质。包含SEQ ID NO:1的氨基酸序列的蛋白质可以与具有SEQ ID NO:1的氨基酸序列的蛋白质和由SEQ ID NO:1的氨基酸序列组成的蛋白质互换使用。

特别地，“根际草螺菌”是属于草螺菌属(genus Herbaspirillum)的革兰氏阴性细菌。在韩国，作为从郁陵岛(Ulleung island)等分离的菌株，根际草螺菌可以从土壤的根际分离。

另外，尽管具有L-色氨酸输出活性的本公开的蛋白质被定义为包含SEQ ID NO:1的氨基酸序列的蛋白质，但是它不排除在SEQ ID NO:1的氨基酸序列的上游或下游无意义的序列的添加、可天然发生的突变、或其沉默突变，且对于本领域技术人员是显而易见的是，具有与包含SEQ ID NO:1的氨基酸序列的蛋白质相同或相应的活性的任何蛋白质都属于具有L-色氨酸输出活性的本公开的蛋白质。具体地，例如，具有L-色氨酸输出活性的本公开的蛋白质可以是由SEQ ID NO:1的氨基酸序列组成的蛋白质、或与SEQ ID NO:1的氨基酸序列具有80％、90％、95％、97％或更高同源性或同一性的氨基酸序列组成的蛋白质。另外，显而易见的是只要该蛋白质具有上述同源性或同一性中的任何的氨基酸序列，并表现出对应于上述蛋白质的效果，则在部分序列中具有缺失、修饰、取代或添加的氨基酸序列的任何蛋白质也可以属于本公开的待突变的蛋白质的范围。

也就是说，在本公开中，即使在将其描述为“具有特定SEQ ID NO的氨基酸序列的蛋白质或多肽”或“由特定SEQ ID NO的氨基酸序列组成的蛋白质或多肽”的情况下，显而易见的是，只要该蛋白质具有与由相应SEQ ID NO的氨基酸序列组成的多肽的活性相同或对应的活性，则具有部分序列中缺失、修饰、取代或添加的氨基酸序列的任何蛋白质也可用于本公开。例如，显而易见的是，只要多肽具有与SEQ ID NO:1相同或对应的活性，则“由SEQID NO:1的氨基酸序列组成的多肽”也可以属于“由SEQ ID NO:1的氨基酸序列组成的多肽”。

本公开中提供的具有L-色氨酸输出能力的蛋白质变体可以是指这样的变体，其中在具有上述L-色氨酸输出能力的蛋白质中，在其特定位置的氨基酸被取代，并且与突变前的蛋白质的L-色氨酸输出能力相比所得到的L-色氨酸输出能力超过100％。

如本文所用，术语“变体”是指其中在保守取代和/或修饰中，至少一个氨基酸与所列举序列的氨基酸不同，但是维持蛋白质的功能和性质的蛋白质。变体通过几个氨基酸的取代、缺失或添加而与鉴定的序列不同。通常可以通过修饰上述蛋白质的氨基酸序列中的一个或多个氨基酸并评估上述修饰的蛋白质的性质来鉴定这样的变体。也就是说，相对于其天然蛋白质的能力，变体的能力可以增加、不变或减小。另外，一些变体可包括其中一个或多个部分(例如，N端前导序列或跨膜结构域)被移除的变体。其它变体可包括其中成熟蛋白质的N-和/或C-端的部分被移除的变体。术语“变体”可与“修饰”、“修饰蛋白”、“修饰多肽”、“突变体”、“突变蛋白质(mutein)”、“趋异的(divergent)”、“变体”等互换使用，但是只要这些术语用于表明被变异，待使用的术语不限于此且可以使用任何术语。为了本公开的目的，变体可指其中与天然野生型或未修饰蛋白的活性相比，突变蛋白质的活性增加的变体，但变体不限于此。

如本文所用，术语“保守取代”是指一个氨基酸被具有类似结构和/或化学性质的另一个氨基酸取代。例如，变体可保留一种或多种生物活性同时具有一个或多个保守取代。这种氨基酸取代通常可基于残基的极性、电荷、溶解度、疏水性、亲水性、和/或两亲性性质的相似性而发生。例如，在带电氨基酸中，带正电的(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸；带负电的(酸性)氨基酸包括谷氨酸和天冬氨酸。在不带电的氨基酸中，非极性氨基酸包括甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、蛋氨酸、苯丙氨酸、色氨酸、和脯氨酸；极性或亲水性氨基酸包括丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺、和谷氨酰胺；以及芳香氨基酸包括苯丙氨酸、色氨酸和酪氨酸。

进一步地，变体可包括对多肽的性质和二级结构具有最小影响的氨基酸的缺失或添加。例如，多肽可以与共翻译时或翻译后指导蛋白质转移的蛋白质N-端处的信号(或前导)序列缀合。另外，多肽也可以与另一序列或连接子缀合用于多肽的鉴定、纯化或合成。

只要取代的氨基酸与取代前的氨基酸不同，“用不同氨基酸的取代”不受限制。也就是说，只要将SEQ ID NO:1的氨基酸序列的N-端的第79个氨基酸(即亮氨酸)用亮氨酸以外的氨基酸取代；将SEQ ID NO:1的氨基酸序列的N-端的第80个氨基酸(即，丝氨酸)用丝氨酸以外的氨基酸取代；将SEQ ID NO:1的氨基酸序列的N-端的第81个氨基酸(即亮氨酸)用亮氨酸以外的氨基酸取代；将SEQ ID NO:1的氨基酸序列的N-端的第82个氨基酸(即，丝氨酸)用丝氨酸以外的氨基酸取代；或者将SEQ ID NO:1的氨基酸序列的N-端的第83个氨基酸(即异亮氨酸)用异亮氨酸以外的氨基酸取代，“用不同氨基酸的取代”不受限制。同时，当在本公开中表达为“特定氨基酸被取代”时，即使未具体说明氨基酸已被不同的氨基酸取代，显然，氨基酸被与取代之前的氨基酸不同的氨基酸取代。

可替代地，蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被取代前的氨基酸以外的氨基酸(不包括酸性氨基酸和碱性氨基酸)取代的变体。可替代地，蛋白质变体可以是具有不带电的氨基酸的变体，其中取代的氨基酸与取代前的氨基酸不同，但蛋白质变体不限于此。

可替代地，蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被与取代前的氨基酸不同的疏水性氨基酸和脂肪族氨基酸之间的氨基酸取代的变体。具体地，蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被疏水性(非极性)氨基酸和脂肪族氨基酸之间的任一个氨基酸取代的变体。脂肪族氨基酸可以是例如选自甘氨酸、丙氨酸、缬氨酸、亮氨酸、和异亮氨酸的氨基酸，但脂肪族氨基酸不限于此。疏水性(非极性)氨基酸可以是例如选自甘氨酸、蛋氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、酪氨酸、和色氨酸的氨基酸，但疏水性(非极性)氨基酸不限于此。

可替代地，蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被小尺寸氨基酸中与取代前的氨基酸不同的氨基酸取代的变体，但蛋白质变体不限于此。

如本文所用，术语“小尺寸氨基酸”包括20种氨基酸中具有相对小尺寸的氨基酸(即，甘氨酸、丙氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、和天冬酰胺)，并且具体地，可以指甘氨酸、丙氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、亮氨酸、异亮氨酸和脯氨酸，但是小尺寸氨基酸不限于此；且更具体地，小尺寸氨基酸可以指甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、丝氨酸、和苏氨酸，但小尺寸氨基酸不限于此。

可替代地，蛋白质变体可以是其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被选自丙氨酸、缬氨酸、亮氨酸和异亮氨酸的氨基酸取代的变体，但蛋白质变体不限于此。

具体地，蛋白质变体中被不同氨基酸的取代可以是选自下列取代的一个或多个取代，取代由以下取代组成：其中SEQ ID NO:1的氨基酸序列中的第79个氨基酸(即，亮氨酸)被丙氨酸、缬氨酸、或异亮氨酸取代的取代；其中SEQ ID NO:1的氨基酸序列中的第80个氨基酸(即，丝氨酸)被丙氨酸、缬氨酸、亮氨酸、或异亮氨酸取代的取代；其中SEQ ID NO:1的氨基酸序列中的第81个氨基酸(即，亮氨酸)被丙氨酸、缬氨酸、或异亮氨酸取代的取代；其中SEQ ID NO:1的氨基酸序列中的第82个氨基酸(即，丝氨酸)被丙氨酸、缬氨酸、亮氨酸、或异亮氨酸取代的取代；以及其中SEQ ID NO:1的氨基酸序列中的第83个氨基酸(即，异亮氨酸)被丙氨酸、缬氨酸、或亮氨酸取代，但取代不限于此。

由此，与突变前的蛋白质相比，本公开的蛋白质变体具有增强的L-色氨酸输出能力。

显然，本公开的蛋白质变体(其中SEQ ID NO:1的从N-端第79位至第83位的氨基酸中的至少一个氨基酸被不同的氨基酸取代)包括其中与第79位至第83位相对应的位置的氨基酸被不同的氨基酸取代的蛋白质变体。

本领域普通技术人员将能够通过应用本领域已知的确认序列比对、同源性或同一性的方法将任何序列与本公开的SEQ ID NO:1比较，来鉴定任何序列中任何位置的氨基酸是否是与SEQ ID NO:1的第79位至第83位的氨基酸相对应的氨基酸。

因此，虽然本文没有另外描述，但显然，涉及“SEQ ID NO:1的第79位至第83位的氨基酸”的描述也可以是应用于任何序列(例如与SEQ ID NO:1具有50％、60％、70％、80％、或90％、或更高同一性的序列)中的“与SEQ ID NO:1的第79位至第83位的氨基酸相对应的氨基酸”的描述。

例如，本公开的蛋白质变体可以是其中与第79位至第83位的氨基酸对应的氨基酸被不同的氨基酸取代并且与SEQ ID NO:1具有70％、80％、90％、或95％同一性的蛋白质变体，但本公开的蛋白质变体不限于此。

其中SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的一个或多个氨基酸被不同的氨基酸取代的蛋白质变体可以是包括SEQ ID NO:131至SEQ ID NO:147中的任何一个氨基酸序列的蛋白质变体；具体地，可以是基本上由SEQ ID NO:131至SEQ ID NO:147中的任何一个氨基酸序列组成的蛋白质变体；并且更具体地，可以是由SEQ ID NO:131至SEQ ID NO:147中的任何一个氨基酸序列组成的蛋白质变体，但是本公开的蛋白质变体不限于此。

另外，蛋白质变体可以包含SEQ ID NO:131至SEQ ID NO:147中的任何一个氨基酸序列；或氨基酸序列，其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被固定，并且其与SEQ ID NO:1具有80％或更高的同源性或同一性，但蛋白质变体不限于此。具体地，本公开的突变多肽可包括与SEQ ID NO:131至SEQ ID NO:147的任一氨基酸序列具有至少80％、90％、95％、96％、97％、98％、或99％的同源性或同一性的多肽。另外，显而易见的是，只要蛋白质具有任何上述同源性或同一性并且表现出与上述蛋白质相对应的效果，在第79位至第83位的氨基酸以外的序列部分中具有被缺失、修饰、取代、或添加的氨基酸序列的任何蛋白质也可被包括在本公开的范围内。

如本文所用，术语“同源性”或“同一性”是指两个给定氨基酸序列或核苷酸序列之间的相关程度，并且其可以表示为百分比。这些术语“同源性”和“同一性”经常可以互换使用。

保守的多核苷酸或多肽的序列同源性或同一性可以通过标准比对算法来确定，并且由使用的程序建立的默认空位罚值(default gap penalty)可以与其一起使用。实际上，同源性或同一性序列可以在中等或高度严格的条件下沿着整个序列或整个长度的至少约50％、60％、70％、80％、或90％彼此杂交。在杂交中，也可以考虑包括代替密码子的简并密码子的多核苷酸。

任意两个多核苷酸或多肽序列是否具有同源性、相似性、或同一性，可利用本领域已知的计算机算法(例如“FASTA”程序)利用Pearson等人(1988)[Proc.Natl.Acad.Sci.USA85:2444]引入的默认参数来确定。可替代地，可使用EMBOSS包的Needleman程序(EMBOSS：The European Molecular Biology Open Software Suite，Rice等人,2000,Trends Genet.16:276-277)(5.0.0或更高版本)中执行的Needleman-Wunsch算法(1970,J.Mol.Biol.48:443-453)来确定。(包括GCG程序包(Devereux,J.等人,NucleicAcids Research 12:387(1984))、BLASTP、BLASTN、FASTA(Atschul,[S.][F.][ET AL,JMOLEC BIOL 215]:403(1990)；Guide to Huge Computers,Martin J.Bishop,[ED.,]Academic Press,San Diego,1994,和[CARILLO ETA/.](1988)SIAM J Applied Math 48:1073)。例如，同源性、相似性、或同一性可利用来自美国国家生物技术信息中心(NationalCenter for Biotechnology Information)数据库的BLAST或ClustalW来确定。

多核苷酸或多肽之间的同源性、相似性、或同一性可通过利用GAP计算机程序(如Smith和Waterman(Adv.Appl.Math(1981)2:482)公开的，如Needleman等人,(J MolBiol.48:443(1970))引入的程序)比较给定的序列信息来确定。简而言之，GAP程序将同源性、相似性、或同一性定义为相似的比对符号(即，核苷酸或氨基酸)的数量除以两序列中较短者的符号总数。GAP程序的默认参数可包括：(1)二进制比较矩阵(包括同一性值为1和非同一性值为0)和如Schwartz and Dayhoff,eds.描述的Gribskov等人,(Nucl.AcidsRes.14:6745(1986))的加权比较矩阵(Atlas Of Protein Sequence And Structure,National Biomedical Research Foundation,pp.353-358(1979)或EDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩阵)；(2)每个空位的罚值为3.0，且每个空位中的每个符号附加0.10罚值(或空位开放罚值(gap open penalty)为10和空位延伸罚值(gap extensionpenalty)为0.5)；和(3)末端空位无罚值。

另外，任何两个多核苷酸或多肽序列是否具有同源性、相似性或同一性可以通过在定义的严格条件下进行的southern杂交实验来比较这些序列来确认，并且可以在本领域的范围内并通过本领域技术人员公知的方法来确定要定义的适当杂交条件(例如，J.Sambrook等人,Molecular Cloning,A Laboratory Manual,2nd Edition,Cold SpringHarbor Laboratory press,Cold Spring Harbor,New York,1989；F.M.Ausubel等人,Current Protocols in Molecular Biology,John Wiley&Sons,Inc.,纽约)。

如本文所用，关于术语蛋白质的“待表达/表达”是指其中靶蛋白被引入到微生物中或靶蛋白被修饰以在微生物中被表达的状态。当靶蛋白是存在于微生物中的蛋白时，术语是指其中与其内源蛋白的活性或其修饰前的活性相比，蛋白质的活性被增强的状态。为了本公开的目的，“靶蛋白”可以是具有上述L-色氨酸输出能力的蛋白质的变体。

具体地，术语“蛋白质的引入”意指微生物表现出其中原先不具有的特定蛋白质的活性，或与其内源蛋白活性或修饰前的蛋白活性相比，微生物表现出增强的活性。例如，术语“蛋白质的引入”可以意指将编码特定蛋白的多核苷酸引入到微生物的染色体中；或者将包括编码特定蛋白的多核苷酸的载体引入到微生物中，且从而允许表现特定蛋白的活性。另外，术语“活性的增强”意指与其内源活性或其修饰前的活性相比，特定蛋白质的活性被增强。术语“内源活性”是指在微生物的性状由于天然或人工因素导致的遗传突变而改变的情况下，修饰前亲本菌株原先具有的特定蛋白的活性。

具体地，在本公开中，可以通过选自以下的一种或多种方法来实现活性的增强，方法由以下组成：增加编码蛋白质变体的基因的细胞内拷贝数的方法；将突变引入到编码蛋白质变体的基因的表达控制序列的方法；用具有强活性的序列替换编码具有L-色氨酸输出活性的蛋白质变体的基因的表达控制序列的方法；用编码蛋白质变体的基因替换染色体上编码具有L-色氨酸输出活性的天然蛋白质的基因的方法；进一步将突变引入编码具有L-色氨酸输出活性的蛋白质的基因，使得蛋白质变体的活性被增强的方法；以及将蛋白质变体引入微生物中的方法，但增强活性方法不限于此。

在上文中，可以以基因与载体可操作地连接的形式或通过将基因插入到宿主细胞的染色体中的形式进行增加基因拷贝数的方法，但是方法不特别限于此。具体地，通过将载体引入到宿主细胞中可以增加基因的拷贝数，其中载体(编码本公开的蛋白的多核苷酸可操作地连接至载体且无论宿主细胞如何载体都能够复制和起作用)被引入到宿主细胞中。可替代地，通过将载体(多核苷酸可操作连接至载体且载体能将多核苷酸插入到宿主细胞的染色体中)引入到宿主细胞的染色体中可以增加基因的拷贝数。可以通过本领域已知的方法(例如，同源重组)实现将多核苷酸插入到染色体中。

然后，用于增加多核苷酸表达的表达控制序列的修饰可以通过以下来进行：通过缺失、插入、非保守或保守取代、或其组合来诱导核酸序列中的突变，以进一步增强表达控制序列的活性；或者通过用具有更强活性的核酸序列替换表达控制序列，但是表达控制序列的修饰方法并不特别限于此。表达控制序列可以包括启动子、操纵基因序列、编码核糖体结合位点的序列、控制转录和翻译终止的序列等，但表达控制序列不特别限于此。

可以替换原始启动子，将强启动子与多核苷酸的表达单元的上游区域连接，但不限于此。本领域已知的强启动子的实例可以包括cj1至cj7启动子(韩国专利号10-0620092)、lac启动子、trp启动子、trc启动子、tac启动子、λ噬菌体PR启动子、P_L启动子、tet启动子、gapA启动子、SPL7启动子、SPL13(sm3)启动子(韩国专利号10-1783170)、O2启动子(韩国专利号10-1632642)、tkt启动子、yccA启动子等，但强启动子不限于此。

进一步地，染色体上的多核苷酸序列的修饰可以通过以下进行：通过缺失、插入、非保守或保守取代、或其组合来诱导表达控制序列上的突变，以进一步增强多核苷酸序列的活性；或者通过用改良的多核苷酸序列替换多核苷酸序列以具有更强活性，但是多核苷酸序列的修饰方法并不特别限于此。

基于野生型或未经修饰的微生物菌株中蛋白质的活性或浓度，如上所述的蛋白活性的引入和增强通常可以将相应蛋白质的活性或浓度增加至少1％、至少10％、至少25％、至少50％、至少75％、至少100％、至少150％、至少200％、至少300％、至少400％、或至少500％、和至多1000％或2000％，但增加的范围不限于此。

本公开的另一方面提供了编码以上蛋白质变体的多核苷酸。

如本文所用，术语“多核苷酸”是指作为核苷酸聚合物的具有超过一定长度的DNA或RNA链，其是通过共价键连接的核苷酸单体的长链，且更具体地，是指编码蛋白质变体的多核苷酸片段。

只要多核苷酸序列编码具有L-色氨酸输出能力的蛋白质变体，编码本公开的蛋白质变体的多核苷酸可以不受限制地包括任何多核苷酸序列。

在本公开中，编码具有L-色氨酸输出能力的蛋白质的氨基酸序列的基因可以是wex基因，可以源自根际草螺菌，具体地，可以是编码SEQ ID NO:1的氨基酸序列的核苷酸序列，且更具体地，可以是包括SEQ ID NO:2的核苷酸序列的核苷酸序列，但基因不限于此。

考虑到密码子简并性和要表达多肽的生物有机体中优选的密码子，可以在不改变多肽的氨基酸序列的范围内，在编码本公开的蛋白质变体的多核苷酸的编码区中进行各种修饰。具体地，可以不受限制地包括编码蛋白质变体(其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被不同的氨基酸取代)的任何多核苷酸序列。例如，本公开的多核苷酸可以是本公开的蛋白质变体，且具体地，可以是编码包括SEQID NO:131至SEQ ID NO:147中任一个的氨基酸序列的蛋白质、或者具有与蛋白质同源性或同一性的多肽的多核苷酸序列，但本公开的多核苷酸不限于此，且更具体地，可以是包括SEQ ID NO:80、81、82、89、90、91、92、101、102、103、110、111、112、113、122、123和124的多核苷酸序列中任一个多核苷酸序列的多核苷酸，但本公开的多核苷酸不限于此。同源性和同一性与上述相同。

此外，可以不受限制地包括通过与可由已知的基因序列制备的任何探针(例如，对上述多核苷酸序列的全部或部分的互补序列)在严格条件下杂交而编码蛋白质变体(其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位的氨基酸中的至少一个氨基酸被不同的氨基酸取代)的任何序列。

术语“严格条件”是指使多核苷酸之间能够特异性杂交的条件。这些条件被具体的描述在文献(例如，J Sambrook等人，同上)中。例如，条件可以包括在具有高同源性(同源性是40％或更高、具体地是90％或更高、更具体地是95％或更高、甚至更具体地是97％或更高、和最具体地是99％或更高)的基因之间进行杂交，而在具有低于上述同源性的同源性的基因之间不进行杂交；或在southern杂交的常规洗涤条件下进行，即，在对应于60℃、1×SSC、和0.1％SDS，具体地60℃、0.1×SSC、和0.1％SDS，和更具体地68℃、0.1×SSC、和0.1％SDS的盐浓度和温度下，洗涤一次、具体地两次或三次。然而，杂交条件不限于此，而可以由本领域技术人员根据目的适当地调节。

尽管根据杂交的严格程度，碱基之间的错配是可能的，但杂交需要两个核苷酸包含互补序列。术语“互补”用于描述能够彼此杂交的核苷酸碱基之间的关系。例如，关于DNA，腺苷与胸腺嘧啶互补，以及胞嘧啶与鸟嘌呤互补。因此，本公开可包括与整个序列互补的分离的多核苷酸片段以及实质上相似的多核苷酸序列。

具体地，可在55℃的T_m值下，使用杂交条件(其包括杂交步骤)并使用上述条件来检测具有同源性的多核苷酸。另外，T_m值可以是60℃、63℃、或65℃，但温度不限于此，并且可以由本领域技术人员根据目的适当地调节。

适合于多核苷酸杂交的严格程度取决于多核苷酸的长度和互补程度，并且变量在本领域是公知的(参见Sambrook等人，同上，9.50至9.51和11.7至11.8)。

本公开的又一方面提供了载体，其包括编码蛋白质变体的多核苷酸。

如本文所用，术语“载体”是指包括编码靶蛋白的多核苷酸的核苷酸序列的DNA构建体，编码靶蛋白的多核苷酸的核苷酸序列可操作地连接至合适的控制序列，使得靶蛋白可以在合适的宿主中表达。控制序列包括能够启动转录的启动子、用于控制转录的任何操纵基因序列、编码适当的mRNA核糖体结合位点的序列、以及控制转录和翻译终止的序列。转化到合适的宿主细胞中以后，载体可以与宿主基因组无关地复制或起作用，或者可以整合到宿主基因组本身中。

本公开中所用的载体不受特别限制，而可以使用本领域已知的任何载体。常规使用的载体的实例可以包括天然或重组质粒、粘粒、病毒和噬菌体。例如，pWE15、M13、MBL3、MBL4、IXII、ASHII、APII、t10、t11、Charon4A、Charon21A等可以用作噬菌体载体或粘粒载体；且基于pBR、pUC、pBluescriptII、pGEM、pTZ、pCL、pET等的载体可以用作质粒载体。具体地，可以使用载体，如pDZ、pACYC177、pACYC184、pCL、pECCG117、pUC19、pBR322、pMW118、pCC1BAC等。

例如，可以通过用于细胞内染色体插入的载体，用突变的多核苷酸替换染色体中编码靶蛋白的多核苷酸。可以使用本领域已知的任何方法(例如，同源重组)进行将多核苷酸插入到染色体中，但方法不限于此。载体可以进一步包括用于确认其成功插入到染色体中的选择标记。选择标记用于选择用载体转化的细胞，即以确认靶核酸分子是否已经成功插入，并且可以使用能够提供可选择表型的标记(例如，抗药性、辅源营养、对细胞毒剂的抗性，和表面蛋白的表达等)。在处理选择剂的情况下，只有能够表达选择标记的细胞才能够存活或表达其它表型性状，从而能够容易地选择经转化的细胞。

本公开的另一个目的是提供生产L-色氨酸的微生物，其表达具有L-色氨酸输出活性的蛋白质变体。

如本文所用，术语“生产L-色氨酸的微生物”是指与野生型或未经修饰的微生物菌株相比，能够在培养基中从碳源过量生产L-色氨酸的微生物。另外，生产L-色氨酸的微生物可以是重组微生物。具体地，该微生物可以是肠杆菌属(genus Enterobacter)的微生物、埃希氏菌属(genus Escherichia)的微生物、欧文氏菌属(genus Erwinia)的微生物、沙雷氏菌属(genus Serratia)的微生物、普罗威登斯菌属(genus Providencia)的微生物、棒杆菌属的微生物、或短杆菌属(genus Brevibacterium)的微生物，但只要该微生物能生产L-色氨酸，微生物的类型不特别地受限制。更具体地，微生物可以是棒杆菌属的微生物或埃希氏菌属的微生物。

甚至更具体地，埃希氏菌属的微生物可以是大肠杆菌，以及棒杆菌属的微生物可以是谷氨酸棒杆菌，但是可以不受限制地包括其中引入具有L-色氨酸输出活性的蛋白质或活性增强且因此L-色氨酸生产量能增加的埃希氏菌属或棒杆菌属的任何微生物。

在上述微生物中，可以使用通过增强tktA基因的表达或通过阻断L-色氨酸生物合成途径中的分支途径以连续供应前体(例如，赤藓糖-4-磷酸；E4P)和有效能量利用来增加L-色氨酸生物合成的方法、或使用利用较少量ATP的方法等，来增加L-色氨酸生产量。

具体地，在本公开中，只要亲本菌株是生产L-色氨酸的微生物，生产L-色氨酸的微生物(其表达具有L-色氨酸输出活性的蛋白质或蛋白质变体，或者其被修饰使得具有L-色氨酸输出活性的蛋白质或蛋白质变体能被表达)的亲本菌株不特别地被限制。生产L-色氨酸的微生物可以是其中竞争途径中的基因、L-色氨酸操纵基因的定向途径中的调节子、用于输入L-色氨酸的基因、或用于输入和分解L-色氨酸的基因的活性被削弱或失活，以增强L-色氨酸生物合成途径的微生物；和/或可以是其中L-色氨酸操纵基因活性被过表达的微生物。具体地，与其内源活性相比，trpR(即，用于调控色氨酸合成的酶组的基因，其可抑制L-色氨酸生物合成基因(trpEDCBA)的表达)的活性、或Mtr(即，将细胞外L-色氨酸输入到细胞中的膜蛋白)的活性可以被削弱或除去。

为了实现上述目的，本公开的另一方面提供了用于生产色氨酸的方法，其包括在培养基中培养表达蛋白质变体的生产L-色氨酸的微生物。

L-色氨酸、具有L-色氨酸输出活性和包含SEQ ID NO:1的氨基酸序列的蛋白质、蛋白质的表达和微生物与上述相同。

如本文所用，术语“培养”意指使微生物在适当控制的环境条件下生长。本公开的培养过程可以在本领域已知的合适培养基和培养条件下进行。根据待选择的菌株，本领域技术人员可以容易地调节这种培养过程以供使用。具体地，培养过程可以以本领域已知的分批培养、连续培养和补料分批培养进行，但培养过程不限于此。

如本文所用，术语“培养基”是指含有培养微生物所需的营养物质作为主要成分的物质混合物，并且其提供了营养物质、生长因子等以及对生存和生长至关重要的水。具体地，作为用于培养本公开的微生物使用的培养基和其它培养条件可以不受特别限制地使用微生物常规培养使用的任何培养基。然而，可以在需氧条件下在含有适当碳源、氮源、磷源、无机化合物、氨基酸和/或维生素等的常规培养基中，同时调节温度、pH等来培养本公开的微生物。

在本公开中，碳源可以包括碳水化合物(例如，葡萄糖、果糖、蔗糖、麦芽糖等)；糖醇(例如，甘露醇、山梨糖醇等)；有机酸(例如，丙酮酸、乳酸、柠檬酸等)；氨基酸(例如，谷氨酸、蛋氨酸、赖氨酸等)等。另外，碳源可以包括天然有机营养物(例如，淀粉水解物、糖蜜、黑糖蜜、米糠、木薯、甘蔗糖蜜、玉米浆等)。具体地，可以使用碳水化合物，如葡萄糖和灭菌的预处理糖蜜(即，糖蜜被转化为还原糖)，且另外，可以不受限制地使用适当量的各种其它碳源。可以单独使用或以两种或多种的组合使用这些碳源，但碳源不限于此。

氮源的实例可以包括无机氮源(例如，氨、硫酸铵、氯化铵、乙酸铵、磷酸铵、碳酸铵、硝酸铵等)；氨基酸(例如，谷氨酸、蛋氨酸、谷氨酰胺等)；和有机氮源(例如，蛋白胨、N-Z胺、肉提取物、酵母提取物、麦芽提取物、玉米浆、酪蛋白水解产物、鱼或其分解产物、脱脂大豆饼或其分解产物等)。可以单独使用或以两种或多种的组合使用这些氮源，但氮源不限于此。

磷源的实例可以包括磷酸二氢钾、磷酸氢二钾、相应的含钠盐等。无机化合物的实例可以包括氯化钠、氯化钙、氯化铁、硫酸镁、硫酸铁、硫酸锰、碳酸钙等。另外，除此之外，可以包括氨基酸、维生素和/或适当的前体。可以将这些构成成分或前体添加到分批培养或连续培养的培养基中，但不限于此。

在本公开中，通过以适当的方式向培养基添加化合物(例如，氢氧化铵、氢氧化钾、氨、磷酸、硫酸等)，可以在培养微生物期间调节培养基的pH值。另外，在培养期间，可以添加消泡剂(例如，脂肪酸聚乙二醇酯)以防止泡沫产生。另外，可以将氧气或含氧气体注入到培养基中以维持培养基的需氧状态；或者，可以在不注入气体或将氮、氢或二氧化碳气体注入到培养基中以便维持培养基的厌氧或微需氧状态，但气体不限于此。

培养基温度可以在从20℃至50℃的范围内，并具体地在从30℃至37℃的范围内，但培养基温度不限于此。可以继续培养直至获得所需量的有用物质，并具体地培养10至100小时，但培养周期不限于此。

生产方法可包括从培养的培养基或微生物中回收L-色氨酸。

在回收色氨酸的步骤中，可以使用本公开的用于培养微生物的方法(例如，根据分批培养过程、连续培养过程或补料分批培养过程，使用本领域已知的合适方法)从培养基中回收期望的L-色氨酸。例如，可以单独或组合使用诸如离心、过滤、用蛋白结晶沉淀剂处理(盐析法)、萃取、超声波破碎、超滤、透析、各种色谱(例如，分子筛色谱(凝胶过滤)、吸附色谱、离子交换色谱、亲和色谱法等)和HPLC的方法，但是方法不限于此。

生产方法可以包括纯化过程。在纯化过程中，可以使用本领域已知的适当纯化方法纯化回收的L-色氨酸。

本公开的另一方面提供了增加微生物的L-色氨酸输出能力的方法，其包括修饰微生物，使得具有L-色氨酸输出活性的蛋白质变体(其中选自SEQ ID NO:1的氨基酸序列中第79位至第83位氨基酸中的至少一个氨基酸被不同的氨基酸取代)可以在微生物中表达。

本公开的又一方面提供了蛋白质变体的用于增加L-色氨酸输出能力的用途。

本公开的又一方面提供了蛋白质变体的用于增加L-色氨酸生产能力的用途。

由于本公开的蛋白质变体可增加微生物的L-色氨酸输出能力，因此其可用于增加L-色氨酸的生产。蛋白质变体和其它氨基酸与上述相同。

实施例

在下文中，将通过示例性实施方式详细描述本公开。然而，提供这些示例性实施方式仅是为了说明的目的，而不意图限制本公开的范围。

实施例1：输出基因的筛选和选择

作为以具有YdeD(即，源自大肠杆菌的EamA家族)的氨基酸序列作为查询序列基于NCBI和KEGG数据库的PSI-BLAST筛选结果，选择了被认为能够输出色氨酸的膜蛋白的30个候选基因和具有这些基因的生物有机体。在它们中，考虑到适用于生产菌株的生物安全水平和可用性，选择了5种生物有机体，如下表1所示。

[表1]预期具有能够输出芳香族氨基酸的膜蛋白的微生物

实施例2：制备其中引入源自根际草螺菌的基因的棒杆菌属微生物

编码实施例1中选择的源自根际草螺菌的膜蛋白的基因具有SEQ ID NO:1的氨基酸序列。关于编码膜蛋白的基因及其相邻核苷酸序列的信息(登记号NZ_LFLU01000012.1)获自NIH基因库(NIH GenBank)。

基于获得的核苷酸序列信息合成了用于将源自根际草螺菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自根际草螺菌的基因，使用根际草螺菌菌株的染色体DNA作为模板以及SEQ ID NO:3和SEQ ID NO:4的引物进行了PCR。使用Solg^TMPfu-X DNA聚合酶作为聚合酶，以及如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合1分钟；以及在72℃下聚合5分钟。

结果，获得了956 bp的基因片段，其包含924 bp的基因(SEQ ID NO:2)。

SEQ ID NO:3(wex-1)

TAGAGGAGACACAACATGAATAGCAAGAAGGCCAC

SEQ ID NO:4(wex-2)

ggctcttcctgtttAGTCTACAAACAGTCCGCCAC

为了获得源自谷氨酸棒杆菌的gapA启动子，使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:6的引物进行了PCR。使用Solg^TM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)作为聚合酶，以及如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合30秒；以及在72℃下聚合5分钟。

SEQ ID NO:5(PgapA-1)

cccttccggtttAGTTTGAAGCCAGTGTGAGTTGC

SEQ ID NO:6(PgapA(-wex)-2)

CTTCTTGCTATTCATGTTGTGTCTCCTCTAAAGATTGTA

通过Gibson装配方法(DG Gibson等人,NATURE METHODS,VOL.6 NO.5,MAY 2009,NEBuilder HiFi DNA Assembly Master Mix)克隆了扩增的gapA启动子区域、源自根际草螺菌的基因片段和用ScaI限制性酶切割的pDZTn载体(韩国专利号10-1126041)，以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Hrh。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合，然后在50℃下温育1小时来进行了克隆。

通过电穿孔将制备的pDZTn-PgapA-Hrh载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中(Appl.Microbiol.Biotechnol.(1999)52:541-545)以及然后进行二次交换以获得其中一个拷贝的PgapA-Hrh基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

SEQ ID NO:7(确认_PgapA-wex-1)

CGGATTATGCCAATGATGTG

SEQ ID NO:8(确认_PgapA-wex-2)

CACGATCACCAACATTCAGG

将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Hrh。

实施例3：制备其中引入源自施氏假单胞菌的基因的棒杆菌属微生物

编码实施例1中选择的源自施氏假单胞菌的膜蛋白的基因具有SEQ ID NO:9的氨基酸序列。关于相应基因及其相邻核苷酸序列的信息(登记号NC_018177.1)获自NIH基因库。

基于获得的核苷酸序列信息合成了用于将源自施氏假单胞菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自施氏假单胞菌的基因，使用施氏假单胞菌菌株的染色体DNA作为模板以及SEQ ID NO:11和SEQ ID NO:12的引物以与实施例2中相同的方式进行了PCR。

结果，获得了977 bp的基因片段，其包含945 bp的输出基因(SEQ ID NO:10)。

SEQ ID NO:11(Pst-1)

TAGAGGAGACACAACATGAAAAACCAGCGTAAAGC

SEQ ID NO:12(Pst-2)

ggctcttcctgtttAGTTTATCCGTTTCGACGCGG

对于使用源自谷氨酸棒杆菌的gapA启动子，使用谷氨酸棒杆菌ATCC13869的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:13的引物以与实施例2中相同的方式进行了PCR。

SEQ ID NO:13(PgapA(-Pst)-2)

ACGCTGGTTTTTCATGTTGTGTCTCCTCTAAAGATTGTA

通过Gibson装配方法克隆了扩增的gapA启动子区域、源自施氏假单胞菌的基因片段和用ScaI限制性酶切割的pDZTn载体，以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Pst。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合，然后在50℃下温育1小时来进行了克隆。

通过电穿孔将制备的pDZTn-PgapA-Pst载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中(Appl.Microbiol.Biotechnol.(1999)52:541-545)以及然后进行二次交换以获得其中一个拷贝的PgapA-Pst基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Pst。

实施例4：制备其中引入源自粪产碱菌的基因的棒杆菌属微生物

编码实施例1中选择的源自粪产碱菌的膜蛋白的基因具有SEQ ID NO:14的氨基酸序列。关于相应基因及其相邻核苷酸序列的信息(登记号NZ_CP013119.1)获自NIH基因库。

基于获得的核苷酸序列信息合成了将源自粪产碱菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自粪产碱菌的基因，使用粪产碱菌菌株的染色体DNA作为模板以及SEQ ID NO:16和SEQ ID NO:17的引物以与实施例2中相同的方式进行了PCR。

结果，获得了943bp的基因片段，其包含912bp的输出基因(SEQ ID NO:15)。

SEQ ID NO:16(Afa-1)

TAGAGGAGACACAACATGAAGCAATCTGATAAGGC

SEQ ID NO:17(Afa-2)

gctcttcctgtttAGTTCAGGCAGCGCTTTTTAGT

为了获得源自谷氨酸棒杆菌的gapA启动子，使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:18的引物以与实施例2中相同的方式进行了PCR。

SEQ ID NO:18(PgapA(-Afa)-2)

ATCAGATTGCTTCATGTTGTGTCTCCTCTAAAGATTGTA

通过Gibson装配方法克隆了扩增的gapA启动子区域、源自粪产碱菌的基因片段和用ScaI限制性酶切割的pDZTn载体，以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Afa。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合，然后在50℃下温育1小时来进行了克隆。

通过电穿孔将制备的pDZTn-PgapA-Afa载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中以及然后进行二次交换以获得其中一个拷贝的PgapA-Afa基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Afa。

实施例5：制备其中引入源自钩虫贪铜菌的基因的棒杆菌属微生物

编码实施例1中选择的源自钩虫贪铜菌的膜蛋白的基因具有SEQ ID NO:19的氨基酸序列。关于相应基因及其相邻核苷酸序列的信息(登记号AM260480.1)获自NIH基因库。

基于获得的核苷酸序列信息合成了将源自钩虫贪铜菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自钩虫贪铜菌的基因，使用钩虫贪铜菌菌株的染色体DNA作为模板以及SEQ ID NO:21和SEQ ID NO:22的引物以与实施例2中相同的方式进行了PCR。

结果，获得了977bp的基因片段，其包含源自钩虫贪铜菌的945bp的输出基因(SEQID NO:20)。

SEQ ID NO:21(Cne-1)

TAGAGGAGACACAACATGCAAAGCAAGAGCAAAGC

SEQ ID NO:22(Cne-2)

ggctcttcctgtttAGTTCACGGTTCCTGGACACG

为了获得源自谷氨酸棒杆菌的gapA启动子，使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:23的引物以与实施例2中相同的方式进行了PCR。

SEQ ID NO:23(PgapA(-Cne)-2)

GCTCTTGCTTTGCATGTTGTGTCTCCTCTAAAGATTGTA

通过Gibson装配方法克隆了扩增的gapA启动子区域、源自钩虫贪铜菌的基因片段和用ScaI限制性酶切割的pDZTn载体，以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Cne。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合，然后在50℃下温育1小时来进行了克隆。

通过电穿孔将制备的pDZTn-PgapA-Cne载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中以及然后进行二次交换以获得其中一个拷贝的PgapA-Cne基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Cne。

实施例6：制备其中引入源自大肠杆菌str.K-12substr.MG1655的基因的棒杆菌属微生物

编码实施例1中选择的源自大肠杆菌str.K-12substr.MG1655的膜蛋白的基因具有SEQ ID NO:24的氨基酸序列。关于相应基因及其相邻核苷酸序列的信息(登记号NC_000913.3)获自NIH基因库。

基于获得的核苷酸序列信息合成了将源自大肠杆菌的基因插入到谷氨酸棒杆菌的基因组DNA中的引物。为了扩增源自大肠杆菌的基因，使用大肠杆菌菌株的染色体DNA作为模板以及SEQ ID NO:26和SEQ ID NO:27的引物以与实施例2中相同的方式进行了PCR。

结果，获得了913bp的基因片段，其包含882bp的输出基因(SEQ ID NO:25)。

SEQ ID NO:26(Eco-1)

TAGAGGAGACACAACATGACACGACAAAAAGCAAC

SEQ ID NO:27(Eco-2)

gctcttcctgtttAGTTTAACCACGACGTGTCGCC

为了获得源自谷氨酸棒杆菌的gapA启动子，使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:5和SEQ ID NO:28的引物以与实施例2中相同的方式进行了PCR。

SEQ ID NO:28(PgapA(-Eco)-2)

TTTTTGTCGTGTCATGTTGTGTCTCCTCTAAAGATTG

通过Gibson装配方法克隆了扩增的gapA启动子区域、源自大肠杆菌的基因片段和用ScaI限制性酶切割的pDZTn载体，以及从而获得了重组质粒。将重组质粒命名为pDZTn-PgapA-Eco。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合，然后在50℃下温育1小时来进行了克隆。

通过电穿孔将制备的pDZTn-PgapA-Eco载体转化到野生型谷氨酸棒杆菌ATCC13869菌株中以及然后进行二次交换以获得其中一个拷贝的PgapA-Eco基因被插入到染色体中的转座子基因之间的菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，每个引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

将由此获得的菌株命名为谷氨酸棒杆菌ATCC13869::PgapA-Eco。

实施例7：测量其中引入源自各种微生物的基因的棒杆菌属微生物菌株中的MIC

为了确认在实施例2至6中制备的5种类型谷氨酸棒杆菌菌株(即，ATCC13869::PgapA-Hrh、ATCC13869::PgapA-Pst、ATCC13869::PgapA-Afa、ATCC13869::PgapA-Cne和ATCC13869::PgapA-Eco)中色氨酸输出活性的存在，使用色氨酸类似物和苯丙氨酸类似物(即，另一种芳香族氨基酸)进行了最小抑制浓度(MIC)实验。将5种不同的谷氨酸棒杆菌菌株(每种引入有编码膜蛋白的基因)在基本液体培养基中在30℃下培养了24小时，分别稀释至3×10³个细胞和3×10⁴个细胞的浓度，以及然后在其中添加了色氨酸类似物和苯丙氨酸类似物的基本固体培养基中进行点样培养。

对于最小抑制浓度(MIC)实验，将p-氟-DL-苯丙氨酸(2.5 mg/mL)或5-氟-DL-色氨酸(0.25μg/mL)添加到最小固体培养基中，并在60小时后观察细胞生长(表2)。

在其中以2.5 mg/mL的浓度添加了苯丙氨酸类似物的条件下，选择的5种类型基因的引入全部能够使细胞生长。在它们中，源自根际草螺菌、粪产碱菌和大肠杆菌的基因的引入显示了最高的细胞生长。与以上三种菌株相比，源自施氏假单胞菌的基因的引入显示出细胞生长略微减少，并且源自钩虫贪铜菌的基因的引入显示出最低的细胞生长。在相同条件下，野生型ATCC13869菌株不生长。另外，在以0.25μg/mL的浓度添加了色氨酸类似物的条件下，仅源自根际草螺菌的基因的引入能够使细胞生长。

从上述结果可以看出，据观察即使引入之间存在活性差异，所选择的5种类型基因的引入全部显示出对苯丙氨酸和苯丙氨酸类似物的抗性。相反，关于色氨酸和色氨酸类似物，仅源自根际草螺菌的基因的引入显示出对其具有特异性和优异的抗性。基于这些结果，可以解释为仅由源自根际草螺菌的基因编码的膜蛋白可以作为对于色氨酸的输出蛋白。

基本培养基(pH7.2)

葡萄糖10g、KH₂PO₄ 1g、K₂HPO₄ 2g、MgSO₄.7H₂O 0.4g、尿素2g、(NH₄)₂SO₄ 5g、NaCl0.5g、烟酰胺5μg、泛酸钙0.1μg、生物素0.2μg、硫胺素盐酸盐(Thiamine HCl)3μg、痕量元素溶液1 mL(基于1L蒸馏水)

痕量元素溶液

Na₂B₄O₇ 10H₂O 0.09 g、(NH₄)₆Mo₇O₂₇ 4H₂O 0.04 g、ZnSO₄.7H₂O 0.01 g、CuSO₄ 5H₂O0.27 g、MnCl₂.4H₂O 0.01 g、FeCl₃.6H₂O 1 g、CaCl₂ 0.01 g(基于1L蒸馏水)

[表2]在含有苯丙氨酸类似物或色氨酸类似物的基本培养基中，其中引入源自各种微生物的基因的谷氨酸棒杆菌菌株的生长

实施例8：制备其中引入源自各种微生物的基因的用于大肠杆菌的表达载体

为了确认源自实施例1中所选择的各种微生物的基因在大肠杆菌中对色氨酸或其类似物的抗性，将基因中的每种克隆到pCL1920(即，大肠杆菌表达载体)中并用大肠杆菌W3110的yccA启动子表达。

为了获得源自根际草螺菌的基因片段，使用根际草螺菌菌株的染色体DNA作为模板以及SEQ ID NO:29和SEQ ID NO:30的引物进行了PCR。将Solg^TM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶，并如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合1分钟；以及在72℃下聚合5分钟。

SEQ ID NO:29(Hrh-3)

ATAGAGAGTGACTCAATGAATAGCAAGAAGGCCAC

SEQ ID NO:30(Hrh-4)

TCGAGCTCGGTACCCCTACAAACAGTCCGCCAC

为了获得源自大肠杆菌W3110的yccA启动子，使用大肠杆菌W3110的基因组DNA作为模板以及SEQ ID NO：31和SEQ ID NO：32的引物进行PCR。将Solg^TM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶，以及如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合10秒；以及在72℃下聚合5分钟。

SEQ ID NO:31(PyccA-1)

CTCTAGAGGATCCCCTTCCAGATCAAATGCGTAA

SEQ ID NO:32(PyccA(-Hrh)-2)

CTTCTTGCTATTCATTGAGTCACTCTCTATGACAG

通过Gibson装配方法克隆了扩增的yccA启动子区域、源自根际草螺菌的基因片段和用SmaI限制性酶切割的pCL1920载体(pSC101ori，Sp^r)，以及从而获得了重组质粒。将重组质粒命名为pCL1920-PyccA-Hrh。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合，然后在50℃下温育1小时来进行了克隆。将获得的pCL1920-PyccA-Hrh引入到野生型大肠杆菌W3110中，以及从而制备了W3110/pCL1920-PyccA-Hrh(即，其中表达基因的转化体)。

为了获得源自施氏假单胞菌的基因片段，使用施氏假单胞菌菌株的染色体DNA作为模板以及SEQ ID NO:33和SEQ ID NO:34的引物进行了PCR。另外，以与从上述根际草螺菌菌株获得基因片段相同的方式进行了PCR，不同之处在于使用了SEQ ID NO:35的引物，该引物用于获得源自大肠杆菌W3110的yccA启动子供使用。

SEQ ID NO:33(Pst-3)

ATAGAGAGTGACTCAATGAAAAACCAGCGTAAAGC

SEQ ID NO:34(Pst-4)

TCGAGCTCGGTACCCTTATCCGTTTCGACGCGG

SEQ ID NO:35(PyccA(-Pst)-2)

ACGCTGGTTTTTCATTGAGTCACTCTCTATGACAG

由此，获得了重组质粒并将其命名为pCL1920-PyccA-Pst。将表达载体pCL1920-PyccA-Pst转化到野生型大肠杆菌W3110中，以及从而制备了W3110/pCL1920-PyccA-Pst(即，其中表达基因的转化体)。

其中表达源自粪产碱菌菌株的基因的转化体的制备过程与上述相同，不同之处在于使用粪产碱菌菌株的染色体DNA作为模板以及SEQ ID NO:36和SEQ ID NO:37的引物进行了PCR，以及使用了用于获得yccA启动子的SEQ ID NO:38的引物。

SEQ ID NO:36(Afa-3)

ATAGAGAGTGACTCAATGAAGCAATCTGATAAGGC

SEQ ID NO:37(Afa-4)

TCGAGCTCGGTACCCTCAGGCAGCGCTTTTTAGT

SEQ ID NO:38(PyccA(-Afa)-2)

ATCAGATTGCTTCATTGAGTCACTCTCTATGACAG

由此，获得了在其中克隆了源自粪产碱菌的基因的重组质粒并将其命名为pCL1920-PyccA-Afa。将表达载体pCL1920-PyccA-Afa转化到野生型大肠杆菌W3110中，以及从而制备了W3110/pCL1920-PyccA-Afa(即，转化体)。

为了获得源自钩虫贪铜菌菌株的基因片段，使用钩虫贪铜菌菌株的染色体DNA作为模板以及SEQ ID NO:39和SEQ ID NO:40的引物进行了PCR。另外，以与从上述根际草螺菌菌株获得基因片段相同的方式进行了PCR，不同之处在于使用SEQ ID NO:41的引物，该引物用于获得源自大肠杆菌W3110的yccA启动子供使用。

SEQ ID NO:39(Cne-3)

ATAGAGAGTGACTCAATGCAAAGCAAGAGCAAAGC

SEQ ID NO:40(Cne-4)

TCGAGCTCGGTACCCTCACGGTTCCTGGACACG

SEQ ID NO:41(PyccA(-Cne)-2)

GCTCTTGCTTTGCATTGAGTCACTCTCTATGACAG

由此，获得了重组质粒并将其命名为pCL1920-PyccA-Cne。将表达载体pCL1920-PyccA-Cne转化到野生型大肠杆菌W3110中，以及从而制备了W3110/pCL1920-PyccA-Cne(即，其中表达基因的转化体)。

为了获得源自大肠杆菌菌株的基因片段，使用大肠杆菌str.K-12substr.MG1655菌株的染色体DNA作为模板以及SEQ ID NO:42和SEQ ID NO:43的引物进行了PCR。另外，以与从上述根际草螺菌菌株获得基因片段相同的方式进行了PCR，不同之处在于使用SEQ IDNO:44的引物，该引物用于获得源自大肠杆菌W3110的yccA启动子供使用。

SEQ ID NO:42(Eco-3)

ATAGAGAGTGACTCAATGACACGACAAAAAGCAAC

SEQ ID NO:43(Eco-4)

TCGAGCTCGGTACCCTTAACCACGACGTGTCGCC

SEQ ID NO:44(PyccA(-Eco)-2)

TTTTTGTCGTGTCATTGAGTCACTCTCTATGACAG

由此，获得了重组质粒并将其命名为pCL1920-PyccA-Eco。将表达载体pCL1920-PyccA-Eco引入到野生型大肠杆菌W3110中，以及从而制备了W3110/pCL1920-PyccA-Cne(即，其中表达基因的转化体)。

实施例9：测量其中过表达源自各种微生物的膜蛋白的基因的大肠杆菌的MIC

为了确认其中过表达实施例8中制备的5种类型基因的大肠杆菌菌株(即，W3110/pCL1920-PyccA-Hrh、W3110/pCL1920-PyccA-Pst、W3110/pCL1920-PyccA-Afa、W3110/pCL1920-PyccA-Cne、和W3110/pCL1920-PyccA-Eco)的抗性，使用色氨酸类似物和苯丙氨酸类似物进行了最小抑制浓度(MIC)实验。将其中过表达5种类型基因的大肠杆菌菌株在含有壮观霉素(50μg/mL)的M9基本液体培养基中在37℃下培养了15小时，分别稀释至10⁴个细胞和10⁵个细胞的浓度，以及然后在其中添加了色氨酸类似物或苯丙氨酸类似物的含有壮观霉素(50μg/mL)的M9葡萄糖基本固体培养基中点样培养。对于最小抑制浓度(MIC)实验，将p-氟-DL-苯丙氨酸(2mg/mL)或5-氟-DL-色氨酸(0.7μg/mL)添加到M9基本固体培养基中，以及在48小时后观察细胞生长(表3)。

如同在谷氨酸棒杆菌菌株中，当过表达源自大肠杆菌的基因时，在添加了苯丙氨酸类似物的条件下，大肠杆菌菌株显示出优异的生长，并且源自粪产碱菌的基因的过表达也显示出显著的生长。然而，源自根际草螺菌、施氏假单胞菌、和钩虫贪铜菌的基因的过表达未显示出与W3110/pCL1920(即，对照组)中相当的生长。相反，全部5种类型所选择的基因的过表达使得在添加色氨酸类似物的条件下使全部细胞生长成为可能。在它们中，源自根际草螺菌的基因的过表达显示出最高的生长，并且源自粪产碱菌和大肠杆菌的输出基因的过表达显示出第二高的生长。源自施氏假单胞菌和钩虫贪铜菌的输出基因的过表达显示出可忽略的生长。

关于大肠杆菌菌株中5种类型基因的MIC实验结果与谷氨酸棒杆菌中观察的那些相似。源自根际草螺菌的基因在谷氨酸棒杆菌和大肠杆菌菌株中均显示出对色氨酸及其类似物的特异性和优异的抗性，且源自大肠杆菌的输出基因显示出对苯丙氨酸及其类似物的输出抗性高于对色氨酸的输出抗性。从这些结果，确定了源自根际草螺菌的基因显示出对谷氨酸棒杆菌和大肠杆菌菌株中的色氨酸的特异性和优异的输出能力。

[表3]在含有苯丙氨酸类似物或色氨酸类似物的基本培养基中，其中每个基因过表达的大肠杆菌菌株的生长

参考例1：制备谷氨酸棒杆菌属的生产L-色氨酸的微生物

生产L-色氨酸的菌株是从野生型谷氨酸棒杆菌ATCC13869中开发的。由于野生型谷氨酸棒杆菌不能生产L-色氨酸，或者即使可能的话，也只能生产非常少量，因此尝试使用其中增强生产L-色氨酸所必需的生物合成途径的菌株作为亲本菌株。具体地，通过增强启动子增加了L-色氨酸生物合成基因的操纵基因的表达。另外，为了释放TrpE蛋白的反馈抑制，TrpE的第38个氨基酸(即，丝氨酸)被精氨酸取代(Journal of Bacteriology,Nov.1987,p.5330-5332)。

对于上述遗传操作，首先，获得了trpE启动子的上游区域和TrpE的第38个氨基酸突变的下游区域用于染色体中的同源重组。具体地，通过使用谷氨酸棒杆菌的染色体DNA作为模板以及SEQ ID NO:45和SEQ ID NO:46的引物进行了PCR，获得了trpE启动子上游区域的遗传片段，而通过使用谷氨酸棒杆菌的染色体DNA作为模板以及SEQ ID NO:47和SEQ IDNO:48的引物进行PCR，获得了TrpE的第38个氨基酸突变的下游区域的遗传片段。

SEQ ID NO:45(Pspl7-trpE(S38R)_L-1)

TCGAGCTCGGTACCCAAACAACTGCGACGTGTGTC

SEQ ID NO:46(Pspl7-trpE(S38R)_L-2)

CATGAAGCGCCGGTACCTTAATCATTTTTGGGTTC

SEQ ID NO:47(Pspl7-trpE(S38R)_R-1)

GCCCTGTTGGAACGCGCTGATATCACCACCAAGAA

SEQ ID NO:48(Pspl7-trpE(S38R)_R-2)

CTCTAGAGGATCCCCAGATGTCACCGTTGTAAATG

将Solg^TM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶，并如下进行了PCR：在95℃下变性5分钟；30个循环的在95℃下变性30秒，在60℃下退火30秒，以及在72℃下聚合60秒；以及在72℃下聚合5分钟。

使用合成的启动子SPL7(SEQ ID NO:49)作为模板以及SEQ ID NO:50和SEQ IDNO:51的引物进行了PCR。

SEQ ID NO:50(Pspl7-1)

CCCAAAAATGATTAAGGTACCGGCGCTTCATGTCA

SEQ ID NO:51(Pspl7-2)

GGGATTCGTGCTCATGATATCTGTTTTGATCTCCTCC

将Solg^TM Pfu-X DNA聚合酶(SolGent Co.,Ltd.)用作聚合酶，并如下进行了PCR：在95℃下变性5分钟；30个循环的在95℃下变性30秒，在60℃下退火30秒，以及在72℃下聚合30秒；以及在72℃下聚合5分钟。

为了获得源自谷氨酸棒杆菌的TrpE的上游片段(包括从第1个氨基酸至突变的第38个氨基酸的氨基酸序列)，使用谷氨酸棒杆菌的基因组DNA作为模板以及SEQ ID NO:52和SEQ ID NO:53的引物进行了PCR。

SEQ ID NO:52(trpE(S38R)-1)

ATCAAAACAGATATCATGAGCACGAATCCCCATGT

SEQ ID NO:53(trpE(S38R)-2)

GTGGTGATATCAGCGCGTTCCAACAGGGCTGCATC

使用Gibson装配方法通过克隆trpE启动子的扩增上游区域和TrpE的突变的第38个氨基酸的下游区域、SPL7启动子和TrpE的上游片段、以及用SmaI限制性酶切割的pDZ载体获得了重组质粒。将重组质粒命名为pDZ-PSPL7-trpE(S38R)。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合，然后在50℃下温育1小时来进行了克隆。

通过电穿孔将制备的pDZ-PSPL7-trpE(S38R)载体转化到谷氨酸棒杆菌ATCC13869菌株中以及然后进行二次交换。然后，获得了其中染色体中的trpE的启动子被SPL7启动子(即，更强的启动子)替换并且TrpE的第38个氨基酸(即，丝氨酸)被精氨酸替换的菌株。通过基因组测序和使用SEQ ID NO:54和SEQ ID NO:55的引物(其可以扩增插入基因的同源重组的上游区域和下游区域)的PCR方法，确认了相应的遗传操作，并且将所得菌株命名为CA04-8325。

SEQ ID NO:54(确认_Pspl7-trpE(S38R)-1)

GAAGAAGAGGCTGCAGATG

SEQ ID NO:55(确认_Pspl7-trpE(S38R)-2)

GATCAGCGCCATCATGTT

色氨酸生产通过芳香族氨基酸代谢途径发生，并且该代谢途径从磷酸烯醇丙酮酸和赤藓糖4-磷酸之间的缩合反应开始。因此，这两种前体的平稳供应对于色氨酸的生产是必需的，并且为了平稳供应已知相对缺乏的赤藓糖4-磷酸而进行了tkt基因的过表达。

对于上述遗传操作，使用谷氨酸棒杆菌的染色体DNA作为模板以及SEQ ID NO:56和SEQ ID NO:57的引物进行了PCR以获得用于额外插入tkt基因的上游区域，以及使用SEQID NO:58和SEQ ID NO:59的引物以获得用于额外插入tkt基因的下游区域。

SEQ ID NO:56(Pn-tkt_L-1)

TCGAGCTCGGTACCCAAACTTTGAGTGGGTGCGTG

SEQ ID NO:57(Pn-tkt_L-2)

TCGAGCTACGAGGGCGGTTCCCAGCCCTTCATTAG

SEQ ID NO:58(Pn-tkt_R-1)

ATTAACGGTTAATTGATTCTGGACGTCATGACTAC

SEQ ID NO:59(Pn-tkt_R-2)

CTCTAGAGGATCCCCGCCTCGATGATGCAGTCGTC

将Solg^TM Pfu-X DNA聚合酶用作聚合酶，并如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合30秒；以及在72℃下聚合5分钟。

为了获得tkt基因及其启动子，使用野生型谷氨酸棒杆菌ATCC13869的染色体DNA作为模板以及SEQ ID NO:60和SEQ ID NO:61的引物进行PCR，以及从而获得了包括其启动子的tkt基因。

SEQ ID NO:60(Pn-tkt-1)

GAAGGGCTGGGAACCGCCCTCGTAGCTCGAGAGTT

SEQ ID NO:61(Pn-tkt-2)

CATGACGTCCAGAATCAATTAACCGTTAATGGAGTCC

将Solg^TM Pfu-X DNA聚合酶用作聚合酶，并如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合1分20秒；以及在72℃下聚合5分钟。

使用Gibson装配方法通过克隆用于额外插入tkt基因的扩增的上游区域和用于额外插入tkt基因的下游区域、包括tkt启动子的tkt基因、和通过SmaI限制性酶切割的用于染色体转化的pDZ载体获得了重组质粒，并且将所得重组质粒命名为pDZ-Pn-tkt。通过以计算的摩尔数将Gibson装配试剂和基因片段中的每个混合，然后在50℃下温育1小时来进行了克隆。

通过电穿孔将制备的pDZ-Pn-tkt载体转化到CJ04-8325菌株中以及然后进行二次交换，以获得其中包括tkt启动子的tkt基因被插入到染色体中的菌株。通过基因组测序和使用SEQ ID NO:62和SEQ ID NO:63的引物的PCR方法，确认了相应的遗传操作，该引物可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。将所得菌株命名为CA04-8352。CA04-8352菌株于2018年2月2日根据布达佩斯条约的规定国际保藏于国际保藏机构韩国微生物保藏中心(KCCM)，并指定了保藏号KCCM12218P。

SEQ ID NO:62(确认_Pn-tkt-1)

ACCCAGAACCCCAAATTTTC

SEQ ID NO:63(确认_Pn-tkt-2)

TTGAGTTCGACAACTTTGG

实施例10：通过其中引入源自根际草螺菌和大肠杆菌的基因的棒杆菌属微生物的色氨酸生产

将源自根际草螺菌的基因引入到CA04-8352中，该基因在实施例7中的色氨酸类似物的最小抑制浓度下显示出优异的活性，CA04-8352是参考例1中制备的生产色氨酸的菌株。为此目的，通过电穿孔将用于引入实施例2中制备的源自根际草螺菌的基因的pDZTn-PgapA-Hrh载体转化到CA04-8352(即，生产色氨酸的菌株)中并进行如实施例2中的过程，以及从而获得了其中一个拷贝的源自根际草螺菌的基因被插入到转座子基因之间的菌株。将所得菌株命名为CA04-8405。

另外，将源自大肠杆菌的基因引入到CA04-8352(即，生产色氨酸的菌株)中作为对照组。通过电穿孔将用于引入实施例6中制备的源自大肠杆菌的基因的pDZTn-PgapA-Eco载体转化到CA04-8352(即，生产色氨酸的菌株)中并进行如实施例6中的过程，以及从而获得了其中一个拷贝的源自大肠杆菌的基因被插入到转座子基因之间的菌株。将所得菌株命名为CA04-8406。

通过以下方法培养由上述过程获得的菌株CA04-8405和CA04-8406以确认相对于参考例1中制备的作为对照组的CA04-8352菌株的色氨酸生产量。将每种菌株接种到含有种子培养基(25mL)的250mL拐角-挡板烧瓶(corner-baffle flask)中并在30℃下以200rpm振荡培养20小时。然后，将每种种子培养溶液(1mL)接种到含有生产培养基(25mL)的250mL拐角-挡板烧瓶中并在30℃下以200rpm振荡培养24小时。培养完成后，通过HPLC测量了L-色氨酸生产量。

种子培养基(pH7.0)

葡萄糖20g、蛋白胨10g、酵母提取物5g、尿素1.5g、KH₂PO₄ 4g、K₂HPO₄ 8g、MgSO₄·7H₂O 0.5g、生物素100μg、硫胺素盐酸盐1000μg、泛酸钙2000μg、烟酰胺2000μg(基于1L蒸馏水)

生产培养基(pH7.0)

葡萄糖30g、(NH₄)₂SO₄ 15g、MgSO₄·7H₂O 1.2g、KH₂PO₄ 1g、酵母提取物5g、生物素900μg、硫胺素盐酸盐4500μg、泛酸钙4500μg、CaCO₃ 30g(基于1L蒸馏水)

[表4]确认通过CA04-8352(生产L-色氨酸的谷氨酸棒杆菌菌株)、CA04-8405(其中插入源自根际草螺菌的基因的菌株)和CA04-8406(其中插入源自大肠杆菌的基因的菌株)的L-色氨酸生产量

在培养基中通过CA04-8352、CA04-8405和CA04-8406菌株的L-色氨酸生产的结果显示于上表4中。其中引入源自根际草螺菌的基因的CA04-8405菌株在烧瓶培养中生产最终浓度为1.52g/L的L-色氨酸，并且与CA04-8352菌株(即，对照组)相比，这是约5倍的提高。这表明源自根际草螺菌的基因能显著提高谷氨酸棒杆菌菌株中的L-色氨酸生产。相反，其中引入源自大肠杆菌基因的CA04-8406菌株生产浓度为0.23g/L的L-色氨酸，这几乎与CA04-8352菌株(即，CA04-8406菌株的亲本菌株)的L-色氨酸生产量相同。如在实施例7和9中确认的色氨酸类似物和苯丙氨酸类似物的最小抑制浓度(MIC)实验中所确认的，源自大肠杆菌的基因被认为是显示出对苯丙氨酸的特异性高于对色氨酸的特异性的输出基因。根据布达佩斯条约的规定，CA04-8405菌株于2017年8月21日国际保藏于国际保藏机构韩国微生物保藏中心(KCCM)，并指定了保藏号KCCM12099P(CA04-8405)。

实施例11：分析其中引入源自根际草螺菌的基因的谷氨酸棒杆菌中的细胞内色氨酸代谢物

为了明确确认细胞内色氨酸浓度是否随着CA04-8405菌株(即，生产色氨酸的菌株)的色氨酸输出能力的提高而降低，使用有机溶剂通过萃取方法测量了CA04-8405菌株及CA04-8352(即，CA04-8405菌株的亲本菌株)中的细胞内色氨酸浓度。

用于分析细胞内代谢物的方法根据参考文献中所述的方法进行(Nakamura J等人，Appl.Environ.Microbiol.73(14):4491-4498,2007)。

首先，关于突变的谷氨酸棒杆菌菌株CA04-8352和CA04-8405，将每种菌株接种到含有种子培养基(25mL)的250mL拐角-挡板烧瓶中并在30℃下以200rpm振荡培养20小时。然后，将每种种子培养溶液(1mL)接种到含有生产培养基(25mL)的250mL拐角-挡板烧瓶中并在30℃下以200rpm振荡培养。根据葡萄糖消耗分析了细胞内色氨酸浓度三次。通过快速真空过滤(Durapore HV，0.45μm；Millipore，Billerica，MA)将每个步骤中的培养细胞与培养液分离。将吸附有细胞的过滤器用蒸馏水(10mL)洗涤两次，以及在含有5μM吗啉乙磺酸和5μM蛋氨酸砜的甲醇中浸泡10分钟。将氯仿(1.6mL)和蒸馏水(0.64μL)添加到上面获得的细胞提取物(1.6mL)中并充分混合，并且仅将水相施加到旋转柱上以除去蛋白质杂质。使用毛细管电泳质谱法分析了过滤的提取物，且结果显示在图1中。

如图1所示，确认了与其亲本菌株CA04-8352相比，CA04-8405菌株显示出细胞内色氨酸浓度降低至33％至41％的水平。这些结果表明由于源自根际草螺菌的基因的表达，谷氨酸棒杆菌菌株细胞内生产的色氨酸平稳地向细胞外输出，因而CA04-8405菌株的细胞内色氨酸浓度降低。从这些结果，确认了源自根际草螺菌的基因是编码具有色氨酸特异性输出能力的膜蛋白的基因。

参考例2：制备生产L-色氨酸的埃希氏菌属微生物

埃希氏菌属的生产L-色氨酸的微生物是从野生型大肠杆菌W3110中开发的。为了确认是否随着具有L-色氨酸输出活性的蛋白被修饰以表达，色氨酸生产量显著增加，将制备以生产L-色氨酸的菌株用作亲本菌株。具体地，L-色氨酸生物合成基因(trpEDCBA)——其参与从分支酸(Chorismate)生产L-色氨酸——的表达被TrpR抑制。因此，除去了编码TrpR的trpR基因。另外，为了释放根据L-色氨酸生产的提高的TrpE多肽的反馈抑制，从TrpE的N-端的第21个氨基酸(即，脯氨酸)被丝氨酸取代(J.Biochem.Mol.Biol.32,20-24(1999))。

Mtr膜蛋白具有将细胞外L-色氨酸引入到细胞中的作用，并且TnaA蛋白具有将细胞内L-色氨酸和水分子分解成吲哚、丙酮酸和氨(NH₃)的作用。因此，除去了抑制L-色氨酸生产并分解L-色氨酸的mtr和tnaA基因。

为了除去这些基因，使用了λ-red重组方法(使用PCR产物在大肠杆菌K-12中一步灭活染色体基因，Datsenko KA,Wanner BL.,Proc Natl Acad Sci USA.2000Jun 6；97(12):6640-6645)。为了除去mtr基因，使用pKD4载体作为模板以及SEQ ID NO:64和SEQ IDNO:65的引物进行了PCR。结果，获得了1580bp基因片段，其中FRT-卡那霉素-FRT盒被结合到mtr基因侧翼的一对50bp同源核苷酸(其中其间发生染色体同源重组)。pKD4载体的卡那霉素抗生素标记用于确认靶基因的除去和抗生素基因的插入，并且FRT区域具有在除去靶基因后除去抗生素标记的作用。

将Solg^TM Pfu-X DNA聚合酶用作聚合酶，并如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合1分钟；以及在72℃下聚合5分钟。

SEQ ID NO:64(Δmtr盒-1)

TGCAATGCATAACAACGCAGTCGCACTATTTTTCACTGGAGAGAAGCCCTGTGTAGGCTGGAGCTGCTTC

SEQ ID NO:65(Δmtr盒-2)

TGCAATGCATAACAACGCAGTCGCACTATTTTTCACTGGAGAGAAGCCCTGTCCATATGAATATCCTCCT

通过电穿孔将表达λred重组酶(gam、bet和exo基因)的pKD46载体转化到大肠杆菌W3110菌株中，并将菌株涂布在含有卡那霉素(50mg/L)的LB固体培养基上。当OD₆₀₀达到约0.1时，通过添加10mM L-阿拉伯糖，其中确认了pKD46载体转化的大肠杆菌W3110菌株诱导重组酶的表达。当OD₆₀₀达到约0.6时，将菌株制备成感受态细胞，并通过电穿孔转化了上述过程中获得的线性基因片段，其中FRT-卡那霉素-FRT盒被结合到mtr基因侧翼的一对50bp同源核苷酸。对于在含有卡那霉素(25mg/L)的LB固体培养基上生长的菌落，使用SEQ IDNO:66和SEQ ID NO:67的引物进行了菌落PCR，并选择了其中制得782bp基因片段的菌落。

SEQ ID NO:66(确认_盒-1)

GGGCAGGATCTCCTGTCATC

SEQ ID NO:67(确认_Δmtr-2)

AAATGTCGGATAAGGCACCG

将由于同源重组的发生其中除去了mtr基因的菌株制备成感受态细胞，以除去卡那霉素抗生素标记，以及然后通过电穿孔用pCP20载体转化。pCP20载体表达FLP蛋白，以及从而识别卡那霉素抗生素侧翼的FRT位点并在染色体中与其结合，从而除去FRT位点之间的抗生素标记。将含有氨苄青霉素(100mg/L)和氯霉素(25mg/L)的LB固体培养基中生长的pCP20载体转化菌株在LB液体培养基中在30℃下培养1小时，进一步在42℃下培养15小时，以及在LB固体培养基上涂布。在含有氨苄青霉素(100mg/L)和氯霉素(25mg/L)的LB固体培养基；含有卡那霉素(12.5mg/L)的LB固体培养基；和不含有抗生素的LB固体培养基中培养生长的菌落。仅选择了在不含有抗生素的LB固体培养基中生长的菌落。最终通过基因组测序确认了mtr基因的除去，并将该菌株命名为CA04-9300。

通过上述方法进行了遗传操作以除去tnaA基因。使用pKD4载体作为模板以及SEQID NO:68和SEQ ID NO:69的引物进行了PCR，以及从而获得了1580bp基因片段，其中FRT-卡那霉素-FRT盒被结合到tnaA基因侧翼的一对50bp同源核苷酸(其中其间发生染色体同源重组)。将Solg^TM Pfu-X DNA聚合酶用作聚合酶，以及如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合1分钟；以及在72℃下聚合5分钟。

SEQ ID NO:68(ΔtnaA盒-1)

TGTAATATTCACAGGGATCACTGTAATTAAAATAAATGAAGGATTATGTAGTGTAGGCTGGAGCTGCTTC

SEQ ID NO:69(ΔtnaA盒-2)

TGTAGGGTAAGAGAGTGGCTAACATCCTTATAGCCACTCTGTAGTATTAAGTCCATATGAATATCCTCCT

确认了pKD46载体的转化。用上述过程中获得的线性基因片段(其中FRT-卡那霉素-FRT盒被结合到tnaA基因侧翼的一对50bp同源核苷酸)通过电穿孔转化CA04-9300(其中通过添加10mM L-阿拉伯糖表达了重组酶)。对于在含有卡那霉素(25mg/L)的LB固体培养基上生长的菌落，使用SEQ ID NO:66和SEQ ID NO:70的引物进行了菌落PCR，以及选择了其中制得787bp基因片段的菌落。

SEQ ID NO:70(确认_ΔtnaA-2)

ACATCCTTATAGCCACTCTG

将由于同源重组其中除去了tnaA基因的菌株制备成感受态细胞，以除去卡那霉素抗生素标记，以及然后用pCP20载体转化，以及制备了其中通过表达FLP蛋白除去了卡那霉素抗生素标记的菌株。最终通过基因组测序确认了tnaA基因的除去，并将该菌株命名为CA04-9301。

为了除去trpR基因，使用pKD4载体作为模板以及SEQ ID NO:71和SEQ ID NO:72的引物进行了PCR，以及从而获得了基因片段(1580bp)，其中FRT-卡那霉素-FRT盒被结合到trpR基因侧翼的一对50bp同源核苷酸(其中其间发生染色体同源重组)。将Solg^TM Pfu-XDNA聚合酶用作聚合酶，以及如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火40秒，以及在72℃下聚合1分钟；以及在72℃下聚合5分钟。

SEQ ID NO:71(ΔtrpR盒-1)

TACAACCGGGGGAGGCATTTTGCTTCCCCCGCTAACAATGGCGACATATTGTGTAGGCTGGAGCTGCTTC

SEQ ID NO:72(ΔtrpR盒-2)

GCATTCGGTGCACGATGCCTGATGCGCCACGTCTTATCAGGCCTACAAAAGTCCATATGAATATCCTCCT

确认了pKD46载体的转化。用上述过程中获得的线性基因片段(其中FRT-卡那霉素-FRT盒被结合到trpR基因侧翼的一对50bp同源核苷酸)通过电穿孔转化CA04-9301(其中通过添加10mM L-阿拉伯糖表达了重组酶)。对于在含有卡那霉素(25mg/L)的LB固体培养基上生长的菌落，使用SEQ ID NO:66和SEQ ID NO:73的引物进行了菌落PCR，以及选择了其中制得838bp基因片段的菌落。

SEQ ID NO:73(确认_ΔtrpR-2)

AGGACGGATAAGGCGTTCAC

将由于同源重组其中除去了trpR基因的菌株制备成感受态细胞，以除去卡那霉素抗生素标记，以及然后用pCP20载体转化，以及制备了其中通过表达FLP蛋白除去了卡那霉素抗生素标记的菌株。最终通过基因组测序确认了trpR基因的除去，并将该菌株命名为CA04-9307。

为了向CA04-9307菌株提供反馈抗性trpE性状，使用大肠杆菌W3110 gDNA作为模板以及SEQ ID NO:74和SEQ ID NO:75的引物(这两个引物均包含EcoRI限制性位点)进行了PCR，以及从而获得了含有EcoRI限制性位点的1575bp的trpE基因片段。将Solg^TM Pfu-X DNA聚合酶用作聚合酶，并如下进行了PCR：在95℃下变性2分钟；27个循环的在95℃下变性20秒，在62℃下退火1分钟，以及在72℃下聚合1分钟；以及在72℃下聚合5分钟。

SEQ ID NO:74(trpE-1)

GAATTCATGCAAACACAAAAACCGAC

SEQ ID NO:75(trpE-2)

GAATTCTCAGAAAGTCTCCTGTGCA

在用EcoRI限制性酶分别处理通过上述方法获得的trpE基因片段和pSG76-C质粒(Journal of Bacteriology,July 1997,p.4426-4428)后进行了克隆。通过电穿孔将克隆的质粒转化到大肠杆菌DH5α中，以及在含有氯霉素(25μg/mL)的LB平板上选择了转化的大肠杆菌DH5α菌株，以及从而获得了pSG76-C-trpE质粒。

使用以上获得的pSG76-C-trpE质粒以及SEQ ID NO:76和SEQ ID NO:77的引物通过定点诱变(Stratagene，USA)制备了pSG76-C-trpE(P21S)。

SEQ ID NO:76(trpE(P21S)-1)

CGCTTATCGCGACAATTCCACCGCGCTTTTTCACCAG

SEQ ID NO:77(trpE(P21S)-2)

CTGGTGAAAAAGCGCGGTGGAATTGTCGCGATAAGCG

将pSG76-C-trpE(P21S)质粒转化到CA04-9307菌株中，在LB-Cm培养基(酵母提取物10g/L、NaCl 5g/L、胰蛋白胨10g/L、和氯霉素25μg/L)中培养，以及选择了对氯霉素具有抗性的菌落。所选择的转化体是其中通过首次插入将pSG76-C-trpE(P21S)质粒插入到基因组的trpE区域中的菌株。用pAScep质粒(其表达切割存在于pSG76-C质粒中的I-SceI区域的限制性酶I-SceI)转化其中插入获得的trpE(P21S)基因的菌株(Journal ofBacteriology,July 1997,p.4426-4428)，以及选择了在LB-Ap(酵母提取物10g/L、NaCl5g/L、胰蛋白胨10g/L、和氨苄青霉素100μg/L)中生长的菌株。使用SEQ ID NO:74和SEQ IDNO:75的引物扩增了选择的菌株中的trpE基因，并且通过测序确认了扩增的trpE基因被替换为trpE(P21S)基因。将由此制备的菌株命名为CA04-4303。

实施例12：其中引入源自根际草螺菌的基因的埃希氏菌属微生物的L-色氨酸生产

将实施例8中制备的pCL1920-PyccA-Hrh引入到参考例2中制备的CA04-4303菌株中，以及从而制备其中过表达源自根际草螺菌的基因的CA04-4306菌株。另外，将作为对照组的pCL1920载体转化到CA04-4303菌株中。为了确认两种菌株(即，CA04-4303/pCL1920和CA04-4306)中L-色氨酸生产量，将这些菌株在含有壮观霉素(50mg/L)的LB液体培养基中培养12小时。然后，将这些菌株各自接种到含有25mL生产培养基的250mL拐角-挡板烧瓶中，使得初始OD₆₀₀值变为0.01，以及然后在37℃下以200rpm振荡培养48小时。培养完成后，通过HPLC测量了L-色氨酸生产量。

关于培养基中CA04-4303/pCL1920和CA04-4306菌株中L-色氨酸生产的结果显示在下表5中。其中引入并过表达了源自根际草螺菌的基因的菌株CA04-4306在烧瓶培养中显示了2.1g/L的最终L-色氨酸浓度，其比对照组的最终L-色氨酸浓度高约50％。这表明源自根际草螺菌的基因在大肠杆菌中也能输出L-色氨酸，以及从而显著提高其L-色氨酸生产。

生产培养基(pH 7.0)

葡萄糖70g、(NH₄)₂SO₄ 20g、MgSO₄·7H₂O 1g、KH₂PO₄ 2g、酵母提取物2.5g、柠檬酸钠5g、NaCl 1g、CaCO₃ 40g(基于1L蒸馏水)

[表5]确认源自大肠杆菌的L-色氨酸生产菌株(CA04-4303)和其中过表达源自根际草螺菌的输出基因的L-色氨酸生产菌株(CA04-4306)中的L-色氨酸生产量

因此，从实施例7和9的结果可以看出，源自根际草螺菌的基因显示出对L-色氨酸及其类似物的高特异性和优异的抗性。从实施例10和12的结果中可以看出，源自根际草螺菌的基因均提高了谷氨酸棒杆菌和大肠杆菌菌株中的L-色氨酸生产。另外，在实施例11中观察到了源自根际草螺菌的基因基本上向细胞外输出色氨酸。结果，将源自根际草螺菌的基因命名为wex(色氨酸(W)输出基因)。

实施例13：使用随机诱变改进Wex输出能力

在该实施例中，进行了易错PCR以对野生型wex基因施加随机诱变，并且在进行易错PCR时，使用了多样化PCR随机诱变试剂盒(Diversify PCR Random Mutagenesis Kit)(Clontech，USA)。

为了获得引入随机诱变的wex基因的变体，使用实施例8中制备的pCL1920-PyccA-wex作为模板以及SEQ ID NO:78和SEQ ID NO:79进行了易错PCR。

为了选择突变率条件，如下根据MnSO₄的浓度，用两种组成进行了易错PCR。

SEQ ID NO:78(wex-1)

ACTCTAGAGGATCCCCTTCCAGATCAAATGCGTAA

SEQ ID NO:79(wex-2)

ATTCGAGCTCGGTACCCCTACAAACAGTCCGCCAC

[表6]用于易错PCR的组成(单位：μL)

情况#	1	2
			10X钛Taq缓冲液	5	5
MnSO₄(8mM)	1	2
			dGTP(2mM)	1	1
50X Diversify dNTP混合物	1	1
			钛Taq聚合酶	1	1
引物混合物	2	2
			模板DNA(1ng/uL)	1	1
PCR级水	38	37
			总体积	50	50

[表7]易错PCR循环

使用易错PCR(其在表6和表7的条件下进行)和pCL1920(其用SmaI限制性酶切割)的产物，通过Gibson装配方法(DG Gibson等人,Nature Methods,VOL.6NO.5,MAY 2009,NEBuilder HiFi DNA Assembly Master Mix)获得了重组突变质粒文库。通过上述方法获得的突变体文库、pCL1920-PyccA-Hrh和pCL1920被转化到大肠杆菌W3110细胞中，在含有壮观霉素(50g/L)的LB平板培养基中培养，以及从突变体文库中筛选出50个菌落。进行了测序以确定它们的突变率和在多种位置突变的存在/不存在。作为测序结果，情况#1条件的突变率为1.3kb-1，以及情况#2条件的突变率为2.5kb-1。情况#1和#2都被确定满足适合获得突变体文库的突变率，并使用在上述条件下制备的文库进行了筛选有效突变的过程。

含有50μg/mL 5'-氟色氨酸(即，L-色氨酸类似物)的300μL的M9基本培养基被等分到96深孔板的每个孔中，随后接种先前转化的突变体文库(即，W3110/pCL1920-PyccA-Hrh、W3110/pCL1920、和W3110/pCL1920-PyccA-wex突变体文库)的每个菌落。在1200rpm/37℃下进行了培养，以及培养16小时后在600nm波长下测量了OD。与对照菌株(W3110/pCL1920和W3110/pCL1920-PyccA-Hrh)的情况一样，在深孔板中几乎没有观察到大多数突变体文库的生长。它们当中，筛选了具有改善生长的51个菌落，以及从菌落中分别提取了pCL1920-PyccA-wex突变质粒，并再转化到大肠杆菌W3110菌株中以评价再现性。在其中通常含有浓度为50μg/mL的5'-氟色氨酸的M9基本培养基中，观察到了在M9基本培养基中显示出特异性生长改善的10种菌株，并记录了它们的OD。

[表8]其中在含有L-色氨酸类似物的基本培养基中生长得到改善的wex文库

	光密度(OD₆₀₀)
		W3110/pCL1920	0.189
W3110/pCL1920-PyccA-Hrh	0.393
		W3110/pCL1920-PyccA-wex突变体文库(1-3 8G)	0.791
W3110/pCL1920-PyccA-wex突变体文库(1-4 6D)	1.026
		W3110/pCL1920-PyccA-wex突变体文库(2-1 10C)	0.748
W3110/pCL1920-PyccA-wex突变体文库(2-12 8C)	0.773
		W3110/pCL1920-PyccA-wex突变体文库(2-15 6B)	0.825
W3110/pCL1920-PyccA-wex突变体文库(2-18 3F)	0.921
		W3110/pCL1920-PyccA-wex突变体文库(3-3 6D)	0.831
W3110/pCL1920-PyccA-wex突变体文库(3-6 11F)	0.749
		W3110/pCL1920-PyccA-wex突变体文库(5-5 10B)	0.766
W3110/pCL1920-PyccA-wex突变体文库(5-18 6B)	0.783

从10株筛选的突变株中提取pCL1920-PyccA-wex突变质粒后，进行了测序以确认它们的突变，以及结果确认了突变发生在编码序列(CDS)(其不在启动子区域中)中。另外，确认了，10株突变株中的8株中突变位点集中在Wex膜蛋白的氨基酸序列的第79个氨基酸(即，亮氨酸)至第83个氨基酸(即，异亮氨酸)的区域中，且大多数突变是用疏水性氨基酸、脂肪族氨基酸、或相对小的L-氨基酸取代它们。因此，确定了Wex膜蛋白的氨基酸序列的第79位至第83位可以是引入突变以提高L-色氨酸输出能力的核心区域。在这方面，尝试通过用各种疏水性氨基酸(一种或多种)、脂肪族氨基酸(一种或多种)、或相对较小的L-氨基酸(一种或多种)取代相应序列中的氨基酸(一个或多个)来提高其活性。

实施例14：棒杆菌属微生物中Wex序列的第79个氨基酸(亮氨酸)被疏水性氨基酸取代

尝试通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中的第79个氨基酸亮氨酸(下文称为第79位或在第79个位置的亮氨酸)，以确认输出L-色氨酸的改进的效力。使用实施例2中制备的pDZTn-PgapA-Hrh作为模板进行了定点诱变，以生产亮氨酸以外的三种不同氨基酸的突变。通过以下方法进行了定点诱变。

[表9]定点诱变的PCR组成

	单位(μL)
		10X pfu-X缓冲液	5
10mM dNTP混合物	1
		pfu-X聚合酶	1
诱变正向引物(5pmol)	2
		诱变反向引物(5pmol)	2
pDZTn-PgapA-Hrh(模板DNA,200ng/μL)	1
		dH₂O	38
总计	50

[表10]定点诱变的PCR循环

为了Wex氨基酸序列的第79位的氨基酸(即，亮氨酸)被不同的疏水性氨基酸(即，丙氨酸(A)(SEQ ID NO:80、SEQ ID NO:131)、缬氨酸(V)(SEQ ID NO:81、SEQ ID NO:132)、和异亮氨酸(I)(SEQ ID NO:82、SEQ ID NO:133))中的每个取代，如表9中所示，使用表11中表明的各诱变引物组制备了PCR混合物，并按照表10中所示的下列方法进行了PCR。PCR完成后，向其中添加了1μL的DpnI限制性酶，以及在37℃下处理混合物1小时。将3μL经DpnI处理的DNA转化到DH5α感受态细胞中，以获得突变体pDZTn-PgapA-wex质粒，以及通过测序确认了表11中表明的每个突变。

[表11]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列的第79位的氨基酸被分别突变

将如表11中所示制备的pDZTn-PgapA-wex L79A、pDZTn-PgapA-wex L79V和pDZTn-PgapA-wex L79I载体通过电穿孔各自转化到参考例1中制备的CA04-8352菌株中，以及然后进行了二次交换，以分别获得其中突变wex基因被插入到染色体中的三种菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

获得的突变株分别命名为CA04-8352(wex L79A)、CA04-8352(wex L79V)和CA04-8352(wex L79I)。

为了确认CA04-8352、CA04-8405、CA04-8352(wex L79A)、CA04-8352(wex L79V)和CA04-8352(wex L79I)菌株中的色氨酸生产量，通过与实施例10中相同的方法培养了这些菌株。培养完成后，通过HPLC测量了每种菌株中的L-色氨酸生产量。

[表12]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(Wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列的第79位氨基酸被分别突变的突变株(CA04-8352(wex L79A)、CA04-8352(wex L79V)和CA04-8352(wex L79I))中L-色氨酸生产量

如表12的结果中所示，与引入野生型Wex的CA04-8405菌株相比，其中Wex氨基酸序列第79位的亮氨酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了1.59％p至2.95％p。特别地，wex L79A突变株显示了最大的L-色氨酸发酵产率的提高，且这些结果表明用不同疏水性氨基酸取代Wex氨基酸序列第79位的亮氨酸可以显著增加Wex的L-色氨酸输出能力的活性。

实施例15：棒杆菌属微生物中Wex序列的第80个氨基酸(丝氨酸)被疏水性氨基酸取代

尝试通过用疏水性氨基酸取代Wex膜蛋白的氨基酸序列中的第80个氨基酸丝氨酸(下文称为第80位的丝氨酸)，以确认输出L-色氨酸的效力。通过与实施例14中相同的方法，使用pDZTn-PgapA-wex作为模板进行了定点诱变，以产生为四种不同类型的疏水性氨基酸的突变。

另外，使用与实施例14中相同的方法，用不同的疏水性氨基酸(即，丙氨酸(A)(SEQID NO:89、SEQ ID NO:134)、缬氨酸(V)(SEQ ID NO:90、SEQ ID NO:135)、亮氨酸(L)(SEQID NO:91、SEQ ID NO:136)和异亮氨酸(I)(SEQ ID NO:92、SEQ ID NO:137))中的每个取代Wex氨基酸序列的第80位的丝氨酸。用于获得pDZTn-PgapA-wex突变质粒的诱变引物组和突变形式与下表13中所示相同。

[表13]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列的第80位的氨基酸被分别突变

将如表13中所示制备的pDZTn-PgapA-wex S80A、pDZTn-PgapA-wex S80V、pDZTn-PgapA-wex S80L和pDZTn-PgapA-wex S80I载体通过电穿孔各自转化到CA04-8352菌株中，以及然后进行了二次交换，以分别获得其中突变wex基因被插入到染色体中的四种菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

获得的突变株分别命名为CA04-8352(wex S80A)、CA04-8352(wex S80V)、CA04-8352(wex S80L)、和CA04-8352(wex S80I)。

为了确认CA04-8352、CA04-8405、CA04-8352(wex S80A)、CA04-8352(wex S80V)、CA04-8352(wex S80L)、和CA04-8352(wex S80I)菌株中的色氨酸生产量，通过与实施例10中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株中的L-色氨酸生产量。

[表14]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列的第80位氨基酸被分别突变的突变株(CA04-8352(wex S80A)、CA04-8352(wex S80V)、CA04-8352(wex S80L)和CA04-8352(wex S80I))中L-色氨酸生产量

如表14的结果中所示，与引入野生型Wex的CA04-8405菌株相比，其中Wex氨基酸序列第80位的氨基酸分别被不同的疏水性氨基酸取代的四种突变体全部显示发酵产率提高了1.99％p至2.62％p。特别地，wex S80V突变株显示了最大的L-色氨酸发酵产率的提高，且这些结果表明，用不同疏水性氨基酸取代Wex氨基酸序列第80位的丝氨酸可以显著增加Wex的L-色氨酸输出能力的活性。

实施例16：棒杆菌属微生物中Wex序列的第81个氨基酸(亮氨酸)被疏水性氨基酸取代

尝试通过用不同的疏水性氨基酸取代Wex膜蛋白的氨基酸序列中的第81个氨基酸亮氨酸(下文称为第81位的亮氨酸)，以确认输出L-色氨酸的改进的效力。通过与实施例14中相同的方法，使用pDZTn-PgapA-wex作为模板进行了定点诱变，以产生为亮氨酸以外的三种不同类型的疏水性氨基酸的突变。

另外，使用与实施例14中相同的方法，用不同的疏水性氨基酸(即，丙氨酸(A)(SEQID NO:101、SEQ ID NO:138)、缬氨酸(V)(SEQ ID NO:102、SEQ ID NO:139)、和异亮氨酸(I)(SEQ ID NO:103、SEQ ID NO:140))中的每个取代Wex氨基酸序列的第81位的亮氨酸。用于获得pDZTn-PgapA-wex突变质粒的诱变引物组和突变形式与下表15中所示相同。

[表15]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列的第81位的氨基酸被分别突变

将如表15中所示制备的pDZTn-PgapA-wex L81A、pDZTn-PgapA-wex L81V和pDZTn-PgapA-wex L81I载体通过电穿孔各自转化到CA04-8352菌株中，以及然后进行二次交换，以分别获得其中突变wex基因被插入到染色体中的三种菌株。通过基因组测序和使用SEQ IDNO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

获得的突变株分别命名为CA04-8352(wex L81A)、CA04-8352(wex L81V)和CA04-8352(wex L81I)。

为了确认CA04-8352、CA04-8405、CA04-8352(wex L81A)、CA04-8352(wex L81V)和CA04-8352(wex L81I)中的色氨酸生产量，用与实施例10中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株中的L-色氨酸生产量。

[表16]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列的第81位氨基酸被分别突变的突变株(CA04-8352(wex L81A)、CA04-8352(wex L81V)和CA04-8352(wex L81I))中L-色氨酸生产量

如表16的结果中所示，与引入野生型Wex的CA04-8405菌株相比，其中Wex氨基酸序列第81位的氨基酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了2.03％p至2.87％p。特别地，wex L81A突变株显示了最大的L-色氨酸发酵产率的提高，且这些结果表明，用不同疏水性氨基酸取代Wex氨基酸序列第81位的亮氨酸可以显著增加Wex的L-色氨酸输出能力的活性。

实施例17：棒杆菌属微生物中Wex序列的第82个氨基酸(丝氨酸)被疏水性氨基酸取代

尝试通过用疏水性氨基酸取代Wex膜蛋白的氨基酸序列中的第82个氨基酸丝氨酸(下文称为第82位的丝氨酸)，以确认输出L-色氨酸的改进的效力。采用与实施例14中相同的方法，使用pDZTn-PgapA-wex作为模板进行了定点诱变，以产生为四种不同类型的疏水性氨基酸的突变。

另外，使用与实施例14中相同的方法，用不同的疏水性氨基酸(即，丙氨酸(A)(SEQID NO:110、SEQ ID NO:141)、缬氨酸(V)(SEQ ID NO:111、SEQ ID NO:142)、亮氨酸(L)(SEQID NO:112、SEQ ID NO:143)、和异亮氨酸(I)(SEQ ID NO:113、SEQ ID NO:144))中的每个取代Wex氨基酸序列的第82位的丝氨酸。用于获得pDZTn-PgapA-wex突变质粒的诱变引物组和突变形式与下表17中所示相同。

[表17]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列的第82位的氨基酸被分别突变

将如表17中所示制备的pDZTn-PgapA-wex S82A、pDZTn-PgapA-wex S82V、pDZTn-PgapA-wex S82L和pDZTn-PgapA-wex S82I载体通过电穿孔各自转化到CA04-8352菌株中，以及然后进行二次交换，以分别获得其中突变wex基因被插入染色体中的四种菌株。通过基因组测序和使用SEQ ID NO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

获得的突变株分别命名为CA04-8352(wex S82A)、CA04-8352(wex S82V)、CA04-8352(wex S82L)、和CA04-8352(wex S82I)。

为了确认CA04-8352、CA04-8405、CA04-8352(wex S82A)、CA04-8352(wex S82V)、CA04-8352(wex S82L)、和CA04-8352(wex S82I)菌株中色氨酸的生产量，通过与实施例10中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株中的L-色氨酸生产量。

[表18]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列第82位氨基酸被分别突变的突变株(CA04-8352(wex S82A)、CA04-8352(wex S82V)、CA04-8352(wex S82L)和CA04-8352(wex S82I))中L-色氨酸生产量

如表18的结果所示，与引入野生型Wex的CA04-8405菌株相比，其中Wex氨基酸序列第82位的氨基酸分别被不同的疏水性氨基酸取代的四种突变体全部显示发酵产率提高了1.40％p至2.76％p。特别地，wex S82A突变株显示了最大的L-色氨酸发酵产率的提高，且这些结果表明，用不同疏水性氨基酸取代Wex氨基酸序列第82位的丝氨酸可以显著增加Wex的L-色氨酸输出能力的活性。

实施例18：棒杆菌属微生物中Wex序列的第83个氨基酸(异亮氨酸)被疏水性氨基酸取代

尝试通过用不同的疏水性氨基酸取代Wex膜蛋白的氨基酸序列中的第83个氨基酸异亮氨酸(下文称为第83位的异亮氨酸)，以确认输出L-色氨酸的改进的效力。通过与实施例14中相同的方法，使用pDZTn-PgapA-wex作为模板进行了定点诱变，以产生为异亮氨酸以外的三种不同类型的疏水性氨基酸的突变。

另外，使用与实施例14相同的方法，用不同的疏水性氨基酸(即，丙氨酸(A)(SEQID NO:122、SEQ ID NO:145)、缬氨酸(V)(SEQ ID NO:123、SEQ ID NO:146)和亮氨酸(L)(SEQ ID NO:124、SEQ ID NO:147))中的每个取代Wex氨基酸序列的第83位的异亮氨酸。用于获得pDZTn-PgapA-wex突变质粒的诱变引物组和突变形式与下表19中所示相同。

[表19]用于制备引入到棒杆菌属的微生物中的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列的第83位的氨基酸被分别突变

将如表19中所示制备的pDZTn-PgapA-wex I83A、pDZTn-PgapA-wex I83V和pDZTn-PgapA-wex I83L载体通过电穿孔各自转化到CA04-8352菌株中，以及然后进行二次交换，以分别获得其中突变wex基因被插入到染色体中的三种菌株。通过基因组测序和使用SEQ IDNO:7和SEQ ID NO:8的引物的PCR方法，确认了相应的遗传操作，引物中的每个可以分别扩增插入相应基因的同源重组的上游区域和下游区域的外部区域。

获得的突变株分别命名为CA04-8352(wex I83A)、CA04-8352(wex I83V)和CA04-8352(wex I83L)。

为了确认CA04-8352、CA04-8405、CA04-8352(wex I83A)、CA04-8352(wex I83V)和CA04-8352(wex I83L)菌株中色氨酸的生产量，通过与实施例10中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株中的L-色氨酸生产量。

[表20]确认源自谷氨酸棒杆菌的生产L-色氨酸的菌株(CA04-8352)、其中插入L-色氨酸输出基因(wex)的菌株(CA04-8405)、以及其中Wex氨基酸序列的第83位的氨基酸被分别突变的突变株(CA04-8352(wex I83A)、CA04-8352(wex I83V)和CA04-8352(wexI83L))中L-色氨酸生产量

如表20的结果所示，与引入野生型Wex的CA04-8405菌株相比，其中Wex氨基酸序列第83位的氨基酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了1.73％p至2.36％p。特别地，wex I83L突变株显示了最大的L-色氨酸发酵产率的提高，且这些结果表明，用不同疏水性氨基酸取代Wex氨基酸序列第83位的异亮氨酸可以显著增加Wex的L-色氨酸输出能力的活性。通过上述实施例2至6所示的结果，确认了用不同疏水性氨基酸取代Wex膜蛋白氨基酸序列中第79位至第83位的氨基酸可以显著增加谷氨酸棒杆菌菌株中L-色氨酸输出能力的活性。

将其中引入了本公开的突变体wex的CA04-8352(wex L79I)、CA04-8352(wexS80V)、CA04-8352(wex L81V)、CA04-8352(wex S82V)和CA04-8352(wex I83L)菌株分别命名为CM05-9022、CM05-9023、CM05-9024、CM05-9025和CM05-9026。这些菌株于2019年3月29日根据布达佩斯条约的规定国际保藏于国际保存机构韩国微生物保藏中心(KCCM)，并指定了保藏号分别为KCCM12475P、KCCM12476P、KCCM12477P、KCCM12478P和KCCM12479P。

实施例19：埃希氏菌属微生物中Wex序列第79位的氨基酸(亮氨酸)被疏水性氨基酸取代

根据在上述实施例14至18中所示的棒杆菌属微生物中引入Wex突变而提高L-色氨酸输出能力活性的效果在埃希氏菌属微生物中再次得到确认。

与棒杆菌属微生物中一样，尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第79位的氨基酸(即，亮氨酸)，以确认输出L-色氨酸的改进的效力。使用实施例8中制备的pCL1920-PyccA-Hrh作为模板进行了定点诱变，以产生为除亮氨酸以外的三种不同类型的疏水性氨基酸的突变。通过以下方法进行了定点诱变。

[表21]定点诱变的PCR组成

[表22]定点诱变的PCR循环

为了用不同的疏水性氨基酸(即，丙氨酸(A)(SEQ ID NO:80、SEQ ID NO:131)、缬氨酸(V)(SEQ ID NO:81、SEQ ID NO:132)和异亮氨酸(I)(SEQ ID NO:82、SEQ ID NO:133))中的每个取代Wex氨基酸序列的第79位的氨基酸(即，亮氨酸)，如表21中所示，使用表23中表明的各诱变引物组制备了PCR混合物，并按照表22中所示的下列方法进行了PCR。PCR完成后，向其中加入了1μL的DpnI限制性酶，以及在37℃下处理了混合物1小时。将3μL用DpnI处理的DNA转化到DH5α感受态细胞中，以获得突变体pCL1920-PgapA-wex质粒，以及通过测序确认了表23中表明的每个突变。

[表23]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列的第79位的氨基酸被分别突变

将如表23中所示制备的pCL1920-PyccA-wex L79A、pCL1920-PyccA-wex L79V和pCL1920-PyccA-wex L79I载体通过电穿孔各自转化到CA04-4303菌株中，以及从而获得了其中在第79位氨基酸中引入了彼此不同的突变wex基因中的每个的三种菌株。所获得的突变株分别命名为CA04-4303(wex L79A)、CA04-4303(wex L79V)和CA04-4303(wex L79I)。

为了使用实施例12中制备的CA04-4303(pCL1920)和CA04-4306菌株作为对照组确认CA04-4303(wex L79A)、CA04-4303(wex L79V)和CA04-4303(wex L79I)菌株中的色氨酸生产量，通过与实施例12中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株中的L-色氨酸生产量。

[表24]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列第79位的氨基酸被分别突变的突变株(CA04-4303(wex L79A)、CA04-4303(wex L79V)、和CA04-4303(wexL79I))中L-色氨酸生产量

如表24的结果所示，与引入野生型Wex的CA04-4306菌株相比，其中Wex氨基酸序列第79位的氨基酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了0.6％p至1.5％p。特别地，与谷氨酸棒杆菌的生产L-色氨酸的菌株中一样，具有wex L79A突变的大肠杆菌菌株显示了最大的L-色氨酸的发酵产率的提高，且这些结果表明，用不同疏水性氨基酸取代Wex氨基酸序列第79位的亮氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌属微生物中的Wex的L-色氨酸输出能力的活性。

实施例20：埃希氏菌属微生物中Wex序列第80位的氨基酸(丝氨酸)被疏水性氨基酸取代

尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第80位的丝氨酸，以确认输出L-色氨酸的改进的效力。使用pCL1920-PyccA-wex作为模板，通过与实施例19相同的方法进行了定点诱变，以产生为四种不同类型的疏水性氨基酸的突变。

另外，使用与实施例19中相同的方法，用不同的疏水性氨基酸(即，丙氨酸(A)(SEQID NO:89、SEQ ID NO:134)、缬氨酸(V)(SEQ ID NO:90、SEQ ID NO:135)、亮氨酸(L)(SEQID NO:91、SEQ ID NO:136)和异亮氨酸(I)(SEQ ID NO:92、SEQ ID NO:137))中的每个取代Wex氨基酸序列的第80位的丝氨酸。用于获得突变pCL1920-PyccA-wex质粒的诱变引物组和突变形式与下表25中所示相同。

[表25]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列的第80位氨基酸被分别突变

将如表25中所示制备的pCL1920-PyccA-wex S80A、pCL1920-PyccA-wex S80V、pCL1920-PyccA-wex S80L和pCL1920-PyccA-wex S80I载体通过电穿孔各自转化到CA04-4303菌株中，以及从而获得了其中在第80位氨基酸中引入了彼此不同的突变wex基因中的每个的四种菌株。所获得的突变株分别命名为CA04-4303(wex S80A)、CA04-4303(wexS80V)、CA04-4303(wex S80L)和CA04-4303(wex S80I)。

为了确认CA04-4303(pCL1920)、CA04-4306、CA04-4303(wex S80A)、CA04-4303(wex S80V)、CA04-4303(wex S80L)和CA04-4303(wex S80I)菌株中色氨酸的生产量，使用与实施例12中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株中的L-色氨酸生产量。

[表26]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列的第80位的氨基酸被分别突变的突变株(CA04-4303(wex S80A)、CA04-4303(wex S80V)、CA04-4303(wexS80L)和CA04-4303(wex S80I))中L-色氨酸生产量

如表26的结果所示，与引入野生型Wex的CA04-4306菌株相比，其中Wex氨基酸序列第80位的氨基酸分别被不同的疏水性氨基酸取代的四种突变体全部显示发酵产率提高了0.3％p至1.2％p。特别地，与谷氨酸棒杆菌的生产L-色氨酸的菌株中一样，具有wex S80V突变的大肠杆菌菌株也显示了最大的L-色氨酸发酵产率的提高，且这些结果表明，用不同的疏水性氨基酸取代Wex氨基酸序列第80位的丝氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌属微生物中Wex的L-色氨酸输出能力的活性。

实施例21：埃希氏菌属微生物中Wex序列第81位的氨基酸(亮氨酸)被疏水性氨基酸取代

尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第81位的亮氨酸，以确认输出L-色氨酸的改进的效力。使用pCL1920-PyccA-wex作为模板，通过与实施例19中相同的方法进行了定点诱变，以产生为除亮氨酸以外的三种不同类型的疏水性氨基酸的突变。

另外，使用与实施例19中相同的方法，用不同的疏水性氨基酸(即，丙氨酸(A)(SEQID NO:101、SEQ ID NO:138)、缬氨酸(V)(SEQ ID NO:102、SEQ ID NO:139)和异亮氨酸(I)(SEQ ID NO:103、SEQ ID NO:140))中的每个取代Wex氨基酸序列的第81位的亮氨酸。用于获得突变pCL1920-PyccA-wex质粒的诱变引物组和突变形式与下表27中所示相同。

[表27]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列第81位氨基酸被分别突变

将如表27中所示制备的pCL1920-PyccA-wex L81A、pCL1920-PyccA-wex L81V和pCL1920-PyccA-wex L81I载体通过电穿孔各自转化到CA04-4303菌株中，以及从而获得了其中在第81位氨基酸中引入了彼此不同的突变wex基因中的每个的三种菌株。所获得的突变株分别命名为CA04-4303(wex L81A)、CA04-4303(wex L81V)和CA04-4303(wex L81I)。

为了确认CA04-4303(pCL1920)、CA04-4306、CA04-4303(wex L81A)、CA04-4303(wex L81V)和CA04-4303(wex L81I)菌株中色氨酸的生产量，通过与实施例12中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株的L-色氨酸生产量。

[表28]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列第81位的氨基酸被分别突变的突变株(CA04-4303(wex L81A)、CA04-4303(wex L81V)和CA04-4303(wexL81I))中L-色氨酸生产量

如表28的结果所示，与引入野生型Wex的CA04-4306菌株相比，其中Wex氨基酸序列第81位的氨基酸分别被不同的疏水性氨基酸取代的三种突变体全部显示发酵产率提高了1.0％p至1.8％p。特别地，与谷氨酸棒杆菌的生产L-色氨酸的菌株中一样，具有wex L81A突变的大肠杆菌菌株也显示了最大的L-色氨酸发酵产率的提高，且这些结果表明，用不同的疏水性氨基酸取代Wex氨基酸序列第81位的亮氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌属微生物中Wex的L-色氨酸输出能力的活性。

实施例22：埃希氏菌属微生物中Wex序列第82位的氨基酸(丝氨酸)被疏水性氨基酸取代

尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第82位的氨基酸(即丝氨酸)，以确认输出L-色氨酸的改进的效力。使用pCL1920-PyccA-wex作为模板，通过与实施例19中相同的方法进行了定点诱变，以产生为四种不同类型的疏水性氨基酸的突变。

另外，使用与实施例19中相同的方法，用不同的疏水性氨基酸(即，丙氨酸(A)(SEQID NO:110、SEQ ID NO:141)、缬氨酸(V)(SEQ ID NO:111、SEQ ID NO:142)、亮氨酸(L)(SEQID NO:112、SEQ ID NO:143)和异亮氨酸(I)(SEQ ID NO:113、SEQ ID NO:144))中的每个取代Wex氨基酸序列的第82位的丝氨酸。用于获得突变pCL1920-PyccA-wex质粒的诱变引物组和突变形式与下表29中所示相同。

[表29]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列第82位氨基酸被分别突变

将如表29中所示制备的pCL1920-PyccA-wex S82A、pCL1920-PyccA-wex S82V、pCL1920-PyccA-wex S82L和pCL1920-PyccA-wex S82I载体通过电穿孔各自转化到CA04-4303菌株中，以及从而获得了其中在第82位氨基酸中引入了彼此不同的突变wex基因中的每个的四种菌株。所获得的突变株分别命名为CA04-4303(wex S82A)、CA04-4303(wexS82V)、CA04-4303(wex S82L)和CA04-4303(wex S82I)。

为了确认CA04-4303(pCL1920)、CA04-4306、CA04-4303(wex S82A)、CA04-4303(wex S82V)、CA04-4303(wex S82L)和CA04-4303(wex S82I)菌株中色氨酸的生产量，通过与实施例12中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株中的L-色氨酸生产量。

[表30]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列第82位的氨基酸被分别突变的突变株(CA04-4303(wex S82A)、CA04-4303(wex S82V)、CA04-4303(wexS82L)和CA04-4303(wex S82I))中L-色氨酸生产量

如表30的结果所示，与引入野生型Wex的CA04-4306菌株相比，其中Wex氨基酸序列第82位的氨基酸分别被不同的疏水性氨基酸取代的四种突变体全部显示发酵产率提高了0.2％p至1.4％p。与谷氨酸棒杆菌的生产L-色氨酸的菌株不同，具有wex S82V突变的大肠杆菌菌株显示了最大的L-色氨酸发酵产率的提高，且这些结果表明，用不同疏水性氨基酸取代Wex氨基酸序列第82位的丝氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌微生物中的Wex的L-色氨酸输出能力的活性。

实施例23：埃希氏菌属微生物中Wex序列第83位的氨基酸(异亮氨酸)被疏水性氨基酸取代

尝试在埃希氏菌属微生物中通过用不同的疏水性氨基酸取代Wex膜蛋白氨基酸序列中第83位的氨基酸(即，异亮氨酸)，以确认输出L-色氨酸的改进的效力。使用pCL1920-PyccA-wex作为模板，通过与实施例19中相同的方法进行定点诱变，以产生为异亮氨酸以外的三种疏水性氨基酸的突变。

另外，使用与实施例19中相同的方法，用不同的疏水性氨基酸(即，丙氨酸(A)(SEQID NO:122、SEQ ID NO:145)、缬氨酸(V)(SEQ ID NO:123、SEQ ID NO:146)、和亮氨酸(L)(SEQ ID NO:124、SEQ ID NO:147))中的每个取代Wex氨基酸序列的第83位的氨基酸(即，异亮氨酸)。用于获得突变pCL1920-PyccA-wex质粒的诱变引物组和突变形式与下表31中所示相同。

[表31]用于制备在埃希氏菌属微生物中表达的突变质粒的诱变引物组，该突变质粒中Wex氨基酸序列的第83位的氨基酸被分别突变

将如表31中所示制备的pCL1920-PyccA-wex I83A、pCL1920-PyccA-wex I83V和pCL1920-PyccA-wex I83L载体通过电穿孔各自转化到CA04-4303菌株中，以及从而获得了其中在第83位氨基酸中引入了彼此不同的突变wex基因中的每个的三种菌株。所获得的突变株分别命名为CA04-4303(wex I83A)、CA04-4303(wex I83V)和CA04-4303(wex I83L)。

为了确认CA04-4303(pCL1920)、CA04-4306、CA04-4303(wex I83A)、CA04-4303(wex I83V)和CA04-4303(wex I83L)菌株中色氨酸的生产量，用与实施例12中相同的方法培养了这些菌株。培养完成后，通过HPLC测定了每种菌株中的L-色氨酸生产量。

[表32]确认源自大肠杆菌的生产L-色氨酸的菌株(CA04-4303(pCL1920))、其中表达L-色氨酸输出基因(wex)的菌株(CA04-4306)、以及其中Wex氨基酸序列第83位的氨基酸被分别突变的突变株(CA04-4303(wex I83A)、CA04-4303(wex I83V)和CA04-4303(wexI83L))中的L-色氨酸生产量

如表32的结果所示，与引入野生型Wex的CA04-4306菌株相比，其中Wex氨基酸序列第83位的氨基酸分别被不同的疏水性氨基酸取代的三种突变株全部显示发酵产率提高了0.2％p至0.7％p。特别地，与谷氨酸棒杆菌的生产L-色氨酸的菌株中一样，具有wex I83L突变的大肠杆菌菌株也显示了最大的L-色氨酸发酵产率的提高，且这些结果表明，用不同的疏水性氨基酸取代Wex氨基酸序列第83位的异亮氨酸可以显著增加埃希氏菌属微生物中以及棒杆菌属微生物中的Wex的L-色氨酸输出能力的活性。

根据以上所述，本公开所属领域的技术人员将能够理解，本公开可以在不修改本公开的技术概念或必要特征的情况下，以其它具体形式呈现。就这一点而言，本文公开的示例性实施方式仅用于说明性目的，而不应被解释为限制本公开的范围。本公开的范围应被解释为包括以下权利要求的含义和范围以及从其等同概念导出的所有改变或修改的形式，而不是以上详细描述。

<110> CJ第一制糖株式会社

<120> 新型L-色氨酸输出蛋白变体及使用其生产L-色氨酸的方法

<130> OPA19299

<150> KR 10-2019-0040397

<151> 2019-04-05

<160> 147

<170> KoPatentIn 3.0

<210> 1

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex AA 序列

<400> 1

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 2

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex NT 序列

<400> 2

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 3

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> wex - 1

<400> 3

tagaggagac acaacatgaa tagcaagaag gccac 35

<210> 4

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> wex - 2

<400> 4

ggctcttcct gtttagtcta caaacagtcc gccac 35

<210> 5

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PgapA(-wex) - 1

<400> 5

cccttccggt ttagtttgaa gccagtgtga gttgc 35

<210> 6

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> PgapA(-wex) - 2

<400> 6

cttcttgcta ttcatgttgt gtctcctcta aagattgta 39

<210> 7

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 确认_PgapA-wex - 1

<400> 7

cggattatgc caatgatgtg 20

<210> 8

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 确认_PgapA-wex - 2

<400> 8

cacgatcacc aacattcagg 20

<210> 9

<211> 314

<212> PRT

<213> 人工序列

<220>

<223> Pst AA 序列

<400> 9

Met Lys Asn Gln Arg Lys Ala Thr Leu Ile Gly Leu Val Ala Ile Val

1 5 10 15

Leu Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu Ser Leu

20 25 30

Gly Ala Thr Gly Gly Ala Val Met Met Tyr Ser Val Ala Ser Val Met

35 40 45

Leu Leu Phe Thr Val Gly Phe Pro Arg Ile Arg Glu Phe Pro Arg Arg

50 55 60

Tyr Leu Val Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu

65 70 75 80

Ala Leu Ser Ile Gly Tyr Ala Asn Ser Ser Arg Gln Ala Ile Glu Val

85 90 95

Gly Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Ile Leu Ala Ala Ile

100 105 110

Leu Phe Asn Arg Gln Gln Ala Asn Leu Leu Ile Val Pro Gly Phe Leu

115 120 125

Ile Ala Ile Leu Gly Ile Cys Trp Val Leu Gly Gly Glu Gln Gly Leu

130 135 140

Asp Leu Ser Gly Met Thr Ala Asn Ile Arg Asp Asn Pro Leu Ser Tyr

145 150 155 160

Gly Leu Ala Phe Ala Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val

165 170 175

Thr Thr Arg Ile Ala Gly Gly Lys Asn Gly Val Thr Leu Phe Phe Met

180 185 190

Leu Thr Ala Leu Ala Leu Trp Ala Lys Tyr Leu Ala Ile Gly Gly Glu

195 200 205

Thr Met Glu Phe Ser Tyr His Ala Leu Ile Tyr Leu Val Leu Ala Ala

210 215 220

Ser Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His

225 230 235 240

Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Leu

245 250 255

Ser Ala Ala Leu Ala Ala Val Leu Leu Arg Thr Pro Leu Ser Leu Ser

260 265 270

Phe Trp Gln Gly Ala Ala Met Val Cys Ile Gly Ser Ile Leu Cys Trp

275 280 285

Phe Ala Thr Arg Ala Lys Pro Pro Glu Ser Ala Gln Ser Gly Asp Gln

290 295 300

Ala Ser Ala Thr Thr Pro Arg Arg Asn Gly

305 310

<210> 10

<211> 945

<212> DNA

<213> 人工序列

<220>

<223> Pst NT 序列

<400> 10

atgaaaaacc agcgtaaagc gaccctcatc gggctcgttg caattgtctt gtggagctcg 60

atcgtcggcc tgatccgggg cgtcagcgag agcctcggcg cgaccggtgg tgccgtcatg 120

atgtacagcg tcgcatcggt aatgctgttg ttcacggtcg gctttccgcg gatacgggag 180

ttcccccgac gctatcttgt ctggggcagc ctgctgttcg tctcgtacga gctgtgcctt 240

gccctgtcca tcggctacgc caacagcagc cgacaggcca tcgaggtcgg catggtcaat 300

tacctgtggc cggccttcac gatcctggcg gcgatcctgt tcaacaggca gcaggccaac 360

ctgctcatcg ttcccggctt cctcatcgcg atcctcggga tctgctgggt gctcggcggg 420

gaacaggggc tggacctgtc cgggatgacg gcgaacatcc gcgacaatcc cctcagctac 480

gggctggcct tcgccggcgc ggtgatctgg gcggcatact gcacggtgac cacgcggatc 540

gccggcggca agaacggtgt cacgctgttc ttcatgctga cggcattggc gctatgggcc 600

aagtacctgg ccatcggcgg ggaaacgatg gaattcagct accacgcgct gatctacctg 660

gtgctggccg cctccgcgat gggcttcggc tatgcggcgt ggaacgtcgg catcctgcac 720

ggcaatgtca ccgtcctcgc tggtgcttcg tatttcatcc cggtgctgtc cgccgccctg 780

gcggccgtac tgttgcgtac gccgctgtcg ctgtcgttct ggcagggtgc cgccatggtc 840

tgcatcgggt cgatcctctg ctggttcgcc acccgtgcga aaccgccaga atcggcgcag 900

tcgggtgacc aggccagcgc aaccacgccg cgtcgaaacg gataa 945

<210> 11

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pst-1

<400> 11

tagaggagac acaacatgaa aaaccagcgt aaagc 35

<210> 12

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pst-2

<400> 12

ggctcttcct gtttagttta tccgtttcga cgcgg 35

<210> 13

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> PgapA(-Pst)-2

<400> 13

acgctggttt ttcatgttgt gtctcctcta aagattgta 39

<210> 14

<211> 303

<212> PRT

<213> 人工序列

<220>

<223> Afa AA 序列

<400> 14

Met Lys Gln Ser Asp Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Val

1 5 10 15

Leu Trp Ser Thr Ile Val Gly Leu Ile Arg Ser Val Ser Asp Ser Leu

20 25 30

Gly Val Thr Gly Gly Ala Ala Leu Ile Tyr Thr Leu Ala Ser Val Phe

35 40 45

Leu Leu Leu Ser Val Gly Trp Val Arg Leu Arg Asp Phe Pro Arg Arg

50 55 60

Tyr Leu Ile Trp Gly Ser Val Leu Phe Val Cys Tyr Glu Leu Cys Leu

65 70 75 80

Ala Leu Ser Ile Gly Tyr Ala His Asn Ser Gln Gln Ala Ile Glu Val

85 90 95

Gly Met Val Asn Tyr Leu Trp Pro Thr Phe Thr Ile Val Ala Ala Ile

100 105 110

Leu Phe Asn Lys Gln Lys Ala Asn Gly Leu Leu Ala Pro Gly Leu Leu

115 120 125

Leu Ser Met Met Gly Ile Ser Trp Ile Leu Gly Gly Glu Gln Gly Leu

130 135 140

Ser Leu His Asn Ile Trp Leu Asn Val Gln Asp Asn Pro Leu Ser Tyr

145 150 155 160

Gly Leu Ala Phe Ser Gly Ala Leu Ile Trp Ala Gly Tyr Ser Thr Met

165 170 175

Thr Ala Arg Ile Ala Gln Gly Lys Asn Gly Ile Thr Leu Phe Phe Met

180 185 190

Leu Thr Ala Ala Ala Leu Trp Val Lys Tyr Leu Val Gln Gly Ala Pro

195 200 205

Ala Met Thr Phe Thr Val Pro Ala Leu Val Tyr Leu Leu Leu Ala Ala

210 215 220

Met Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His

225 230 235 240

Gly Asn Val Thr Ile Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Phe

245 250 255

Ser Ala Ala Leu Ser Thr Val Leu Leu Gln Ala Pro Leu Thr Leu Thr

260 265 270

Phe Trp Gln Gly Ser Ser Met Val Cys Leu Gly Ala Leu Leu Cys Trp

275 280 285

Leu Ala Ile Arg Val Arg Lys Pro Arg Ser Leu Lys Ser Ala Ala

290 295 300

<210> 15

<211> 912

<212> DNA

<213> 人工序列

<220>

<223> Afa NT 序列

<400> 15

atgaagcaat ctgataaggc aaccctgatc gggctgatcg ccattgtcct ttggagcacg 60

attgtcggcc tgatacgcag cgtcagcgac tctctgggcg taaccggcgg cgctgccctg 120

atttacaccc tggcctcggt ctttcttctt ttatcagtgg gctgggtacg cttgcgcgac 180

ttcccgcgtc gctacctgat ctggggcagt gtgctgtttg tctgctatga actctgcctg 240

gccctgtcca tcggctatgc ccacaacagc cagcaggcaa ttgaagtggg gatggtcaac 300

tatctgtggc cgacctttac cattgtggcc gccatcttgt tcaataagca aaaagccaat 360

gggctgcttg cacccggcct gctcttgtcc atgatgggaa tcagctggat tctgggcggc 420

gagcaaggct tgagcctgca caacatctgg ctgaatgtgc aggacaatcc cttgagctac 480

ggcctggcct ttagcggcgc gctgatctgg gccggctaca gcaccatgac cgcccgcatc 540

gcccagggca aaaatggcat caccctgttt ttcatgctga cggcagcggc cttgtgggtg 600

aagtacctgg tccaaggtgc tcctgccatg acgtttacgg ttcccgcctt ggtgtatttg 660

ctgctggcgg ccatggcgat gggctttggc tatgccgcct ggaatgtcgg tattttgcat 720

ggcaatgtca ccatcctggc cggcgcttcc tactttattc cggtattttc agccgccctg 780

tccaccgttt tgctgcaagc tccgttgacg ctgaccttct ggcaaggctc gtccatggtg 840

tgtttgggtg ccctgctatg ctggctggcc atccgggttc gcaaaccccg gtcactaaaa 900

agcgctgcct ga 912

<210> 16

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Afa-1

<400> 16

tagaggagac acaacatgaa gcaatctgat aaggc 35

<210> 17

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Afa-2

<400> 17

gctcttcctg tttagttcag gcagcgcttt ttagt 35

<210> 18

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> PgapA(-Afa)-2

<400> 18

atcagattgc ttcatgttgt gtctcctcta aagattgta 39

<210> 19

<211> 314

<212> PRT

<213> 人工序列

<220>

<223> Cne AA 序列

<400> 19

Met Gln Ser Lys Ser Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Leu

1 5 10 15

Leu Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu Asn Leu

20 25 30

Gly Ala Thr Gly Gly Ala Ala Met Ile Tyr Thr Val Ala Ser Ala Leu

35 40 45

Leu Leu Leu Thr Val Gly Phe Val Arg Met Gln Asp Phe Pro Arg Arg

50 55 60

Tyr Leu Val Trp Gly Ser Ile Leu Phe Val Ser Tyr Glu Leu Cys Leu

65 70 75 80

Ser Leu Ser Ile Gly Tyr Ala Asn Ser Ser Arg Gln Ala Ile Glu Val

85 90 95

Gly Met Val Asn Tyr Leu Trp Pro Ser Phe Thr Met Leu Cys Ala Ile

100 105 110

Ala Phe Asn Lys Gln Lys Ala Asn Leu Leu Ile Ile Pro Gly Phe Leu

115 120 125

Ile Ala Ile Leu Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu

130 135 140

Asp Phe Ala Gly Met Ala Glu Asn Ile Gln Asp Asn Pro Leu Ser Tyr

145 150 155 160

Gly Leu Ala Phe Leu Gly Ala Leu Ile Trp Ala Ala Tyr Cys Thr Val

165 170 175

Thr Asn Arg Ile Ala Glu Gly Arg Asn Gly Ile Thr Leu Phe Phe Met

180 185 190

Leu Thr Ala Leu Ala Leu Trp Ile Lys Tyr Phe Ala Thr Glu Ser Gly

195 200 205

Ser Met Glu Phe Ser Tyr Gln Ala Val Ile Tyr Leu Ala Leu Ala Ala

210 215 220

Ser Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His

225 230 235 240

Gly Asn Val Thr Val Leu Ala Gly Ala Ser Tyr Phe Ile Pro Val Leu

245 250 255

Ser Ala Ala Leu Ala Ala Met Leu Leu Arg Thr Pro Leu Ser Ile Ala

260 265 270

Phe Trp Lys Gly Ala Ser Met Val Cys Ala Gly Ser Ile Leu Cys Trp

275 280 285

Leu Ala Thr Arg Gly Gln Arg Ser Lys Ala Pro Pro Leu Pro Glu Leu

290 295 300

Pro Gln Ser Arg Glu Arg Val Gln Glu Pro

305 310

<210> 20

<211> 945

<212> DNA

<213> 人工序列

<220>

<223> Cne NT 序列

<400> 20

atgcaaagca agagcaaagc aactctcatc gggctcatcg cgattctgtt atggagctcg 60

attgtcggcc tgattcgcgg tgtcagcgaa aaccttgggg caaccggtgg ggcggcaatg 120

atctataccg tcgcctcggc cctgctcttg ctgacagtcg gtttcgtcag aatgcaggat 180

tttccccggc gctatctggt ttggggaagc attctgttcg tttcgtacga gctgtgtctt 240

tccttgtcca ttggctacgc caacagcagc aggcaagcca ttgaggtggg gatggtcaac 300

tacttgtggc cgagcttcac catgctgtgt gccatcgcat tcaacaagca gaaggccaac 360

ttgctgatca ttcccggctt cctgatcgcc attctcggga tctgctgggt gcttggcggg 420

gatcagggcc tggacttcgc cgggatggcg gagaacatcc aggacaatcc gctcagctat 480

gggctggcct tccttggtgc cctgatctgg gcggcgtatt gcactgtgac caaccggatt 540

gccgaaggca ggaatggcat cacgctgttc ttcatgctga cagcgctggc gttgtggatc 600

aagtatttcg ccacagagag cgggtcgatg gaatttagct atcaggcagt gatttatctt 660

gcgttggccg cctctgcgat gggattcggc tatgcggcct ggaatgttgg catcctgcat 720

ggcaatgtca ccgtccttgc cggcgcttcc tacttcattc cggtactttc cgccgccctg 780

gcggccatgc tcttgcgtac acccctgtcg atcgccttct ggaagggcgc atccatggta 840

tgtgcggggt cgatcctctg ttggctggca acacgtgggc aacgttccaa ggcacctccg 900

ttgccggaat taccgcagtc gcgcgaacgt gtccaggaac cgtga 945

<210> 21

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Cne-1

<400> 21

tagaggagac acaacatgca aagcaagagc aaagc 35

<210> 22

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Cne-2

<400> 22

ggctcttcct gtttagttca cggttcctgg acacg 35

<210> 23

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> PgapA(-Cne)-2

<400> 23

gctcttgctt tgcatgttgt gtctcctcta aagattgta 39

<210> 24

<211> 293

<212> PRT

<213> 人工序列

<220>

<223> Eco AA 序列

<400> 24

Met Thr Arg Gln Lys Ala Thr Leu Ile Gly Leu Ile Ala Ile Val Leu

1 5 10 15

Trp Ser Thr Met Val Gly Leu Ile Arg Gly Val Ser Glu Gly Leu Gly

20 25 30

Pro Val Gly Gly Ala Ala Ala Ile Tyr Ser Leu Ser Gly Leu Leu Leu

35 40 45

Ile Phe Thr Val Gly Phe Pro Arg Ile Arg Gln Ile Pro Lys Gly Tyr

50 55 60

Leu Leu Ala Gly Ser Leu Leu Phe Val Ser Tyr Glu Ile Cys Leu Ala

65 70 75 80

Leu Ser Leu Gly Tyr Ala Ala Thr His His Gln Ala Ile Glu Val Gly

85 90 95

Met Val Asn Tyr Leu Trp Pro Ser Leu Thr Ile Leu Phe Ala Ile Leu

100 105 110

Phe Asn Gly Gln Lys Thr Asn Trp Leu Ile Val Pro Gly Leu Leu Leu

115 120 125

Ala Leu Val Gly Val Cys Trp Val Leu Gly Gly Asp Asn Gly Leu His

130 135 140

Tyr Asp Glu Ile Ile Asn Asn Ile Thr Thr Ser Pro Leu Ser Tyr Phe

145 150 155 160

Leu Ala Phe Ile Gly Ala Phe Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Asn Lys Tyr Ala Arg Gly Phe Asn Gly Ile Thr Val Phe Val Leu Leu

180 185 190

Thr Gly Ala Ser Leu Trp Val Tyr Tyr Phe Leu Thr Pro Gln Pro Glu

195 200 205

Met Ile Phe Ser Thr Pro Val Met Ile Lys Leu Ile Ser Ala Ala Phe

210 215 220

Thr Leu Gly Phe Ala Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Ile Met Ala Val Gly Ser Tyr Phe Thr Pro Val Leu Ser

245 250 255

Ser Ala Leu Ala Ala Val Leu Leu Ser Ala Pro Leu Ser Phe Ser Phe

260 265 270

Trp Gln Gly Ala Leu Met Val Cys Gly Gly Ser Leu Leu Cys Trp Leu

275 280 285

Ala Thr Arg Arg Gly

290

<210> 25

<211> 882

<212> DNA

<213> 人工序列

<220>

<223> Eco NT 序列

<400> 25

atgacacgac aaaaagcaac gctcataggg ctgatagcga tcgtcctgtg gagcacgatg 60

gtaggattga ttcgcggtgt cagtgagggg ctcggcccgg tcggcggcgc agctgctatc 120

tattcattaa gcgggctgct gttaatcttc acggttggat ttccgcgtat tcggcaaatc 180

ccgaaaggct atttactcgc cgggagtctg ttattcgtca gctatgaaat ctgtctggcg 240

ctttccttag ggtatgcggc gacccatcat caggcgattg aagtgggtat ggtgaactat 300

ctgtggccca gcctgacaat tctctttgcc attctgttta atggtcagaa aaccaactgg 360

ttgattgtac ctggattatt attagccctc gtcggcgtct gttgggtgtt aggcggtgac 420

aatgggttac attatgatga aatcatcaat aatatcacca ccagcccatt gagttatttc 480

ctggcgttca ttggtgcgtt tatctgggca gcctattgca cagtaacgaa taaatacgca 540

cgcggattta atggaattac cgtttttgtc ctgctaacgg gagcaagtct gtgggtttac 600

tattttctta cgccacaacc agaaatgata tttagcacgc ccgtcatgat taaactcatc 660

tctgcggcat ttaccttagg atttgcttat gctgcatgga atgtcggtat attgcatggc 720

aatgtcacca ttatggcggt aggttcgtat tttacgcctg tactttcctc agcgcttgca 780

gccgtgctgc tcagcgcccc gctgtcgttc tcgttctggc aaggcgcgct gatggtctgc 840

ggcggttccc tgctctgctg gctggcgaca cgtcgtggtt aa 882

<210> 26

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Eco-1

<400> 26

tagaggagac acaacatgac acgacaaaaa gcaac 35

<210> 27

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Eco-2

<400> 27

gctcttcctg tttagtttaa ccacgacgtg tcgcc 35

<210> 28

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> PgapA(-Eco)-2

<400> 28

tttttgtcgt gtcatgttgt gtctcctcta aagattg 37

<210> 29

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Hrh-3

<400> 29

atagagagtg actcaatgaa tagcaagaag gccac 35

<210> 30

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> Hrh-4

<400> 30

tcgagctcgg tacccctaca aacagtccgc cac 33

<210> 31

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> PyccA - 1

<400> 31

ctctagagga tccccttcca gatcaaatgc gtaa 34

<210> 32

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PyccA(-Hrh)-2

<400> 32

cttcttgcta ttcattgagt cactctctat gacag 35

<210> 33

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pst-3

<400> 33

atagagagtg actcaatgaa aaaccagcgt aaagc 35

<210> 34

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> Pst-4

<400> 34

tcgagctcgg tacccttatc cgtttcgacg cgg 33

<210> 35

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PyccA(-Pst)-2

<400> 35

acgctggttt ttcattgagt cactctctat gacag 35

<210> 36

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Afa-3

<400> 36

atagagagtg actcaatgaa gcaatctgat aaggc 35

<210> 37

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> Afa-4

<400> 37

tcgagctcgg taccctcagg cagcgctttt tagt 34

<210> 38

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PyccA(-Afa)-2

<400> 38

atcagattgc ttcattgagt cactctctat gacag 35

<210> 39

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Cne-3

<400> 39

atagagagtg actcaatgca aagcaagagc aaagc 35

<210> 40

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> Cne-4

<400> 40

tcgagctcgg taccctcacg gttcctggac acg 33

<210> 41

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PyccA(-Cne)-2

<400> 41

gctcttgctt tgcattgagt cactctctat gacag 35

<210> 42

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Eco-3

<400> 42

atagagagtg actcaatgac acgacaaaaa gcaac 35

<210> 43

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> Eco-4

<400> 43

tcgagctcgg tacccttaac cacgacgtgt cgcc 34

<210> 44

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> PyccA(-Eco)-2

<400> 44

tttttgtcgt gtcattgagt cactctctat gacag 35

<210> 45

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pspl7-trpE(S38R)_L-1

<400> 45

tcgagctcgg tacccaaaca actgcgacgt gtgtc 35

<210> 46

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pspl7-trpE(S38R)_L-2

<400> 46

catgaagcgc cggtacctta atcatttttg ggttc 35

<210> 47

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pspl7-trpE(S38R)_R-1

<400> 47

gccctgttgg aacgcgctga tatcaccacc aagaa 35

<210> 48

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pspl7-trpE(S38R)_R-2

<400> 48

ctctagagga tccccagatg tcaccgttgt aaatg 35

<210> 49

<211> 294

<212> DNA

<213> 人工序列

<220>

<223> spl7 启动子序列

<400> 49

ggcgcttcat gtcaacaatc tttaacgttt tcaagttcac aagtcgtgtt caaatggtga 60

caagattgga cactgtgctg aattggcacc aagccctcat aaatgataga tctaaatcga 120

atatcaatat atggtctgtt tattggaacg cgtcccagtg gctgagacgc atccgctaaa 180

gccccaggaa ccctgtgcag aaagaacaaa taatcgtgaa ttttggcagc aacagcaatt 240

cctgctacaa ttgaaaacgt gcaaaagcat agattattgg aggagatcaa aaca 294

<210> 50

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pspl7 - 1

<400> 50

cccaaaaatg attaaggtac cggcgcttca tgtca 35

<210> 51

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> Pspl7 - 2

<400> 51

gggattcgtg ctcatgatat ctgttttgat ctcctcc 37

<210> 52

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> trpE (S38R) - 1

<400> 52

atcaaaacag atatcatgag cacgaatccc catgt 35

<210> 53

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> trpE (S38R) - 2

<400> 53

gtggtgatat cagcgcgttc caacagggct gcatc 35

<210> 54

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 确认_Pspl7-trpE(S38R) - 1

<400> 54

gaagaagagg ctgcagatg 19

<210> 55

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 确认_Pspl7-trpE(S38R) - 2

<400> 55

gatcagcgcc atcatgtt 18

<210> 56

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pn-tkt_L - 1

<400> 56

tcgagctcgg tacccaaact ttgagtgggt gcgtg 35

<210> 57

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pn-tkt_L - 2

<400> 57

tcgagctacg agggcggttc ccagcccttc attag 35

<210> 58

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pn-tkt_R - 1

<400> 58

attaacggtt aattgattct ggacgtcatg actac 35

<210> 59

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pn-tkt_R - 2

<400> 59

ctctagagga tccccgcctc gatgatgcag tcgtc 35

<210> 60

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> Pn-tkt - 1

<400> 60

gaagggctgg gaaccgccct cgtagctcga gagtt 35

<210> 61

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> Pn-tkt - 2

<400> 61

catgacgtcc agaatcaatt aaccgttaat ggagtcc 37

<210> 62

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 确认_Pn-tkt - 1

<400> 62

acccagaacc ccaaattttc 20

<210> 63

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 确认_Pn-tkt - 2

<400> 63

ttgagttcga caactttgg 19

<210> 64

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 64

tgcaatgcat aacaacgcag tcgcactatt tttcactgga gagaagccct gtgtaggctg 60

gagctgcttc 70

<210> 65

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 65

tgcaatgcat aacaacgcag tcgcactatt tttcactgga gagaagccct gtccatatga 60

atatcctcct 70

<210> 66

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 66

gggcaggatc tcctgtcatc 20

<210> 67

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 67

aaatgtcgga taaggcaccg 20

<210> 68

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 68

tgtaatattc acagggatca ctgtaattaa aataaatgaa ggattatgta gtgtaggctg 60

gagctgcttc 70

<210> 69

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 69

tgtagggtaa gagagtggct aacatcctta tagccactct gtagtattaa gtccatatga 60

atatcctcct 70

<210> 70

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 70

acatccttat agccactctg 20

<210> 71

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 71

tacaaccggg ggaggcattt tgcttccccc gctaacaatg gcgacatatt gtgtaggctg 60

gagctgcttc 70

<210> 72

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 72

gcattcggtg cacgatgcct gatgcgccac gtcttatcag gcctacaaaa gtccatatga 60

atatcctcct 70

<210> 73

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物

<400> 73

aggacggata aggcgttcac 20

<210> 74

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> trpE - 1

<400> 74

gaattcatgc aaacacaaaa accgac 26

<210> 75

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> trpE - 2

<400> 75

gaattctcag aaagtctcct gtgca 25

<210> 76

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> trpE(P21S) - 1

<400> 76

cgcttatcgc gacaattcca ccgcgctttt tcaccag 37

<210> 77

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> trpE(P21S) - 2

<400> 77

ctggtgaaaa agcgcggtgg aattgtcgcg ataagcg 37

<210> 78

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex-1)

<400> 78

actctagagg atccccttcc agatcaaatg cgtaa 35

<210> 79

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex-2)

<400> 79

attcgagctc ggtaccccta caaacagtcc gccac 35

<210> 80

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(L79A)

<400> 80

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcgcatcg 240

ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 81

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(L79V)

<400> 81

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcgtgtcg 240

ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 82

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(L79I)

<400> 82

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcatctcg 240

ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 83

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L79A-1)

<400> 83

gtgtcctacg aactctgcgc atcgctctcc atcggttatg 40

<210> 84

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L79A-2)

<400> 84

cataaccgat ggagagcgat gcgcagagtt cgtaggacac 40

<210> 85

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L79V-1)

<400> 85

gtgtcctacg aactctgcgt gtcgctctcc atcggttatg 40

<210> 86

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L79V-2)

<400> 86

cataaccgat ggagagcgac acgcagagtt cgtaggacac 40

<210> 87

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L79I-1)

<400> 87

gtgtcctacg aactctgcat ctcgctctcc atcggttatg 40

<210> 88

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L79I-2)

<400> 88

cataaccgat ggagagcgag atgcagagtt cgtaggacac 40

<210> 89

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(S80A)

<400> 89

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctggca 240

ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 90

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(S80V)

<400> 90

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctggtg 240

ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 91

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(S80L)

<400> 91

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgctg 240

ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 92

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(S80I)

<400> 92

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgatc 240

ctctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 93

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S80A-1)

<400> 93

gtcctacgaa ctctgcctgg cactctccat cggttatgcc 40

<210> 94

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S80A-2)

<400> 94

ggcataaccg atggagagtg ccaggcagag ttcgtaggac 40

<210> 95

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S80V-1)

<400> 95

gtcctacgaa ctctgcctgg tgctctccat cggttatgcc 40

<210> 96

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S80V-2)

<400> 96

ggcataaccg atggagagca ccaggcagag ttcgtaggac 40

<210> 97

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S80L-1)

<400> 97

gtcctacgaa ctctgcctgc tgctctccat cggttatgcc 40

<210> 98

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S80L-2)

<400> 98

ggcataaccg atggagagca gcaggcagag ttcgtaggac 40

<210> 99

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S80I-1)

<400> 99

gtcctacgaa ctctgcctga tcctctccat cggttatgcc 40

<210> 100

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S80I-2)

<400> 100

ggcataaccg atggagagga tcaggcagag ttcgtaggac 40

<210> 101

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(L81A)

<400> 101

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

gcatccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 102

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(L81V)

<400> 102

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

gtgtccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 103

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(L81I)

<400> 103

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

atctccatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 104

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L81A-1)

<400> 104

cctacgaact ctgcctgtcg gcatccatcg gttatgccaa tac 43

<210> 105

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L81A-2)

<400> 105

gtattggcat aaccgatgga tgccgacagg cagagttcgt agg 43

<210> 106

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L81V-1)

<400> 106

cctacgaact ctgcctgtcg gtgtccatcg gttatgccaa tac 43

<210> 107

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L81V-2)

<400> 107

gtattggcat aaccgatgga caccgacagg cagagttcgt agg 43

<210> 108

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L81I-1)

<400> 108

cctacgaact ctgcctgtcg atctccatcg gttatgccaa tac 43

<210> 109

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex L81I-2)

<400> 109

gtattggcat aaccgatgga gatcgacagg cagagttcgt agg 43

<210> 110

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(S82A)

<400> 110

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

ctcgcaatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 111

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(S82V)

<400> 111

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

ctcgtgatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 112

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(S82L)

<400> 112

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

ctcctgatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 113

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(S82I)

<400> 113

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

ctcatcatcg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 114

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S82A-1)

<400> 114

cgaactctgc ctgtcgctcg caatcggtta tgccaataca g 41

<210> 115

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S82A-2)

<400> 115

ctgtattggc ataaccgatt gcgagcgaca ggcagagttc g 41

<210> 116

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S82V-1)

<400> 116

cgaactctgc ctgtcgctcg tgatcggtta tgccaataca g 41

<210> 117

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S82V-2)

<400> 117

ctgtattggc ataaccgatc acgagcgaca ggcagagttc g 41

<210> 118

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S82L-1)

<400> 118

cgaactctgc ctgtcgctcc tgatcggtta tgccaataca g 41

<210> 119

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S82L-2)

<400> 119

ctgtattggc ataaccgatc aggagcgaca ggcagagttc g 41

<210> 120

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S82I-1)

<400> 120

cgaactctgc ctgtcgctca tcatcggtta tgccaataca g 41

<210> 121

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex S82I-2)

<400> 121

ctgtattggc ataaccgatg atgagcgaca ggcagagttc g 41

<210> 122

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(I83A)

<400> 122

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

ctctccgcag gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 123

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(I83V)

<400> 123

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

ctctccgtgg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 124

<211> 924

<212> DNA

<213> 人工序列

<220>

<223> wex(I83L)

<400> 124

atgaatagca agaaggccac gctgatcgga cttactgcag tggtcctctg gagttccatt 60

gtcggattga ttcgcggcgt cagcgaacat ctcggcgcta ccgggggcgc ggcgatgatg 120

tatagcgttg cctcgctgtt tctgctgttg tcggtcggtt tcccgaaact gggttccttt 180

ccgaaaaaat acctcttgtg gggcagcctg ctgtttgtgt cctacgaact ctgcctgtcg 240

ctctccctgg gttatgccaa tacaggcagg caagcaatcg aagtcagcat ggtcaactat 300

ctgtggccgg cattcacgct catcgccgcc attgcattca accggcagag agcgaactgg 360

atggtggtgc ccggattcat cctctcgatt atcggtatct gctgggtgct gggcggtgac 420

caggggctgg acctggcggg catgcttggc aacgtgcagg acaatccgct cagttatggg 480

ctggcttttt tgggcgccgt gatctgggcc gcctattgca ctgtgacggc ccgcctcgcg 540

aaggggaaga acggagtgac gctgttcttc attcttgtgg cattgacgct ctgggtgaag 600

tttttcttcg gcgatcaccg cccgatgtct ttcagcctgc cggcaattgt ctacctgctc 660

ctggcggcgg ccgcgatggg cttcggctat gcggcatgga atgtcgggat cttgcacggt 720

aacgtgaccg tgctggcggg cgtgtcgtac tttatcccgg ttttttcggc ggcgttgtcc 780

gcgatggtgt tgcatgcgcc gttgccgcga tcgttttggg tgggggcgtc gctggtatgc 840

gccggttcga tactgtgctg gctggcaacc agggccaggc gcgcttcggc cgcgcaagaa 900

gatgcggtgg cggactgttt gtag 924

<210> 125

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex I83A-1)

<400> 125

gaactctgcc tgtcgctctc cgcaggttat gccaatacag gcagg 45

<210> 126

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex I83A-2)

<400> 126

cctgcctgta ttggcataac ctgcggagag cgacaggcag agttc 45

<210> 127

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex I83V-1)

<400> 127

gaactctgcc tgtcgctctc cgtgggttat gccaatacag gcagg 45

<210> 128

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex I83V-2)

<400> 128

cctgcctgta ttggcataac ccacggagag cgacaggcag agttc 45

<210> 129

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex I83L-1)

<400> 129

gaactctgcc tgtcgctctc cctgggttat gccaatacag gcagg 45

<210> 130

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物(wex I83L-2)

<400> 130

cctgcctgta ttggcataac ccagggagag cgacaggcag agttc 45

<210> 131

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex L79A

<400> 131

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Ala Ser

65 70 75 80

Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 132

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex L79V

<400> 132

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Val Ser

65 70 75 80

Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 133

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex L79I

<400> 133

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Ile Ser

65 70 75 80

Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 134

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex S80A

<400> 134

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ala

65 70 75 80

Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 135

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex S80V

<400> 135

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Val

65 70 75 80

Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 136

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex S80L

<400> 136

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Leu

65 70 75 80

Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 137

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex S80I

<400> 137

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ile

65 70 75 80

Leu Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 138

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex L81A

<400> 138

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Ala Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 139

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex L81V

<400> 139

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Val Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 140

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex L81I

<400> 140

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Ile Ser Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 141

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex S82A

<400> 141

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Leu Ala Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 142

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex S82V

<400> 142

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Leu Val Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 143

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex S82L

<400> 143

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Leu Leu Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 144

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex S82I

<400> 144

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Leu Ile Ile Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 145

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex I83A

<400> 145

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Leu Ser Ala Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 146

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex I83V

<400> 146

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Leu Ser Val Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

<210> 147

<211> 307

<212> PRT

<213> 人工序列

<220>

<223> wex I83L

<400> 147

Met Asn Ser Lys Lys Ala Thr Leu Ile Gly Leu Thr Ala Val Val Leu

1 5 10 15

Trp Ser Ser Ile Val Gly Leu Ile Arg Gly Val Ser Glu His Leu Gly

20 25 30

Ala Thr Gly Gly Ala Ala Met Met Tyr Ser Val Ala Ser Leu Phe Leu

35 40 45

Leu Leu Ser Val Gly Phe Pro Lys Leu Gly Ser Phe Pro Lys Lys Tyr

50 55 60

Leu Leu Trp Gly Ser Leu Leu Phe Val Ser Tyr Glu Leu Cys Leu Ser

65 70 75 80

Leu Ser Leu Gly Tyr Ala Asn Thr Gly Arg Gln Ala Ile Glu Val Ser

85 90 95

Met Val Asn Tyr Leu Trp Pro Ala Phe Thr Leu Ile Ala Ala Ile Ala

100 105 110

Phe Asn Arg Gln Arg Ala Asn Trp Met Val Val Pro Gly Phe Ile Leu

115 120 125

Ser Ile Ile Gly Ile Cys Trp Val Leu Gly Gly Asp Gln Gly Leu Asp

130 135 140

Leu Ala Gly Met Leu Gly Asn Val Gln Asp Asn Pro Leu Ser Tyr Gly

145 150 155 160

Leu Ala Phe Leu Gly Ala Val Ile Trp Ala Ala Tyr Cys Thr Val Thr

165 170 175

Ala Arg Leu Ala Lys Gly Lys Asn Gly Val Thr Leu Phe Phe Ile Leu

180 185 190

Val Ala Leu Thr Leu Trp Val Lys Phe Phe Phe Gly Asp His Arg Pro

195 200 205

Met Ser Phe Ser Leu Pro Ala Ile Val Tyr Leu Leu Leu Ala Ala Ala

210 215 220

Ala Met Gly Phe Gly Tyr Ala Ala Trp Asn Val Gly Ile Leu His Gly

225 230 235 240

Asn Val Thr Val Leu Ala Gly Val Ser Tyr Phe Ile Pro Val Phe Ser

245 250 255

Ala Ala Leu Ser Ala Met Val Leu His Ala Pro Leu Pro Arg Ser Phe

260 265 270

Trp Val Gly Ala Ser Leu Val Cys Ala Gly Ser Ile Leu Cys Trp Leu

275 280 285

Ala Thr Arg Ala Arg Arg Ala Ser Ala Ala Gln Glu Asp Ala Val Ala

290 295 300

Asp Cys Leu

305

Claims

1.具有L-色氨酸输出活性的蛋白质变体，

其中SEQ ID NO:1的氨基酸序列中的第79位氨基酸被丙氨酸、缬氨酸或异亮氨酸取代，

其中SEQ ID NO:1的氨基酸序列中的第80位氨基酸被丙氨酸、缬氨酸、亮氨酸或异亮氨酸取代，

其中SEQ ID NO:1的氨基酸序列中的第81位氨基酸被丙氨酸、缬氨酸或异亮氨酸取代，

其中SEQ ID NO:1的氨基酸序列中的第82位氨基酸被丙氨酸、缬氨酸、亮氨酸或异亮氨酸取代，或

其中SEQ ID NO:1的氨基酸序列中的第83位氨基酸被丙氨酸、缬氨酸或亮氨酸取代。

2.根据权利要求1所述的蛋白质变体，其中所述蛋白质变体由选自SEQ ID NO:131至SEQ ID NO:147中的任一个氨基酸序列组成。

3.多核苷酸，其编码权利要求1至2中任一项所述的蛋白质变体。

4.载体，其包含权利要求3所述的多核苷酸。

5.生产L-色氨酸的微生物，其表达权利要求1至2中任一项所述的蛋白质变体，其中所述微生物属于棒杆菌属(genus Corynebacterium)或埃希氏菌属(genus Escherichia)。

6.生产L-色氨酸的方法，其包括：

在培养基中培养权利要求5所述的微生物；以及

从所述培养的培养基或培养的微生物中回收L-色氨酸。

7.蛋白质变体用于增加微生物的L-色氨酸生产的用途，

其中SEQ ID NO:1的氨基酸序列中的第83位氨基酸被丙氨酸、缬氨酸或亮氨酸取代，

其中所述微生物属于棒杆菌属或埃希氏菌属。