CN101193911B

CN101193911B - 半胱氨酸减少的疏水蛋白融合蛋白、其生产和用途

Info

Publication number: CN101193911B
Application number: CN2006800205772A
Authority: CN
Inventors: T·萨布科夫斯基; M·考罗什; H-G·勒迈尔; H·巴尔格; C·博尔施韦勒
Original assignee: BASF SE
Current assignee: BASF SE
Priority date: 2005-06-10
Filing date: 2006-06-09
Publication date: 2013-06-12
Anticipated expiration: 2026-06-09
Also published as: JP5302676B2; CA2611234A1; CN101193911A; US7910699B2; JP2008545435A; DE102005027139A1; WO2006131564A2; WO2006131564A3; US20090136996A1; EP1893639A2

Abstract

本发明涉及通用结构式(I)的多肽X_n-C¹-X_1-50-C²-X_0-5-C³-X_p-C⁴-X_1-100-C⁵-X_1-50-C⁶-X_0-5-C⁷-X_1-50-C⁸-X_m(I)，及其生产和用途。

Description

半胱氨酸减少的疏水蛋白融合蛋白、其生产和用途

技术领域

本发明涉及新型疏水蛋白融合蛋白、其生产和用途。

背景技术

疏水蛋白是约100个氨基酸的小蛋白质，其为丝状真菌的特征蛋白质并且不存在于其它生物体中。最近，在天蓝色链霉菌(Streptomyces coelicolor)中发现疏水蛋白类蛋白质，称为“Chaplins”，而且其同样具有高表面活性的性质。Chaplins可以在水-空气界面组装形成淀粉样原纤维(Classen等人2003 Genes Dev 1714-1726；Elliot等人2003，Genes Dev.17，1727-1740)。

疏水蛋白以不溶于水的形式分布于多种真菌结构，例如气生菌丝、孢子、子实体的表面。疏水蛋白的基因从子囊菌(ascomycetes)、半知菌(deuteromycetes)和担子菌(basidiomycetes)中分离而来。某些真菌含有多于一个的疏水蛋白基因，例如普通裂褶菌(Schizophyllum commune)、灰盖鬼伞(Coprinus cinereus)、构巢曲霉(Aspergillus nidulans)。明显地，多种疏水蛋白涉及真菌发育的不同阶段。推测所述疏水蛋白负责不同的功能(vanWetter等人，2000，Mol.Mierobiol.，36，201-210；Kershaw等人1998，Fungal Genet.Biol，1998，23，18-33)。

除了为产生气生菌丝减少水的表面张力以外，疏水蛋白的生物学功能还有使孢子疏水化(Wsten等人1999，Curr.Biol.，19，1985-88；Bell等人1992，Genes Dev.，6，2382-2394)。此外，疏水蛋白被用于内衬地衣子实体中的气体通道，并且作为真菌病原体辨别植物表面系统的成分(Lugones等人1999，Mycol.Res.，103，635-640；Hamer和Talbot，1998，Curr.Opinion Microbiol.，卷1，693-697)。

互补实验证明单个类型中的疏水蛋白在某种程度上可以在功能上相互取代。

先前公开的疏水蛋白只能以中等产量制备，并且用常用的蛋白质化学纯化和分离方法纯化。目前在遗传方法的辅助下供应更大量的疏水蛋白的尝试尚未成功。

发明主题

本发明的主题是提供新的疏水蛋白及其生产方法，所述方法使能够经济地生产疏水蛋白并在多种技术领域使用。

发明详述

本发明涉及通用结构式(I)的多肽

X_n-C¹-X_1-50-C²-X_0-5-C³-X_p-C⁴-X_1-100-C⁵-X_1-50-C⁶-X_0-5-C⁷-X_1-50-C⁸-X_m (I)

其中X可以是任何20种天然存在的氨基酸(苯丙氨酸Phe、亮氨酸Leu、丝氨酸Ser、酪氨酸Tyr、半胱氨酸Cys、色氨酸Trp、脯氨酸Pro、组氨酸His、谷氨酰胺Gln、精氨酸Arg、异亮氨酸Ile、甲硫氨酸Met、苏氨酸Thr、天冬酰胺Asn、赖氨酸Lys、缬氨酸Val、丙氨酸Ala、天冬氨酸Asp、谷氨酸Glu、甘氨酸Gly)，且在X的指数表示氨基酸数，指数n和m是0-500之间，优选在15-300之间的数，p是1-250之间，优选在1-100之间的数，并且C是半胱氨酸、丙氨酸、丝氨酸、甘氨酸、甲硫氨酸或苏氨酸，其中至少4个由C指定的残基为半胱氨酸，附带条件是缩写为X_n 或X_m或X_p的肽序列的至少一个是长度至少为20个氨基酸的非天然连接于疏水蛋白的肽序列，该多肽在包被玻璃表面之后使接触角改变至少20°。

C¹到C⁸指定的氨基酸优选为半胱氨酸，但是它们也可能被其它相似的大氨基酸(优选丙氨酸、丝氨酸、苏氨酸、甲硫氨酸或甘氨酸)所代替。然而，C¹到C⁸位置的至少4个、优选至少5个、尤其优选至少6个且尤其至少7个应该包含半胱氨酸。本发明蛋白质中的半胱氨酸可以是还原形式或彼此形成二硫键。尤其优选形成分子内C-C桥，特别是具有至少1个、优选2个、尤其优选3个和特别尤其优选4个分子内二硫键的那些。当如上所述用相似的大氨基酸代替半胱氨酸时，那些彼此之间形成分子内二硫键的C位置的配对最好也被代替。

如果在以X指定的位置也使用半胱氨酸、丝氨酸、丙氨酸、甘氨酸、甲硫氨酸或苏氨酸，可以相应改变通式中单个半胱氨酸位点的数量。

尤其有利的多肽是那些具有通式(II)的多肽

X_n-C¹-X_3-25-C²-X_0-2-C³-X_5-50-C⁴-X_2-35-C⁵-X_2-15-C⁶-X_0-2-C⁷-X_3-35-C⁸-X_m (II)

其中X可以是任何20种天然存在的氨基酸(苯丙氨酸Phe、亮氨酸Leu、丝氨酸Ser、酪氨酸Tyr、半胱氨酸Cys、色氨酸Trp、脯氨酸Pro、组氨酸His、谷氨酰胺Gln、精氨酸Arg、异亮氨酸Ile、甲硫氨酸Met、苏氨酸Thr、天冬酰胺Asn、赖氨酸Lys、缬氨酸Val、丙氨酸Ala、天冬氨酸Asp、谷氨酸Glu、甘氨酸Gly)，在X的指数表示氨基酸数，指数n和m是2-300之间的数，并且C是半胱氨酸、丙氨酸、丝氨酸、甘氨酸、甲硫氨酸或苏氨酸，其中至少4个由C指定的残基为半胱氨酸，附带条件是缩写为X_n或X_m的肽序列的至少一个是长度至少为35个氨基酸的非天然连接疏水蛋白的肽序列，该多肽在包被玻璃表面之后使接触角改变至少20°。

特别尤其有利的是那些具有通式(III)的多肽

X_n-C¹-X_5-9-C²-C³-X_11-39-C⁴-X_2-23-C⁵-X_5-9-C⁶-C⁷-X_6-18-C⁸-X_m (III)

其中X可以是任何20种天然存在的氨基酸(苯丙氨酸Phe、亮氨酸Leu、丝氨酸Ser、酪氨酸Tyr、半胱氨酸Cys、色氨酸Trp、脯氨酸Pro、组氨酸His、谷氨酰胺Gln、精氨酸Arg、异亮氨酸Ile、甲硫氨酸Met、苏氨酸Thr、天冬酰胺Asn、赖氨酸Lys、缬氨酸Val、丙氨酸Ala、天冬氨酸Asp、谷氨酸Glu、甘氨酸Gly)，在X的指数表示氨基酸数，指数n和m是0-200之间的数，并且C是半胱氨酸、丙氨酸、丝氨酸、甘氨酸、甲硫氨酸或苏氨酸，其中至少6个由C指定的残基为半胱氨酸，附带条件是缩写为X_n或X_m的肽序列的至少一个是长度至少为40个氨基酸的非天然连接疏水蛋白的肽序列，该多肽在包被玻璃表面之后使接触角改变至少20°。

所述本发明的优选实施方案是具有通用结构式(I)、(II)或(III)的多肽，该结构式包含至少一种I类疏水蛋白，优选至少一个dewA、rodA、hypA、hypB、sc3、basf1、basf2疏水蛋白，或其部分或衍生物。下文的序列表对所述疏水蛋白进行了结构表征。也可能将多个(优选2个或3个)相同或不同结构的疏水蛋白彼此连接，并且连接于并非天然连接疏水蛋白的相应适宜多肽序列上。

本发明尤其优选的实施方案是具有SEQ ID NO：20、22、24所示的多肽序列的新蛋白质，及其编码核酸序列，具体是SEQ ID NO：19、21、23中定义的序列。尤其优选的实施方案还包括由SEQ ID NO：20、22或24所示多肽序列起始，通过取代、插入或缺失至少1个至多10个、优选5个、更优选所有氨基酸的5％而产生的蛋白质，所述蛋白质仍然具有起始蛋白质至少50％的生物特性。此处蛋白质的生物学特性指上述接触角的改变，如实施例10中所述。

本发明的蛋白质中至少一个缩写为X_n或X_m或X_p位置的多肽序列不是天然连接于疏水蛋白的，该多肽序列包含至少20个、优选至少35个、尤其优选至少50个、和尤其至少100个氨基酸(也指下文中的融合配偶体)。这是为了说明所述蛋白质可能由自然条件下并不以这种形式共同存在的疏水蛋白部分和融合配偶体部分组成。

融合配偶体部分可能选自多种蛋白质。对于多数融合配偶体，其也可能连接于一个疏水蛋白部分，例如连接于所述疏水蛋白部分的氨基端(X_n)和羧基端(X_m)或中间(X_p)。然而，也可能例如两个融合配偶体连接于本发明蛋白质的单个位置(X_n或X_m)。

尤其优选的融合配偶体部分是能够使本发明的蛋白质包被玻璃表面的多肽序列，并且其引起蛋白质处理的玻璃表面对去污剂处理具有抗性，这在实验部分(实施例10)中有详细描述(例如1％SDS在80℃处理10分钟)。

尤其合适的融合配偶体部分是在微生物、特别是大肠杆菌(E.coli)或枯草芽孢杆菌(Bacillus subtilis)中天然存在的多肽。此类融合配偶体的实例是序列yaad(SEQ ID NO：15和16)、yaae(SEQ ID NO：17和18)和硫氧还蛋白。同样高度适用的是所述序列的片段或衍生物，其只含有所述序列的部分、优选10-90％、尤其优选25-75％。此处优选C末端缺失体，例如仅由N-末端前75个氨基酸组成的yaad片段，或其中与所述序列相比有单个氨基酸或核苷酸改变的序列。例如可以在yaad和yaae序列的C-末端附加另外的氨基酸，特别是2个另外的氨基酸(优选精氨酸、丝氨酸)。也可能优选与天然存在的序列相比，插入到yaae序列中另外的氨基酸，例如SEQ IDNO：17和18中的第2号氨基酸(甘氨酸)。

其它融合配偶体、尤其是那些在通式(I)的X_p位置的融合配偶体的实例是酶活性结构域、抗微生物结构域、作为受体兴奋剂/拮抗剂的多肽序列、色素、调味剂和芳香剂、金属结合结构域。还可能产生与多种活性化合物和效应子共价结合的特异性偶联位点。例如，在该环中插入另外的赖氨酸，以便在技术人员所公知的异双功能(heterobifunctional)连接的帮助下，通过伯氨基基团(primary amino group)使活性化合物和效应子特异的连接于疏水蛋白分子主链。

此外，也可能在两个融合配偶体的连结点处插入另外的氨基酸，导致在核酸水平上新产生或钝化限制性内切酶识别位点。

本发明蛋白质的多肽序列还可能通过例如糖基化、乙酰化或通过其它与例如戊二醛化学交联的方法加以修饰。

本发明蛋白质的一个特性是当用所述蛋白质包被表面时改变表面的性质。实验上是通过在以蛋白质包被表面之前和之后测量水滴接触角，并确定两次测量的差别来确定所述表面性质的改变。

用于测量接触角的精确实验条件在实施例10中的实验部分说明。在这些条件下，本发明的蛋白质具有使接触角至少增大20°，优选25°，尤其优选30°的性质。

目前已知的疏水蛋白中，疏水蛋白部分的极性和非极性氨基酸的位置是保守的，导致特征性的疏水性图谱。根据生物物理学性质和疏水性的差异将目前已知的疏水蛋白分为两类，I类和II类(Wessels等人1994，Ann.Rev.Phytopathol.，32，413-437)。

I类疏水蛋白组装的膜高度不可溶(即使是升高温度在1％的十二烷基硫酸钠(SDS)中也是如此)，并且只能通过浓缩的三氟乙酸(TFA)或甲酸而再次解离。与之相反，II类疏水蛋白的组装形式较不稳定。它们通过60％浓度的乙醇或1％SDS(在室温)即可再次解离。这种对于溶剂和去污剂的高稳定性是疏水蛋白的特殊性质，并且其将本发明的多肽包被与表面上多种蛋白质形成的“非特异性”蛋白质包被区分开来。

氨基酸序列的比较揭示，在II类疏水蛋白中C³和C⁴半胱氨酸之间区域的长度明显小于I类疏水蛋白。

此外，II类疏水蛋白比I类疏水蛋白具有更多带电荷的氨基酸。

本发明还涉及生产本发明蛋白质的方法。这些多肽可以通过肽合成的成熟技术化学制备，例如通过Merrifield固相合成。

然而，尤其有用的是基因工程方法，其中两个分别编码融合配偶体和疏水蛋白部分的核酸序列(优选DNA序列)组合，从而通过组合核酸序列的基因表达在宿主生物体中产生所希望的蛋白质。

此处用于所述构建方法的合适的宿主生物体(生产生物体)可以是原核生物(包括古细菌(Archaea))或真核生物，尤其是细菌包括嗜盐菌(halobacteria)和甲烷球菌(methanococci)，真菌，昆虫细胞，植物细胞和哺乳动物细胞，尤其优选大肠杆菌、枯草芽孢杆菌、巨大芽孢杆菌(Bacillusmegaterium)、米曲霉(Aspergillus oryzea)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、巴斯德毕赤酵母(Pichia pastoris)、假单胞菌属物种(Pseudomonas spec.)、乳酸杆菌(lactobacilli)、多形汉逊酵母(Hansenulapolymorpha)、里氏木霉(Trichoderma reesei)、SF9(或相关细胞)等等。

本发明还涉及表达构建体的用途，所述表达构建体包含在调控核酸序列的遗传控制下编码本发明的多肽的核酸序列，并且本发明也涉及包含至少一个所述表达构建体的载体。

本发明的构建体优选包含特定编码序列的5’上游启动子和3’下游终止序列，适用的情况下还包含各自与所述编码序列有效连接的其他常用调控元件。

“有效连接”指启动子、编码序列、终止子和适用情况下的其他调控元件的有序排列，从而使每个调控元件能够实现其表达编码序列所需的功能。

有效连接序列的实例为寻靶序列以及增强子、多腺苷酸化信号等等。其它调控元件包含可选标记、扩增信号、复制起点等等。合适的调控元件在例如Goeddel，基因表达技术：酶学方法185，学术出版社，San Diego，CA(1990)中描述。

除这些调控序列以外，可能在实际结构基因的上游仍存在对这些序列的天然调控，且适用的情况下可对之进行遗传修饰，从而通过关闭天然调控而增强基因表达。

优选的核酸构建体最好还包含一个或多个与启动子功能性连接的上述增强子序列，以增强核酸序列的表达。其他有利的序列，例如其他的调控元件或终止子也可插入到DNA序列的3’末端。

在构建体中可能具有本发明的核酸的一个或多个拷贝。如果为筛选所述构建体所需，构建体也可能包含其他标记，例如抗生素抗性或营养缺陷型补偿基因。

例如，对本发明方法有利的调控序列存在于启动子如coS、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、lacIq-T7、T5、T3、gal、trc、ara、rhaP(rhaPBAD)SP6、λ-PR启动子或λ-P启动子中，这些启动子最好在革兰氏阴性菌中使用。其他有利的调控序列存在于例如革兰氏阳性启动子amy和SP02，和酵母或真菌启动子ADC1、MFα、AC、P-60、CYC1、GAPDH、TEF、rp28、ADH。

也可以使用人工启动子进行调控。

为了在宿主生物体中表达，最好将核酸构建体插入例如能够使基因在宿主细胞中最优表达的载体(例如质粒或噬菌体)。除质粒和噬菌体以外，载体也指技术人员所公知的任何其它载体，即例如病毒(如SV40、CMV、杆状病毒和腺病毒)，转座子，IS元件，噬粒，粘粒，和线性或环状DNA，以及农杆菌系统。

这些载体可以在宿主生物体中自主复制或随染色体复制。这些载体构成本发明的其他实施方案。合适质粒的实例是大肠杆菌中的pLG338、pACYC184、pBR322、pUC18、pUC19、pKC30、pRep4、pHS1、pKK223-3、pDHE19.2、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III”3-B1、tgt11或pBdCl，链霉菌(Streptomyces)的pIJ101、pIJ364、pIJ702或pIJ361，杆菌的pUB110、pC194或pBD214，棒状杆菌(Corynebacterium)的pSA77或pAJ667，真菌的pALS1、pIL2或pBB116，酵母中的2α、pAG-1、YEp6、YEp13或pEMBLYe23，或植物中的pLGV23、pGHlac⁺、pBIN19、pAK2004或pDH51。所述质粒是可能质粒的一小部分选择。其它质粒是技术人员所公知的，并且能够在例如《克隆载体)》(Eds.Pouwels P.H.等人Elsevier，Amsterdam-New York-Oxford，1985，ISBN 0 444 904018)中找到。

为了表达其它存在的基因，核酸构建体也最好包含3’-末端和/或5’-末端调控序列来增强表达，根据宿主生物和基因或所选基因对所述序列加以选择，以达到最佳表达。

这些调控序列旨在使基因和蛋白质特异性表达。这意味着取决于宿主生物体，例如基因只在诱导后表达或过表达，或者立即表达和/或过表达。

在这点上，优选引入的调控序列或因子具有正面影响，并且增强其被引入的基因的表达。因此，使用强转录信号(例如启动子和/或增强子)在转录水平增强调控元件是有利的。然而，除此之外，也可能通过例如改良mRNA稳定性来增强翻译。

在载体的另一实施方案中，包含本发明核酸构建体或本发明核酸的载体也可能以线性DNA的形式被有利地引入微生物中，并通过异源或同源重组的方式整合到宿主生物体的基因组中。此线性DNA可能由线性化载体(例如质粒)组成，或仅由本发明的核酸构建体或核酸组成。

为实现生物中异源基因的最佳表达，最好根据生物中特定的密码子使用来修饰核酸序列。通过计算机分析所研究生物的其他已知基因，可以容易的确定密码子的使用。

将合适的启动子与合适的编码核苷酸序列和终止信号或多聚腺苷酸信号融合来制备表达盒。为此使用的常规重组和克隆技术见于例如T.Maniatis，E.F.Fritsch和J.Sambrook，分子克隆：实验室操作手册，ColdSpring Harbor Laboratory，Cold Spring Harbor，NY(1989)和T.J.Silhavy，M.L.Berman和L.W.Enquist，基因融合实验，Cold SpringHarbor Laboratory，Cold Spring Harbor，NY(1984)以及在Ausubel，F.M.等人，现代分子生物学实验方法，Greene Publishing Assoc.和WileyInterscience(1987)中的描述。

为了在合适宿主生物体中表达，重组核酸构建体或基因构建体最好插入宿主特异的载体，该载体能够使基因在宿主中最优表达。载体是技术人员所熟知的，并且能够在例如“克隆载体”(Pouwels P.H.等人，编辑，Elsevier，Amsterdam-New York-Oxford，1985)中找到。

可以利用本发明的载体制备例如由至少一个本发明的载体转化的重组微生物，并且其可用于生产本发明所用多肽。最好将本发明的上述重组构建体引入合适的宿主系统并表达之。在此情况下，优选使用技术人员熟知的常用克隆和转染方法，例如共沉淀、原生质体融合、电穿孔法、逆转录病毒转染等等，以引起所述核酸在特定表达系统中表达。合适的系统在例如现代分子生物学实验方法，F.Ausubel等人编辑，Wiley Interscience，New York 1997，或Sambrook等人，分子克隆：实验室操作手册，第二版，Cold Spring Harbor Laboratory，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，NY，1989中描述。

也可以根据本发明制备同源重组微生物。为此，可制备包含至少一部分本发明的基因或编码序列的载体，适用的情况下，所述编码序列中引入至少一个氨基酸缺失、氨基酸添加或氨基酸取代，从而修饰(例如功能性破坏)本发明的序列(敲除载体)。引入的序列可为例如相关微生物的同源物，或由哺乳动物、酵母或昆虫来源衍生而来。或者，可设计用于同源重组的载体，从而使内源性基因在同源重组时发生突变或其他改变，但仍然编码功能性蛋白质(例如改变上游调控区域由此改变内源性蛋白质的表达)。本发明所用的基因的改变的部分位于同源重组载体中。适合同源重组的载体的构建在例如Thomas，K.R.和Capecchi，M.R.(1987)Cell 51：503中描述。

适合本发明的核酸或核酸构建体的重组宿主生物体原则上是任何原核或真核生物体。最好使用微生物例如细菌、真菌或酵母作为宿主生物体。革兰氏阳性或革兰氏阴性细菌，优选肠杆菌科(Enterobacteriaceae)、假单胞菌科(Pseudomonadaceae)、根瘤菌科(Rhizobiaceae)、链霉菌科(Streptomycetaceae)或诺卡氏菌科(Nocardiaceae)的细菌，特别优选使用的细菌为埃希氏菌属(Escherichia)、假单胞菌属、链酶菌属、诺卡氏菌属、伯克霍尔德菌属(Burkholderia)、沙门氏菌属(Salmonella)、农杆菌属或红球菌属(Rhodococcus)的细菌。

依据宿主生物体，按技术人员公知的方法生长或培养本发明方法中使用的生物体。微生物通常生长在液体培养基中，其中包含碳源(通常以糖的形式)、氮源(通常以有机氮源的形式例如酵母提取物，或例如硫酸铵等盐类)、微量元素(例如铁盐、锰盐和镁盐)、以及适用情况下的维生素，生长温度在0℃到100℃之间，优选10℃到60℃，同时供以氧气。此种情况培养液pH值可以维持或不维持在固定值，即在培养过程中可以调节或不调节。可以进行分批发酵、半分批发酵或连续培养。可以在发酵最初开始时引入营养素，或以半连续或连续方式进行随后加料。可以通过实施例中所描述的方法从生物体中分离酶，或者在反应中使用酶粗提物。

可以用重组方法制备本发明的多肽或其功能生物活性片段，通过培养产生多肽的微生物，适用的情况下诱导表达多肽，而且从培养液中分离所述多肽。如果需要，也可以通过此种方法在工业上生产多肽。可以通过已知方法培养和发酵重组微生物。例如细菌可以在20-40℃，pH6-9条件下，在TB培养基或LB培养基中繁殖。合适的培养条件例如在T.Maniatis，E.F.Fritsch和J.Sambrook，分子克隆：实验室操作手册，Cold Spring HarborLaboratory，Cold Spring Harbor，NY(1989)中详细描述。

如果本发明使用的多肽并非分泌至培养基中，那么就要破坏细胞，通过已知的多肽分离方法从溶菌产物中获得产品。正如所预期的，通过高频超声、高压(例如在弗氏压碎器中)、渗透、使用去污剂、水解酶或有机溶剂、匀浆等手段，或通过所列出的方法中的多个的组合来破坏细胞。

多肽可以用已知的层析方法纯化，例如分子筛层析(凝胶过滤法)，例如Q琼脂糖层析，离子交换层析和疏水层析，以及使用其它常用方法，例如超滤、结晶、盐析、透析和非变性凝胶电泳。合适的方法在例如Cooper，F.G.，Biochemische Arbeitsmethoden，[original title：The tools ofbiochemistry]，Verlag Walter de Gruyter，Berlin，New York or in Scopes，R.，蛋白质纯化，Springer Verlag，New York，Heidelberg，Berlin中描述。

最好通过使用载体系统或寡核苷酸分离重组蛋白质，所述寡核苷酸以特定核苷酸序列延伸cDNA，从而编码例如有利于纯化的改变的多肽或融合蛋白质。此类合适的修饰的实例是作为锚起作用的“标签”，例如六组氨酸锚的修饰、或能够作为抗原被抗体识别的表位(例如在Harlow，E.和Lane，D.，1988，抗体：实验室操作手册，Cold Spring Harbor(N.Y.)Press中描述)。其它合适的标签是例如HA、钙调节蛋白-BD、GST、MBD；几丁质-BD、链霉亲和素-BD-avi-标签、Flag-标签、T7等等。这些锚可以用于将蛋白质附着在固体载体上，例如聚合体基质，例如其可填充到层析柱中，或用于微孔滴定板或其它载体。相应的纯化方法可以从商品化的亲和标签供应商那里获得。

在显微镜下可以观察到许多疏水蛋白包被的真菌表面(孢子、子实体、菌丝)，其特征结构称为“小棒(rodlets)”。类似的厚度约为10nm的小棒也可以在疏水蛋白包被的亲水表面检测到(例如玻璃、云母等)(W

sten等人，1993，Plant Cell，5，1567-1574)。

由于包被表面的疏水蛋白的特殊性质(例如抗去污剂，例如1％浓度的SDS溶液)，这些蛋白质具有用于许多工业应用的极大潜能。多种专利文件涉及此类应用的实例，此处引用其中关于疏水蛋白的应用。

(申请)号优先权申请人

WO 03/10331	07.23.2001	Nanosystems B.V.申请
			WO 04/00880	06.21.2002	Nanosystems B.V.申请
WO 03/84508	04.04.2002	Nanosystems B.V.申请
			WO 00/40968	01.05.1999	Unilever N.V.(Hindustan Lever Ltd.)
EP-B 1 252 516	02.04.2000	Nanosystems B.V. Stichting voor de Technische Wetenschappen申请
			EP-B 1257 571	02.04.2000	Nanosystems B.V.申请
WO 01/57066	02.04.2000	Nanosystems B.V.申请
			WO 03/10331	07.23.2001	Nanosystems B.V.申请
WO 03/53383	12.14.2001	L’Oreal

疏水蛋白(尤其是I类疏水蛋白)在工业上的利用至今还不成功，这是由于缺乏有效的生产和纯化的方法。先前描述的从天然来源(孢子、真菌菌丝等等)提取的方法只能产生毫克级的材料量(例如WO 96/41882)。

通过重组生产多种生物生产者的途径同样被证明非常复杂，并且不是很令人满意。

本发明的疏水蛋白，其融合形式(即与融合配偶体部分一起)以及分离的形式两者都具有所希望的疏水蛋白性质。因此本发明的蛋白质既可能直接用作融合蛋白，又可以在剪切后除去融合配偶体而用作“纯化的”疏水蛋白。

当需要移除融合配偶体时，推荐在融合蛋白中疏水蛋白部分和融合配偶体部分之间掺入潜在的切割位点(蛋白酶的特定识别位点)。尤其合适的切割位点包括通过生物信息学工具能够确定的那些否则将既不存在于疏水蛋白部分也不存在于融合配偶体部分中的肽序列。尤其有用的是例如在甲硫氨酸的BrCN切割或蛋白酶介导的Xa因子切割、肠激酶切割、凝血酶、TEV切割(烟草蚀纹病毒蛋白酶)。

实施例

实施例1

克隆yaad-His₆/yaaE-His₆的准备工作

用寡核苷酸Hal570和Hal571(Hal 572/Hal 573)进行多聚酶链式反应。所使用的模板DNA是枯草芽孢杆菌基因组DNA。获得的PCR片段包含枯草芽孢杆菌yaaD/yaaE基因的编码序列，和在其末端的NcoI和BglII限制性切割位点。纯化PCR片段，并用限制性内切酶NcoI和BgHI切割。此DNA片段用作插入片段克隆到Qiagen pQE60载体中，该载体预先用限制性内切酶NcoI和BglII线性化。这样获得的载体pQE60YAAD#2/pQE60YaaE#5可以分别用于表达由YAAD::HIS₆和YAAE::HIS₆组成的蛋白质。

Hal570：gcgcgcccatggctcaaacaggtactga

Hal571：gcagatctccagccgcgttcttgcatac

Hal572：ggccatgggattaacaataggtgtactagg

Hal573：gcagatcttacaagtgccttttgcttatattcc

实施例2a

yaad-疏水蛋白DewA-His6的克隆

用寡核苷酸KaM416和KaM417进行多聚酶链式反应。所使用的模板DNA是构巢霉菌基因组DNA。获得的PCR片段包含疏水蛋白基因dewA的编码序列，和N-末端因子Xa蛋白酶切割位点。纯化PCR片段，并用限制性内切酶BamHI切割。此DNA片段用作插入片段克隆到载体pQE60YAAD#2中，该载体预先用限制性内切酶BglII线性化。

这样获得的载体#508用于表达由YAAD::Xa::dewA::HIS₆组成的融合蛋白质。

KaM416：

GCAGCCCATCAGGGATCCCTCAGCCTTGGTACCAGCGC

KaM417：

CCCGTAGCTAGTGGATCCATTGAAGGCCGCATGAAGTTCTCCGT

CTCCGC

实施例2b

具有抗菌性质的嵌合体融合蛋白质的制备

为了引入具有抗菌性质的肽序列，遵循以下克隆策略：

从我们的Yaad-DewA表达质粒“pQE60 Yaad dewA His”开始，通过半胱氨酸3和4之间的融合PCR将抗菌肽序列插入。

图2

1a)PCR区域：YaaD-dewA到半胱氨酸3，包括T7 novispirin突出端

模板：pQE60 YaaD dewA 6His

引物：引物1

(AATTAACCATGGCTCAAACA)20-mer

引物2

(GCCATATTTTTTAATAATATGAATAATTTTACGGGTAATACGACGC

AGGTTTTTGCAGCAAGCGATCGAGCCGA)74-mer

PCR条件：55℃，1118bp

1b)PCR区域：novispirin突出端到6His/终止

模板：pQE60 YaaD dewA 6His

引物：引物3

(ATATTATTAAAAAATATGGCAACTCCCCCGCTGAGACCAA)40-mer

引物4

(CTAATTAAGCTTAGTGATGGT)21-mer

PCR条件：54℃，306bp

2)退火PCR

将PCR 1a和1b产物50pmol组合，用Pfu-聚合酶进行退火PCR(95℃1分钟，72℃5分钟-10个循环)

随后加入外部引物(outside primers)，进行通常的35个循环的PCR。

引物：引物1

(AATTAACCATGGCTCAAACA)20-mer

引物4

(CTAATTAAGCTTAGTGATGGT)21-mer

PCR条件：53℃，1404bp

3)连接

载体：pQE60 YaaD dewA 6His

用NcoI/KpnI消化

制备凝胶，分离3428bp的条带

插入片段：退火PCR的产物

用NcoI/KpnI消化

制备凝胶，分离1350bp的条带

4)转化XL10/TG10化学感受态细胞(chemocomp.cells)

图3

pQE60 YaaD dewA Cys3 G10 novispirin

1a)PCR区域：YaaD-dewA到Cys3，包括G10 novispirin突出端

模板：pQE60 YaaD dewA 6His

引物：引物1

(AATTAACCATGGCTCAAACA)20-mer

引物5

(GCCATATTTTTTAATAATATGAATGCCTTTACGAATAATACGACGC

AGGTTTTTGCAGCAAGCGATCGAGCCGA)74-mer

PCR条件：55℃，1118bp

1b)PCR区域：novispirin突出端到6His/终止

图4

模板：pQE60 YaaD dewA 6His

引物：引物6

(ATATTATTAAAAAATATGGCAACTCCCCCGCTGAGACCAA)40-mer

引物4

(CTAATTAAGCTTAGTGATGGT)21-mer

PCR条件：54℃，306bp

2)退火PCR

随后加入外部引物，进行普通的35个循环的PCR。

引物：引物1

(AATTAACCATGGCTCAAACA)20-mer

引物4

(CTAATTAAGCTTAGTGATGGT)21-mer

PCR条件：53℃，1404bp

3)连接

载体：pQE60 YaaD dewA 6His

用NcoI/KpnI消化

制备凝胶，分离3428bp的条带

插入片段：退火PCR的产物

用NcoI/KpnI消化

制备凝胶，分离1350bp的条带

4)转化XL10/TG10化学感受态细胞

图5

蛋白质的纯化和评估与实施例8-10类似。

可以测定抗菌性质：

抗菌作用的测定在6-孔微量滴定板中进行，该滴定板填充相应生长所需的琼脂(LB、YM)。然后将平板培养过夜。

在测定中使用的微生物如下：

枯草芽孢杆菌

巨大芽胞杆菌

大肠杆菌XL1 Blue MR

藤黄微球菌(Micrococcus luteus)

泛菌(Pantoea)

库特菌(Kurthia gibs.)

假单胞菌属物种

肉杆菌(Carnobacterium)

白色念珠菌(Candida albicans)

尖孢镰刀菌(Fusarium oxysporum)

除肉杆菌和假单胞菌以外的所有微生物有机体(MO)都在20ml YPD培养基中培养过夜(30℃，200rpm)；肉杆菌在TSB中培养，假单胞菌在CASO中培养。将20μl特定细菌或真菌的悬浮液应用于微孔滴定板的每个孔，并轻轻铺平。使悬浮液在某种程度上浸入琼脂。然后将疏水蛋白溶液(同样20μl)应用于孔的中央；在30℃培养箱中培养琼脂平板。在过夜培养后已经可以观测到最初结果：通过应用点周围没有生长物来揭示抗菌作用，而缺乏抗菌作用的孔被完全长满。

实施例3

yaad疏水蛋白RodA-His₆的克隆

质粒#513的克隆类似于质粒#508，使用寡核苷酸KaM434和KaM435。

KaM434：GCTAAGCGGATCCATTGAAGGCCGCATGAAGTTCTCCATTGCTGC

KaM435：CCAATGGGGATCCGAGGATGGAGCCAAGGG

实施例4

yaad疏水蛋白BASF1-His₆的克隆

质粒#507的克隆类似于质粒#508，使用寡核苷酸KaM417和KaM418。

使用的模板DNA是人工合成的DNA序列，疏水蛋白BASF1(见附件)。

KaM417：CCCGTAGCTAGTGGATCCATTGAAGGCCGCATGAAGTTCTCCGTCTCCGC

KaM418：CTGCCATTCAGGGGATCCCATATGGAGGAGGGAGACAG

实施例5

yaad疏水蛋白BASF2-His₆的克隆

质粒#506的克隆类似于质粒#508，使用寡核苷酸KaM417和KaM418。使用的模板DNA是人工合成的DNA序列，疏水蛋白BASF2(见附件)。

KaM417：CCCGTAGCTAGTGGATCCATTGAAGGCCGCATGAAGTTCTCCGTCTCCGC

KaM418：CTGCCATTCAGGGGATCCCATATGGAGGAGGGAGACAG

实施例6

yaad疏水蛋白SC3-His₆的克隆

质粒#526的克隆类似于质粒#508，使用寡核苷酸KaM464和KaM465。使用的模板DNA是Schyzophyllum commune cDNA(见附件)。

KaM464：CGTTAAGGATCCGAGGATGTTGATGGGGGTGC

KaM465：GCTAACAGATCTATGTTCGCCCGTCTCCCCGTCGT

实施例7

yaad疏水蛋白DewA-His₆重组大肠杆菌菌株的发酵

将含有表达yaad疏水蛋白DewA-His₆的大肠杆菌菌株的3ml LB液体培养基接种于15ml Greiner管中。于37℃在振荡器上以200rpm培养8小时。将1ml此预培养液各自接种于2个1升有塞子锥形瓶中的250mlLB培养基中(+100μg/ml氨苄青霉素)，在37℃以180rpm振荡培养9小时。

将0.5升的预培养液(相对于水测量OD_600nm 1∶10)接种于13.5升的LB培养基(+100μg/ml氨苄青霉素)中，置于20升的发酵罐。在OD_600nm约3.5时添加140ml的100mM IPTG。3小时以后，将发酵罐冷却到10℃，并通过离心除去发酵液。细胞沉淀用于进一步的纯化。

实施例8

重组疏水蛋白融合蛋白的纯化

(带有C-末端His6标签的疏水蛋白融合蛋白的纯化)

100g的细胞沉淀(100-500mg的疏水蛋白)用50mM pH7.5的磷酸钠缓冲液补足到总体积为200ml，并将沉淀重悬。悬浮液用T25型高速分散器Ultraturrax(Janke和Kunkel；IKA-Labortechnik)处理10分钟，随后为了降解核酸，再与500单位benzonase核酸酶(Merck，Darmstadt；order No.1.01697.0001)在室温培育1小时。在破坏细胞之前使用玻璃萃取柱(P1)进行过滤。为了破坏细胞和剪断剩余的基因组DNA，用匀浆器在1500巴进行2次处理(Microfluidizer M-110EH；Microfluidics Corp.)。将匀浆液离心(Sorvall RC-5B，GSA转子，250ml离心筒，60分钟，4℃，12000rpm，23000g)，上清置于冰上，用100ml pH7.5的磷酸钠缓冲液重悬沉淀。重复3次离心和重悬，在第3次重复时磷酸钠缓冲液中包含1％SDS。重悬以后，将溶液搅拌1小时，然后进行最终离心(Sorvall RC-5B，GSA转子，250ml离心筒，60分钟，4℃，12000rpm，23000g)。根据SDS-PAGE分析，疏水蛋白存在于最终离心的上清液部分(图1)。实验显示疏水蛋白可以以包涵体的形式存在于相应大肠杆菌中。50ml含疏水蛋白的上清液应用于以50mM pH8.0的Tris-Cl缓冲液平衡的50ml镍-琼脂糖高性能17-5268-02柱(Amersham)。用50mM pH8.0的Tris-Cl缓冲液洗柱，随后用包含200mM咪唑的50mM pH8.0的Tris-Cl缓冲液洗脱疏水蛋白。为了去除咪唑，溶液用50mM pH8.0的Tris-Cl缓冲液透析。

图1描述本发明疏水蛋白的纯化

1泳道：应用于镍-琼脂糖柱的溶液(1∶10稀释)

2泳道：流出液＝清洗步骤的洗脱液

3-5泳道：洗脱级分的OD 280峰

图1中本发明的疏水蛋白分子量约为53kD。一些较小条带代表所述疏水蛋白的降解产物。

实施例9

具有疏水蛋白表面的包被/评估

疏水蛋白或疏水蛋白融合蛋白的包被性质优选以玻璃和聚四氟乙烯(Teflon)分别作为亲水和疏水表面的模型进行评估。

标准包被实验

玻璃：

-疏水蛋白浓度：1-100μg/mL

-玻璃片在50mM pH4醋酸钠+0.1％吐温20中培育过夜(温度80℃)

-包被以后，在蒸馏水中清洗

-然后于80℃在1％SDS中培育10分钟

-在蒸馏水中清洗

聚四氟乙烯(Teflon)：

-浓度：1-100μg/mL

-聚四氟乙烯(Teflon)平板在10mM pH8的Tris中培育过夜(温度80℃)

-包被以后，在蒸馏水中清洗

-然后于80℃在1％吐温20中培育10分钟

-在蒸馏水中清洗

-然后于80℃在1％SDS中培育10分钟

-在蒸馏水中清洗

样品在空气中干燥，测定5μl水滴的接触角(单位为度)，得到如下值，例如：

根据实施例8以yaad-DewA融合蛋白进行实验(对照：无蛋白质；yaad-dewA-his₆：100μg/ml融合蛋白配偶体)：

	80℃，1％SDS处理之后
			聚四氟乙烯Teflon	玻璃
对照	96.8	30
			yaad	97.4	38.7
100μg/ml	77.7	76.8
			50μg/ml	85.9	77.9
10μg/ml	83.5	74.5
			5μg/ml	104	70.3
1μg/ml	104.9	73

实施例10

具有疏水蛋白表面的包被/评估

玻璃(窗玻璃，Süddeutsche Glas，Mannheim，Germany)：

-疏水蛋白浓度：100μg/mL

-玻璃片在50mM pH4的醋酸钠+0.1％吐温20中培育过夜(温度80℃)

-包被以后，在蒸馏水中清洗

-然后于80℃在1％SDS的蒸馏水溶液中培育10分钟

-在蒸馏水中清洗

样品在空气中干燥，且测定5μl水滴的接触角(单位为度)。

接触角的测量用Dataphysics接触角系统OCA 15+仪器，应用软件为SCA 20.2.0.(2002年11月)。根据制造商的说明书进行测量。

未处理的玻璃接触角为30±5°，以根据实施例8(yaad-dewA-his6)的功能性疏水蛋白包被的玻璃接触角为75±5°。

序列表中DNA和多肽序列的序列命名

dewA DNA和多肽序列	SEQ ID NO：1
		dewA多肽序列	SEQ ID NO：2
rodA DNA和多肽序列	SEQ ID NO：3
		rodA多肽序列	SEQ ID NO：4
hypA DNA和多肽序列	SEQ ID NO：5
		hypA多肽序列	SEQ ID NO：6
hypB DNA和多肽序列	SEQ ID NO：7
		hypB多肽序列	SEQ ID NO：8
sc3 DNA和多肽序列	SEQ ID NO：9
		sc3多肽序列	SEQ ID NO：10
basf1 DNA和多肽序列	SEQ ID NO：11
		basf1多肽序列	SEQ ID NO：12
basf2 DNA和多肽序列	SEQ ID NO：13
		basf2多肽序列	SEQ ID NO：14
yaadDNA和多肽序列	SEQ ID NO：15
		yaad多肽序列	SEQ ID NO：16
yaaeDNA和多肽序列	SEQ ID NO：17
		yaae多肽序列	SEQ ID NO：18
yaad-Xa-dewA-his DNA和多肽序列	SEQ ID NO：19
		yaad-Xa-dewA-his多肽序列	SEQ ID NO：20
yaad-Xa-rodA-his DNA和多肽序列	SEQ ID NO：21
		yaad-Xa-rodA-his多肽序列	SEQ ID NO：22
yaad-Xa-basf1-his DNA和多肽序列	SEQ ID NO：23
		yaad-Xa-basf1-his多肽序列	SEQ ID NO：24

序列表

<110>巴斯福股份公司

<120>新型半胱氨酸减少的疏水蛋白融合蛋白、其生产和用途

<130>AE 20040837

<160>24

<170>PatentIn version 3.1

<210>1

<211>405

<212>DNA

<213>basf-dewA

<220>

<221>CDS

<222>(1)..(405)

<223>

<400>1

atg cgc ttc atc gtc tct ctc ctc gcc ttc act gcc gcg gcc acc gcg 48

Met Arg Phe Ile Val Ser Leu Leu Ala Phe Thr Ala Ala Ala Thr Ala

1 5 10 15

acc gcc ctc ccg gcc tct gcc gca aag aac gcg aag ctg gcc acc tcg 96

Thr Ala Leu Pro Ala Ser Ala Ala Lys Asn Ala Lys Leu Ala Thr Ser

20 25 30

gcg gcc ttc gcc aag cag gct gaa ggc acc acc tgc aat gtc ggc tcg 144

Ala Ala Phe Ala Lys Gln Ala Glu Gly Thr Thr Cys Asn Val Gly Ser

35 40 45

atc gct tgc tgc aac tcc ccc gct gag acc aac aac gac agt ctg ttg 192

Ile Ala Cys Cys Asn Ser Pro Ala Glu Thr Asn Asn Asp Ser Leu Leu

50 55 60

agc ggt ctg ctc ggt gct ggc ctt ctc aac ggg ctc tcg ggc aac act 240

Ser Gly Leu Leu Gly Ala Gly Leu Leu Asn Gly Leu Ser Gly Asn Thr

65 70 75 80

ggc agc gcc tgc gcc aag gcg agc ttg att gac cag ctg ggt ctg ctc 288

Gly Ser Ala Cys Ala Lys Ala Ser Leu Ile Asp Gln Leu Gly Leu Leu

85 90 95

gct ctc gtc gac cac act gag gaa ggc ccc gtc tgc aag aac atc gtc 336

Ala Leu Val Asp His Thr Glu Glu Gly Pro Val Cys Lys Asn Ile Val

100 105 110

gct tgc tgc cct gag gga acc acc aac tgt gtt gcc gtc gac aac gct 384

Ala Cys Cys Pro Glu Gly Thr Thr Asn Cys Val Ala Val Asp Asn Ala

115 120 125

ggc gct ggt acc aag gct gag 405

Gly Ala Gly Thr Lys Ala Glu

130 135

<210>2

<211>135

<212>PRT

<213>basf-dewA

<400>2

Met Arg Phe Ile Val Ser Leu Leu Ala Phe Thr Ala Ala Ala Thr Ala

1 5 10 15

Thr Ala Leu Pro Ala Ser Ala Ala Lys Asn Ala Lys Leu Ala Thr Ser

20 25 30

Ala Ala Phe Ala Lys Gln Ala Glu Gly Thr Thr Cys Asn Val Gly Ser

35 40 45

Ile Ala Cys Cys Asn Ser Pro Ala Glu Thr Asn Asn Asp Ser Leu Leu

50 55 60

Ser Gly Leu Leu Gly Ala Gly Leu Leu Asn Gly Leu Ser Gly Asn Thr

65 70 75 80

Gly Ser Ala Cys Ala Lys Ala Ser Leu Ile Asp Gln Leu Gly Leu Leu

85 90 95

Ala Leu Val Asp His Thr Glu Glu Gly Pro Val Cys Lys Asn Ile Val

100 105 110

Ala Cys Cys Pro Glu Gly Thr Thr Asn Cys Val Ala Val Asp Asn Ala

115 120 125

Gly Ala Gly Thr Lys Ala Glu

130 135

<210>3

<211>471

<212>DNA

<213>basf-rodA

<220>

<221>CDS

<222>(1)..(471)

<223>

<400>3

atg aag ttc tcc att gct gcc gct gtc gtt gct ttc gcc gcc tcc gtc 48

Met Lys Phe Ser Ile Ala Ala Ala Val Val Ala Phe Ala Ala Ser Val

1 5 10 15

gcg gcc ctc cct cct gcc cat gat tcc cag ttc gct ggc aat ggt gtt 96

Ala Ala Leu Pro Pro Ala His Asp Ser Gln Phe Ala Gly Asn Gly Val

20 25 30

ggc aac aag ggc aac agc aac gtc aag ttc cct gtc ccc gaa aac gtg 144

Gly Asn Lys Gly Asn Ser Asn Val Lys Phe Pro Val Pro Glu Asn Val

35 40 45

acc gtc aag cag gcc tcc gac aag tgc ggt gac cag gcc cag ctc tct 192

Thr Val Lys Gln Ala Ser Asp Lys Cys Gly Asp Gln Ala Gln Leu Ser

50 55 60

tgc tgc aac aag gcc acg tac gcc ggt gac acc aca acc gtt gat gag 240

Cys Cys Asn Lys Ala Thr Tyr Ala Gly Asp Thr Thr Thr Val Asp Glu

65 70 75 80

ggt ctt ctg tct ggt gcc ctc agc ggc ctc atc ggc gcc ggg tct ggt 288

Gly Leu Leu Ser Gly Ala Leu Ser Gly Leu Ile Gly Ala Gly Ser Gly

85 90 95

gcc gaa ggt ctt ggt ctc ttc gat cag tgc tcc aag ctt gat gtt gct 336

Ala Glu Gly Leu Gly Leu Phe Asp Gln Cys Ser Lys Leu Asp Val Ala

100 105 110

gtc ctc att ggc atc caa gat ctt gtc aac cag aag tgc aag caa aac 384

Val Leu Ile Gly Ile Gln Asp Leu Val Asn Gln Lys Cys Lys Gln Asn

115 120 125

att gcc tgc tgc cag aac tcc ccc tcc agc gcg gat ggc aac ctt att 432

Ile Ala Cys Cys Gln Asn Ser Pro Ser Ser Ala Asp Gly Asn Leu Ile

130 135 140

ggt gtc ggt ctc cct tgc gtt gcc ctt ggc tcc atc ctc 471

Gly Val Gly Leu Pro Cys Val Ala Leu Gly Ser Ile Leu

145 150 155

<210>4

<211>157

<212>PRT

<213>basf-rodA

<400>4

Met Lys Phe Ser Ile Ala Ala Ala Val Val Ala Phe Ala Ala Ser Val

1 5 10 15

Ala Ala Leu Pro Pro Ala His Asp Ser Gln Phe Ala Gly Asn Gly Val

20 25 30

Gly Asn Lys Gly Asn Ser Asn Val Lys Phe Pro Val Pro Glu Asn Val

35 40 45

Thr Val Lys Gln Ala Ser Asp Lys Cys Gly Asp Gln Ala Gln Leu Ser

50 55 60

Cys Cys Asn Lys Ala Thr Tyr Ala Gly Asp Thr Thr Thr Val Asp Glu

65 70 75 80

Gly Leu Leu Ser Gly Ala Leu Ser Gly Leu Ile Gly Ala Gly Ser Gly

85 90 95

Ala Glu Gly Leu Gly Leu Phe Asp Gln Cys Ser Lys Leu Asp Val Ala

100 105 110

Val Leu Ile Gly Ile Gln Asp Leu Val Asn Gln Lys Cys Lys Gln Asn

115 120 125

Ile Ala Cys Cys Gln Asn Ser Pro Ser Ser Ala Asp Gly Asn Leu Ile

130 135 140

Gly Val Gly Leu Pro Cys Val Ala Leu Gly Ser Ile Leu

145 150 155

<210>5

<211>336

<212>DNA

<213>basf-HypA

<220>

<221>CDS

<222>(1)..(336)

<223>

<400>5

atg atc tct cgc gtc ctt gtc gct gct ctc gtc gct ctc ccc gct ctt 48

Met Ile Ser Arg Val Leu Val Ala Ala Leu Val Ala Leu Pro Ala Leu

1 5 10 15

gtt act gca act cct gct ccc gga aag cct aaa gcc agc agt cag tgc 96

Val Thr Ala Thr Pro Ala Pro Gly Lys Pro Lys Ala Ser Ser Gln Cys

20 25 30

gac gtc ggt gaa atc cat tgc tgt gac act cag cag act ccc gac cac 144

Asp Val Gly Glu Ile His Cys Cys Asp Thr Gln Gln Thr Pro Asp His

35 40 45

acc agc gcc gcc gcg tct ggt ttg ctt ggt gtt ccc atc aac ctt ggt 192

Thr Ser Ala Ala Ala Ser Gly Leu Leu Gly Val Pro Ile Asn Leu Gly

50 55 60

gct ttc ctc ggt ttc gac tgt acc ccc att tcc gtc ctt ggc gtc ggt 240

Ala Phe Leu Gly Phe Asp Cys Thr Pro Ile Ser Val Leu Gly Val Gly

65 70 75 80

ggc aac aac tgt gct gct cag cct gtc tgc tgc aca gga aat caa ttc 288

Gly Asn Asn Cys Ala Ala Gln Pro Val Cys Cys Thr Gly Asn Gln Phe

85 90 95

acc gca ttg att aac gct ctt gac tgc tct cct gtc aat gtc aac ctc 336

Thr Ala Leu Ile Asn Ala Leu Asp Cys Ser Pro Val Asn Val Asn Leu

100 105 110

<210>6

<211>112

<212>PRT

<213>basf-HypA

<400>6

Met Ile Ser Arg Val Leu Val Ala Ala Leu Val Ala Leu Pro Ala Leu

1 5 10 15

Val Thr Ala Thr Pro Ala Pro Gly Lys Pro Lys Ala Ser Ser Gln Cys

20 25 30

Asp Val Gly Glu Ile His Cys Cys Asp Thr Gln Gln Thr Pro Asp His

35 40 45

Thr Ser Ala Ala Ala Ser Gly Leu Leu Gly Val Pro Ile Asn Leu Gly

50 55 60

Ala Phe Leu Gly Phe Asp Cys Thr Pro Ile Ser Val Leu Gly Val Gly

65 70 75 80

Gly Asn Asn Cys Ala Ala Gln Pro Val Cys Cys Thr Gly Asn Gln Phe

85 90 95

Thr Ala Leu Ile Asn Ala Leu Asp Cys Ser Pro Val Asn Val Asn Leu

100 105 110

<210>7

<211>357

<212>DNA

<213>basf-HypB

<220>

<221>CDS

<222>(1)..(357)

<223>

<400>7

atg gtc agc acg ttc atc act gtc gca aag acc ctt ctc gtc gcg ctc 48

Met Val Ser Thr Phe Ile Thr Val Ala Lys Thr Leu Leu Val Ala Leu

1 5 10 15

ctc ttc gtc aat atc aat atc gtc gtt ggt act gca act acc ggc aag 96

Leu Phe Val Asn Ile Asn Ile Val Val Gly Thr Ala Thr Thr Gly Lys

20 25 30

cat tgt agc acc ggt cct atc gag tgc tgc aag cag gtc atg gat tct 144

His Cys Ser Thr Gly Pro Ile Glu Cys Cys Lys Gln Val Met Asp Ser

35 40 45

aag agc cct cag gct acg gag ctt ctt acg aag aat ggc ctt ggc ctg 192

Lys Ser Pro Gln Ala Thr Glu Leu Leu Thr Lys Asn Gly Leu Gly Leu

50 55 60

ggt gtc ctt gct ggc gtg aag ggt ctt gtt ggc gcg aat tgc agc cct 240

Gly Val Leu Ala Gly Val Lys Gly Leu Val Gly Ala Asn Cys Ser Pro

65 70 75 80

atc acg gca att ggt att ggc tcc ggc agc caa tgc tct ggc cag acc 288

Ile Thr Ala Ile Gly Ile Gly Ser Gly Ser Gln Cys Ser Gly Gln Thr

85 90 95

gtt tgc tgc cag aat aat aat ttc aac ggt gtt gtc gct att ggt tgc 336

Val Cys Cys Gln Asn Asn Asn Phe Asn Gly Val Val Ala Ile Gly Cys

100 105 110

act ccc att aat gcc aat gtg 357

Thr Pro Ile Asn Ala Asn Val

115

<210>8

<211>119

<212>PRT

<213>basf-HypB

<400>8

Met Val Ser Thr Phe Ile Thr Val Ala Lys Thr Leu Leu Val Ala Leu

1 5 10 15

Leu Phe Val Asn Ile Asn Ile Val Val Gly Thr Ala Thr Thr Gly Lys

20 25 30

His Cys Ser Thr Gly Pro Ile Glu Cys Cys Lys Gln Val Met Asp Ser

35 40 45

Lys Ser Pro Gln Ala Thr Glu Leu Leu Thr Lys Asn Gly Leu Gly Leu

50 55 60

Gly Val Leu Ala Gly Val Lys Gly Leu Val Gly Ala Asn Cys Ser Pro

65 70 75 80

Ile Thr Ala Ile Gly Ile Gly Ser Gly Ser Gln Cys Ser Gly Gln Thr

85 90 95

Val Cys Cys Gln Asn Asn Asn Phe Asn Gly Val Val Ala Ile Gly Cys

100 105 110

Thr Pro Ile Asn Ala Asn Val

115

<210>9

<211>408

<212>DNA

<213>basf-sc3

<220>

<221>CDS

<222>(1)..(408)

<223>

<400>9

atg ttc gcc cgt ctc ccc gtc gtg ttc ctc tac gcc ttc gtc gcg ttc 48

Met Phe Ala Arg Leu Pro Val Val Phe Leu Tyr Ala Phe Val Ala Phe

1 5 10 15

ggc gcc ctc gtc gct gcc ctc cca ggt ggc cac ccg ggc acg acc acg 96

Gly Ala Leu Val Ala Ala Leu Pro Gly Gly His Pro Gly Thr Thr Thr

20 25 30

ccg ccg gtt acg acg acg gtg acg gtg acc acg ccg ccc tcg acg acg 144

Pro Pro Val Thr Thr Thr Val Thr Val Thr Thr Pro Pro Ser Thr Thr

35 40 45

acc atc gcc gcc ggt ggc acg tgt act acg ggg tcg ctc tct tgc tgc 192

Thr Ile Ala Ala Gly Gly Thr Cys Thr Thr Gly Ser Leu Ser Cys Cys

50 55 60

aac cag gtt caa tcg gcg agc agc agc cct gtt acc gcc ctc ctc ggc 240

Asn Gln Val Gln Ser Ala Ser Ser Ser Pro Val Thr Ala Leu Leu Gly

65 70 75 80

ctg ctc ggc att gtc ctc agc gac ctc aac gtt ctc gtt ggc atc agc 288

Leu Leu Gly Ile Val Leu Ser Asp Leu Asn Val Leu Val Gly Ile Ser

85 90 95

tgc tct ccc ctc act gtc atc ggt gtc gga ggc agc ggc tgt tcg gcg 336

Cys Ser Pro Leu Thr Val Ile Gly Val Gly Gly Ser Gly Cys Ser Ala

100 105 110

cag acc gtc tgc tgc gaa aac acc caa ttc aac ggg ctg atc aac atc 384

Gln Thr Val Cys Cys Glu Asn Thr Gln Phe Asn Gly Leu Ile Asn Ile

115 120 125

ggt tgc acc ccc atc aac atc ctc 408

Gly Cys Thr Pro Ile Asn Ile Leu

130 135

<210>10

<211>136

<212>PRT

<213>basf-sc3

<400>10

Met Phe Ala Arg Leu Pro Val Val Phe Leu Tyr Ala Phe Val Ala Phe

1 5 10 15

Gly Ala Leu Val Ala Ala Leu Pro Gly Gly His Pro Gly Thr Thr Thr

20 25 30

Pro Pro Val Thr Thr Thr Val Thr Val Thr Thr Pro Pro Ser Thr Thr

35 40 45

Thr Ile Ala Ala Gly Gly Thr Cys Thr Thr Gly Ser Leu Ser Cys Cys

50 55 60

Asn Gln Val Gln Ser Ala Ser Ser Ser Pro Val Thr Ala Leu Leu Gly

65 70 75 80

Leu Leu Gly Ile Val Leu Ser Asp Leu Asn Val Leu Val Gly Ile Ser

85 90 95

Cys Ser Pro Leu Thr Val Ile Gly Val Gly Gly Ser Gly Cys Ser Ala

100 105 110

Gln Thr Val Cys Cys Glu Asn Thr Gln Phe Asn Gly Leu Ile Asn Ile

115 120 125

Gly Cys Thr Pro Ile Asn Ile Leu

130 135

<210>11

<211>483

<212>DNA

<213>basf-BASF1

<220>

<221>CDS

<222>(1)..(483)

<223>

<400>11

atg aag ttc tcc gtc tcc gcc gcc gtc ctc gcc ttc gcc gcc tcc gtc 48

Met Lys Phe Ser Val Ser Ala Ala Val Leu Ala Phe Ala Ala Ser Val

1 5 10 15

gcc gcc ctc cct cag cac gac tcc gcc gcc ggc aac ggc aac ggc gtc 96

Ala Ala Leu Pro Gln His Asp Ser Ala Ala Gly Asn Gly Asn Gly Val

20 25 30

ggc aac aag ttc cct gtc cct gac gac gtc acc gtc aag cag gcc acc 144

Gly Asn Lys Phe Pro Val Pro Asp Asp Val Thr Val Lys Gln Ala Thr

35 40 45

gac aag tgc ggc gac cag gcc cag ctc tcc tgc tgc aac aag gcc acc 192

Asp Lys Cys Gly Asp Gln Ala Gln Leu Ser Cys Cys Asn Lys Ala Thr

50 55 60

tac gcc ggc gac gtc ctc acc gac atc gac gag ggc atc ctc gcc ggc 240

Tyr Ala Gly Asp Val Leu Thr Asp Ile Asp Glu Gly Ile Leu Ala Gly

65 70 75 80

ctc ctc aag aac ctc atc ggc ggc ggc tcc ggc tcc gag ggc ctc ggc 288

Leu Leu Lys Asn Leu Ile Gly Gly Gly Ser Gly Ser Glu Gly Leu Gly

85 90 95

ctc ttc gac cag tgc gtc aag ctc gac ctc cag atc tcc gtc atc ggc 336

Leu Phe Asp Gln Cys Val Lys Leu Asp Leu Gln Ile Ser Val Ile Gly

100 105 110

atc cct atc cag gac ctc ctc aac cag gtc aac aag cag tgc aag cag 384

Ile Pro Ile Gln Asp Leu Leu Asn Gln Val Asn Lys Gln Cys Lys Gln

115 120 125

aac atc gcc tgc tgc cag aac tcc cct tcc gac gcc acc ggc tcc ctc 432

Asn Ile Ala Cys Cys Gln Asn Ser Pro Ser Asp Ala Thr Gly Ser Leu

130 135 140

gtc aac ctc ggc ctc ggc aac cct tgc atc cct gtc tcc ctc ctc cat 480

Val Asn Leu Gly Leu Gly Asn Pro Cys Ile Pro Val Ser Leu Leu His

145 150 155 160

atg 483

Met

<210>12

<211>161

<212>PRT

<213>basf-BASF1

<400>12

Met Lys Phe Ser Val Ser Ala Ala Val Leu Ala Phe Ala Ala Ser Val

1 5 10 15

Ala Ala Leu Pro Gln His Asp Ser Ala Ala Gly Asn Gly Asn Gly Val

20 25 30

Gly Asn Lys Phe Pro Val Pro Asp Asp Val Thr Val Lys Gln Ala Thr

35 40 45

Asp Lys Cys Gly Asp Gln Ala Gln Leu Ser Cys Cys Asn Lys Ala Thr

50 55 60

Tyr Ala Gly Asp Val Leu Thr Asp Ile Asp Glu Gly Ile Leu Ala Gly

65 70 75 80

Leu Leu Lys Asn Leu Ile Gly Gly Gly Ser Gly Ser Glu Gly Leu Gly

85 90 95

Leu Phe Asp Gln Cys Val Lys Leu Asp Leu Gln Ile Ser Val Ile Gly

100 105 110

Ile Pro Ile Gln Asp Leu Leu Asn Gln Val Asn Lys Gln Cys Lys Gln

115 120 125

Asn Ile Ala Cys Cys Gln Asn Ser Pro Ser Asp Ala Thr Gly Ser Leu

130 135 140

Val Asn Leu Gly Leu Gly Asn Pro Cys Ile Pro Val Ser Leu Leu His

145 150 155 160

Met

<210>13

<211>465

<212>DNA

<213>basf-BASF2

<220>

<221>CDS

<222>(1)..(465)

<223>

<400>13

atg aag ttc tcc gtc tcc gcc gcc gtc ctc gcc ttc gcc gcc tcc gtc 48

Met Lys Phe Ser Val Ser Ala Ala Val Leu Ala Phe Ala Ala Ser Val

1 5 10 15

gcc gcc ctc cct cag cac gac tcc gcc gcc ggc aac ggc aac ggc gtc 96

Ala Ala Leu Pro Gln His Asp Ser Ala Ala Gly Asn Gly Asn Gly Val

20 25 30

ggc aac aag ttc cct gtc cct gac gac gtc acc gtc aag cag gcc acc 144

Gly Asn Lys Phe Pro Val Pro Asp Asp Val Thr Val Lys Gln Ala Thr

35 40 45

gac aag tgc ggc gac cag gcc cag ctc tcc tgc tgc aac aag gcc acc 192

Asp Lys Cys Gly Asp Gln Ala Gln Leu Ser Cys Cys Asn Lys Ala Thr

50 55 60

tac gcc ggc gac gtc acc gac atc gac gag ggc atc ctc gcc ggc ctc 240

Tyr Ala Gly Asp Val Thr Asp Ile Asp Glu Gly Ile Leu Ala Gly Leu

65 70 75 80

ctc aag aac ctc atc ggc ggc ggc tcc ggc tcc gag ggc ctc ggc ctc 288

Leu Lys Asn Leu Ile Gly Gly Gly Ser Gly Ser Glu Gly Leu Gly Leu

85 90 95

ttc gac cag tgc gtc aag ctc gac ctc cag atc tcc gtc atc ggc atc 336

Phe Asp Gln Cys Val Lys Leu Asp Leu Gln Ile Ser Val Ile Gly Ile

100 105 110

cct atc cag gac ctc ctc aac cag cag tgc aag cag aac atc gcc tgc 384

Pro Ile Gln Asp Leu Leu Asn Gln Gln Cys Lys Gln Asn Ile Ala Cys

115 120 125

tgc cag aac tcc cct tcc gac gcc acc ggc tcc ctc gtc aac ctc ggc 432

Cys Gln Asn Ser Pro Ser Asp Ala Thr Gly Ser Leu Val Asn Leu Gly

130 135 140

aac cct tgc atc cct gtc tcc ctc ctc cat atg 465

Asn Pro Cys Ile Pro Val Ser Leu Leu His Met

145 150 155

<210>14

<211>155

<212>PRT

<213>basf-BASF2

<400>14

Met Lys Phe Ser Val Ser Ala Ala Val Leu Ala Phe Ala Ala Ser Val

1 5 10 15

Ala Ala Leu Pro Gln His Asp Ser Ala Ala Gly Asn Gly Asn Gly Val

20 25 30

Gly Asn Lys Phe Pro Val Pro Asp Asp Val Thr Val Lys Gln Ala Thr

35 40 45

Asp Lys Cys Gly Asp Gln Ala Gln Leu Ser Cys Cys Asn Lys Ala Thr

50 55 60

Tyr Ala Gly Asp Val Thr Asp Ile Asp Glu Gly Ile Leu Ala Gly Leu

65 70 75 80

Leu Lys Asn Leu Ile Gly Gly Gly Ser Gly Ser Glu Gly Leu Gly Leu

85 90 95

Phe Asp Gln Cys Val Lys Leu Asp Leu Gln Ile Ser Val Ile Gly Ile

100 105 110

Pro Ile Gln Asp Leu Leu Asn Gln Gln Cys Lys Gln Asn Ile Ala Cys

115 120 125

Cys Gln Asn Ser Pro Ser Asp Ala Thr Gly Ser Leu Val Asn Leu Gly

130 135 140

Asn Pro Cys Ile Pro Val Ser Leu Leu His Met

145 150 155

<210>15

<211>882

<212>DNA

<213>basf-yaad

<220>

<221>CDS

<222>(1)..(882)

<223>

<400>15

atg gct caa aca ggt act gaa cgt gta aaa cgc gga atg gca gaa atg 48

Met Ala Gln Thr Gly Thr Glu Arg Val Lys Arg Gly Met Ala Glu Met

1 5 10 15

caa aaa ggc ggc gtc atc atg gac gtc atc aat gcg gaa caa gcg aaa 96

Gln Lys Gly Gly Val Ile Met Asp Val Ile Asn Ala Glu Gln Ala Lys

20 25 30

atc gct gaa gaa gct gga gct gtc gct gta atg gcg cta gaa cgt gtg 144

Ile Ala Glu Glu Ala Gly Ala Val Ala Val Met Ala Leu Glu Arg Val

35 40 45

cca gca gat att cgc gcg gct gga gga gtt gcc cgt atg gct gac cct 192

Pro Ala Asp Ile Arg Ala Ala Gly Gly Val Ala Arg Met Ala Asp Pro

50 55 60

aca atc gtg gaa gaa gta atg aat gca gta tct atc ccg gta atg gca 240

Thr Ile Val Glu Glu Val Met Asn Ala Val Ser Ile Pro Val Met Ala

65 70 75 80

aaa gcg cgt atc gga cat att gtt gaa gcg cgt gtg ctt gaa gct atg 288

Lys Ala Arg Ile Gly His Ile Val Glu Ala Arg Val Leu Glu Ala Met

85 90 95

ggt gtt gac tat att gat gaa agt gaa gtt ctg acg ccg gct gac gaa 336

Gly Val Asp Tyr Ile Asp Glu Ser Glu Val Leu Thr Pro Ala Asp Glu

100 105 110

gaa ttt cat tta aat aaa aat gaa tac aca gtt cct ttt gtc tgt ggc 384

Glu Phe His Leu Asn Lys Asn Glu Tyr Thr Val Pro Phe Val Cys Gly

115 120 125

tgc cgt gat ctt ggt gaa gca aca cgc cgt att gcg gaa ggt gct tct 432

Cys Arg Asp Leu Gly Glu Ala Thr Arg Arg Ile Ala Glu Gly Ala Ser

130 135 140

atg ctt cgc aca aaa ggt gag cct gga aca ggt aat att gtt gag gct 480

Met Leu Arg Thr Lys Gly Glu Pro Gly Thr Gly Asn Ile Val Glu Ala

145 150 155 160

gtt cgc cat atg cgt aaa gtt aac gct caa gtg cgc aaa gta gtt gcg 528

Val Arg His Met Arg Lys Val Asn Ala Gln Val Arg Lys Val Val Ala

165 170 175

atg agt gag gat gag cta atg aca gaa gcg aaa aac cta ggt gct cct 576

Met Ser Glu Asp Glu Leu Met Thr Glu Ala Lys Asn Leu Gly Ala Pro

180 185 190

tac gag ctt ctt ctt caa att aaa aaa gac ggc aag ctt cct gtc gtt 624

Tyr Glu Leu Leu Leu Gln Ile Lys Lys Asp Gly Lys Leu Pro Val Val

195 200 205

aac ttt gcc gct ggc ggc gta gca act cca gct gat gct gct ctc atg 672

Asn Phe Ala Ala Gly Gly Val Ala Thr Pro Ala Asp Ala Ala Leu Met

210 215 220

atg cag ctt ggt gct gac gga gta ttt gtt ggt tct ggt att ttt aaa 720

Met Gln Leu Gly Ala Asp Gly Val Phe Val Gly Ser Gly Ile Phe Lys

225 230 235 240

tca gac aac cct gct aaa ttt gcg aaa gca att gtg gaa gca aca act 768

Ser Asp Asn Pro Ala Lys Phe Ala Lys Ala Ile Val Glu Ala Thr Thr

245 250 255

cac ttt act gat tac aaa tta atc gct gag ttg tca aaa gag ctt ggt 816

His Phe Thr Asp Tyr Lys Leu Ile Ala Glu Leu Ser Lys Glu Leu Gly

260 265 270

act gca atg aaa ggg att gaa atc tca aac tta ctt cca gaa cag cgt 864

Thr Ala Met Lys Gly Ile Glu Ile Ser Asn Leu Leu Pro Glu Gln Arg

275 280 285

atg caa gaa cgc ggc tgg 882

Met Gln Glu Arg Gly Trp

290

<210>16

<211>294

<212>PRT

<213>basf-yaad

<400>16

Met Ala Gln Thr Gly Thr Glu Arg Val Lys Arg Gly Met Ala Glu Met

1 5 10 15

Gln Lys Gly Gly Val Ile Met Asp Val Ile Asn Ala Glu Gln Ala Lys

20 25 30

Ile Ala Glu Glu Ala Gly Ala Val Ala Val Met Ala Leu Glu Arg Val

35 40 45

Pro Ala Asp Ile Arg Ala Ala Gly Gly Val Ala Arg Met Ala Asp Pro

50 55 60

Thr Ile Val Glu Glu Val Met Asn Ala Val Ser Ile Pro Val Met Ala

65 70 75 80

Lys Ala Arg Ile Gly His Ile Val Glu Ala Arg Val Leu Glu Ala Met

85 90 95

Gly Val Asp Tyr Ile Asp Glu Ser Glu Val Leu Thr Pro Ala Asp Glu

100 105 110

Glu Phe His Leu Asn Lys Asn Glu Tyr Thr Val Pro Phe Val Cys Gly

115 120 125

Cys Arg Asp Leu Gly Glu Ala Thr Arg Arg Ile Ala Glu Gly Ala Ser

130 135 140

Met Leu Arg Thr Lys Gly Glu Pro Gly Thr Gly Asn Ile Val Glu Ala

145 150 155 160

Val Arg His Met Arg Lys Val Asn Ala Gln Val Arg Lys Val Val Ala

165 170 175

Met Ser Glu Asp Glu Leu Met Thr Glu Ala Lys Asn Leu Gly Ala Pro

180 185 190

Tyr Glu Leu Leu Leu Gln Ile Lys Lys Asp Gly Lys Leu Pro Val Val

195 200 205

Asn Phe Ala Ala Gly Gly Val Ala Thr Pro Ala Asp Ala Ala Leu Met

210 215 220

Met Gln Leu Gly Ala Asp Gly Val Phe Val Gly Ser Gly Ile Phe Lys

225 230 235 240

Ser Asp Asn Pro Ala Lys Phe Ala Lys Ala Ile Val Glu Ala Thr Thr

245 250 255

His Phe Thr Asp Tyr Lys Leu Ile Ala Glu Leu Ser Lys Glu Leu Gly

260 265 270

Thr Ala Met Lys Gly Ile Glu Ile Ser Asn Leu Leu Pro Glu Gln Arg

275 280 285

Met Gln Glu Arg Gly Trp

290

<210>17

<211>591

<212>DNA

<213>basf-yaae

<220>

<221>CDS

<222>(1)..(591)

<223>

<400>17

atg gga tta aca ata ggt gta cta gga ctt caa gga gca gtt aga gag 48

Met Gly Leu Thr Ile Gly Val Leu Gly Leu Gln Gly Ala Val Arg Glu

1 5 10 15

cac atc cat gcg att gaa gca tgc ggc gcg gct ggt ctt gtc gta aaa 96

His Ile His Ala Ile Glu Ala Cys Gly Ala Ala Gly Leu Val Val Lys

20 25 30

cgt ccg gag cag ctg aac gaa gtt gac ggg ttg att ttg ccg ggc ggt 144

Arg Pro Glu Gln Leu Asn Glu Val Asp Gly Leu Ile Leu Pro Gly Gly

35 40 45

gag agc acg acg atg cgc cgt ttg atc gat acg tat caa ttc atg gag 192

Glu Ser Thr Thr Met Arg Arg Leu Ile Asp Thr Tyr Gln Phe Met Glu

50 55 60

ccg ctt cgt gaa ttc gct gct cag ggc aaa ccg atg ttt gga aca tgt 240

Pro Leu Arg Glu Phe Ala Ala Gln Gly Lys Pro Met Phe Gly Thr Cys

65 70 75 80

gcc gga tta att ata tta gca aaa gaa att gcc ggt tca gat aat cct 288

Ala Gly Leu Ile Ile Leu Ala Lys Glu Ile Ala Gly Ser Asp Asn Pro

85 90 95

cat tta ggt ctt ctg aat gtg gtt gta gaa cgt aat tca ttt ggc cgg 336

His Leu Gly Leu Leu Asn Val Val Val Glu Arg Asn Ser Phe Gly Arg

100 105 110

cag gtt gac agc ttt gaa gct gat tta aca att aaa ggc ttg gac gag 384

Gln Val Asp Ser Phe Glu Ala Asp Leu Thr Ile Lys Gly Leu Asp Glu

115 120 125

cct ttt act ggg gta ttc atc cgt gct ccg cat att tta gaa gct ggt 432

Pro Phe Thr Gly Val Phe Ile Arg Ala Pro His Ile Leu Glu Ala Gly

130 135 140

gaa aat gtt gaa gtt cta tcg gag cat aat ggt cgt att gta gcc gcg 480

Glu Asn Val Glu Val Leu Ser Glu His Asn Gly Arg Ile Val Ala Ala

145 150 155 160

aaa cag ggg caa ttc ctt ggc tgc tca ttc cat ccg gag ctg aca gaa 528

Lys Gln Gly Gln Phe Leu Gly Cys Ser Phe His Pro Glu Leu Thr Glu

165 170 175

gat cac cga gtg acg cag ctg ttt gtt gaa atg gtt gag gaa tat aag 576

Asp His Arg Val Thr Gln Leu Phe Val Glu Met Val Glu Glu Tyr Lys

180 185 190

caa aag gca ctt gta 591

Gln Lys Ala Leu Val

195

<210>18

<211>197

<212>PRT

<213>basf-yaae

<400>18

Met Gly Leu Thr Ile Gly Val Leu Gly Leu Gln Gly Ala Val Arg Glu

1 5 10 15

His Ile His Ala Ile Glu Ala Cys Gly Ala Ala Gly Leu Val Val Lys

20 25 30

Arg Pro Glu Gln Leu Asn Glu Val Asp Gly Leu Ile Leu Pro Gly Gly

35 40 45

Glu Ser Thr Thr Met Arg Arg Leu Ile Asp Thr Tyr Gln Phe Met Glu

50 55 60

Pro Leu Arg Glu Phe Ala Ala Gln Gly Lys Pro Met Phe Gly Thr Cys

65 70 75 80

Ala Gly Leu Ile Ile Leu Ala Lys GluIle Ala Gly Ser Asp Asn Pro

85 90 95

His Leu Gly Leu Leu Asn Val Val Val Glu Arg Asn Ser Phe Gly Arg

100 105 110

Gln Val Asp Ser Phe Glu Ala Asp Leu Thr Ile Lys Gly Leu Asp Glu

115 120 125

Pro Phe Thr Gly Val Phe Ile Arg Ala Pro His Ile Leu Glu Ala Gly

130 135 140

Glu Asn Val Glu Val Leu Ser Glu His Asn Gly Arg Ile Val Ala Ala

145 150 155 160

Lys Gln Gly Gln Phe Leu Gly Cys Ser Phe His Pro Glu Leu Thr Glu

165 170 175

Asp His Arg Val Thr Gln Leu Phe Val Glu Met Val Glu Glu Tyr Lys

180 185 190

Gln Lys Ala Leu Val

195

<210>19

<211>1329

<212>DNA

<213>basf-yaad-Xa-dewA-his

<220>

<221>CDS

<222>(1)..(1329)

<223>

<400>19

atg gct caa aca ggt act gaa cgt gta aaa cgc gga atg gca gaa atg 48

Met Ala Gln Thr Gly Thr Glu Arg Val Lys Arg Gly Met Ala Glu Met

1 5 10 15

caa aaa ggc ggc gtc atc atg gac gtc atc aat gcg gaa caa gcg aaa 96

Gln Lys Gly Gly Val Ile Met Asp Val Ile Asn Ala Glu Gln Ala Lys

20 25 30

atc gct gaa gaa gct gga gct gtc gct gta atg gcg cta gaa cgt gtg 144

Ile Ala Glu Glu Ala Gly Ala Val Ala Val Met Ala Leu Glu Arg Val

35 40 45

cca gca gat att cgc gcg gct gga gga gtt gcc cgt atg gct gac cct 192

Pro Ala Asp Ile Arg Ala Ala Gly Gly Val Ala Arg Met Ala Asp Pro

50 55 60

aca atc gtg gaa gaa gta atg aat gca gta tct atc ccg gta atg gca 240

Thr Ile Val Glu Glu Val Met Asn Ala Val Ser Ile Pro Val Met Ala

65 70 75 80

aaa gcg cgt atc gga cat att gtt gaa gcg cgt gtg ctt gaa gct atg 288

Lys Ala Arg Ile Gly His Ile Val Glu Ala Arg Val Leu Glu Ala Met

85 90 95

ggt gtt gac tat att gat gaa agt gaa gtt ctg acg ccg gct gac gaa 336

Gly Val Asp Tyr Ile Asp Glu Ser Glu Val Leu Thr Pro Ala Asp Glu

100 105 110

gaa ttt cat tta aat aaa aat gaa tac aca gtt cct ttt gtc tgt ggc 384

Glu Phe His Leu Asn Lys Asn Glu Tyr Thr Val Pro Phe Val Cys Gly

115 120 125

tgc cgt gat ctt ggt gaa gca aca cgc cgt att gcg gaa ggt gct tct 432

Cys Arg Asp Leu Gly Glu Ala Thr Arg Arg Ile Ala Glu Gly Ala Ser

130 135 140

atg ctt cgc aca aaa ggt gag cct gga aca ggt aat att gtt gag gct 480

Met Leu Arg Thr Lys Gly Glu Pro Gly Thr Gly Asn Ile Val Glu Ala

145 150 155 160

gtt cgc cat atg cgt aaa gtt aac gct caa gtg cgc aaa gta gtt gcg 528

Val Arg His Met Arg Lys Val Asn Ala Gln Val Arg Lys Val Val Ala

165 170 175

atg agt gag gat gag cta atg aca gaa gcg aaa aac cta ggt gct cct 576

Met Ser Glu Asp Glu Leu Met Thr Glu Ala Lys Asn Leu Gly Ala Pro

180 185 190

tac gag ctt ctt ctt caa att aaa aaa gac ggc aag ctt cct gtc gtt 624

Tyr Glu Leu Leu Leu Gln Ile Lys Lys Asp Gly Lys Leu Pro Val Val

195 200 205

aac ttt gcc gct ggc ggc gta gca act cca gct gat gct gct ctc atg 672

Asn Phe Ala Ala Gly Gly Val Ala Thr Pro Ala Asp Ala Ala Leu Met

210 215 220

atg cag ctt ggt gct gac gga gta ttt gtt ggt tct ggt att ttt aaa 720

Met Gln Leu Gly Ala Asp Gly Val Phe Val Gly Ser Gly Ile Phe Lys

225 230 235 240

tca gac aac cct gct aaa ttt gcg aaa gca att gtg gaa gca aca act 768

Ser Asp Asn Pro Ala Lys Phe Ala Lys Ala Ile Val Glu Ala Thr Thr

245 250 255

cac ttt act gat tac aaa tta atc gct gag ttg tca aaa gag ctt ggt 816

His Phe Thr Asp Tyr Lys Leu Ile Ala Glu Leu Ser Lys Glu Leu Gly

260 265 270

act gca atg aaa ggg att gaa atc tca aac tta ctt cca gaa cag cgt 864

Thr Ala Met Lys Gly Ile Glu Ile Ser Asn Leu Leu Pro Glu Gln Arg

275 280 285

atg caa gaa cgc ggc tgg aga tcc att gaa ggc cgc atg cgc ttc atc 912

Met Gln Glu Arg Gly Trp Arg Ser Ile Glu Gly Arg Met Arg Phe Ile

290 295 300

gtc tct ctc ctc gcc ttc act gcc gcg gcc acc gcg acc gcc ctc ccg 960

Val Ser Leu Leu Ala Phe Thr Ala Ala Ala Thr Ala Thr Ala Leu Pro

305 310 315 320

gcc tct gcc gca aag aac gcg aag ctg gcc acc tcg gcg gcc ttc gcc 1008

Ala Ser Ala Ala Lys Asn Ala Lys Leu Ala Thr Ser Ala Ala Phe Ala

325 330 335

aag cag gct gaa ggc acc acc tgc aat gtc ggc tcg atc gct tgc tgc 1056

Lys Gln Ala Glu Gly Thr Thr Cys Asn Val Gly Ser Ile Ala Cys Cys

340 345 350

aac tcc ccc gct gag acc aac aac gac agt ctg ttg agc ggt ctg ctc 1104

Asn Ser Pro Ala Glu Thr Asn Asn Asp Ser Leu Leu Ser Gly Leu Leu

355 360 365

ggt gct ggc ctt ctc aac ggg ctc tcg ggc aac act ggc agc gcc tgc 1152

Gly Ala Gly Leu Leu Asn Gly Leu Ser Gly Asn Thr Gly Ser Ala Cys

370 375 380

gcc aag gcg agc ttg att gac cag ctg ggt ctg ctc gct ctc gtc gac 1200

Ala Lys Ala Ser Leu Ile Asp Gln Leu Gly Leu Leu Ala Leu Val Asp

385 390 395 400

cac act gag gaa ggc ccc gtc tgc aag aac atc gtc gct tgc tgc cct 1248

His Thr Glu Glu Gly Pro Val Cys Lys Asn Ile Val Ala Cys Cys Pro

405 410 415

gag gga acc acc aac tgt gtt gcc gtc gac aac gct ggc gct ggt acc 1296

Glu Gly Thr Thr Asn Cys Val Ala Val Asp Asn Ala Gly Ala Gly Thr

420 425 430

aag gct gag gga tct cat cac cat cac cat cac 1329

Lys Ala Glu Gly Ser His His His His His His

435 440

<210>20

<211>443

<212>PRT

<213>basf-yaad-Xa-dewA-his

<400>20

Met Ala Gln Thr Gly Thr Glu Arg Val Lys Arg Gly Met Ala Glu Met

1 5 10 15

Gln Lys Gly Gly Val Ile Met Asp Val Ile Asn Ala Glu Gln Ala Lys

20 25 30

Ile Ala Glu Glu Ala Gly Ala Val Ala Val Met Ala Leu Glu Arg Val

35 40 45

Pro Ala Asp Ile Arg Ala Ala Gly Gly Val Ala Arg Met Ala Asp Pro

50 55 60

Thr Ile Val Glu Glu Val Met Asn Ala Val Ser Ile Pro Val Met Ala

65 70 75 80

Lys Ala Arg Ile Gly His Ile Val Glu Ala Arg Val Leu Glu Ala Met

85 90 95

Gly Val Asp Tyr Ile Asp Glu Ser Glu Val Leu Thr Pro Ala Asp Glu

100 105 110

Glu Phe His Leu Asn Lys Asn Glu Tyr Thr Val Pro Phe Val Cys Gly

115 120 125

Cys Arg Asp Leu Gly Glu Ala Thr Arg Arg Ile Ala Glu Gly Ala Ser

130 135 140

Met Leu Arg Thr Lys Gly Glu Pro Gly Thr Gly Asn Ile Val Glu Ala

145 150 155 160

Val Arg His Met Arg Lys Val Asn Ala Gln Val Arg Lys Val Val Ala

165 170 175

Met Ser Glu Asp Glu Leu Met Thr Glu Ala Lys Asn Leu Gly Ala Pro

180 185 190

Tyr Glu Leu Leu Leu Gln Ile Lys Lys Asp Gly Lys Leu Pro Val Val

195 200 205

Asn Phe Ala Ala Gly Gly Val Ala Thr Pro Ala Asp Ala Ala Leu Met

210 215 220

Met Gln Leu Gly Ala Asp Gly Val Phe Val Gly Ser Gly Ile Phe Lys

225 230 235 240

Ser Asp Asn Pro Ala Lys Phe Ala Lys Ala Ile Val Glu Ala Thr Thr

245 250 255

His Phe Thr Asp Tyr Lys Leu Ile Ala Glu Leu Ser Lys Glu Leu Gly

260 265 270

Thr Ala Met Lys Gly Ile Glu Ile Ser Asn Leu Leu Pro Glu Gln Arg

275 280 285

Met Gln Glu Arg Gly Trp Arg Ser Ile Glu Gly Arg Met Arg Phe Ile

290 295 300

Val Ser Leu Leu Ala Phe Thr Ala Ala Ala Thr Ala Thr Ala Leu Pro

305 310 315 320

Ala Ser Ala Ala Lys Asn Ala Lys Leu Ala Thr Ser Ala Ala Phe Ala

325 330 335

Lys Gln Ala Glu Gly Thr Thr Cys Asn Val Gly Ser Ile Ala Cys Cys

340 345 350

Asn Ser Pro Ala Glu Thr Asn Asn Asp Ser Leu Leu Ser Gly Leu Leu

355 360 365

Gly Ala Gly Leu Leu Asn Gly Leu Ser Gly Asn Thr Gly Ser Ala Cys

370 375 380

Ala Lys Ala Ser LeuIle Asp Gln Leu Gly Leu Leu Ala Leu Val Asp

385 390 395 400

His Thr Glu Glu Gly Pro Val Cys Lys Asn Ile Val Ala Cys Cys Pro

405 410 415

Glu Gly Thr Thr Asn Cys Val Ala Val Asp Asn Ala Gly Ala Gly Thr

420 425 430

Lys Ala Glu Gly Ser His His His His His His

435 440

<210>21

<211>1395

<212>DNA

<213>basf-yaad-Xa-rodA-his

<220>

<221>CDS

<222>(1)..(1395)

<223>

<400>21

atg gct caa aca ggt act gaa cgt gta aaa cgc gga atg gca gaa atg 48

Met Ala Gln Thr Gly Thr Glu Arg Val Lys Arg Gly Met Ala Glu Met

1 5 10 15

caa aaa ggc ggc gtc atc atg gac gtc atc aat gcg gaa caa gcg aaa 96

Gln Lys Gly Gly Val Ile Met Asp Val Ile Asn Ala Glu Gln Ala Lys

20 25 30

atc gct gaa gaa gct gga gct gtc gct gta atg gcg cta gaa cgt gtg 144

Ile Ala Glu Glu Ala Gly Ala Val Ala Val Met Ala Leu Glu Arg Val

35 40 45

cca gca gat att cgc gcg gct gga gga gtt gcc cgt atg gct gac cct 192

Pro Ala Asp Ile Arg Ala Ala Gly Gly Val Ala Arg Met Ala Asp Pro

50 55 60

aca atc gtg gaa gaa gta atg aat gca gta tct atc ccg gta atg gca 240

Thr Ile Val Glu Glu Val Met Asn Ala Val Ser Ile Pro Val Met Ala

65 70 75 80

aaa gcg cgt atc gga cat att gtt gaa gcg cgt gtg ctt gaa gct atg 288

Lys Ala Arg Ile Gly His Ile Val Glu Ala Arg Val Leu Glu Ala Met

85 90 95

ggt gtt gac tat att gat gaa agt gaa gtt ctg acg ccg gct gac gaa 336

Gly Val Asp Tyr Ile Asp Glu Ser Glu Val Leu Thr Pro Ala Asp Glu

100 105 110

gaa ttt cat tta aat aaa aat gaa tac aca gtt cct ttt gtc tgt ggc 384

Glu Phe His Leu Asn Lys Asn Glu Tyr Thr Val Pro Phe Val Cys Gly

115 120 125

tgc cgt gat ctt ggt gaa gca aca cgc cgt att gcg gaa ggt gct tct 432

Cys Arg Asp Leu Gly Glu Ala Thr Arg Arg Ile Ala Glu Gly Ala Ser

130 135 140

atg ctt cgc aca aaa ggt gag cct gga aca ggt aat att gtt gag gct 480

Met Leu Arg Thr Lys Gly Glu Pro Gly Thr Gly Asn Ile Val Glu Ala

145 150 155 160

gtt cgc cat atg cgt aaa gtt aac gct caa gtg cgc aaa gta gtt gcg 528

Val Arg His Met Arg Lys Val Asn Ala Gln Val Arg Lys Val Val Ala

165 170 175

atg agt gag gat gag cta atg aca gaa gcg aaa aac cta ggt gct cct 576

Met Ser Glu Asp Glu Leu Met Thr Glu Ala Lys Asn Leu Gly Ala Pro

180 185 190

tac gag ctt ctt ctt caa att aaa aaa gac ggc aag ctt cct gtc gtt 624

Tyr Glu Leu Leu Leu Gln Ile Lys Lys Asp Gly Lys Leu Pro Val Val

195 200 205

aac ttt gcc gct ggc ggc gta gca act cca gct gat gct gct ctc atg 672

Asn Phe Ala Ala Gly Gly Val Ala Thr Pro Ala Asp Ala Ala Leu Met

210 215 220

atg cag ctt ggt gct gac gga gta ttt gtt ggt tct ggt att ttt aaa 720

Met Gln Leu Gly Ala Asp Gly Val Phe Val Gly Ser Gly Ile Phe Lys

225 230 235 240

tca gac aac cct gct aaa ttt gcg aaa gca att gtg gaa gca aca act 768

Ser Asp Asn Pro Ala Lys Phe Ala Lys Ala Ile Val Glu Ala Thr Thr

245 250 255

cac ttt act gat tac aaa tta atc gct gag ttg tca aaa gag ctt ggt 816

His Phe Thr Asp Tyr Lys LeuIle Ala Glu Leu Ser Lys Glu Leu Gly

260 265 270

act gca atg aaa ggg att gaa atc tca aac tta ctt cca gaa cag cgt 864

Thr Ala Met Lys Gly Ile Glu Ile Ser Asn Leu Leu Pro Glu Gln Arg

275 280 285

atg caa gaa cgc ggc tgg aga tct att gaa ggc cgc atg aag ttc tcc 912

Met Gln Glu Arg Gly Trp Arg Ser Ile Glu Gly Arg Met Lys Phe Ser

290 295 300

att gct gcc gct gtc gtt gct ttc gcc gcc tcc gtc gcg gcc ctc cct 960

Ile Ala Ala Ala Val Val Ala Phe Ala Ala Ser Val Ala Ala Leu Pro

305 310 315 320

cct gcc cat gat tcc cag ttc gct ggc aat ggt gtt ggc aac aag ggc 1008

Pro Ala His Asp Ser Gln Phe Ala Gly Asn Gly Val Gly Asn Lys Gly

325 330 335

aac agc aac gtc aag ttc cct gtc ccc gaa aac gtg acc gtc aag cag 1056

Asn Ser Asn Val Lys Phe Pro Val Pro Glu Asn Val Thr Val Lys Gln

340 345 350

gcc tcc gac aag tgc ggt gac cag gcc cag ctc tct tgc tgc aac aag 1104

Ala Ser Asp Lys Cys Gly Asp Gln Ala Gln Leu Ser Cys Cys Asn Lys

355 360 365

gcc acg tac gcc ggt gac acc aca acc gtt gat gag ggt ctt ctg tct 1152

Ala Thr Tyr Ala Gly Asp Thr Thr Thr Val Asp Glu Gly Leu Leu Ser

370 375 380

ggt gcc ctc agc ggc ctc atc ggc gcc ggg tct ggt gcc gaa ggt ctt 1200

Gly Ala Leu Ser Gly Leu Ile Gly Ala Gly Ser Gly Ala Glu Gly Leu

385 390 395 400

ggt ctc ttc gat cag tgc tcc aag ctt gat gtt gct gtc ctc att ggc 1248

Gly Leu Phe Asp Gln Cys Ser Lys Leu Asp Val Ala Val Leu Ile Gly

405 410 415

atc caa gat ctt gtc aac cag aag tgc aag caa aac att gcc tgc tgc 1296

Ile Gln Asp Leu Val Asn Gln Lys Cys Lys Gln Asn Ile Ala Cys Cys

420 425 430

cag aac tcc ccc tcc agc gcg gat ggc aac ctt att ggt gtc ggt ctc 1344

Gln Asn Ser Pro Ser Ser Ala Asp Gly Asn Leu Ile Gly Val Gly Leu

435 440 445

cct tgc gtt gcc ctt ggc tcc atc ctc gga tct cat cac cat cac cat 1392

Pro Cys Val Ala Leu Gly Ser Ile Leu Gly Ser His His His His His

450 455 460

cac 1395

His

465

<210>22

<211>465

<212>PRT

<213>basf-yaad-Xa-rodA-his

<400>22

Met Ala Gln Thr Gly Thr Glu Arg Val Lys Arg Gly Met Ala Glu Met

1 5 10 15

Gln Lys Gly Gly Val Ile Met Asp Val Ile Asn Ala Glu Gln Ala Lys

20 25 30

Ile Ala Glu Glu Ala Gly Ala Val Ala Val Met Ala Leu Glu Arg Val

35 40 45

Pro Ala Asp Ile Arg Ala Ala Gly Gly Val Ala Arg Met Ala Asp Pro

50 55 60

Thr Ile Val Glu Glu Val Met Asn Ala Val Ser Ile Pro Val Met Ala

65 70 75 80

Lys Ala Arg Ile Gly His Ile Val Glu Ala Arg Val Leu Glu Ala Met

85 90 95

Gly Val Asp Tyr Ile Asp Glu Ser Glu Val Leu Thr Pro Ala Asp Glu

100 105 110

Glu Phe His Leu Asn Lys Asn Glu Tyr Thr Val Pro Phe Val Cys Gly

115 120 125

Cys Arg Asp Leu Gly Glu Ala Thr Arg Arg Ile Ala Glu Gly Ala Ser

130 135 140

Met Leu Arg Thr Lys Gly Glu Pro Gly Thr Gly Asn Ile Val Glu Ala

145 150 155 160

Val Arg His Met Arg Lys Val Asn Ala Gln Val Arg Lys Val Val Ala

165 170 175

Met Ser Glu Asp Glu Leu Met Thr Glu Ala Lys Asn Leu Gly Ala Pro

180 185 190

Tyr Glu Leu Leu Leu Gln Ile Lys Lys Asp Gly Lys Leu Pro Val Val

195 200 205

Asn Phe Ala Ala Gly Gly Val Ala Thr Pro Ala Asp Ala Ala Leu Met

210 215 220

Met Gln Leu Gly Ala Asp Gly Val Phe Val Gly Ser Gly Ile Phe Lys

225 230 235 240

Ser Asp Asn Pro Ala Lys Phe Ala Lys Ala Ile Val Glu Ala Thr Thr

245 250 255

His Phe Thr Asp Tyr Lys Leu Ile Ala Glu Leu Ser Lys Glu Leu Gly

260 265 270

Thr Ala Met Lys Gly Ile Glu Ile Ser Asn Leu Leu Pro Glu Gln Arg

275 280 285

Met Gln Glu Arg Gly Trp Arg Ser Ile Glu Gly Arg Met Lys Phe Ser

290 295 300

Ile Ala Ala Ala Val Val Ala Phe Ala Ala Ser Val Ala Ala Leu Pro

305 310 315 320

Pro Ala His Asp Ser Gln Phe Ala Gly Asn Gly Val Gly Asn Lys Gly

325 330 335

Asn Ser Asn Val Lys Phe Pro Val Pro Glu Asn Val Thr Val Lys Gln

340 345 350

Ala Ser Asp Lys Cys Gly Asp Gln Ala Gln Leu Ser Cys Cys Asn Lys

355 360 365

Ala Thr Tyr Ala Gly Asp Thr Thr Thr Val Asp Glu Gly Leu Leu Ser

370 375 380

Gly Ala Leu Ser Gly Leu Ile Gly Ala Gly Ser Gly Ala Glu Gly Leu

385 390 395 400

Gly Leu Phe Asp Gln Cys Ser Lys Leu Asp Val Ala Val Leu Ile Gly

405 410 415

Ile Gln Asp Leu Val Asn Gln Lys Cys Lys Gln Asn Ile Ala Cys Cys

420 425 430

Gln Asn Ser Pro Ser Ser Ala Asp Gly Asn Leu Ile Gly Val Gly Leu

435 440 445

Pro Cys Val Ala Leu Gly Ser Ile Leu Gly Ser His His His His His

450 455 460

His

465

<210>23

<211>1407

<212>DNA

<213>basf-yaad-Xa-BASF1-his

<220>

<221>CDS

<222>(1)..(1407)

<223>

<400>23

atg gct caa aca ggt act gaa cgt gta aaa cgc gga atg gca gaa atg 48

Met Ala Gln Thr Gly Thr Glu Arg Val Lys Arg Gly Met Ala Glu Met

1 5 10 15

caa aaa ggc ggc gtc atc atg gac gtc atc aat gcg gaa caa gcg aaa 96

Gln Lys Gly Gly Val Ile Met Asp Val Ile Asn Ala Glu Gln Ala Lys

20 25 30

atc gct gaa gaa gct gga gct gtc gct gta atg gcg cta gaa cgt gtg 144

Ile Ala Glu Glu Ala Gly Ala Val Ala Val Met Ala Leu Glu Arg Val

35 40 45

cca gca gat att cgc gcg gct gga gga gtt gcc cgt atg gct gac cct 192

Pro Ala Asp Ile Arg Ala Ala Gly Gly Val Ala Arg Met Ala Asp Pro

50 55 60

aca atc gtg gaa gaa gta atg aat gca gta tct atc ccg gta atg gca 240

Thr Ile Val Glu Glu Val Met Asn Ala Val Ser Ile Pro Val Met Ala

65 70 75 80

aaa gcg cgt atc gga cat att gtt gaa gcg cgt gtg ctt gaa gct atg 288

Lys Ala Arg Ile Gly His Ile Val Glu Ala Arg Val Leu Glu Ala Met

85 90 95

ggt gtt gac tat att gat gaa agt gaa gtt ctg acg ccg gct gac gaa 336

Gly Val Asp Tyr Ile Asp Glu Ser Glu Val Leu Thr Pro Ala Asp Glu

100 105 110

gaa ttt cat tta aat aaa aat gaa tac aca gtt cct ttt gtc tgt ggc 384

Glu Phe His Leu Asn Lys Asn Glu Tyr Thr Val Pro Phe Val Cys Gly

115 120 125

tgc cgt gat ctt ggt gaa gca aca cgc cgt att gcg gaa ggt gct tct 432

Cys Arg Asp Leu Gly Glu Ala Thr Arg Arg Ile Ala Glu Gly Ala Ser

130 135 140

atg ctt cgc aca aaa ggt gag cct gga aca ggt aat att gtt gag gct 480

Met Leu Arg Thr Lys Gly Glu Pro Gly Thr Gly Asn Ile Val Glu Ala

145 150 155 160

gtt cgc cat atg cgt aaa gtt aac gct caa gtg cgc aaa gta gtt gcg 528

Val Arg His Met Arg Lys Val Asn Ala Gln Val Arg Lys Val Val Ala

165 170 175

atg agt gag gat gag cta atg aca gaa gcg aaa aac cta ggt gct cct 576

Met Ser Glu Asp Glu Leu Met Thr Glu Ala Lys Asn Leu Gly Ala Pro

180 185 190

tac gag ctt ctt ctt caa att aaa aaa gac ggc aag ctt cct gtc gtt 624

Tyr Glu Leu Leu Leu Gln Ile Lys Lys Asp Gly Lys Leu Pro Val Val

195 200 205

aac ttt gcc gct ggc ggc gta gca act cca gct gat gct gct ctc atg 672

Asn Phe Ala Ala Gly Gly Val Ala Thr Pro Ala Asp Ala Ala Leu Met

210 215 220

atg cag ctt ggt gct gac gga gta ttt gtt ggt tct ggt att ttt aaa 720

Met Gln Leu Gly Ala Asp Gly Val Phe Val Gly Ser Gly Ile Phe Lys

225 230 235 240

tca gac aac cct gct aaa ttt gcg aaa gca att gtg gaa gca aca act 768

Ser Asp Asn Pro Ala Lys Phe Ala Lys Ala Ile Val Glu Ala Thr Thr

245 250 255

cac ttt act gat tac aaa tta atc gct gag ttg tca aaa gag ctt ggt 816

His Phe Thr Asp Tyr Lys Leu Ile Ala Glu Leu Ser Lys Glu Leu Gly

260 265 270

act gca atg aaa ggg att gaa atc tca aac tta ctt cca gaa cag cgt 864

Thr Ala Met Lys Gly Ile Glu Ile Ser Asn Leu Leu Pro Glu Gln Arg

275 280 285

atg caa gaa cgc ggc tgg aga tct att gaa ggc cgc atg aag ttc tcc 912

Met Gln Glu Arg Gly Trp Arg Ser Ile Glu Gly Arg Met Lys Phe Ser

290 295 300

gtc tcc gcc gcc gtc ctc gcc ttc gcc gcc tcc gtc gcc gcc ctc cct 960

Val Ser Ala Ala Val Leu Ala Phe Ala Ala Ser Val Ala Ala Leu Pro

305 310 315 320

cag cac gac tcc gcc gcc ggc aac ggc aac ggc gtc ggc aac aag ttc 1008

Gln His Asp Ser Ala Ala Gly Asn Gly Asn Gly Val Gly Asn Lys Phe

325 330 335

cct gtc cct gac gac gtc acc gtc aag cag gcc acc gac aag tgc ggc 1056

Pro Val Pro Asp Asp Val Thr Val Lys Gln Ala Thr Asp Lys Cys Gly

340 345 350

gac cag gcc cag ctc tcc tgc tgc aac aag gcc acc tac gcc ggc gac 1104

Asp Gln Ala Gln Leu Ser Cys Cys Asn Lys Ala Thr Tyr Ala Gly Asp

355 360 365

gtc ctc acc gac atc gac gag ggc atc ctc gcc ggc ctc ctc aag aac 1152

Val Leu Thr Asp Ile Asp Glu Gly Ile Leu Ala Gly Leu Leu Lys Asn

370 375 380

ctc atc ggc ggc ggc tcc ggc tcc gag ggc ctc ggc ctc ttc gac cag 1200

Leu Ile Gly Gly Gly Ser Gly Ser Glu Gly Leu Gly Leu Phe Asp Gln

385 390 395 400

tgc gtc aag ctc gac ctc cag atc tcc gtc atc ggc atc cct atc cag 1248

Cys Val Lys Leu Asp Leu Gln Ile Ser Val Ile Gly Ile Pro Ile Gln

405 410 415

gac ctc ctc aac cag gtc aac aag cag tgc aag cag aac atc gcc tgc 1296

Asp Leu Leu Asn Gln Val Asn Lys Gln Cys Lys Gln Asn Ile Ala Cys

420 425 430

tgc cag aac tcc cct tcc gac gcc acc ggc tcc ctc gtc aac ctc ggc 1344

Cys Gln Asn Ser Pro Ser Asp Ala Thr Gly Ser Leu Val Asn Leu Gly

435 440 445

ctc ggc aac cct tgc atc cct gtc tcc ctc ctc cat atg gga tct cat 1392

Leu Gly Asn Pro Cys Ile Pro Val Ser Leu Leu His Met Gly Ser His

450 455 460

cac cat cac cat cac 1407

His His His His His

465

<210>24

<211>469

<212>PRT

<213>basf-yaad-Xa-BASF1-his

<400>24

Met Ala Gln Thr Gly Thr Glu Arg Val Lys Arg Gly Met Ala Glu Met

1 5 10 15

Gln Lys Gly Gly Val Ile Met Asp Val Ile Asn Ala Glu Gln Ala Lys

20 25 30

Ile Ala Glu Glu Ala Gly Ala Val Ala Val Met Ala Leu Glu Arg Val

35 40 45

Pro Ala Asp Ile Arg Ala Ala Gly Gly Val Ala Arg Met Ala Asp Pro

50 55 60

Thr Ile Val Glu Glu Val Met Asn Ala Val Ser Ile Pro Val Met Ala

65 70 75 80

Lys Ala Arg Ile Gly His Ile Val Glu Ala Arg Val Leu Glu Ala Met

85 90 95

Gly Val Asp Tyr Ile Asp Glu Ser Glu Val Leu Thr Pro Ala Asp Glu

100 105 110

Glu Phe His Leu Asn Lys Asn Glu Tyr Thr Val Pro Phe Val Cys Gly

115 120 125

Cys Arg Asp Leu Gly Glu Ala Thr Arg Arg Ile Ala Glu Gly Ala Ser

130 135 140

Met Leu Arg Thr Lys Gly Glu Pro Gly Thr Gly Asn Ile Val Glu Ala

145 150 155 160

Val Arg His Met Arg Lys Val Asn Ala Gln Val Arg Lys Val Val Ala

165 170 175

Met Ser Glu Asp Glu Leu Met Thr Glu Ala Lys Asn Leu Gly Ala Pro

180 185 190

Tyr Glu Leu Leu Leu Gln Ile Lys Lys Asp Gly Lys Leu Pro Val Val

195 200 205

Asn Phe Ala Ala Gly Gly Val Ala Thr Pro Ala Asp Ala Ala Leu Met

210 215 220

Met Gln Leu Gly Ala Asp Gly Val Phe Val Gly Ser Gly Ile Phe Lys

225 230 235 240

Ser Asp Asn Pro Ala Lys Phe Ala Lys Ala Ile Val Glu Ala Thr Thr

245 250 255

His Phe Thr Asp Tyr Lys Leu Ile Ala Glu Leu Ser Lys Glu Leu Gly

260 265 270

Thr Ala Met Lys Gly Ile Glu Ile Ser Asn Leu Leu Pro Glu Gln Arg

275 280 285

Met Gln Glu Arg Gly Trp Arg Ser Ile Glu Gly Arg Met Lys Phe Ser

290 295 300

Val Ser Ala Ala Val Leu Ala Phe Ala Ala Ser Val Ala Ala Leu Pro

305 310 315 320

Gln His Asp Ser Ala Ala Gly Asn Gly Asn Gly Val Gly Asn Lys Phe

325 330 335

Pro Val Pro Asp Asp Val Thr Val Lys Gln Ala Thr Asp Lys Cys Gly

340 345 350

Asp Gln Ala Gln Leu Ser Cys Cys Asn Lys Ala Thr Tyr Ala Gly Asp

355 360 365

Val Leu Thr AspIle Asp Glu Gly Ile Leu Ala Gly Leu Leu Lys Asn

370 375 380

Leu Ile Gly Gly Gly Ser Gly Ser Glu Gly Leu Gly Leu Phe Asp Gln

385 390 395 400

Cys Val Lys Leu Asp Leu Gln Ile Ser Val Ile Gly Ile Pro Ile Gln

405 410 415

Asp Leu Leu Asn Gln Val Asn Lys Gln Cys Lys Gln Asn Ile Ala Cys

420 425 430

Cys Gln Asn Ser Pro Ser Asp Ala Thr Gly Ser Leu Val Asn Leu Gly

435 440 445

Leu Gly Asn Pro Cys Ile Pro Val Ser Leu Leu His Met Gly Ser His

450 455 460

His His His His His

465

Claims

1.通用结构式(I)的多肽

X_n-C¹-X_1-50-C²-X_0-5-C³-X_p-C⁴-X_1-100-C⁵-X_1-50-C⁶-X_0-5-C⁷-X_1-50-C⁸-X_m

(I)

其中X可以是20种天然存在的氨基酸中的任何一种，

n和m是0-500之间的数，p是1-250之间的数，C是半胱氨酸、丙氨酸、丝氨酸、甘氨酸、甲硫氨酸或苏氨酸，有至少4个由C指定的残基为半胱氨酸，且其中C³为半胱氨酸和C⁴为半胱氨酸，

附带条件是至少一个缩写为X_n或X_m或X_p的肽序列是长度至少为20个氨基酸的非天然连接至疏水蛋白的肽序列，该多肽在包被玻璃表面之后使接触角改变至少20°。

2.根据权利要求1的多肽，其中结构式(I)包含I类疏水蛋白。

3.根据权利要求1的多肽，其中结构式(I)包含选自dewA、rodA、sc3、hypA、hypB、basf1、basf2组成的组的疏水蛋白。

4.根据权利要求1的多肽，其中结构式(I)包含选自SEQ ID NO：2、4、6、8、10、12、14的序列。

5.根据权利要求1的多肽，其中X_n或X_m包含选自SEQ ID NO：16、18的多肽序列。

6.根据权利要求1的多肽，其中X_n或X_m是(His)_4-10序列。

7.根据权利要求1的多肽，其中结构式(I)包含选自SEQ ID NO：20、22、24组成的组的多肽。

8.编码权利要求1-7中任一项定义的多肽的核酸。

9.产生权利要求1-7中任一项定义的多肽的方法，该方法是通过在宿主生物体中表达权利要求8中定义的核酸，并且分离由此获得的蛋白质，如果合适则在纯化之后分离。

10.根据权利要求9的方法，其中使用的宿主生物体是大肠杆菌。

11.权利要求1-7中任一项的多肽用于表面包被的用途。