CN101426918B

CN101426918B - 磷脂酶，编码磷脂酶的核酸以及制备和应用磷脂酶的方法

Info

Publication number: CN101426918B
Application number: CN2005800146676A
Authority: CN
Inventors: S·格拉马蒂科瓦; G·黑兹尔伍德; D·拉姆; N·R·巴顿; B·G·斯特吉斯; D·E·罗伯逊; J·李; J·A·克雷泼斯; R·菲尔丁; R·C·布朗; A·瓦萨瓦达; X·谭; A·巴迪洛; W·P·范赫克; G·詹森; C·艾萨克; M·J·伯克
Original assignee: DSM IP Assets BV
Current assignee: Dsm Food Professional Co ltd; DSM IP Assets BV
Priority date: 2004-03-08
Filing date: 2005-03-08
Publication date: 2013-03-27
Anticipated expiration: 2025-03-08
Also published as: AU2005221136A1; WO2005086900A3; HUE030573T2; EP1748954A4; US20050108789A1; CA2559060C; PT1748954T; US20080317731A1; US7226771B2; JP2011172583A; JP2007531516A; CN101426918A; EP1748954B1; EP1748954A2; ES2601431T3; PL1748954T3; US7977080B2; AU2005221136B2; WO2005086900A2; BRPI0508559B1

Abstract

本发明提供了具有磷脂酶活性的新型多肽，编码它们的核酸和与它们结合的抗体，所述磷脂酶活性包括，例如，磷脂酶A、B、C和D活性，马铃薯块茎蛋白活性，磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)活性。也提供包括应用这些磷脂酶的工业方法，如，油脱胶，以及包括应用这些磷脂酶的产品。

Description

磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法

发明领域

总体上说，本发明涉及磷脂酶，编码磷脂酶的多核苷酸，制备以及使用这些多核苷酸和多肽的方法。特别地，本发明提供了具有磷脂酶活性的新颖多肽，编码它们的核酸以及与它们结合的抗体。也提供了包括应用这些磷脂酶的工业方法和产品。

背景技术

磷脂酶是水解磷脂中的酯键的酶。与它们在磷脂代谢中的重要性相对应的是，这些酶广泛存在于真核和原核细胞中。磷脂酶影响生物膜的代谢、形成和再组织，并且磷脂酶也参与信号的级联作用。已经知道了几种类型的磷脂酶，按照磷脂分子中受到攻击的键的位置，它们在特异性上有所不同。磷脂酶A1(PLA1)除去1-位的脂肪酸，产生游离的脂肪酸和1-溶血-2-酰基磷脂(1-lyso-2-acylphospholipid)。磷脂酶A2(PLA2)去除2-位的脂肪酸，产生游离的脂肪酸和1-酰基-2-溶血磷脂(1-acyl-2-lysophospholipid)。PLA1和PLA2酶可以是胞内酶或胞外酶，是膜结合的酶或者可溶性酶。发现胞内的PLA2存在于几乎所有的哺乳动物细胞中。磷脂酶C(PLC)去除磷酸部分，产生1，2二酰基甘油和磷酸酯。磷脂酶D(PLD)产生1，2-二酰基甘油磷酸和碱性基团(base group)。PLC和PLD对于细胞功能和信号传导是重要的。PLD是生物催化中主要的磷脂酶(参见，如，Godfrey，T.and West S.(1996)Industrial enzymology，299-300，Stockton Press，New York)。马铃薯块茎储藏蛋白(Patatins)是另一类磷脂酶，据认为其作用如同PLA(参见例如，HirschbergHJ，etal.，(2001)，Eur J Biochem 268(19)：5037-44)。

常见的含油种子，如大豆、油菜籽、向日葵籽、米糠油、芝麻和花生被用作油的来源和原料。在榨油过程中，种子用机械和热处理。用溶剂从粗粉(meal)中分离和分开油。然后应用蒸馏法，从油中分离出溶剂并回收。油经过“脱胶(degummed)”并且进行精炼。粗粉中的溶剂组分可以通过“脱溶剂烤炉(desolventizer toaster)”的热处理而蒸发掉，随后，粗粉干燥和冷却。当溶剂通过蒸馏分离掉以后，产生的粗油经过特殊的脱胶程序和物理精炼的方法加工成为食用油。它也可以作为原料用于产生脂肪酸和甲基酯。粗粉可以用做动物饲料(animal rations)。

脱胶是植物油精炼的第一步，脱胶的目的是去除与油一起被抽提、但干扰随后的油加工工艺的污染磷脂。这些磷脂仅仅溶于无水形式的植物油中，如果通过简单的水合作用，磷脂可以沉淀并去除。水合作用一般通过少量的水与充分干燥的油连续混合来完成。典型地，水的量是磷脂含量的75％，磷脂的量典型地是1到1.5％。虽然在50℃到80℃的范围内，油的粘度会降低，水合胶的分离效果更好，但是温度条件并不非常严格。

很多油脱胶(oil degumming)的方法目前都在使用。油脱胶的过程可以通过使用磷脂酶协助进行。磷脂酶A1和A2已经应用于各种商业过程中的油脱胶作用上，如“ENZYMAX^TM脱胶”(Lurgi Life Science Technologies GmbH，Germany)。也已经考虑将磷脂酶C(PLC)应用于油的脱胶作用，因为磷脂酶C在磷脂上作用产生的磷酸盐部分是极易溶于水的，并且容易去除，而且甘油二酯与油在一起，降低了损失；参见，如Godfrey，T.and West S.(1996)Industrial Enzymology pp.299-300，Stockton Press，New York；Dahlke(1998)“An enzymatic process for the physicalrefining of seed oils，”Chem.Eng.Technol.21：278-281；Clausen(2001)“Enzymatic oildegumming by a novel microbial phospholipase，”Eur.J.Lipid Sci.Technol.103：333-340。

高磷脂油(high phosphatide oils)，例如黄豆、油菜和向日葵油的处理方法不同于别的油如棕榈的处理方法。不像低磷脂油的蒸或“物理精炼”处理，这些高磷油需要特别的化学和机械处理，以去除含磷的磷脂。这些油一般通过化学的方式精炼，在化学精炼过程必需中和游离脂肪酸，以形成皂和不溶性的胶成分。中和过程对于去除游离脂肪酸和磷脂非常有效，但是该过程也导致产率和质量显著降低。在一些情况下，高磷脂的粗制油在碱中和之前的步骤中进行脱胶。用于卵磷脂的大豆油就是这种情况，其中的油首先用水或者酸来脱胶。

植物固醇(phytosterols)(植物甾醇(plant sterols))是天然产物三萜家族的成员，其包括100种以上不同的植物固醇和4000种以上其它种类的三萜。一般而言，据认为，植物甾醇是由于增加甾醇/磷脂配给导致膜硬化，从而稳定植物膜。在化学角度上，植物甾醇在结构上非常类似于胆固醇，并被认为调节植物膜的膜流动性，如胆固醇在动物膜所做的那样。主要的植物甾醇是β-谷甾醇、菜油甾醇和豆甾醇。其它的植物甾醇包括豆甾烯醇(二氢β-谷甾醇)、二氢谷甾醇、24-脱氢胆固醇、二氢菜油甾醇、chalinasterol、多孔甾醇、γ-谷甾醇和菜籽甾醇。

植物甾醇是健康和营养行业中的重要的农产品。它们是用于制造化妆品的有用乳化剂并且为激素药物的生产提供大多数甾体中间体和前体。植物甾醇的饱和类似物以及它们的酯已经被认为是益于心血管健康的有效的降低胆固醇的试剂。植物甾醇通过在肠腔中抑制胆固醇的吸收来降低血清中的胆固醇水平，并且植物甾醇在极低的浓度时便具有免疫调节特性，包括T淋巴细胞的增强的细胞应答和抗癌症细胞系的天然杀伤细胞的细胞毒性能力。此外，它们的治疗效应在治疗肺结核、风湿性关节炎、控制HIV感染的病人和抑制马拉松选手的免疫压力的临床研究中已经得到证明。

植物甾醇的酯类，也指植物甾醇酯，由美国食品药品管理局(FDA)批准为GRAS(一般认为安全，Generally Recognized As Safe)，用于人造黄油，并在1999年得到推广。2000年9月，FDA也提出一个试行规定，该规定准许了含有植物甾醇酯类的食品使用健康声明标记(health-claiming labeling)。因此，用植物甾醇酯类强化的食品非常有望受到消费者的青睐。

大豆油被广泛使用，是重要的粮食，占来自种子和水果的油产量的约30％。大豆仅含有20％的油，在商业规模上通常通过使用溶剂诸如己烷来提取。其油公认的质量和粗粉蛋白的营养价值使得大豆成为首要的含油种子。在提取之前，大豆必需清洗，破碎并去皮，这是因为对油来说有效的溶剂提取需要破碎每一个油细胞以提高物质转移水平。细胞壁主要由纤维素——其与半纤维素相关、果胶物质和木质素组成，细胞壁也可以用酶破碎，以显著提高提取产量和速度。

二酰甘油(DAG)油是食用油，相对天然脂肪酸含有80％或更多的DAG。已经显示，在人中，消化DAG油乳剂之后，相比具有类似的脂肪酸组成的TAG油，餐后乳糜微粒中的甘油三脂的升高水平明显较低。在以日本男子和美国男子和女子为对象的研究中，长期食用DAG油促进体重减轻和身体脂肪减少。一项研究显示用DAG油取代普通的烹饪油降低肥胖和其他危险因素的发生率。

发明概述

本发明提供包括与本发明的示例性序列例如SEQ ID NO：1、SEQ ID NO：3、SEQID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ IDNO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ IDNO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ IDNO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ IDNO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、SEQ IDNO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、SEQ IDNO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、SEQ IDNO：75、SEQ ID NO：77、SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、SEQ IDNO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、SEQ IDNO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、SEQ IDNO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ ID NO：111、SEQ ID NO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ IDNO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ ID NO：129、SEQ ID NO：131、SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ IDNO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ ID NO：147、SEQ ID NO：149、SEQ ID NO：151、SEQ ID NO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ IDNO：199、SEQ ID NO：161、SEQ ID NO：163、SEQ ID NO：165、SEQ ID NO：167、 SEQ ID NO：169、SEQ ID NO：171或SEQ ID NO：173在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或者更多个的残基范围内具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或者更多的或者完全的(100％)序列同一性的核酸序列的分离的或者重组的核酸，在一个方面所述核酸编码具有磷脂酶(PL)活性的至少一个多肽，所述磷脂酶活性例如磷脂酶A、C或D活性，或磷脂酶活性的任何组合，例如PLA、PLC和/或PLD活性——作为多功能活性。在一个方面，所述序列同一性用序列比较算法分析或者目测检查来确定。

发明提供包括与SEQ ID NO：1在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或更多连续的残基范围内具有至少81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％，或者更多，或者完全的(100％)序列同一性的核酸序列的分离的或者重组的核酸，在一个方面所述核酸编码具有磷脂酶活性(PL)的至少一种多肽，所述磷脂酶活性例如磷脂酶A、C或D活性，或磷脂酶活性的任何组合，例如PLA、PLC和/或PLD活性-作为多功能活性。在一个方面，所述序列同一性用序列比较算法分析或者通过目测检查来确定。

发明提供包括与SEQ ID NO：3在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或更多个的残基范围内具有至少78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％，或者更多，或者完全的(100％)序列同一性的核酸序列的分离的或者重组的核酸，在一个方面所述核酸编码具有磷脂酶活性(PL)的至少一种多肽，所述磷脂酶活性例如磷脂酶A、C或D活性，或磷脂酶活性的任何组合，例如PLA、PLC和/或PLD活性-作为多功能活性。在一个方面，所述序列同一性用序列比较算法分析或者通过目测检查来确定。

发明提供包括与SEQ ID NO：5在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或更多个的残基范围内具有至少78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、 95％、96％、97％、98％、99％，或者更多，或者完全的(100％)序列同一性的核酸序列的分离的或者重组的核酸，在一个方面所述核酸编码具有磷脂酶活性

(PL)的至少一种多肽，所述磷脂酶活性例如磷脂酶A、C或D活性，或磷脂酶活性的任何组合，例如PLA、PLC和/或PLD活性-作为多功能活性。在一个方面，所述序列同一性用序列比较算法分析或者通过目测检查来确定。

发明提供包括与SEQ ID NO：7在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或更多个的残基范围内具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％，或者更多，或者完全的(100％)序列同一性的核酸序列的分离的或者重组的核酸，在一个方面所述核酸编码具有磷脂酶活性(PL)的至少一种多肽，所述磷脂酶活性例如磷脂酶A、C或D活性，或磷脂酶活性的任何组合，例如PLA、PLC和/或PLD活性-作为多功能活性。在一个方面，所述序列同一性用序列比较算法分析或者通过目测检查来确定。

在可选择的方面，分离的或者重组的核酸编码包含在SEQ ID NO：2、SEQ IDNO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ IDNO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ IDNO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ IDNO：132、SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138；SEQ ID NO：140；SEQID NO：142；SEQ ID NO：144；NO：146、SEQ ID NO：148、SEQ ID NO：150、SEQ IDNO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、SEQ IDNO：170、SEQ ID NO：172或SEQ ID NO：174中阐明序列的多肽。在一个方面，这些多肽具有磷脂酶，例如磷脂酶A、B、C或D的活性，或磷脂酶活性的任何组合，例如PLA、PLC和/或PLD活性-作为多功能活性。

在一方面，序列比较算法是BLAST算法，如BLAST 2.2.2版算法。一方面，筛选设置(filtering setting)设为blastall-p，blastp-d“nr pataa”-F F，所有其它可选项(options)设为默认值。

在一个方面，磷脂酶活性包括催化甘油磷酸酯键的水解(即，切割甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽(oilseed)的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性；磷脂酶A(PLA)活性，如磷脂酶A1或者磷脂酶A2活性；磷脂酶D(PLD)活性，如磷脂酶D1或者磷脂酶D2活性；磷脂酶B(PLB)活性，例如磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性；或马铃薯块茎蛋白(patatin)活性，或其组合。磷脂酶活性可以包括水解糖蛋白，例如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。在一个方面，本发明的磷脂酶可以具有多功能的活性，例如本文中描述的一种或多种酶活性的组合，例如本发明的磷脂酶可以具有PLC和PLA活性；PLB和PLA活性；PLC和PLD活性；PLC和PLB活性；PLB和patatin活性；PLC和patatin活性；PLD和PLA；PLD、PLA、PLB和PLC活性；或PLD、PLA、PLB、PLC和patatin活性；或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性，或其任意组合。

例如，在一个方面，本发明的多肽具有酶活性，但是缺少脂酶活性，例如缺少影响中性油(甘油三酯)部分的任何酶活性。在特定的工艺中使用这种多肽可能是有利的，例如在脱胶工艺中，中性油部分不受损(减少，例如水解)是重要的。因此，在一个方面，本发明提供了脱胶工艺，该工艺包括使用本发明的具有磷脂酶活性但不具有脂酶活性的多肽。

在一个方面，分离的或重组的核酸编码具有磷脂酶活性的多肽，其是热稳定性的。该多肽在一定的条件下，能够保持磷脂酶活性，这些条件包括20℃至约30℃之间、约25℃至约40C℃之间、约37℃至约95℃之间、约55℃至约85C℃之间、约70℃至约95℃之间或约90℃至约95℃之间。在另一方面，分离的或重组的核酸编码具有磷脂酶活性的多肽，其是耐热性的。在暴露于37℃以上至约95℃范围内的温度、或55℃以上至约85℃范围内的任何温度后，该多肽能够保持磷脂酶活性。在一个方面，在pH 4.5，暴露于90℃以上至约95℃范围内的温度后，该多肽保持磷脂酶活性。

多肽在包括大约pH 8、pH 7.5、pH 7、pH 6.5、pH 6.0、pH 5.5、pH 5或者pH4.5的条件下可以保持磷脂酶的活性。多肽可以在包括温度范围为大约40℃至大约70℃的条件下保持磷脂酶活性。

一方面，分离的或者重组的核酸包含在严格条件下与在SEQ ID NO：1、SEQ IDNO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、SEQ ID NO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、SEQ ID NO：75、SEQ ID NO：77、SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、SEQ ID NO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、SEQ ID NO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、SEQ ID NO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ ID NO：111、SEQ IDNO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ ID NO：129、SEQ IDNO：131、SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ ID NO：147、SEQ IDNO：149、SEQ ID NO：151、SEQ ID NO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ ID NO：165、SEQ IDNO：167、SEQ ID NO：169、SEQ ID NO：171或SEQ ID NO：173中阐明的序列杂交的序列，其中该核酸编码具有磷脂酶活性的多肽。如此处所述，核酸在长度上可以是基因或者转录物的至少大约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850个或更多残基或者是基因或者转录物的全长，具有或者不具有信号序列。如此处所述，严格条件可以是高度严格，中度严格或者低严格性。严格条件可以包括洗涤步骤，如，包括在0.2×SSC，大约65℃条件下洗涤大约15分钟的洗涤步骤。[24]发明提供用于鉴定编码具有磷脂酶，例如磷脂酶活性的多肽的核酸的核酸探针，其中该探针包括本发明的序列，例如在SEQ ID NO：1、SEQ ID NO：3、SEQ IDNO：5、或者SEQ ID NO：7中阐明的序列的至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850个或者更多的连续碱基，该探针通过结合或者杂交鉴定该核酸。该探针可以包括在SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5和/或SEQ ID NO：7中阐明的序列的至少大约10到50、大约20到60、大约30到70、大约40到80或者大约60到100个连续碱基的寡核苷酸。

本发明提供了用于鉴定编码具有磷脂酶，如磷脂酶活性多肽的核酸的核酸探针，其中该探针包括本发明的核酸，例如在至少大约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或者更多连续残基的范围内，与SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、和/或SEQ ID NO：7或者它们的子序列具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％，或者更多，或者完全的(100％)的序列同一性的核酸，并且在一个方面，序列同一性通过序列比较算法分析或者目测检查确定。

本发明提供用于扩增编码具有磷脂酶活性多肽的核酸的扩增引物序列对，其中该引物对能够扩增包括本发明的序列或者片段或者其子序列的核酸序列。扩增引物序列对的一个成员或每一个成员可以包括含有至少大约10到50个该序列连续碱基，或者大约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或者25个该序列连续碱基的寡聚核苷酸。

本发明提供扩增引物对，其中该引物对包括第一成员和第二成员，其中第一成员具有本发明核酸的大约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24、或者25个残基所阐明的序列，第二成员具有第一成员互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基所阐明的序列。

本发明提供了通过扩增产生的磷脂酶，例如使用本发明的扩增引物对的，聚合酶链式反应(PCR)。本发明提供了通过扩增制备磷脂酶的方法，例如应用发明的扩增引物对的聚合酶链式反应(PCR)。一方面，扩增引物对扩增来自文库的核酸，例如基因文库，如环境文库。

本发明提供了扩增编码具有磷脂酶活性多肽的核酸的方法，包括用能够扩增本发明核酸序列或者片段或者其子序列的扩增引物序列对来扩增模板核酸序列。该扩增引物对可以是本发明的扩增引物对。

本发明提供包括本发明的核酸或者其子序列的表达盒(expression cassettes)。一方面，表达盒可以包括可操作性地连接于启动子的核酸。启动子可以是病毒的，细菌的，哺乳动物的或者植物启动子。一方面，植物启动子可以是马铃薯，水稻，玉米，小麦，烟草或者大麦启动子。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面，启动子可以是诱导型启动子。一方面，启动子可以是组织特异性启动子或者环境调控或者发育调控启动子。因此，启动子可以是，例如种子特异性，叶特异性，根特异性，茎特异性或者脱落诱导启动子。一方面，表达盒可以进一步包括植物表达载体或者植物病毒表达载体。

本发明提供包括本发明的表达盒(如载体)或者本发明的核酸的克隆载体。克隆载体可以是病毒载体、质粒、噬菌体、噬菌粒(phagemid)、粘粒、F粘粒(fosmid)、细菌噬菌体或者人工染色体。病毒载体可以包括腺病毒载体，逆转录病毒载体或者腺相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)、或者哺乳动物人工染色体(MAC)。

本发明提供含有本发明核酸或者本发明表达盒(如，载体)或者本发明克隆载体的转化细胞。一方面，转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或者植物细胞。一方面，植物细胞可以是马铃薯、小麦、水稻、玉米、烟草或者大麦细胞。

本发明提供包括本发明的核酸或者本发明的表达盒(如，载体)的转基因非-人类动物。在一方面，动物是小鼠、大鼠、牛、羊或其它哺乳动物。

本发明提供包括本发明的核酸或者本发明的表达盒(如，载体)的转基因植物。转基因植物可以是玉米植物、马铃薯植物、番茄植物、小麦植物、油籽植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。本发明提供包括本发明的核酸或本发明的表达盒(例如，载体)的转基因种子。转基因种子可以是玉米种子、小麦种子、油籽、油菜籽(油菜植物)、大豆种子、棕榈仁、向日葵种子、芝麻种子、花生、水稻或烟草植物种子。

本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法，该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。

本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法，该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。反义寡聚核苷酸的长度可以是大约10到50、大约20到60、大约30到70、大约40到80、大约60到100、大约70到110或者大约80到120个碱基。

本发明提供抑制磷脂酶如细胞内磷脂酶信使翻译的方法，该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供包括本发明序列的子序列的双链抑制性RNA(RNAi)分子。在一方面，RNAi长度是大约15，16，17，18，19，20，21，22，23，24，25或者更多的双链核苷酸。本发明提供抑制磷脂酶如细胞内磷脂酶表达的方法，该方法包括向细胞施用或者在细胞中表达双链抑制性RNA(RNAi)，其中该抑制性RNA包括本发明序列的子序列。

本发明提供了分离的或重组的多肽，该多肽包含与本发明示例性的多肽或肽(例如SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO.68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO.88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ IDNO：110、SEQ ID NO：112、SEQ ID NO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120或SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ IDNO：128、SEQ ID NO：130、SEQ ID NO：132、SEQ ID NO：134、SEQ ID NO：136、SEQID NO：138；SEQ ID NO：140；SEQ ID NO：142；SEQ ID NO：144；NO：146、SEQ IDNO：148、SEQ ID NO：150、SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、SEQ ID NO：170、SEQ ID NO：172或SEQ ID NO：174)在多肽的至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、175、200、225、250、275、300、325、350、400、450、500、550或600或更多残基，或多肽的全长范围内，具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％，或更大，或完全(100％)的序列同一性的氨基酸序列；并且，在一个方面，序列同一性通过序列比较算法分析或者通过目测观察来确定。

在一个方面，本发明提供包括与SEQ ID NO：2具有至少81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或者更多，或者完全的(100％)序列同一性的氨基酸序列的分离的或者重组的多肽。在一个方面，本发明提供包括与SEQ ID NO：4具有至少78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或者更多，或者完全的(100％)序列同一性的氨基酸序列的分离的或者重组的多肽。在一个方面，本发明提供包括与SEQ ID NO：6具有至少78％、79％、80％、81％、 82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或者更多，或者完全的(100％)序列同一性的氨基酸序列的分离的或者重组的多肽。在一个方面，发明提供包括与SEQ IDNO：8具有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％，或者更多，或者完全的(100％)序列同一性的氨基酸序列的分离的或者重组的多肽。

本发明提供由本发明的核酸编码的分离的或者重组的多肽。在可选择的方面，多肽可以具有如SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ IDNO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ IDNO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ IDNO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ IDNO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ IDNO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ IDNO：68、SEQ IDNO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ IDNO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ IDNO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ IDNO：100、SEQ ID NO：102、SEQ IDNO：104、SEQ IDNO：106、SEQ IDNO：108、SEQID NO：110、SEQ ID NO：112、SEQ ID NO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ IDNO：128、SEQ ID NO：130、SEQ ID NO：132、SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138；SEQ ID NO：140；SEQ ID NO：142；SEQ ID NO：144；NO：146、SEQID NO：148、SEQ ID NO：150、SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ IDNO：164、SEQ IDNO：166、SEQ ID NO：168、SEQ ID NO：170、SEQ ID NO：172或SEQ ID NO：174中阐明的序列。多肽可以具有磷脂酶活性，如磷脂酶A，B，C或者D活性，或磷脂酶活性的任何组合，例如PLA、PLC和/或PLD活性—作为多功能活性。例如，在一个方面，本发明的多肽具有酶活性，但是缺少脂酶活性，例如缺少影响中性油(甘油三酯)部分的任何酶活性。在一个方面，本发明提供了脱胶工艺，该工艺包括使用具有磷脂酶活性但不具有脂酶活性的本发明的多肽，这样在脱胶工艺中，任何中性油部分不受损害(减少、改变、降解，例如水解)。

本发明提供了含有缺乏信号序列的本发明的多肽的分离的或者重组的多肽，在一个方面，缺乏信号肽的多肽具有与SEQ ID NO：2的残基30到287有至少81％、 82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或者更多序列同一性；与SEQ ID NO：4的残基25到283有至少78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或者更多序列同一性的氨基酸序列；与SEQ ID NO：6的残基26到280有至少78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或者更多序列同一性的氨基酸序列；或与SEQ ID NO：8的残基40到330有至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、或者更多的序列同一性的氨基酸序列。序列同一性通过序列比较算法分析或者通过目测观察确定。

本发明的另一方面提供分离的或者重组的多肽或者肽，该分离的或者重组的多肽或者肽包括本发明的多肽或肽序列、与之基本相同的序列，和与之互补的序列的至少10，15，20，25，30，35，40，45，50，55，60，65，70，75，80，85，90，95或者100或者更多的连续碱基。该肽可以是，例如，免疫源性的片段、基序(如，结合位点)或者活性位点。

在一个方面，本发明分离的或重组的多肽(有或无信号序列)具有磷脂酶活性。在一个方面，磷脂酶活性包括催化甘油磷酸酯键的水解(即，切割甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性；磷脂酶A(PLA)活性，如磷脂酶A1或者磷脂酶A2活性；磷脂酶D(PLD)活性，如磷脂酶D1或者磷脂酶D2活性；磷脂酶B(PLB)活性，例如磷脂酶和溶血磷脂酶(LPL)活性，或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性，或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性；或patatin活性，或其组合。例如，在一个方面，磷脂酶活性包括本文中描述的一种或多种酶活性的组合，例如磷脂酶可以具有PLC和PLA活性；PLB和PLA活性；PLC和PLD活性；PLC和PLB活性；PLB和patatin活性；PLC和patatin活性；PLD和PLA；PLD、PLA、PLB和PLC活性；或PLD、PLA、PLB、PLC和patatin活性；或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性，或其任意组合。

磷脂酶活性可以包括水解糖蛋白，如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。

在一个方面，磷脂酶活性是热稳定性的。多肽可以在包括温度范围在大约20℃到大约30℃之间、大约25℃到大约40℃之间、大约37℃到大约95℃之间、大约55℃到大约85℃之间、大约70℃到大约95℃之间、或者大约90℃到大约95℃之间的条件下保持磷脂酶活性。在一个方面，磷脂酶活性可以是耐热的。多肽可以在暴露于温度范围37℃以上到大约95℃、或者在55℃以上到大约85℃后仍保持磷脂酶活性。在一个方面，多肽可以在pH4.5下，暴露于温度范围在90℃以上到大约95℃后仍保持磷脂酶活性。

在一个方面，多肽可以在包括大约pH 6.5，pH 6，pH 5.5，pH 5，pH 4.5或者pH 4或pH更小(酸性更大)的条件下保持磷脂酶活性。在一个方面，多肽可以在包括大约pH 7，pH 7.5，pH 8.0，pH 8.5，pH 9，pH9.5，pH 10，pH 10.5，或pH11pH更大(碱性更大)的条件下保持磷脂酶活性。

在一个方面，分离的或者重组的多肽可以包括本发明的多肽，其缺乏信号序列。在一个方面，分离的或者重组的多肽可以包括含有异源信号序列，如异源磷脂酶或者非-磷脂酶信号序列的本发明多肽。

本发明提供分离的或者重组的肽，该肽含有与SEQ ID NO：2的1到29残基有至少95％、96％、97％、98％、99％、或者更多序列同一性的，与SEQ ID NO：4的1到24残基有至少95％、96％、97％、98％、99％、或者更多序列同一性的，与SEQ ID NO：6的1到25残基有至少95％、96％、97％、98％、99％、或者更多序列同一性的，或与SEQ ID NO：8的1到39残基，以及SEQ ID表中阐明的其他信号序列有至少95％、96％、97％、98％、99％、或者更多序列同一性的氨基酸序列，其中序列同一性通过序列比较算法分析或者通过目测观察来确定。这些肽可以作为内源性磷脂酶或者其它磷脂酶，或者异源蛋白(非磷脂酶或者其它蛋白)的信号肽序列。在一个方面，本发明提供包括第一结构域和至少第二结构域的嵌合蛋白，第一结构域包括本发明的信号序列。该蛋白可以是融合蛋白。第二结构域可以包括酶。酶可以是磷脂酶。

本发明提供包括至少第一结构域和至少第二结构域的嵌合多肽，第一结构域包括发明的信号肽(SP)或本发明磷脂酶的催化结构域(CD)，或活性位点，第二结构域包括异源多肽或肽，其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。在一个方面，异源多肽或者肽不是磷脂酶。异源多肽或者肽可以在信号肽(SP)或者催化结构域(CD)的氨基末端，羧基末端或者羧基和氨基末端。

本发明提供编码嵌合多肽的分离的或者重组的核酸，其中嵌合多肽包括至少第一结构域和至少第二结构域，第一结构域含有本发明多肽的信号肽(SP)或者催化结构域(CD)或者活性位点，第二结构域包括异源多肽或者肽，其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。

在一个方面，磷脂酶活性包括在大约37℃下，每毫克蛋白大约10到大约100单位范围的比活性。在另一方面，磷脂酶活性包括每毫克蛋白大约100到大约1000单位，大约500到大约750单位范围的比活性。可选择地，磷脂酶活性包括在37℃下每毫克蛋白大约100到大约500单位的比活性。在一方面，磷脂酶活性包括在37℃下每毫克蛋白大约500到大约1200单位的比活性。在另一方面，磷脂酶活性包括在37℃下每毫克蛋白大约750到大约1000单位的比活性。在另一方面，耐热性包含在加热至升高的温度以后，保持在37℃下的磷脂酶至少一半的比活性。可选择的，耐热性包含在加热至升高的温度以后，保持在37℃下每毫克蛋白大约500到大约1200单位的比活性。

本发明提供本发明分离的或者重组的多肽，其中多肽包括至少一个糖基化位点。一方面，糖基化可以是N-连接糖基化。一方面，多肽可以是在巴斯德毕赤酵母(P.pastoris)或者粟酒裂殖酵母(S.pombe)中表达后进行糖基化。

本发明提供了磷脂酶和编码它们的核酸，该磷脂酶具有本发明任何示例性磷脂酶的序列，其中一个或多个或所有糖基化位点被改变，如上所述。因此，本发明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方法，其中该方法包括修饰本发明的磷脂酶编码序列，这样，一个、若干个或所有N-连接的糖基化位点编码基序被修改为非糖基化基序。本发明也提供了由该方法制得的磷脂酶编码序列，和它们编码的酶。

本发明提供了制备变体磷脂酶编码序列的方法，该序列编码对蛋白酶具有增加的耐受性的磷脂酶，该方法包括将等同于SEQ ID NO：2的位置131上的氨基酸修改成一个、若干个或所有下述残基：赖氨酸(K)；丝氨酸(S)；甘氨酸(G)；精氨酸(R)；谷氨酰胺(Q)；丙氨酸(A)；异亮氨酸(I)；组氨酸(H)；苯丙氨酸(F)；苏氨酸(T)；蛋氨酸(M)；亮氨酸(L)，包括具有这些示例性修改的SEQ ID NO：2的变体(和编码它们的核酸)。本发明也提供由该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。

本发明提供了制备变体磷脂酶编码序列的方法，该序列编码对蛋白酶具有减少的耐受性的磷脂酶，该方法包括将等同于SEQ ID NO：2的位置131上的氨基酸修改成一个、若干个或所有下述残基：色氨酸(W)；谷氨酸(E)；酪氨酸(Y)，包括具有这些示例性修改的SEQ ID NO：2的变体(和编码它们的核酸)。本发明也提供由该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。

本发明提供包括本发明多肽的蛋白制备物，其中蛋白制备物包括液体，固体或者凝胶制备物。

本发明提供包括本发明多肽和第二种蛋白或者结构域的异源二聚物。异源二聚物的第二个成员可以是不同的磷脂酶，不同的酶或者另一种蛋白。在一方面，第二个结构域可以是多肽，且异源二聚物可以是融合蛋白。在一方面，第二个结构域可以是表位(抗原决定簇)或者标记。在一方面，本发明提供包括本发明多肽的同源二聚物。

本发明提供具有磷脂酶活性的固定化多肽，其中多肽包含本发明的多肽，本发明核酸编码的多肽，或者包括本发明多肽和第二个结构域的多肽(例如融合蛋白)。在一方面，本发明多肽是固定在细胞、细胞小泡、脂质体、膜(film)、膜(membrane)、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、晶体、片剂、丸、胶囊、粉末、附聚物、表面、多孔结构、阵列或者毛细管上。在一个方面，本发明的多肽固定在物质诸如谷物、果壳、树皮、皮、毛、釉质、骨、壳和由它们衍生而成的物质，或动物饲料，或其组合上。

本发明的多肽(例如磷脂酶)也可以单独存在或以磷脂酶混合物或磷脂酶与其他水解酶混合物的形式存在，其他水解酶诸如纤维素酶、木聚糖酶、蛋白酶、脂酶、淀粉酶、或氧化还原酶如漆酶、过氧化物酶、过氧化氢酶、氧化酶或还原酶。它们可以配制成固体形式如粉末、冻干制剂、颗粒、片剂、条、晶体、胶囊、丸、小球，或液体形式如水溶液、气溶胶、凝胶、糊、浆、水/油乳状液、乳剂、及胶囊、小泡或胶束的悬浮液。在一个方面，本发明的这些制剂可以包括任何下述组分或它们的组合：多元醇如聚乙二醇、聚乙烯醇、丙三醇，糖类如蔗糖、山梨醇、海藻糖、葡萄糖、果糖、麦芽糖；胶凝剂如瓜尔树胶、鹿角菜胶、藻酸盐、葡聚糖、纤维素衍生物、果胶；盐如氯化钠、硫酸钠、硫酸铵、氯化钙、氯化镁、氯化锌、硫酸锌、脂肪酸及其衍生物的盐；金属螯合剂如EDTA、EGTA、柠檬酸钠；抗微生物剂如脂肪酸、其衍生物、对羟基苯甲酸酯、山梨酸酯、甲苯酸盐；阻碍蛋白酶作用的其它化合物如大体积蛋白质(bulk protein)，诸如BSA、小麦水解产物、硼酸盐化合物；乳化剂如非离子型和离子型洗涤剂可以单独或组合使用；植物甾醇；维生素；氨基酸；可以包括还原剂如半胱氨酸或抗氧化化合物如抗坏血酸以及分散剂。

在一个方面，交联和蛋白质修饰作用如聚乙二醇化、脂肪酸修饰和糖基化被用于提高本发明多肽的稳定性(例如酶稳定性)。在一个方面，多元醇和/或糖构成制剂的约5％至约60％，或更多，制剂的约10％至约50％、制剂的约20％至约40％、或制剂的约5％至约20％。在另一方面，胶凝剂构成制剂的约0.5％至约10％、制剂的约1％至约8％、制剂的约2％至约5％、或制剂的约0.5％至约3％。在另一方面，盐如氯化钠、硫酸钠、硫酸铵、氯化钙和/或氯化镁构成制剂的约1％至约30％、制剂的约2％至约20％、制剂的约5％至约15％、或制剂的约1％至约10％。在另一方面，氯化锌以约0.1mM至约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂中。又在另一个方面，硫酸锌以约0.1mM至约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂中。在另一个方面，脂肪酸和/或其衍生物的盐构成制剂的约5％至约40％、制剂的约10％至约30％、制剂的约15％至约25％、或制剂的约5％至约20％。在另一方面，金属螯合剂如EDTA、EGTA和/或柠檬酸钠以约0.1mM至约10mM、约0.5mM至约8mM、约1mM至约5mM或约0.1mM至约1mM的浓度存在于制剂中。在另一方面，抗微生物剂如对羟基苯甲酸酯类、山梨酸酯和/或甲苯酸盐构成制剂的约0.01％至约10％、制剂的约0.05％至约5％、制剂的约0.1％至约1％、或制剂的约0.05％至约0.5％。又在另一个方面，大量蛋白质如BSA和/或小麦水解产物构成制剂的约1％至约20％、制剂的约5％至约15％、制剂的约2.5％至约7.5％、或制剂的约1％至约5％。在另一方面，乳化剂如非离子型和/或离子型洗涤剂以一定浓度存在于制剂中，该浓度包括约1×临界胶束浓度(CMC)至约10×CMC，约2.5×CMC至约7.5×CMC，约1×CMC至约5×CMC，或约3×至约6×CMC。在另一个方面，维生素、氨基酸、还原剂和/或抗氧化化合物构成制剂的约0.1％至约5％、制剂的约0.5％至约4％、制剂的约1％至约2.5％、制剂的约0.1％至约1％。

本发明提供包含固定化多肽的阵列，其中多肽是本发明的磷脂酶或者本发明核酸编码的多肽。本发明提供含有本发明的固定化核酸的阵列。本发明提供含有本发明的固定化抗体的阵列。

本发明提供特异性地结合于本发明多肽或者本发明的核酸编码的多肽的分离的或者重组的抗体。抗体可以是单克隆抗体或者多克隆抗体。本发明提供含有本发明抗体的杂交瘤。

本发明提供分离和鉴定具有磷脂酶活性的多肽的方法，包括以下步骤：(a)提供本发明的抗体；(b)提供含有多肽的样品；以及(c)在抗体能够特异性地结合于该多肽的条件下，将步骤(b)的样品与步骤(a)的抗体接触，从而分离和鉴定磷脂酶。本发明提供制备抗-磷脂酶抗体的方法，包括向非人类动物施用足以产生体液免疫应答的量的本发明核酸或者本发明多肽，从而制备抗磷脂酶抗体。

本发明提供生产重组多肽的方法，包含以下的步骤：(a)提供可操作地连接于启动子的本发明的核酸，以及(b)在允许多肽表达的条件下表达步骤(a)的核酸，从而生产重组多肽。该核酸可以包括与SEQ ID NO：1序列在至少大约100个残基的范围内，具有至少85％的序列同一性的序列，与SEQ ID NO：3的序列在至少大约100个残基的范围内，具有至少80％的序列同一性的序列，与SEQ IDNO：5序列在至少大约100个残基的范围内，具有至少80％的序列同一性的序列，或者与SEQ ID NO：7序列在至少大约100个残基的范围内，具有至少70％的序列同一性的序列，其中序列同一性通过序列比较算法分析或者目测观察来确定。核酸可以包括在严格的条件下与SEQ ID NO：1所阐述的核酸或者其子序列，与SEQID NO：3所阐述的核酸或者其子序列，与SEQ ID NO：5所阐述的核酸或者其子序列，与SEQ ID NO：7所阐述的核酸或者其子序列杂交的核酸。该方法可以进一步包括用步骤(a)的核酸转化宿主细胞，随后表达步骤(a)的核酸，从而在转化细胞中生产重组多肽。该方法可以进一步包括把步骤(a)的核酸插入到非人类动物宿主中，随后表达步骤(a)的核酸，从而在非人动物宿主中生产重组多肽。

本发明提供鉴定具有磷脂酶活性的多肽的方法，包括以下的步骤：(a)提供本发明的多肽或由本发明核酸编码的多肽，或其片段或变异体，(b)提供磷脂酶底物；和(c)将步骤(a)的多肽或其片段或变异体与步骤(b)的底物接触，并检测底物量的增加或者产物量的减少，其中底物量的减少或者产物量的增加说明检测到了具有磷脂酶活性的多肽。在可选择的方面，核酸包括与SEQ ID NO：1在至少大约100个残基的范围内具有至少85％的序列同一性的序列，与SEQ ID NO：3在至少大约100个残基的范围内具有至少80％的序列同一性的序列，与SEQ IDNO：5在至少大约100个残基的范围内具有至少80％的序列同一性的序列，或者与SEQ ID NO：7在至少大约100个残基的范围内具有至少70％的序列同一性的序列，其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选择的方面，核酸可以在严格的条件下与SEQ ID NO：1所阐述的核酸或者其子序列，与SEQ IDNO：3所阐述的核酸或者其子序列，与SEQ ID NO：5所阐述的核酸或者其子序列，与SEQ ID NO：7所阐述的核酸或者其子序列杂交。

本发明提供确定磷脂酶底物的方法，包括以下步骤：(a)提供本发明的多肽或者本发明核酸编码的多肽；(b)提供测试底物；以及(c)将步骤(a)的多肽与步骤(b)的测试底物接触，检测底物量的增加或者产物量的减少，其中底物量的减少或者产物量的增加确定测试底物为磷脂酶底物。在可选择的方面，核酸可以与SEQ ID NO：1在至少大约100个残基的范围内具有至少85％的序列同一性，与SEQ ID NO：3在至少大约100个残基的范围内具有至少80％的序列同一性，与SEQID NO：5在至少大约100个残基的范围内具有至少80％的序列同一性，或者与SEQID NO：7在至少大约100个残基的范围内具有至少70％的序列同一性，其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选择的方面，核酸在严格的条件下与SEQ ID NO：1所阐述的核酸或者其子序列，SEQ ID NO：3所阐述的核酸或者其子序列，SEQ ID NO：5所阐述的核酸或者其子序列，SEQ ID NO：7所阐述的核酸或者其子序列杂交。

本发明提供确定化合物是否特异性地结合于磷脂酶的方法，包括以下步骤：(a)在允许核酸翻译成多肽的条件下，表达核酸或者包含该核酸的载体，其中该核酸和载体包括本发明的核酸或者载体；或者，提供本发明的多肽，(b)使多肽与测试化合物接触；和(c)确定测试化合物是否特异性地结合于多肽，从而确定该化合物是否特异地结合于磷脂酶。在可选择的方面，核酸序列与SEQ ID NO：1在至少大约100个残基的范围内，具有至少85％的序列同一性，与SEQ ID NO：3在至少大约100个残基的范围内，具有至少80％的序列同一性，与SEQ ID NO：5在至少大约100个残基的范围内，具有至少80％的序列同一性，或者与SEQ IDNO：7在至少大约100个残基的范围内，具有至少70％的序列同一性，其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选择的方面，核酸在严格的条件下与SEQ ID NO：1所阐述核酸或其子序列，与SEQ ID NO：3所阐述核酸或其子序列，与SEQ ID NO：5所阐述核酸或其子序列，与SEQ ID NO：7所阐述核酸或其子序列杂交。

本发明提供鉴定磷脂酶活性的调节物的方法，包括以下步骤：(a)提供本发明的多肽或者本发明核酸编码的多肽；(b)提供测试化合物；以及(c)将步骤(a)的多肽与步骤(b)的测试化合物接触；并测定磷脂酶的活性，其中在测试化合物存在的条件下测得的磷脂酶活性与在无测试化合物存在的条件下测得的磷脂酶活性相比得到的变化证明测试化合物调节了磷脂酶的活性。在可选择的方面，核酸可以与SEQ ID NO：1在至少大约100个残基的范围内，具有至少85％的序列同一性，与SEQ ID NO：3在至少大约100个残基的范围内，具有至少80％的序列同一性，与SEQ ID NO：5在至少大约100个残基的范围内，具有至少80％的序列同一性，或者与SEQ ID NO：7在至少大约100个残基的范围内，具有至少70％的序列同一性，其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选择的方面，核酸可以在严格的条件下与选自SEQ ID NO：1所阐述核酸或其子序列；SEQ ID NO：3所阐述核酸或其子序列；SEQ ID NO：5所阐述核酸或其子序列；和SEQ ID NO：7所阐述核酸或其子序列的核酸序列杂交。

在一个方面，磷脂酶活性通过提供磷脂酶底物并且检测底物量的增加或者产物量的减少来测定。与不存在测试化合物的条件下底物或者产物的量相比，在存在测试化合物的条件下，底物量的减少或者产物量的增加证明测试化合物是磷脂酶活性的激活剂。与不存在测试化合物的条件下底物或者产物的量相比，在存在测试化合物的条件下，底物量的增加或者产物量的减少证明测试化合物是磷脂酶活性的抑制剂。

发明提供包含处理器和数据存储设备的计算机系统，其中所述的数据存储设备上已存储了本发明的多肽序列或者本发明的核酸序列。

一方面，计算机系统可以进一步包括序列比较算法，和其上已经存储了至少一个参照序列的数据存储设备。序列比较算法可以包括表明多态性的计算机程序。计算机系统可以进一步包括鉴定所述序列的一个或者多个特征的标识符(identifier)。

本发明提供已存储了包括本发明多肽序列或本发明核酸序列的序列的计算机可读存储介质。

本发明提供了鉴定序列中的特征的方法，包括以下步骤：(a)应用鉴定序列的一个或者多个特征的计算机程序来读取序列，其中该序列包括本发明的多肽序列或者本发明的核酸序列；和(b)用计算机程序鉴定序列中的一个或者多个特征。[74]本发明提供比较第一序列和第二序列的方法，该方法包括以下步骤：(a)应用比较序列的计算机程序读取第一序列和第二序列，其中第一序列包括本发明的多肽序列或者本发明的核酸序列；并且(b)用计算机程序确定第一序列和第二序列间的差异。在一个方面，确定第一序列和第二序列间差异的步骤进一步包括鉴定多态性的步骤。在一个方面，该方法进一步包括鉴定序列中一个或者多个特征的标识符(以及标识符的应用)。在一个方面，该方法包括用计算机程序读取第一序列，并鉴定该序列中的一个或者多个特征。

本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法，包括以下步骤：(a)提供扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对，其中引物对能够扩增本发明的核酸(如SEQ ID NO：1或其子序列，SEQID NO：3或其子序列，SEQ ID NO：5核酸或其子序列，SEQ ID NO：7核酸或其子序列，等等)；(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与扩增引物对杂交；和(c)将步骤(b)的核酸和步骤(a)的扩增引物对结合，并且从环境样品中扩增核酸，从而从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在一方面，扩增引物序列对的每一个成员包括含有本发明的核酸序列的至少大约10到50个连续碱基的寡核苷酸。在一方面，扩增引物序列对是本发明的扩增对。

本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法，包括以下步骤：(a)提供包含本发明的核酸序列或其子序列的多核苷酸探针；(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与步骤(a)的多核苷酸探针杂交；(c)将步骤(b)的分离的核酸或者经处理的环境样品与步骤(a)的多核苷酸探针结合；和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸，因此从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在可选择的方面，环境样品包括水样品、液体样品、土壤样品、空气样品或者生物样品。在可选择的方面，生物样品来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞、藻类细胞、地衣细胞或者哺乳动物细胞。

本发明提供产生编码磷脂酶的核酸的变异体的方法，包括以下步骤(a)提供包括本发明核酸的模板核酸；(b)在模板序列中修饰，缺失或者添加一个或者多个核苷酸，或其组合从而产生模板核酸的变异体。

在一方面，该方法进一步包括表达变异核酸，产生变体磷脂酶多肽。在可选择的方面，修饰、添加或者缺失由易错PCR(error-prone PCR)、重排(shuffling)、寡聚核苷酸定向诱变(oligonucleotide-directed mutagenesis)、装配PCR(assembly PCR)、有性PCR诱变(sexual PCR mutagenesis)、体内诱变(in vivo mutagenesis)、盒式诱变(cassette mutagenesis)、回归整体诱变(recursive ensemble mutagenesis)、指数整体诱变(exponential ensemble mutagenesis)、位点专一性诱变(site-specific mutagenesis)、基因重装配(gene reassembly)、基因位点饱和诱变^TM(Gene Site SaturationMutagenesis，GSSM^TM)、合成连接重装配(synthetic ligation reassembly，SLR)和/或其组合的方法来引入。在可选择的方面，修饰、添加或者缺失通过选自下述方法引入：重组、回归序列重组(recursive sequence recombination)、硫代磷酸酯-修饰的DNA诱变(phosphothioate-modified DNA mutagenesis)、含尿嘧啶的模板诱变(uracil-containing template mutagenesis)、缺口二重诱变(gapped duplex mutagenesis)、点错配修复诱变(point mismatch repair mutagenesis)、修复-缺陷型宿主株诱变(repair-deficient host strain mutagenesis)、化学诱变、放射诱变、缺失诱变、限制-选择诱变(restriction-selection mutagenesis)、限制-纯化诱变(restriction-purificationmutagenesis)、人工基因合成(artificial gene synthesis)、整体诱变(ensemblemutagenesis)、嵌合核酸多聚体生成(chimeric nucleic acid multimer creation)和/或其组合。

在一方面，该方法被反复重复，直到产生与模板核酸编码的磷脂酶相比，具有改变的或不同的活性或者改变的或不同的稳定性的磷脂酶。在一方面，改变的或不同的活性是在酸性条件下的磷脂酶活性，其中模板核酸编码的磷脂酶在酸性条件下没有活性。一方面，改变的或不同的活性是在高温下的磷脂酶活性，其中模板核酸编码的磷脂酶在高温的条件下没有活性。一方面，该方法反复重复，直到产生与模板核酸的密码子选择相比具有改变的密码子选择的磷脂酶编码序列。该方法反复重复，直到产生与模板核酸的信息表达或者信息稳定性相比具有更高或更低水平的信息表达或者信息稳定性的磷脂酶基因。

本发明提供修饰编码磷脂酶的核酸中密码子以增强其在宿主细胞中表达的方法，该方法包括(a)提供本发明的编码磷脂酶的核酸；(b)鉴定步骤(a)的核酸中的非偏爱(non-preferrd)或者不太偏爱(less preferred)的密码子，并且用编码相同氨基酸的偏爱的或者中立使用(neutrally used)的密码子作为替代密码子替换之，其中偏爱密码子是在宿主细胞基因的编码序列中出现频率较多的密码子，而非偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中出现频率较低的密码子，由此修饰该核酸以增加其在宿主细胞中的表达。

本发明提供修饰编码磷脂酶的核酸中的密码子的方法，该方法包括(a)提供本发明的编码磷脂酶的核酸；并且(b)确定步骤(a)的核酸中的密码子，并用编码相同氨基酸的不同的密码子作为替代密码子来替换之，从而修饰编码磷脂酶的核酸中的密码子。

本发明提供修饰编码磷脂酶的核酸中的密码子以增强其在宿主细胞中的表达的方法，该方法包括(a)提供本发明的编码磷脂酶的核酸，和(b)鉴定步骤(a)的核酸中的非偏爱的或者不太偏爱的密码子，并用编码相同氨基酸的偏爱的或者中立使用的密码子作为替代密码子来替换之，其中偏爱密码子是在宿主细胞基因的编码序列中出现频率较多的密码子，非-偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中出现频率较少的密码子，由此修饰该核酸以增加其在宿主细胞中的表达。

本发明提供修饰编码磷脂酶的核酸中的密码子以降低其在宿主细胞的表达的方法，该方法包括(a)提供本发明的编码磷脂酶的核酸；和(b)鉴别步骤(a)的核酸中的至少一个偏爱的密码子，并用编码相同氨基酸的非偏爱的或者不太偏爱的密码子作为替代密码子替换之，其中偏爱密码子是在宿主细胞基因的编码序列中出现频率较高的密码子，非偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中出现频率较低的密码子，由此修饰该核酸以减少其在宿主细胞中的表达。在可选择的方面，宿主细胞是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞、藻类细胞、地衣细胞或哺乳动物细胞。

本发明提供产生编码多个经修饰的磷脂酶活性位点或底物结合位点的核酸文库的方法，其中经修饰的活性位点或者底物结合位点来源于包括编码第一活性位点或者第一底物结合位点的序列的第一核酸，该方法包括：(a)提供编码第一个活性位点或者第一个底物结合位点的第一核酸，其中第一核酸序列包括本发明的核酸，(b)提供一套在第一核酸的多个靶密码子处编码天然产生的氨基酸变体的诱变寡核苷酸；和(c)应用该套诱变的寡核苷酸产生一套编码活性位点或者编码底物结合位点的变体核酸，在每一个被诱变的氨基酸密码子处，变体核酸编码一定范围的氨基酸变异，从而产生编码多个修饰的磷脂酶活性位点或者底物结合位点的核酸文库。在可选择的方面，本方法包括通过下列的方法诱变步骤(a)的第一核酸，所述方法包括优化的定向进化系统(optimized directed evolution system)、基因位点饱和诱变^TM(Gene Site-Saturation Mutagenesis^TM)(GSSM^TM)、合成连接重装配(SLR)。该方法可以进一步包括通过下列方法诱变诱变步骤(a)的第一核酸或变体，所述包括易错PCR、重排、寡核苷酸定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、回归整体诱变、指数整体诱变、位点专一性诱变、基因重装配、基因位点饱和诱变^TM(GSSM^TM)、合成连接重装配(SLR)及其组合。本方法可以进一步包括通过以下的方法诱变步骤(a)的第一核酸或变异体，所述方法包括重组、回归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶的模板诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。

本发明提供制备小分子的方法，包括以下步骤(a)：提供可以合成或者修饰小分子的多个生物合成酶，其中之一包括由本发明核酸编码的磷脂酶；(b)提供用于步骤(a)的至少一种酶的底物，并且(c)在利于许多生物催化反应进行的条件下，将步骤(b)的底物和酶反应，通过一系列生物催化反应产生小分子。

本发明提供修饰小分子的方法，包括以下步骤：(a)提供由本发明核酸编码的磷脂酶；(b)提供小分子；和(c)在利于磷脂酶催化的酶反应进行的条件下，将步骤(a)的酶与步骤(b)的小分子反应，从而通过磷脂酶酶促反应修饰小分子。一方面，该方法包括为步骤(a)的酶提供多种的小分子底物，从而产生了经修饰的小分子文库，该小分子文库由磷脂酶催化的至少一种酶促反应产生。一方面，该方法进一步包括多种额外酶，在有利于进行由该酶催化的多种生物催化反应的条件下，通过多种酶促反应形成经修饰的小分子文库。在一方面，该方法进一步包括检测文库以确定在文库中是否存在表现出期望活性的特定修饰小分子的步骤。检测文库的步骤可以进一步包括系统地去除文库中用来产生部分多个修饰小分子的除一种反应之外的所有生物催化反应，通过检测一部分修饰小分子中是否存在具有所需活性的特定的修饰小分子，鉴定产生具有所需活性的特定修饰小分子的至少一种特定的生物催化反应。

本发明提供用于确定磷脂酶的功能性片段方法，包括以下步骤：(a)提供包括本发明氨基酸序列的磷脂酶；和(b)缺失步骤(a)序列中的多个氨基酸残基，并且测定剩余序列的磷脂酶活性，从而确定磷脂酶的功能性片段。一方面，磷脂酶活性通过提供磷脂酶底物，检测底物量的增加或者反应产物量的减少来测定。一方面，与不存在测试化合物条件下确定的底物或者反应产物的量相比较，在测试化合物存在的条件下，酶底物量的减少或者反应产物量的增加表明测试化合物是磷脂酶活性的激活剂。

本发明提供切割甘油磷酸酯键的方法，包括以下步骤：(a)提供具有磷脂酶活性的多肽，其中该多肽包括本发明的氨基酸序列，或者该多肽由本发明的核酸序列编码；(b)提供包含甘油磷酸酯键的组合物；和(c)在该多肽切割甘油磷酸酯键的条件下，将步骤(a)的多肽与步骤(b)的组合物接触。一方面，该条件包括大约pH5到大约8.5之间，或者大约pH4.5(或酸性更大，即pH＜4.5)到大约9.0(或碱性更大，即pH＞9)之间。一方面，该条件包括大约40℃到大约70℃之间的温度。一方面，该组合物包括植物油。一方面，该组合物包括油籽磷脂。一方面，切割反应可以产生水可抽提的磷酸化的碱和甘油二酯。

本发明提供了水解、分解或破裂含磷脂组合物的方法，该方法包括提供具有磷脂酶活性的至少一种本发明的多肽，或由本发明的至少一种核酸编码的具有磷脂酶活性的多肽；提供包含磷脂的组合物；以及在磷脂酶水解、分解或破裂含磷脂组合物的条件下将所述多肽与所述组合物接触。在一个方面，该方法包括使用高剪切力混合该组合物，然后以无剪切力或低剪切力与至少一种具有磷脂酶活性的本发明的多肽混合，以使磷脂底物与磷脂酶充分“接触”。具有磷脂酶活性的至少一种多肽也可以存在于高剪切力混合步骤中。该方法可以以任何规模实施，例如以包括约1克(g)至约500、1000、2000、2500、5000g或更多，或该范围内的任何数量。

本发明提供油的脱胶(oil degumming)方法，包括以下步骤：(a)提供具有磷脂酶活性的至少一种多肽，其中多肽包括本发明的氨基酸序列，或者多肽由本发明的核酸序列编码；(b)提供包括植物油的组合物；和(c)在多肽可以切割植物油中酯键的条件下，将步骤(a)的多肽与步骤(b)的植物油接触，从而进行油的脱胶。在一方面，植物油包括油籽。植物油可以包括米糠油(rice bran oils)、棕榈油，油菜籽油，玉米油，大豆油，油菜油(canola oil)，芝麻油，花生油，或者葵花子油。在一方面，该方法进一步包括加入发明的磷脂酶，其它磷脂酶或其组合。在一个方面，将一种以上具有磷脂酶活性的多肽加入到该方法中，其中至少一种多肽是本发明的酶。在一个方面，酶以特定顺序加入，例如，具有不同特性的PLC以特定顺序加入，例如具有PC和PE活性的酶被首先加入(或者两种酶同时加入，一种具有PC活性，另一种具有PE活性)，然后加入具有PI PLC活性的酶，或其任意组合。

在油的脱胶方法的一个方面，含油组合物包括植物油、动物油、藻类油或鱼油或脂肪。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、来自棕榈果仁的油、油菜油、向日葵油、芝麻油或花生油。多肽可以水解含油组合物中来自水合和/或非水合磷脂的磷脂。在一个方面，多肽在甘油磷酯键水解磷脂从而产生甘油二酯和水溶性磷酸盐化合物。在一个方面，多肽具有磷脂酶C的活性。在一个方面，多肽是磷脂酶D，且也可以加入磷酸酶。

在油的脱胶方法的一个方面，接触步骤包括水解油中的水合磷脂。水解条件可以包括碱性条件，例如在一个方面，该条件包括在碱性pH条件下约20℃至40℃的温度。碱性条件可以包括约pH 8至pH 10，或更大的pH。在该方法的任何时刻，水解条件都可以被变为碱性，例如在一个方面，在该条件变成碱性之前，加入磷脂酶诸如PLC(例如，含酸油诸如磷脂酸的“碱性中合”)。

在油的脱胶方法的一个方面，在PLC的作用下，碱将使1，2-DAG异构成1，3-DAG，1，3-DAG的营养健康价值超过1，2-DAG，例如1，3-DAG作为能源被燃烧掉，而不是作为脂肪储存起来(如1，2-DAG)。因此，本发明提供了碱性油精炼工艺，其中磷脂酶例如本发明的酶包括PLC，“在前期(atthe front end)”加入，即在加入任何酸和碱之前加入，例如，如图13的示范性方法中所示。在本发明的碱性精炼工艺的前端加入PLC(参见下面进一步的论述)以及随后加入酸和碱的结果之一就是产生了提高水平的1，3-DAG(不是1，2-DAG)。这可能是酸或碱催化的酰基转移的结果。从营养角度讲，1，3-D AG胜于1，2-DAG。因此，本发明包括使用本发明的PLC进行的油脱胶工艺，因而最终的脱胶油产物含有不少于约0.5％、1.0％、2.0％、3.0％、4.0％或5.0％的1，3-DAG。

在油的脱胶方法的一个方面，水解条件可以包括反应时间约3至10分钟或更多时间。水解条件可以包括在约50℃至60℃的温度下，在约pH 5至pH 6.5，或约pH 5至pH 7.5，或约pH 5至pH 8.0，水解油中的水合或非水合的磷脂，反应时间是约30至60分钟。

在油的脱胶方法的一个方面，多肽被结合到过滤器上，并使含磷脂的脂肪或油通过过滤器。该多肽可以被加入到包括含磷脂脂肪或油的溶液中，然后使该溶液通过过滤器。

在油的脱胶方法的一个方面，该方法还包括通过物理的方法除去脱胶工艺产生的胶，这是通过加入硬化物质例如云母或等同物进行的。在一个方面，这增加了油产量。

本发明还提供转化非水合的磷脂成水合形式的磷脂的方法，包括以下步骤：(a)提供具有磷脂酶活性的多肽，其中多肽包括本发明的氨基酸序列，或者多肽由本发明的核酸编码；(b)提供包括非水合磷脂的组合物；和(c)在多肽能够切割非水合磷脂中的酯键的条件下，将步骤(a)的多肽与步骤(b)的非水合磷脂接触，从而将非水合磷脂转化为水合形式。

本发明提供使油脱胶的方法，包括以下步骤：(a)提供包括具有磷脂酶活性的本发明的多肽，或者由本发明核酸编码的多肽的组合物；(b)提供包括含有磷脂的脂肪或者油的组合物；(c)在多肽能够对含磷脂的组合物进行脱胶的条件下(在本发明的多肽能够催化磷脂水解的条件下)，将步骤(a)的多肽与步骤(b)的组合物接触。在一方面，含油的组合物包括植物、动物、藻或者鱼的油。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、棕榈仁的油、油菜油、葵花子油、芝麻油或者花生油。多肽可以水解含油组合物中水合和/或非水合磷脂中的磷脂。多肽可以在甘油磷脂键水解磷脂，产生甘油二酯和水溶性的磷酸盐化合物。多肽可以具有磷脂酶C，B，A或者D的活性。在一方面，加入了磷脂酶D活性和磷酸酶活性。接触可以包括油中的水合磷脂的水解。水解条件可以包括在碱性pH下，温度为大约20℃到40℃。碱性条件可以包括大约pH 8到pH 10的pH。水解条件可以包括反应时间为3到10分钟。水解条件可以包括在温度为大约50℃到60℃，pH大约为pH 5到pH 6.5，反应时间为大约30到60分钟，水解油中水合的或者非水合的磷脂。多肽可以结合于过滤器，并使含有磷脂的脂肪或者油通过过滤器。多肽可以加入到包含含磷脂的脂肪或者油的溶液中，然后使溶液通过过滤器。

本发明提供将非水合的磷脂转化为水合形式的方法，包括以下的步骤：(a)提供包括具有本发明磷脂酶活性的多肽，或者由本发明的核酸序列编码的多肽的组合物；(b)提供包括非水合的磷脂的组合物；和(c)在多肽将非水合磷脂转化为水合形式的条件下，将步骤(a)的多肽与步骤(b)组合物接触。多肽可以具有磷脂酶C的活性。多肽可以具有磷脂酶D的活性，并且也加入磷酸酶。

发明提供碱法精炼含磷脂的组合物的方法，包括以下步骤：(a)提供包含磷脂酶，其可以是本发明的具有磷脂酶活性的多肽，或者由本发明核酸编码的多肽的组合物；(b)提供包含磷脂的组合物；和(c)在碱法精炼之前，碱法精炼期间或者之后，将步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶活性，例如PLC、PLB、PLD和/或PLA活性。多肽可以在碱性精炼之前即在该方法的“前期(front end)”，在加入酸或碱之前加入，如图13所示。

多肽(其可以是本发明的酶，例如PLC)可以在碱性精炼期间加入，并根据磷水平和游离脂肪酸的水平，可以加入变化水平的酸或碱。多肽(其可以是本发明的酶)可以在碱性精炼之前或之后加入：分离以前，在强混合器(intense mixer)或阻滞混合器(retention mixer)中；加热步骤之后；在离心机中；在皂脚中；在洗涤水中；和/或在漂白或除臭步骤中。该方法可以包括使用浓的碱溶液，例如浓度比11％的工业标准更高，以降低胶的质量(mass of gum)。在可选择的方面，浓的碱溶液是在约12％至50％之间，例如约20％、30％、40％、50％或60％或更浓。

含磷脂的组合物可以包括植物。多肽可以通过转基因的方式在该植物中表达。具有磷脂酶活性的多肽可以在破碎种子或植物其他部分期间加入，或者具有磷脂酶活性的多肽在破碎之后或精炼之前加入。

还提供了使用本发明的多肽水解油(例如植物油)中的磷脂，以产生甘油二酯(DAG)和水溶性磷酸酯的碱法精炼工艺。在一个方面，本发明的酶必须在碱法精炼工艺中，包括可选地低含量水和/或在约55℃至约70℃的温度范围内操作。在该温度范围内，以低水条件使用碱法精炼工艺，将通过增加DAG和减少气体夹带油(entrained oil)而使产量最大化。在一个方面，在本发明的碱法精炼工艺中使用的酶对磷脂酰胆碱(PC)和磷脂酰乙醇胺(PE)具有非常好的活性，在约pH 6至pH 9具有活性，在高达75℃下具有活性，在低含量水例如约2％至5％水的具有活性，例如SEQ ID NO：2的序列编码的酶，SEQ ID NO：1的序列编码的酶。

在本发明用于水解油中磷脂的碱法精炼工艺的另一方面，使用了两种酶：PI-特异性PLC(水解PI)和水解PC、PE及PA的PC-PLC。该实施方案产生适合于化学或物理精炼的油，并使DAG的产量增加最大化，并减少气体夹带的油。

发明提供纯化植物甾醇或者三萜的方法，包括以下的步骤：(a)提供包括本发明的具有磷脂酶活性的多肽或者由本发明核酸编码的多肽的组合物；(b)提供含有植物甾醇或者三萜的组合物；和(c)在多肽可以催化组合物中磷脂的水解的条件下，将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。植物甾醇或者三萜可以包括植物甾醇(plant sterol)。该植物甾醇可以来源于植物油。植物油可以包括米糠油(a rice bran oil)、椰子油、油菜油(canolaoil)、可可黄油、玉米油、棉籽油、亚麻油、橄榄油、棕榈油、花生油、来自米糠的油、红花油、芝麻油、大豆油、或者葵花子油。该方法可以包括应用非极性溶剂来定量地提取游离的植物甾醇和甾醇脂肪酸酯。植物甾醇或者三萜可以包括β-谷甾醇、菜油甾醇、豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、链甾醇(desmosterol)、海绵甾醇、多孔甾醇、穿贝海绵甾醇或者菜籽甾醇。

本发明提供精炼粗制油的方法，包括以下步骤：(a)提供包括本发明的具有磷脂酶活性的多肽，或者由本发明核酸编码的多肽的组合物；(b)提供包括含磷脂的油的组合物；和(c)在多肽催化组合物中的磷脂水解的条件下，将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。多肽可以在水溶液加入到组合物的情况下具有磷脂酶活性。水的水平可以是在0.5到5％之间。处理时间可以大约2小时以下，大约60分钟以下，大约30分钟以下，大约15分钟以下，或者5分钟以下。水解条件可以包括温度范围在大约25℃到70℃之间。水解条件可以包括使用苛性碱。可以使用碱的浓溶液，例如比11％的工业标准更浓的浓度，以减少胶的质量。在可选择的方面，碱的浓溶液是在约12％至50％之间，例如约20％、30％、40％、50％或60％或更浓的浓度。

水解条件可以包括pH范围在大约pH 3到pH 10之间、在大约pH 4到pH9之间、或者在大约pH 5到pH 8之间。水解条件可以包括在接触步骤(c)后加入乳化剂和/或进行混合。该方法可以包括加入乳化剂破乳剂(emulsifiers-breaker)和/或加热或冷却(例如在约4℃至约-20℃之间，或更低温度)，来促进水相的分离。该方法可以包括在接触步骤前进行脱胶，通过离心收集卵磷脂，然后再加入PLC，PLC和/或PLA以去除非水合的磷脂。对于食用油，该方法可以包括对粗油进行水脱胶到少于10ppm的磷，对于生物柴油，然后通过物理精炼到少于大约50ppm的磷。该方法可以包括加入酸来增强非水合磷脂的水合作用。在一个方面，加入酸来促进钙和镁金属含量的降低。

本发明提供了改善或防止脂多糖(LPS)-介导的毒性的方法，该方法包括给予患者包含本发明多肽的药物组合物。本发明提供了内毒素的解毒方法，包括使内毒素与本发明的多肽接触。本发明提供了从类脂A上脱去2′或3′脂肪酸链的脱酰基方法，包括将类脂A与本发明的多肽接触。

本发明提供了精炼润滑剂的方法，包括以下步骤：(a)提供包括本发明的酶的组合物；(b)提供润滑剂；和(c)在酶可以选择性地水解润滑剂中的油的条件下，用酶处理润滑剂，从而精炼该润滑剂。该润滑剂可以是液压油。

本发明提供了处理织物的方法，包括下述步骤：(a)提供包括本发明的酶的组合物；(b)提供织物；和(c)用该酶处理织物。织物的处理可以包括最终织物的手感和褶皱的改善、染色、获得阻燃性、获得防水性、获得光学亮度或者获得树脂整理。该织物可以包括棉、粘胶纤维、人造纤维、lyocell、亚麻(flax)、亚麻(linen)、苎麻、其所有的混合物，或者它们与聚酯、羊毛、聚酰胺、丙烯酸类或聚丙烯酸类的混合物。本发明提供了包含本发明的酶的织物、纱线或纤维。该酶可以被吸附，吸附或固定在织物、纱或纤维的表面。

本发明提供了表达磷脂酶C方法，该方法包括提供具有Mut⁺表型的毕赤酵母菌株；将异源的磷脂酶C-编码核酸插入毕赤酵母菌株；并将毕赤酵母菌株培养在表达磷脂酶C的条件下。该方法还可以包括用锌补充培养条件。本发明也提供了用于表达磷脂酶C的细胞体系，分离的细胞和细胞系，包括Mut⁺表型毕赤酵母菌株，其含有可操作性地连接于毕赤酵母菌株中可以操作的启动子的异源的磷脂酶C-编码核酸。

本发明提供了用于表达异源蛋白的耐zeocin的酵母细胞体系(例如酵母细胞、细胞系、单个细胞)，包括步骤：提供含有能够表达异源蛋白的异源核酸的毕赤酵母某种(Pichia sp.)(例如巴斯德毕赤酵母(P.pastoris))细胞；在含某一初始浓度zeocin的条件下培养该细胞；挑选对初始浓度的zeocin有抗性的细胞，并在含有较高浓度zeocin的条件下再培养；并挑选出步骤(C)中培养的耐较高浓度zeocin的细胞。在一个方面，异源蛋白是酶，或任选地是磷脂酶，或任选地是磷脂酶C(PLC)，例如本发明的任何酶。

本发明的一个或者多个实施方案的细节在附图和以下的说明书中进行阐明。本发明的其它特征，目标，以及优势将通过阅读说明书和附图以及权利要求得变得显而易见。

出于各种目的，本文所引用的所有出版物、专利、专利申请、GenBank序列以及美国模式菌种保藏中心(ATCC)保藏物，特意并入本文作为参考。

附图简述

下图是本发明的实施方案的例示性说明，并不为了限制权利要求所包含的发明范围。

图1是计算机系统的框图，具体的细节说明参见下文。

图2是过程200的一个方面的流程图，为了确定新序列和数据库中的序列之间的同源性水平，把新的核苷酸或蛋白质序列与数据库中的序列相比较，具体的细节说明参见下文。

图3是举例说明在计算机中确定两个序列是否是同源的过程的实施方案的流程图，具体细节说明参见下文。

图4是举例说明标识符过程的一个方面的流程图，该标识符过程用于检测序列中特征的存在与否，具体的细节说明参见下文。

图5A、5B和5C用图表说明用于模拟PLC-介导的脱胶的典型两相系统，具体的细节说明参见下文。

图6用图表说明了应用本发明的磷脂酶的典型的植物油精炼过程。

图7用图表说明用于物理精炼油的发明的典型脱胶过程，具体的细节说明参见下文。

图8用图表说明用本发明的磷脂酶C进行的磷脂水解，具体的细节说明参见下文。

图9用图表说明了本发明的示例性碱法精炼工艺，说明了用本发明的磷脂酶C作为“碱法精炼辅助剂”(长混合碱法精炼)的一个可选择的实施方案，具体的细节说明参见下文。

图10用图表说明了用本发明的磷脂酶C作为脱胶辅助剂，具体的细节说明参见下文。

图11用图表描述了本发明的示例性核酸和多肽的选择的特征，如在下面进一步详细描述地。

图12图示了来自本发明的两个酶系统的数据，如在下面实施例3中所述。

图13图示了本发明的示例性碱炼工艺，并示出了一个可选的实施方案，包括应用本发明的酶C作为“碱炼助剂”(长混合碱炼(Long Mix Caustic Refining))，如下面详细描述地。

图14示出了本发明方法的另一种示例性变化，其中在工艺中使用了两个离心步骤，如下面详细描述地。

图15示出了本发明方法的另一种示例性变化，其中在工艺中使用了三个离心步骤，如下面详细描述地。

图16示出了本发明方法的另一种示例性变化，其使用酸处理并在脱胶步骤之前具有离心步骤，如下面详细描述地。

图17示出了体外消化试验的结果，其中本发明的磷脂酶C变体，如下面实施例4中详细描述地。

图18示出了使用本发明的示例性酶进行的分批发酵罐培养的结果，如下面实施例5中详细描述地。

图19示出了本发明的巴斯德毕赤酵母MutS菌株的氧吸收速率(″OUR″)比较结果，如下面实施例5中详细描述地。

图20示出了本发明的巴斯德毕赤酵母MutS菌株的甲醇消耗图结果，如下面实施例5中详细描述地。

图21示出了本发明SEQ ID NO：2的示例性PLC酶的重组形式的培养物的“OUR”图，如下面实施例5中详细描述地。

图22示出了SDS-PAGE的结果，显示了在培养物中产生的PLC蛋白的质量，和与之相应的、本发明SEQ ID NO：2的示例性PLC酶的重组形式的培养物的“OUR”图，如下面实施例5中详细描述地。

图23示出了SDS-PAGE的结果，显示了活性PLC的数量，该活性PLC位于本发明SEQ ID NO：2的示例性PLC酶的重组形式的培养物的胞内，如下面实施例5中详细描述地。

图24示出了与活性PLC相关的酵母细胞形态学变化的可视化图——本发明SEQ ID NO：2的示例性PLC酶的重组形式，如下面实施例5中详细描述地。

图25用概述了数据，显示了在95h TFT(总发酵时间)，在毕赤酵母中，使用本发明SEQ ID NO：2的示例性PLC酶进行的PLC生产性能的状态，如下面实施例5中详细描述地。

图26是表，概述了数据，这些数据来自对本发明的示例性zeocin-适应的细胞菌落的表达筛选，如下面实施例5中详细描述地。

图27示出了数据，这些数据显示，在含有本发明的示例性zeocin-适应的细胞菌落的培养物中，PLC蛋白水平是较高的，如下面实施例5中详细描述地。

图28示出了数据，这些数据显示了本发明的zeocin-适应的细胞菌落与对照的生长比较，如下面实施例5中详细描述地。

图29示出了加热试验的结果，显示了本发明SEQ ID NO：2的示例性酶的热稳定性，图中指出了条件，如下面实施例5中详细描述地。

图30示出了总结加热试验的NMR数据，证明了本发明SEQ ID NO：2的示例性酶的热稳定性，如下面实施例6中详细描述地。

图31、32和33示出了数据，这些数据证明了SEQ ID NO：2的热稳定性，使用p-NPPC，条件为图中显示的条件，如下面实施例6中详细描述地。

图34示出了数据，这些数据证明了SEQ ID NO：2的热稳定性，使用DSC分析，如下面实施例6中详细描述地。

不同图中的类似参考符号表明类似的元素。

发明详述

本发明提供了磷脂酶，例如，具有磷脂酶A、B、C和D、patatin、磷脂酸磷脂酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽，编码它们的多核苷酸，以及制备和应用它们的方法。本发明提供了有效地切割油诸如植物油中的甘油磷酸酯键，例如油籽磷脂，从而产生水可提取的磷酸化的碱和甘油二酯的酶。一方面，本发明的磷脂酶具有脂酰水解酶(LAH)的活性。在可选择的方面，本发明的磷脂酶可以切割磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸和/或鞘磷脂或它们的组合中的甘油磷酸酯键(glycerophosphate esterlinkage)。例如，在一个方面，本发明的磷脂酶对一种或多种特定的底物具有特异性，例如本发明的酶可以对PE和PC；PE和PI；PE和PS；PS和PE；PS和PI；PI和PE；PS、PI和PC；PE、PI和PC；或PE、PS、PI和PC具有特异性作用。

本发明的磷脂酶(如，具有磷脂酶A、B、C和D、patatin、磷脂酸磷脂酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽)可以用于植物油的酶法脱胶，这是因为磷酸部分可溶于水，并且容易去除。甘油二酯产物将仍存留在油中，从而降低损失。本发明的PLCs可以用作在商业上的油脱胶诸如ENZYMAX

工艺中的PLA1s和PLA2s的补充或者替代，在所述ENZYMAX

工艺中磷脂是由PLA1和PLA2水解的。

在一方面，本发明的磷脂酶在高温和/或低温下，或者在较宽的温度范围内，具有活性，例如，它们可以在20℃到90℃，30℃到80℃，或者在40℃到70℃的温度范围具有活性。本发明也提供在碱性pH或者酸性pH，例如低的水酸度具有活性的本发明的磷脂酶。在可选择的方面，本发明的磷脂酶可以在酸性pH低至pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0和pH3.5或更加酸性(即pH＜3.5) 的条件下仍具有活性。在可选择的方面，本发明的磷脂酶可以在碱性pH高至pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、pH10或碱性更大(即pH＞10)的条件下具有活性。一方面，本发明的磷脂酶在低水活度(低的水含量)条件下，在约40℃到约70℃、75℃或80℃或更高温度之间的温度下具有活性。

本发明也提供了用于进一步修饰本发明的示范性磷脂酶以产生具有期望特性的酶的方法。例如，由本发明方法产生的磷脂酶可以具有改变了的底物特异性、底物结合特异性、底物切割型式、热稳定性、pH/活性曲线、pH/稳定性曲线(如在较低pH值，例如pH＜6或者pH＜5，或者较高的pH值，如pH＞9的情况下稳定性提高)、对于氧化作用的稳定性、Ca²⁺依赖性、比活性和类似特性。本发明提供对于任何感兴趣特性的改变。例如，这些改变可以产生与母本磷脂酶相比具有改变的pH和温度活性曲线的变异体。

在一方面，本发明的磷脂酶被用于各种植物油处理步骤中，如植物油提取中，特别地，用在称为“油脱胶”的过程中去除“磷脂胶(phospholipid gums)”，如本文所述。本发明提供了组合物(例如包含本发明的酶)和由各种来源生产植物油的工艺，所述各种来源如米糠、大豆、油菜、花生、芝麻、向日葵和玉米。本发明的磷脂酶可以在任何植物油加工步骤中被用于替代PLA，例如磷脂酶A2。

定义

术语“磷脂酶”包括具有任何磷脂酶活性的酶，例如，切割油中，如植物油中的甘油磷酸酯键(催化水解甘油磷酸酯键)。本发明的磷脂酶活性可以产生可水提取的磷酸化的碱以及甘油二酯。本发明的磷脂酶活性也包括在高温、低温、碱性pH和酸性pH条件下水解甘油磷酸酯键。术语“磷脂酶活性”也包括切割甘油磷酸酯以产生可水提取的磷酸化的碱以及甘油二酯。术语“磷脂酶活性”也包括切割磷脂中甘油和磷酸的酯键。术语“磷脂酶活性”也包括其它的活性，如结合并水解底物的能力，底物如油，例如植物油，底物也包括植物和动物磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性；磷脂酶A(PLA)活性，如磷脂酶A1或者磷脂酶A2活性；磷脂酶B(PLB)活性，如磷脂酶B1或者磷脂酶B2活性，包括溶血磷脂酶(LPL)活性和/或溶血磷脂酶-转酰基酶(LPTA)活性；磷脂酶D(PLD)活性，如磷脂酶D1或者磷脂酶D2活性；和/或patatin活性或它们的任何组合。磷脂酶活性可以包括水解糖蛋白，如马铃薯块茎中或者任何茄属植物(Solanum)如马铃薯(Solanum tuberosum.)中的糖蛋白。磷脂酶活性可以包括patatin酶活性，如patatin酯酶活性(见，例如，Jimenez(2002)Biotechnol.Prog.18：635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。磷脂酶活性可以包括对一种或多种特定的底物具有特异性，例如本发明的酶可以对PE和PC；PE和PI；PE和PS；PS和PE；PS和PI；PI和PE；PS、PI和PC；PE、PI和PC；或PE、PS、PI和PC，或它们的任何组合具有特异性作用。

在一个方面，本发明的磷脂酶可以具有多功能活性，例如一种或多种本文中描述的酶活性的组合。例如，在一个方面，本发明的多肽具有酶活性，但是缺少脂酶活性，或缺少影响中性油(甘油三酯)组分的任何酶活性。在特定的工艺中，例如在脱胶工艺中使用这样的多肽可能是有利的，在脱胶工艺中，中性油组分不受损害(减少、降解例如水解)是重要的。因此，在一个方面，本发明提供了脱胶工艺，该工艺包括使用具有磷脂酶活性但是缺少脂酶活性的本发明多肽。

在一个方面，本发明的PLC磷脂酶利用(例如催化水解)各种磷脂底物，包括磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)和/或磷脂酸或它们的组合。此外，这些酶对这些磷脂的溶血磷脂形式具有不同程度的活性。在各个方面，本发明的PLC酶可以对磷脂酰胆碱和磷脂酰乙醇胺作为底物显示出偏好性。

在一个方面，本发明的磷脂酰肌醇PLC磷脂酶利用各种磷脂底物，包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外，这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面，本发明的磷脂酰肌醇PLC酶可以对磷脂酰肌醇作为底物显示出偏好性。

在一个方面，本发明的patatin酶利用各种磷脂底物，包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外，这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面，本发明的patatin可以基于氨基序列相似性的保守性。在不同的方面，这些酶展示出多组不同的生物化学特性，并可以进行PLA1、PLA2、PLC或PLD酶类的特征性反应。

在一个方面，本发明的PLD磷脂酶利用各种磷脂底物，包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外，这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在一个方面，这些酶可用于进行转酯反应，以产生具有一定结构的磷脂。

术语“抗体”包括源自、建模自(modeled after)或者实质上编码自一种或多种免疫球蛋白基因或其片段的肽或者多肽，其能够特异地结合于抗原或者表位，参见，例如Fundamental lmmunology，Third Edition，W.B.Paul，ed.，Raven Press，N.Y.(1993)；Wilson(1994)J.Immunol.Methods 175：267-273；Yarmush(1992)J.Biochem.Biophys.Methods 25：85-97。术语抗体包括抗原结合部分，即，“抗原结合位点”(例如，保持了结合抗原能力的片段、子序列、互补决定区(CDRs)，包括：(i)Fab片段，由VL、VH、CL和CH1结构域组成的单价片段；(ii)F(ab’)₂片段，包括在铰链区通过二硫键连接两个Fab片段的二价片段；(iii)由VH和CH1结构域组成的Fd片段；(iv)由抗体单臂的VL和VH结构域组成的Fv片段，(v)由VH结构域组成的dAb片段(Ward et al.，(1989)Nature 341：544-546)；以及(vi)分离的互补决定区(CDR)。单链抗体也被包括于术语“抗体”中。

在此应用的术语“阵列(array)”或者“微阵列(microarray)”或者“生物芯片(biochip)”或者“芯片(chip)”是许多靶元素，每一个靶元素包括确定量的一个或者多个多肽(包括抗体)或者固定于底物表面积的确定区域上的核酸，参见下面进一步的具体讨论。

正如在此所用地，术语“计算机”，“计算机程序”和“处理器”以它们最广的含义使用，并整合所有这样的设备，如以下详细描述的。

特定的多肽或者蛋白的“编码序列”或者“编码特定的多肽或者蛋白的序列”，是指当置于合适的调控序列的控制下可以转录和翻译成多肽或者蛋白的核酸序列。

在此使用的术语“表达盒(expression cassette)”是指在宿主细胞中可以影响结构基因表达(即，编码蛋白质，如本发明的磷脂酶的序列)的核苷酸序列，所述宿主细胞与所述核苷酸序列相容。表达盒包括至少一个可以可操作地连接至编码多肽的序列上的启动子；并且，可选择地，连接有其它的序列例如，转录终止信号。也可以应用进行表达所必要的或有帮助的额外的因子，例如，增强子。如在此所应用的“可操作地连接(Operably linked)”是指连接DNA序列上游的启动子，这样该启动子能够介导该DNA序列的转录。因此，表达盒也包括质粒、表达载体、重组病毒、任何形式的重组的“裸露DNA”载体，和类似物。“载体”包括可以感染、转染、瞬间或者永久转导细胞的核酸。将被认识到，载体可以是裸露的核酸，或者与蛋白或者脂类复合的核酸。载体可选择地包括病毒或者细菌的核酸和/或蛋白，和/或膜(如，细胞膜，病毒的脂包膜，等等)。载体包括，但不限于复制子(如，RNA复制子，细菌噬菌体)，DNA片段可以连接到其上，并被复制。载体因此包括，但不限于是RNA，自主复制的环状或者线性的DNA或者RNA(如，质粒、病毒以及类似物，参见，如，美国专利No.5,217,879)，并且也包括表达载体和非表达质粒。当重组微生物或者细胞培养物被描述容纳“表达载体”时，其包括染色体外的环状和线性DNA，和已经整合进入宿主染色体的DNA。当载体由宿主细胞维持时，该载体可以在细胞有丝分裂期间作为自主结构由细胞稳定地复制，或者整合入宿主基因组中。

“质粒”的命名为在大写字母和/或数字之前和/或之后加上小写字母“p”。在此使用的起始质粒(starting plasmid)可以通过商业渠道获得，通过公共渠道自由获得，或者按照公开的程序从可利用的质粒构建得到。此外，与那些在此描述的质粒等价的质粒是在本领域是已知的，并且对普通技术人员而言是显而易见的。

术语“基因”是指参与产生多肽链的DNA片段，包括，在编码区的前面和后面的区域，如头部和尾部，启动子和增强子，以及适当情况下，单个编码片段(外显子)之间的插入序列(内含子)，等等。

如在此应用的短语“核酸”或者“核酸序列”是指寡核苷酸、核苷酸、多核苷酸、或者是指它们中的任何之一的片段，是指基因组或者合成来源的DNA或者 RNA(如，mRNA、rRNA、tRNA、iRNA)，其可以是单链的或者双链的，并且可以代表有义链或者无义链，是指肽核酸(PNA)，或者是指任何DNA样或者RNA样的物质，天然的或者合成来源的，包括如，iRNA，核糖核蛋白(如双链iRNA，如iRNPs)。该术语包括核酸，即，寡核苷酸，包括天然核苷酸的已知类似物。该术语也包括具有合成骨架的核酸样结构，见，如，Mata(1997)Toxicol.Appl.Pharmacol.144：189-197；Strauss-Soukup(1997)Biochemistry 36：8692-8698；Samstag(1996)Antisense Nucleic Acid Drug Dev 6：153-156。

在此应用的“氨基酸”或者“氨基酸序列”是指寡肽，肽，多肽，或者蛋白序列，或者是指这些序列中的任何序列的片段、部分或亚基，并且是指天然产生的或者合成的分子。

在此应用的术语“多肽”和“蛋白”是指通过肽键或者修饰的肽键相互连接在一起的氨基酸，即，肽等排体，可以含有除了20个基因编码的氨基酸外的修饰氨基酸。术语“多肽”也指肽或者多肽片段，基序(motif)和类似物。该术语也包括糖基化的多肽。本发明的肽或者多肽也包括所有“模拟”和“肽模拟”形式，如下面进一步描述地。

如在此所应用的，术语“分离的”是指从起始的环境(如，如果是天然发生的，那么就是天然环境)中移取的物质。例如，存在于活动物中的天然发生的多核苷酸或者多肽不是分离的，但是，如果该同样的多核苷酸或者多肽，与天然系统中的一些或者所有的共存物分离，那么就是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或者多肽可以是一个组合物的一部分，并且仍然是分离，这是因为这样的载体或者组合物不是天然环境的一部分。正如在此使用的，分离的物质或者组合物也可以是“纯化”的组合物，即，它并不需要绝对的纯度；相反，认为其是相对性的定义。从文库中得到的单个核酸可以经过常规纯化为具有电泳均一性。可选择的方面，本发明提供从基因组DNA或者从文库中的其它序列中或者其它的环境中纯化至少一个、两个、三个、四个、五个或者更多数量级的核酸。

正如在此应用的，术语“重组子”是邻接于“骨架”核酸的核酸，而在天然环境下它们并不邻接。在一方面，核酸代表了核酸“骨架分子”群体中5％或者更多数目的核酸插入物。本发明的“骨架分子”包括核酸，如表达载体、自主复制核酸、病毒、整合性核酸，和用于维持或者操作感兴趣的核酸插入物的其他的载体或者核酸。在一方面，富集的核酸代表了重组骨架分子群体中的15％、20％、30％、40％、50％、60％、70％、80％、90％或者更多数目的核酸插入物。“重组”多肽或者蛋白是指由重组DNA技术产生的多肽或者蛋白，如，从用编码所需多肽或者蛋白的外源DNA构建物转化的细胞产生。“合成的”多肽或者蛋白是那些通过化学合成制备的多肽或者蛋白，如下面进一步描述地。

如下面进一步讨论地，当在启动子处启动转录的RNA聚合酶将编码序列转录成为mRNA时，启动子序列被“可操作地连接于”编码序列。

“寡核苷酸”是指单链多脱氧核苷酸或者两个互补的多脱氧核苷酸链，它们可以通过化学合成。这样合成寡核苷酸在5’没有磷酸，因此在激酶存在时，不通过ATP加入磷酸的情况下，不能连接于另一个寡核苷酸。合成的寡核苷酸将连接于没有脱磷酸化的片段。

在两核酸或者多肽上下文中的短语“实质上相同(substantially identical)”，是指当为了获得最大对应性(correspondence)而比较和比对时，具有至少50％、60％、70％、75％、80％、85％、90％、95％、98％或者99％的核苷酸或者氨基酸残基(序列)同一性的两个或者多个序列，所述最大对应性用任何已知的序列比较算法测量，如以下详细讨论的，或者通过目测的方法测量。在可选择的方面，本发明提供与本发明的示范性序列，如SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8等等在核酸或者多肽的至少大约100个残基、150个残基、200个残基、300个残基、400个残基的区域内或者从约50个残基到全长之间的区域内，实质上相同的核酸和多肽序列。本发明的核酸序列可以在多肽编码区域的整个长度上实质上相同。

另外的，“实质上相同(substantially identical)”的氨基酸序列是与参考序列差异一个或者多个保守性或者非保守性的氨基酸取代、缺失或者插入的序列，特别地，当这样的取代发生在分子的非活性位点的位置上，只要多肽基本上保留了它的功能特性。保守氨基酸的取代，例如，用一个氨基酸取代另一个同类的氨基酸(如，将一个疏水氨基酸，如异亮氨酸、缬氨酸、亮氨酸或者甲硫氨酸置换为另一个疏水氨基酸，或者将极性氨基酸置换为另一个极性氨基酸，如，将赖氨酸置换为精氨酸，将谷氨酸置换为天冬氨酸或者，将谷酰胺置换为天冬酰胺)。可以缺失一个或者多个氨基酸，例如，从磷脂酶多肽中缺失一个或者多个氨基酸，从而对多肽结构进行修饰，而并不显著改变其生物活性。例如，可以去除对于磷脂酶的生物活性并不需要的氨基或者羧基端氨基酸。可以通过很多的方法分析本发明修饰的多肽序列的磷脂酶活性，包括将修饰的多肽序列与磷脂酶底物接触，并且确定是否修饰的多肽减少了分析中的特异底物的量或者增加了功能性磷脂酶与底物的酶促反应的生物产物的量，如下面进一步论述地。

“杂交”是指通过碱基配对，核酸链与互补链结合的过程。杂交反应可能是敏感的并且具有选择性，这样可以鉴定在样品中以低浓度存在的感兴趣的特定的序列。合适的严格条件可以通过例如，预杂交和杂交溶液中的盐和甲酰胺浓度，或者杂交温度来确定，并且本领域是熟知的。例如，严格性的增加可以通过降低盐浓度，增加甲酰胺的浓度，或者提高杂交温度，改变杂交时间予以实现，如下面所详细描述地。在可选择的方面，本发明的核酸通过它们可以在各种的严格条件下(如，高，中，和低)杂交的能力来确定，如在此所阐明地。

术语“变异体”是指在一个或者多个碱基对、密码子、内含子、外显子、或者氨基酸残基(分别地)被修饰，但仍保持本发明的磷脂酶的生物活性的本发明的多核苷酸或者多肽。变异体可以通过很多种方法产生，例如，易错PCR、重排、寡核苷酸定向诱变、装配PCR、有性PCR诱变、体外诱变、盒式诱变、递归整体诱变、指数整体诱变、定点诱变、基因重装配，GSSM^TM和它们的组合。在此包括了产生在一定的pH或温度下具有活性的磷脂酶，例如，不同与野生型磷脂酶的突变体技术。

术语“饱和诱变(saturation mutagenesis)”、基因位点饱和诱变^TM(GSSMTM)或者“GSSM^TM”，包括应用简并的寡核苷酸引物将点突变引入多核苷酸中的方法，如下的详细解释。

术语“优化的定向进化系统(optimized directed evolution system)”或者“优化的定向进化(optimized directed evolution)”包括对相关核酸序列，例如，相关基因的片段重新进行装配的方法，并在下面进行了详细解释。

术语“合成连接重装配(synthetic ligation reassembly)”或者“SLR”包括以非随机的方式连接寡核苷酸片段的方法，并在下面进行了详细解释。

核酸的产生和操作

本发明提供分离的或重组的核酸(例如示范性的SEQ ID NO：1、SEQ IDNO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、SEQ ID NO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、SEQ ID NO：75、SEQ ID NO：77、SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、SEQ ID NO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、SEQ ID NO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、SEQ ID NO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ ID NO：111、SEQ IDNO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ ID NO：129、SEQ IDNO：131、SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ ID NO：147、SEQ IDNO：149、SEQ ID NO：151、SEQ ID NO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ ID NO：165、SEQ IDNO：167、SEQ ID NO：169、SEQ ID NO：171或SEQ ID NO：173)，包括编码本发明的多肽和磷脂酶的表达盒，如表达载体。本发明也包括应用本发明的核酸发现新的磷脂酶序列的方法。也提供用于修饰本发明核酸的方法，例如，合成连接重装配、优化的定向进化系统和/或饱和诱变。

通过，如，克隆和表达cDNA文库，通过PCR扩增信使或者基因组DNA，和类似方法，发明的核酸可以制备，合成和/或进行操作。在实践本发明的方法中，通过操作模板核酸，可以修饰同源基因，正如在此所述的。本发明可以和本领域已知的其它任何方法或者方案或者装置结合进行实践，这些方法或者方案或者装置在科学和专利的文献中得到充分描述。

一般技术

用于实践本发明的核酸，不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或者它们的杂合体，都可以自不同的来源分离，进行遗传工程改造，扩增，和/或表达/重组产生。从这些核酸产生的重组多肽可以单独分离或者克隆，并且检测所需的活性。可以应用任何重组表达系统，包括细菌、哺乳动物、酵母、昆虫或者植物细胞表达系统。

可选择地，这些核酸可以通过已知的化学合成技术在体外合成，如在如Adams(1983)J.Am.Chem，Soc.105：661；Belousov(1997)Nucleic Acids Res.25：3440-3444；Frenkel(1995)Free Radic.Biol.Med.19：373-380；Blommers(1994)Biochemistry 33：7886-7896；Narang(1979)Meth.Enzymol.68：90；Brown(1979)Meth.Enzymol.68：109；Beaucage(1981)Tetra.Lett.22：1859；美国专利4,458,066中描述的。

用于核酸操作的技术，如，亚克隆，探针标记(如，使用Klenow聚合酶的随机引物标记，切口平移，扩增)，测序，杂交等等，这些方法在科学和专利文献中已充分描述，参见，如，Sambrook，ed.，MOLECULAR CLONING：ALABORATORY MANUAL(2ND ED.)，Vols.1-3，Cold Spring Harbor Laboratory，(1989)；CURRENT PROTOCOLS IN MOLECULAR BIOLOGY，Ausubel，ed.JohnWiley&Sons，Inc.，New York(1997)；LABORATORY TECHNIQUES INBIOCHEMSTRY AND MOLECULAR BIOLOGY：HYBRlDlZATION WITHNUCLEIC ACID PROBES，Part I.Theory and Nucleic Acid Preparation，Tijssen，ed.Elsevier，N.Y.(1993)。

获得和操作用于实践本发明方法的核酸另一有用方法是从基因组样品中克隆，并且如果需要，筛选和再克隆从例如，基因组克隆或者cDNA克隆中分离或者扩增的插入物。在发明方法中使用的核酸的来源包括包含于如，哺乳动物人工染色体(MACs)中的基因组或者cDNA文库，见如，美国专利5,721,118，6,025,155；人类人工染色体，见，如，Rosenfeld(1997)Nat.Genet.15：333-335，酵母人工染色体(YAC)；细菌人工染色体(BAC)；P1人工染色体，见，如，Woon(1998)Genomics 50：306-316；P1衍生的载体(PACs)，见，如，Kern(1997)Biotechniques 23：120-124，粘粒、重组病毒、噬菌体或者质粒。

在一方面，编码本发明多肽的核酸在适当的阶段与能够指导翻译的多肽或者片段分泌的前导序列装配在一起。

本发明提供融合蛋白和编码融合蛋白的核酸。本发明的多肽可以与异源的肽或者多肽融合，如N-末端鉴定肽，其赋予了所需的特征，如增加的稳定性或者简化的纯化方法。本发明的肽和多肽也可以以与一个或者多个连接其上的额外的结构域形成融合蛋白的形式合成并表达，从而，如，产生更具免疫源性的肽，更容易分离重组合成肽，鉴定和分离抗体和表达抗体的B细胞，等等。有利于检测和纯化的结构域包括，如，允许在固定化金属上纯化的金属螯合肽，如，聚组氨酸序列(polyhistidine tracks)和组氨酸-色氨酸模块(histidine-tryptophan modules)，允许在固定的免疫球蛋白上纯化的蛋白A结构域，以及在FLAGS延伸/亲和纯化系统(FLAGS extension/affinity purification system，Immunex Corp，Seattle WA)中使用的结构域。在纯化结构域和含有基序的肽或者多肽之间，包含可以切割的连接序列如因子Xa或者肠激酶(lnvitrogen，San Diego CA)的接头序列，以便于纯化。例如，表达载体可能包括连接于六个组氨酸残基的编码表位的核酸序列，然后是硫氧还蛋白和肠激酶切割位点(见，如，Williams(1995)Biochemistry 34：1787-1797，Dobeli(1998)Protein Expr.Purif.12：404-414)。组氨酸残基有利于检测和纯化，而肠激酶切割位点提供从融合蛋白的剩余物中纯化表位的方法。与编码融合蛋白的载体相关的技术以及应用融合蛋白的技术，在科学和专利文献中已充分描述，参见例如例如Kroll(1993)DNA Cell.Biol.，12：441-53。

转录和翻译控制序列

本发明提供可操作地与表达(如，转录和翻译)控制序列如，启动子或者增强子连接以指导或者调控RNA的合成/表达的本发明核酸(如，DNA)序列。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp启动子。典型的真核启动子包括CMV即刻早期、HSV胸腺嘧啶激酶、早期和晚期SV40，来自逆转录病毒的LTRs和鼠金属硫蛋白I。

适于在细菌中表达多肽的启动子包括大肠杆菌lac或者trp启动子，lacI启动子，lacZ启动子，T3启动子，T7启动子，gpt启动子，λPR启动子，λPL启动子，来自编码糖酵解的酶如，3-磷酸甘油激酶(PGK)的操纵子的启动子，和酸性磷酸酶启动子。真核启动子包括CMV即刻早期启动子，HSV胸腺嘧啶激酶启动子，热休克启动子，早期和晚期SV40启动子，来自逆转录病毒的LTRs，和鼠金属硫蛋白I启动子。也可以应用已知的在原核或者真核细胞或者其病毒中控制基因表达的其它启动子。

表达载体和克隆载体

本发明提供包括发明的核酸，如，编码发明的磷脂酶的序列的表达载体和克隆载体。本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒、粘粒、fosmids、细菌人工染色体、病毒DNA(如，牛痘、腺病毒、禽类痘病毒、伪狂犬病病毒和SV40衍生物)，以P1为基础的人工染色体、酵母质粒、酵母人工染色体以及对感兴趣的特定宿主(如杆菌属(Bacillus)，曲霉属(Aspergillus)和酵母)特异的任何其它载体。本发明的载体可以包括染色体的，非染色体的和合成的DNA序列。很多合适的载体为本领域技术熟练人员所了解，并且可以买到。典型的载体包括：细菌的：pQE载体(Qiagen)、pBluescript质粒、pNH载体、λ-ZAP载体(Stratagene)；ptrc99a、pKK223-3、pDR540、pRIT2T(Pharmacia)；真核的：PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而，也可以应用任何其它的质粒或其他的载体，只要它们可以在宿主中复制并且有活力。低拷贝数或者高拷贝数的载体可以应用于本发明。

表达载体可以包括启动子，用于翻译起始的核糖体结合位点和转录终止子。载体也包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起始位点，任何必要的核糖体结合位点，多腺苷酸化位点，剪接供体和受体位点，转录终止序列，和5′侧非转录序列。在一些方面，源于SV40的剪接和多聚腺苷酸化位点的DNA序列可以用于提供所需的非-转录遗传元件。

在一个方面，表达载体含有一个或者多个选择性标记基因，使得可以选择含有该载体的宿主细胞。这些选择标记包括编码二氢叶酸还原酶的基因或对赋予真核细胞培养物对新霉素有抗性的基因，大肠杆菌中赋予抗四环素或者抗氨苄青霉素的基因，以及酿酒酵母(S.cerevisiae)的TRP1基因。启动子区域可以使用氯霉素转移酶(CAT)载体或者具有选择标记的其它载体，从任何所需基因中选择。

在真核细胞中表达多肽或者其片段的载体也包含增加表达水平的增强子。增强子是DNA的顺式作用元件，一般长度从大约10到大约300bp，其作用于启动子，增强启动子的转录。例子包括在复制起点的旁侧100到270bp的SV40增强子，巨细胞病毒的早期启动子增强子，在复制起点的旁侧的多瘤增强子，和腺病毒增强子。

DNA序列可以以各种的程序插入到载体中。一般而言，用适合的限制性内切酶消化插入片段和载体之后，将DNA序列连接于载体的期望位置上。各种克隆技术是本领域已知的，例如，如在Ausubel和Sambrook中所描述的技术。这样的程序和其它程序被认为是在本领域的技术人员的知识范围之内。

载体可以是质粒，病毒颗粒或者噬菌体的形式。其它的载体包括染色体的，非染色体的和合成的DNA序列，SV40的衍生物；细菌质粒，噬菌体DNA，杆状病毒，酵母质粒，源于质粒和噬菌体DNA组合的载体，病毒DNA如牛痘，腺病毒，禽类痘病毒，和伪狂犬病病毒。例如，Sambrook描述了原核和真核宿主中使用的多种克隆和表达载体。

可以应用的特定细菌载体包括可以从商业渠道获得的质粒，包括下述为人熟知的克隆载体的遗传元件：pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals，Uppsala，Sweden)，GEM1(Promega Biotec，Madison，WI，USA)pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174、pBlueScript II KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK223-3、pDR540、pRIT5(Pharmacia)、pKK232-8和pCM7。特别的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而，也可以应用任何其它的载体，只要它在宿主细胞可以复制和繁殖。

宿主细胞和转化的细胞

本发明也提供包括发明核酸序列，如，编码本发明磷脂酶的序列，本发明的载体的转化的细胞。宿主细胞可以是本领域技术熟练人员所熟悉的任何宿主细胞，包括原核细胞，真核细胞，如，细菌细胞，真菌细胞，酵母细胞，哺乳动物细胞，昆虫细胞，或者植物细胞。本发明的酶可以在任何宿主细胞中表达，例如任何细菌细胞、任何酵母细胞，例如巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母(Schizosaccharomyces pombe)。示范性的细菌细胞包括大肠杆菌(E.coli)、乳酸乳球菌(Lactococcus lactis)、链霉菌属(Streptomyces)、枯草芽孢杆菌(Bacillussubtilis)、鼠伤寒沙门菌(Salmonella typhimurium)和杆菌属(Bacillus)、链霉菌属和葡萄球菌属(staphylococcus)中的任何菌株。示例性的昆虫细胞包括果蝇S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9)。示例性的动物细胞包括CHO、COS或者黑色素瘤(Bowes melanoma)或者任何小鼠或者人类细胞系。适当的宿主的选择是在本领域技术人员的能力之内。

可以应用任何不同的技术将载体引入到宿主细胞，这些技术包括转化、转染、转导、病毒感染、基因枪或者Ti-介导的基因转移。特定的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂质体转染或者电穿孔(Davis，L.，Dibner，M.，Battey，I.，Basic Methods in Molecular Biology，(1986))。

适当地，工程化的宿主细胞可以在传统营养培养基中培养，该培养基经修改以适于激活启动子，选择转化子或者扩增发明的基因。随后转化适当的宿主株，并且该宿主株生长至适当的细胞密度，通过适当的方法(如，温度变换或者化学诱导)诱导所选择的启动子，细胞可以被额外培养一段时间，以使得它们产生所需的多肽或者其片段。

细胞通过离心收集，通过物理或者化学的方法破碎，得到的粗提取物保留用于进一步的纯化。用于表达蛋白的微生物细胞可以通过任何方便的方法破碎，包括冷冻-解冻循环、超声波破碎、机械破碎，或者应用细胞裂解剂。这样的方法为本领域技术人员所熟悉。表达的多肽或者片段可以通过下述方法从重组细胞培养物中回收纯化，这些方法包括硫酸铵或者乙醇沉淀、酸法抽提、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟基磷灰石层析和植物凝集素层析。如果必要的话，可以在实现多肽的构象化作用中应用蛋白重新折叠步骤。如果需要，可以应用高效液相色谱(HPLC)进行最终的纯化步骤。

各种哺乳动物培养系统可以用来表达重组蛋白。哺乳动物表达系统的例子包括猴肾成纤维细胞COS-7细胞系和能够从相容性载体中表达蛋白的其它的细胞系，如C127、3T3、CHO、Hela和BHK细胞系。

宿主细胞中的构建物可以以传统的方式用来产生重组序列编码的基因产物。取决于在重组产生程序中采用的宿主，含有载体的宿主细胞产生的多肽可以是糖基化的或者是非糖基化的。本发明的多肽可以包括，也可以不包括起始的甲硫氨酸氨基酸残基。

无细胞的翻译系统可能也用于产生本发明的多肽。无细胞翻译系统可以应用从含有可操作性地连接到编码多肽或其片段的核酸的启动子的DNA构建物转录得到的mRNA。在一些方面，DNA构建物可以，在进行体外转录反应前，先线性化。然后转录的mRNA与合适的无细胞翻译提取物如，兔网织红细胞提取物一起温育，来产生所需的多肽或者其片段。

表达载体可以含有一个或者多个选择性标记基因，提供用于选择转化的宿主细胞的表型特征，如，二氢叶酸还原酶和用于真核细胞培养物的新霉素抗性，或者如大肠杆菌中的四环素或者氨苄青霉素抗性。

示范性磷脂酶C酶(具有SEQ ID NO：2中阐明的序列)已在各种宿主系统中以活性形式被过量表达，这些系统包括革兰氏阴性细菌，诸如大肠杆菌，革兰氏阳性细菌，诸如任何杆菌属菌株(例如枯草芽孢杆菌、蜡质芽孢杆菌(Bacilluscereus))、酵母宿主细胞(包括例如巴斯德毕赤酵母、酵母属某种(Saccharomycessp.)，诸如酿酒酵母(S.cerevisiae)和粟酒裂殖酵母)和乳酸乳球菌(Lactococcuslactis)或哺乳动物、真菌、植物或昆虫细胞。在每一宿主系统中，由各种构建物表达活性酶。这些核酸表达构建物可以包含编码全长开放阅读框(由信号序列、前序列和成熟蛋白编码序列组成)的核苷酸，或它们可以包含这些遗传元件的亚组，单独或者与异源遗传元件组合，其充当信号序列和/或成熟开放阅读框的前序列。这些系统中的每一个可以充当表达PLC的商用生产性宿主，以用于之前描述的酶法油脱胶工艺。

核酸的扩增

在实践本发明时，编码本发明多肽的核酸，或者修饰的核酸可以例如通过扩增被复制。本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对。在一方面，引物对能够扩增本发明的核酸序列，如，包括示范性的SEQ IDNO：1，或者其子序列；如SEQ ID NO：3所阐明的序列，或者其子序列；如SEQ IDNO：5所阐明的序列，或者其子序列；如SEQ ID NO：7所阐明的序列，或者其子序列，等等。本领域技术人员可以设计用于这些序列的任何部分或全长的扩增引物序列对。

本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对，其中引物对可以扩增包括本发明序列或者其片段或子序列的核酸。扩增引物序列对的其中一个或每一个成员可以包括含有该序列的至少大约10到50个连续碱基的寡核苷酸，或者包括含有该序列的大约12、13、14、15、16、17、18、19、20、21、22、23、24或者25个连续碱基的寡核苷酸。

本发明提供扩增引物对，其中引物对包括具有在本发明核酸的大约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第一成员，和具有在第一成员的互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第二成员。本发明提供通过扩增产生的磷脂酶，如应用本发明的扩增引物对进行聚合酶链式反应(PCR)。本发明提供使用本发明的扩增引物对，通过扩增，例如，聚合酶链式反应(PCR)制备磷脂酶的方法。在一方面，扩增引物对从文库，例如，基因文库，如环境文库中扩增核酸。

扩增反应也可以用于定量样品中的核酸(如在细胞样品中的信息的量)，标记核酸(如，用于阵列或者印迹)，检测核酸，或者定量样品中特异核酸的量。在发明的一个方面，扩增分离自细胞或者DNA文库的信息。技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增的方法是本领域所熟知的，并且包括，如，聚合酶链式反应，PCR(见，如，PCR PROTOCOLS，A GUIDE TO METHODS ANDAPPLICATIONS，ed.Innis，Academic Press，N.Y.(1990)和PCR STRATEGIES(1995)，ed.Innis，Academic Press，Inc.，N.Y.，连接酶链式反应(LCR)(见，如，Wu(1989)Genomics 4：560，Landegren(1988)Science 241：1077；Barringer(1990)Gene 89：117)；转录扩增(见，如，Kwoh(1989)Proc.Natl.Acad.Sci.USA 86：1173)，和自支持序列复制(见如，Guatelli(1990)Proc.Natl，Asad.Sci.USA 87：1874)；Qβ复制酶扩增(见，如，Simth(1997)J.Clin.Microbiol.35：1477-1491)；自动的Qβ复制酶扩增分析(见，如，Burg(1996)Mol.Cell.Probes 10：257-271)和其它RNA聚合酶介导的技术(如，NASBA，Cangene，Mississauga，Ontario)；也见，例如，Berger(1987)Methods Enzymol.152：307-316；Sambrook；Ausubel；美国专利4,683,195和4,683,202；Sooknanan(1995)Biotechnology 13：563-564。

确定序列同一性的程度

本发明提供包括与本发明的示例性核酸(例如SEQ ID NO：1、SEQ IDNO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、SEQ ID NO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、SEQ ID NO：75、SEQ ID NO：77、SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、 SEQ ID NO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、SEQ ID NO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、SEQ ID NO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ ID NO：111、SEQ IDNO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ ID NO：129、SEQ IDNO：131、SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ ID NO：147、SEQ IDNO：149、SEQ ID NO：151、SEQ ID NO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ ID NO：165、SEQ IDNO：167、SEQ ID NO：169、SEQ ID NO：171或SEQ ID NO：173，和编码SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ IDNO：132、SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ ID NO：144、SEQ ID NO：146、SEQ ID NO：148、SEQ IDNO：150、SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ IDNO：168、SEQ ID NO：170、SEQ ID NO：172或SEQ ID NO：174的核酸)在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或者更多个残基的范围内具有至少大约50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或者更多的或者完全的(100％)序列同一性的序列的分离的或者重组的核酸。序列同一性(同源性)的程度可以应用任何计算机程序和相关参数来确定，包括那些在本文所描述的，如用默认参数的BLAST 2.2.2.或者FASTA 3.0t78版。在可选择的实施方案中，序列同一性可以是在核酸或者多肽的至少大约5、10、20、30、40、50、100、150、200、250、300、350、400个连续残基，或者全长的范围内。序列同一性(同源性)的程度可以应用任何计算机程序和相关联的参数来确定，包括那些在本文所说明的，如使用默认参数的BLAST 2.2.2.或者FASTA 3.0t78版。

图11用图表描述了本发明的示例性核酸和多肽的选择的特征，包括示例性序列与公共数据库的序列同一性比较。图11中描述的所有序列已针对两组数据库进行了BLAST搜索(如在下面详细描述的)。第一数据库获自NCBI(美国国家生物技术信息中心)。对这些数据库进行搜索所获得的所有结果参见名称为“NR描述(NR Description)”、“NR登记码(NR Accession Code)”、“NR E值(NR Evalue)”或“NR生物(NR Organism)”的各栏。“NR”指由NCBI维护的非冗余(Non-Redundant)核苷酸数据库。该数据库是GenBank、GenBank更新和EMBL更新的综合。栏“NR描述(NR Description)”中的条目指任何给定的NCBI记录中的描述行(definition line)，其包括了对序列的描述，诸如来源生物、基因名称/蛋白质名称，或对序列的一些功能描述。“NR登记码(NR Accession Code)”一栏中的条目指给予序列记录的独特标识符(identifier)。“NR E值(NR Evalue)”一栏中的条目指期望值(E值)，其代表了这样的可能性：同在询问序列(query sequence)(本发明的序列)与数据库序列之间发现的比对分值一样良好的比对分值，发现于在随机序列之间相同的数量的比较中的概率，如在当前的BLAST搜索中所进行的。“NR生物(NR Organism)”一栏中的条目指被鉴定为关系最密切的BLAST命中(hit)的序列的来源生物。第二组数据库统称为Geneseq^TM数据库，其可从Thomson Derwent(Philadelphia，PA)获得。对该数据库所作搜索的所有结果参见名称为“Geneseq蛋白质描述(Geneseq ProteinDescription)”、“Geneseq蛋白质登记码(Geneseq Protein Accession Code)”、“Geneseq蛋白质E值(Geneseq Protein Evalue)”、“Geneseq DNA描述(Geneseq DNADescription)”、“Geneseq DNA登记码(Geneseq DNA Accession Code)”、“GeneseqDNA E值(Geneseq DNA Evalue)”各栏中。这些栏中发现的信息与上述NR各栏中发现的信息类似，除了它来自对Geneseq^TM数据库而不是对NCBI数据库进行的BLAST搜索。此外，该表包括“预测的EC编号(Predicted EC No.)”一栏。EC编号是根据标准化的酶命名法的方案赋予一类酶的编号，该命名法是由国际生物化学和分子生物学联合会(IUBMB)的命名委员会的酶部(Enzyme Commission of theNomenclature Committee of International Union of Biochemistry and MolecularBiology)开发的。在“预测的EC编号”栏中的结果是由对Kegg(Kyoto Encyclopediaof Genes and Genomes)数据库的BLAST搜索结果来确定的。如果最高BLAST匹配(top BLAST match)的E值等于或小于e^-6，那么赋予该最高匹配的EC编号进入表中。最高命中(top hit)的EC编号用作向导，用于指出本发明序列的EC编号可能是什么。“询问DNA长度(Query DNA Length)”和“询问蛋白质长度(Query ProteinLength)”这两栏分别指本发明的序列中核苷酸的数目或氨基酸的数目，本发明的序列被用于对NCBI或Geneseq数据库进行搜索或查询。“Geneseq或NR DNA长度(Geneseq or NR DNA Length)”、“Geneseq或NR蛋白质长度(Geneseq or NR ProteinLength)”这两栏分别指从BLAST搜索获得的最高匹配的序列中的核苷酸的数目或氨基酸的数目。这些栏中给出的结果是来自返回(return)了较低的E值的搜索，它们或者来自NCBI数据库或者来自Geneseq数据库。“Geneseq或NR％ID蛋白质(Geneseq or NR％ID Protein)”和“Geneseq或NR％ID DNA(Geneseq or NR％IDDNA)”指本发明序列与最高BLAST匹配的序列之间的序列同一性百分比。这些栏中给出的结果是来自返回(return)了较低的E值的搜索，它们或者来自NCBI数据库或者来自Geneseq数据库。

同源性序列也包括RNA序列，其中尿嘧啶替代了在核酸序列中的胸腺嘧啶。同源序列可以应用在此描述的任何程序得到或者可以由校正测序错误得到。应该理解到的是，在此所列的核酸序列可以以传统的单字符格式来表示(见，如，Stryer，Lubert.Biochemistry 3rd Ed.，W.H.Freeman & Co.，New York)或者以记录序列中的核苷酸的身份的任何其他格式来表示。

在本发明的这一方面，可以使用在此指明的各种序列比较程序。蛋白和/或核酸序列同一性(同源性)可以应用本领域已知的任何序列比较算法和程序评估。这样的算法和程序包括，但不限于，TBLASTN、BLASTP、FASTA、TFASTA、和CLUSTALW(Pearson和Lipman，Proc.Natl.Acad.Sci.USA 85(8)：2444-2448，1988；Altschul et al.，J.Mol.Biol.215(3)：403-410，1990；Thompson et al.，NucleicAcids Res.22(2)：4673-4680，1994；Higgins et al.，Methods Enzymol.266：383-402，1996；Altschul et al.，J.Mol.Biol.215(3)：403-410，1990；Altschul et al.，NatureGenetics 3：266-272，1993)。

同源性或者同一性可以应用序列分析软件来测定(如，遗传学计算机组的序列分析软件包，Uinversity of Wisconsin Biotechnology Center，1710 UniversityAvenue，Madison，WI 53705)。这样的软件通过对各种缺失、替换和其它修饰进行同源性水平赋值来匹配相似的序列。在两个或者多个核酸或者多肽序列的情况下，术语“同源性”和“同一性”是指两个或者多个序列或者子序列，当在比较窗口或者指定区域中应用任何数量的序列比较算法或者手动比对和目测来测定，通过比较和比对以便获得最大的一致性时，它们是相同的或者具有特定百分比的相同氨基酸残基或者核苷酸。对于序列比较，一个序列可以作为参照序列(示范性序列SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4，、SEQ ID NO：5、SEQID NO：6、SEQ ID NO：7、SEQ ID NO：8，等等)与待测序列进行比较。当应用序列比较算法，待测序列和参照序列被输入到计算机中，指定子序列坐标，如果必要，指定序列算法程序参数。可以应用默认程序参数，或者指定选择性参数。依据程序参数，序列比较算法计算待测序列和参照序列的序列同一性百分比。

在此应用的“比较窗口(comparison window)”，包括涉及任一数目的连续残基的片段。例如，在发明可选择的方面，当两个序列优化比对后，将范围从20到本发明的示范性序列的全长的连续残基，与相同数目的连续位置的参照序列进行比较，所述示范性序列例如SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ IDNO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8等等。如果参照序列与发明的示范性序列例如SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQID NO：4、SEQ ID NO：5、SEQ ID NO：6、SEQ ID NO：7、SEQ ID NO：8等具有必要的序列同一性，如，50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％，或者更多的序列同一性，那么该序列是属于本发明的范围。在可选择的实施方案中，当两个序列优化地比对后，将范围从大约20到600、大约50到200、和大约100到150的序列，与同样数目的连续位置的参照序列进行比较。用于比较的序列比对方法是本领域所熟知的。用于比较的优化序列比对可以用下述方法实施，例如，Smith & Waterman，Adv.Appl.Math.2：482，1981的局部同源性算法、Needleman & Wunsch，J.Mol.Biol.48：443，1970的同源比对算法、Person & Lipman，Proc，Nat′l.Acad.Sci.USA 85：2444，1988的相似性搜索法、这些算法的计算机化执行(GAP、BESTFIT、FASTA和TFASTA，于WisconsinGenetics Software Package，Genetics Computer Group，575 Science Dr.，Madison，WI)，或者通过手动比对和目测完成。用于确定同源性或者同一性的其它算法包括，例如，除了BLAST程序外(在美国国家生物信息中心的基本局部比对搜索工具(Basic Local Alignment Search Tool))、ALIGN、AMAS(多比对的序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋白多序列比对(ProteinMultiple Sequence Alignment))、ASSET(比对片段的统计评估工具(Aligned SegmentStatistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN(生物序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BLocksIMProved Searcher)、FASTA，Intervals & Points，BMB、CLUSTAL V、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸比对工具(Forced NucleotideAlignment Tool))、Framealign、Framesearch、DYNAMIC、FILTER、FSAP(Fristensky序列分析包)、GAP(通用比对程序(Global Alignment Program))、GENAL、GIBBS、GenQuest、ISSC(灵敏性序列比较(Sensitive Sequence Comparison))、LALIGN(局部序列比对(Local Sequence Alignment))、LCP(局部含量程序(Local Content Program))、MACAW(多比对构建和分析工作台(Multiple AlignmentConstruction & Analysis Workbench))、MAP(多比对程序(Multiple AlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多序列比对(Pattern-InducedMulti-sequence Alignment))、SAGA(遗传算法进行的序列比对(Sequence Alignmentby Genetic Algorithm))和WHAT-IF。这样的比对程序也可以用于筛选基因组数据库，鉴定具有实质上相同的序列的多核苷酸序列。目前已经有很多基因组数据库可用，例如，人类基因组的实质部分可以作为人类基因组测序计划(Gibbs，1995)的一部分。几个基因组已经测序完成，如，生殖道支原体(M.genitalium)(Fraseret al.，1995)，甲烷球菌(M.jannaschii)(Bult et al.，1996)，流感嗜血菌(H.influenzae)(Fleischmann et al.，1995)，大肠杆菌(Blattner et al.，1997)，和酵母(S.cerevisiae)(Mewes et al.，1997)，和果蝇(D.melanogaster)(Adams etal.，2000)。模式生物的基因组测序中已经取得了显著的进展，如小鼠，线虫(C.elegans)，和拟南芥(Arabadopsis sp.)。含有具有某些功能性信息注解的基因组信息的数据库由不同的组织保持，并且可以通过因特网进行访问。

BLAST、BLAST 2.0和BLAST 2.2.2算法也用于实践发明。这些算法在，如，Altschul(1977)Nuc.Acids Res.25：3389-3402；Altschul(1990)J.Mol.Biol.215：403-410中有描述。进行BLAST分析的软件可以通过美国国家生物技术信息中心(the National Center for Biotechnology Information)公开得到。这一算法包括首先通过鉴别待询序列(query sequence)中长度为W的短的字串来确定高分序列对(high scoring sequence pairs，HSPs)，所述高分序列对在与数据库序列中同样长度的字串联配时，匹配或者满足某个正值的阈值T。T是指邻近字串(neighborhood word)的分数阈值(Altschul等，如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着每一个序列向两个方向延伸，只要累积的联配分数在增加。对于核苷酸序列，使用参数M(一对匹配残基的奖励分数；总是大于0)来计算累积分数；对于氨基酸序列，使用记分矩阵来计算累计分数。出现下面情况时，字串在各个方向上的延伸便停止：累积的联配分数由达到的最大值下降了数量X；由于一个或者多个记分为负的残基联配的累积，累积分数达到0或者0以下；或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)默认的是：字串长度(W)为11，期望值(E)为10，M＝5，N＝-4，对两条链进行比较。对于氨基酸序列，BLASTP程序默认：字串长度为3，期望值(E)为10，BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89：10915)联配(B)为50，期望值(E)为10，M＝5，N＝-4，对两条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分析(参见，例如，Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90：5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability，P(N))，其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如，在受测核酸和参考核酸的比较中，如果最小合计概率小于大约0.2，更优选地小于0.01，最优选地小于大约0.001，就认为该核酸与参考序列相似。一方面，应用基本局部对比搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。例如，五个特定的BLAST程序可以用来进行以下的任务：(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较；(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较；(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较；(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较；(5)TBLASTX把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。BLAST程序通过确定相似片段来确定同源性序列，所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoringsegment pairs)”，该受测序列优选地从蛋白或者核酸序列数据库得到。高分片段对优选地利用记分矩阵来鉴定(即，联配)，很多的记分矩阵在本领域是已知的。优选地，应用的记分矩阵为BLOSUM62矩阵(Gonnet等，Science 256：1443-1445，1992；Henikoff和Henikoff，Proteins 17：49-61，1993)。较少不优选地，也可以应用PAM或者PAM250矩阵(参见如，Schwartz和Dayhoff，eds.，1978，Matrices forDetecting Distance Relationships：Atlas of protein Sequence and Structure，Washingion：National Biomedical Research Foundation)。

本发明的一方面，为了确定是否核酸具有发明范围内的必需的序列同一性，应用NCBI BLAST 2.2.2程序，默认值的选择是blastp。在BLAST 2.2.2程序中，有大约38个设置选择。在发明的该示范性方面，除了默认的过滤设置外，应用所有的默认值(即除了过滤设置为关闭(OFF)外，所有的参数设定为默认值)，在该位置上应用“-FF”设置，其使得不能进行过滤。由于短的序列长度的缘故，默认过滤的使用经常导致与Karlin-Altschul犯规。

如上所述，用于本发明的该示范性方面并被用来测定图11中值的默认值包括：

“低复杂性过滤器(Filter for low complexity)：开启(ON)

>字长：3

>矩阵：Blosum62

>缺口成本：存在值：11

>延伸：1”

其它的默认值设置为：低复杂性过滤器关闭(off)，蛋白质字长为3，BLOSUM62矩阵，缺口存在罚值-11，并且缺口延伸罚值-1。

示范性的NCBI BLAST 2.2.2程序设置在下面的实施例1中阐明。注意，“-W”选项默认值为0。这是指，如果没有设置，对于蛋白，字长默认值为3，对于核苷酸，字长默认值为11。

计算机系统和计算机程序产品

为了确定和鉴定序列同一性、结构同源性、基序等等，本发明的多肽或核酸序列可以在计算机可以读取和访问的任何介质上储存，记录和操作。相应地，本发明提供计算机，计算机系统，计算机可读介质，计算机程序产品和类似物，在其上记录和储存有本发明的核酸和多肽序列，例如，本发明的示例性序列，如，SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：3、SEQ ID NO：4、SEQ ID NO：5、SEQ IDNO：6、SEQ ID NO：7、SEQ ID NO：8，等。正如在此使用的，词语“记录”和“存储”是指将信息存储到计算机介质中的过程。技术人员很容易地采用任何已知的方法将信息记录到计算机可读介质上，从而产生包括发明的一个或者多个核酸和/或多肽序列的产品。

本发明的另一方面是其上已记录有发明的至少一个核酸和/或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质、闪存。例如，计算机可读介质可以是硬盘、软盘、磁带、闪存、CD-ROM、数码多功能光盘(DVD)、随机存储器(RAM)、或只读存储器(ROM)或本领域技术人员知道的任何类型的介质。

本发明的方面包括系统(如，以因特网为基础的系统)，特别地计算机系统，其存储和操作在此描述的序列和序列信息。计算机系统100的一个例子描述在图1的方块图中。正如在此所使用的，“计算机系统”是指用于分析本发明的核苷酸和多肽序列的硬件组件、软件组件以及数据存储组件。计算机系统100可以包括用于序列数据处理、访问和操作的处理器。处理器105可以是任何已知类型的中央处理器如，例如，Intel公司的奔腾III处理器或者Sun，Motorola，Compaq、AMD或者International Business Machines(IBM)类似的处理器。计算机系统100是一种通用系统，其包括处理器105和用于存储数据的一个或者多个内部数据存储组件110，和一个或者多个用于检索存储于数据存储装置的数据的数据检索装置。本领域技术人员可以很容易地知道，任何一个目前可得到的计算机系统是合适的。

在一方面，计算机系统100包括连接于总线(bus)的处理器105，该总线连接于主存储器115(优选地，作为RAW执行)和一个或者更多的内部数据存储装置110，如硬盘驱动器和/或其上存储有数据的其它计算机可读介质。计算机系统100可以进一步包括一个或者多个用于读取存储于内部数据存储装置110上的数据的数据检索装置118。

数据检索装置118可以为，例如，软盘驱动器、光盘驱动器、磁带驱动器，或者可以(如通过因特网)连接于远端数据存储系统的调制解调器等等。在一些实施方案中，内部的数据存储装置110是可移动的计算机可读介质，例如含有控制逻辑和/或在其中记录有数据的软盘、光盘、磁带等。有利的是，计算机系统100可以包括或运行适当的软件程序，从插入到数据检索装置中的数据存储部分读取控制逻辑和/或数据。

计算机系统100包括用于给计算机应用者显示输出的结果的显示器120。应当注意到，计算机系统100可以在网络中或者宽域网中与其它的计算机系统125a-c相联，提供集中化的计算机系统100访问。访问和处理本发明的核苷酸或者氨基酸序列的软件可以在执行过程中驻留在主存储器115中。

在一些方面，计算机系统100可以进一步包括比较发明的核酸序列的序列比较算法。算法和序列可以储存在计算机可读的介质中。“序列比较算法”是指一个或多个程序，其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数据储存装置中存储的其它的核苷酸序列和/或化合物。例如，序列比较算法可将储存在计算机可读介质上的示范性序列，例如SEQ ID NO：1，SEQ ID NO：2，SEQID NO：3，SEQ ID.NO：4，SEQ ID NO：5，SEQ ID NO：6，SEQ ID NO：7，SBQ ID NO：8等的核苷酸序列与储存在计算机可读介质上的参考序列比较，以鉴定同源性或结构基序。

以上算法应用的参数可以依据所研究的序列长度和同源性水平而加以调整。在一些方面，在使用者没有给出指令的情况下，算法使用的参数可以应用默认参数。图2是说明过程200的一个方面的流程图，这个处理过程是为了确定新序列和数据库中的序列间的同源性水平，把新的核苷酸或者蛋白序列与数据库中的序列加以比较。含有序列的数据库可以是存储于计算机系统100的私人数据库，或者公共的数据库，如通过因特网可以访问到的GENBANK。过程200开始于起始状态201，然后移至状态202，其中待比较的新序列存储在计算机系统100的存储器上。如上讨论，存储器可以是任何形式的存储器，包括RAM或者内部存储设备。

过程200然后移至状态204，其中序列数据库被打开以用于分析和比较。然后，过程200移至状态206，其中存储在数据库的第一个序列读取到计算机的存储器中。然后在状态210中进行比较，确定第一序列是否与第二序列相同。重要的是，注意到这一步骤并不限于在所述新序列和数据库中的第一序列间进行准确的比较。本领域技术人员熟知比较两个核苷酸或者蛋白序列的方法，尽管它们并不完全相同。例如，为了提高两个待测序列间的同源性水平，可以在一个序列中引入空位。在比较过程中控制是否往序列中引入空位或者其它特征的参数一般由计算机系统的使用者输入。

一旦在状态210下进行两个序列的比较，在决定状态210下作出两个序列是否相同的决定。当然，术语“相同”并不限于绝对相同的序列。在过程200中，在使用者输入的同源性参数范围内的序列将标记为“相同”。如果决定了两个序列是相同的，过程200移至状态214，其中给使用者显示了来自数据库的所述序列的名称。这一状态可以告诉使用者具有被显示的名称的序列满足输入的同源性限制。一旦被存储的序列的名称显示给使用者，过程200移至决定状态218，其中确定在数据库中是否存在更多的序列。如果在数据库中没有更多的序列存在，那么过程200终止于结束状态220。然而，如果在数据库中存在更多的序列，那么过程200移至状态224，其中指示器移至数据库的下一个序列以便可以与所述的新序列比较。以这种方式，所述的新序列与数据库中的每一个序列进行联配和比较。

应当注意，如果在决定状态212作出了决定，序列没有同源性，那么过程200将立即移至决定状态218，以确定在数据库中是否有任何其它的序列用于比较。同样地，发明的一方面是包括处理器，其上储存有本发明的核酸序列的数据存储装置以及用于进行比较的序列比较器的计算机系统。序列比较器可以指示待比较序列之间的同源性水平或者鉴定结构基序，或者可以确定与这些核酸代码和多肽代码相比较的序列中的结构基序。

图3是说明在计算机中确定两个序列是否具有同源性的过程250的一个实施方案的流程图。过程250开始于起始状态252，然后移至状态254，其中待比较的第一序列被存储于存储器中。待比较的第二序列然后在状态256被存储于存储器中。过程250然后移至状态260，其中读取第一序列的第一个字符，然后到状态262，其中读取第二序列的第一个字符。应当理解，如果序列是核苷酸序列，那么所述字符一般将是A、T、C、G或者U。如果序列是蛋白质序列，那么它可以是单字母的氨基酸代码，以便第一序列和第二序列可以很容易地进行比较。然后在决定状态264作出是否两个字符是否相同的确定结果。如果它们是相同的，那么过程250移至状态268，其中读取第一序列和第二序列的下一个字符。然后确定所述的下一字符是否相同。如果相同，那么过程250继续这一循环直到两个字符是不同的。如果确定了接下来的两个字符并不相同，过程250移至决定状态274，确定在两个序列中是否有任何更多的字符要读取。如果没有任何更多的字符被读取，那么过程250移至状态276，其中第一序列和第二序列的同源性水平显示给使用者。通过计算序列间相同字符占第一序列中字符总数的比例来确定同源性水平。这样，如果第一个100核苷酸序列的每一个字符都与第二序列的每一个字符联配，那么同源性水平将是100％。

可选择地，计算机程序可以比较参照序列与本发明的序列，以确定是否序列在一个或者多个位置上不同。程序可以记录本发明序列或参照序列中插入、缺失或者替换的核苷酸或者氨基酸残基的长度和同一性。计算机程序可以是确定是否参照序列与本发明的序列相比，含有单核苷酸多态性(SNP)，或者是否本发明的序列含有已知序列的SNP的程序。因此，在一些方面，计算机程序是鉴定SNPs的程序。该方法可以通过以上描述的计算机系统和描述在图3中的方法来完成。

该方法可以通过应用计算机程序读取本发明序列和参照序列，并且用计算机程序来鉴定差异来进行。

在其他方面，以计算机为基础的系统包括鉴定本发明的核酸或者多肽中的特征的标识符(identifier)。“标识符”是指鉴定核酸序列中的某些特征的一个或者多个程序。例如，标识符可以包括鉴定核酸序列中的开放阅读框架(ORF)的程序。图4是说明用于检测序列中特征存在与否的标识符过程300的一个方面的流程图。过程300起始于起始状态302，然后移至状态304，其中待检测特征的第一序列存储于计算机系统100的存储器115上。过程300然后移至状态306，在该状态下，打开具有序列特征的数据库。这样数据库将包括一系列每一个特征的属性和特征的名称。例如，特征名称可以是“起始密码子”，特征属性为“ATG”。另一个例子是特征名称为“TAATAA盒”，特征属性为“TAATAA”。这样的数据库的例子是由威斯康辛大学遗传学计算机组(University of Wisconsin Genetics ComputerGroup)制作。可选择地，特征可以是结构多肽基序，如α螺旋、β折叠，或者功能性多肽基序，如酶的活性位点、螺旋-转角-螺旋基序或者本领域技术知道的其他基序。一旦在状态306打开特征数据库，过程300移至状态308，其中第一特征从数据库中读取。然后在状态310中进行第一特征的属性与第一序列的比较。然后在决定状态316下作出决定，是否在第一序列中发现所述特征的属性。如果发现该属性，过程300移至状态318，其中所发现的特征的名称显示给使用者。过程300然后移至决定状态320，在其中作出是否在数据库中存在更多的特征的决定。如果不存在更多的特征，过程300终止于结束状态324。然而，如果数据库中确实存在有更多的特征，那么过程300在状态326读取下一个序列特征，并且循环回到状态310，其中该下一个特征的属性与第一序列进行比较。如果在决定状态316中所述特征的属性没有在所述第一序列中发现，那么为了决定在数据库中是否存在更多特征，过程300直接移至决定状态320。因此，在一方面，本发明提供了鉴定开放阅读框架(ORFs)的计算机程序。

本发明的核酸序列，或本发明的多肽序列可在各种数据处理程序中以多种格式被储存和进行操作。例如，本发明的核酸序列，或本发明的多肽序列，可以以文本形式储存在字处理文件如Microsoft WORD或WORDPERFECT中，或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程序如DB2、SYBAS或ORACL中。另外，许多计算机程序和数据库都可用作序列比较算法、标识符、或参考核苷酸序列或多肽序列的来源，所述参考核苷酸序列或多肽序列要与本发明的核酸序列进行比较。用于实践本发明的程序和数据库包括，但不限于：MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(MolecularApplications Group)、Look(Molecular Applications Group)、MacLook(MolecularApplications Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等，J.Mol.Biol.215：403，1990)、FASTA(Pearson和Lipman，Proc.Natl.Acad.Sci. USA，85：2444，1988)、FASTDB(Brutlag等，Comp.App.Biosci.6：237-245，1990)、Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(Molecular Simulations Inc.)、Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular SimulationsInc.)、Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.)，Homology(Molecular Simulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(MolecularSimulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLab Diversity Explorer(Molecular SimulationsInc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular SimulationsInc.)、MDL可用化学制品目录数据库(Available Chemicals Directory database)、MDL药品数据报告数据库(Drug Data Report data base)、综合医药化学数据库(Comprehensive Medicinal Chemistry database)、德温特世界药物索引数据库(World Drug Index database)、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。其它的程序和数据库对于本公开内容的所述技术领域内的技术人员是显而易见的。

应用以上的程序可能检测到的基序包括：编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化作用位点、泛素化位点、α螺旋、β折叠、编码引导被编码蛋白的分泌的信号肽的信号序列、涉及转录调控的序列如同源框、酸性伸展(acidicstretches)、酶的活性位点、底物结合位点以及酶切割位点。

核酸的杂交

本发明提供了可在严格条件下与本发明的示例性序列例如在SEQ IDNO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、SEQ ID NO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、SEQ ID NO：75、SEQ ID NO：77、SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、SEQ ID NO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、SEQ ID NO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、SEQ ID NO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ IDNO：111、SEQ ID NO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ IDNO：129、SEQ ID NO：131、SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、 SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ IDNO：147、SEQ ID NO：149、SEQ ID NO：151、SEQ ID NO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ IDNO：165、SEQ ID NO：167、SEQ ID NO：169、SEQ ID NO：171或SEQ ID NO：173中阐明的序列或者编码包括在SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ IDNO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ IDNO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ IDNO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ IDNO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ IDNO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ IDNO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ IDNO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ IDNO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ IDNO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ IDNO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ ID NO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ IDNO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ IDNO：144、SEQ ID NO：146、SEQ ID NO：148、SEQ ID NO：150、SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ IDNO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、SEQ ID NO：170、SEQ ID NO：172或SEQ ID NO：174中阐明的序列的多肽的核酸杂交的分离的或者重组的核酸。严格条件可以是高度严格条件，中度严格条件，低度严格条件，包括在此描述的高度的和降低的严格条件。在可选择的方面，本发明的核酸根据它们在严格条件下杂交的能力来定义，它们可以在大约5个残基到某分子例如本发明的示范性核酸的全长之间。例如，它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400个或更多个残基。比全长核酸较短的核酸也包括在内。这些核酸可以用作如，杂交探针、标记探针、PCR寡核苷酸探针、iRNA(单链或者双链)、编码抗体结合肽(表位)的序列或反义序列、基序、活性位点、结合结构域、调控结构域以及类似物。

在一方面，本发明的核酸通过其在高的严格条件下杂交的能力定义，该高严格性包括条件为大约37℃到42℃，大约50％的甲酰胺。在一方面，本发明的核酸通过其在降低的严格条件下杂交的能力定义，该降低的严格性包括条件为大约30℃到35℃，大约35％到25％的甲酰胺。可选择地，本发明的核酸通过其可以在高严格条件下杂交的能力定义，该高严格性包括条件为42℃，50％的甲酰胺中，5×SSPE，0.3％的SDS，封闭核酸重复序列，如cot-1或者鲑鱼精DNA(例如，200n/ml剪切的和变性的鲑鱼精DNA)。在一方面，本发明的核酸通过其在降低的严格条件下杂交的能力定义，该降低的严格性条件包括降低的温度35℃，35％的甲酰胺。

杂交以后，滤膜可以在50℃，用6×SSC，0.5％的SDS洗涤。超过25％的甲酰胺，这些条件认为是“中度”条件，低于25％的甲酰胺，这些条件认为是“低度”条件。“中度”杂交条件的一个特定例子是上面的杂交在甲酰胺为30％时进行。“低严格性”杂交条件的特定例子是上面的杂交在甲酰胺为10％时进行。

与特定水平的严格性相对应的温度范围可以进一步通过计算感兴趣的核酸中嘌呤与嘧啶的比例，并且相应地调节温度来缩小。本发明的核酸也通过其在Ausubel和Sambrook中所述的高度、中度、低度严格条件下杂交的能力来定义。对上面的范围和条件所作的变化可以用于实施本发明，并且是本领域技术人员所熟知的。下面进一步描述了杂交条件。

寡核苷酸探针和应用方法

本发明也提供了用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探针。一方面，探针包括在SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27、SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47、SEQ ID NO：49、SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61、SEQ ID NO：63、SEQ ID NO：65、SEQ ID NO：67、SEQ ID NO：69、SEQ ID NO：71、SEQ ID NO：73、SEQ ID NO：75、SEQ ID NO：77、SEQ ID NO：79、SEQ ID NO：81、SEQ ID NO：83、SEQ ID NO：85、SEQ ID NO：87、SEQ ID NO：89、SEQ ID NO：91、SEQ ID NO：93、SEQ ID NO：95、SEQ ID NO：97、SEQ ID NO：99、SEQ ID NO：101、SEQ ID NO：103、SEQ ID NO：105、SEQ ID NO：107、SEQ ID NO：109、SEQ ID NO：111、SEQ ID NO：113、SEQ ID NO：115、SEQ IDNO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ ID NO：129、SEQ ID NO：131、SEQ ID NO：133、SEQ IDNO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQ ID NO：147、SEQ ID NO：149、SEQ ID NO：151、SEQ IDNO：153、SEQ ID NO：155、SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ ID NO：165、SEQ ID NO：167、SEQ ID NO：169、SEQ ID NO：171或SEQ ID NO：173中阐述的序列的至少10个连续的碱基。可选择地，本发明的探针可以是本发明的序列中所阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、50、55、 60、65、70、75、80、90、100或150，或更多，或大约10到50、大约20到60、大约30到70个连续碱基。这些探针通过结合或者杂交来鉴定核酸。这些探针可以用于本发明的阵列中，见下面的讨论，包括，例如，毛细管阵列。本发明的探针也可以用于分离其它的核酸或多肽。

本发明的探针可以用于确定是否生物样品，如土壤样品，含有具有本发明的核酸序列的生物或者可以从其获得该核酸的生物。在这样的程序中，获得潜在地隐藏了可从其分离得到核酸的生物体的生物样品，并且从该样品获得核酸。在允许探针与样品中存在的任何互补序列特异性杂交的条件下，将核酸与探针接触。在必要的情况下，为了确定允许探针特异地与互补序列杂交的条件，可以让探针与来自已知含有互补序列的样品中的互补序列相接触，同时与不含有互补序列的对照序列相接触。杂交条件，如杂交缓冲液中的盐浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度，可以进行被变化以确定允许所述探针特异地与互补的核酸杂交的条件(参见有关特异性杂交条件的论述)。

如果样品含有可以从其中分离出所述核酸的生物体，那么探针的特异性杂交可以被检测到。杂交可以通过使用可检测试剂标记所述探针来检测，所述的可检测试剂例如放射性同位素、荧光染料或者能够催化形成可检测产物的酶。使用标记探针来检测在样品中存在的互补核酸的很多方法对于本领域技术人员是熟悉的。这些方法包括Southern印迹、Northern印迹、菌落杂交方法以及点印迹。这些程序中的每一个的方案在Ansubel和Sambrook中给出。

作为选择，可以在一个扩增反应中使用一种以上的探针(其中的至少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含有包括本发明的核酸序列的生物体(如，从中分离出所述核酸的生物体)。在一方面，所述探针包括寡核苷酸。一方面，所述扩增反应可以包括PCR反应。PCR的实验方案见前面Ausubel和Sambrook的如上的所述(参见有关扩增反应的讨论)。在这些程序中，所述样品中的核酸与所述探针相接触，进行所述扩增反应，检测任何得到的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳，并用嵌入剂如溴化乙啶染胶来进行检测。可选择地，一种或者多种探针可以用放射性同位素标记，并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物的存在。

源自位于本发明序列的3’或者5’末端附近的序列的探针也可以用于染色体移步(chromosome walking)程序中，以鉴定含有另外的序列如基因组序列的克隆。这样的方法允许从宿主生物体中分离出编码其他感兴趣的蛋白的基因。

在一方面，本发明的核酸被用作探针来鉴定和分离相关的核酸。在一些方面，所述的相关的核酸可以是来自某些生物体的cDNA或者基因组DNA，但是这些生物体不是本发明的核酸起初被分离出来的那些生物体。在这样的程序中，核酸样品与所述探针在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体的核酸的杂交然后采用以上描述的任何方法来检测。

在核酸杂交反应中，用于达到特定严格水平的条件可以根据待杂交核酸的性质来进行改变。例如，在选择杂交条件时要考虑核酸杂交区域的长度、互补程度、核苷酸序列组成(如，GC对AT含量的比率)、以及核酸类型(如，RNA对DNA)。另外考虑是否其中一个核酸固定于，如滤膜上。杂交可以在低严格性，中度严格性或者高严格性的条件下进行。作为核酸杂交的例子，含有固定化变性核酸的聚合物膜首先在45℃下，在由0.9M NaCl、50mM NaH₂PO₄，pH 7.0、5.0mMNa₂EDTA、0.5％SDS、10×Denhardt′s和0.5mg/ml多核腺苷酸组成的溶液中预杂交30分钟。然后将大约2×10⁷cpm(比活性4-9×10⁸cpm/ug)的³²P末端标记的寡核苷酸探针加入到溶液中。在12-16小时的温育以后，膜在室温(RT)下于含有0.5％SDS的1×SET(150mM NaCl、20mM Tris盐酸，pH 7.8、1mM Na₂EDTA)中洗涤30分钟，然后在新鲜配制的1×SET，在Tm-10℃下，再洗涤寡核苷酸探针30分钟。然后将膜暴露于自显影膜上来检测杂交信号。

通过改变用于鉴定核酸，如与可检测探针杂交的cDNA或者基因组DNA的杂交条件的严格性，可以鉴定和分离与探针具有不同同源性水平的核酸。可以通过在低于探针的解链温度下改变温度进行杂交而使严格性变化。解链温度，Tm，是指(在定义的离子强度和pH下)50％的靶序列与精确互补的探针杂交的温度。非常严格的条件被选择为与特定的探针的Tm值相等或比其低大约5℃。探针的解链温度可以通过应用以下的经验公式计算：对于在14到70个核苷酸长度的探针，应用此公式计算解链温度：Tm＝81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N)，其中的N是探针的长度。如果杂交在含有甲酰胺的溶液中进行，解链温度可以通过应用以下的公式来计算：Tm＝81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63％甲酰胺)-(600/N)，其中的N是探针的长度。预杂交可以在6×SSC、5×Denhardt′s试剂、0.5％SDS、100μg变性的鲑鱼精DNA片段或者6×SSC、5×Denhardt′s试剂、0.5％SDS、100μg变性的鲑鱼精DNA片段、50％甲酰胺中进行。SSC和Denhardt′s和其他溶液的配方列于例如Sambrook中。

通过在以上所列的预杂交溶液中加入可以检测到的探针来进行杂交。当所述探针包括双链DNA时，它应在加入到杂交缓冲液前被变性。滤膜与杂交缓冲液接触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA或者基因组DNA杂交。对于超过200个核苷酸长度的探针，杂交的过程可以是在低于Tm温度15-25℃进行。对于较短的探针，如寡核苷酸探针，杂交的过程可以是在低于Tm温度5-10℃下进行。在一个方面，在6×SSC溶液中的杂交过程在大约68℃进行。在一个方面，在含有50％甲酰胺的溶液中的杂交在大约42℃进行。考虑所有前述的杂交在高严格条件下进行。

杂交以后，洗涤滤膜以去除任何非特异结合的可检测探针。洗涤滤膜所用的严格性也可以根据正被杂交的核酸的性质、正被杂交的核酸的长度、互补的程度，核苷酸序列的组成(如，GC对AT的含量)，以及核酸类型(如，RNA对 DNA)来进行变化。逐渐增高的严格条件洗涤的例子如下：2×SSC，0.1％SDS，室温下15分钟，(低严格性)；0.1×SSC，0.5％SDS，室温下30分钟到1小时(中度严格性)；0.1×SSC，0.5％SDS，杂交温度和68℃之间，15到30分钟(高严格性)；0.15M NaCl，在72℃下15分钟(极高严格性)。最后的低严格性洗涤可以在0.1×SSC，室温下进行。以上的例子仅仅示出了可以用于实施本发明，例如洗涤滤膜的一组条件。本领域技术人员将知道，对于不同严格性洗涤有无数方案，所有这些方案都可以用于实施本发明。

已经与探针杂交的核酸可以通过放射自显影或者其它传统的技术来确定。可以改变以上的程序来鉴定具有与探针序列具有降低水平的同源性的核酸。例如为了获得与可检测探针具有降低水平的同源性的核酸，可以应用不太严格的条件。例如，在含有Na⁺浓度为大约1M的杂交缓冲液中，杂交温度可以以5℃的幅度从68℃降低到42℃。杂交后，滤膜用2×SSC，0.5％SDS，在杂交温度下洗膜。超过50℃，这些条件认为是“中度”条件，低于50℃，这些条件认为是“低度”条件。“中度”杂交条件的例子是上面的杂交在55℃进行。“低严格性”杂交条件的特定例子是上面的杂交在45℃进行。

可选择地，杂交在缓冲液，如含有甲酰胺的6×SSC中，在42℃下进行。在这种情况下，杂交缓冲液中甲酰胺的浓度可以以5％的幅度从50％降低到0％，以鉴定与探针具有降低的同源性水平的克隆。杂交后，滤膜可以用6×SSC，0.5％SDS在50℃下洗涤。认为当甲酰胺浓度大于25％时为“中度”条件，而低于25％时为“低度”条件。“中度”杂交条件的特定例子是当以上的杂交在30％的甲酰胺中进行时。“低严格性”杂交条件的特定例子是当以上的杂交在10％的甲酰胺中进行时。

本发明的这些探针和方法可以用于分离具有与本发明的核酸序列有至少大约99％、至少98％、至少97％、至少96％、至少95％、至少90％、至少85％、至少80％、至少75％、至少70％、至少65％、至少60％、至少55％或者至少50％同源性的序列的核酸，所述本发明的核酸序列包括它们的至少大约10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或者500个连续的碱基，和与之互补的序列。同源性可以应用在此所述的比对算法测定。例如，同源的多核苷酸可以具有在此描述的其中一个编码序列的天然发生的等位基因突变体的编码序列。当与本发明的核酸比较时，这样的等位基因突变体可以具有一个或者多个核苷酸的取代、缺失或者添加。

此外，本发明的探针和方法可以用于分离编码与本发明多肽具有至少大约99％，至少95％，至少90％，至少85％，至少80％，至少75％，至少70％，至少65％，至少60％，至少55％或者至少50％序列同一性(同源性)的多肽的核酸，正如应用序列比对算法(如，使用默认参数的FASTA版本3.0t78的算法，或者具有在此阐明的示范性设置的BLAST 2.2.2程序)确定的，所述本发明多肽包括它们的至少5、10、15、20、25、30、35、40、50、75、100或者150个连续的氨基酸。

抑制磷脂酶的表达

本发明进一步提供与本发明的核酸序列如磷脂酶编码核酸互补的核酸(如，本发明的核酸序列的反义序列)。反义序列可以抑制磷脂酶编码基因的转运，剪接或者转录。抑制可以通过靶向基因组DNA或者信使RNA而起作用。例如，通过杂交和/或切割，可以抑制被靶向的核酸的转录或者功能。本发明提供的特别有效的一套抑制物包括能够结合磷脂酶基因或者信息的寡核苷酸，在每一种情况下，都可阻止或者抑制磷脂酶的产生或者发挥功能。结合是通过序列特异性的杂交实现的。另一类有用的抑制物包括引起磷脂酶信息失活或者切割的寡核苷酸。该寡核苷酸可以具有引起此种切割的酶活性，如核酶。该寡核苷酸可以进行化学修饰，或者偶联到能够切割互补核酸的酶或组分上。人们可以筛选具有许多不同的此类寡核苷酸的文库，以获得那些具有期望的活性的寡核苷酸。

磷脂酶表达的抑制可以具有多种不同的工业用途。例如，抑制磷脂酶的表达可以减慢或者阻止酸败。当脂类或多肽，如，结构脂类或者多肽，被酶促降解时，可能发生酸败。这可以导致水果和蔬菜的变质或者腐败。一方面，应用可以抑制磷脂酶的表达和/或活性的本发明组合物，例如，抗体、反义寡核苷酸、核酶和RNAi，可以用于减缓或者阻止酸败。因此，在一方面，本发明提供方法和组合物，包括将本发明的抗体、反义寡核苷酸、核酶和RNAi应用于植物或者植物产品(如，水果、种籽、根、叶等)，以阻止或者延缓酸败。这些组分也可以由植物(如，转基因植物)或者其它生物(如，用本发明的磷脂酶基因转化的细菌或者其它微生物)表达。

用于抑制磷脂酶表达的本发明的组分(如反义物、iRNA、核酶、抗体)可以用作药物组分。

反义寡核苷酸

本发明提供能够结合磷脂酶信息的反义寡核苷酸，该反义寡核苷酸可以通过靶向mRNA来抑制磷脂酶活性。设计反义寡核苷酸的策略在科学和专利文献中已经充分说明，并且技术人员可以应用本发明的新的试剂来设计这样的磷脂酶寡核苷酸。例如，用于筛选有效的反义寡核苷酸的基因步行/RNA作图试验方案是本领域所熟知的，参见，如，Ho(2000)Methods Enzymol.314：168-183，该文献描述了RNA作图分析方法，该作图分析方法以标准的分子技术为基础，为有效的反义序列选择提供了简单而可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11：191-198。

也可以应用天然存在的核酸作为反义寡核苷酸。反义寡核苷酸可以是任何长度；例如，在可选择的方面，反义寡核苷酸在大约5到100、大约10到80、大约15到60、大约18到40之间。最佳长度可以通过常规的筛选方法来确定。反义寡核苷酸可以以任何浓度存在。最佳浓度可以通过常规的筛选方法来确定。已经知道有许多能够解决该潜在的问题的合成的，非天然存在的核苷和核酸类似物。例如，可以应用含有非离子性骨架，如N-(2-氨基乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有硫代磷酸连接的反义寡核苷酸，如，WO 97/03211；WO 96/39154；Mata(1997)Toxicol Appl Pharmacol 144：189-197；AntisenseTherapeutics，ed.Agrawal(Humana Press，Totowa，N.J.，1996)所述。本发明提供的具有合成的DNA骨架类似物的反义寡核苷酸也可以包括磷-二硫代、甲基磷酸盐、磷阿米酮、烷基磷三酯、氨基磺酸盐、3’-硫代乙缩醛、甲叉(甲基亚胺)、3′-N-氨基甲酸酯剂和吗啉代氨基甲酸酯核酸，如以上所述。

可以应用组合化学的方法产生大量的寡核苷酸，可以对这些寡核苷酸快速筛选，以获得对任何靶，如本发明的有义和反义磷脂酶序列，具有适当的结合亲和性和特异性的特定的寡核苷酸(见，如，Gold(1995)J.of Biol.Chem.270：13581-13584)。

抑制性核酶

本发明提供可以结合磷脂酶信息的核酶，其可以通过靶向mRNA来抑制磷脂酶的酶活性。设计核酶和选择用于靶向作用的对磷脂酶具特异性的反义序列在科学和专利文献中已经充分说明，并且技术人员可以应用本发明的新型试剂来设计这样的核酶。核酶通过核酶的靶RNA结合部分结合靶RNA起作用，该核酶的靶RNA结合部分与切割靶RNA的RNA的酶活部分非常接近。因此，核酶通过互补的碱基配对作用识别并且结合靶RNA，并且一旦结合于正确的位点，将酶法切割靶RNA并且使靶RNA失活。如果切割发生在编码序列中，以这种方式进行的靶RNA的切割将破坏其指导编码蛋白合成的能力。当核酶结合并且切割其靶RNA后，一般情况下，将从RNA上释放，因此能够反复地结合和切割新的靶标。

在一些情况下，核酶的酶本质决定了其比其它技术如反义技术(其中核酸分子简单地结合于核酸靶来阻止其转录、翻译或者与其它分子的缔合)更优越，这是因为导致有效治疗作用所必需的有效的核酶浓度低于反义寡核苷酸的浓度。这一潜在的优点反映了核酶可以以酶的方式起作用的能力。由此，单个核酶分子可以切割靶RNA的很多分子。此外，核酶是典型的高度特异性的抑制剂，其抑制的特异性不仅仅依赖于结合的碱基配对机制，也依赖于分子抑制其结合的RNA表达的机制。即，抑制是通过切割RNA靶来引起的，因此特异性是通过靶向的RNA的切割速率与非-靶向的RNA的切割速率之比来定义。该切割机制取决于参与碱基配对的因素以外的因素。因此，核酶的特异性作用高于结合于同一个RNA位点的反义寡核苷酸的作用。

具有酶活的核酶RNA分子可以以锤头基序(hammerhead motif)形成，但也可以以发夹、肝炎δ病毒、I类内含子或者RNaseP样RNA(与RNA的引导序列有关)基序形成。Rossi(1992)Aids Research and Human Retroviruses 8：183描述了此类锤头基序的例子；Hampel(1989)Biochemistry 28：4929，和Hampel(1990)Nuc.Acids Res.18：299中描述了发夹基序；Perrotta(1992)Biochemistry 31：16中描述了肝炎δ病毒基序；Guerrier-Takada(1983)Cell 35：849中描述了RNaseP基序；Cech美国专利4,987,071中描述了I类内含子。描述这些特异基序的目的不是限制性的；本领域技术人员将认识到，本发明的酶RNA分子具有与一个或者多个靶基因RNA区域互补的特异性底物结合位点，并且具有在底物结合位点内或者周围赋予该分子以RNA切割活性的核苷酸序列。

RNA干涉(RNAi)

在一方面，本发明提供包括本发明的磷脂酶序列的RNA抑制分子，即所谓的“RNAi”分子。RNAi分子包括双链RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表达。一方面，RNAi是长度为大约15、16、17、18、19、20、21、22、23、24、25或者更长的双螺旋核苷酸。虽然发明并不受限于任何特别的作用机理，但是RNAi可以进入细胞，并且引起相似或相同序列的单链RNA(ssRNA)，包括内源性mRNA的降解。当细胞暴露于双链RNA(dsANA)时，来自同源基因的mRNA被称为RNA干涉(RNAi)的过程选择性地降解。RNAi背后的可能的基本机理是，将与特定的基因序列匹配的双链RNA(dsANA)断裂形成称之为短干扰RNA的短片段，该短片段可以触发与其序列匹配的mRNA的降解。在一方面，本发明的RNAi在基因沉默治疗中使用，参见，例如Shuey(2002)Drug Discov.Today7：1040-1046。在一方面，本发明提供使用本发明的RNAi选择性降解RNA的方法。该方法可以在体外、离体或在体内进行。一方面，本发明的RNAi分子可以用于在细胞，器官或动物内产生功能丧失的突变。产生RNAi分子和使用RNAi分子选择性降解RNA的方法在本领域是众所周知的，参见，例如美国专利6,506,559；6,511,824；6,515,109；6,489,127。

核酸修饰

本发明提供产生本发明的核酸例如那些编码磷脂酶的核酸的变体的方法。在可选择的实施方案中，本发明提供了修饰本发明的酶的方法，例如通过随意或随机方法，或非随机方法或定向进化方法，诸如基因位点饱和诱变^TM(GSSM^TM)对其编码序列进行突变，以改变酶的活性pH范围或最佳活性pH范围，活性温度范围或最佳活性温度范围、特异性、活性(动力学)；酶对糖基化、磷酸化或金属(例如Ca、Mg、Zn、Fe、Na)的应用，例如以影响pH/温度稳定性。本发明提供了修饰本发明的酶的方法，例如通过GSSM^TM对其编码序列进行突变，以增加它对蛋白酶活性的抗性。本发明提供了修饰本发明的酶的方法，例如通过GSSM^TM对其编码序列进行突变，以改变酶对Ca、Mg、Na具有特异性但不会螯合Zn的金属螯合剂的应用。本发明提供了修饰本发明的酶的方法，例如通过GSSM^TM对其编码序列进行突变，其将具有期望的活性组合，例如PI、PA和PC/PE特异性PLCs。

这些方法可以重复或者在不同的组合中使用，产生与模板核酸编码的磷脂酶相比具有改变的或不同的活性或者改变的或不同的稳定性的磷脂酶。这些方法也可以重复或者在不同的组合中使用，例如，产生基因/信息表达、信息翻译或者信息稳定性上的变化。另一方面，细胞的遗传组分可以通过，例如离体的同源基因修饰，然后再插入细胞中而加以改变。

本发明的核酸可以通过任何方法改变。例如，无规或随机方法，或者，非随机方法，或者“定向进化”方法。

基因的随机突变的方法在本领域是众所周知的，见，例如，美国专利5,830,696。例如，诱变剂可以用于随机突变基因。诱变剂包括，例如，紫外光或者γ-辐射，或者化学诱变剂，例如，丝裂霉素、亚硝酸、光致活性补骨脂素，它们单独使用或组合使用，以诱导可以通过重组进行修复的DNA断裂。其他化学诱变剂包括，例如，重亚硫酸钠、亚硝酸、羟胺、肼或者甲酸。其他诱变剂是核苷酸前体的类似物，例如，亚硝基胍，5-溴尿嘧啶，2-氨基嘌呤，或者吖啶。这些试剂可以代替核苷酸前体加入到PCR反应中，从而使序列突变。也可以使用嵌入试剂例如原黄素、吖啶黄、阿的平和类似物。

可以应用分子生物学上的任何技术，如随机PCR诱变，参见，如，Rice(1992)Proc.Natl.Acad.Sci.USA 89：5467-5471；或者组合式多重盒式诱变，参见如，Crameri(1995)Biotechinques 18：194-196。可选择地，核酸，如基因，可以在无规或“随机”片段化后重新装配，参见，如，美国专利6,291,242；6,287,862；6,287,861；5,955,358；5,830,721；5,824,514，5,811,238；5,605,793.。在可选择的方面，修饰、增加或者删除可以通过易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因重装配、基因位点饱和诱变^TM(GSSM^TM)、合成连接重装配(SLR)、重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成、和/或者这些方法和其它方法的组合产生。

以下的出版物描述了各种递归重组程序和/或可以整入到本发明的方法中的方法：Stemmer(1999)“Molecular breeding of viruses for targeting and other clinicalproperties”Tumor Targeting 4：1-4；Ness(1999)Nature Biotechnology 17：893-896；Chang(1999)“Evolution of a cytokine using DNA family shuffling”NatureBiotechnology 17：793-797；Minshull(1999)“Protein evolution by molecularbreeding”Current Opinion in Chemical Biology 3：284-290；Christians(1999)“Directedevolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17：259-264；Crameri(1998)“DNA shuffling of a family of genesfrom diverse species accelerates directed evolution”Nature 391：288-291；Crameri (1997)“Molecular evolution of an arsenate detoxification pathway by DNAshuffling”Nature Biotechnology 15：436-438；Zhang(1997)“Directed-evolution of aneffective fucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94：4504-4509；Patten等(1997)“Applications of DNA Shuffling toPharmaceuticals and Vaccines”Current Opinion in Biotechnology 8：724-733；Crameri等(1996)“Construction and evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2：100-103；Crameri等(1996)“Improved green fluorescent proteinby molecular evolution using DNA shuffling”Nature Biotechnology 14：315-319；Gates等(1996)“Affinity selective isolation of ligands from peptide libraries through displayon a lac repressor ′headpiece dimer′”Journal of Molecular Biology 255：373-386；Stemmer(1996)“Sexual PCR and Assembly PCR”In：The Encyclopedia of MolecularBiology.VCH Publishers，New York.447-457页；Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations of mutant andwildtype cassettes”BioTechniques 18：194-195；Stemmer等(1995)“Single-stepassembly of a gene and entire plasmid form large numbers ofoligodeoxyribonucleotides”Gene，164：49-53；Stemmer(1995)“The Evolution ofMolecular Computation”Science 270：1510；Stemmer(1995)“Searching SequenceSpace”Bio/Technology 13：549-553；Stemmer(1994)“Rapid evolution of a protein invitro by DNA shuffling”Nature 370：389-391；和Stemmer(1994)“DNA shuffling byrandom fragmentation and reassembly：In vitro recombination for molecularevolution”Proc.Natl.Acad.Sci.USA 91：10747-10751。

产生多样性的突变方法包括，例如，定点诱变(Ling等.(1997)“Approachesto DNA mutagenesis：an overview”Anal Biochem.254(2)：157-178；Dale等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57：369-374；Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19：423-462；Botstein & Shortle(1985)“Strategies and applications of in vitromutagenesis”Science 229：1193-1201；Carter(1986)“Site-directed mutagenesis”Biochem.J.237：1-7；Kunkel(1987)“The efficiency of oligonucleotide directedmutagenesis”在Nucleic Acids & Molecular Biology(Eckstein，F.和Lilley，D.M.J.eds.，Springer Verlag，Berlin))；使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad.Sci.USA 82：488-492；Kunkel等(1987)“Rapid and efficient site-specificmutagenesis without phenotypic selection”Methods in Enzymol.154，367-382；和Bass等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242：240-245)；寡核苷酸诱导的定点诱变(Methods in Enzymol.100：468-500(1983)；Methods in Enzymol.154：329-350(1987)；Zoller & Smith(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors：an efficient and general procedure for the production of point mutations in any DNA fragment”NucleicAcids Res.10：6487-6500；Zoller & Smith(1983)“Oligonucleotide-directedmutagenesis of DNA fragments cloned into M13 vectors”Methods in Enzymol.100：468-500和Zoller & Smith(1987)Oligonucleotide-directed mutagenesis：a simplemethod using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154：329-350)；硫代磷酸酯修饰的DNA诱变(Taylor等(1985)“The use of phosphorothioate-modified DNA in restriction enzyme reactions to preparenicked DNA”Nucl.Acids Res.13：8749-8764；Taylor等(1985)“The rapid generationof oligonucleotide-directed mutations at high frequency usingphosphorothioate-modified DNA”Nucl.Acids Res.13：8765-8787(1985)；Nakamaye(1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioategroups and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.14：9679-9698；Sayers等(1988)“Y-T Exonucleases in phosphorothioate-basedoligonucleotide-directed mutagenesis”Nucl.Asids Res.16：791-802；和Sayers等(1988)“Strand specific cleavage of phosphorothioate-containing DNA by reactionwith restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16：803-814)；使用缺口双重DNA的诱变(Kramer等(1984)“The gapped duplexDNA approach to oligonucleotide-directed mutation construetion”Nucl.Acids Res.12：9441-9456；Kramer & Fritz(1987)Methods in Enzymol.“Oligonucleotide-directedconstruction of mutations via gapped duplex DNA”154：350-367；Kramer等(1988)“Improved enzymatic in vitro reactions in the gapped duplex DNA approach tooligonucleotide-directed construction of mutations”Nucl.Acids Res.16：7207；和Fritz等(1988)“Oligonucleotide-directed construction of mutations：a gapped duplex DNAprocedure without enzymatic reactions in vitro”Nucl.Acids Res.16：6987-6999)。

可以用于实践本发明方法的另外的实验方案包括点错配修复(Kramer(1984)“Point Mismatch Repair”Cell 38：879-887)，应用修复缺陷型宿主株的诱变(Carter等(1985)“Improved oligonucleotide site-directed mutagenesis using M13vectors”Nucl.Acids Res.13：4431-4443；和Carter(1987)“Improvedoligonucleotide-directed mutagenesis using M13 vectors”Methods in Enzymol.154：382-403)，缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate largedeletions”Nucl.Acids Res.14：5115)，限制-选择和限制-纯化(Wells等(1986)“Importance of hydrogen-bond formation in stabilizing the transition state ofsubtilisin”Phil.Trans.R.Soc.Lond.A 317：415-423)，通过全基因合成的诱变(Nambiar等(1984)“Total synthesis and cloning of a gene coding for the ribonucleaseS protein”Science 223：1299-1301；Sakamar和Khorana(1988)“Total synthesis andexpression of a gene for the a-subunit of bovine rod outer segment guaninenucleotide-binding protein(trahsducin)”Nucl.Acids Res.14：6361-6372；Wells等 (1985)“Cassette mutagenesis：an efficient method for generation of multiplemutations at defined sites”Gene 34：315-323；和Grundstrom等(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene synthesis”Nucl.Acids Res.13：3305-3316)，双链断裂修复(Mandecki(1986)，Arnold(1993)“Proteinengineering for unusual environments”Current Opinion in Biotechnology 4：450-455.“Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli：amethod for site-speciflc mutagenesis”Proc.Natl.Acad.Sci.USA，83：7177-7181)。很多以上的方法的另外的细节在Methods in Enzymology的154卷中有说明，其中也描述了用于解决各种诱变方法遇到的问题的有用的控制。

也参见Stemmer的美国专利5,605,793(1997年2月25日)，“Methods forIn Vitro Recombination；”Stemmer等人的美国专利5,811,238(1998年9月22日)“Methods for Generating Polynucleotides having Desired Characteristics by IterativeSelection and Recombination；”Stemmer等人的美国专利5,830,721(1998年11月3日)，“DNA Mutagenesis by Random Fragmentation and Reassembly；”Stemmer等人的美国专利5,834,252(1998年11月10日)“End-Complementary PolymeraseReaction；”Minshull等人的美国专利5,837,458(1998年11月17日)，“Methods andCompositions for Cellular and Metabolic Engineering；”WO 95/22625，Stemmer和Cramen，“Mutagenesis by Random Fragmentation and Reassembly；”Stemmer和Lipschutz的WO 96/33207“End Complementary Polymerase Chain Reaction；”Stemmer和Crameri的WO 97/20078“Methods for Generating Polynucleotideshaving Desired Characteristics by Iterative Selection and Recombination；”Minshull和Stemmer的WO 97/35966，“Methods and Compositions for Cellular and MetabolicEngineering；”Punnonen等人的WO 99/41402“Targeting of Genetic VaccineVectors；”Punnonen等人的WO 99/41383“Antigen Library Immunization；”Punnonen等人的WO 99/41369“Genetic Vaccine Vector Engineering；”Punnonen等人的WO99/41368“Optimization of Immunomodulatory Properties of Genetic Vaccines；”Stemmet和Crameri的EP 752008“DNA Mutagenesis by Random Fragmentation andReassembly；”Stemmer的EP 0932670“Evolving Cellular DNA Uptake by RecursiveSequence Recombination；”Stemmer等人的WO 99/23107，“Modification of VirusTropism and Host Range by Viral Genome Shuffling；”Apt等人的WO 99/21979，“Human Papillomavirus Vectors；”del Cardayre等人的WO 98/31837“Evolution ofWhole Cells and Organisms by Recursive Sequence Recombination；”Patten和Stemmer的WO 98/27230“Methods and Compositions for Polypeptide Engineering，”Stemmet等人的WO 98/27230，“Methods for Optimization of Gene Therapy byRecursive Sequence Shuffling and Selection，”WO 00/00632，“Methods for GeneratingHighly Diverse Libraries，”WO 00/09679，“Methods for Obtaining in VitroRecombined Polynucleotide Sequence Banks and Resulting Sequences，”Arnold等人的WO 98/42832，“Recombination of Polynucleotide Sequences Using Random orDefined Primers，”Arnold等人的WO 99/29902，“Method for Creating Polynucleotideand Polypeptide Sequences，”Vind的WO 98/41 653，“An in Vitro Method forConstruction of a DNA Library，”Borchert等人的WO 98/41622，“Method forconstructing a Library Using DNA Shuffling，”和Pati和Zarling的WO 98/42727，“Sequence Alterations using Homologous Recombination.”。

某些美国申请提供了关于产生不同多样性的方法的细节，包括Patten等人的“SHUFFLING OF CODON ALTEAED GENES”，1999年9月28日提交，(美国系列号09/407,800)；del Cardayre等人的“EVOLUTION OF WHOLE CELLS ANDORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”，提交于1998年7月15日(美国系列号09/166,188)和1999年7月15日(美国系列号09/354,922)；Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACIDRECOMBINATION”，提交于1999年9月28日(美国系列号09/408,392)和Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”，提交于2000年1月18日(PCT/US00/01203)；Welch等人的“USE OFCODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETICSHUFFLING”，提交于1999年9月28日(美国系列号09/408,393)；Selifonov等人的“METHODS FOR MAKING CHARACTER STRINGS，POLYNUCLEOTIDS& POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”，提交于2000年1月18日(PCT/US00/01202)和，例如，Selifonov等人的“METHODS FOR MAKINGCHARACTER STRINGS，POLYNUCLEOTIDS & POLYPEPTIDES HAVINGDESIRED CHARACTERISTICS”，提交于2000年7月18日(美国系列号09/618,579)，Selifonov和Stemmer的“METHODS OF POPULATING DATASTRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”，提交于2000年1月18日(PCT/US00/01138)；和Affholter的“SINGLE-STRANDED NUCLEICACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACIDFRAGMENT ISOLATION”，提交于2000年9月6日(美国系列号09/656,549)。

非随机的或者“定向进化”的方法包括例如，饱和诱变(例如GSSM^TM)、合成的连接重装配(SLR)，或者它们的组合，它们被用来修饰本发明的核酸，以产生具有新的或者改变的性质(例如，在高的酸性或碱性条件，高温和类似条件下具有活性)的磷脂酶。由修饰了的核酸编码的多肽可以在测定磷脂酶或者其它活性之前对活性进行筛选。可以应用任何测试形式或者方案，如，用毛细管阵列平台。参见，如，美国专利6,280,926；5,939,250。

饱和诱变，或GSSM^TM

在本发明的一个方面中，非随机的基因修饰，“定向进化过程”，被用于产生具有新的或者改变的特性的磷脂酶。本方法的各种变化已经被称为“基因位点诱变”、“位点饱和诱变”、“基因位点饱和诱变^TM”或者简单地称为“GSSM^TM”。饱和诱变可以与别的诱变过程相结合。见，例如，美国专利6,171,820；6,238,884。一方面，GSSM^TM包括提供模板多核苷酸和众多的寡核苷酸，其中每种寡核苷酸包括与模板多核苷酸同源的序列，因此靶向模板多核苷酸中的特异序列，以及为同源基因的变异体的序列；通过使用寡核苷酸复制模板多核苷酸，产生包括非随机序列变异的子代多核苷酸，从而产生包括同源基因序列变异体的多核苷酸。

在一方面，将含有简并N，N，G/T序列的密码子引物用于往多核苷酸中引入点突变，以便产生一组子代多肽，其中在每个氨基酸位置都是全范围的单氨基酸取代，例如被靶向待修饰的酶活性位点或者配体结合位点中的氨基酸残基。这些寡核苷酸可以包括连续的第一同源序列，简并N，N，G/T序列，和任选地，第二同源序列。从使用这些寡核苷酸得到的下游的子代翻译产物包括多肽上的每个氨基酸位点的所有可能的氨基酸变异，这是因为N，N，G/T序列的简并性包括所有20种氨基酸的密码子。在一方面，一个这样的简并寡核苷酸(包括，例如，一个简并N，N，G/T盒)用于使亲代多核苷酸模板中的每个最初密码子进行全范围的密码子取代。在另一方面，使用至少两个简并盒——或者在相同的寡核苷酸中，或者在不相同的寡核苷酸中，以使亲代多核苷酸模板中的至少两个最初密码子进行全范围的密码子取代。例如，一个寡核苷酸中可以含有一个以上的N，N，G/T序列，以在一个以上的位点上引入氨基酸突变。大量的这些N，N，G/T序列可以直接相邻，或者被一个或多个另外的核苷酸序列隔开。在另一方面，适用于引入添加或者缺失的寡核苷酸可以单独使用或者与含有N，N，G/T序列的密码子联合使用，以引入氨基酸添加、缺失和/或取代的任何组合或者排列组合。

在一方面，应用含有邻接的N，N，G/T三联体，即简并的(N，N，G/T)n序列的寡核苷酸，可以在两个或者多个邻近的氨基酸位置同时进行诱变。另一方面，可以应用简并度比N，N，G/T序列小的简并盒。例如，在一些例子中，(如，在一个寡核苷酸中)应用包括仅仅一个N的简并三联体序列是理想的，其中所述的N可以是在三联体的第一、第二或者第三的位置。在剩下的两个位置可以使用包括任何组合和排列的任何其它的碱基。作为选择，在一些例子中，(如，在一个寡核苷酸中)使用简并的N，N，N三联体序列是理想的。

一方面，应用简并的三联体(如N，N，G/T三联体)，可以系统地而容易地在多肽的每一和所有氨基酸位置中产生完整范围的可能的天然氨基酸(对应于所有20个氨基酸)(在可供选择的方面，所述方法也包括在每一个氨基酸残基或者密码子位置产生比所有可能的种类要少的替换)。例如，对于100个氨基酸的多肽，可以产生2000个不同的种类(即，每个位置可能的20种氨基酸×100个氨基酸位置)。通过应用含有简并N，N，G/T三联体的一段寡核苷酸或者一套寡核苷酸，32个不同的序列可以编码所有20种可能的天然氨基酸。因此，在使用至少一种这样的寡核苷酸进行亲本多核苷酸序列饱和诱变的反应容器中，产生了32种不同的子代寡核苷酸，它们编码20种不同的多肽。相反地，在定点突变中，应用非简并的寡核苷酸导致在每个反应容器中仅仅有一种子代多肽产物。非简并的寡核苷酸可以选择性地与公开的简并引物组合使用；例如，在工作多肽中，可以应用非简并的寡核苷酸来产生特异的点突变。这就提供了一种手段来获得特定的沉默点突变、导致相应的氨基酸变化的点突变、以及引起终止密码子产生和多肽片段相应的表达终止的点突变。

一方面，每一个饱和诱变反应容器中含有编码至少20种子代多肽(如，磷脂酶)分子的多核苷酸，因此所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中的被诱变的密码子位置的特定氨基酸位置(其它的例子使用了少于20个天然的组合)。产生于每个饱和诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如，使用例如表达载体克隆至合适的宿主，如大肠杆菌宿主)，然后进行表达的筛选。当通过筛选确定显示出有利的性质变化(例如与亲本多肽比较，在碱性、酸性条件下磷脂酶活性增强)的单个子代多肽时，就可以用测序来确定其中所含有的相应的有利的氨基酸取代。

一方面，如在此所公开的，应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变，可以在超过一个的氨基酸位置确定出的有利的氨基酸变化。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者多种新的子代分子。例如，如果在多肽的三个氨基酸位置的每一个位置确定出2个特定的有利的氨基酸变化，这样出现的排列就包括在每一个位置的3种可能性(与原来的氨基酸没有变化，和两个有利变化中的每一个)和3个位置。这样，就有3×3×3或者27种总的可能性，包括先前检查出的7种——6种单点突变(即，在三个位置的每一个有2个)和在任何位置中都没有变化的1种。

另一方面，为了改变序列，定点饱和诱变可以与任何随机的或非随机方法一起使用，例如，合成的连接重装配(见下文)，重排，嵌合，重组和其他诱变过程和诱变剂。本发明提供以重复方式使用任何诱变过程，包括饱和诱变。

合成的连接重组装(SLR)

本发明提供称为“合成连接重装配”，或者简单地称为“SLR”的非随机基因修饰系统，这是一种“定向进化方法”，以产生具有新的或者改变的特性的磷脂酶。SLR是非随机地把寡核苷酸片段连接在一起的方法。此方法与随机的寡核苷酸重排不同，因为核酸构件不被随机重排、串联或者随机地嵌合，而是非随机组装。参见，例如，美国专利申请系列号(USSN)09/332,835，题目是”Synthetic LigationReassembty in Directed Evolution”，于1999年6月14日提交(“USSN 09/332,835”)。一方面，SLR包括以下步骤：a)提供模板多核苷酸，其中该模板多核苷酸包括编码同源基因的序列；(b)提供多个构建模块多核苷酸，其中所述的构建模块多核苷酸被设计为可与模板多核苷酸在预定的序列处交叉装配(cross-over reassemble)，而且所述的构建模块多核苷酸包括所述同源基因的变异体序列以及在变异序列两侧与模板多核苷酸同源的序列；(c)将模板多核苷酸与构建模块多核苷酸结合，以便构建模块多核苷酸与模板多核苷酸交叉装配，产生包含同源基因序列变异的多核苷酸。

SLR并不依赖于在待重新组装的多核苷酸之间存在高水平的同源性。这样，这一方法可以用于非随机地产生包括超过10¹⁰⁰个不同嵌合体的子代分子文库。SLR可以用于产生包括超过10¹⁰⁰⁰个不同子代嵌合体的文库。这样，本发明的这些方面包括用于产生一套最终的具有按设计选择的整个装配顺序的嵌合核酸分子的非随机方法。这一方法包括按设计产生大量特定的核酸构建模块的步骤，这些核酸构建模块具有可以应用的相互间相容的可以连接的末端，然后装配这些核酸构建模块，这样就完成了按设计的全部装配顺序。

将被装配的核酸构建模块的相互相容的可连接的末端对于这种类型的顺序装配被认为是“适用的”，如果它们使得构建模块以预先制定的顺序联接的话。因此，核酸构建模块被偶联的总体装配顺序是通过可连接末端的设计来特异化的。如果不止一个装配步骤将要被应用，那么核酸构建模块被偶联的总体装配顺序也通过装配步骤的先后次序来特异化。一方面，退火的构建模块用酶处理，如用连接酶(如，T4 DNA连接酶)处理，以完成构建模块间的共价键结合。

一方面，寡核苷酸构建模块的设计通过分析一套祖先核酸序列模板而获得，该模板作为产生子代一套最终的嵌合多核苷酸的基础。这些亲本寡核苷酸模板作为序列信息源，辅助待诱变例如待嵌合或者重排的核酸构建模块的设计。

在这一方法的一个方面，为了选择一个或者多个分界点(demarcationpoints)，对多个亲本核酸模板的序列进行联配。所述分界点可以位于同源的区域，并且可以包括一个或者多个核苷酸。这些分界点在一个方面由至少两个祖先模板中共有。所述分界点可以因此用于描绘将要产生的寡核苷酸构建模块的边界，以便重新排列亲本寡核苷酸。在祖先分子中确定和选择的分界点用作装配最终的嵌合子代分子的潜在的嵌合位点。分界点可以是至少两个亲本多核苷酸序列共同的同源区域(包括至少一个同源核苷酸碱基)。可选择地，分界点可以是由至少半数的亲本多核苷酸序列共同拥有的同源区域，或者，是由至少三分之二的亲本多核苷酸序列共同拥有的同源区域。甚至更优选地，可应用的分界点是至少四分之三的亲本多核苷酸序列共同拥有的同源区域，或者，是几乎所有的亲本多核苷酸序列共同拥有的同源区域。一方面，分界点是由所有的亲本多核苷酸序列共同拥有的同源区域。

一方面，为了产生一个全面的子代嵌合多核苷酸文库，连接重装配过程被尽可能充分地实施。换句话说，核酸构建模块的所有可能顺序的组合存在于一套最终的嵌合核酸分子中。同时，另一方面，每个组合中的装配顺序(即，各个构建模块的装配顺序，按各个最终的嵌合核酸序列的5’到3’的方向)是按照以上所述设计的(或者是非随机的)。由于本发明的非随机性质，产生不需要的副产物的可能性大大降低。

在另一方面，系统地实施连接重装配的方法。例如，实施本方法来产生系统区分化的子代分子文库，划分开的文库可以系统地进行筛选，例如逐个的筛选。换句话说，通过选择性的和审慎的应用特定的核酸构建模块，再加上选择性的和审慎的应用连续的分步骤的装配反应，本发明使得这样一种设计可以实现，即可以在各个反应容器中制备出各自特定的一系列子代产物。这就允许进行系统的检查和筛选步骤。因此，这些方法允许对很可能是很大数目的子代分子以较小的组进行系统性检测。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力，尤其是当祖先分子之间具有低水平的同源性时，所以这些方法可以产生包括很大数目的子代分子的文库(或者一套分子)。由于该连接重装配发明的非随机性，产生的子代分子在一个方面包括具有依设计而选择的全部装配序列的最终嵌合核酸分子的文库。饱和诱变和优化的定向进化方法也可以用于产生不同的子代分子种类。可以理解，本发明在分界点的选择、核酸构建模块的大小和数目以及偶联的大小和设计方面提供了选择和控制的自由度。更进一步理解的是，本发明的操作对分子间同源性的要求被大大放松了。实际上，甚至可以在有较少分子间同源性或者没有分子间同源性的区域选择区别点。例如，由于密码子的摆动性，即，密码子的简并，核苷酸的替代可以被引入到核酸构建模块中而并不改变在相应的祖先模板中起初编码的氨基酸。可选择地，密码子可以被改变以至于原先的氨基酸的编码被改变。本发明提供了这样的替换，它们能够被引入到核酸构建模块中，由此增加分子间同源的分界点的发生率，这样就允许在构建模块之间实现更多数目的偶联，这又使得更多数目的子代嵌合分子产生。

另一方面，构件产生的步骤的合成特性允许设计和引入核苷酸(例如，一个或者多个核苷酸，其可以是，例如密码子或内含子或者调控序列)，其以后可以任选地在体外过程(例如，通过诱变)或者体内过程(例如，通过利用宿主微生物的基因剪切能力)中被除去。应该理解的是，在许多情况中，除了产生适用的分界点的潜在好处之外，由于许多别的原因，这些核苷酸的引入也是理想的。

一方面，核酸构件被用于引入内含子。因此，功能性的内含子被引入进根据在此描述的方法产生的人造基因中。人工引入的内含子可以在宿主细胞中发挥基因剪切的功能，作用方式如同天然产生的内含子发挥基因剪切的功能的方式。

优化的定向进化系统

本发明提供了一种非随机的基因修改系统，命名为“优化的定向进化系统”，其可以用来产生具有新的或者改变的特性的磷脂酶。优化的定向进化涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用，其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件(crossover events)的序列。

遗传交换事件是在嵌合序列中的一个点，在这里，发生从一个亲本变异体到另一个亲本变异体的序列转换。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。

此外，这一方法与其他系统相比，提供了一种用于探究巨大数量的可能的蛋白变异体的方便手段。以前，例如，如果在反应中产生了10¹³个嵌合分子，测试这样大数目的嵌合突变体的特定活性将会非常困难。此外，子代群体的相当部分将具有很高数目的遗传交换事件，其中得到的蛋白不大可能具有增高水平的特定活性。通过应用这些方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此，尽管在反应中可以仍然产生10¹³嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以偏向于具有预定数目的遗传交换事件，所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多核苷酸中的哪一个可能影响到特定的性质时，这时便提供了更加可控制的变量。

产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡核苷酸。每一个寡核苷酸优选地包括重叠的独特区域，这样把所述寡核苷酸混合在一起，得到具有以正确顺序装配的每一寡核苷酸片段的新的变异体。在USSN 09/332,835中可以发现另外的信息。对应于每一个亲本变异体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如，为了发现具有如在高温下的更高活性的嵌合变异体，可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子，对应于每一个亲本变异体的每一部分可以产生一套50个寡核苷酸序列。因此，在连接重装配过程中，在每一个嵌合序列中有可能有超过50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变异体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔数量存在于连接反应中，有可能在一些位置中来自同一亲本多核苷酸的寡核苷酸将相互一个个连接，而不导致遗传交换事件。如果在这一例子的任何连接步骤中，来自每一个亲本的每一个寡核苷酸的浓度保持不变，那么将会有1/3的可能性(假定3个亲本)：来自同一个亲本变异体的寡核苷酸将在嵌合序列内连接，而不产生遗传交换。

相应的，可以确定概率密度函数(PDF)，以预测在一个连接反应的每一步中可能发生的遗传交换事件的总数，其中给定了一套确定数目的亲本变异体、对应于每种变体的寡核苷酸、以及在连接反应中的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法，可以计算这样的概率密度函数，而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外，可以预先确定遗传交换事件的目标数目，然后对该系统进行程序化，以计算在该连接反应的每一个步骤中，每种亲本寡核苷酸的起始量，从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用，通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列，其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点，在这里，发生从一个亲本变异体到另一个亲本变异体的序列转换。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度，这样，序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。

此外，这些方法与其他系统相比，提供了一种用于探究大数量的可能蛋白变异体空间的方便手段。通过应用在这里描述的方法，嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此，尽管在反应中可以仍然产生10¹³个嵌合分子，但是所选择的用于进一步分析的每一个分子很可能具有，例如，仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件，所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多核苷酸中的哪一个可能影响到特定的性质时，这时便提供了更加可控制数量的变量。

一方面，该方法通过产生对应于每一个亲本序列的片段或者部分的寡核苷酸，产生嵌合子代多核苷酸序列。每一个寡核苷酸优选地包括重叠的独特区域，这样把所述寡核苷酸混合一起，得到具有以正确顺序装配的每一寡核苷酸片段的新的变异体。也可参见USSN 09/332,835。

对应于每一个亲本变异体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如，为了发现具有如在高温下的更高活性的嵌合变异体，可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子，对应于每一个亲本变异体的每一部分可以产生一套50个寡核苷酸序列。因此，在连接重装配过程中，在每一个嵌合序列中有可能有超过50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变异体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔数量存在于连接反应中，有可能在一些位置中来自同一亲本多核苷酸的寡核苷酸将相互一个个连接，而不导致遗传交换事件。如果在这一例子的任何连接步骤中，来自每一个亲本的每一个寡核苷酸的浓度保持不变，那么将会有1/3的可能性(假定3个亲本)：来自同一个亲本变异体的寡核苷酸将在嵌合序列内连接，而不产生遗传交换。

因此，可以确定概率密度函数(PDF)，以预测在一个连接反应的每一步中可能发生的遗传交换事件的总数，其中给定了一套确定数目的亲本变异体、对应于每种变体的寡核苷酸、以及在连接反应中的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。可以计算这样的概率密度函数，而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外，可以预先确定遗传交换事件的目标数目，然后对该系统进行程序化，以计算在该连接反应的每一个步骤中，每种亲本寡核苷酸的起始量，从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。

确定遗传交换事件

本发明的实施方案包括系统和软件，它们接受所需的遗传交换的概率密度函数(PDF)、待重新装配的亲本基因的数目以及重新装配的片段数目作为输入量。该程序输出“片段PDF”，它可以用于确定用于获得重新装配的基因和那些基因的估计的遗传交换PDF的具体方法。于此说明的过程优选地在MATLAB(TheMathworks，Natick，Massachusetts)中进行，MATLAB

是一种用于技术计算的程序语言和开发环境。

迭代过程(iterative process)

在实践本发明时，这些过程可以迭代反复。例如，对产生改变的磷脂酶表型的核酸(或者，所述核酸)进行鉴定，重新分离，再修饰，再检测活性。此过程可以反复重复，直到得到所需的表型。例如，整个生物化学的合成代谢或者分解代谢途径可以在细胞中设计，包括磷脂酶活性。

类似地，如果确定了特定的寡核苷酸对于所有所需的性质(如，新的磷脂酶表型)没有影响，那么就可以合成包括这段序列在内的更大的亲本寡核苷酸，从而将作为变量的这段序列去除。由于将这段序列合并到更大的序列中，可以避免任何遗传交换事件，所以在子代多核苷酸中，这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系，以及哪些与所需的性质无关的重复实践，可以更有效地探寻可能提供特定性质或者活性的所有蛋白变异体。

体内重排

分子的体内重排用在本发明的提供本发明的多肽如抗体、磷脂酶和类似物的变异体的方法中。体内重排可以利用细胞重组多聚体的天然特性来进行。尽管体内的重组提供了实现分子多样性的主要的天然途径，遗传重组仍然是一种相对复杂的过程，其涉及1)同源性识别；2)链切割，链侵入，和导致产生重组交叉(recombination chiasma)的代谢步骤；和最后3)交叉消除至分离的重组分子。交叉的形成需要同源序列的识别。

一方面，本发明提供由至少第一个多核苷酸和第二个多核苷酸产生杂合多核苷酸的方法。本发明可以用于通过将共有具部分序列同源性的至少一个区域的至少第一多核苷酸和第二多核苷酸引入到合适的宿主细胞中而产生杂合多核苷酸。该具部分序列同源性的区域促进导致产生杂合多核苷酸的序列识别的过程。正如在此使用的，术语“杂合多核苷酸”是由本发明的方法产生的任何核苷酸序列，含有从至少两个最初多核苷酸序列得到的序列。这样的杂合多核苷酸可以由促进DNA分子间的序列整合的分子间重组事件产生。另外，这样的杂合多核苷酸可以由利用重复序列以改变DNA分子中的核苷酸序列的分子内还原性重配过程产生。

产生序列变异体

本发明也提供使用本发明的核酸和多肽产生本发明的核酸和磷脂酶序列变异体，或者分离磷脂酶例如磷脂酶的序列变异体的方法。一方面，本发明提供本发明的磷脂酶基因的变异体，所述基因可以使用任何方法改变，包括，例如随机方法，或者非随机方法，或者“定向进化”方法，如上描述。

分离的变异体可以是天然发生的。变异体也可以体外产生。变异体可以使用遗传工程技术，例如定点诱变，随机化学诱变，核酸外切酶III缺失程序和标准克隆技术产生。做为选择，这样的变异体，片段，类似物或衍生物可以使用化学合成或者修饰程序产生。产生变异体的别的方法也为本领域技术人员所熟悉。这些方法包括修饰从天然分离物得到的核酸序列，产生编码具有特性的多肽的核酸的程序，所述特性增加它们在工业或实验室应用中的价值。在这些程序中，产生并且表征大量与从天然分离物得到的序列相比具有一个或多个核苷酸差异的变异体序列。这些核苷酸差异可以导致产生相对于由天然分离物的核酸编码的多肽而言的氨基酸变化。

例如，变异体可以使用易错PCR产生。在易错PCR中，PCR在DNA聚合酶复制保真度低的情况下进行，这样在PCR产物的全长中获得高比率的点突变。易错PCR在，例如Leung，D.W.，等，Technique，1：11-15，1989)和Caldwell，R.C.&Joyce G.F.，PCR Methods Applic.，2：28-33，1992中有描述。简要而言，在这些程序中，为了在全长的PCR产物中得到高比率的变突变，将待诱变的核酸与PCR引物、反应缓冲液、MgCl₂、MnCl₂、Taq聚合酶和合适浓度的dNTP混合。例如，反应使用20毫微微摩尔(fmoles)待诱变的核酸，每种PCR引物30皮摩尔，反应缓冲液包括50mM KCl，10mM Tris HCl(PH8.3)和0.01％明胶，7mM MgCl₂，0.5mMMnCl₂，5单位的Taq聚合酶，0.2mM dGTP，0.2mM dATP，1mM dCTP和1mM dTTP。PCR进行30个循环，每个循环为94℃1分钟，45℃1分钟，72℃1分钟。然而，应该理解地是，这些参数可以适当的改变。将诱变的核酸克隆进入合适的载体中，并评估诱变的核酸编码的多肽的活性。

变异体也可以使用寡核苷酸定向诱变产生，在感兴趣的任何克隆DNA中产生位点专一的变异。寡核苷酸诱变在，例如，Reidhaar-Olson(1988)Science241：53-57中有描述。简要地，在这些程序中，合成待被引入到克隆的DNA中的许多具有一个或多个突变的双链寡核苷酸，并且插入到待诱变的克隆DNA中。回收含有经诱变的DNA的克隆，并评定经诱变的DNA编码的多肽的活性。

另一个产生变异体的方法是装配PCR。装配PCR涉及由小的DNA片段的混合物装配出PCR产物。在同一个容器中平行进行很多不同的PCR反应，其中，一个反应的产物用作另外一个反应的引物。装配PCR在例如美国专利5,965,408中有说明。

还有一个产生变异体的方法是有性PCR诱变。在有性PCR诱变中，由于基于序列同源性的DNA分子的随机片段化，在不同的但是高度相关的DNA序列的DNA分子之间，在体外强行发生同源重组，然后通过PCR反应的引物延伸，遗传交换得到固定。有性PCR诱变在，例如，Stemmer(1994)Proc.Natl.Asad.Sci.USA 91：10747-10751中描述。简要地说，在这样的程序中，多个待重组的核酸用DNase消化，产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段，重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR反应。例如，PCR可以这样进行：将纯化的片段重悬于含有0.2mM的各种dNTP、2.2mM MgCl₂、50mM KCl、10mM的Tris-HCl，pH 9.0以及0.1％的Triton X-100的溶液中，其浓度为10-30ng/μl，以100∶1的比例在反应混合物中加入2.5Units的Taq聚合酶，用以下的条件进行PCR：94℃60秒，94℃30秒，50-55℃30秒，72℃30秒(30-45次)，然后72℃进行5分钟。然而，这些参数可以进行适当的变化。在一些方面，寡核苷酸可以包括在该PCR反应中。在其它的一些方面，DNA聚合酶I的Klenow片段可以用于第一轮PCR反应，而Taq聚合酶可以用于后续的PCR反应。重组序列经过分离并评估它们编码的多肽的活性。

变异体也可以通过体内诱变产生。在一些方面，感兴趣的序列中的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生，所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖将最终产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在，例如，PCT公开号WO91/16427中有描述。

变异体也可以通过应用盒式诱变产生。在盒式诱变中，双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸“盒子”替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。

递归整体诱变也可以用于产生变异体。递归整体诱变是一种用于蛋白质工程(蛋白突变)的算法，它的开发是为了产生表型相关的突变体组成的多样性群体，其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA 89：7811-7815中有描述。

在一些方面，用指数整体诱变产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程，其中一小组的残基被随机化，同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整体诱变在如，Delegrave(1993)Biotechnology Res.11：1548-1552中有描述。随机和定点诱变在如，Amold(1993)Current Opinion in Biotechnology 4：450-455中有描述。

在一些方面，变异体利用重排方法产生，其中编码不同的多肽的多个核酸的部分被融合在一起，产生编码嵌合多肽的嵌合核酸序列，其描述于美国专利5,965,408；5,939,250中。

本发明也提供本发明的多肽变异体，包括其中一个或多个氨基酸残基(例如，本发明的示范性多肽的氨基酸残基)被保守的或不保守的氨基酸残基(例如，保守的氨基酸残基)取代，这样的取代的氨基酸残基可以是或者不是由遗传密码编码的氨基酸残基。保守的取代是多肽中给定的氨基酸被具有相似特征的另一个氨基酸取代。因此，本发明的多肽包括本发明的序列的保守取代，包括但不局限于以下取代：脂肪族氨基酸，例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸被另一个脂肪族氨基酸取代；丝氨酸被苏氨酸取代，或者相反；酸性残基例如天冬氨酸和谷氨酸被另一酸性残基取代；具有酰胺基团的残基，例如天冬酰胺和谷氨酰胺被另一具有酰胺基团的残基取代；碱性残基例如赖氨酸和精氨酸与另一碱性残基互换；芳香族残基例如苯丙氨酸、酪氨酸被另一芳香族残基取代。其他变异体是本发明的多肽的一个或多个氨基酸残基包括取代基团的那些变异体。

包括在本发明范围中的其他变异体是多肽与另一化合物，例如可以增加多肽半寿期的化合物，例如聚乙二醇缔合的那些变异体。

在本发明范围内的另外的变异体中，另外的氨基酸融合到多肽上，如前导序列、分泌序列、蛋白原序列(proprotein sequence)或者有利于纯化、富集或者使所述多肽稳定的序列。

在一些方面，发明的多肽变异体、片段、衍生物和类似物保持与示范性多肽相同的生物功能或活性，例如在此描述的磷脂酶活性。另一些方面，变异体、片段、衍生物或类似物包括原蛋白(proprotein)，这样，变异体，片段，衍生物或类似物可以通过切割原蛋白部分产生活性多肽被而活化。

密码子优化，实现宿主细胞中高水平的蛋白表达

本发明提供修饰编码磷脂酶的核酸，以便改变密码子使用(codon usage)的方法。一方面，本发明提供修饰编码磷脂酶的核酸中的密码子，以增加或降低其在宿主细胞中的表达的方法。本发明也提供了编码经修饰而增强其在宿主细胞中的表达的磷脂酶的核酸、经过这样的修饰的磷脂酶，和制备经修饰的磷脂酶的方法。该方法包括确定编码磷脂酶的核酸中“非-偏爱的”或者“较不偏爱的”密码子，并且用编码同样氨基酸的“偏爱的密码子”作为替换密码子替换一个或者多个这样的非-偏爱或者较不偏爱的密码子，并且在所述核酸中至少一个非-偏爱或者较不偏爱的密码子被编码相同氨基酸的偏爱密码子替换。偏爱密码子是在宿主细胞基因的编码序列中被优先使用的密码子，而不偏爱的或者较不偏爱的密码子是指在宿主细胞基因的编码序列中较少使用的密码子。

用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此，本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸，以及由所述的密码子被改变的核酸编码的多肽。示范性的宿主细胞包括革兰氏阴性细菌，如大肠杆菌；革兰氏阳性细菌，芽孢杆菌属(Bacillus)(蜡状芽孢杆菌(B.cereus))或链霉菌、加氏乳酸杆菌(Lactobacillus gasseri)、乳酸乳球菌(Lactococcus lactis)、乳脂乳球菌(Lactococcus cremoris)、枯草芽孢杆菌。示范性的宿主细胞也包括真核生物体，如，各种酵母，如酵母属的种(Saccharomyces sp.)，包括酿酒酵母、粟酒裂殖酵母、巴斯德毕赤酵母和乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)、黑曲霉(Aspergillus niger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此，本发明也包括在这些生物体和生物物种中的表达被优化的核酸和多肽。

例如，从细菌细胞中分离的编码磷脂酶的核酸密码子被修饰，以便该核酸在不同于获得该磷脂酶的细菌的细菌细胞、酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中优化表达。优化密码子的方法在本领域是已知的，参见如，美国专利5,795,737；Baca(2000)Int.J.Parasitol.30：113-118；Hale(1998)Protein Expr.Purif.12：185-188；Narum(2001)Inect.Immun.69：7250-7253。也参见Narum(2001)Infect.Immun.69：7250-7253，描述了在鼠系统中优化密码子；Outchkourov(2002)Protein Expr.Purif.24：18-24，描述了在酵母中优化密码子；Feng(2000)Biochemistry39：15399-15409，描述了在大肠杆菌中优化密码子；Humphreys(2000)Protein Expr.Purif 20：252-264，描述了大肠杆菌中导致分泌的优化密码子使用。

转基因非-人类的动物

本发明提供了包含本发明的核酸、多肽、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因非人类动物。转基因非人动物可以是，例如，包括本发明的核酸的山羊、兔、绵羊、猪、牛、大鼠和小鼠。这些动物可以作为，例如体内研究磷脂酶活性的模型使用，或者体内筛选磷脂酶活性的调节物的模型使用。欲在转基因非人动物中表达的多肽的编码序列可以设计为组成型的，或者组织特异性、发育特异性或者诱导转录调控因子的控制之下。转基因非人动物可以用本领域已知的任何方法设计和产生；参见，例如美国专利6,211,428；6,187,992；6,156,952；6,118,044；6,111,166；6,107,541；5,959,171；5,922,854；5,892,070；5,880,327；5,891,698；5,639,940；5,573,933；5,387,742；5,087,571，这些专利描述了产生和使用转化的细胞和卵，以及转基因小鼠、大鼠、兔、绵羊、猪和母牛。也参见，例如Pollock(1999)J.Immunol.Methods 231：147-157，描述在转基因产奶动物的奶中产生重组蛋白；Baguisi(1999)Nat.Biotechnol.17：456-461，描述转基因山羊的产生。美国专利6,211,428，描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人类哺乳动物。美国专利5,387,742，描述了把克隆的重组子或者合成的DNA序列注射至鼠受精卵中，移植注射的卵至假孕的雌鼠中，并且生长成为转基因鼠，它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992，描述了制备和应用转基因鼠，它的基因组具有编码淀粉样蛋白原(APP)的基因的断裂。

“基因敲除动物(knockout animals)”也可以用于实践本发明的方法。例如，在一方面，本发明的转基因动物或者修饰的动物包括“基因敲除动物”，如“基因敲除鼠”，它被工程改造，不会表达或不能表达磷脂酶。

转基因植物和种子

本发明提供了包含本发明的核酸、多肽(例如磷脂酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因植物和种子。本发明也提供了包含本发明的核酸和/或多肽(例如磷脂酶)的植物产物，如油、种子、叶、提取物以及类似物。转基因植物可以是双子叶的(双子叶植物)或者单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如，美国专利6,309,872。

本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如，核酸或者表达构建物可以导入到所需的植物宿主的基因组中，或者，核酸或者表达构建物可以是附加体。可以导入到所需植物的基因组中，这样宿主的磷脂酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”，其中例如同源重组导致的基因序列的插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已知的，参见，如，Strepp(1998)Proc Natl.Acad.Sci.USA95：4368-4373；Miao(1995)Plant J 7：359-365。参见下面的转基因植物的讨论。

本发明的核酸可以将所需的性质赋予基本上任何植物，例如，含油籽的植物，如水稻，大豆，油菜籽，向日葵子，芝麻和花生。为了优化或改变宿主磷脂酶的表达，本发明的核酸可以用于控制植物代谢途径。这可以改变植物中磷脂酶的活性。作为选择，本发明的磷脂酶可以用于产生转基因植物，以产生天然情形下不由此植物产生的化合物。这可以降低生产成本或产生新的产品。

一方面，产生转基因植物的第一步骤涉及制备在植物细胞中表达的表达构建物。这些技术是本领域熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列以及选择适当的基因终止序列。典型的组成型启动子是来自花椰菜花叶病毒的CaMV35S，它一般在植物中导致高水平的表达。其它的启动子更具特异性，并且对植物的内部或者外部环境中的暗示有反应。典型的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。

一方面，修饰核酸来实现在植物细胞中更强的表达。例如，本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率，而一些植物优选G-C核苷酸对。因此，编码序列中的A-T核苷酸可以用G-C核苷酸取代，而不显著改变氨基酸序列，可以增强在植物细胞中基因产物的产生。

为了鉴定已经成功整合了转移基因的植物细胞或者组织，可以将选择性标记基因加入到基因构建物中。这可能是必要的，因为在植物细胞中完成基因的整合和表达是一个小概率事件，仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白，所述试剂一般对植物有毒性，如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时，只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样，为了有恰当的功能，标记基因也需要启动子和终止序列。

一方面，转基因植物或种子制备方法包括将发明的序列，和任选地，标记基因整合到目标表达构建物(例如，质粒)中，同时定位启动子和终止子序列。这可以包括将修饰的基因通过合适方法转入植物中。例如，构建物可以应用如电穿孔和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中，或者构建物可以应用弹道方法(ballistic methods)，如，DNA微粒轰击(DNA particlebombardment)的方法直接引入到植物组织中。例如，参见如，Christou(1997)Plant Mol.Biol.35：197-203；Pawlowski(1996)Mol.Biotechnol.6：17-30；Klein(1987)Nature 327：70-73；Talcumi(1997)Genes Genet.Syst.72：63-69，讨论了应用微粒轰击引入转基因到小麦中；Adam(1997)如上，应用微粒轰击将YACs引入至植物细胞中。例如，Rinehart(1997)如上，用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明；而且，可以通过商业渠道获得BioRad(Biolistics)PDS-2000微粒加速设备；也参见，John，美国专利5,608,148；和Ellis，美国专利5,681,730，描述了微粒介导的裸子植物的转化。

一方面，原生质体可以被固定，并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易，但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化，其中的DNA被包裹于钨微射弹(tungsten microprojectiles)上，射出物的大小为细胞大小的1/100，它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生，一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。

核酸，例如表达构建物也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化，如，烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol. Biol.33：989-999)，参见Porta(1996)“Use of viral replicons for the expression of genesin plants”，Mol.Biotechnol.5：209-221。

可选择地，核酸，如表达构建物，可以与合适的T-DNA旁侧区域组合，并导入到传统的根癌农杆菌宿主载体中。根癌农杆菌宿主的毒力功能将在植物细胞受该细菌感染时，引导构建物和邻近的标记插入至植物细胞DNA中。根癌农杆菌介导的转化技术，包括disarming和二元载体的应用，在科学文献中有详细的说明。参见，如，Horsch(1984)Science 233：496-498；Fraley(1983)Proc.Natl.Acad.Sci.USA 80：4803(1983)；Gene Transfer to Plants，Potrykus，ed.(Springer-Verlag，Berlin 1995)。根癌农杆菌细胞的DNA被包含在细菌染色体中，也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(～20kb长)和一系列毒力(virulence)基因，T-DNA在感染过程中被转移到植物细胞中，毒力基因则引导所述感染过程。根癌农杆菌可以通过伤口感染植物：当植物的根或者茎受伤，它释放某种化学信号，作为对这种信号的响应，根癌农杆菌的毒力基因被激活，并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录，然后将自身插入到暴露的植物DNA中。为了应用根癌农杆菌作为转基因载体，必须去除T-DNA的肿瘤诱导部分，而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间，从这里转移到植物细胞并且整合到植物的染色体中。

本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化，参见Hiei(1997)Plant Mol.Biol.35：205-218。也参见如，Horsch，Science(1984)233：496；Fraley(1983)Proc.Natl Acad.Sci USA 80：4803；Thykjaer(1997)如上；Park(1996)Plant Mol.Biol.32：1135-1148，讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin，美国专利5,712,135，描述了包含在谷类或者其它单子叶植物的细胞中的具有功能性的基因的DNA的稳定整合过程。

一方面，第三步可以包括能够将整合的靶基因传递至下一代的完整植物的选择和再生。这样的再生技术依赖于对组织培养生长培养基中的某些植物激素的操作，典型地，依赖于与所需的核苷酸序列一同引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明，Evans等，Protoplastslsolation and Culture，Handbook of Plant Cell Culture，124-176页，MacMillilanPublishing Company，New York，1983；和Binding，Regeneration of Plants，PlantProtoplasts，21-73页，CRC Press，Boca Raton，1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.ofplant Phys.38：467-486中有概括性的说明。为了从转基因组织如未成熟的胚胎获得整个植物，它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养，即称为组织培养的过程。一旦整个植物再生并且产生种子，便开始评价子代。

在表达序列盒稳定地整入到转基因植物之后，其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术，这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化，包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此，本发明的种子可以来自本发明的两个转基因植物的杂交，或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(如，磷脂酶)时，所需的效应(例如，表达本发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。

本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草，如牧草(蓝草，早熟禾属Poa)，饲料草如羊茅属，黑麦草属，温带草，如翦股颖属(Agrostis)，和谷类，如，小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草、豆类，如羽扇豆、马铃薯、甜菜、豌豆、蚕豆和大豆，以及十字花科植物(Brassicaceae属)，如花椰菜，油菜籽，和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样，本发明的转基因植物和种子包括很宽范围的植物，包括，但不限于，以下属的种：腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、油菜属(Brassica)、柑桔属(Citrus)、Citrullus、辣椒属(Capsicum)、Carthamus、椰子属(Cocos)、咖啡属(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、Daucus、Elaeis、Fragaria、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、Majorana、苜蓿属(Medicago)、烟草属(Nicotiana)、Olea、Oryza、Panieum、Pannisetum、鳄梨属(Persea)、菜豆属(Phaseolus)、Pistachia、Pisum、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、Sinapis、茄属(Solanum)、高粱属(Sorghum)、Theobromus、Trigonella、小麦属(Triticum)、野豌豆属(Vicia)、Vitis、Vigna、和玉蜀黍属(Zea)。

在可供选择的实施方式中，本发明的核酸在植物(例如，转基因植物)，如含油籽植物，例如水稻、大豆、油菜籽、向日葵子、芝麻和花生中表达。本发明的核酸可以在含纤维细胞的植物，包括例如，棉花、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、balsa、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻中表达。在可供选择的实施方式中，本发明的转基因植物可以是棉属(Gossypium)的成员，包括任何棉(Gossypium)种的成员，如，亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。

本发明也提供用于大量生产本发明的多肽(例如磷脂酶或抗体)的转基因植物。例如，参见Palingren(1997)Trends Genet.13：348；Chong(1997)TransgenicRes.6：289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′，2′)启动子，应用根癌农杆菌介导的叶片圆盘(leaf disc)转化方法，在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。

应用已知的程序，技术人员可以通过检测在转基因植物中转基因mRNA或者蛋白的增加或者减少来筛选本发明的植物。检测和定量mRNA或者蛋白的方法是本领域熟知的。

多肽或肽

本发明提供了与本发明的示范性序列例如SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ IDNO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQ ID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ IDNO：132、SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138、SEQ ID NO：140、SEQ ID NO：142、SEQ ID NO：144、SEQ ID NO：146、SEQ ID NO：148、SEQ IDNO：150、SEQ ID NO：152、SEQ ID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ IDNO：168、SEQ ID NO：170、SEQ ID NO：172，or SEQ ID NO：174具有序列同一性(例如，至少50％、51％、52％、53％、54％、55％、56％、57％、58％、59％、60％、61％、62％、63％、64％、65％、66％、67％、68％、69％、70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％，或者更多，或者完全的(100％)序列同一性)的分离的或重组的多肽。如以上讨论的，同一性可以在多肽的全长范围内，或者，同一性可以在其子序列，例如，至少大约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多残基的范围内。本发明的多肽也可以比示例性多肽(例如，SEQ ID NO：2、SEQ ID NO：4、SBQ ID NO：6、SEQ ID NO：8等)的全长要短。在可选择的实施方案中，本发明提供大小在大约5到多肽全长范围的多肽(肽，片段)，所述多肽例如酶，如磷脂酶，例如，磷脂酶；示例性大小为大约5、10、15、20、25、30、35，40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400或更多残基，例如，SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8等的示例性磷脂酶的连续残基。本发明的肽可以用作，例如，标记探针、抗原、耐受原、基序、磷脂酶活性位点、结合结构域、调控结构域和类似物。

一方面，多肽具有磷脂酶活性，例如，切割甘油磷酸酯键，水解磷酸酯键的能力，包括马铃薯块茎蛋白(patatin)，脂酰水解酶(LAH)，磷脂酶A，B，C和/或磷脂酶D活性，或它们的任意组合。

在可选择的方面，本发明的示例性多肽具有磷脂酶活性，信号序列位置、最初来源，如在下表1中所阐述。为了帮助阅读此表，例如在第一排，其中SEQ IDNO：143、144指具有在SEQ ID NO：144中阐述的序列的多肽，和由SEQ ID NO：143编码的多肽，它们具有PLA-特异性PLA活性，最初分离自未知来源；另一个例子在SEQ ID NO：167，168行，其中167、168指具有在SEQ ID NO：168中阐述的序列的多肽，和由SEQ ID NO：167编码的多肽，它们具有磷脂酸磷酸酶活性，信号序列在位置1至30(“AA1-30”指氨基酸残基1至30，等等)，即MARSWKWRPLLSSFLLVSLAPFSTSVPCFK，最初分离自未知来源。本发明提供也包含信号序列的肽，和嵌合多肽，其中所述肽和嵌合多肽包含表1中所阐述的信号序列，如下面所述。

表1

SEQ ID NO：	酶类型	信号序列位置 (AA＝氨基酸)	信号(AA)	来源
					143， 144	PA-特异性PLA	未知
25，26	Patatin			未知
					77，78	Patatin	未

[0384]

		知
			35，36	Patatin	未知
125， 126	Patatin	未知
			135， 136	Patatin	未知
99，100	Patatin	未知
			65，66	Patatin	未知
87，88	Patatin	未知
			86，87	Patatin	未知
45，46	Patatin	未知
			59，60	Patatin	未知
13，14	Patatin	未知
			71，72	Patatin	未知
55，56	Patatin	未知
			33，34	Patatin	未知
91，92	Patatin	未知
			103， 104	Patatin	未知
11，12	Patatin	未知
			17，18	Patatin	未知

[0385]

95，96	Patatin			未知
					43，44	Patatin			未知
27，28	Patatin			未知
					131， 132	Patatin			未知
127， 128	Patatin			未知
					133， 134	Patatin			未知
137， 138	Patatin			未知
					165， 166	Patatin			未知
167， 168	磷脂酸磷酸酶	AA1-30	MARSWKWRPLLSSFLLVSLAPFSTSVPCF K	未知
					169， 170	磷脂酸磷酸酶			未知
171， 172	磷脂酸磷酸酶			未知
					173， 174	磷脂酸磷酸酶			未知
111， 112	磷脂酰肌醇PLC	AA1-16	MGAGAILLTGAPTASA	细菌
					107， 108	磷脂酰肌醇PLC	AA1-23	MSNKKFILKLFICSTILSTFVFA	未知
109， 110	磷脂酰肌醇PLC	AA1-23	MSNKKFILKLFICSTILSTFVFA	未知
					113， 114	磷脂酰肌醇PLC	AA1-23	MSNKKFILKLFICSTILSTFVFA	未知
117， 118	磷脂酰肌醇PLC	AA1-23	MNNKKFILKLFICSMVLSAFVFA	未知
					119， 120	磷脂酰肌醇PLC	AA1-23	MNNKKFILKLFICSMVLSAFVFA	未知

[0386]

	醇PLC			知
					115， 116	磷脂酰肌醇PLC	AA1-23	MNNKKFILKLFICSMVLSAFVFA	未知
121， 122	磷脂酰肌醇PLC	AA1-23	MRNKKFILKLLICSTVLSTFVFA	未知
					141， 142	磷脂酶			未知
155， 156	磷脂酶	AA1-36	MRTTTTNWRQIVKSLKLFLMGLCLFISASF ASSAYA	未知
					159， 160	磷脂酶			未知
145， 146	PLA			未知
					147， 148	PLA			未知
149， 150	PLA			未知
					151， 152	PLA			未知
153， 154	PLA			未知
					157， 158	PLA			未知
163， 164	PLA			未知
					101， 102	PLC	AA1-39	LSLVASLRRAPGAALALALAAATLAVTAQ GATAAPAAAAA	细菌
1，2	PLC	AA1-24	MKKKVLALAAMVALAAPVQSVVFAQ	未知
					3，4	PLC	AA1-24	MKRKILAIASVIALTAPIQSVAFAH	未知
5，6	PLC	AA1-24	MKRKILAIASVIALTAPIQSVAFAH	未知
					97，98	PLC	AA1-25	MKRKLCTWALVTAIASSTAVIPTAAE	未知

[0387]

7，8	PLC	AA1-29	MITLIKKCLLVLTMTLLLGVFVPLQPSHAT	未知
					31，32	PLC	AA1-20	MKKKLCTWALVTAISSGWAI	未知
81，82	PLC	AA1-25	MKKKLCTMALVTAISSGVVTIPTEAQ	未知
					93，94	PLC	AA1-29	MITLIKKCLLVLTMTLLSGVFVPLQPSYAT	未知
89，90	PLC	AA1-25	MKKKLCTLAFVTAISSIAITIPTEAQ	未知
					123， 124	PLC	AA1-24	MKKKVLALAAMVALAAPVQSVVFA	未知
129， 130	PLC	AA1-27	MKKKICTLALVSAITSGVVTIPTVASA	未知
					139， 140	PLC	AA1-20	MKIKPLTFSFGLAVTSSVQA	未知
105， 106	PLC	AA1-30	MNRCRNSLNLQLRAVTVAALVVVASSAA LAW	未知
					9，10	PLC	AA1-20	MKLLRVFVCVFALLSAHSKAD	未知
47，48	PLD			未知
					15，16	PLD			未知
41，42	PLD			未知
					23，24	PLD			未知
51，52	PLD			未知
					53，54	PLD			未知
19，20	PLD	AA1-19	MKKTTLVLALLMPFGAASAQ	未知
					75，76	PLD			未

[0388]

				知
					57，58	PLD			未知
63，64	PLD	AA1-18	MKNTLILAGCILAAPAVAD	未知
					79，80	PLD	AA1-23	MRNFSKGLTSILLSIATSTSAMAF	未知
37，38	PLD	AA1-23	MRNFSKGLTSILLSIATSTSAMAF	未知
					61，62	PLD	AA1-21	MTLKLSLLIASLSAVSPAVLAN	未知
67，68	PLD		无	未知
					83，84	PLD	AA1-21	MKKIVIYSFVAGVMTSGGVFAA	未知
49，50	PLD	AA1-23	MNFWSFLLSITLPMGVGVAHAQPD	未知
					39，40	PLD			未知
73，74	PLD			未知
					29，30	PLD			未知
21，22	PLD	AA1-28	MQQHKLRNFNKGLTGVVLSVLTSTSAMA F	未知
					71，72	PLD			未知
161，162	PLD	AA1-24	MNRKLLSLCLGATSCIALSLPVHA	未知

在一个方面，本发明提供了具有SEQ ID NO：107、SEQ ID NO：109、SEQ IDNO：111、SEQ ID NO：113、SEQ ID NO：115、SEQ ID NO：117、SEQ ID NO：119、SEQ ID NO：121、SEQ ID NO：123、SEQ ID NO：125、SEQ ID NO：127、SEQ IDNO：129、SEQ ID NO：131、SEQ ID NO：133、SEQ ID NO：135、SEQ ID NO：137、SEQ ID NO：139、SEQ ID NO：141、SEQ ID NO：143、SEQ ID NO：145、SEQID NO：147、SEQ ID NO：149、SEQ ID NO：151、SEQ ID NO：153、SEQ ID NO：155、 SEQ ID NO：157、SEQ ID NO：159、SEQ ID NO：161、SEQ ID NO：163、SEQ IDNO：165、SEQ ID NO：167、SEQ ID NO：169、SEQ ID NO：171和/或SEQ ID NO：173中阐明的序列的多肽，和其子序列，例如它们的具有磷脂酶活性，例如磷脂酶C(PLC)活性的活性位点(“催化结构域”)。在一个方面，多肽具有磷脂酶活性，但是缺少中性油(甘油三酯)水解活性。例如，在一个方面，多肽具有磷脂酶活性，但是缺少影响中性油(甘油三酯)组分的任何活性。在一个方面，本发明提供了脱胶工艺，该工艺包括使用具有磷脂酶活性但是缺少脂酶活性的本发明多肽。

本发明的多肽和肽可以从天然来源分离，可以合成，或者是重组产生的多肽。肽和蛋白质可以体外或体内重组表达。本发明的肽和多肽可以使用本领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本领域熟知的化学方法，全部地或部分地合成，见，例如Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223；Horn(1980)Nucleic Acids Res.Symp.Ser.225-232；Banga，A.K.，Therapeutic Peptides and Proteins，Formulation，Processing and Delivery Systems(1995)Technomic Publishing Co.，Lancaster，PA。例如，肽合成可以使用各种固相技术进行(见，例如，Roberge(1995)Science 269：202，Metrifield(1997)MethodsEnzymol.289：3-13)，并且可以例如使用ABI 431A肽合成仪(Perkin Elmer)，根据生产商提供的指导自动合成。

本发明的肽和多肽也可以糖基化。糖基化可以通过化学方法或者利用细胞生物合成机制在翻译后加上，其中后一种方式包括使用已知的糖基化基序，该糖基化基序可以是序列本来所拥有的，或者可以作为肽加上，或者加在编码序列的核酸中。糖基化可以是O-连接的或N-连接的。

本发明的肽和多肽，如以上描述的，包括所有的“模拟的”和“肽模拟的”形式。术语“模拟的”和“肽模拟的”指的是基本上具有与发明的多肽相同结构和/或功能特征的合成化学化合物。模拟物可以是完全由合成的、非天然的氨基酸类似物组成，或者是部分天然肽氨基酸和部分氨基酸的非天然类似物组成的嵌合分子。模拟物也可以含有任何量的天然氨基酸保守取代，只要这样的取代基本上不改变模拟物的结构和/或活性。如同作为保守变异体的本发明多肽的情况，常规实验可以确定模拟物是否在发明的范围内，即，其结构和/或功能是否基本上没有被改变。因此，一方面，假如模拟物具有磷脂酶活性，那么该模拟物在本发明的范围内。

本发明的多肽模拟物组合物可以含有非天然结构组分的任何组合。在可选择的方面，本发明的模拟物组合物包括以下三种结构基团的一种或所有：a)不是天然酰胺键(“肽键”)连接的残基连接基团，b)取代天然发生的氨基酸残基的非天然残基，或者c)诱导二级结构模拟，即诱导或稳定二级结构例如β-转角、γ-转角、β-折叠、α-螺旋构象和类似结构的残基。例如，当所有残基或一些残基通过化学方式，而不是天然肽键的方式连接时，本发明的多肽可以表征为模拟物。各个肽模拟物残基可以通过肽键、别的化学键或者偶联方式，例如，戊二醛，N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N，N′-二环己基碳二亚胺(DCC)或者N，N′-二异丙基碳二亚胺(DIC)连接。可以作为常规的酰胺键(“肽键”)连接的替代连接基团包括，例如，南五味子酮(例如，-C(＝O)-CH₂-，针对-C(＝O)NH)、氨基亚甲基(CH₂-NH)、乙烯、烯烃(CH＝CH)、醚(CH₂-O)、硫醚(CH₂-S)、四唑(CN₄-)、噻唑、反向酰胺(retroamide)、硫代酰胺或酯(见，例如，Spatola(1983)，Chemistry and Biochemistry of Amino Acids，Peptides and Proteins，VOl.7，pp267-357，“Peptide Backbone Modifications，”Marcell Dekker，NY)。

本发明的多肽也可以由于含有所有或一些取代天然发生的氨基酸残基的非天然残基，而表征为模拟物。非天然残基在科学文献和专利文献中得到充分地描述；一些用作天然氨基酸残基的模拟物的示例性的非天然组分和指导描述于下。芳香族氨基酸的模拟物可以通过被下述氨基酸取代产生，例如，D-或L-萘丙氨酸(naphylalanine)；D-或L-苯基甘氨酸，D-或L-2噻吩丙氨酸(thieneylalanine)；D-或L-1、-2、3-或4-芘基丙氨酸；D-或L-3噻吩丙氨酸(thieneylalanine)；D-或L-(2-吡啶基)-丙氨酸；D-或L-(3-吡啶基)-丙氨酸；D-或L-(2-吡嗪基)-丙氨酸；D-或L-(4-异丙基)-苯基甘氨酸；D-(三氟甲基)-苯基甘氨酸；D-(三氟甲基)-苯基丙氨酸；D-p-氟-苯基丙氨酸；D-或L-p-二苯基苯基丙氨酸；K-或L-p-甲氧基二苯基苯基丙氨酸；D-或L-2-吲哚-(烷基)丙氨酸；和D-或L-alkylainines，或非酸性氨基酸，其中烷基可以是取代的或不取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、sec-isotyl、异戊基或非酸性氨基酸。非天然氨基酸的芳香环包括，例如，噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯和吡啶基芳香环。

酸性氨基酸的模拟物可以通过用以下的取代来产生，如，保持有负电荷的非羧酸氨基酸；(膦酰基)丙氨酸；硫酸化的苏氨酸。羧基侧链(如，天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰，所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮鎓-4，4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如，(除了赖氨酸和精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸，或者(胍基)烷基-乙酸的取代产生，其中烷基如以上定义。腈衍生物(如，含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂在优选为碱性的条件下反应而产生，所述的常规试剂包括如苯乙二醛、2，3-丁二酮、1，2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-acetylimidizol和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生；得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-imidozoyl)丙酸；氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物；甲基2-吡啶基二硫化物；p-氯汞苯甲酸盐；2-氯汞-4硝基苯酚，或者，氯-7-硝基苯并-氧杂-1，3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如methyl picolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2，4，戊二酮的反应，和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括，例如，2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸，或者3，3，-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或者对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括，例如，由脯氨酸和赖氨酸的羟基化作用产生的模拟物；由丝氨酰或者苏氨酰的羟基的磷酸化作用产生的模拟物；由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物；由N-末端胺的乙酰化作用而产生的模拟物；由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物；或者，由C-末端羧基的酰胺化而产生的模拟物。

本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。因此，任何天然发生的L-构型(也可以被称为R或者S，取决于化学实体的结构)的氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代，相反手性的氨基酸称为D-氨基酸，但也可以称R-或者S-型。

本发明也提供了通过天然过程，如，翻译后加工(如，磷酸化，酰化以及类似作用)或者化学修饰技术修饰本发明的多肽的方法，以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方，包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解，相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解过程、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用，和转移RNA介导氨基酸添加到蛋白质中，如精氨酰化。参见，如，Creighton，T.E.，Proteins-Structure and Molecular Properties 2nd Ed.，W.H.Freeman和Company，New York(1993)；Posttranslational Covalent Modification ofProteins，B.C.Johnson，Ed.，Academic Press，New York，11-12页(1983)。

固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield，R.B.，J.Am.Chem.Soc.，85：2149-2154，1963)(也参见Stewart，J.M.和Young，J.D.，Solid PhasePeptide Synthesis，第二版，Pierce Chemical Co.，Rockford，III，11-12页)，并且这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearch Biochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等，Proc.Natl.Acad.Sci.，USA，81：3998(1984)的方法，它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行，而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时，一个板的杆或者钉被倒转并插入到另一个板的相应孔或者贮存器中，所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤，即是，反转和插入所述杆和钉的顶端至适当的溶液中，将氨基酸构建成所要的肽。此外，大量的FMOC肽合成系统是可利用的。例如，应用Applied Biosystems，Inc.的Model 431A^TM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得，或者通过直接的合成或者通过用其它已知的技术将一系列片段偶联起来的合成。

磷脂酶

本发明提供新的磷脂酶，编码磷脂酶的核酸，结合磷脂酶的抗体，代表酶的抗原位点(表位)和活性位点的肽，调控和结合结构域，和产生和使用它们的方法。一方面，本发明的多肽具有磷脂酶活性，或者如以上描述的的磷脂酶活性(例如，切割磷酸甘油酯键，缺少脂酶活性，等等)的任何组合。在可选择的方面，本发明的磷脂酶具有由在此描述的示范性磷脂酶的活性修饰而得的活性。

本发明包括具有或不具有信号序列的磷脂酶和信号序列本身。本发明包括本发明的酶的片段或子序列，例如包含催化结构域(活性位点)、结合位点、调控结构域、表位、信号序列、前原结构域(prepro domains)和类似物的肽或多肽，或由它们组成的肽或多肽。本发明也包括固定化的磷脂酶、抗磷脂酶抗体和它们的片段。本发明包括杂合物(heterocomplexes)，例如，包括本发明的磷脂酶的融合蛋质、异二聚体等。代表酶的抗原位点(表位)、活性位点、结合位点、信号序列和类似物的肽可以用常规的筛选方案测定。

本发明的这些酶和过程可以用于取得对高磷含量的油，特别是大米、大豆、玉米、油菜和向日葵油更彻底的脱胶。例如，在一个方面，一旦用PI-PLC切割，磷脂酰肌醇被转化为二酰基甘油和磷酸肌醇(phosphoinositol)。在离心期间，二酰基甘油与水相分开(从而提高油产量)，磷酸肌醇与水相分开，其中它作为重相的组分被去除。本发明的酶，例如本发明的PI-PLC可以被掺入到化学或物理油精炼过程中。

在可选的实施方案中，本发明的酶具有磷脂酰肌醇特异性磷脂酶C(PI-PLC)活性、磷脂酰胆碱特异性磷脂酶C活性、磷脂酸磷酸酶活性、磷脂酶A活性和/或patatin-相关磷脂酶活性。这些酶可以单独使用，或者相互之间或与本发明的其他酶或其他酶组合使用。在一个方面，本发明提供了这样的方法，其中这些酶(包括本发明的磷脂酰肌醇特异性磷脂酶C(PIPLC)、磷脂酰胆碱特异性磷脂酶C和/或磷脂酶D(与磷酸酶结合)、磷脂酸磷酸酶、磷脂酶A、patatin-相关磷脂酶)被单独或组合使用，用于使油脱胶，所述油诸如诸如植物油，例如高磷油，诸如，大豆油、玉米油、油菜油、米糠油和向日葵油。本发明的这些酶和过程可以用于取得对高磷含量的油，特别是大豆、玉米、油菜、米糠和向日葵油更彻底的脱胶。一旦用PI-PLC切割，磷脂酰肌醇被转化为二酰基甘油和磷酸肌醇。在离心期间，二酰基甘油与水相分开(提高油产量)，磷酸肌醇与水相分开，其中它作为重相的组分被去除。本发明的酶，例如本发明的PI-PLC可以被掺入到化学或物理油精炼过程中。

在一个方面，本发明提供了组合物，例如溶液，其包括在中性pH的柠檬酸钠，以水合不可水合物。例如，本发明提供了pH范围在约4至9或约5至8或约6至7的柠檬酸钠溶液，其可以用来水合在高磷油中的不可水合的磷脂(包括本发明的酶)。在一个方面，非水合磷脂的水合是通过螯合与磷脂相关的钙和镁进行的，从而使得之前不可溶的磷脂盐更容易地在水相中分开。在一个方面，一旦磷脂向水/油介面移动或进入水相，本发明的磷脂酶(例如本发明的磷脂酶特异性磷酸水解酶)或其他磷脂酶，将会把该磷脂转化为二酰基甘油和磷酸酯。在一个方面，一旦加入酸和碱，钙和镁金属的含量将降低(参见有关碱过程的论述)

本发明的酶是高度选择性的催化剂。与别的酶一样，它们催化常规的合成化学术所不能比拟的具有精巧的立体选择性、区域选择性和化学选择性的反应。而且，本发明的酶是非常多用的。它们可以经改变而在有机溶剂中具有功能，可在极端pH(例如，高pH和低pH)、极端温度(例如，高温和低温)、极端盐度水平(例如，高盐度和低盐度)下操作，并且催化结构上与它们的天然的、生理学上的底物无关的化合物的反应。本发明的酶可以设计为与大范围的天然和非天然底物具有反应活性，因此，使得能事实上修饰任何有机先导化合物。本发明的酶也可以设计为具有高度的对映选择性和区域选择性。这些酶所展示出的高度的官能基团选择性使得人们能明了产生新的活性化合物的合成顺序中的每一个反应。本发明的酶也可以设计为催化许多与它们的天然生理功能无关的不同的反应。

本发明开发了酶的独特催化特性。然而，在化学转化中，生物催化剂(即，纯化的酶或粗酶，非活细胞或活细胞)的使用一般要求确定与特异的起始化合物反应的特定生物催化剂。本发明使用经选择的生物催化剂，即，本发明的酶，和对在许多起始化合物中都存在的功能基团具有特异性的反应条件。每种生物催化剂对一种功能基团，或几种相关功能基团特异，可以与含有这种功能基团的多种起始化合物反应。生物催化反应由单个的起始化合物产生一个衍生物群体。这些衍生物可以经过另一轮生物催化途径，产生第二个群体衍生化合物。生物催化衍生化作用的每次重复都可以产生数千种最初化合物的变异体。

酶在起始化合物的特异位点反应，不影响该分子的其余部分，这个过程使用常规的化学方法是难以达到的。此高度的生物催化特异性提供了确定文库中单个活性酶的方法。文库是用一系列用于产生该文库的生物催化反应表征，是一个所谓的“生物合成史”。筛选文库的生物学活性以及追踪生物合成史，可确定产生该活性化合物的特异反应顺序。重复反应顺序，测定合成的化合物的结构。这种鉴定方式，与别的合成和筛选方法不同，不要求固定化技术，化合物可以在溶液中合成，并且实际上使用任何类型的筛选分析方法进行任意进行检测。需要注意的是，酶反应对功能基团的高度特异性使得可以“追踪”形成生物催化产生的文库的特异性酶反应。

本发明也提供使用本发明的核酸、多肽和抗体，来发现新的磷脂酶的方法。一方面，筛选λ-噬菌体文库以基于表达发现磷脂酶。在筛选中使用λ-噬菌体文库可以允许如下事项：检测毒性克隆；改进与底物的接触；降低对工程改造宿主的要求，绕开任何由文库的大量排除所致的潜在偏差；和，在低克隆密度下的快速生长。λ-噬菌体文库的筛选可以在液相或在固相中进行。在液相中筛选赋予分析条件的更大灵活性；额外的底物灵活性；对弱克隆更为灵敏；比固相筛选易于自动化。

许多程序步骤使用机器自动化进行，每天可以完成几千种生物催化反应和筛选分析，同时确保高度准确和再现性(见以下的阵列讨论)。结果，衍生化合物的文库可以在大概数周内获得。对分子，包括小分子修饰的进一步教导，见PCT/US94/09174。

磷脂酶信号序列和催化结构域

本发明提供磷脂酶的信号序列(例如，信号肽(SPs))，例如含有信号序列的肽和/或嵌合多肽，其中所述肽或嵌合多肽具有表1中示出的信号序列，或如下面示出的信号序列。本发明提供了编码这些信号序列(SPs，例如具有含有本发明多肽的氨基末端残基的序列的肽，或具有由本发明多肽的氨基末端残基组成的序列的肽)的核酸。一方面，本发明提供了信号序列，其包括这样的肽，该肽包含本发明多肽的残基1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到29、1到30、1到31、1到32或1到33中所阐述的序列，或该肽由所述序列组成，所述本发明的多肽例如SEQ ID NO：2、SEQ IDNO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ IDNO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28、SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、 SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48、SEQ ID NO：50、SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62、SEQ ID NO：64、SEQ ID NO：66、SEQ ID NO：68、SEQ ID NO：70、SEQ ID NO：72、SEQ ID NO：74、SEQ ID NO：76、SEQ ID NO：78、SEQ ID NO：80、SEQ ID NO：82、SEQ ID NO：84、SEQ ID NO：86、SEQ ID NO：88、SEQ ID NO：90、SEQ ID NO：92、SEQ ID NO：94、SEQ ID NO：96、SEQ ID NO：98、SEQ ID NO：100、SEQ ID NO：102、SEQ ID NO：104、SEQ ID NO：106、SEQ ID NO：108、SEQ ID NO：110、SEQ ID NO：112、SEQ IDNO：114、SEQ ID NO：116、SEQ ID NO：118、SEQ ID NO：120、SEQ ID NO：122、SEQID NO：124、SEQ ID NO：126、SEQ ID NO：128、SEQ ID NO：130、SEQ ID NO：132、SEQ ID NO：134、SEQ ID NO：136、SEQ ID NO：138；SEQ ID NO：140；SEQ ID NO：142；SEQ ID NO：144；NO：146、SEQ ID NO：148、SEQ ID NO：150、SEQ ID NO：152、SEQID NO：154、SEQ ID NO：156、SEQ ID NO：158、SEQ ID NO：160、SEQ ID NO：162、SEQ ID NO：164、SEQ ID NO：166、SEQ ID NO：168、SEQ ID NO：170、SEQ ID NO：172或SEQ ID NO：174。这些肽中的任何肽可以是嵌合蛋白例如重组蛋白的一部分。信号序列肽可以与本发明的其他酶(例如本发明的磷脂酶，从中本得不到该信号序列)，或与其他磷脂酶，或与任何多肽相配，如下进一步论述。

示例性的信号序列列于表1和SEQ ID列表中，如，SEQ ID NO：2、SEQ IDNO：4、SEQ ID NO：6的残基1到24；SEQ ID NO：8的残基1到29；SEQ ID NO：10的残基1到20；SEQ ID NO：20的残基1到19；SEQ ID NO：22的残基1到28；SEQ ID NO：32的残基1到20；SEQ ID NO：38的残基1到23；对于本发明的其它示例性信号序列，参见表1和SEQ ID列表。

在一些方面，本发明的磷脂酶无信号序列。在一个方面，本发明提供了缺少所有或部分信号序列的磷脂酶。在一个方面，本发明提供了编码来自一种磷脂酶的信号序列的核酸序列，该核酸序列可操作性地连接到不同的磷脂酶的核酸序列上，或者，任选地，来自非磷脂酶蛋白的信号序列也可以是期望的。

磷脂酶前原结构域(prepro domains)、结合结构域和催化结构域

如上所述，除了信号序列(例如信号肽(SPs))，本发明提供了前原结构域、结合结构域(例如底物结合结构域)和催化结构域(CDs)。本发明的SP结构域、结合结构域、前原结构域和/或CDs可以是分离的或重组的肽，或可以是融合蛋白的一部分，例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CDs)(例如″活性位点″)、前原结构域、结合结构域和信号序列(SPs，例如具有含有本发明多肽的氨基末端残基的序列的肽，或具有由本发明多肽的氨基末端残基组成的序列的肽)的核酸。

本发明的磷脂酶的信号序列(SPs)、结合结构域、催化结构域(CDs)和/或前原序列(prepro sequences)可以是分离的肽，或者连接于其他磷脂酶或者非磷脂酶多肽的序列，如，作为融合(嵌合)蛋白。在一方面，包含本发明磷脂酶信号序列SPs和/或前原序列的多肽含有与本发明磷脂酶异源的序列(例如，包含本发明的SP和/或前原序列以及其他磷脂酶或非磷脂酶蛋白的序列的融合蛋白)。在一个方面，本发明提供了具有异源CDs、SPs和/或前原序列，例如具有酵母信号序列的序列的本发明磷脂酶。本发明的磷脂酶可以包括异源的CDs、SPs和/或前原序列，它们在载体中，例如在pPIC系列载体(lnvitrogen，Carlsbad，CA)中。

一方面，本发明的SPs、CDs和/或前原序列在鉴定了新型的磷脂酶多肽之后来确定。分选蛋白质并且转运蛋白质至它们的细胞内合适位置的途径，一般被称为蛋白质定向转运途径(protein targeting pathways)。在所有这些定向转运系统中的最重要成员之一是在新合成多肽的氨基端的短氨基酸序列，叫做信号序列。信号序列引导蛋白质至细胞的合适位置定位，并且在转运过程中或者当蛋白到达其最终的目的地之后去除。大多数溶酶体蛋白，膜蛋白，或者分泌蛋白具有氨基末端信号序列，该序列标记这些蛋白用于转移到内质网的腔中。信号序列的长度可以在从13到45或更多个氨基酸残基内进行变化。本领域技术人员知道识别信号序列的各种方法。例如，一方面，通过称为SignalP的方法来鉴定新型的水解酶信号肽。SignalP应用识别信号肽和它们的切割位点的组合的神经网络。(Nielsen，et al.，“Identification of prokaryotic and eukaryotic signal peptides and prediction oftheir cleavage sites.”Protein Engineering，vol.10，no.1，p.1～6(1997)。

在一个方面，本发明的磷脂酶不必具有SPs和/或前原序列，和/或催化结构域(CDs)。在一个方面，本发明提供缺少所有或部分SP、CD和/或前原结构域的磷脂酶。在一个方面，本发明提供了编码来自一种磷脂酶的信号序列(SP)、CD和/或前原序列的核酸序列，其可操作性地连接到不同的磷脂酶的核酸序列上，或任选地，来自非磷脂酶蛋白的信号序列(SP)、CD和/或前原结构域也是可期待的。

本发明也提供了分离的或者重组的多肽，含有本发明的信号序列(SPs)、前区域和/或催化结构域(CDs)，以及异源序列。异源序列是与SP、前区域和/或CD非天然相关(如，对于磷脂酶)的序列。与SP、前区域和/或CD非天然相关的序列可以在SP、前区域和/或CD的氨基末端，羧基末端，和/或在SP和/或CD的末端。一方面，本发明提供了分离的或者重组的多肽，包括(或者由…组成)这样的多肽，该多肽包括本发明的信号序列(SPs)、前区域和/或催化结构域(CDs)，条件是其并不与和与其有天然联系的任何序列有联系(如磷脂酶序列)。相似地，一方面，本发明提供了编码这些多肽的分离的或者重组的核酸。所以，在一个方面，本发明的分离或者重组核酸包含有本发明的信号序列(SP)、前区域和/或催化结构域(CD)以及异源序列(即是，与本发明的信号序列(SP)、前区域和/ 或催化结构域(CD)的编码序列并不天然关联的序列)的编码序列。异源序列可以在3’末端、5’末端，和/或在SP、前区域和/或CD编码序列的末端。

本发明的多肽包括活性形式的或无活性形式的磷脂酶。例如，本发明的多肽包括成熟作用或对前序列加工之前的前蛋白，对前序列加工例如通过前蛋白-加工酶，例如前蛋白转化酶对前蛋白加工产生“有活性的”成熟蛋白。本发明的多肽包括因其他原因而失活的磷脂酶，这些原因例如翻译后加工事件而“激活”之前无活性，例如内-或外肽酶或蛋白酶作用、磷酸化作用事件、酰胺化作用、糖基化作用、去糖基化、硫酸化作用、二聚体化事件和/或类似作用。鉴定“前”区域序列、CDs、结合结构域和信号序列的方法是常规的，并且是本领域熟知的，参见例如Van deVen(1993)Crit.Rev.Oncog.4(2)：115-136；用于鉴定蛋白质-蛋白质相互作用的酵母双杂交筛选，由Miller(2004)Methods MoI.Biol.261：247-62；Heyninck(2004)Methods MoI.Biol.282：223-41，USPN 6,617,122；6,190,874描述。例如，为了鉴定前区域，从胞外空间纯化蛋白质，测定N-端蛋白质序列，并与未加工的形式作比较。

本发明的多肽可以作为蛋白质制剂配制成任何液体、固体、半固体或凝胶形式。例如，本发明的蛋白质制品可以包括这样的制剂，其含有非水液体组合物、铸造固体、粉末、冻干的粉末、粒状形式、颗粒形式、压缩的片剂、小球、丸、凝胶形式、水凝胶、膏、气溶胶、雾剂、洗液或浆状制剂。

本发明的多肽包括所有的活性形式，包括本发明酶的活性子序列，例如催化结构域(CDs)或活性位点。在一个方面，本发明提供下面阐述的催化结构域或活性位点。在一个方面，本发明提供了肽或多肽或等同物，其包括通过使用数据库诸如Pfam(其收集了大量的多序列比对和覆盖了许多常见的蛋白质家族的隐藏的Markov模型，The Pfam protein families database，A.Bateman，E.Birney，L.Cerruti，R.Durbin，L.Etwiller，S.R.Eddy，S.Griffiths-Jones，K.L.Howe，M.Marshall，and E.L.L.Sonnhammer，Nucleic Acids Research，30(1)：276-280，2002)而预测到的活性结构域，或由这些预测到的活性结构域组成。

本发明提供了本发明酶的N-端或C-端子序列(例如信号序列、前序列)与其他多肽、活性蛋白质或蛋白质片段的融合物。本发明的酶(例如磷脂酶C酶)可以通过将酶作为无活性的融合蛋白表达而产生，该无活性的融合蛋白随后通过蛋白质水解切割事件激活(使用内源性或外源性蛋白酶活性，例如胰蛋白酶)，切割导致融合蛋白伴侣和成熟的酶，例如磷脂酶C酶分离。在一个方面，本发明的融合蛋白由杂合核苷酸构建物表达，该构建物编码单个开放阅读框，含有下述元件：融合蛋白的核苷酸序列、接头序列(定义为编码连接两个柔性较小的蛋白区域的柔性氨基酸序列的核苷酸序列)、蛋白酶切割识别位点、和成熟酶(例如本发明的任何酶，例如磷脂酶)序列。在可选的方面，融合蛋白可以包含果胶裂解酶序列、木聚糖酶序列、磷脂酸磷酸酶序列或另一序列，例如之前显示在感兴趣的宿主细胞中过量表达的序列。

可以使用任何宿主系统(参见上面论述)，例如任何细菌，例如革兰氏阳性细菌，诸如杆菌属，或革兰氏阴性细菌，诸如大肠杆菌，或任何酵母，例如巴斯德毕赤酵母。嵌合核苷酸构建物中的核苷酸序列的排列可以基于用每一融合构建物获得的蛋白质表达水平来测定。在一个方面，从核苷酸构建物的5′端至构建物的3′端，核苷酸序列如下装配而成：信号序列/融合蛋白/接头序列/蛋白酶切割识别位点/成熟酶(例如本发明的任何酶，例如磷脂酶)或信号序列/前序列/成熟酶/接头序列/融合蛋白。酶(例如本发明的任何酶，例如磷脂酶)作为无活性融合蛋白表达，可以提高酶序列的总表达水平，可以减少与活性酶过表达相关的任何潜在的毒性，和/或可以增加使用之前的货架期，这是因为在融合蛋白，例如果胶裂解酶与酶，例如磷脂酶蛋白分离之前是无活性的。

在各个方面，本发明提供了激活作为融合蛋白表达的本发明的磷脂酶的具体的制剂。在一个方面，使用蛋白质水解活性或潜的蛋白质水解活性结合氨基-末端或羧基末端肽酶，来激活最初作为无活性的融合蛋白表达磷脂酶活性。该激活事件可以用各种方法实现，并且是在应用于油脱胶之前的制备/储存过程的各种时间点时进行。本发明的示例性工艺包括：在将融合构建物分泌到发酵介质中后由生产性宿主表达的内源活性进行的切割；在宿主细胞破裂之后，由激活的内源性蛋白酶活性进行的切割，或与胞内表达的融合构建物接触；使粗或纯化的融合构建物通过具有固定化的蛋白酶活性的柱，以在制备酶制剂之前完成切割和酶(例如本发明的磷脂酶，例如磷脂酶C)激活作用。用可溶性的蛋白质水解活性源处理粗的或纯化的融合构建物；在油精炼中，使用可溶性的或不溶性的蛋白质水解活性源，激活磷脂酶(例如本发明的磷脂酶，例如磷脂酶C)，之后立即用于各工艺中；和/或在减低的温度(例如在约4℃至20℃之间的任何温度)，通过使融合构建物制剂持续循环通过具有固定化的蛋白酶活性的柱，来激活(例如本发明的磷脂酶，例如磷脂酶C)磷脂酶活性。该激活事件可以在传递到使用位置之前完成，或它可以在油精炼中原位发生。

糖基化

本发明的肽和多肽(例如水解酶，抗体)也可以进行糖基化，例如在一个方面，含有至少一个糖基化位点，例如N-连接或O-连接的糖基化。在一个方面，多肽可以在巴斯德毕赤酵母或粟酒裂殖酵母中表达后进行糖基化。糖基化可以在翻译后以化学的方式或通过胞内生物合成机制加入，其中后者整合使用已知的糖基化基序，其对于序列来说可以天然的，或可以作为肽加入，或加入到核酸编码序列中。

在一个方面，本发明提供了含有N-连接的糖基化的SEQ ID NO：2的多肽，如下表中所述。

全长SEQ ID NO：2(在一个方面其由SEQ ID NO：1编码)开放阅读框编码七(7)个潜在的天冬酰胺-连接的(N-连接)糖基化位点。野生型SEQ ID NO：2开放阅读框在能够进行糖基化的宿主(例如，巴斯德毕赤酵母、酿酒酵母、粟酒裂殖酵母或哺乳动物细胞)中的表达，导致产生糖基化的SEQ ID NO：2磷脂酶，其由于存在N-连接的糖基化作用基本上没有活性。用PNGase F或内切糖苷酶H对野生型糖基化的SEQ ID NO：2进行酶促去糖基化作用，导致激活SEQ ID NO：2活性。此外，通过诱变对一个或多个N-连接的糖基化位点进行修饰(以便该位点不再被识别为N-连接的糖基化位点，并且糖基化不再发生在那个位点)，导致产生具有不同程度的活性增加的SEQ ID NO：2。

相比在相同的宿主细胞中表达的野生型开放阅读框，对SEQ ID NO：2糖基化位点4、5和/或6中编码天冬酰胺的核苷酸密码子进行诱变(例如将天冬酰胺转化为天冬氨酸)，导致产生具有增加的PLC活性的酶(在巴斯德毕赤酵母中表达的三联突变体具有与在非糖基化宿主如大肠杆菌中表达的野生型序列基本上相同的比活性和功能活性)。在N-连接的糖基化共有序列(NXS/T)中通过诱变丝氨酸或苏氨酸残基来废除N-连接的糖基化位点也是可能的，例如通过在这些位置改变这些核苷酸密码子产生缬氨酸或异亮氨酸，以代替丝氨酸或苏氨酸。使用该策略来除去N-连接的糖基化位点也导致在具有糖基化作用的宿主表达系统中产生活性SEQ ID NO：2磷脂酶。

磷脂酶活性的分析

本发明提供了具有磷脂酶活性或磷脂酶活性的任何组合的分离的、合成的或者重组的多肽(例如酶、抗体)，以及编码它们的核酸。本领域已知的很多磷脂酶分析方法中的任何方法都可以来用于确定是否多肽具有磷脂酶活性，并且是否是属于本发明的范围。用于确定磷脂酶A、B、D和C，patatin和脂酰水解酶活性或脂酶活性的常规方案是本领域已知的。

示例性的活性分析包括混浊度分析、羟甲香豆素磷酸胆碱(荧光)分析、Amplex red(荧光)磷脂酶分析、薄层色谱分析(TLC)、细胞裂解分析和p-硝基苯基磷脂酰胆碱分析。应用这些分析方法，可以很快地筛查出具有磷脂酶活性的多肽、肽或抗体。

磷脂酶活性可以包括脂酰水解酶(LAH)活性，参见如，Jimenez(2001)Lipids 36：1169-1174，该文献描述了用于确定patatin的脂酰水解酶活性的以十八烷基乙烯乙二醇单十二烷基醚为基础的混合微胶粒分析。Pinsirodom(2000)J.Agric.Food Chem.48：155-160，该文献描述了示例性的脂酰水解酶(LAH)patatin活性。

在以下文献中说明了用于确定磷脂酶活性的混浊度分析，如，在Kauffmann(2001)“Conversion of Bacillus thermocatenulatus lipase into an efficientphospholipase with increased activity towards long-chain fatty acyl substrates bydirected evolution and rational design”Protein Engineering 14：919-928；Ibrahim(1995)“Evidence implicating phospholipase as a virulence factor of Candida albicans，”Infect.Immun.63：1993-1998。

用于确定磷脂酶活性的羟甲香豆素(荧光)磷酸胆碱分析方法描述在下述文献中，例如Goode(1997)”Evidence for cell surface and internal phospholipaseactivity in ascidian eggs，”Develop.Growth Differ.39：655-660；Diaz(1999)”Directfluorescence-based lipase activity assay，”BioTechniques 27：696-700。

用于确定磷脂酶活性的Amplex Red(荧光)磷脂酶分析可以作为试剂盒获得，如，应用来自Molecular Probes Inc.(Eugene，OR)的Amplex Red磷脂酰胆碱特异性磷脂酶分析试剂盒，按照制造商的说明，检测磷脂酰胆碱特异性磷脂酶。在荧光微板读数器中，使用560±10nm的激发光和590±10nm的荧光检测，测量荧光。该分析在极低酶浓度时也灵敏。

确定磷脂酶活性的薄层色谱分析(TLC)描述在Reynolds(1991)Methodsin Enzymol.197：3-13；Taguchi(1975)“Phospholipase from Clostridium novyi typeA.I，”Biochim.Biophys.Acta 409：75-85中。薄层色谱分析(TLC)是用于检测磷脂酶活性的广泛应用的技术。已经应用了该方法的不同的经改良的方法从液相分析混合物提取磷脂酶。在一些PLC的分析中，通过浆氯仿/甲醇(2∶1)加入到反应混合物中来终止水解。未反应的起始物以及二酰基甘油通过抽提进入有机相，并且可以通过TLC分离，首基(head group)产物仍存在水相中。为了获得对磷脂消化更精确的测定，可以使用放射性标记的底物(参见，如，Reynolds(1991)Methodsin Enzymol.197：3-13)。产物和反应物的比率可以用于计算单位时间内的底物水解的实际摩尔数。如果所有的成分相同提取，提取中的任何损失将相同地影响所有的成分。磷脂消化产物的分离可以通过硅胶TCL来完成，用氯仿/甲醇/水(65∶25∶4)作为溶剂系统(参见，如，Taguchi(1975)Biochim.Biophys.Acta 409：75-85)。[391]确定磷脂酶活性的p-硝基苯磷脂酰胆碱分析描述于例如Korbsrisate(1999)J.Clin.Microbiol.37：3742-3745；Berka(1981)Infect.Immun.34：1071-1074。该分析方法基于酶法水解底物类似物p-硝基苯磷脂酰胆碱，释放黄色的生色化合物p-硝基苯，可以在405nm检测到。该底物方便用于进行高通量筛选。

基于红细胞裂解，细胞裂解分析可以检测具有细胞裂解活性的磷脂酶。毒性磷脂酶可以与真核细胞膜作用，并水解磷脂酰胆碱和鞘磷脂，引起细胞裂解，参见，如，Titall(1993)Microbiol.Rev.57：347-366。

杂合(嵌合)磷脂酶和肽文库

一方面，本发明提供了杂合磷脂酶和融合蛋白，包括肽文库，其含有本发明的序列。本发明的肽文库可以用于分离靶标如磷脂酶底物、受体、酶的肽调节物(如激活剂或者抑制剂)。本发明的肽文库可以用于鉴定靶的正常结合伴侣，如配基，例如，细胞因子、激素和类似物。一方面，本发明提供了包括本发明的信号序列(SP)和/或催化结构域(CD)以及异源序列的嵌合蛋白(参见以上)。

本发明也提供了应用本发明核酸和多肽，来产生“改进的”和杂合的磷脂酶的方法。例如，本发明提供了用于产生具有活性的酶的方法，所述活性如，在极端碱性pH值和/或酸性pHs、高和低的温度、渗透压和类似条件下的磷脂酶活性(如，磷脂酶A、B、C或者D活性、patatin酯酶活性、甘油磷酸酯键的切割、植物油中磷脂的酯连接的切割)。本发明提供了用于产生杂合酶(如，杂合磷脂酶)的方法。

一方面，本发明的方法通过应用细胞内过程产生新的杂合多核苷酸，该过程整合第一多核苷酸的序列，这样所得到的杂合多核苷酸编码表现出源于第一生物活性多肽的活性的多肽。例如，第一多核苷酸可以是编码本发明示例性的磷脂酶(如SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8等)的示例性核酸序列(如SEQ ID NO：1、SEQ ID NO：3、SBQ ID NO：5、SEQ ID NO：7等)。第一核酸可以编码来自一种生物的酶，其在特定的环境条件下，如高盐的条件下有效地发挥作用。它可以与由源于不同生物体的第二多核苷酸所编码的酶“整合”，该酶可以在不同的环境条件下如极端的高温条件下，有效地发挥作用。例如，两个核酸可以通过例如重组和/或还原性重配产生杂合分子。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸可以编码表现出由原始多核苷酸编码的两种酶的特性的酶。因此，由杂合多核苷酸编码的酶可以在第一和第二多核苷酸编码的酶共有的环境条件下，如高盐和极端温度下有效地发挥作用。

可选择地，由本发明的方法得到的杂合多肽可以表现出原始酶所没有显示出的特异化酶活性。例如，在编码磷脂酶活性的多核苷酸重组和/或还原性重配以后，由杂合多核苷酸编码得到的杂合多肽可以通过被筛查来自每一种起始酶的特异活性，即，磷脂酶对之起作用的键的类型以及磷脂酶发挥作用的温度。这样，例如，可以筛查磷脂酶，来查明那些可以将杂种磷脂酶从起初的磷脂酶分辨出来的化学功能，如：(a)酰胺(肽键)，即是，磷脂酶；(b)酯键，即是磷脂酶和脂酶；(c)乙醛缩，即是糖苷酶，和，例如，杂合多肽起作用时的温度、pH或者盐浓度。

待与本发明的核酸“整合”的多核苷酸来源可以从下述情形中分离：个体生物(“分离物”)，生长于成分确定培养基的生物群(“富集培养物”)，或者，未经培养的生物(“环境样品”)。由于其使人们可以接近未开发的具生物多样性的资源，应用培养物依赖性(culture-independent)方法来得到编码来自环境样品的新型生物活性的多核苷酸是最优选的。“环境文库”是从环境样品中产生，并且代表了天然发生生物体的全体基因组，环境文库保存在克隆载体中，载体可以在适合的原核宿主中繁殖扩增。因为克隆DNA起初是从环境样品中直接提取，文库并不限于可以生长于纯培养基中的小部分的原核生物。此外，存在于这些样品中的环境DNA的标准化，可以允许其更加平等地代表在起始样品中存在的所有种的DNA。这就可以显著增加从样品的次要组成中发现感兴趣基因的效率，该样品中的次要组成与优势种相比，可能少了几个数量级。

例如，从一个或者更多的未培养的微生物产生的基因文库中，筛查感兴趣的活性。编码感兴趣的生物活性分子的潜在途径，首先在原核生物细胞中以基因表达文库的方式被捕获。编码感兴趣活性的多核苷酸分离自这样的文库，并且引入到宿主细胞中。将宿主细胞生长于促进重组和/或还原性重配的环境中，从而产生具有新型的或者增强活性的潜在的生物活性分子。

可以制备杂合多核苷酸的微生物包括原核微生物如真细菌和古细菌，低等真核微生物如真菌、一些藻和原生动物。多核苷酸可以是分离自环境样品，在这种情况下，核酸被回收而不需培养某一种生物体，或者是从一种或者多种培养的生物中回收。在一方面，这样的微生物可以是适于极端环境的，如，嗜高温的、嗜冷的、冷育的、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的磷脂酶的多核苷酸可以用于制备杂合酶。这样的酶可以在地表温泉和深海的热火山口超过100℃的温度有作用，在北极水域低于0℃的温度有作用，在死海的饱和的盐环境下有作用，在pH值在0附近例如煤层沉积物和地热富硫矿泉中起作用，或者在pH值超过11例如污水污泥中有作用。例如，来自极端条件下的生物体的几种被克隆和被表达的磷脂酶在很宽的温度和pH范围内表现出高活性。

在此描述的选择和分离的多核苷酸，包括至少一种本发明的核酸，被引入到适当的宿主细胞中。适当的宿主细胞是可以促进重组和/或还原性重配的任何细胞。选择的多核苷酸可以在包括合适控制序列的载体中。宿主细胞可以是较高等的真核生物细胞，如哺乳动物细胞，或者较低等的真核生物细胞，如，酵母细胞，或者优选地，宿主细胞可以是原核细胞，如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染，或电穿孔(Davis等人，1986)来实现。

示范性的适当的宿主包括：细菌细胞，如大肠杆菌、链霉菌、鼠伤寒沙门氏菌；真菌细胞，如酵母；昆虫细胞如果蝇S2和草地夜蛾Sf9；动物细胞如CHO、COS或者黑色素瘤细、胞腺病毒；和植物细胞(也可参见上面的论述)。选择适合的宿主用于重组和/或还原性重配或者仅仅用于表达重组蛋白被认为是在本领域技术人员已知的范围内。可以用于重组和/或还原性重配或者仅仅用于表达重组蛋白的哺乳动物细胞培养系统包括：猴肾纤维原细胞的COS-7细胞系，其在“SV40-transformed simian cells support the replication of early SV40 mutants”(Gluzman，1981)中有说明，C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体可以包括复制起点、合适的启动子和增强子，以及必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列，以及5’旁侧的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于提供所需的非转录的遗传学元件。

含有感兴趣多核苷酸的宿主细胞(用于重组和/或还原性重配或者仅仅用于表达重组蛋白)可以在传统的营养培养基中培养，对该培养基进行改变以适于激活启动子，选择转化子或者扩增基因。培养的条件，如温度，pH和类似因素是那些之前选择用于表达条件的宿主细胞所使用的，并且对于普通技术人员是显而易见的。经鉴定具有特异酶活性的克隆可以随后进行测序，以鉴定编码具有增强活性的酶的多核苷酸序列。

另一方面，本发明的核酸和方法可以用于产生用于生物化学途径的新型多核苷酸，所述生物化学途径如，来自一个或者多个操纵子或者基因簇或者其部分的途径。例如，细菌和很多的真核生物具有调控基因的协调机制，其中所述基因的产物参与相关的过程。基因成簇排列在单个染色体上，在结构上称“基因簇”，它们在单个调控序列的控制下一起转录，所述调控序列包括起始整个簇的转录的单个启动子。因此，基因簇是指一组或者相同或者相关的相邻基因，一般是指功能上相关的邻近的基因。

基因簇DNA可以从不同的生物体中分离出来并且连接到载体中，特别是含有表达调控序列的载体，所述表达控制序列可以控制和调控可检测蛋白或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于引入外源DNA使用具有非常大的容量的载体，特别适合用于这样的基因簇，在这里通过括大肠杆菌的f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒，在接合过程中它能实现自身的高频率转移，f-因子对于获得和稳定扩增大DNA片段，如来自混合的微生物样品的基因簇是理想的。可以使用“Fosmids”、粘粒或者细菌人工染色体(BAC)载体作为克隆载体。它们源于大肠杆菌f因子，可以稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时，这就有可能得到以稳定的“环境DNA文库”形式存在的大的基因组片段。粘粒载体最初是设计用来克隆和扩增基因组DNA的大片段。应用粘粒载体的克隆在Sambrook 等，Molecular Cloning：A Laboratory Mannual，第二版，Cold Spring HarborLaboratory Press(1989)中有详细说明。一旦连接到适当的载体，含有不同的聚酮化合物合成酶基因簇的两个或者多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选，以寻找在起初的基因簇没有发现的增强的活性。

因此，一方面，本发明涉及使用本发明的核酸序列产生具有生物活性的杂合多肽以及筛选具有活性(例如，增强的活性)的多肽的方法，该方法通过：

1)以可操作性连接的方式导入至少第一多核苷酸(例如本发明的核酸)，和导入至少第二多核苷酸到合适的宿主细胞，所述的至少第一多核苷酸和第二多核苷酸共有具有部分序列同源性的至少一个区域；

2)在促进序列重新组织的条件下培养宿主细胞，得到可操作性连接的杂合多核苷酸；

3)表达由所述杂合多核苷酸编码的杂合多肽；

4)在有利于鉴定期望的生物活性(例如增强的磷脂酶活性)的条件下筛选所述的杂合多肽；和

5)分离编码该杂合多肽的多核苷酸。

用于筛选各种酶活性的方法对于本领域技术人员是已知的，关于它的讨论贯穿于本说明书。当要分离本发明的多核苷酸和多肽时，可以应用这些方法。

体内重配可以集中在“分子间”的过程上，统称为“重组”。在细菌中，它一般被视为是“RecA-依赖”的现象。本发明可以依赖于宿主细胞的重组过程来重组和重配序列，或者依赖于细胞介导还原过程的能力，通过缺失来减少细胞中的准-重复序列的复杂性。该“还原性重配”过程通过分子内的、RecA-依赖过程而发生。因此，在本发明的一方面，应用本发明的核酸，通过还原性重配过程，产生新型的多核苷酸。该方法包括产生含有连续序列(起始的编码序列)的构建物，它们插入到合适的载体中，并且然后将它们引入到合适的宿主细胞。单个分子同一性的重配通过在构建物中具有同源性区域的连续序列间的组合过程，或者准-重复单位间的组合过程而发生。重配过程重组和/或降低重复序列的复杂性和程度，并且导致产生新型的分子种类。

可以引用各种处理来提高重配效率。这些处理可以包括用紫外光，或者损坏DNA的化学试剂处理，和/或使用表现增高水平的“遗传不稳定性”的宿主细胞系。因此，这样的重配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然特性。

重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排列出现；以相似序列的连续单元出现。一旦连接，在连续序列之间的连接处变得本质上无形，并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板内容，在模板上可以发生滑移事件。因此，含有准重复的构建物有效地提供了足够的分子弹性，缺失(和潜在的插入)事件实际上可以在准重复单元内的任何地方发生。当准重复序列全部以相同方向连接，例如，头对尾或者反之亦然，细胞就不能区别各个单元。因此，还原过程可以在整个序列中发生。相反地，当例如，所述单元以头对头存在，而不是头对尾，相邻单元的头尾倒置，这样缺失的形成将有利于不连续单元的失去。因此，在本发明的一个方面，待重配序列是处于相同的方向。准重复序列的随机定向将会导致重配效率的损失，而序列的一致定向将会提供最高的效率。然而，虽然具有较少的相同定向的连续序列会降低效率，但是仍然可以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效率的准重复序列制备构建物。

应用各种方法中的任何一种，可以将序列装配成头对尾的定向，包括以下方法：a)可以使用包括poly-A头和poly-T尾的引物，当制成单链时，包括poly-A头和poly-T尾的引物将提供定向。这通过具有由RNA制备引物的头几个碱基来完成，而且随后用RNaseH可以很容易去除RNA。b)可以应用包括独特的限制酶切割位点的引物。这需要多个位点、一组独特的序列、和重复的合成和连接步骤。c)引物的内部几个碱基可以被硫醇化，并且用外切酶来产生合适的具有尾巴的分子。

重配序列的回收依赖于具有下降的重复指数(RI)的克隆载体的确定。被重配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有降低的RI的克隆载体的回收可以这样被完成，即：1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。2)通过物理程序对缩短的载体进行物理回收。在这一情况下，克隆载体将应用标准的质粒分离程序进行回收，或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。3)插入物的大小下降时，对含有可以选择的断裂基因的载体进行回收。4)应用表达载体以及适当的选择，使用定向选择技术。

相关的生物体的编码序列(例如，基因)可以表现出高度的同源性，并且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明中。然而，这一过程并不限于这种几乎相同的重复。

以下是本发明的示例性方法。编码性核酸序列(准-重复)来自三个(3)种，包括本发明的核酸。每一序列编码具有一套不同特征的蛋白质，包括本发明的酶。每一个序列在序列的唯一位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共同被扩增并且被连接到随机的组合中，以便所有可能的排列交换和组合可以在连接的分子群体中获得。准-重复单位的数目可以通过装配条件来控制。在构建物中，准-重复单位的平均数目通过重复指数(RI)来定义。一旦形成，构建物可以，或不必按照出版的方法通过琼脂糖凝胶来按大小分离，插入到克隆载体，并且转染到合适的宿主细胞中。然后细胞进行繁殖，并且进行“还原性重配”。如果需要，还原性重配过程的速率可以通过引入DNA损伤来刺激。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导，还是通过“分子间”的机制由重组类似的事件来介导是不重要的。最终的结果是分子被重配，得到所有可能的组合。在一个方面，本方法包括一个额外的步骤，即对重排的文库成员进行筛选，以确定具有与一种预定的大分子如蛋白质受体、寡聚糖、病毒颗粒或者其它的预定的化合物或者结构结合或者不同方式地相互作用，或者催化一个特定的反应(如，酶的催化结构域)的能力的个别的重排文库成员。从这样的文库所鉴定得到的多肽，如，磷脂酶可以用于各种目的，例如在此说明的工业过程和/或可以进行改组和/或选择的一个或者多个另外的循环。

在另一方面，可以预见，在重组或重配之前，或者在重组或重配的过程中，通过本发明的方法产生的多核苷酸可以用试剂处理或进行加工，这些处理或加工促进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其编码的多肽的多样性。促进诱变的试剂和过程可以包括，但不限于：(+)-CC-1065，或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley，(1992)；能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见，例如，van de Poll等(1992))，或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也见，van de Poll等(1992)，751-758页)；三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物，如7-溴甲基-苯[a]蒽(“BMA”)、三(2，3-二溴丙基)磷酸盐(“Tris-BP”)、1，2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7，8-二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑[4，5-f]-喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4，5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的尤其优选的方法由紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)组成。特别包含的方法是DNA加合物或者来自多核苷酸或者多核苷酸库的含有DNA加合物的多核苷酸，在进一步的处理前，其可以通过包括加热含有所述多核苷酸的溶液的过程进行释放或者去除。

筛选方法学和“在线”监视设备

在实践本发明的方法中，可以应用各种设备和方法学，结合使用本发明的多肽和核酸，例如，来筛选具有磷脂酶活性的多肽，来筛选作为潜在的活性调节物的化合物(如，酶活性的增强或者抑制)，以获得结合于本发明多肽的抗体，获得与本发明核酸杂交的核酸和类似物。

固定化的酶固体支持物

磷脂酶，其片段以及编码该酶和片段的核酸可以附于固体支持物上。这对于工业过程中磷脂酶的使用常常是经济的且有效的。例如，磷脂酶(或其活性片段)的联合物或者混合物——其用于特定的化学反应——可以附于固体支持物，并且浸于处理容器中。酶反应因此可以进行。随后，可以将固体支持物从容器中取出，同时取出的是固定在支持物上的酶，用于重复使用。在本发明的一个实施方案中，将分离的本发明核酸附着于固体支持物。在本发明的另一个实施方案中，固体支持物是选自凝胶、树脂、聚合物、陶瓷、玻璃、微电极以及它们的任意组合。

例如，用于本发明的固体支持物包括凝胶。凝胶的一些例子包括琼脂糖(Sepharose)、明胶、戊二醛、壳聚糖处理的戊二醛、白蛋白-戊二醛、壳聚糖-黄原胶、toyopearl胶(聚合胶)、藻酸盐、藻酸盐-聚赖氨酸、角叉菜胶、琼脂糖、glyoxyl琼脂糖、磁性琼脂糖、葡聚糖-琼脂糖、聚(氨基甲酰磺酸盐)水凝胶、BSA-PEG水凝胶、磷酸化的聚乙烯醇(PVA)、单氨基乙基-N-氨基乙基(MANA)氨基，或者它们的任意组合。

用于本发明的另一固体支持物是树脂或者聚合物。树脂或者聚合物的一些例子包括纤维素、丙烯酰胺、尼龙、人造纤维、聚酯、阴离子交换树脂、AMBERLITE^TMXAD-7、AMBERLITE^TMXAD-8、AMBERLITE^TMIRA-94、AMBERLITE^TMIRC-50、聚乙烯、聚丙烯酸、聚甲基丙烯酸酯或者它们的任何组合。

用于本发明的另一类型固体支持物是陶瓷。一些例子包括非多孔陶瓷、多孔陶瓷、SiO₂、Al₂O₃。用于本发明的另一类固体支持物是玻璃。一些例子包括非多孔玻璃、多孔玻璃、氨基丙基玻璃或者它们的任何组合。可以应用的另一类型固体支持物是微电极。一个例子是聚乙烯亚胺涂层磁铁。石墨颗粒可以用于固体支持物。

用于实施本发明的其他示例性固体支持物包括硅藻土产品和硅酸盐。一些例子包括CELITE

、KENITE

、DIACTIV

、PRIMISIL、DIAFIL

硅藻土和MICRO-CEL

、CALFLO

、SILASORB^TM和CELKATE

合成硅酸钙和硅酸镁。固体支持物的其他例子是细胞，诸如血红细胞。

固定化方法

有许多本领域技术人员已知的用于将酶或者其片段，或者核酸固定化在固体支持物上的方法。这样的方法的一些例子包括：如，产生静电液滴的方法、电化学方法、通过吸收、共价结合、交联、化学反应或者化学工艺、封装、捕集、通过藻酸钙，或者通过聚(2-羟乙基甲基丙烯酸)进行固定化的方法。类似的方法在下述文献中：Enzymology，Immobilized Enzymes and Cells，Part C.1987.AcademicPress.S.P.Colowick和N.O.Kaplan编辑，Volume 136；和Immobilization ofEnzymes and Cells.1997.Humana Press.Edited，G.F.Bickerstaff编辑.Series：Methods in Biotechnology，由J.M.Walker编辑。

毛细管阵列

毛细管阵列，如GIGAMATRIX^TM，Diversa Corporation，San Diego，CA，可以用于本发明的方法。本发明的核酸或者多肽可以固定于或者施用于阵列，包括毛细管阵列。阵列可以用于筛选或者监控能够结合或者调节本发明核酸或者多肽活性的组分(如，小分子，抗体，核酸等)文库。毛细管阵列提供了另一个系统用于固定和筛查样品。例如，样品筛选设备可以包括形成由相临的毛细管组成的阵列的许多毛细管，其中每一个毛细管包括至少一个确定的保持样品的腔的壁。该设备也可以进一步包括置于阵列中邻近毛细管之间的空隙物质，以及在空隙物质内形成的一个或者多个参照的标记。用于筛选样品的毛细管，其中毛细管经修改以适合结合在毛细管阵列中，可以包括限定保留样品的腔的第一壁，以及由过滤材料形成的第二壁，用于过滤被提供给腔以激发样品的激发能。

多肽或者核酸，如，配基，可以引入第一成分到毛细管阵列中的至少一部分毛细管。毛细管阵列中的每一个毛细管可以包括至少一个确定保留第一组分的腔的壁。在第一组分后，引入气泡至毛细管中。可以将第二组分引入到毛细管中，其中第二组分是通过气泡与第一组分分开。令人感兴趣的样品可以作为用可检测的颗粒标记的第一液体引入到毛细管阵列的毛细管中，其中毛细管阵列中的每一个毛细管包括至少一个限定保留第一液体和可检测颗粒的腔的壁，并且其中至少一个壁用将可检测颗粒结合到至少一个壁的结合材料包被。该方法可以进一步包括从毛细管中去除第一液体，其中结合的可检测颗粒仍保留在毛细管中，然后将第二液体引入到毛细管中。

毛细管阵列可以包括很多的单个的毛细管，包括由至少一个限定腔的外壁。毛细管的外壁可以是一个或者多个融合在一起的壁。相似地，壁限定的腔是圆柱形、正方形、六角形或者任何其它的几何性状，只要壁形成保留液体或者样品的腔即可。毛细管阵列中的毛细管可以非常接近地固定在一起，以形成平面结构。毛细管可以通过融合(如，当毛细管由玻璃制成时)、胶粘、粘合或者通过夹具并列结合在一起。毛细管阵列可以由任何数量的单个毛细管构成，例如，范围从100到4,000,000个毛细管。毛细管阵列可以形成具有大约100,000或者更多单个毛细管结合在一起的微滴定板。

阵列，或“生物芯片”

本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测化合物(例如，小分子、抗体、核酸等等)的结合或者调控本发明的核酸或者多肽的活性的能力。例如，在本发明的一方面，一个被监测的参数是磷脂酶基因的转录表达。细胞的一种或者多种或者所有的转录物可以通过阵列或者“生物芯片”上的固定化核酸与包含细胞转录物的样品，或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。通过应用微型芯片上的核酸“阵列”，细胞的一些或者所有转录物可以同时被量化。可选择地，包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新型的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。

本发明可以用任何已知的“阵列”进行实践，所述“阵列”也被指作“微阵列”或者“核酸阵列”或者“多肽阵列”或者“抗体阵列”或者“生物芯片”，或者它们的变体。阵列一般是多个“点”或者“靶元素”，每一个靶元素包括确定数量的一种或者多种生物分子，例如，固定于基底表面的确定区域、用于特异结合一种样品分子如mRNA转录物的寡核苷酸。

在实践本发明的方法时，任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地整入，或者也引入它们的变化，例如在下列文献中说明的：美国专利6,277,628；6,277,489；6,261,776；6,258,606；6,054,270；6,048,695；6,045,996；6,022,963；6,013,440；5,965,452；5,959,098；5,856,174；5,830,645；5,770,456；5,632,957；5,556,752；5,143,854；5,807,522；5,800,992；5,744,305；5,700,637；5,556,752；5,434,049；还例如，WO 99/51773；WO 99/09217；WO97/46313；WO 96/17958；还例如，Johnston(1998)Curr.Biol.8：R171-R174；Schummer(1997)Biotechinques 23：1087-1092；Kern(1997)Biotechniques23：120-124；Solinas-Toldo(1997)Genes，Chromosomes & Cancer 20：399-407；Bowtell(1999)Nature Genetics Supp.21：25-32。也参见出版的美国专利申请20010018642；20010019827；20010016322；20010014449；20010014448；20010012537；20010008765。

抗体和基于抗体的筛选方法

本发明提供了可与本发明的磷脂酶特异结合的分离出的或重组的抗体。这些抗体可用来分离、鉴定或定量本发明的磷脂酶或相关的多肽。这些抗体可以用于抑制本发明酶的活性。这些抗体可以用于分离与本发明那些物质相关的多肽，如，相关的磷脂酶。抗体可以用于免疫沉淀，染色(如FACS)、免疫亲和柱等等。如果需要的话，编码特异抗原的核酸序列可以通过免疫方法获得，随后分离出多肽或者核酸，进行扩增或者克隆，将多肽固定在本发明的阵列上。可供选择地，本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构，如，抗体的亲和性可以增加或者降低。而且，制备或者修饰抗体的能力可以是通过本发明的方法改造入细胞的表型。

免疫、产生或者分离抗体(多克隆的或者单克隆的)的方法是本领域技术人员所了解的，并且在科学和专利文献中有描述，参见，如，Coligan，CURRENTPROTOCOLS IN IMMUNOLOGY，Wiley/Greene，NY(1991)；Stites(eds.)BASICAND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications，Los Altos，CA(“Stites”)；Goding，MONOCLONAL ANTIBODIES：PRINCIPLES AND PRACTICE(第2版)Academic Press，New York，NY(1986)；Kohler(1975)Nature256：495；Harlow(1988)ANTIBODIES，A LABORATORY MANUAL，Cold SpringHarbor Publications，New York。除了使用动物的传统的体内方法外，抗体也可以在体外产生，例如，应用表达重组抗体结合位点的噬菌体展示文库。参见如，Hoogenboom(1997)Trends Biotechnol.15：62-70；Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26：27-45。

多肽可以用于产生可以特异性结合本发明多肽的抗体。得到的抗体可以用于免疫亲和层析方法中，来分离或者纯化多肽或者确定是否多肽存在于生物样品中。在这样的程序中，将蛋白制备物，如提取物，或者生物样品与能够特异性结合本发明的其中一个多肽的抗体相接触。

在免疫亲和程序中，将抗体附着于固体支持物，如珠或者其它的柱基质。在抗体特异性结合本发明多肽中的一个多肽的条件下，将蛋白制备物置于与抗体接触。洗涤去除非特异性结合的蛋白后，洗脱特异性结合的多肽。

在生物样品中的蛋白结合抗体的能力可以通过应用本领域技术人员熟悉的任何不同的方法来测定。例如，结合可以通过用可检测的标记如荧光试剂、酶标或者放射性同位素标记抗体来测定结合。可选择地，抗体与样品的结合可以应用其上具有这样的可检测标记的第二抗体来检测。特定的分析包ELISA分析、夹心法分析、放射免疫分析以及Western印迹。

产生的针对本发明多肽的多克隆抗体可以通过直接注射该多肽至动物中而得到，或者将该多肽施用动物例如，非人类动物而得到。这样得到的抗体随后结合于该多肽本身。以这样的方式，可以应用仅仅编码多肽片段的序列来产生可以结合整个天然多肽的抗体。这样的抗体随后可以用于从表达多肽的细胞中分离该多肽。

为了制备单克隆抗体，可使用可通过连续细胞系培养来产生抗体的任何技术。实例包括杂交瘤技术、trioma技术、人B-细胞杂交瘤技术和EBV-杂交瘤技术(参见例如Cole(1985)Monoclonal Antibodies and Cancer Therapy，Alan R.Liss，Inc.，pp.77-96)。

可以对产生单链抗体的技术(参见，如，美国专利编号4,946,778)进行调整，用于产生针对本发明多肽的单链抗体。可选择地，可以用转基因鼠来表达针对这些多肽或者其片段的人源化的抗体。

产生的针对本发明多肽的抗体可以用于从其它的生物体和样品中筛选类似的多肽。在这样的技术中，将来自该生物体的多肽与该抗体接触，检测特异性结合抗体的那些多肽。以上所述的任何程序可以用于检测抗体结合。

试剂盒

本发明提供了包括以下成分的试剂盒，如，核酸，表达盒，载体，细胞，多肽(如含有至少一种本发明的磷脂酶的试剂盒)和/或本发明的抗体(如含有至少一种本发明的抗体的试剂盒)。该试剂盒也可以含有指导性材料，来指导本发明的方法学和工业应用，正如在此所述。

本发明酶的工业和医学应用

本发明提供了使用本发明的多肽，例如磷脂酶和本发明的其他酶，例如磷脂酶A、B、C和D、patatins的许多工业应用和医学应用，包括转换不可水合的磷脂至水合形式、油脱胶，处理来自植物、鱼、藻类和类似物的油，在此仅仅指出了几种应用。在任何这些可选择的工业应用和医学应用中，酶可以以特定的顺序加入，例如具有不同的特异性的磷脂酶以特定顺序加入，例如首先加入具有PC-和PE-水解活性的酶(或加入两种酶，一种具有PC-水解活性，另一种具有PE-水解活性)，然后加入具有PI-水解活性(例如PLC活性)的酶，或其任何组合。

任何或所有本发明的方法可用于“加工级”，例如在约15,000；25,000；50,000；75,000或100,000lbs精炼油/天至约1、2、3、4、5或6百万或更多lbs精炼油/天级别上进行的油加工或精炼。

在工业应用中使用磷脂酶的方法是本领域所熟知的。例如，本发明的磷脂酶和方法可以用于处理脂肪和油，如，在日本专利申请公布H6-306386中所述，该申请描述了将存在于油和脂肪的磷脂转化为含有磷酸基团的水溶性物质。

本发明的磷脂酶可以用于处理植物油和磷脂，如那些来源于或者分离自米糠、大豆、油菜、棕榈、棉籽、玉米、棕榈仁、椰子、花生、芝麻、向日葵的植物油和磷脂。本发明的磷脂酶可以用于处理提炼油，如，那些来自果籽的油，如葡萄籽、杏仁、琉璃苣等。本发明的磷脂酶可以用于处理以不同形式存在的油和磷脂，包括粗制品形式、脱胶的、胶、洗涤水、黏土、硅石、皂脚和类似物。本发明的磷脂酶可以用于处理高磷含量的油、鱼油、动物油、植物油、藻类油和类似物。在本发明的任何方面，任何时候可以应用磷脂酶C，一种选择包括应用本发明的磷脂酶D和磷酸酶(如，应用PLD/磷酸酶的组合来提高高磷含量油如大豆豆油的产量)。

本发明的磷脂酶可以用于处理和制备食用油、生物柴油，用于药物学和化妆品的脂质体、结构磷脂和结构脂类。本发明的磷脂酶可以用于油提取。本发明的磷脂酶可以用于处理和制备各种肥皂。

加工食用油：产生1，3-二酰基甘油(1，3DAG)

本发明提供了使用本发明的酶(或多种酶)来制备1，3-二酰基甘油(1，3DAG)的工艺。在一个方面，磷脂酶C或磷脂酶D加磷酸酶产生1，2-二酰基甘油；这提高了在食用油精炼期间的油产量。当用于包括碱中和步骤的工艺时，例如作为碱精炼助剂，多达70％的1，2-二酰基甘油(1，2DAG)进行了酰基转移，被转化为1，3-DAG。1，3-DAG具有增加的健康益处，因此使用PLC作为碱炼助剂产生具有增加的营养价值的油。

本发明提供了使用本发明的酶(或多种酶)制备和加工食用油的工艺，包括产生具有增加数量的1，3-DAG的食用油。二酰基甘油是许多食用油中天然存在的化合物。在本发明方法，例如油脱胶工艺的一个方面，碱(苛性碱)引起PLC产生的1，2-DAG异构化成1，3-DAG，其提供超过1，2-DAG的营养健康价值，例如1，3-DAG作为能量被燃烧掉，而不是作为脂肪被储存起来(1，2-DAG则是这样)。通过在碱炼工艺开始时加入PLC(酸和碱随后)，本发明的方法产生提高水平的1，3-DAG(减少1，2-DAG)。从营养角度看，1，3-DAG优于1，2-DAG。在可选择的方面，本发明包括使用本发明的PLC的油脱胶工艺，从而产生含有不少于0.5％、1.0％、2.0％或3.0％或更多1，3-DAG的最终脱胶的油产物。

因此，本发明提供(通过酯交换作用)制备精炼油(例如二酰基甘油)——包括食用油——的工艺，其含有增加水平的1，3-二酰基甘油(1，3-DAG)，如在实施例13中所示，其中磷脂酶，诸如本发明的酶，是“前期加载型的(front-loaded)”，或在加入酸或者碱之前加入。由甘油三酯的酶促水解产生DAG，通过异构化由1，2DAG产生1，3DAG。相比传统的食用油，含有1，3DAG的食用油显示出不同的代谢效应。1，3DAG和1，2DAG或甘油三酯之间代谢途经的差异使得较大部分的来自1，3二酰基甘油的脂肪酸作为能源被燃烧掉，而不是作为脂肪储存起来。临床研究已经显示，经常食用DAG油作为明智膳食(sensible diet)的一部分，能帮助个体控制他们的体重和体内脂肪。此外，1，3DAG的代谢减少血流中循环的餐后甘油三酯。因为肥胖和增高的血脂是与慢性疾病包括心血管疾病和II型糖尿病相关的危险因素，这些与生活方式相关的健康状况可以受到有规律的消耗DAG油这样的有益方式的影响。

可以通过各种方法食用含DAG的油。因此，在一个方面，本发明提供使用本发明的酶制备食物的工艺，食物例如具有增加水平的1，3-DAG二酰基甘油的焙烤食物，和含有二酰基甘油油的焙烤食物。在一个方面，焙烤食物是饼干、蛋糕和类似的焙烤食物。

在可选择的实施方案中，可以用于本发明方法，包括食用油加工方法的酶的组合包括(其中在该组合中的一种、若干种或所有酶包含本发明的酶)：

。PLC+PI-PLC+PLA(PLC反应完成后加入PLA)；

。PLD+磷酸酶+PI-PLC，然后加入PLA；或

。PLC或(PLC+PI-PLC)+PLA，对磷脂酸具有特异性(所有的酶同时或依次加入)。

油脱胶和植物油的处理

本发明的酶(例如具有脂酶、磷脂酶、酯酶和/或糖苷酶或等同活性的多肽)可以用于各种植物油加工步骤中，诸如用于植物油提取，特别地，用于在称为“油脱胶”的工艺中除去“磷脂胶”。

本发明的这些工艺可用于“加工级”，例如在约15,000；25,000；50,000；75,000或100,000lbs精炼的油/天至约1、2、3、4、5或6百万或更多lbs精炼的油/天的级别上。

在一个方面，本发明提供了油脱胶的方法，该方法包括使用本发明的磷脂酶，例如本发明的PLC。在一个方面，该方法还包括添加另一磷脂酶(其也可以是本发明的磷脂酶)，例如本发明的其他PLC、PLA、PLB、PLB或patatin或具有溶血磷脂酶-转酰基酶(LPTA)活性或溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)或它们的组合的酶，和/或patatin样磷脂酶(其也可以是本发明的酶)。在一个方面，所有酶一起加入，或可选择地，酶以特定的顺序加入，例如加入PLC后加入PLA和/或patatin；或者首先加入具有PC和PE活性的酶或许多酶，然后加入PI PLC。

在一个方面，因磷脂酶(例如，本发明的PLC)处理的结果，该过程使得产量提高。在一个方面，因磷脂酶(例如，本发明的PLA)处理的结果，该过程使得油中的磷含量额外地减少。

在一个方面，本发明提供了这样的工艺，包括使用本发明的磷脂酶，例如本发明的PLC来减少胶的量并通过减少油被捕获的数量来增加中性油(甘油三酯)产量。在一个方面，本发明提供这样的工艺，包括使用本发明的磷脂酶，例如本发明的PLC来增加中性油和二酰甘油(DAG)的产量，以增加油相。在可选择的方面，本发明的方法(例如脱胶方法)可以包含一种或多种其他的酶，诸如蛋白酶、淀粉酶、角质酶、另一磷脂酶(包括例如本发明的酶)、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳糖酶、木聚糖酶、氧化酶，例如乳糖酶和/或过氧化物酶或具有等同活性的多肽，或其组合。

本发明的磷脂酶可以用于各种植物油处理步骤，如在植物油的提取中，特别地，用于在上述称为“油脱胶”的过程中去除“磷脂胶”。本发明提供了用于处理不同来源的植物油的方法，所述来源如米糠、大豆、油菜、花生和其它的果实、芝麻、向日葵、棕榈和玉米。该方法可以与基于用如己烷提取的工艺联合，随后将粗提取物精炼成食用油，其中包括使用本发明酶和方法。精炼顺序的第一步骤是所谓的“脱胶”过程，其用于通过加入水来分离磷脂。分离通过脱胶沉淀的物质，并且进一步处理成卵磷脂混合物。商业上应用的卵磷脂，如大豆卵磷脂和向日葵卵磷脂，是半固体的或者是非常粘稠的物质。它们是由极性脂类和油的混合物组成，其中，极性脂类主要是磷脂，油主要是甘油三酯。

本发明的磷脂酶可以用于任何“脱胶”过程，包括水脱胶、ALCON油脱胶(如，用于大豆)、safinco脱胶、“超脱胶”、UF脱胶、TOP脱胶、单脱胶 (uni-degumming)、干法脱胶和ENZYMAX^TM脱胶。参见，美国专利6,355,693；6,162,623；6,103,505；6,001,640；5,558,781；5,264,367。本发明方法整合的各种脱胶过程描述于Bockisch，M.(1998)In Fats and Oils Handbook，The extraction ofVegetable Oils(Chapter 5)，345～445，AOCS Press，Champaign，Illinois。本发明的磷脂酶可以用于甘油三酸酯油的酶促脱胶的工业应用，如在EP 513 709中所述。

在一个方面，本发明的磷脂酶用于处理植物油，例如粗油，诸如米糠、大豆、油菜、花和类似物。在一个方面，这提高脱胶工艺的效率。在一个方面，本发明提供了在低水条件下进行酶脱胶的方法，例如在约0.1％至20％水，或0.5％至10％水的范围内。在一个方面，这提高了在离心期间，重相从油相的分离水平。对这些相提高的分离水平能够导致磷脂更有效地从油中去除，包括可水合的和不可水合的油。在一个方面，这能够产生含有较少捕获的中性油(甘油三酯)的胶组分，从而提高脱胶工艺期间的总油产量。

在一个方面，本发明的磷脂酶，例如具有PLC活性的多肽用于处理油(例如植物油，例如粗油，诸如米糠、大豆、油菜、花和类似物)，例如用于脱胶工艺，以减少胶量和通过减少油捕获而增加中性油含量。在一个方面，本发明的磷脂酶，例如具有PLC活性的多肽，用于生产二酰甘油(DAG)和用于增加油相。

本发明的磷脂酶可以用于酶促脱胶的工业应用，如，在CA1102795中所述，其描述了通过加入至少50％重量百分比的水从谷物脂类中分离极性脂类的方法。以其应用的原理是加入水到粗油混合物的角度来看，该方法是经过改良的脱胶过程。

一方面，本发明提供了酶促过程，包括应用本发明磷脂酶(如，PLC)，包括水解在油中的水合磷脂，温度为约20℃到40℃，碱性pH，如pH为大约pH8到pH10，反应时间为大约3到10分钟。这可以导致油中的最终磷水平少于10ppm。本发明也提供了酶促过程，包括应用本发明磷脂酶(如，PLC)，包括水解油中可水合的和不可水合的磷脂，温度大约50℃到60℃，pH值略低于中性，例如大约pH5到pH6.5，反应时间为大约30到60分钟的条件下。这可以导致油中的最终磷水平少于10ppm。

在一方面，本发明提供了酶促过程，该过程利用磷脂酶C酶水解甘油磷酸酯键，从而使得能将磷脂中的二酰甘油部分返回到油中，如植物油、鱼油或者藻类的油(“磷脂酶C(PLC)苛性碱精炼助剂”)；和，在脱胶步骤中将磷脂含量减少至对于待物理精炼的高磷油足够低的水平(磷脂酶C(PLC)脱胶助剂”)。这两种方法能够产生不同价值并且具有不同的目标应用。

在本发明各种示例性过程中，很多不同的步骤组成了核心的漂白和脱臭精炼过程之前的脱胶过程。这些步骤包括，加热、混合、维持、分离和干燥。在加热步骤以后，加入水，常常是酸，并且混合，以便使得不溶性的磷脂“胶”凝聚成可以被分离的颗粒。虽然在脱胶过程中水分离很多磷脂，但是部分磷脂是以钙盐或者镁盐的形式存在的不可水合的磷脂(NHPs)。脱胶过程通过加入酸处理这些NHPs。在磷脂水合以后，油被混合，维持并且通过离心分离。最后，将油干燥并且贮存、运输或者精炼，如图6所示。得到的胶既可以进一步处理以获得卵磷脂产物，也可以加回到食物中。

在本发明各种示例性工艺中，磷的水平被降到低至对于物理精炼足够低。与苛性碱精炼相比，该分离过程可能导致潜在更高的产量损失。此外，脱胶过程可能产生不能以商业卵磷脂出售的废物，参见，例如图7，图7是物理精炼油的示例性的脱胶过程。因此，这些过程并没有取得显著的市场份额，碱精炼过程继续统治着米糠、大豆、油菜和向日葵工业。然而，注意，用于特殊脱胶过程的磷脂酶C酶将降低胶的形成，并且将磷脂中的甘油二酯部分返回到油中。

在一个方面，本发明提供了在胶组分中使用本发明的PLC的方法。在该方法的一个方面，将油加入到粗油中，以产生乳状液，这导致磷脂酰胆碱、磷脂酰乙醇胺和磷脂酰肌醇移入水相(水脱胶)。离心之后，这些磷脂是含水胶组分的主要组分。胶组分中的磷脂可以用磷脂酶C或磷脂酶D加磷酸酶(或其他组合，参见下面描述)处理，以产生二酰甘油(DAG)和磷酸酯。在此时，DAG可以从其他胶组分中提取出来，并在适合于对DAG进行转酯作用的条件下用脂酶处理，产生期望的三酰甘油(结构性类脂)。

在另一方面，利用在PLC反应后例如通过加入碱增加胶的pH，大部分的1，2-DAG可以被转化为1，3-DAG。1，3-DAG然后可以从胶中提取出来，并在合适的条件下与脂酶反应，以在sn2位置对1，3-DAG进行转酯作用，从而产生期望的结构性三酰甘油。

在可选择的方面，用于转酯反应的脂肪酸，可以来自各种来源，包括粗油中发现的游离脂肪酸。

在一个方面，来自水脱胶的磷脂与本发明的PLC组合使用，产生结构性类脂。水脱胶的油可以暴露于PLC和/或PLD(其中之一或两者可以是本发明的酶)加磷酸酶或这些组合中的其中一种，然后暴露于PLA(可以是本发明的酶)，以将磷减少至适合于碱或物理精炼的水平。

在可选择的实施方案中，可以用于本发明方法包括这些脱胶工艺的酶的组合包括(其中该组合中的一种、若干种或所有酶包含本发明的酶)：

。PLC+PI-PLC+PLA(PLC反应完成后加入PLA)；

。PLD+磷酸酶+PI-PLC，然后加入PLA；或

碱法精炼(caustic refining)

本发明提供了在碱炼中使用磷脂酶(包括本发明的酶)的过程，其中酶被用作碱炼助剂。在可选择的方面，PLC或PLD和/或磷酸酶用于滴加的过程，既可以在碱法中和精炼过程(既可以连续精炼也可以间歇精炼)之前，期间，或者之后。加入的酶量可以根据工艺来变化。用于本工艺的水的水平可以是低水平的，例如约0.5到5％。可选择地，通过多次，将苛性碱加入至该工艺中。此外，该过程可以在不同的温度下(25℃到70℃)，不同的酸或碱条件下，并且在变化的pH值(4到12)下进行。可以使用浓的碱溶液，例如比11％的工业标准浓度更大，以减少胶的量。在可选的方面，浓的碱溶液浓度在约12％至50％之间，例如约20％、30％、40％、50％或60％或更浓。

在一方面，本发明的磷脂酶C在甘油磷酸酯键处水解磷脂，产生甘油二酯和水溶性的磷酸化合物。水解的磷脂进入到水相，而甘油二酯留在油相中，如在图8所说明的。PLC“碱炼助剂”的一个目的是将在中和过程中形成的磷脂胶转化为二酰甘油，二酰甘油将又转移回到油相。相反地，“PLC脱胶助剂”的一个目的是将粗油中的磷脂降低为少于百万分之十(10ppm)的磷当量。

可以用于碱炼过程的酸，包括但是并不限于，磷酸、柠檬酸、抗坏血酸、磺酸、反丁烯二酸、顺丁烯二酸、盐酸和/或乙酸。酸被用于水合不可水合的磷脂。可以应用的碱包括但不限于，KOH和NaOH。碱被用于中和游离脂肪酸。可选择地，磷脂酶，或者更特别地，PLC或者PLD和磷酸酶，用于从胶/皂脚中纯化植物固醇。

在碱炼前加入磷脂酶的本发明的可选择的实施方案是在植物中表达磷脂酶。在另一个实施方案中，在压碎植物、种籽或者其它的植物部分期间加入磷脂酶。可选择地，在压碎后，但是在精炼前(即是在容器中)加入磷脂酶。此外，在有酸或无酸的条件下，加入磷脂酶作为精炼预处理。

已经描述过的本发明的另一个实施方案，是在碱炼过程期间加入磷脂酶。在这一过程，酸和碱的水平依赖于磷的水平和游离脂肪酸的水平而变化。此外，该过程使用宽的温度和pH范围，这依赖于所应用的酶的种类。

在本发明的另一个实施方案中，磷脂酶在碱炼后加入(图9)。在一个例子中，在分离前，磷脂酶加入到强力混合器(intense mixer)或者滞留混合器(retention mixer)。可选择地，磷脂酶在加热步骤后加入。在另一个实施方案，磷脂酶在离心步骤中加入。在额外的实施方案中，磷脂酶加入到皂脚中。可选择地，磷脂酶加入到洗涤水中。在另一个例子中，磷脂酶在漂白和/或脱臭步骤中加入。

在一个方面，在漂白和脱臭之前，磷脂酶，例如磷脂酶C，本发明的酶将水解中和过的粗的和脱胶的油中水合和非水合磷脂的磷脂。本发明的示例性的“碱炼”工艺在图9和图13中示出。图9包括静态混合器(static mixer)的示例性时间、温度和pH(30至60分钟、50至60℃，pH 5至6.5)和滞留时间(3至10分钟，20-40℃)。

目标酶可以作为滴加物(drop-in product)应用于现有的碱法中和工艺中，如在图9中所示。在该方面，如果酶在加入碱之后加入，酶将不必经受极端的pH水平。如图13(酶“前载型”示例性工艺)所示，任何磷脂酶，包括本发明的磷脂酶，诸如PLC、PLB、PLA和/或PLC都可以用于粗油脱胶工艺，如Bailey′s Industrial Oil & FatProducts v.4(ed.Y.H.Hui)中所述。图14和图15示出了本发明方法的变化，其中两个或三个离心步骤分别用于所述工艺中，其可以用于加工任何油，例如植物油，诸如粗的大豆油，如图中所示。图15的示例性方法在碱炼之前具有离心步骤(除了碱炼之后和水洗之前，和水洗之后的离心步骤)，而图14的示例性方法在碱炼之前并没有离心步骤。图16示出了该工艺的另一示例性变化，其使用酸处理并在脱胶步骤之前有离心步骤；该示例性工艺用于处理任何油，例如植物油诸如粗的豆油，如图所示。

一方面，本发明的磷脂酶使得磷除至低到物理精炼可接受的水平。一方面，本发明的PLC将在漂白和脱臭前，水解来自粗油中水合和非水合磷脂的磷脂。在目前的脱胶操作中，靶酶可以作为点滴形式的产品应用，参见例如图10。假如在商业设备中为亚最佳状态的混合，很可能需要酸来引起非水合的磷脂与酶在油/水的界面上接触。因此，一方面，应用本发明的酸稳定性PLC。

一方面，本发明的PLC脱胶助剂工艺可以减少表2中示出的一个或者所有三个项目的损失。在PLC过程中相关的损失，以质量为基础计算，据估计可以为大约0.8％，相对地，由于磷脂的去除，则为5.2％。

表2：由PLC产品所致的损失

	碱炼助剂	脱胶助剂
			1)胶形成和分离中的油损失2.1％	X	X
2)在加入苛性碱中皂化的油3.1％		X
			3)在漂白中黏土中捕获的油^*＜1.0％	X	X
总产量损失～5.2％	～2.1％	～5.2％

本发明该过程的另外潜在的益处包括如下：

◆减少的吸附剂—对较低水平(＜5ppm)的磷，需要较少的吸附剂

◆较低的化学剂用量—与非水合磷脂的水合作用相关的化学剂和工艺成本较少

◆较低的废物产生—需要较少的水来从油中去除磷

通过本发明的方法(如“脱胶”)处理的油包括植物油种籽，如，大豆油、油菜籽油、米糠油和向日葵油。一方面，本发明的“PLC碱炼助剂”可以比目前的碱炼工艺节约1.2％。精炼助剂应用用于豆油，该豆油已经针对卵磷脂进行脱胶，并且这些也从值/加载计算中扣除。

本发明工艺的执行目标可以根据应用而变化，并且更特异地，根据酶加入的点而变化，参见表3。

表3应用的执行目标

可以应用本发明磷脂酶，如，磷脂酶A1的其它工艺可以将非水合的天然磷脂转化为至水合的形式。一方面，该酶对热敏感。因为对油加热可以破坏酶，这可能是需要的。然而，脱胶反应必须调节为pH 4-5以及60℃来适应该酶。在300个单位/kg的油饱和剂量时，该示例性工艺的成功之处在于将以前的水脱胶油的磷含量降至≤10ppm P。优点可以是减少的H₂O含量，而且在应用、处理和废物中所导致的节约。表4列出了本发明酶的示例性的工业应用：

表4：示例性应用

	碱炼助剂	脱胶助剂
			豆油/卵磷脂产生	X
化学精炼的豆油、向日葵油、油菜油	X	X
			低磷脂油(如，棕榈)		X

[0561] 除了这些不同的“脱胶“工艺，本发明的磷脂酶可以用于任何的植物油处理步骤。例如，在任何植物油的处理步骤中，本发明的磷脂酶可以用于替代PLA，如磷脂酶A2。用本发明的方法“处理”或者“脱胶”的油包括大豆油、油菜籽油、玉米油、来自棕榈仁的油、油菜油、向日葵油、芝麻油、花生油、米糠油和类似油。该工艺的主要产物包括甘油三酯。

在一种示例性工艺中，当酶加入到粗制油，并且与粗制油反应时，每1kg的粗制油所应用的磷脂酶的量为约10-10,000单位，或者，可选择地，约100-2,000单位。酶处理进行5分钟到10个小时，温度为30℃到90℃，或者，可选择地，约40℃到70℃。条件可以依赖于酶的最适温度而变化。加入用于溶解酶的水的量为，每100重量份的粗制油使用5-1,000重量份的水，或者可选择地，大约每100重量份的粗制油使用大约10到200重量份的水。

一旦这样的酶处理过程完成后，用合适的方式，如离心分离器分离酶液体，并得到经处理的油。以这样的工艺对胶状物进行酶分解所产生的含磷化合物实际上全部被转移到水相，并且从油相中去除。一旦酶处理完成后，如果需要，处理的油可以另外用水或者有机或者无机酸洗涤，如乙酸、柠檬酸、磷酸、琥珀酸和等同的酸，或用盐溶液洗涤。

在超滤脱胶的一个示例性过程中，在过滤前，将酶结合于过滤器，或者将酶加入到油中，或定时用酶清洗过滤器。

在磷脂酶介导的物理精炼助剂的示例性工艺中，将水和酶加入到粗制油中(例如粗植物油)。一方面，本发明的PLC或者PLD以及磷酸酶用于该工艺中。在磷脂酶介导的物理精炼中，水可以是低水平的，即0.5-5％，处理时间应当短(少于2小时，或者少于60分钟，或者少于30分钟，或者少于15分钟，或者少于5分钟)。该工艺可以在不同的pH(如，3-10)，不同的温度(25℃到70℃)下，应用不同的酸和/或碱进行。

在可选择的方面，水脱胶首先进行，通过离心收集卵磷脂，然后加入本发明的PLC或PLC和PLA以去除非水合的磷脂(该工艺应当在低的水浓度下进行)。另一方面，对粗制油进行水脱胶至低于10ppm(食用油)，随后进行物理精炼(对于生物柴油低于50ppm)。一方面，加入乳化剂，和/或将粗制油置于强力混合器中促进混合。可选择地，加入破乳剂，和/或对粗制油加热来促进水相的分离。另一方面，加入酸来促进非水合磷脂的水合。另外地，磷脂酶可以用于介导从胶/皂脚中纯化植物固醇。

在一个方面，本发明提供了用于油脱胶的组合物和方法(其可以包括使用本发明的磷脂酶)，包括使用变化数量的酸和碱，而不制备皂脚。使用本发明油脱胶的这一方面，酸(包括磷酸和/或柠檬酸)可以用于水合高磷含量油(包括大豆、油菜和向日葵)中的非水合的磷脂。一旦磷脂被水合，加入碱，可以提高水相的pH：加入的碱的量可以为酶活性产生有利的pH，但不会导致在油中形成显著的皂脚组分。因为不形成皂脚，油中的游离脂肪酸可以在下游除去，这发生在脱胶步骤之后，漂白和脱臭期间。

本发明的酶可用于改进油提取和油脱胶效果(例如植物油)。在一个方面，本发明的PLC和至少一种植物细胞壁降解剂(例如纤维素酶、半纤维素酶或类似物，以使细胞壁柔软并增加提取时的产量)被用于本发明的工艺中。在该使用本发明的酶以改进油提取和油脱胶的示例性方法中，本发明的磷脂酶C以及其他水解酶(例如纤维素酶、半纤维素酶、酯酶、蛋白酶和/或磷酸酶)用于与油生产(包括但是不限于大豆、油菜、向日葵、米糠油)相关的破碎步骤期间。通过在溶剂提取之前使用酶，或代替溶剂提取，有可能增加油产量和减少粗油中水合和非水合的磷脂的数量。非水合磷脂的减少可以归因于在与钙或镁络合之前，潜在的非水合磷脂转化为二酰甘油和相应的磷酸酯。粗油中磷脂总的减少量将提高精炼期间的产量，并有可能无需在漂白和脱臭之前独立的脱胶步骤。

在一个方面，本发明提供了将本发明的磷脂酶(例如本发明的磷脂酶-特异性磷酸水解酶)或另一磷脂酶用于修改的“有机精炼过程”的工艺，其可以包括将酶(例如PLC)加入盛有柠檬酸的桶中。

本发明的酶可以用于任何油处理方法，如，脱胶或等同的工艺。例如，本发明的酶可以用于美国专利5,558,781；5,264,367；6,001,640所描述的工艺中。USPN5,558,781所描述的工艺应用磷脂酶A1，A2或B，实质上降解了油中的卵磷脂，其作为乳化剂发挥作用。

通过应用本发明的磷脂酶，如具有磷脂酶A和/或B活性的多肽，本发明的酶和方法可以用于旨在减少包含高含量非水合磷的食用油中的含磷组分的过程中，如在EP专利号：EP 0869167中所述。一方面，食用油是粗制油，所谓的“非-脱胶油”。一方面，该方法处理非脱胶油，包括压榨油或者提取油，或者其混合物，它们来自，例如油菜籽、大豆、芝麻、花生、玉米、米糠或向日葵。在粗制油中，磷脂含量可以从0.5到3％w/w之间变化，对应于磷含量的范围为200到1200ppm，或者在250到1200ppm范围内。除了磷脂，粗制油也可以含有低浓度的碳水化合物、糖化合物，和Ca、Mg和Fe的金属/磷脂酸复合物。一方面，工艺包括用本发明的磷脂酶处理磷脂或者溶血磷脂，以便水解脂肪酰基基团。一方面，磷脂或者溶血磷脂包括卵磷脂或者溶血卵磷脂。本工艺的一方面，食用油具有的磷含量为在大约50到250ppm之间，而且该工艺包括用本发明的磷脂酶处理油，以便水解大部分的磷脂，并且从油中分离含有水解的磷脂的水相。一方面，酶法脱胶过程之前，对油进行水脱胶。一方面，该方法生产动物饲料，所述生产包括将本发明磷脂酶与饲料物质以及至少一种磷脂混合。

本发明的酶和方法可以用于油脱胶过程，正如在WO 98/18912所描述的。本发明的磷脂酶可以降低食用油中的磷脂含量。该工艺可以包括用本发明的磷脂酶处理油，来水解大部分的磷脂，并且从油中分离含有水解的磷脂的水相。该工艺可以用于纯化含有磷脂的任何食用油，如，植物油，例如大豆油、米糠油、油菜籽油和向日葵油、鱼油，藻类油和动物油和类似油。在用酶处理以前，植物油优选地进行预处理，例如通过湿法精炼去除粘质(黏液)。在开始用磷脂酶处理之时，该油可能含有约50-250ppm的磷，或约50至约1500ppm的磷，或更多的磷，如磷脂，并且本发明的工艺可以将该值降低到约5-10ppm以下。

本发明的酶可以用于如1993年4月25日提交的日本申请H5-132283所述的工艺，该日本申请包括纯化油和脂肪的工艺，该工艺包括步骤：将油和脂肪中的磷脂转化为含磷酸基团的水溶性物质，并且作为水溶性物质去除它们。酶的作用是用于转化成水溶性物质。优选使用的酶是具有磷脂酶C活性的酶。

本发明的酶可以用于如“Organic Refining Process，”(ORP)(IPH，Omaha，NE)所述的工艺，其是精炼种子油的一种方法。ORP可能具有优于传统化学精炼的优点，包括提高的精油产量、增值的副产品、较低的资金成本和更低的环境成本。

本发明的酶可以用于处理油或脂肪，动物或者植物的，未加工的、半加工的或者精炼的油或脂肪的工艺，包括将本发明的至少一种酶加入到这样的油或者脂肪中，该酶能够水解和/或解聚在油中含有的非甘油酯化合物，例如EP申请号：82870032.8所述。本发明用于水解和/或解聚在油中含有的非甘油酯化合物的示例性方法为：

1)在油和脂肪中，加入之前溶解于少量合适溶剂(例如，水)中的本发明的酶或者酶复合物，并混合。大量的溶剂是可能的，但是选择对该酶无毒性的和适合的溶剂。这一加入可以在逐次加载的工艺中进行，也可以在连续的工艺中进行。按照该工艺，加入到油和脂肪中所必需的酶量的范围可以依赖于酶以及待处理的产物，范围从约5到400ppm，或约约20到400ppm；例如，对于1000kg的油或者脂肪0.005kg至0.4kg的酶，并且优选地5到100ppm，即，对于1000kg的油从0.005kg到0.1kg的酶，这些值应该理解为对于浓缩的酶而言，即没有稀释剂或者溶剂。

2)使油或者脂肪通过固体或者半固体支持物上的本发明酶组成的固定的或者不溶性过滤床，支持物优选呈现多孔的或者纤维性结构。在这一技术中，酶被捕获于支持物的多孔或者纤维结构的微孔中。这些由例如，树脂或合成的多聚物，纤维素碳酸盐，凝胶如琼脂糖，具有多孔结构的多聚物或共聚物的丝构成，从而将处于溶液中的酶的小液滴捕获在它们的微孔中。关于酶的浓度，有可能达到支持物的饱和水平。

3)以微小的液滴形式，将油和脂肪分散在稀释的酶溶液中，在可选择的方面，含有约0.05到4％，或含有约0.2到4％体积的本发明的酶。这一技术描述在例如比利时专利595,219中。具有圆锥形的盖子的几米高的圆柱形柱子充满了稀释的酶溶液。对于这一目的，选择在待处理的油或者脂肪中无毒和不可溶混的溶剂，优选水。柱子的底部装配了分配系统，在其中，油或者脂肪以极端分割的形式(每m²大约10,000流量)连续注入。这样形成无数的油或者脂肪的液滴，液滴在酶溶液中缓慢地升高并且碰到表面，从而在反应器的圆锥形盖子的顶部被连续排出。

棕榈油可以在用本发明酶处理前进行预处理。例如，将大约30kg的未处理的棕榈油加热到+50℃。在蒸馏水中制备具有纤维素酶和果胶酶的1％溶液。在强烈搅拌几分钟下，将这些中的每一个以600g加入到油的水相溶液中。然后，在中度搅拌的条件下，将油保持在+50℃，总反应时间是两个小时。然后，将温度升高到+90℃，以使酶失活，并制备用于过滤和进一步处理的混合物。将油在真空中干燥，并使用过滤助剂进行过滤。

本发明的酶可以用在如EP专利EP 0 513 709 B2所述的工艺中。例如，本发明提供了通过使用本发明的磷脂酶的酶促分解作用，减少动物和植物油中的含磷成分的含量的工艺。在可选择的方面，将磷含量为约50至1500ppm，或约50至250ppm的预先除去粘液的动物和植物油与有机羧酸混合搅拌，并将所得到的混合物的pH值设定为约pH 4至pH 6，将含有本发明的磷脂酶A₁、A₂或者B的酶溶液被加入到该混合物中，在混合容器中，通过强力搅拌，形成微小的液滴，在其中，形成相对于油的重量百分比为0.5到5％的乳状液，所述的乳化作用的进行通过至少一个后续的反应容器，在涡旋运动下，在反应时间为从0.1到10个小时下，在温度的范围为20℃到80℃下进行，当从含水溶液中分离后，处理的油具有的磷含量在5ppm以下。

有机精炼工艺可以用于粗制油和脱胶油。该工艺在控制的工艺条件下，应用在线方式加入有机酸，并与传统的离心分离相结合。从植物油磷脂(“VOP”)自然分离的水被再循环，并再次使用。有机精炼工艺的结果为，总的水用量可以大大降低。

本发明的磷脂酶和方法也可以用于酶法处理食用油，如在美国专利6,162,623中所述。在这一示例性的方法中，本发明提供了两亲性的酶。该酶可以固定化，如，通过制备含有连续疏水相以及含有酶以及酶载剂的分散水相的乳状液，并且从分散相中去除水，直到该相变成固体酶包被的颗粒。该酶可以是脂酶。固定的脂酶可以用于由脂酶催化的反应，如甘油一酯、甘油二酯或者甘油三酯的分子内酯化作用，或者当脂酶是磷脂酶时，从甘油三酯油去除磷脂。水相可以含有发酵液，可食用的甘油三酯油可以是疏水相，载剂包括糖类、淀粉、葡聚糖、水溶性纤维素衍生物和发酵残余物。这一示例性的方法可以用于处理甘油三酯、甘油二酯、甘油单酯、甘油、磷脂、糖脂或脂肪酸，它们可以存在于疏水相中。在一方面，用于去除甘油三酯油中的磷脂的工艺包括，混合含有磷脂的甘油三酯油与含有本发明磷脂酶的制备物；将磷脂水解为溶血磷脂；从油中分离水解的磷脂，其中磷脂酶是固定化的磷脂酶。

本发明的磷脂酶和方法也可以应用于用酶法处理食用油，如在美国专利号6,127,137中所述。这一示例性方法水解完整磷脂的两个脂酰基团。用于该示例性方法的本发明的磷脂酶没有脂酶活性，并且其在很低的pH下具有活性。这些特征使其非常适于油脱胶，这是因为油的酶法和碱法水解(皂化作用)可能均受到抑制。在一方面，本发明提供水解磷脂或者溶血磷脂中的脂酰基团的工艺，包括用磷脂酶处理磷脂或者溶血磷脂，所述磷脂酶水解磷脂中的两个脂酰基团并且基本上无脂酶活性的。一方面，本发明的磷脂酶的最佳作用温度为约50℃，测定的条件是在pH 3到pH 4下进行10分钟，并且最佳pH为大约pH 3，测定的条件是在40℃下进行10分钟。一方面，磷脂或者溶血磷脂包括卵磷脂，或者溶血卵磷脂。一方面，在大部分的磷脂水解后，从油中分离含有水解的磷脂的水相。一方面，本发明提供了工艺，用于从食用油中去除磷脂，包括用本发明磷脂酶的水溶液的分散体，在pH 1.5至pH 3下处理油，并从油中分离含有水解的磷脂的水相。一方面，在用磷脂酶处理前，处理油以除去粘质。一方面，在用磷脂酶处理前，该油含有磷脂，其量相当于50到250ppm的磷。一方面，在存在0.5到5％的水的条件下，在30℃到45℃，用磷脂酶处理1到12个小时，磷脂酶的剂量为0.1到10mg/l。

本发明的磷脂酶和方法也可以用于用酶解处理食用油，如在美国专利号6,025,171中所述。在这一示例性的方法中，本发明的酶是固定化的，通过制备含有连续疏水相的乳状液，如甘油三酯油，和含有两亲性酶的分散水相，如本发明的脂酶或者磷脂酶，和在水相中部分溶解和部分不溶解的载剂物质，并且从水相中去除水，一直到该相变为固体酶包被的载剂颗粒。因为水相已经用水溶性物质饱和了，载剂物质的非溶解部分可以是在水和油中不溶的物质，或者一种以未溶解形式存在的水溶性物质。水相可以用含有发酵残留物和生物物质的粗制脂酶发酵液形成，它们可以作为载剂物质。固定的脂酶可以用于油中的酯重排和脱酸化。反应后，固定的酶可以通过加入水再生，用于以后的反应，并且得到载剂的部分溶解，且所形成的含有酶和载剂的水相分散到疏水相中，通过该疏水相蒸发除水，又一次形成酶包被的载剂颗粒。

本发明的磷脂酶和方法也可以用酶解处理食用油，如在美国专利号6,143,545中所述。该示例性方法应用本发明的磷脂酶来降低在食用油中含磷组分的含量，该食用油中包括高含量的非水合磷。一方面，该方法用于降低食用油中的含磷组分的含量，油中含有非水合磷的含量为至少50ppm，通过预处理食用油，在60℃测定，通过加入含有柠檬酸单水合物的水溶液(加入的水对油为4.8％w/w；在水相中的(柠檬酸)＝106mM，在水/油乳剂中的＝4.6mM)维持30分钟；转移10ml的在油乳状液中的预处理水至试管中；在沸水浴中加热乳状液30分钟；在5000rpm离心10分钟，转移大约8ml的上层(油)相至新的试管中，并且放置24小时；从上清相中取2克，用于测定在食用油中的非水合磷的含量(ppm)。该方法也可以包括在从大约pH 5到8的pH条件下，让油接触本发明的磷脂酶A 或者B的水溶液(如，PLA1、PLA2或PLB)，该溶液在油中进行乳化，直到油的含磷量下降到小于11ppm，然后从处理的油中分离含水相。

本发明的磷脂酶和方法也可以用于酶法处理食用油，如在美国专利5,532,163中所述。本发明提供精炼油和脂肪的工艺，通过该工艺，待处理的油和脂肪中的磷脂可以被有效地分解和去除。一方面，本发明提供精炼油和脂肪的工艺，包括，在乳状液中，使油和脂肪与本发明的酶反应，例如，与具有分解甘油磷脂中甘油-脂肪酸酯键的活性的酶(如，本发明的PLA2)反应；也提供了另一个工艺，其中用酶处理的油和脂肪用水或者酸性水溶液洗涤。一方面，用于洗涤步骤的酸性水溶液是至少一种酸的溶液，如，柠檬酸、乙酸、磷酸以及它们的盐。一方面，乳化条件为每100重量份数的油和脂肪应用30重量份数或者更多的水。因为油和脂肪可以不用传统的碱法精炼步骤来纯化，所以可以减少洗涤废水和工业废物的产生。此外，由于归因于它们被包括在这些废物中所致的天然油和脂肪的损失并不在本发明的工艺中发生，所以油的回收产量增加。一方面，本发明提供了用于精炼含有大约100到10,000ppm的磷脂的油和脂肪的工艺，包括：在乳化的条件下，将所述的油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸酯键活性的本发明的酶进行反应。一方面，本发明提供了用于精炼含有大约100到10,000ppm的磷脂的油和脂肪的工艺，包括：在乳化的条件下，将所述的油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸酯键活性的本发明的酶反应；并且随后用洗涤水清洗处理的油和脂肪。

本发明的磷脂酶和方法也可以用于酶法处理食用油，例如，在美国专利号5,264,367中所述。可食用植物油或动物油，如油，例如大豆油——其已经通过湿法精炼去除了粘质——的含磷成分的含量以及铁含量，通过下述方法降低：通过将所述油与本发明的酶，如磷脂酶A1、A2或者B的水溶液接触，进行酶促降解，然后从处理的油中分离水相。一方面，本发明提供了酶促方法，用于降低油中的含磷组分以及含铁组分的含量，该油已经进行了精炼，去除了粘质。已经进行精炼去除了粘质的油，可以用本发明的酶处理，如用磷脂酶C、A1、A2或者B处理。可以实现低于5ppm的磷含量，低于1ppm的铁含量。低的铁含量可以有助于油的稳定性。

本发明的磷脂酶和方法也可以用于制备酯交换的油，如在美国专利中5,288,619所描述的。本发明提供了酶促酯交换的方法，用于制备具有低的反式酸(tran-acid)和低中间物链脂肪酸(low intermediate chain fatty acid)含量的人造黄油。该方法包括以下步骤：提供含有硬脂酸来源材料和可食用的液体植物油的酯交换反应混合物；应用1-，3-位置特异性脂酶对硬脂酸来源材料和植物油进行酯交换；然后，最后氢化脂肪酸混合物，来提供再循环的硬脂酸来源材料，用于与植物油进行再循环反应。本发明也提供了制备酯交换油的逆流方法(counter-currentmethod)。该方法包括下述步骤：提供含有1-，3-位置特异性脂酶的酯交换反应区域；将植物油引入酯交换区域；引入硬脂酸来源物质；传输超临界气体或者亚临界液化气体逆流流体；在反应区域中进行甘油三酯流与硬脂酸或者硬脂酸单酯流的酯交换反应；撤掉酯交换的甘油三酯人造黄油流；撤掉逆流流体相；对酯交换的硬脂酸或者硬脂酸单酯进行氢化作用，来提供氢化的再循环硬脂酸来源物质；并将氢化的再循环硬脂酸源物质引入到反应区域。

一方面，高度不饱和的磷脂化合物可以通过适当地应用本发明的磷脂酶C，以去除sn-3位置的磷酸基团，随后进行1，3脂酶酰基酯的合成，而转变为甘油三酯。2-取代的磷脂可以直接用作功能性食物成分，或者随后可以应用本发明的固定化的磷脂酶C，选择性地在反应器160中进行水解，以便产生1-甘油二酯，随后进行在此描述的酶促酯化反应，来产生具有2-取代的多不饱和脂肪酸组分的甘油三酯产物。

本发明的磷脂酶和方法也可以用于植物油酶促脱胶过程，如在美国专利6,001,640中所描述的。该发明方法包括，在食用油的生产中的脱胶步骤。来自植物油的可水合磷脂通过之前的水相脱胶过程已经被去除，用本发明的磷脂酶进行酶促处理使植物油不含有非水合磷脂。该工艺可以是温和的、经济的并且对环境无不良影响。仅仅水解溶血卵磷脂而不水解卵磷脂的磷脂酶用于该脱胶过程。

一方面，为了使得本发明的酶能起作用，两相，含有酶的油相和水相，必须充分混合。仅仅搅拌它们可能是不够的。如果其溶解于少量的水中，如0.5-5％重量百分比(相对于油)，并且以这一形式在油中进行乳化，从而形成直径少于10微米的液滴(重均)，则有助于酶在油中很好地分散开。液滴可以小于1微米。可以以径向速率超过100cm/秒进行剧烈的搅拌。应用外部旋转泵，油也可以在反应器中循环。含有酶的水相也可以通过超声作用充分分散。可以应用分散仪器。

酶反应可能发生在油相和水相之间的边界面上。所有这些混合措施的目标在于，为含有酶的水相产生最大可能的表面积。表面活性剂的加入增加了水相的微分散。所以，在一些情况下，将HLB值高于9的表面活性剂，如十二烷基硫酸钠加入到酶溶液中，如在EP-A 0 513 709中所描述的。增加乳化作用的类似有效的方法是加入溶血卵磷脂。加入量的范围相对于油在0.001％到1％之间，相对于油而言。酶处理期间的温度不是至关重要的。可以应用的温度在20℃到80℃之间，但是后者只能应用很短的时间。在该方面，应用具有良好的温度和/或低pH值耐受性的本发明磷脂酶。最佳的应用温度在30℃到50℃之间。处理的时间取决于温度，并且在增高温度时，处理时间可以变短。时间从0.1到10小时，或者从1到5小时一般就足够了。反应发生在脱胶反应器中，其可以划分为几个阶段，如在DE-A 43 39 556中所描述的。因此，可以进行连续操作，也可以进行间歇性操作。反应可以在不同的温度阶段中进行。例如，温育可以在40℃下进行3小时，然后在60℃下进行1小时。如果反应阶段式进行，也可能在各个阶段调节不同的pH值。例如，在第一阶段，溶液pH值可以调节到7，例如，通过加入柠檬酸溶液，在第二阶段，将pH值调节到2.5。然而，在至少一个阶段，酶溶液的pH值必须低于4或者低于3。如果pH值被后续调节到低于这一水平，可能会损害效果。因此，柠檬酸可以在酶被混合到油中之前被加入至酶溶液中。

在酶处理完成以后，酶溶液以及包含在酶溶液中的NHP的分解产物，可以例如通过离心的方式，从油相中分批或连续地分离出来。由于酶具有高水平的稳定性，并且包含在溶液中的分解产物的量较少(它们可能沉淀为污泥)，同一含水酶相可以重复应用几次。也有可能从污泥中释放出酶，参见，如，DE-A 43 39556，因此基本上没有污泥的酶溶液可以被再次使用。在这一脱胶工艺的一个方面中，得到含有少于15ppm磷的油。一个目标是磷含量少于10ppm；或者少于5ppm。在磷含量低于10ppm的情况下，按照蒸馏脱酸工艺进一步处理油是十分可能的。许多其它的离子，如镁、钙、锌以及铁，可以从油中去除，如低于0.1ppm。这样，该产品为在进一步的处理和储存中具有好的耐氧化性具有理想的前提条件。

本发明的磷脂酶和方法也可以用于降低植物油和动物油中含磷组分的量，如在EP专利的EP 05 13709中所述。在这一方法中，之前已经经过了脱泥处理的植物和动物油例如大豆油中的含磷组分尤其是磷脂如卵磷脂的含量，以及铁的含量，通过应用本发明的磷脂酶A1、A2或者B的酶促降解作用而被降低。

本发明的磷脂酶和方法也可以用于精炼脂肪或者油，如在JP 06306386所述。本发明提供了用于精炼脂肪或者油的工艺，该工艺包括将在脂肪或者油中的磷脂转化成水溶性的含磷基团物质的步骤，并且除去该物质的步骤。本发明酶(如，PLC)的作用被用于将磷脂转化成这种物质。因此，有可能在无需进行碱炼步骤的情况下，精炼脂肪或者油，碱炼步骤产生含有碱性废水和大量油的工业废物。由于中性脂肪或者油逃逸到废物中的损失可以降低到零，所以可以实现产量的增加。在一方面，胶状物质被转化成水溶性物质，通过加入本发明的具有磷脂酶C活性的酶，作为水溶性物质而被去除，这在粗制油的脱胶过程和进行酶处理的阶段中进行。一方面，本发明的磷脂酶C具有切割存在于磷脂中的甘油和磷酸的酯键的活性。如果需要，该方法可以包括用水或者酸性水溶液洗涤经过酶处理的油。一方面，加入本发明的酶，并且与粗制油反应。所用的磷脂酶C的量可以是每公斤粗制油，10到10,000单位，或大约100到2,000单位。

本发明的磷脂酶和方法也可以用于水脱胶过程，如，在Dijstra，Albert J.，et al.，Oleagineux，Corps Gras，Lipides(1998)，5(5)，367-370中。在该示例性的方法中，水脱胶过程被用于产生卵磷脂，并且用于使用脱胶酸和漂白土的干法脱胶过程。这一方法可能仅仅对于低磷脂含量的油是经济可行的，如，棕榈油、月桂油等。对于具有高NHP含量的种子油，应用酸精炼过程，其中该过程在榨油机中进行，以便允许经由粗粉(meal)的胶清除。一方面，该酸精炼油是在物理精炼之前进行的一个可能的“精炼(polishing)”操作。

本发明的磷脂酶和方法也可以用于脱胶过程，如在Dijkstra，et al.，Res.Dev.Dep.，N.V.Vandemoortele Coord.Cent.，Izegem，Belg.JAOCS，J.Am.Oil Chem.Soc.(1989)，66：1002-1009中所述。在该示例性的方法中，总的脱胶过程包括将酸，如磷酸或者柠檬酸分散至大豆油中，允许接触一定的时间，随后将碱，如苛性钠或者硅酸钠混合到油包酸(acid-in-oil)乳状液中。这可以将中和度低保持在足够低的水平，以避免形成肥皂，这是因为那会导致油损失的增加。随后，油通过离心分离器，在这种情况下，大多数胶状物从油流中去除，产生具有最少油含量的胶相(gumphase)。油流随后通过第二离心分离器中，以去除所有残留的胶，得到稀释的胶相，其进行再循环。洗涤和干燥或者在线碱法精炼完成该工艺。在采用全部的脱胶工艺以后，与经典的碱法精炼工艺相比，实现了总产量增加大约0.5％。完全脱胶的油然后可以进行碱精炼，漂白和脱臭，或者被漂白和物理精炼。

本发明的磷脂酶和方法也可以用于去除植物油如大豆油中的不可水合磷脂，如在Hvolby，et al.，Sojakagefabr.，Copenhagen，Den.，J.Amer.Oil Chem.Soc.(1971)48：503-509中所描述。在这一示例性的方法中，水脱胶的油，在不同的固定pH值下，与含有和不含有Ca⁺⁺、Mg/Ca结合试剂的缓冲液，以及表面活性剂混合。不可水合的磷脂可以作为微胶粒或者混合乳化剂组分在未转化的状态下去除。更进一步地，不可水合磷脂可以通过转化为解离形式而去除，例如通过从磷脂中去除Mg和Ca，该过程可以通过酸化或者通过用Mg/Ca络合或者Mg/Ca沉淀试剂处理来完成。不可水合磷脂的去除或者化学转化可能导致乳状液形成减少，和来自乳状液层和皂脚中的脱酸化油的分离有所改善。

本发明的磷脂酶和方法也可以用于植物油的脱胶，如在Buchold，et al.，Frankfurt/Main，Germany.Fett Wissenschaft Technologie(1993)，95(8)，300-304中所述。在本发明的用于食用植物油脱胶的这一示例性工艺中，用本发明酶如，磷脂酶A2的水悬浮液，来水解结合在磷脂sn2位上的脂肪酸，得到不溶于油的1-酰基-溶血磷脂，并且因此更适用于物理分离。甚至加入少量的相当于大约700lecitase单位/公斤油，得到的残留磷浓度少于10ppm，这样化学精炼是可以用物理精炼替代的，省略了中和、皂脚破裂和废水处理的必要。

本发明的磷脂酶和方法也可以用于植物油的脱胶，如EnzyMax.Dahlke，Klaus.Dept.G-PDO，Lurgi O1-Gas，Chemie，GmbH，Frankfurt，Germany.Oleagineux，Corps Gras，Lipides(1997)，4(1)，55-57中所述。该示例性过程是一个用于物理精炼几乎任何种类油的脱胶过程。通过酶催化的水解，磷脂转化为水溶性的溶血磷脂，其可以通过离心从油中分离得到。在酶法脱胶的油中，残留的磷含量可以低至2ppm P。

本发明的磷脂酶和方法也可以用于植物油的脱胶，如在Cleenewerck，et al.，N.V.Vamo Mills，Izegem，Belg.Fett Wissenschaft Technologie(1992)，94：3 17-22，和Clausen，Kim；Nielsen，Munk.Novozymes A/S，Den.Dansk Kemi(2002)83(2)：24-27 所述。本发明的磷脂酶和方法可以整合酸对植物油进行的预精炼工艺，如在下述文献中所述：Nilsson-Johansson，et al.，Fats Oils Div.，Alfa-Laval Food Eng.AB，Tumba，Swed.Fett Wissenschaft Technologie(1988)，90(11)，447-51；以及，Munch，Ernst W.Cereol Deutschland GmbH，Mannheim，Germany.Editor(s)：Wilson，RichardF.Proceedings of the World Conference on Oilseed Processing Utilization，Cancun，Mexico，Nov.12-17，2000(2001)，Meeting Date2000，17-20。

本发明的磷脂酶和方法也可以用于植物油中的脱胶，如在Jerzewska，et al.，Inst.Przemyslu Miesnego i Tluszczowego，Warsaw，Pol.，Tluszcze Jadalne(2001)，36(3/4)，97-110中所述。在本发明的这一工艺中，通过应用本发明的磷脂酶A2对水合的低-芥酸油菜籽油进行酶法脱胶。该酶可以催化磷脂中甘油部分的中心碳原子连接的脂肪酸酯键的水解。它也可以水解不可水合的磷脂为它们相对应的可水合的溶血化合物。对于非纯化的酶制备物，加入2％的制备物4小时，可以得到更好的结果(87％P去除率)。

在本发明的油脱胶(或使用本发明酶的油脱胶工艺)的另一示例性工艺中，加入酸性聚合物，例如藻酸盐或果胶。在本发明的该油脱胶工艺中，将酸性聚合物(例如藻酸或果胶或更加可溶性的盐形式)加入到含有少量水(例如在约0.5至5％范围内)的粗油中。在该方面中，通过结合粗油中的钙和/或镁，酸性聚合物可以减少和/或分裂磷脂-金属络合物，从而提高不可水合的磷脂的溶解性。在可选择的方面，这些磷脂将移动到油/水介面或进入水相，并且转化为二酰甘油和相应的侧链，或者完整的磷脂将作为重相的组分被随后的离心除去。在水相中酸性聚合物的存在也可以增加水相的密度，并提高从油(轻)相分离重相的效果。

本发明的油脱胶(或使用本发明酶的油脱胶工艺)的一个示例性工艺改变脱臭程序，以获得二酰甘油(DAG)组分。在可选择的方面，如果必要或需要，在酶助脱胶之后，可以修改脱臭条件(温度、压力、蒸馏设备的构造)，以达到提高游离脂肪酸(FFA)从二酰甘油/三酰甘油组分分离的结果，或进一步修饰以从三酰甘油组分分离出二酰甘油。这些修饰的结果是，使用本发明的方法，有可能获得更好级别的FFA和二酰甘油，如果本发明的酶(例如磷脂酶，或PLC或PLC和磷酸酶的组合)被用于在物理精炼工艺中对食用油脱胶的话。

在各个方面，实施在此描述的本发明方法(或使用本发明的酶)，具有许多优点诸如：减少或消除溶剂和溶剂回收步骤；降低资金成本；减少下游精炼成本；减少化学品使用，设备，工艺时间，能源(热能)和水使用/废水产生；产生更高质量的油；在一些烹饪和煎炒应用中可以使用无需精炼的压榨机压出的油(该压出的油可以具有优异的稳定性，色泽和气味特征和高维生素E含量)；产生更高质量的膳食；产生更低脂肪含量的膳食(目前，出自机械压榨的膳食引起反刍动物的消化问题)；产生提高的营养特性——降低水平的芥子油苷、鞣酸、芥子碱、植酸(如在Technology and Solvents for Extracting Oilseeds and Nonpetroleum Oils，AOCS1997中所述)。

在一个方面，本发明提供了精炼植物油(例如大豆油、玉米油、棉籽油、棕榈油、花生油、油菜籽油、红花油、向日葵油、芝麻籽油、米糠油、椰子油或油菜油)和它们的副产物的工艺，和对卵磷脂脱臭的工艺，例如在美国专利6,172,248或6,172,247中所述，其中的方法包括使用至少一种本发明的酶，例如本发明的磷脂酶C。因此，本发明提供了包含至少一种本发明的酶的卵磷脂和植物油。在示例性有机酸精炼工艺中，将植物油与稀释的含水有机酸溶液组合，并进行高度剪切，以将酸溶液充分分散在油中。将所得的酸和油混合物在低剪切下混合一段足够的时间，以将污染物整合到水合的杂质相中，从而产生纯化的植物油相。在该示例性工艺中，可以使用混合器或循环系统(例如循环水桶)和/或磷脂或卵磷脂储存桶，如在美国专利4,240,972、4,049,686、6,172,247或6,172,248中所述。这些工艺可以作为间歇或连续工艺操作。粗或脱胶的植物油可以由储存桶供应(例如通过泵)并可以加热。待纯化的植物油可以是粗的或“脱胶的”油。

在一个方面，本发明的磷脂酰肌醇-PLC(PI-PLC)酶用于植物油脱胶。本发明的PI-PLC酶可以单独使用，或与其他的酶(例如，本发明的PLC、PLD、磷酸酶)组合使用，以提高植物油(包括大豆油、油菜油和向日葵油)脱胶期间的油产量。PI-PLC可以优选地将磷脂酰肌醇转化为1，2-二酰甘油(DAG)和磷酸肌醇(phosphoinositol)，但是它也可以对其他磷脂表现出活性，包括磷脂酰胆碱、磷脂酰乙醇胺、磷酯酰丝氨酸或磷脂酸或其组合。对植物油进行酶处理导致捕获在较小的胶组分中的油的数量减少，这增加了酶处理的植物油中的DAG的数量并增加了中性油，从而实现产量增加。

含油种子的酶法加工

本发明提供了酶法加工含油种子，包括大豆、油菜、椰子、鳄梨和橄榄糊的组合物(例如酶)和方法。在一个方面，本发明的这些工艺可以增加油产量，并提高获得的膳食的营养质量。在一些方面，使用本发明的酶和方法来酶法加工含油种子，将具有经济和环境利益，并为油萃取和加工人类和动物食物提供了可供选择的技术。在可选择的方面，本发明的工艺包括使用本发明的磷脂酶、其他磷脂酶、蛋白酶、磷酸酶、植酸酶、木聚糖酶、淀粉酶(例如α-淀粉酶)、葡聚糖酶(例如β-葡聚糖酶)、聚半乳糖醛酸酶、半乳糖脂酶、纤维素酶、半纤维素酶、果胶酶和其他降解植物细胞壁的酶、以及混合酶制剂和细胞裂解剂。

在可选择的方面，本发明的工艺可以与其他工艺联合实施，例如酶处理，例如用碳水化合物酶处理，包括纤维素酶、半纤维素酶和其他副降解活性，或与化学工艺联合，例如己烷提取大豆油工艺。当在溶剂萃取之前进行酶法处理时，酶法处理可以增加油萃取率达8-10％。

在可选择的方面，本发明的工艺可以用水萃取工艺实施。水萃取方法对于油萃取来说可能是环境上更清洁的可选择的技术。水工艺的低萃取产量可以通过使用这样的酶克服，即该酶水解形成含油种子细胞壁的结构多糖，或水解形成细胞和类脂体膜的蛋白质，例如，利用包括纤维素酶、半纤维素酶和/或原果胶酶在内的酶进行消化，用于从大豆细胞提取油。在一个方面，根据Kasai(2003)J.Agric.Food Chem.51：6217-6222的描述，用本发明的酶实施本方法，该文献报道了消化细胞壁最有效的酶是纤维素酶。

在一个方面，蛋白酶与本发明的方法一起使用。已经评价了蛋白酶和纤维素酶对油和蛋白质提取产量的操作变量和酶活性以及其他工艺参数，诸如酶浓度、水解时间、颗粒大小和固液比的联合效应。在一个方面，根据Rosenthal(2001)Enzyme and Microb.Tech.28：499-509的描述，用本发明的酶实施本方法，该文献报道了使用蛋白酶能比使用热处理面粉时的对照产生明显较高的油和蛋白质产量。

在一个方面，全蛋白、果胶和半纤维素提取与本发明方法一起使用。植物细胞由一系列的多糖组成，其常常与蛋白质和酚类化合物缔合或被蛋白质和酚类化合物替代。这些碳水化合物中的大部分只是被消化酶部分消化或低效利用。通过加工或降解性酶处理来破裂这些结构，可以提高它们的营养可利用率。在一个方面，根据Ouhida(2002)J.Agric.Food Chem.50：1933-1938的描述，用本发明的酶实施本方法，该文献报道了全蛋白、果胶和半纤维素提取之后大大降解了大豆细胞壁纤维素(高达20％)。

在一个方面，本发明的方法进一步包括在处理种子例如油菜籽中结合各种酶处理，这些处理包括使用蛋白酶、纤维素酶和半纤维素酶(相互之间和与本发明的一种或多种酶的各种联合)。例如，所述方法可以包括在传统工艺之前，在用酶温育期间，在20至40水份中酶法处理油菜种子，如Sosulski(1990)Proc.Can.Inst.Food Sci.Technol.3：656所述。本发明的方法可以进一步结合蛋白酶、α-淀粉酶、聚半乳糖醛酸酶(相互之间和与本发明的一种或多种酶的各种联合)，以水解椰子粉中的细胞物质和释放椰子油，该椰子油可以通过离心回收，如McGlone(1986)J.ofFood Sci.51：695-697所述。本发明的方法可以进一步以不同的组合方式结合果胶酶、α-淀粉酶、蛋白酶、纤维素酶(相互之间和与本发明的一种或多种酶的各种联合)，以在酶法提取鳄梨油期间明显提高产量(在最好的情况下～70％)，如Buenrostro(1986)Biotech.Letters 8(7)：505-506所述。在本发明的橄榄油提取工艺中，用纤维素酶、半纤维素酶、聚半乳糖醛酸酶、果胶-转甲基酶、蛋白酶和它们的组合(相互之间和与本发明的一种或多种酶的组合)处理橄榄糊，如，例如Montedoro(1976)Acta Vitamin.Enzymol.(Milano)30：13所述。

从植物油中纯化植物固醇

本发明提供了方法，用于从植物油中纯化植物固醇和三萜，或者植物甾醇。应用本发明的磷脂酶和方法可以纯化的植物固醇，包括β-谷固醇、菜油甾醇(campesterol)、豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、24-脱氢胆甾醇、chalinasterol、多孔甾醇、穿贝海绵甾醇(clionasterol)和菜子甾醇(brassicasterol)。植物固醇是用于健康和营养工业的重要农产品。因此，本发明的磷脂酶和方法可用于制备用于化妆品制造的乳化剂以及用于生产激素药物的甾体中间物和前体。本发明的磷脂酶和方法用于制备(如，纯化)植物固醇和它们的酯的类似物，用作具有心血管健康价值的降低胆固醇的试剂。本发明的磷脂酶和方法用于纯化植物甾醇，植物甾醇通过抑制在消化道中的胆固醇吸收，来降低血清中的胆固醇水平。本发明的磷脂酶和方法用于纯化具有在极低的浓度下具有免疫调节特征的植物甾醇，包括增强的T淋巴细胞的细胞应答和天然杀伤细胞对癌细胞系的细胞毒性活性。本发明的磷脂酶和方法用于纯化植物甾醇，用于治疗肺结核、类风湿性关节炎、HIV感染病人的处理和免疫应力的抑制，例如，在马拉松选手中。

本发明的磷脂酶和方法用于纯化存在于日用植物油(如，椰子、油菜、可可豆脂油、玉米、棉籽、亚麻、橄榄、棕榈、花生、米糠、红花、芝麻、大豆、向日葵油)的甾醇部分中的甾醇成分，如，谷固醇(40.2-92.3％)、菜油甾醇(2.6-38.6％)、豆甾醇(0-31％)和5-燕麦固醇(1.5-29％)。

本发明的方法可以结合油籽中植物来源固醇的分离，该分离通过下述方法完成：用氯仿-甲醇、己烷、二氯甲烷或者丙酮进行抽提，然后进行皂化作用和层析法纯化，以获得富集的总甾醇。可选择地，植物样品可以通过应用超临界二氧化碳的超临界流体提取，以得到总脂类提取物，从中可以富集和分离甾醇。对于甾醇化合物的随后表征和定量，粗分离物可以通过很多不同的色谱技术纯化和分离，包括柱层析(CC)、气相色谱、薄层色谱(TLC)、正相高效液相色谱(HPLC)、反相高效液相色谱和毛细管电色谱。在所有的色谱分离和分离技术中，对于样品清理、纯化、定性分析和测试样品中固醇的初步估计而言，CC和TCL程序的应用是最容易进行的，成本上承受得起的并且是适当的。

在可食用油的精炼过程中，植物油中的植物固醇作为副产物而丧失。本发明的磷脂酶和方法应用从这样的副产物中分离的植物固醇，来制备从这样的副产物中分离得到的富集植物固醇的产物。本发明的植物固醇分离和纯化方法可以合并油处理工艺中的工业副产物，并且可以包括如分子蒸馏、液-液提取和结晶的操作。

本发明的方法可以结合液体抽提来提取植物固醇的工艺。例如，本发明的方法可以应用非极性溶剂如己烷(一般用于提取大部分种类的植物油)，定量地提取游离的植物固醇和植物固酰脂肪酸酯。固醇糖苷和脂肪酰化固醇糖苷仅仅被己烷部分提取，增强的溶剂极性产生更高百分比的抽提率。可以应用的一个程序是Bligh和Dyer的氯仿-甲醇方法，用于提取所有的固醇脂类，包括磷脂。一个定性分离和定量分析的植物固醇脂类的示例性方法包括将脂类提取物注入HPLC系统。

本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇，如在美国专利号6,303,803中所描述的。这是降低含有固醇的脂肪和油中的固醇含量的方法。其是基于胆固醇和其它甾醇对于形成疏水流体双层如磷脂双层的两性分子的亲和性，是一个高效和具有成本效率的过程。磷脂的聚集体与，例如含有甾醇的脂肪或者油在含水环境下接触，随后进行混合。聚集的磷脂混合物的分子结构对胆固醇和其它甾醇具有高亲和性，可以从脂肪和油中选择性地去除这样的分子。水相分离混合物被混合足够长的时间，以便通过分配甾醇到磷脂聚集体部分中，从而选择性地降低脂肪/油产物中的甾醇含量。甾醇含量降低的脂肪或者油被从水相分离混合物中分离。可选择地，相应的富集甾醇的组分也可以被从水相分离混合物中分离。这些步骤可以在环境温度下进行，涉及加热的成本被最小化，同样地，产物因为热而降解的可能性也被最小化。另外，需要最少量的设备，并且因为所有需要的材料都是食品级的，该方法不需要在操作、废物处理或者最终产物的污染方面有特别预防措施。

本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇，如，在美国专利号5,880,300所描述。将磷脂聚集体与，如含有甾醇的脂肪或者油在含水环境中接触，然后进行混合。在充分混合后，甾醇含量降低的脂肪或者油从含水分离混合物中分离出来。可选择地，相应的甾醇富集的磷脂也可以从含水分离混合物中分离。植物(如蔬菜)油含有植物甾醇(植物固醇)，它们也可以应用本发明的方法去除。该方法可以用于商业处理循环的任何阶段的脂肪/油产品。例如，本发明的工艺可以用于精炼、漂白和脱臭的油(“RBD油”)，或者在达到RBD状态之前的加工过程的任何阶段。与RBD之前的油(pre-RBD oil)相比，尽管RBD油可能具有改变的密度，本过程易于改变而适合于RBD也适合于RBD之前的油，或者适于各种其它的脂肪/油产品，这是是通过改变磷脂含量、磷脂组成、磷脂∶水的比例、温度、压力、混合条件和分离条件而进行的，如下所述。

可选择地，本发明的酶和方法可以用于在油加工的中间步骤中分离植物甾醇或者其它甾醇。例如，已知在植物油的脱臭中植物甾醇丧失。含有甾醇的蒸馏部分——例如来自处理的中间阶段，可以进行以上所述的甾醇抽提程序。这提供了富含甾醇的卵磷脂或者其它磷脂物质，其可以进一步处理以便回收抽提的甾醇。

去污剂组合物

本发明提供了包括一种或者多种本发明磷脂酶的去污剂组合物，和制备和使用这些组合物的方法。本发明并入了所有制备和使用去污剂组合物的方法，参见例如美国专利6,413,928；6,399,561；6,365,561；6,380,147。去污剂组合物可以是一个和两个部分的含水组合物、非含水液体组合物、铸塑固体、粒形形式、微粒形式、压缩片剂、凝胶和/或膏状物以及浆状物形式。本发明也提供能够应用这些去污剂组合物快速去除各种食物污迹、食物残留物膜和其它微小的食物组合物的方法。本发明的磷脂酶可以通过磷脂的催化水解来帮助去除污染。本发明的磷脂酶可以用在洗盘去污剂和纺织品洗涤去污剂中。

实际的活性酶含量依赖于去污剂组合物的制造方法，并且并不是决定性的，只要去污剂溶液具有所需的酶促活性。一方面，存在于最终溶液中的磷脂酶的量的范围为，在每克去污剂组合物中，大约0.001mg到0.5mg。选择用于本发明的工艺和产品的特定酶，依赖于最终用途的条件，包括产品物理形式、应用pH、应用温度和待降解或者改变的污物类型。对于任何给定的一套应用条件，可以选择酶以提供最佳的活性和稳定性。在一个方面，本发明的多肽在大约4到大约12的pH范围，大约20℃到大约95℃的温度范围内有活性。本发明的去污剂可以包括阳离子、半极性非离子的或者兼性离子表面活性剂；或者其混合物。

本发明的磷脂酶可以配制成粉末去污剂和液体去污剂，其pH值在4.0到12.0之间，以重量百分比计算，含量水平为约0.01％到大约5％(优选地0.1％到0.5％)。这些去污剂组合物也可以包括其它的酶如已知的蛋白酶、纤维素酶、脂酶或内切糖苷酶，以及助洗剂和稳定剂。本发明磷脂酶的加入到传统的清洗组合物中，并不产生任何特定的应用限制。换句话说，只要pH在以上的范围内，温度低于所述酶的变性温度，适于去污剂的任何温度和pH也适于本组合物。此外，本发明的多肽可以用于不含去污剂的洗涤组合物中，此外，或者可以单独应用，或者可以与助洗剂和稳定剂组合应用。

本发明提供了包括去污剂的洗涤或消毒组合物，和/或用于洗涤和/或消毒硬表面的消毒组合物，适用于洗涤和/或消毒织品的去污剂组合物，洗盘组合物，口腔清洗组合物，牙齿清洗组合物，和/或隐形眼镜清洗溶液。

一方面，本发明提供了洗涤对象的方法，该方法包括在足以洗涤的条件下，使该对象与本发明的磷脂酶接触。可以包括本发明的磷脂酶，作为去污剂添加剂。本发明的去污剂组合物可以，例如，配制成包括本发明磷脂酶的手洗或机洗去污剂组合物。适用于对染色织物进行预处理的洗涤添加剂可以包括本发明的磷脂酶。织物柔软剂组合物可以包括本发明的磷脂酶。可选择地，本发明的磷脂酶可以被配制为去污剂组合物，用于一般家用硬表面的清洗操作。在可选择的方面，本发明的去污剂添加剂和去污剂组合物可以包括一种或者多种其它的酶，如蛋白酶、脂酶、角质酶、另一种磷脂酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶，如乳糖酶和/或过氧化物酶。选择本发明酶的特性以与选定的去污剂相容(即，最适pH，与其它酶和非酶成分相容等等)，并且所述酶以有效量存在。在一方面，本发明的磷脂酶用于从织物中去除恶臭物质。可以用于实践本发明的各种去污剂组合物和用于制备它们的方法描述在下述专利中，例如美国专利6,333,301；6,329,333；6,326,341；6,297,038；6,309,871；6,204,232；6,197,070；5,856,164。

废物处理

本发明的磷脂酶可以用于废物处理。一方面，本发明提供了应用本发明磷脂酶的固体废物消化过程。该方法可以包括减少基本上未处理的固体废物的量和体积。固体废物可以用酶消化过程处理，这是在酶溶液(包括本发明的磷脂酶)存在的条件下，在控制的温度下进行的。固体废物可以转化为液化废物和任何残留固体废物。所得到的液化废物可以与所述的任何残留固体废物分离。参见如美国专利5,709,796。

解毒

磷脂酶(例如本发明的PLCs、patatins)可以用于解毒方法，例如对内毒素，如包含脂多糖(LPS)的组合物进行解毒，并且，本发明提供了使用至少一种本发明酶的解毒方法，所述酶例如patatin，具有如SEQ ID NO：12(由SEQ ID NO：11编码)、SEQ ID NO：14(由SEQ ID NO：13编码)、SEQ ID NO：18(由SEQ ID NO：17编码)、SEQ ID NO：26(由SEQ ID NO：25编码)、SEQ ID NO：28(由SEQ ID NO：27编码)、SEQ ID NO：34(由SEQ ID NO：33编码)、SEQ ID NO：36(由SEQ ID NO：35编码)、SEQ ID NO：44(由SEQ ID NO：43编码)、SEQ ID NO：46(由SEQ ID NO：45编码)、SEQ ID NO：56(由SEQ ID NO：55编码)、SEQ ID NO：60(由SEQ ID NO：59编码)、SEQ ID NO：66(由SEQ ID NO：65编码)、SEQ ID NO：72(由SEQ ID NO：71编码)、SEQ ID NO：78(由SEQ ID NO：77编码)、SEQ ID NO：87(由SEQ ID NO：86编码)、SEQ ID NO：88(由SEQ ID NO：87编码)、SEQ ID NO：92(由SEQ ID NO：91编码)、SEQ ID NO：96(由SEQ ID NO：95编码)、SEQ ID NO：100(由SEQ ID NO：99编码)、SEQ ID NO：104(由SEQ ID NO：103编码)、SEQ ID NO：126(由SEQ ID NO：125编码)、SEQ ID NO：128(由SEQ ID NO：127编码)、SEQ ID NO：132(由SEQ ID NO：131编码)、SEQ ID NO：134(由by SEQ ID NO：133编码)、SEQ ID NO：136(由SEQ IDNO：135)或SEQ ID NO：138(由SEQ ID NO：137)阐述的序列。在一个方面，本发明的磷脂酶用于对脂多糖(LPS)解毒。在一个方面，该解毒作用是通过对来自类脂A的2′和/或3′脂肪酸链进行脱酰作用。在一个方面，本发明的磷脂酶(例如PLC、patatin)用于水解来自类脂例如类脂A(例如来自细菌内毒素)的2′-月桂酰和/或3′-肉豆蔻酰链。在一个方面，本发明的方法用于破坏内毒素，例如来自革兰氏阴性细菌，如来自大肠杆菌的毒素。在一个方面，本发明的磷脂酶(例如PLC、patatin)被用于改善毒素中毒(例如来自进行性革兰氏阴性感染)的效应，或预防性地防止感染(例如动物或人的感染)期间的内毒素效应。因此，本发明提供包含本发明的磷脂酶(例如PLC、patatin)的药物组合物，和使用本发明的水解酶来改善或预防脂多糖(LPS)毒性作用的方法，例如在脓血症期间。

加工食物

本发明的磷脂酶可以用于加工食物，例如以改变它们的稳定性、贮存期、风味、质地，提高它们的营养价值和类似情况。例如，在一个方面，本发明的磷脂酶用于产生酸性磷脂，用于控制食物的苦味。

在一个方面，本发明提供了使用本发明的磷脂酶制备奶酪的工艺(因此，本发明也提供了包含本发明磷脂酶的奶酪)。在一个方面，本发明的酶(例如磷脂酶A、溶血磷脂酶或其组合)被用于加工奶酪，以增强风味、增加产量和/或“稳定”奶酪，例如通过降低“(去油(oil-off))”的趋势来进行，或在一个方面，本发明的酶用于从酪乳加工奶酪。本发明的这些工艺可以结合任何方法或方案，例如在美国专利6,551,635和6,399,121、WO 03/070013、WO 00/054601中所述。例如，在一个方面，本发明的磷脂酶被用于稳定乳或含乳组合物例如奶油中的脂肪乳状物，以及用于稳定乳制组合物，例如用于制备奶油或液体奶油。在一个方面，本发明提供了使用至少一种本发明酶来增强奶酪的风味的工艺，该工艺包括在含水介质中，在产生增强的奶酪风味的条件下(例如减少的苦味)，温育蛋白、脂肪和蛋白酶和脂肪酶，如WO 99/66805所述。在一个方面，本发明的磷脂酶用于增强奶酪(例如凝乳)的风味，这通过在升高的温度，例如在约75℃至95℃之间，用水、蛋白酶和脂酶(本发明的酶)混合来进行，如在美国专利4,752,483中所述。在一个方面，本发明的磷脂酶用于通过在将凝结剂加入到牛奶之前将本发明的酶(例如脂酶或磷脂酶)加入到奶酪(例如酪乳)中，或在挤压之前将本发明的酶加入到含盐凝乳中来促进奶酪老化，如美国专利4,707,364中所述。在一个方面，本发明的脂酶用于降解牛奶脂肪中的甘油三酯来释放游离脂肪酸，从而增强风味。蛋白酶也可以用于本发明的这些工艺的任何工艺中，参见例如Brindisi(2001)J.of Food Sci.66：1100-1107。在另一个方面，酯酶、脂酶、磷脂酶和/或蛋白酶的组合可以用于本发明的这些工艺或任何工艺。

在一个方面，本发明的磷脂酶用于减少食物中例如油诸如具有高含量的不可水合磷组分的植物油中的磷组分含量，如WO 98/26057所述。

本发明的磷脂酶的其它用途

本发明的磷脂酶也可以用于研究磷酸肌醇(PI)信号系统；用于诊断、预后和双极性紊乱治疗的开发(参见如，Pandey(2002)Neuropsychopharmacology26：216-228)；作为抗氧化剂；作为修饰的磷脂；作为发泡剂和胶凝剂；产生用于血管形成组织的血管生成性类脂；用于鉴定磷脂酶，如PLA、PLB、PLC、PLD和/或patatin调节剂(激动剂或者拮抗剂)，如作为抑制剂而用作抗瘤剂、消炎剂以及作为止痛剂。它们可以用于产生酸性磷脂，用于控制食品和药物中的苦味。它们可以用于脂肪纯化。它们可以用于鉴定用于治疗病毒性、炎症性、过敏性和心血管疾病的肽抑制剂。它们可以用于制备疫苗。它们可以用于制备多不饱和脂肪酸甘油酯和磷脂酰甘油。

本发明的磷脂酶，例如，PLA和PLC酶，用于产生免疫毒素和各种治疗剂，用于抗癌治疗。

本发明的磷脂酶可以与其它用于脱色(即，去除叶绿素)的酶和去污剂(参见以上)联合使用，如，与其它的酶(如，脂酶、蛋白酶、酯酶、磷酸酶)联合使用。例如，在应用PLC的任何场合中，都可以组合应用PLD和磷酸酶，以产生与PLC单独使用相同的结果。

下表概述了本发明的若干示例性工艺和制剂：

通过糖基化作用使酶的活性失活和调节酶的活性

本发明提供这样的方法，包括使用重组技术制备和表达具有生物活性的酶或其他蛋白，例如有害的或有毒的酶，(其中所述酶或其他蛋白正常情况下未糖基化)它们为无活性或活性较低但是可再活化的形式。该方法包括将一个或多个糖基化位点(例如N-连接的或O-连接的糖基化作用)加入到具有生物活性的酶或其他蛋白(例如本发明的酶)中，这是通过下述步骤进行的：对编码序列进行工程化以整合入新的糖基化位点(多个位点)；在真核细胞或工程化的等同物中或在能够进行翻译后糖基化的体外系统中表达变体编码序列。例如，3个氨基酸的序列NXS/T是真核细胞中的糖基化位点，而原核细胞不是这样的。因此，本发明包括将至少一个三氨基酸序列NXS/T加入到蛋白中，以便它的活性因翻译后糖基化的缘故而减少或失活。

糖基化作用可以导致产生加入到N残基的2个N-乙酰葡萄糖胺(NGlucNac)分子。随后的加入可以生物种特异性的。在大部分的种中，甘露糖(Mann)然后被加入到NGlucNa上，Mann残基的数目从10至100。唾液酸在一些物种中也可以被加入。在毕赤酵母中，在加入NglucNac之后，10至25个Mann残基可以被添加。

这些方法包括使用任何去糖基化酶或一组酶，它们中的许多酶可能已被鉴定和/或可以通过商业渠道获得。例如，内切糖苷酶H在最后一个NGlucNac处进行切割，留下一个NClucNac依然连接在N残基上。PNGaseF酶切割掉所有的糖，并将N残基的氨基侧链转化成羟基，从而使酶中的N氨基酸变成天冬氨酸(D)氨基酸。因此，所述方法包括体内或体外使用内切糖苷酶H和/或PNGaseF或等价的酶，从而部分或完全地再激活工程化的“临时失活的”蛋白。

该方法包括将酶或其他多肽靶向至宿主分泌途径，以便所述酶被糖基化。设计新的糖基化位点，这样，糖基化作用使酶失活，或修饰它的活性，例如减少它的活性，或者以另外的方式修饰活性，诸如阻止底物结合位点。因为酶是失活的或是活性较低，这些酶的活性的负面影响不再限制蛋白在宿主细胞中的积聚，所以有害的或有毒的酶可以以更高的水平表达。通过移去糖，例如使用商业上可获得的去糖基化酶，例如通过使用全细胞工程化方法体外除去糖，或体内除去糖，失活的、糖基化的酶可以被重新活化(部分或完全)。

在一个方面，将真核糖基化靶位点诸如NXS/T加入到任何蛋白，例如本发明的酶。这使本领域技术人员能够将糖基化位点加入到感兴趣的蛋白，并期望当通过将那个蛋白表达在真核宿主细胞中并将该蛋白靶向宿主细胞的分泌途径使得那个蛋白被糖基化时，将那个蛋白转化为临时失活的蛋白。

因此，本发明提供了产生在正常情况下数量巨大时由于害处或毒性太大而不能被宿主细胞耐受的酶。该效果可以是临时性的，因为它可以重新产生活性酶(通过去糖基化作用，例如通过翻译后修饰/去糖基化作用)，以用于需要活性酶的进一步的工作。

在一个方面，本发明提供了制备和表达具有生物活性的蛋白的方法，该蛋白的活性通过糖基化作用而临时失活，该方法包括：(a)提供编码具有生物活性的蛋白的核酸，其中所述蛋白在天然情况下是非糖基化的；(b)将至少一个糖基化基序编码序列插入到编码蛋白的核酸中，其中糖基化形式的蛋白是无活性的；(c)将靶向序列插入蛋白，这样该蛋白被导向宿主细胞的分泌途径，其中所述宿主细胞能够识别糖基化基序并糖基化该蛋白；和(d)在宿主细胞中表达修饰的核酸。在一个方面，该方法进一步包括对表达的蛋白去糖基化，从而再次激活蛋白例如酶诸如本发明的酶的活性。在一个方面，宿主细胞是真核细胞。在一个方面，通过去糖基化作用，或者化学的方法或者酶促的方法，体外再次激活失活的表达的重组蛋白。

确定一个或多个糖基化基序的设置以临时性地失活蛋白，仅仅涉及制备变体蛋白编码核酸的常规方法，例如通过GSSM^TM，和常规筛选方案，例如活性或结合分析方法。

由于糖基化作用的缘故，其活性对宿主细胞有害的酶被致失活。因为它是无活性的，所以它可以以高得多的水平积聚在真核宿主细胞中。因为它不再具有活性，所以它不再能够发挥其负面作用。有毒的酶的失活作用是临时性的，这是因为使用EndoH或PNGase F对该酶进行去糖基化作用能完全恢复酶的正常活性。大量糖基化的、失活的酶积聚在培养基中，这表明，宿主细胞完全耐受无活性形式的酶。

本发明参照以下的实施例来进一步说明；然而，应当理解地是，本发明并不限于这些实施例。

实施例1：用于序列同一性作图的BLAST程序

本实施例描述了示例性的序列同一性程序，用以确定核酸是否在本发明的范围内。应用NCBI BLAST 2.2.2程序，默认选择为blastp。除了默认过滤设置外，应用所有默认值(即，除了过滤设置为OFF(关)外，所有参数设置为默认)；在该位置应用“-F F”设置，其使得不能进行过滤。由于序列长度短，应用默认过滤常常导致Karlin-Altschul歪曲(violation)。用于本实施例的默认值为：

“低复杂度过滤(Filter for low complexity)：开

>字长(Word Size)：3

>矩阵(Matrix)：Blosum 62

>空位成本(Gap Costs)：存在(Existence)：11

>延伸(Extension)：1”

其它的默认设置为：低复杂度过滤关闭，对于蛋白字长为3，BLOSUM62矩阵，空位存在罚分-11和空位延伸罚分-1。“-W”选项设定为默认值0。这意味着，如果不设定，字长默认值对于蛋白为3，对于核苷酸为11。设置读入：

<<README.bls.txt>>

>------------------------------------------------------------------------------

>blastall arguments:

>

>-p Program Name[String]

>-d Database[String]

>default＝nr

>-i Query File[File In]

>default＝stdin

>-e Expectation value(E)[Real]

>default＝10.0

>-m alignment view options:

>0＝pairwise，

>1＝query-anchored showing identities，

>2＝query-anchored no identities，

>3＝flat query-anchored，show identities，

>4＝flat query-anchored，no identities，

>5＝query-anchored no identities and blunt ends，

>6＝flat query-anchored，no identilies and blunt ends，

>7＝XML Blast output，

>8＝tabular，

>9 tabular with comment lines[Integer]

>default＝0

>-o BLAST report Outout File[File Out]Optional

>default＝stdout

>-F Filter query sequence(DUST with blastn，SEG with others)[String]

>default＝T

>-G Cost to open a gap(zero invokes default behavior)[Integer]

>default＝0

>-E Cost to extend a gap(zero invokes default behavior)[Integer]

>default＝0

>-X X dropoff value for gapped alignment(in bits)(zero invokes default

>behavior)[Integer]

>default＝0

>-I Show GI′s in deflines[T/F]

>default＝F

>-q Penalty for a nucleotide mismatch(blastn only)[Integer]

>default＝-3

>-r Reward for a nucleotide match(blastu only)[Integer]

>default＝1

>-v Number of database sequences to show one-line descriptions for(V)

>[Integer]

>default＝500

>-b Number of database sequence to show alignments for(B)[Integer]

>default＝250

>-f Threshold for extending hits，default if zero[Integer]

>default＝0

>-g Perform gapped alignment(not available with tblastx)[T/F]

>default＝T

>-Q Query Genetic code to use[Integer]

>default＝1

>-D DB Genetic code(for tblast[nx]only)[Integer]

>default＝1

>-a Number of processors to use[Integer]

>default＝1

>-O SeqAlign file[File Out]Optional

>-J Believe the query defline[T/F]

>default＝F

>-M Matrix[String]

>default＝BLOSUM62

>-W Word size，default if zero[Integer]

>default＝0

>-z Effective length of the database(use zero for the real size)

>[String]

>default＝0

>-K Number of best hits from a region to keep(off by default，if used a

>value of 100 is recommended)[Integer]

>default＝0

>-P 0 for multiple hits 1-pass，1 for single hit 1-pass，2 for 2-pass

>[Integer]

>default＝0

>-Y Effective length of the search space(use zero for the real size)

>[Real]

>default＝0

>-S Query strands to search against database(for blast[nx]，and

>tblastx).3is both，1is top，2is bottom[Integer]

>default＝3

>-T Produce HTML output[T/F]

>default＝F

>-1 Restrict search of database to list of GI′s[String]Optional

>-U Use lower case filtering of FASTA sequence[T/F]Optional

>default＝F

>-y Dropoff(X)for blast extensions in bits(0.0invokes default

>behavior)[Real]

>default＝0.0

>-Z X dropoff value for final gapped aligmnent(in bits)[Integer]

>default＝0

>-R PSI-TBLASTN checkpoint file[File In]Optional

>n MegaBlast search[T/F]

>default＝F

>-L Location on query sequence[String]Optional

>-A Multiple Hits window size(zero for single hit algorithm)[Integer]

>default＝40

实施例2：PLC介导的脱胶的模拟

该实施例描述了磷脂酶C(PLC)介导脱胶的模拟。

由于在水中磷脂酰胆碱(PC)的溶解性差，起初将磷脂酰胆碱溶解于乙醇中(100mg/ml)。对于初步测试，制备了PC的储存溶液，是在pH 6的50mM的3-吗啉基丙磺酸或60mM柠檬酸/NaOH中。，将PC储液(10μl，1μg/μl)加入到Eppendorf管中的500μl精炼的大豆油(含2％的水)中。为了产生乳状液，将管中的内容物通过涡流振荡混合3分钟(参见图5A)。油和水相通过在13,000rpm离心1分钟来分离(图5B)。反应管在所需的温度下(37℃、50℃或60℃)进行预温育，并且加入3μl来自蜡状芽孢杆菌(Bacillus cereus)的PLC(0.9U/μl)至水相(图5C)。通过用氯仿/甲醇/水(65∶25∶4)作为溶剂系统的TLC对PC的消失进行分析(参见如Taguchi(1975)，见上文)，并且在暴露于碘蒸汽后可以被观察到。

图5示意性地说明了用于模拟PLC-介导的脱胶的两相系统模型。图5A：通过混合粗制油与2％的水，来水合污染的磷脂(P)，产生乳状液。图5B：离心后分离水相和油相，并将PLC加入到水相中，其含有沉淀的磷脂(“胶”)。在水相中发生了PLC的水解。图5C：通过从水相中抽取等分试样并用TLC对它们进行分析，监控反应的时间进程。

实施例3：磷脂酶的表达

该实施例描述了构建可以表达多种磷脂酶(包括本发明的酶)的本发明的商业生产菌株。为了产生适合用于对食品级植物油(包括大豆、芥花和向日葵)脱胶的多酶制剂，可以产生在同一表达宿主中表达两种不同磷脂酶序列的重组表达菌株。例如，可以构建该菌株以含有一个或多个拷贝的PLC基因，和一个或多个拷贝的磷脂酰肌醇-PLC基因。这些基因可以存在于一个质粒、多个质粒上，或者这些基因可以通过同源重组被插入到表达宿主的基因组中。当这些基因通过同源重组导入时，它们可以作为DNA表达盒导入宿主基因组中的单个位点中，所述表达盒含有一个或多个拷贝的两个基因。可选择地，每个基因的一个或多个拷贝可以导入宿主染色体中的不同位点。这两个基因序列的表达可以由一种类型的启动子驱动，或者每一基因序列可以由独立的启动子驱动。根据每一基因的拷贝数和启动子的类型，最终的菌株将表达变化比例的每一活性酶类型。表达菌株可以用任何的杆菌(例如蜡状芽孢杆菌)或链霉菌、大肠杆菌、粟酒裂殖酵母、巴斯德毕赤酵母或者其它革兰氏阴性、革兰氏阳性或酵母表达系统来构建。

在一个方面，本发明提供了对大豆油进行脱胶的双酶系统，其中至少一种酶是本发明的酶。PLC加上PI-PLC比单独使用其中一种酶产生更多的DAG。然而，两种酶都比无酶对照样品产生更多的DAG。在一个方面，反应条件包括1毫升大豆油、在任何添加之前油中初始水分含量～0.4％、50℃、用2.75M NaOH中和的0.2％柠檬酸、10U PLC、15μL PI-PLC(0.45mg总蛋白)，1小时总反应时间。图12所示的表概述了从本发明的该双酶脱胶系统获得的数据。

在另一方面，本发明的PI-PLC酶可以在与PLC中所述相同的条件下使用。这些条件包括植物油的化学精炼和植物油的水脱胶。

实施例4：具有提高的表达水平和改变的蛋白酶抗性的磷脂酶

本发明提供了挑选磷脂酶C变体(突变体)的方法，该磷脂酶C在糖基化宿主中具有提高的表达水平并对其所分泌的蛋白酶具有改变的抗性。

在糖基化宿主中提高的表达水平

潜在的天冬酰胺-连接的糖基化位点具有氨基酸共有序列—天冬酰胺-任何氨基酸-丝氨酸或苏氨酸(在单字母氨基酸代码中为NXS/T)，用诱变方法将其敲除，以便将糖基化识别基序中的天冬酰胺或丝氨酸或苏氨酸改变成不同的氨基酸，因此序列不再编码潜在的糖基化位点。糖基化位点的去除在下述位置实现：本发明的磷脂酶C的氨基酸位置氨基酸63，氨基酸131，和氨基酸134，该磷脂酶C具有如SEQ ID NO：2中所阐述的序列，例如由SEQ ID NO：1来编码。当该蛋白在酵母—巴斯德毕赤酵母中异源表达时，其糖基化位点的消除提高这种变体—活性磷脂酶C(PLC，SEQ ID NO：2)的表达水平。这种减少或消除PLC酶中的潜在糖基化位点的策略可以提高活性PLC在任何糖基化宿主中的表达水平。因此，本发明提供了具有任何本发明的示例性磷脂酶的序列的磷脂酶(和编码它们的核酸)，其中一个或多个或所有糖基化位点已被改变，如上所述。因此，本发明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方法，其中该方法包括修饰本发明的磷脂酶编码序列，以便一个、若干个或所有N-连接糖基化位点编码基序被修饰成非糖基化基序。本发明也提供了由该方法制备的磷脂酶编码序列，和它们所编码的酶。

改变的蛋白酶抗性

本发明提供了制备变体磷脂酶编码序列的方法，该序列编码对蛋白酶具有增加的抗性的磷脂酶，该方法包括将等同于SEQ ID NO：2的位置131上的氨基酸修改成下述的一个、若干个或所有残基：赖氨酸(K)；丝氨酸(S)；甘氨酸(G)；精氨酸(R)；谷氨酰胺(Q)；丙氨酸(A)；异亮氨酸(I)；组氨酸(H)；苯丙氨酸(F)；苏氨酸(T)；甲硫氨酸(M)；亮氨酸(L)，包括具有这些示例性修改的SEQ ID NO：2的变体(和编码它们的核酸)。本发明也提供了由该方法制备的序列所编码的分离的、合成的或重组的磷脂酶。本发明也提供了制备变体磷脂酶编码序列的方法，该序列编码对蛋白酶具有减少的抗性的磷脂酶，该方法包括将等同于SEQ ID NO：2的位置131上的氨基酸修改成下述的一个、若干个或所有残基：色氨酸(W)；谷氨酸(E)；酪氨酸(Y)，包括具有这些示例性修改的SEQ ID NO：2的变体(和编码它们的核酸)。本发明也提供了由该方法制备的序列所编码的分离的、合成的或重组的磷脂酶。

将含有天然分泌的巴斯德毕赤酵母蛋白酶的混合物的上清液与野生型和突变型PLC酶制剂混合并温育。终止反应，与无蛋白酶阴性对照相比，通过SDS-PAGE，显现降解结果。通过测量残留PLC活性也可以测定降解结果。通过观察发现了新奇现象，即某些敲除糖基化作用的突变显著改变该表达的磷脂酶在发酵期间对降解的敏感性。该方法的优势是在生产期间直接选择对宿主生物分泌的蛋白酶具有增加的或减少的抗性的突变体。

本发明的这种方法可以使用定点诱变(例如GSSM^TM)来改变本发明的磷脂酶C的氨基酸序列，例如如下所示，SEQ ID NO：1编码的SEQ ID NO：2的子序列。将红色标出的每一氨基酸(下面)由天冬酰胺(单字母代码中为N)改变为天冬氨酸(D)、丝氨酸(S)或另一氨基酸，如下所述。这些氨基酸被命名为下面序列中的氨基酸63、氨基酸131和氨基酸134，其中色氨酸(W)命名为氨基酸1。进行这些突变，以通过减少在巴斯德毕赤酵母表达系统中表达的蛋白的糖基化作用来增加活性磷脂酶C蛋白(SEQ ID NO：176)的表达水平。这些相同的突变可以增加本发明的任何活性磷脂酶C在任何其他表达系统中的表达水平，所述表达系统根据NXS/T系统对天冬酰胺进行糖基化(N-连接的糖基化)，其中N是天冬酰胺，X是任何氨基酸，S/T是丝氨酸或苏氨酸。因此，本发明也提供了通过改变位置131处的氨基酸来改变表达的磷脂酶C的敏感性的方法。

SEQ ID NO：2的氨基酸38-282，包括三个特定修饰，该全长磷脂酶C蛋白序列氨基酸序列为SEQ ID NO：175。注意：为了计算变化的位置，将第一个氨基酸(W)计为位置1。WSAEDKHNEGINSHLWIVNRAIDIMSRNTTIVNPNETALLNEWRADLENGIYSA DYENPYYDDSTYASHFYDPDTGTTYIPFAKHAKETGAKYFNLAGQAYQNQDM QQAFFYLGLSLHYLGDVNQPMHAASFTDLSYPMGFHSKYENFVDTIKNNYIVS DSNGYWNWKGANPEDWIEGAAVAAKQDYPGVVNDTTKDWFVKAAVSQEYA DKWRAEVTPVTGKRLMEAQRVTAGYIHLWFDTYVNR- 如下面所述，将表达的磷脂酶C变体在存在巴斯德毕赤酵母蛋白酶的情况下温育，获得以下结果：

在SEQ ID NO：2的氨基酸位置131的以下氨基酸增加了表达的磷脂酶C对巴斯德毕赤酵母蛋白酶降解作用的抗性：赖氨酸(K)；丝氨酸(S)；甘氨酸(G)；精氨酸(R)；谷氨酰胺(Q)；丙氨酸(A)；异亮氨酸(I)；组氨酸(H)；苯丙氨酸(F)；苏氨酸(T)；甲硫氨酸(M)；亮氨酸(L)。在SEQ ID NO：2的氨基酸位置131的以下氨基酸减少了表达的磷脂酶C对巴斯德毕赤酵母蛋白酶降解作用的抗性：色氨酸(W)；谷氨酸(E)；酪氨酸(Y)。因此，本发明提供了变体磷脂酶，其具有任何其中之一或若干或所有这些修饰，这取决于是否需要增加或减少表达的磷脂酶C对蛋白酶降解作用的抗性。本发明提供了在等同于SEQ ID NO：2的位置131上具有任何其中之一或若干或所有这些修饰的变体磷脂酶。该残基等同于SEQ ID NO：2的位置131，并且对任何特定氨基酸残基的修饰是否可以增加或减少该酶对蛋白酶降解作用的抗性，可以通过本领域熟知的方案常规地和预测性地确定，例如用于评价磷脂酶C(SEQ ID NO：2，由SEQ ID NO：1编码)的蛋白酶敏感性的示例性分析方法，如下所述：

缓冲液：

。1.0M MES，pH 6.2

。0.7M醋酸钠(“NaAc”)，pH 5.2

测试：

。使用独立的1.5mL微量离心管

。向25μL PLC酶样品，加入5μL NaAc或7μL MES缓冲液，并混合

。加入25μL含蛋白酶的巴斯德毕赤酵母上清液，并混合

。加入2μL 5％叠氮化钠，并混合

。在加湿温育器中，将管置于盛有水的预热烧杯中的悬浮架上

。对照包括PLC+缓冲液+dH₂O，和毕赤酵母SN+缓冲液+dH₂O

。温育0-24小时，如果需要，在多个时间点取样。

检测

。将样品按1∶2与含5mMEDTA的样品缓冲液混合，100℃加热4分钟，冷却，离心，混合，每泳道加载5μL样品，考马斯(Coomassie)染色，在SDS-PAGE上显现结果。

。也可以直接采取样品和时间点进行标准PLC活性分析。

结果：

SDS-PAGE跑胶，结果显示在图17中；其显示了体外消化试验的结果，其中磷脂酶C变体在粗蛋白酶提取物中37℃温育最高达22小时。根据序列“DXD”(氨基酸位置63的天冬氨酸-氨基酸位置131的任何氨基酸-氨基酸位置134的天冬氨酸)的“X”位置发现的氨基酸，命名每一PLC突变体。这些凝胶显示了用粗蛋白酶温育后，表达的PLC变体蛋白的稳定性或敏感性。稳定的变体在″-″(无蛋白酶反应的对照)和″+″(反应含有蛋白酶)泳道中显示出具有相似染色强度的PLC带。与″-″泳道相比，在″＝″泳道中，对蛋白酶更敏感的变体将显示出PLC蛋白带染色强度的减少。

实施例5：获得稳定的高水平表达PLC的方法

本发明提供了在酵母培养物例如巴斯德毕赤酵母培养物中获得具有稳定的高水平表达和高比活性的磷脂酶例如PLC的发酵工艺。由该方法生产的酶可以用于例如植物油精炼，诸如大豆、芥花、向日葵或其他油。

本发明提供了生产工艺，该工艺具有这样的特征，即能够在酵母细胞培养物，例如巴斯德毕赤酵母，如在分批喂料培养物中以g/l水平，生产活性磷脂酶，例如PLC。在微生物培养物中活性PLC蛋白的异源表达仅以mg/l的水平在文献中偶有描述。此外，本发明的工艺是基于这样的发现，在毕赤酵母培养物中PLC蛋白的表达削弱了对MeOH的吸收能力，但是无其它研究过的生理生长特征。与毕赤酵母培养物中常规的异源蛋白表达相反，需要高水平的共-喂料比率(highco-feed rates)(葡萄糖/或甘油)。除提高酶的生产特征外，较高水平的共-喂料比率也消除了普通蛋白酶活性的表达，该蛋白酶活性与PLC降解相关。此外，通过在具有Mut⁺表型的毕赤酵母菌株中产生PLC而不损害与Mut⁺表型相关(并且因此，不以工业级使用)的可测量测试，可以克服较差的MeOH利用率特征，从而进一步提高产生特征。因此，相比于通常用于工业规模的毕赤酵母系统的条件，本发明的该工艺将活性PLC的生产率提高＞50-倍(从使用常规方法的100U/ml提高至＞5000U/ml全肉汤；＞5g/l蛋白)。此外，因为PLC是需要结合锌以获得正确的折叠和活性的金属酶，在一个方面，本发明包括补充锌。对本发明的培养物而言，该锌补充策略使得PLC活性如同全肉汤培养物中一样，几乎完全稳定(＜5％的活性丧失)，例如在4℃下，＞5天。这明显有助于回收工艺，因为1)不稳定蛋白活性的产生在回收工艺期间继续恶化，和2)其赋予了更大的工艺灵活性，特别是以大规模水平。

色氨酰基氨肽酶微量培养板分析

本发明提供了色氨酰基氨肽酶微量培养板分析方法，其被开发用于测定毕赤酵母发酵各时间点样品中的相对色氨酰基氨肽酶活性。该分析的通量能力足以满足从大量发酵反应中的多个时间点进行取样。

材料与方法

缓冲液：

·15mMNaPO₄，2mM MnCl₂，pH 7.5，aq.

底物

·HTrp-AMC(Bachem，I1670)

底物溶液：

·将底物溶于10mM甲醇中

·将100μL 10mM底物加入6mL缓冲液中

样品：

·毕赤酵母发酵各时间点的样品

·离心除去细胞。

微量培养板制备：

·就每一份样品复制品、空白和参考，给空96孔板(black 96-well)每孔等分加入90μl的底物溶液，

·将微量培养板置于荧光微量培养板阅读台上(例如SpectraMax，MolecularDynamics)

样品的添加和反应动力学：

·设置荧光微量培养板阅读器：

。Ex.350nm/Em.460nm；自动切断(455nm)；PMT中等；每孔3次阅读；自动校准“开”

。RT(室温)

。0-30分钟时程；每30秒阅读一次

。在第一次阅读之前，初始化设备板的混合功能，混合5秒

·将样品按96-孔形式等分，并用多通道移液器以每孔10μL转移样品

·取下盖子，重新将微量培养板放置在微量培养板阅读器中

·开始读数

根据未知样品的固有活性，可以改变样品稀释度，分析持续时间和动力学取样，以及可以用常规筛选方法测定的所有变量。

底物已经显示出在这些条件下非常稳定，阴性对照空白显示出其吸光率没有随时间变化而增加。

Bodipy BSA蛋白酶微量培养板分析

本发明提供了Bodipy BSA蛋白酶微量培养板分析方法，以帮助测定毕赤酵母发酵各时间点样品中的总蛋白酶活性。该分析的通量能力足以满足从大量发酵反应中进行多时间点取样。

材料与方法

底物：

·DQ BSA green(Molecular Probes，D 12050)

底物溶液：

·将一瓶底物(1mg)中的内含物溶于1mL含有0.1％叠氮化钠的水中

样品：

·毕赤酵母发酵各时间点的样品

·离心除去细胞。

阳性对照：

·0.2mg/mL枯草杆菌蛋白酶(Sigma，P5380)，于50mM NaPO₄，pH 7.5中

·在水中连续稀释

微量培养板制备：

·就每一样品复制品、空白和参考，等分地给空96-孔板(black 96-well)的每孔中加入90μl的底物溶液

样品的添加和反应

·按96-孔的形式等分样品，并使用多通道移液器以每孔10μL转移样品

·替换微量培养板的盖子，用箔包裹，在37℃置于加湿温育器中，温育3-4小时或过夜

荧光测量：

·设置荧光微量培养板阅读器：

。Ex.495nm/Em.525nm；自动切断(515nm)；PMT低；每孔3次阅读；自动校准“开”

。RT

选择Bodipy BSA作为通用蛋白酶底物。缺少对bodipy BSA的水解并不表明不存在蛋白酶，但是已经显示其与PLC酶的水解和PLC活性的丧失相关。已经证明，BSA可以用bodipy卵清蛋白或酪蛋白替代。

在一个方面，在整个发酵时程内表征蛋白酶活性是有用的，这是因为该活性可以是临时性的和瞬时的。

在全培养肉汤或上清液中PLC活性的测量：

本发明提供了在全培养肉汤或上清液中进行的PLC活性测量分析方法；该分析方法是对Edward A.Dennis(1973)Kinetic dependence of phospholipase A2 activity on the detergent Triton X-100.J.Lipid Res.14：152-159，USP 24/NF 19，Pancrealipase-Assay for lipase activity.第1256-1257页中描述的方法的修改。本发明的PLC活性测量分析方法包括：

溶液：

100mM硫酸锌溶液

100mM氯化钙溶液

底物溶液(20mM磷脂酰胆碱，40mM Triton X-100，5mM氯化钙)

稀释缓冲液(0.1％Triton X-100，1mM硫酸锌，1％阿拉伯树胶)

分析程序：

-用稀释缓冲液(1.0％阿拉伯树胶，1.0％Triton X-100，1mM硫酸锌)制备待分析样品的稀释液。在分析前用冰冷的缓冲液现制备稀释液，并保藏在冰浴中，直到使用。

-将20mL的底物溶液转移入约50mL容量的带夹套的玻璃管，该玻璃管的外室与恒温控制的水浴相连。覆盖混合物，并用机械搅拌装置持续搅拌。将混合物的温度维持在37±0.1℃，从通过盖子上的孔插入的微量滴定管，用0.01N KOH VS预滴定底物，将pH调节至7.3。加入50μL的酶稀释液，然后自动持续添加0.01NKOH VS6分钟，将pH维持在7。

此外，对发酵罐培养物进行标准的PAGE凝胶电泳，Western和Northern印迹分析以及以在线/离线获得发酵参数(生物量水平、气体分析等)的标准分析技术。

产生Mut⁺表型毕赤酵母菌株

本发明提供了细胞，细胞系统，和表达磷脂酶C的方法，该方法包括使用具有Mut⁺表型的毕赤酵母菌株。该方法包括将编码异源PLC的核酸插入毕赤酵母菌株中。然后在表达PLC的条件下培养该细胞。该方法可以进一步为所述培养条件补充锌。

在一个方面，这些方法，细胞和细胞系统使用SEQ ID NO：2，其是需要锌的金属酶。在一个方面，它以3摩尔(复数)/摩尔的量使用。它的MW近似28kDa，pI近似5.2，并具有宽的底物耐受性：PC＞PE＞PS＞＞PI。未加工的酶具有24个氨基酸的信号序列，13个氨基酸的前序列，和245个氨基酸残基的“成熟”酶。

在一个方面，本发明的Mut⁺毕赤酵母菌株具有两个拷贝的醇氧化酶(AOX)基因，AOX1和AOX2，在转化期间受到影响(“Mut”代表“甲醇利用率(MethanolUtilization)”)，如下所述：

·Mut⁺

·单交换事件，AOX1和AOX2基因完整

·单独依靠甲醇生长和表达。可能共喂料

·Mut^s

·双交换事件，破坏AOX1基因

·共喂料提高生长和表达

·Mut^-

·重组事件破坏AOX1和AOX2基因

·不能代谢甲醇，需要共喂料

总之：Mut^-＜Mut^s _plc＜Mut^s/Mut⁺ _plc＜Mut⁺

在Mut⁺和Mut^s之间存在发酵差异，包括：

·甲醇的最佳诱导浓度

·氧消耗率

·由于更快的吸收能力，依靠甲醇，Mut⁺生长比Mut^s快

·诱导之后，容易度过过渡期

·Mut⁺不用于大规模表达

·通风/冷却能力，MeOH敏感性

巴斯德毕赤酵母的甲醇利用途经是本领域所熟知的。醇氧化酶(AOX)将甲醇催化转变为甲醛；因此，如果AOX被过量表达，导致“腌渍的”酵母细胞。

在本发明的一个方面，使用巴斯德毕赤酵母的示例性发酵方案，包括：

·种子培养(瓶或桶)

·在丰富培养基中进行分批发酵，以增加生物量

·分批发酵罐培养

·分批阶段(甘油)

·随着初始碳源被消耗，生物量增长

·葡萄糖或甘油喂料阶段

·由D.O.含量引发喂料添加，或线性/指数喂料

·增长至足够的生物量，以进行诱导和表达(无乙醇，C-受限的)

·甲醇诱导

·喂料是受调控的(D.O.％，MeOH传感器，RQ)，或者预先设置的喂料方案

·与葡萄糖或甘油共喂料，取决于表型和表达参数

·Mut⁺诱导，以1-3g/L MeOH

·Mut^s诱导，以4-7g/LMeOH

图18示出了分批发酵罐培养的结果，如上所述，仅使用甘油。蛋白酶活性来自毕赤酵母中的内源性蛋白酶。分批发酵可以是丰富培养基，以增加生物量。如在图18中所示，在约69小时开始的蛋白酶活性的逐步增加对应于PLC活性的逐步减少。较高的甘油(glyc)共喂料速率提高了活性PLC的表达，减少(消除)了蛋白酶的产生，如下面数据概括表所示：

共喂料速度 (ml/min)

诱导之前 /之后的碳源

诱导 OD

PLC活性 (U/ml sup)

消耗的 MeOH(L)

Bodipy蛋白酶

最终OD

0.5 1.5 2 2.5 3

Glyc/Glyc Glyc/Glyc Glyc/Glyc Glyc/Glyc Glyc/Glyc

250-300

100 1100 1550 1550 1715

1 1.7 1.3 1.4 1.4

是否否否否

450 680 860 900 820

这些研究在30-L BB发酵罐中、以DSD-PLC进行。测量0UR或Vol.氧吸收率(Vol.Oxygen Uptake Rate“OUR”)，作为良好表达的‘总培养物健康’指标，或‘生物标记(Boomarker)’。图19示出了该研究的结果，产生DSD-PLC的巴斯德毕赤酵母MutS 30L培养物的OUR曲线比较结果，使用1700U/ml、1100U/ml和100U/ml的PLC，温度为30℃，甘油共喂料，如上所述。

图20示出了产生DSD-PLC，pH 6.2(1100U/ml和100U/ml PLC)，或异源蛋白的巴斯德毕赤酵母Mut^S 30L培养物的甲醇消耗曲线比较结果，以甘油共喂料，如上所述。这是需求-驱动型(demand-driven)MeOH喂料，残余MeOH水平控制在4g/l。

此外，Mut⁺表型提高活性PLC表达水平，并增强MeOH吸收，如该数据表格所概括的：

Mut

共喂料速度 (ml/min)

诱导 OD

PLC活性 (U/mlsup)

消耗的 MeOH (L)

Bodipy 蛋白酶

最终OD

S

0.5 1.5 2 2.5 3

250-300

100 1100 1550 1550 1715

1 1.7 1.3 1.4 1.4

是否否否否

450 680 860 900 820

[0908]

+

0.5 0.5 1 1 1 1.5 1.5 1.5 2

250-300

1001 1200 1786 2010 1768 2669 2693 2597 2154

5.6 7 5.9 6.8 7.9 10 7.1 8.1 8.3

是否否否否否否否否

871 908 988 930 700 701 818 804 752

PLC似乎不影响该Mut⁺表型菌株的生理生长特征，该菌株以6×拷贝数表达重组PLC SEQ ID NO：2，数据在图21中示出，OUR图如附图说明中所阐述。只是供应-驱动型(supply-driven)MeOH喂料，在Mut⁺培养物中无残留的葡萄糖或MeOH。

此外，产生的PLC蛋白的质量是可变的，具有不可预测性，例如<<或>>50％的总PLC蛋白具有活性，如图22中的SDS-PAGE结果所代表性示出。该OUR图(如上所论述)数据图解概述被插入到SDS-PAGE示图的上面部分。对照命名为JG＝0.5μl 1.6mg ml^-1。与蛋白酶或氨肽酶活性没有相关性。显著数量的活性PLC位于细胞内，如图23所示(也显示了研究的方案)，其中在细胞内检测到＞700U/mlPLC(在图23中，PLC(SEQ ID NO：2)+α信号肽(来自酿酒酵母属)+糖基化作用)。形态学变化与活性PLC的浓度相关，如图24中所示。形态学变化的大小依赖于菌株和碳源。

增加的Zn并没有促进具有2×拷贝数的Mut⁺SEQ ID NO：2的毕赤酵母的表达，所述Mut⁺SEQ ID NO：2具有DSD突变，如在下面数据表格中所概述的(超过1×的是通过共喂料来供应)(首先，上面一行是空载体对照)。增加的Zn确实提高了作为全肉汤的保藏稳定性(在4℃，＞100h后，具有相类的活性水平)，和总工艺的稳健性。

图25用图表概述的数据显示了在95h TFT(total fermentation time(总发酵时间))时，毕赤酵母中PLC生产性能的状态。在图表右边的5条柱显示了从“Zeo菌株”得到的结果，或生产PLC的巴斯德毕赤酵母菌株的Zeocin适应性。该菌株是抗生素-抗性的、无标记菌株，在巴斯德毕赤酵母中表达作为异源基因的本发明PLC(SEQ ID NO：2)。已经证明，通过用抗生素zeocin来使菌株适应，人们可以获得新的稳定菌株，该菌株具有极大提高的感兴趣蛋白的表达水平。

将原始的抗生素-抗性无标记菌株，菌株#1(含有SEQ ID NO：2)按照一系列稀释步骤进行培养，每一次增加抗生素zeocin的浓度。在每一步骤，将前面步骤的一部分培养物用新鲜培养基稀释至在600nm的光密度(OD600)为1.0，并将增加数量的zeocin加入到新的培养基中，再生长24小时。在最后阶段，使用200ug/ml的zeocin浓度，将最终培养物划线接种到MD/YPD板上，以使单菌落生长。结果发现，来自最终阶段培养物的菌落显示出对zeocin高度耐受性，而亲代菌株则显示出非常低的耐受性。其中一个菌落，菌株#2(含有SEQ ID NO：2)相比起原始PLC菌株，菌株#1，显示出显著提高的(约70％以上)PLC表达水平。同样证明了，在传代40代之后，菌株#2在zeocin耐受性和PLC表达上都是稳定的，这表明新菌株获得“永久性的”高PLC表达和zeocin耐受性的性状。

通过使用本发明的“Zeo菌株”(Zeocin毕赤酵母适应型)获得高水平的PLC活性：4100u/ml，在小罐(mini-tanks)中。该结果来自包含6×DSD SEQ ID NO：2的毕赤酵母菌株。简而言之，该SEQ ID NO：2表达菌株通过在一系列的步骤中进行培养而“适应”，每一步骤都使用增加的zeocin浓度。明显地，该适应方法迫使菌株/构建物发生一些变化(在分子或遗传水平上)，并使PLC活性水平显著提高。

示例性的结果是：

·罐1、2和4(每一个代表不同的菌落)的表现都超出原始预适应的SEQ ID NO：2-表达菌株，罐1和4都达到4100u/ml，罐2达到3500u/ml。

·罐1和4早在75hrs时就达到3000u/ml以上，这表示：比原始预适应的SEQ IDNO：2-表达菌株(其在此时通常远低于2000u/ml)具有更快的活性积聚水平。

实验设计和结果的详细内容是：

zeocin适应的基本原理：

有关PLC表达的早期工作是在毕赤酵母pPICZa载体中完成的，该载体含有zeocin-抗性标记。zeocin因此被用于转化选择。后来，我们转换到AMR-较少形式的构建物(AMR-less version construct)以开发商业候选产品。当进行小罐发酵时，我们观察到使用AMR-less构建物获得PLC活性水平显著下降：在pPICZa-DSD构建物中，上清液活性达到4000u/ml，而在2×DSD中仅获得ca.2000u/ml。使用 AMR-less构建物，也观察到明显的生理差异，例如较低的甲醇消耗率和更多的细胞裂解，特别是当使用同样的发酵方案测试较高拷贝数的(5×、6×)构建物时。

pPIZa构建物和AMR-less构建物之间的明显差异之一是在转化过程中zeocin的使用，问题是细胞有可能依靠什么来度过zeocin选择。本发明提供了在zeocin存在下培养AMR-less构建物的方法，然后使细胞经受某些有利于PLC表达的变化。

2×DSD的Zeocin适应实验：

实验首先用2×DSD(因为此时它是转移分子)进行。该研究以1ug/ml的zeocin浓度(″zeo 1″)开始，使培养物生长～24hrs。从那时起，进行各步骤，将zeocin浓度增加至zeo 5、zeo 10、zeo 15、zeo 20、zeo 40、zeo 60、zeo 80、zeo 100，最后增加至zeo 200(zeo 100通常用于转化选择)。每一步骤都使用新鲜的培养基，并将前一阶段的培养物用于接种下一阶段的培养物，OD值为1.0，生长～24hrs。将每一阶段的培养物划线接种于YPD板，用于保藏以及获得单菌落。

zeo-适应菌落的小罐发酵结果：

为了检测zeocin适应的效果，从zeo 200和zeo 100培养物(其被划线接种于YPD板)挑选12个菌落，并用小罐筛选。结果总结在幻灯片(slide)6中。我们能够发现若干菌落的表现明显超出原始构建物(含SEQ ID NO：2的毕赤酵母菌株)。其中，来自zeo 200培养物的菌落#5显示PLC活性水平提高约50％。对筛选的观察如下：

·zeo-适应的培养物和原始的SEQ ID NO：2-表达菌株之间的生长曲线没有明显的差异。

·尽管已适应的培养物的稳定性没有被广泛测试，它们还是在无zeocin存在的YPD和/或MD板上被重新划线接种了若干次。所有发酵过程也是在无zeocin存在下进行的。

·菌落与菌落之间有明显的变化，无论是生长上的还是PLC表达上的。

·有关发酵的一些技术问题可能部分地是这些变化所致。

在6×DSD上进行Zeocin适应试验

受来自zeo-适应2×DSD的结果的鼓舞，我们随后对6×DSD(此时测定得知其优于2×DSD)进行了同样的试验。我们以zeocin浓度5ug/ml(″zeo 5″)开始，并使培养物生长～24小时。从那时起，进行各个步骤，将zeocin浓度增加至zeo 15、zeo 30、zeo 50、zeo 100，最终至zeo 200。与2×DSD相同，每一步骤都使用新鲜的培养基，并将前一阶段的培养物用于接种下一阶段的培养物，OD值为1.0，生长～24hrs。将每一阶段的培养物划线接种于YPD板，用于保藏以及获得单菌落。

zeo-适应的6×DSD菌落的小罐发酵结果

挑选来自zeo 200培养物(其被划线接种于MD板)的六个菌落，并与小罐中的原始SEQ ID NO：2-表达菌株一起测试。关键的观察结果如下：

·所有三个菌落(罐1、2和4)的表现都超出原始SEQ ID NO：2-表达菌株，罐1和4都达到4100u/ml，罐2达到3500u/ml。

·罐1和4早在75hrs时就达到3000u/ml以上，这表示与SEQ ID NO：2-表达菌株(其在此时通常远低于2000u/ml)相比，具有更快的活性积聚水平。

·相比起在10-L罐中进行的3000u/ml，在罐1、2和4中的PLC表达水平也似乎是较高(参见幻灯片4)。因此不清楚是否表观比活性在罐1、2和4中较高，即，是否所产生的PLC不同于原始SEQ ID NO：2-表达菌株。

·对照，罐7和8此时未达到3000u/ml。不清楚是否罐1、2和4能达到更高的水平。应注意，百分比的增加(35％，4100u/ml对3000u/ml)是小于2×适应的培养物。

·图26给出了对来自6×DSD zeocin-适应的菌落表达筛选的概述。原始菌株最高的活性水平为～3000u/ml(小罐和10-L)；zeocin-适应的6×DSD的活性水平为4100u/ml(增加～35％)。图27的数据显示，相比起在10-L罐(和罐条件)中的3000u/ml，罐1、2和4中的PLC蛋白水平较高，如上所述(凝胶载量是1.0ul的5×稀释肉汤，0.2ul的全肉汤)。图28显示了zeo-适应的菌落与对照的生长比较。相比起原始SEQ ID NO：2-表达菌株，Zeocin-适应的6×DSD菌落(6×DSD)具有相似的生长曲线。

在C-限制的好氧酵母培养物中，分泌蛋白的Qp，在μ＝0.10h^-1下，一般为0.5-2.5mg/g.h^-1。基于400mg/g DW的蛋白含量，“代谢载荷(metabolic burden)”小于总蛋白生产率的10％。在整个发酵期间，PLC mRNA水平保持在高水平上，这与表达并不相关。基于5g/l(150g)PLC蛋白，少于总5mol C/h的0.1mol C/h(总C的～2％被消耗)成为PLC中的碳，～25％成为生物量。在这些生产条件下，PLC活性似乎没有影响一般的生长生理特征(除MeOH利用能力受影响外)。

总之，本发明提供了zeocin-抗性酵母细胞系统，诸如酵母细胞，细胞系和/或单细胞，用于表达由下述方法制备的异源蛋白(例如酶，诸如PLC)，该方法包括下述步骤：提供包含能够表达异源蛋白的异源核酸(例如，包含酶编码序列的载体；可操作性连接到启动子的ORF)的毕赤酵母某种(例如巴斯德毕赤酵母)的细胞；将细胞(许多细胞)培养在包含起始浓度(该浓度足够低以便一些细胞存活，而足够高以选择抗生素抗性细胞)的zeocin的条件下；选择对起始浓度的zeocin具有抗性的细胞，并重新培养在包含较高浓度的zeocin的条件下；选择对较高浓度的zeocin具有抗性的细胞。本发明也提供了该方法制备的酵母细胞，细胞系和/或单细胞。常规的筛选方法能够确定使用什么起始浓度的抗生素，需要或期望多少轮的选择，和如何快速增加各轮选择之间的抗生素浓度。

实施例6：热稳定性PLC

本发明提供了热稳定性磷脂酶。具有SEQ ID NO：2中所阐明的序列的示例性酶的热稳定性得到了证明。使用SEQ ID NO：2证明了本发明可比较的磷脂的热稳定性。在两个不同的系统中测试了SEQ ID NO：2的活性：水中和在油中。在含水系统中，替代底物(p-nppc)用于测量活性；该酶在86℃开始丧失活性。然而，在油分析中，在85℃，水解大豆油中存在的PC和PE底物时，该酶显示出良好的活性。检测相同的酶的Tm，发现它在15mg/mL时为86℃，并且是不可逆的。

图29示出了使用10U的SEQ ID NO：2时的85℃加热试验的结果，条件如图中所示。图30示出了总结该加热试验的NMR数据。图31、32和33所示出的数据概述了使用p-NPPC时的SEQ ID NO：2的热稳定性，在图中所示的条件下。图34示出了来自DSC分析的数据，显示了SEQ ID NO：2的热稳定性，酶浓度为15mg/mL，Tm为86℃。

序列表

<110>戴弗萨公司

GRAMATIKOVA，Svetlana

HAZLEWOOD，Geoff

BARTON，Nelson

LAM，David

<120>磷脂酶，编码磷脂酶的核酸以及制备和应用磷脂酶的方法

<130>56446-20042.49

<150>10/796,907

<151>2004-03-08

<160>176

<170>FastSEQ for Windows Version 4.0

<210>1

<211>849

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>1

atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcgcc agttcaaagt 60

gtagtatttg cacaaacaaa taatagtgaa agtcctgcac cgattttaag atggtcagct 120

gaggataagc ataatgaggg gattaactct catttgtgga ttgtaaatcg tgcaattgac 180

atcatgtctc gtaatacaac gattgtgaat ccgaatgaaa ctgcattatt aaatgagtgg 240

cgtgctgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat 300

agtacatatg cttctcactt ttatgatccg gatactggaa caacatatat tccttttgcg 360

aaacatgcaa aagaaacagg cgcaaaatat tttaaccttg ctggtcaagc ataccaaaat 420

caagatatgc agcaagcatt cttctactta ggattatcgc ttcattattt aggagatgtg 480

aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct 540

aaatacgaaa attttgttga tacaataaaa aataactata ttgtttcaga tagcaatgga 600

tattggaatt ggaaaggagc aaacccagaa gattggattg aaggagcagc ggtagcagct 660

aaacaagatt atcctggcgt tgtgaacgat acgacaaaag attggtttgt aaaagcagcc 720

gtatctcaag aatatgcaga taaatggcgt gcggaagtaa caccggtgac aggaaagcgt 780

ttaatggaag cgcagcgcgt tacagctggt tatattcatt tgtggtttga tacgtatgta 840

aatcgctaa 849

<210>2

<211>282

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(24)

<223>从环境样品中获得

<400>2

Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala

1 5 10 15

Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro

20 25 30

Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile

35 40 45

Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg

50 55 60

Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp

65 70 75 80

Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro

85 90 95

Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr

100 105 110

Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala

115 120 125

Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln

130 135 140

Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val

145 150 155 160

Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met

165 170 175

Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn

180 185 190

Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn

195 200 205

Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr

210 215 220

Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala

225 230 235 240

Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val

245 250 255

Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile

260 265 270

His Leu Trp Phe Asp Thr Tyr Val Asn Arg

275 280

<210>3

<211>852

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>3

atgaaaagaa aaattttagc tatagcttcc gtaattgctt taacagctcc tatccaaagt 60

gtggcgtttg cgcatgaaaa tggtcaccaa gatccaccaa ttgctctaaa gtggtcagca 120

gaatctatac ataatgaagg agtaagttct catttatgga ttgtaaacag agccattgat 180

attatgtccc aaaatacgac tgttgtgaag caaaatgaga cagctctatt aaatgaatgg 240

cgtacggatc tagagaaagg catttactct gcggattatg aaaacccata ctatgataat 300

tccacattcg cttcacactt ctatgatcct gattcaggaa aaacgtatat tccatttgct 360

aaacaagcaa agcaaacagg agcgaaatat tttaaattag ctggtgaagc ttatcaaaat 420

aaagatctga aaaacgcatt cttttattta ggattatcac ttcactattt aggggatgtc 480

aaccaaccaa tgcatgcagc aaactttact aatatttcgc atccatttgg cttccactca 540

aaatatgaaa atttcgttga tacagtgaaa gacaattata gagtaacgga tggaaatggc 600

tattggaatt ggcaaagtgc aaatccagaa gagtgggttc atgcatcagc atcagcagca 660

aaagctgatt ttccatcaat tgttaatgat aagacgaaaa attggttcct aaaagcagct 720

gtatcacaag actctgctga taaatggcgt gcagaagtaa caccgataac aggaaaacgt 780

ttaatggaag cgcagcgtgt tacagctgga tatatccatt tatggtttga tacgtacgtg 840

aataacaaat aa 852

<210>4

<211>283

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(24)

<223>从环境样品中获得

<400>4

Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala

1 5 10 15

Pro Ile Gln Ser Val Ala Phe Ala His Glu Asn Gly His Gln Asp Pro

20 25 30

Pro Ile Ala Leu Lys Trp Ser Ala Glu Ser Ile His Asn Glu Gly Val

35 40 45

Ser Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln

50 55 60

Asn Thr Thr Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp

65 70 75 80

Arg Thr Asp Leu Glu Lys Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro

85 90 95

Tyr Tyr Asp Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser

100 105 110

Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala

115 120 125

Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys

130 135 140

Asn Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val

145 150 155 160

Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe

165 170 175

Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn

180 185 190

Tyr Arg Val Thr Asp Gly Asn Gly Tyr Trp Asn Trp Gln Ser Ala Asn

195 200 205

Pro Glu Glu Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe

210 215 220

Pro Ser Ile Val Asn Asp Lys Thr Lys Asn Trp Phe Leu Lys Ala Ala

225 230 235 240

Val Ser Gln Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Ile

245 250 255

Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile

260 265 270

His Leu Trp Phe Asp Thr Tyr Val Asn Asn Lys

275 280

<210>5

<211>843

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>5

atgaaaagaa aaattttagc tatagcttct gtaattgctt taacagctcc tattcaaagt 60

gtggcgtttg cgcatgaatc tgatgggcct attgctttaa gatggtcagc ggaatctgta 120

cataatgaag gagtaagttc tcatttatgg attgtaaaca gagcaattga tattatgtcc 180

caaaatacga ctgtggtgaa gcaaaatgag acagctctat taaatgaatg gcgtacgaat 240

ttggaggaag gtatttattc tgcagattat aaaaacccat actatgataa ttccacattc 300

gcttcacact tctatgatcc tgattcagaa aaaacgtata ttccatttgc taaacaagca 360

aagcaaacgg gagcaaagta ttttaaatta gctggtgaag cttatcaaaa taaagatctg 420

aaaaatgcat tcttttattt aggattatca cttcattatt taggggatgt caatcaacca 480

atgcatgcag caaactttac taacatttcg catccatttg gcttccactc aaaatatgaa 540

aacttcgttg atacagtgaa agacaattat agagtaacag atggagatgg ctattggaat 600

tggaaaagtg caaatccaga agagtgggtt catgcatcag catcagcagc aaaagctgat 660

ttcccatcaa ttgttaatga taatacgaaa agttggttcc taaaagcagc ggtatcacaa 720

gactctgctg acaaatggcg tgctgaagta acaccggtaa caggaaaacg tttaatggaa 780

gcacagcgta ttacagctgg atatattcat ttatggtttg atacgtacgt gaataacaaa 840

taa 843

<210>6

<211>280

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(24)

<223>从环境样品中获得

<400>6

Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala

1 5 10 15

Pro Ile Gln Ser Val Ala Phe Ala His Glu Ser Asp Gly Pro Ile Ala

20 25 30

Leu Arg Trp Ser Ala Glu Ser Val His Asn Glu Gly Val Ser Ser His

35 40 45

Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln Asn Thr Thr

50 55 60

Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp Arg Thr Asn

65 70 75 80

Leu Glu Glu Gly Ile Tyr Ser Ala Asp Tyr Lys Asn Pro Tyr Tyr Asp

85 90 95

Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser Glu Lys Thr

100 105 110

Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala Lys Tyr Phe

115 120 125

Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys Asn Ala Phe

130 135 140

Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro

145 150 155 160

Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe Gly Phe His

165 170 175

Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn Tyr Arg Val

180 185 190

Thr Asp Gly Asp Gly Tyr Trp Asn Trp Lys Ser Ala Asn Pro Glu Glu

195 200 205

Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe Pro Ser Ile

210 215 220

Val Asn Asp Asn Thr Lys Ser Trp Phe Leu Lys Ala Ala Val Ser Gln

225 230 235 240

Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys

245 250 255

Arg Leu Met Glu Ala Gln Arg Ile Thr Ala Gly Tyr Ile His Leu Trp

260 265 270

Phe Asp Thr Tyr Val Asn Asn Lys

275 280

<210>7

<211>963

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>7

gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt gttaggggtt 60

ttcgtaccgc tgcagccatc acatgctact gaaaattatc caaatgattt taaactgttg 120

caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca 180

gattatatga gtaatgcaga ttacttcaag ggacatgatg ctctgctctt aaatgagctt 240

tttgacaatg gaaattcgaa catgctgcta atgaacttat ccacggaata tccatatcaa 300

acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat 360

tttgtacccg aagatggcgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata 420

cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat 480

gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa 540

gatactgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc 600

aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac 660

tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc 720

aatgcgccta ccgaatattt agggcatagc tctacttggg acccagaaac gaacagcatt 780

acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa 840

gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg 900

aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa 960

taa 963

<210>8

<211>320

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(29)

<223>从环境样品中获得

<400>8

Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu

1 5 10 15

Leu Leu Gly Val Phe Val Pro Leu Gln Pro Ser His Ala Thr Glu Asn

20 25 30

Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro

35 40 45

Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser

50 55 60

Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu

65 70 75 80

Phe Asp Asn Gly Asn Ser Asn Met Leu Leu Met Asn Leu Ser Thr Glu

85 90 95

Tyr Pro Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp

100 105 110

Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val

115 120 125

Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr

130 135 140

Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr

145 150 155 160

Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His

165 170 175

Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile

180 185 190

Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn

195 200 205

Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met

210 215 220

Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val

225 230 235 240

AsnAla Pro Thr Glu Tyr Leu Gly His Ser Ser Thr Trp Asp Pro Glu

245 250 255

Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His

260 265 270

Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp

275 280 285

Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr

290 295 300

Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys

305 310 315 320

<210>9

<211>999

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>9

atgaaattac tgcgtgtctt tgtgtgcgtt tttgctttac tcagcgcaca cagcaaagcc 60

gatacactta aagtaatggc ttataatatt atgcaactaa acgtacaaga ttgggatcaa 120

gcaaatcgtg cacagcgctt gccaaacgtc atatctcaat taagtgacag tcctgatgtc 180

attcttatca gcgaagcgtt tagcagccaa tcagaatctg cgttagcgca acttgctcaa 240

ctttaccctt atcaaactcc caatgttggc gaagactgta gtggcgctgg ctggcaaagc 300

ttaacgggta actgctcgaa tagccccttt gtgatccgcg gtggagtggt gattttatct 360

aagtacccca tcattacgca aaaagcccat gtgtttaata acagcctgac tgatagttgg 420

gattatttag caaacaaagg tttcgcttat gttgaaatag aaaaacatgg caaacgttac 480

caccttattg gcacgcattt acaagcaacg catgatggcg acacagaagc tgagcatatt 540

gtgagaatgg gtcaattaca agagatacaa gatttcattc aaagcgagca aattcacact 600

tctgagccgg tcattatcgg cggtgatatg aacgtagagt ggagcaagca atctgaaatt 660

acagatatgc tcgaagtggt tcgcagccgt ctaattttca acacacctga agttggctct 720

ttctctgcaa aacacaactg gtttaccaaa gctaacgcct actatttcga ctacagctta 780

gagtataacg acacgctcga ttatgtactt tggcatgcag accataagca acccaccaat 840

accccagaaa tgttagtacg ttacccaaaa gcagagcgtg acttttactg gcgttactta 900

cgcggaaatt ggaacttacc ttctggccgt tattatcatg atggatacta taacgaactg 960

tctgatcact acccagtgca agttaacttt gaattttaa 999

<210>10

<211>332

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(20)

<223>从环境样品中获得

<400>10

Met Lys Leu Leu Arg Val Phe Val Cys Val Phe Ala Leu Leu Ser Ala

1 5 10 15

His Ser Lys Ala Asp Thr Leu Lys Val Met Ala Tyr Asn Ile Met Gln

20 25 30

Leu Asn Val Gln Asp Trp Asp Gln Ala Asn Arg Ala Gln Arg Leu Pro

35 40 45

Asn Val Ile Ser Gln Leu Ser Asp Ser Pro Asp Val Ile Leu Ile Ser

50 55 60

Glu Ala Phe Ser Ser Gln Ser Glu Ser Ala Leu Ala Gln Leu Ala Gln

65 70 75 80

Leu Tyr Pro Tyr Gln Thr Pro Asn Val Gly Glu Asp Cys Ser Gly Ala

85 90 95

Gly Trp Gln Ser Leu Thr Gly Asn Cys Ser Asn Ser Pro Phe Val Ile

100 105 110

Arg Gly Gly Val Val Ile Leu Ser Lys Tyr Pro Ile Ile Thr Gln Lys

115 120 125

Ala His Val Phe Asn Asn Ser Leu Thr Asp Ser Trp Asp Tyr Leu Ala

130 135 140

Asn Lys Gly Phe Ala Tyr Val Glu Ile Glu Lys His Gly Lys Arg Tyr

145 150 155 160

His Leu Ile Gly Thr His Leu Gln Ala Thr His Asp Gly Asp Thr Glu

165 170 175

Ala Glu His Ile Val Arg Met Gly Gln Leu Gln Glu Ile Gln Asp Phe

180 185 190

Ile Gln Ser Glu Gln Ile His Thr Ser Glu Pro Val Ile Ile Gly Gly

195 200 205

Asp Met Asn Val Glu Trp Ser Lys Gln Ser Glu Ile Thr Asp Met Leu

210 215 220

Glu Val Val Arg Ser Arg Leu Ile Phe Asn Thr Pro Glu Val Gly Ser

225 230 235 240

Phe Ser Ala Lys His Asn Trp Phe Thr Lys Ala Asn Ala Tyr Tyr Phe

245 250 255

Asp Tyr Ser Leu Glu Tyr Asn Asp Thr Leu Asp Tyr Val Leu Trp His

260 265 270

Ala Asp His Lys Gln Pro Thr Asn Thr Pro Glu Met Leu Val Arg Tyr

275 280 285

Pro Lys Ala Glu Arg Asp Phe Tyr Trp Arg Tyr Leu Arg Gly Asn Trp

290 295 300

Asn Leu Pro Ser Gly Arg Tyr Tyr His Asp Gly Tyr Tyr Asn Glu Leu

305 310 315 320

Ser Asp His Tyr Pro Val Gln Val Asn Phe Glu Phe

325 330

<210>11

<211>1041

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>11

atggcttcac aattcaggaa tctggttttt gaaggaggcg gtgtaaaggg aatcgcctat 60

atcggcgcca tgcaggtgct ggagcagcgc ggacatttgg agcacgttgt gagggtggga 120

ggaacaagtg caggggctat taacgctctc attttttcgc tgggctttac cattaaagag 180

cagcaggata ttctcaattc caccaacttc agggagttta tggacagctc tttcggattt 240

gtgcgaaact tcagaaggct ctggagtgaa ttcgggtgga accgcggtga tgtgttttcg 300

gagtgggcag gagagctggt gaaagagaaa ctcggcaaga agaacgccac cttcggcgat 360

ctgaaaaaag cgaagcgccc cgatctctac gttatcggaa ccaacctctc caccgggttt 420

tccgagactt tttcgcatga acgccacgcc aacatgccgc tggtggatgc ggtgcggatc 480

agcatgtcga tcccgctctt ttttgcggca cgcagacttg gcaaacgaag cgatgtgtat 540

gtggatggag gtgttatgct caactacccg gtaaagctgt tcgacaggga gaaatacatc 600

gatttggaga aggagaaaga ggcagcccgc tacgtggagt actacaatca agagaatgcc 660

cggtttctgc ttgagcggcc cggccgaagc ccgtacgttt acaaccggca gaccctaggc 720

ctgcggctcg actcgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc 780

aaacagatca accgcttccc cgaatatgcc aaagccctga tcggtgcact gatgcaggtg 840

caggagaaca tccacctgaa aagcgacgac tggcagcgaa cgctctacat caacacgctg 900

gatgtgggta ccacagattt cgacattaat gacgagaaga aaaaagtgct ggtgaatgag 960

ggaatcaagg gagcggaaac ctacttccgc tggtttgagg atcccgaagc taaaccggtg 1020

aacaaggtgg atttggtctg a 1041

<210>12

<211>346

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>12

Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly His

20 25 30

Leu Glu His Val Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile

50 55 60

Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe

65 70 75 80

Val Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly

85 90 95

Asp Val Phe Ser Glu Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly

100 105 110

Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe

130 135 140

Ser His Glu Arg His Ala Asn Met Pro Leu Val Asp Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg

165 170 175

Ser Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys

180 185 190

Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Lys Glu Ala

195 200 205

Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu

210 215 220

Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Lys Ala

260 265 270

Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser

275 280 285

Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asp Ile Asn Asp Glu Lys Lys Lys Val Leu Val Asn Glu

305 310 315 320

Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu

325 330 335

Ala Lys Pro Val Asn Lys Val Asp Leu Val

340 345

<210>13

<211>1038

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>13

atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60

attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca cagagtcgga 120

gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac ggtccgtgag 180

caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt 240

attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat 300

agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360

ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggtat 420

gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc 480

tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgaacgaca agatgtgtat 540

gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt 600

gatctggtca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct 660

cgctttcagc ttgagcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720

ttgcgactgg atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780

aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840

caggaaaaca ttcatctaca tggcgatgat tgggcgcgca cggtctatat cgatacattg 900

gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgagcaa 960

ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg 1020

aatagagtgg agtcatag 1038

<210>14

<211>345

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>14

Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val

20 25 30

Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile

50 55 60

Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val

65 70 75 80

Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly

85 90 95

Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly

100 105 110

Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Glu Arg

165 170 175

Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys

180 185 190

Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Val Lys Asp Pro Gly Ala

195 200 205

Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu

210 215 220

Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln

260 265 270

Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly

275 280 285

Asp Asp Trp Ala Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln

305 310 315 320

Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu

325 330 335

Glu Lys Pro Val Asn Arg Val Glu Ser

340 345

<210>15

<211>1344

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>15

atgctggtca tcattcatgg ctggagcgat gaggcgggct cgttcaagac cctggccaga 60

cgtttggcca aggcgccacc cgagggcctc gggacgcagg tcacggaaat ccatctgggt 120

gattatgtgt ccctggatga ccaggtgacg ttcaatgatc tggtcgatgc catggccaga 180

gcctggagcg atcgtggtct gcccacggcc ccgcgcagcg tcgatgccgt cgtgcacagc 240

accggcggcc tggtgatccg cgactggctc acgcagctgt acacgccgga aacagccccc 300

attcgtcgcc tgctgatgct cgctccggcc aatttcggct cgccgctggc acacaccgga 360

cgcagcatga tcggccgggt caccaagggc tggaagggca cgcggctctt tgaaacgggc 420

aagcacattc tcaaagggct cgaactggcc agcccctacg cctgggcgct ggccgaacgc 480

gatctgttca gcgatcagaa ctattatggc gccgggcgca tcctgtgcac tgtcctggtg 540

ggcaacgccg gttatcgcgg catcagcgcc gtcgccaacc ggcccggcac ggacggcacc 600

gtgcgcgtca gcagcgccaa tctccaagcg gccaggatgc tgctcgattt cagcgccagt 660

ccacaggctg agccggaatt caccctgcac gacagcaccg cggaaattgc cttcggcatc 720

gccgacgagg aagaccacag caccatcgcc gccaaggatc gcggcccgcg caaggcagtc 780

acctgggaac tgattctcaa agccctgcag atcgaggatg caagctttgc tcaatggtgc 840

cggcagatgc aggagcattc cgcggccgtg acggaaacgg cggaaaagcg ccgcaatgtt 900

cactacaaca gcttccagaa taccgtcgtg cgcgtggtgg acaaccacgg tgccgccgtg 960

caggattatc tcatcgagtt ttacatgaat gatgatcgca aactccgcga tcagcgcctc 1020

acccagcgcc tgcaggagca ggtgattacc aacgtgcacg gctacggtga cgacaagtcc 1080

tatcgcagca tgctgatcaa ctgcacggag ctctatgcgc tgatgtccag accgcaggat 1140

cgcctgaaca tcagcatcac cgcctatccg gatctctcca agggactggt ggggtatcgc 1200

acctacacgg acgaggatat cggttccctc tctctggatg cagcgcagat ccgaaagctc 1260

tttaagccgc accgtaccct gttgatgaca ctgtgcctgc aacgctatca gaaagatgat 1320

gtgttccgat tcagggatgt ttga 1344

<210>16

<211>447

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>16

Met Leu Val Ile Ile His Gly Trp Ser Asp Glu Ala Gly Ser Phe Lys

1 5 10 15

Thr Leu Ala Arg Arg Leu Ala Lys Ala Pro Pro Glu Gly Leu Gly Thr

20 25 30

Gln Val Thr Glu Ile His Leu Gly Asp Tyr Val Ser Leu Asp Asp Gln

35 40 45

Val Thr Phe Asn Asp Leu Val Asp Ala Met Ala Arg Ala Trp Ser Asp

50 55 60

Arg Gly Leu Pro Thr Ala Pro Arg Ser Val Asp Ala Val Val His Ser

65 70 75 80

Thr Gly Gly Leu Val Ile Arg Asp Trp Leu Thr Gln Leu Tyr Thr Pro

85 90 95

Glu Thr Ala Pro Ile Arg Arg Leu Leu Met Leu Ala Pro Ala Asn Phe

100 105 110

Gly Ser Pro Leu Ala His Thr Gly Arg Ser Met Ile Gly Arg Val Thr

115 120 125

Lys Gly Trp Lys Gly Thr Arg Leu Phe Glu Thr Gly Lys His Ile Leu

130 135 140

Lys Gly Leu Glu Leu Ala Ser Pro Tyr Ala Trp Ala Leu Ala Glu Arg

145 150 155 160

Asp Leu Phe Ser Asp Gln Asn Tyr Tyr Gly Ala Gly Arg Ile Leu Cys

165 170 175

Thr Val Leu Val Gly Asn Ala Gly Tyr Arg Gly Ile Ser Ala Val Ala

180 185 190

Asn Arg Pro Gly Thr Asp Gly Thr Val Arg Val Ser Ser Ala Asn Leu

195 200 205

Gln Ala Ala Arg Met Leu Leu Asp Phe Ser Ala Ser Pro Gln Ala Glu

210 215 220

Pro Glu Phe Thr Leu His Asp Ser Thr Ala Glu Ile Ala Phe Gly Ile

225 230 235 240

Ala Asp Glu Glu Asp His Ser Thr Ile Ala Ala Lys Asp Arg Gly Pro

245 250 255

Arg Lys Ala Val Thr Trp Glu Leu Ile Leu Lys Ala Leu Gln Ile Glu

260 265 270

Asp Ala Ser Phe Ala Gln Trp Cys Arg Gln Met Gln Glu His Ser Ala

275 280 285

Ala Val Thr Glu Thr Ala Glu Lys Arg Arg Asn Val His Tyr Asn Ser

290 295 300

Phe Gln Asn Thr Val Val Arg Val Val Asp Asn His Gly Ala Ala Val

305 310 315 320

Gln Asp Tyr Leu Ile Glu Phe Tyr Met Asn Asp Asp Arg Lys Leu Arg

325 330 335

Asp Gln Arg Leu Thr Gln Arg Leu Gln Glu Gln Val Ile Thr Asn Val

340 345 350

His Gly Tyr Gly Asp Asp Lys Ser Tyr Arg Ser Met Leu Ile Asn Cys

355 360 365

Thr Glu Leu Tyr Ala Leu Met Ser Arg Pro Gln Asp Arg Leu Asn Ile

370 375 380

Ser Ile Thr Ala Tyr Pro Asp Leu Ser Lys Gly Leu Val Gly Tyr Arg

385 390 395 400

Thr Tyr Thr Asp Glu Asp Ile Gly Ser Leu Ser Leu Asp Ala Ala Gln

405 410 415

Ile Arg Lys Leu Phe Lys Pro His Arg Thr Leu Leu Met Thr Leu Cys

420 425 430

Leu Gln Arg Tyr Gln Lys Asp Asp Val Phe Arg Phe Arg Asp Val

435 440 445

<210>17

<211>1137

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>17

atgaaaaaaa gccttcaaca acatcttgcc gctgacggca gcccaaagaa tattctttct 60

ctcgacgggg gaggaatcag aggggctttg acccttggtt ttctcaaaaa aatagaaagc 120

atcctgcagg aaaaacatgg gaaggactat ctcctttgcg atcactttga tttgatcggt 180

ggaacttcca caggctccat cattgcagca gcattggcta taggcatgac agtggaggaa 240

atcactaaaa tgtatatgga tctgggcgga aaaattttcg gcaagaaaag gagtttctgg 300

agaccctggg aaactgcgaa atacttgaaa gcaggatatg accacaaagc tcttgaaaag 360

agtctgaaag atgctttcca ggattttctt ttaggaagtg accaaattag aacaggtctt 420

tgtatagtag ccaaaagagc agataccaat agtatatggc cattgattaa ccaccccaaa 480

ggaaaattct atgattcaga acaaggcaaa aacaaaaata tccccttatg gcaggcagta 540

agggcgagta ccgctgctcc aacctatttc gctccacaat taatagatgt gggtgatggt 600

caaaaggctg cttttgtgga cggaggggta agcatggcca ataaccccgc attaaccctg 660

ttaaaagtgg ctacacttaa aggttttcct tttcattggc caatgggaga agacaaactg 720

accatagttt cagtaggcac cggatatagt gttttccaaa gacaaaaggg tgaaatcacc 780

aaagcttcct tattaacttg ggccaaaaac gtcccggaaa tgttgatgca ggatgcttct 840

tggcagaatc agaccatact tcagtggatt tctaaatccc ccactgcaca ttccatagat 900

atggaaatgg aagaccttag agatgacttt ctaggcggaa gaccactcat caaatacctc 960

aggtacaact tccccttgac agtaaatgat ctcaatggat tgaagcttgg gaaaagcttt 1020

acccaaaaag aggtcgaaga tttggtggaa atgagcaatg cacataaccg agaggagttg 1080

tataggattg gggagaaggc ggctgaaggg tcggtaaaaa aagaacattt tgaataa 1137

<210>18

<211>378

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>18

Met Lys Lys Ser Leu Gln Gln His Leu Ala Ala Asp Gly Ser Pro Lys

1 5 10 15

Asn Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly Ala Leu Thr Leu

20 25 30

Gly Phe Leu Lys Lys Ile Glu Ser Ile Leu Gln Glu Lys His Gly Lys

35 40 45

Asp Tyr Leu Leu Cys Asp His Phe Asp Leu Ile Gly Gly Thr Ser Thr

50 55 60

Gly Ser Ile Ile Ala Ala Ala Leu Ala Ile Gly Met Thr Val Glu Glu

65 70 75 80

Ile Thr Lys Met Tyr Met Asp Leu Gly Gly Lys Ile Phe Gly Lys Lys

85 90 95

Arg Ser Phe Trp Arg Pro Trp Glu Thr Ala Lys Tyr Leu Lys Ala Gly

100 105 110

Tyr Asp His Lys Ala Leu Glu Lys Ser Leu Lys Asp Ala Phe Gln Asp

115 120 125

Phe Leu Leu Gly Ser Asp Gln Ile Arg Thr Gly Leu Cys Ile Val Ala

130 135 140

Lys Arg Ala Asp Thr Asn Ser Ile Trp Pro Leu Ile Asn His Pro Lys

145 150 155 160

Gly Lys Phe Tyr Asp Ser Glu Gln Gly Lys Asn Lys Asn Ile Pro Leu

165 170 175

Trp Gln Ala Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Ala Pro

180 185 190

Gln Leu Ile Asp Val Gly Asp Gly Gln Lys Ala Ala Phe Val Asp Gly

195 200 205

Gly Val Ser Met Ala Asn Asn Pro Ala Leu Thr Leu Leu Lys Val Ala

210 215 220

Thr Leu Lys Gly Phe Pro Phe His Trp Pro Met Gly Glu Asp Lys Leu

225 230 235 240

Thr Ile Val Ser Val Gly Thr Gly Tyr Ser Val Phe Gln Arg Gln Lys

245 250 255

Gly Glu Ile Thr Lys Ala Ser Leu Leu Thr Trp Ala Lys Asn Val Pro

260 265 270

Glu Met Leu Met Gln Asp Ala Ser Trp Gln Asn Gln Thr Ile Leu Gln

275 280 285

Trp Ile Ser Lys Ser Pro Thr Ala His Ser Ile Asp Met Glu Met Glu

290 295 300

Asp Leu Arg Asp Asp Phe Leu Gly Gly Arg Pro Leu Ile Lys Tyr Leu

305 3l0 315 320

Arg Tyr Asn Phe Pro Leu Thr Val Asn Asp Leu Asn Gly Leu Lys Leu

325 330 335

Gly Lys Ser Phe Thr Gln Lys Glu Val Glu Asp Leu Val Glu Met Ser

340 345 350

Asn Ala His Asn Arg Glu Glu Leu Tyr Arg Ile Gly Glu Lys Ala Ala

355 360 365

Glu Gly Ser Val Lys Lys Glu His Phe Glu

370 375

<210>19

<211>1248

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>19

atgaaaaaga caacgttagt tttggctcta ttgatgccat ttggtgccgc ctccgcacaa 60

gacaatagta tgactccaga agcaatcaca tcagctcaag tcgcacaaac acaatcagcc 120

tccacctata cctacgttag gtgttggtat cgaacagacg caagccatga ttcaccagca 180

accgactggg agtgggctag aaaggaaaac ggagactatt acaccattga cggttactgg 240

tggtcatcga tctcctttaa aaatatgttc tatagcgaga ctcctcaaca agagatcaag 300

cagcgttgtg tagacacctt ggatgttcag cacgacaaag ccgacatcac ctactttgcc 360

gctgacaacc gcttctctta caaccattct atctggacta acgatcacgg ctttcaagcg 420

aaccaaatca accgaatagt cgcttttggc gatagtcttt cagacacggg caacctattt 480

aatgggtcac aatggatttt ccctaaccct aattcttggt tcttgggtca cttctctaac 540

ggcttcgttt ggactgaata cttggctaac gctaagggcg ttccactcta taactgggct 600

gtgggtggcg cagcaggaac caaccaatat gtcgctctaa ctggtgtcta tgatcaggtc 660

acttcgtacc tgacttacat gaagatggcg aaaaattatc gcccagagaa cacactattc 720

acattagagt ttggattgaa tgactttatg aattacggac gtgaagtagc tgatgtaaaa 780

gctgacttta gtagcgcact gattcgcctc accgacgctg gcgcaaaaaa cattctgttg 840

ttcaccctac cagatgcgac caaagcccct cagtttaagt actcaacggc ccaagaaatc 900

gagacagttc gtggcaagat tctggcgttc aaccagttca tcaaagaaca agcagagtac 960

tatcaaagca aaggtgacaa cgtgatccta tttgatgcgc acgctctatt ctctagcatc 1020

accagcgacc cacaaaaaca cgggttcaga aacgcaaaag atgcctgcct agatattaat 1080

cgtagtgcat ctcaagacta cctatacagc catagtctga ccaacgactg tgcaacctat 1140

ggttctgata gctatgtatt ttggggcgta acacacccaa ccacagcaac tcataaatac 1200

atcgcaacgc atatactgat gaattcaatg tcgaccttcg acttttaa 1248

<210>20

<211>415

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(19)

<223>从环境样品中获得

<400>20

Met Lys Lys Thr Thr Leu Val Leu Ala Leu Leu Met Pro Phe Gly Ala

1 5 10 15

Ala Ser Ala Gln Asp Asn Ser Met Thr Pro Glu Ala Ile Thr Ser Ala

20 25 30

Gln Val Ala Gln Thr Gln Ser Ala Ser Thr Tyr Thr Tyr Val Arg Cys

35 40 45

Trp Tyr Arg Thr Asp Ala Ser His Asp Ser Pro Ala Thr Asp Trp Glu

50 55 60

Trp Ala Arg Lys Glu Asn Gly Asp Tyr Tyr Thr Ile Asp Gly Tyr Trp

65 70 75 80

Trp Ser Ser Ile Ser Phe Lys Asn Met Phe Tyr Ser Glu Thr Pro Gln

85 90 95

Gln Glu Ile Lys Gln Arg Cys Val Asp Thr Leu Asp Val Gln His Asp

100 105 110

Lys Ala Asp Ile Thr Tyr Phe Ala Ala Asp Asn Arg Phe Ser Tyr Asn

115 120 125

His Ser Ile Trp Thr Asn Asp His Gly Phe Gln Ala Asn Gln Ile Asn

130 135 140

Arg Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Phe

145 150 155 160

Asn Gly Ser Gln Trp Ile Phe Pro Asn Pro Asn Ser Trp Phe Leu Gly

165 170 175

His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala Asn Ala Lys

180 185 190

Gly Val Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn

195 200 205

Gln Tyr Val Ala Leu Thr Gly Val Tyr Asp Gln Val Thr Ser Tyr Leu

210 215 220

Thr Tyr Met Lys Met Ala Lys Asn Tyr Arg Pro Glu Asn Thr Leu Phe

225 230 235 240

Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val

245 250 255

Ala Asp Val Lys Ala Asp Phe Ser Ser Ala Leu Ile Arg Leu Thr Asp

260 265 270

Ala Gly Ala Lys Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys

275 280 285

Ala Pro Gln Phe Lys Tyr Ser Thr Ala Gln Glu Ile Glu Thr Val Arg

290 295 300

Gly Lys Ile Leu Ala Phe Asn Gln Phe Ile Lys Glu Gln Ala Glu Tyr

305 310 315 320

Tyr Gln Ser Lys Gly Asp Asn Val Ile Leu Phe Asp Ala His Ala Leu

325 330 335

Phe Ser Ser Ile Thr Ser Asp Pro Gln Lys His Gly Phe Arg Asn Ala

340 345 350

Lys Asp Ala Cys Leu Asp Ile Asn Arg Ser Ala Ser Gln Asp Tyr Leu

355 360 365

Tyr Ser His Ser Leu Thr Asn Asp Cys Ala Thr Tyr Gly Ser Asp Ser

370 375 380

Tyr Val Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr

385 390 395 400

Ile Ala Thr His Ile Leu Met Asn Ser Met Ser Thr Phe Asp Phe

405 410 415

<210>21

<211>1716

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>21

atgcagcagc ataaattgag gaatttcaac aagggattga ccggcgtcgt attgagcgta 60

ttgacctcta ccagcgccat ggcttttaca caaatcggtg gcggcggcgc gattccgatg 120

ggccatgaat ggctcacgcg cagatccgca ctggaattat taaatgcaga ccatatcgtc 180

tccaacgacc cgctcgaccc acgcttgggc tggagccagg gcttggccaa aaatttggat 240

ctctccaatg cattgaacga agtgcagcgc atccagagcg ttaccaagac caacgcactt 300

tatgaaccac gctatgatga cgtgttttct gcgattgtcg gcgaacgctg ggtggacacg 360

gccggtttca acgttgcgaa ggctaccgtc ggtaaaatcg attgtttcag cgcggtcgcg 420

caagaacctg ccgatgttca gcaagaccat ttcatgcgtc gttacgatga cgtgggcgga 480

caaggtggcg ttaacgccgc acgccgcggg caacaacgtt tcatcaccca tttcatcaac 540

gccgcgatgg ccgaagaaaa aagcataaaa gcgtgggacg gcggtggata ctccacgctg 600

gaaaaagtca gccacaatta tttcttgttt ggtcgcgctg tgcatttgtt ccaggattct 660

ttcagcccgg aacacaccgt gcgtctgccg caagacaact acgaaaaagt acgtcaggta 720

aaagcctatc tgtgttccga aggcgcagag caacatacgc ataacgcgca ggatgcgatc 780

agcttcacca gcggcgacgt tatctggaag aaaaacaccc gtctggatgc cggctggagc 840

acctacaaac ccagcaatat gaaacccgtt gccttggtgg cgatggaagc ctcgaaggac 900

ttgtgggccg ccttcattcg caccatggcc gcaccgcgca gcgagcgtcg cgccattgct 960

cagcaagagg cacaaacgct ggtaaacaac tggttgtcgt tcgacgaaca ggaaatgctg 1020

agctggtacg acgaagaaac tcatcgcgat cacacttacg tgctcgaacc cggccagaac 1080

ggccccggta tttccatgtt cgattgcatg gtgggtctgg gcgtgacgtc tggcagccag 1140

gctgcgcgtg tggccgaact ggatcaacaa cgtcgccagt gcttgttcaa cgtcaaggcc 1200

accaccggtt acagcgatct gaacgatccg cacatggata tcccgtataa ctggcaatgg 1260

acgtcgacca cgcagtggaa agtgccaagc gcgagctgga cgattccgca gttgccggcc 1320

gacgcaggca agaaagtgac gatcaaaaac gccatcaacg gcaatccgct ggtagcgccg 1380

gctggcgtca aacacaacag cgatatttat tccgcgccgg gtgaagccat cgaattcatt 1440

ttcgtcggtg actacaacaa tgagtcttat ctgcgctcga aaaaagatgc ggatttgttc 1500

ttgagctaca gtgcggtatc cggcaagggc ttgctgtaca acacaccgaa tcaggcaggt 1560

tatcgcgtga aaccggcggg cgtgctgtgg acgatcgaga acacctactg gaatgatttc 1620

ctgtggttca acagttcgaa caaccgcatc tacgtaagcg gcacgggcga tgccaacaag 1680

ttacattcac agtggatcat tgacggtctg aaataa 1716

<210>22

<211>571

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(28)

<223>从环境样品中获得

<400>22

Met Gln Gln His Lys Leu Arg Asn Phe Asn Lys Gly Leu Thr Gly Val

1 5 10 15

Val Leu Ser Val Leu Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile

20 25 30

Gly Gly Gly Gly Ala Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg

35 40 45

Ser Ala Leu Glu Leu Leu Asn Ala Asp His Ile Val Ser Asn Asp Pro

50 55 60

Leu Asp Pro Arg Leu Gly Trp Ser Gln Gly Leu Ala Lys Asn Leu Asp

65 70 75 80

Leu Ser Asn Ala Leu Asn Glu Val Gln Arg Ile Gln Ser Val Thr Lys

85 90 95

Thr Asn Ala Leu Tyr Glu Pro Arg Tyr Asp Asp Val Phe Ser Ala Ile

100 105 110

Val Gly Glu Arg Trp Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala

115 120 125

Thr Val Gly Lys Ile Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala

130 135 140

Asp Val Gln Gln Asp His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly

145 150 155 160

Gln Gly Gly Val Asn Ala Ala Arg Arg Gly Gln Gln Arg Phe Ile Thr

165 170 175

His Phe Ile Asn Ala Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp

180 185 190

Asp Gly Gly Gly Tyr Ser Thr Leu Glu Lys Val Ser His Asn Tyr Phe

195 200 205

Leu Phe Gly Arg Ala Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu

210 215 220

His Thr Val Arg Leu Pro Gln Asp Asn Tyr Glu Lys Val Arg Gln Val

225 230 235 240

Lys Ala Tyr Leu Cys Ser Glu Gly Ala Glu Gln His Thr His Asn Ala

245 250 255

Gln Asp Ala Ile Ser Phe Thr Ser Gly Asp Val Ile Trp Lys Lys Asn

260 265 270

Thr Arg Leu Asp Ala Gly Trp Ser Thr Tyr Lys Pro Ser Asn Met Lys

275 280 285

Pro Val Ala Leu Val Ala Met Glu Ala Ser Lys Asp Leu Trp Ala Ala

290 295 300

Phe Ile Arg Thr Met Ala Ala Pro Arg Ser Glu Arg Arg Ala Ile Ala

305 310 315 320

Gln Gln Glu Ala Gln Thr Leu Val Asn Asn Trp Leu Ser Phe Asp Glu

325 330 335

Gln Glu Met Leu Ser Trp Tyr Asp Glu Glu Thr His Arg Asp His Thr

340 345 350

Tyr Val Leu Glu Pro Gly Gln Asn Gly Pro Gly Ile Ser Met Phe Asp

355 360 365

Cys Met Val Gly Leu Gly Val Thr Ser Gly Ser Gln Ala Ala Arg Val

370 375 380

Ala Glu Leu Asp Gln Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala

385 390 395 400

Thr Thr Gly Tyr Ser Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr

405 410 415

Asn Trp Gln Trp Thr Ser Thr Thr Gln Trp Lys Val Pro Ser Ala Ser

420 425 430

Trp Thr Ile Pro Gln Leu Pro Ala Asp Ala Gly Lys Lys Val Thr Ile

435 440 445

Lys Asn Ala Ile Asn Gly Asn Pro Leu Val Ala Pro Ala Gly Val Lys

450 455 460

His Asn Ser Asp Ile Tyr Ser Ala Pro Gly Glu Ala Ile Glu Phe Ile

465 470 475 480

Phe Val Gly Asp Tyr Asn Asn Glu Ser Tyr Leu Arg Ser Lys Lys Asp

485 490 495

Ala Asp Leu Phe Leu Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu

500 505 510

Tyr Asn Thr Pro Asn Gln Ala Gly Tyr Arg Val Lys Pro Ala Gly Val

515 520 525

Leu Trp Thr Ile Glu Asn Thr Tyr Trp Asn Asp Phe Leu Trp Phe Asn

530 535 540

Ser Ser Asn Asn Arg Ile Tyr Val Ser Gly Thr Gly Asp Ala Asn Lys

545 550 555 560

Leu His Ser Gln Trp Ile Ile Asp Gly Leu Lys

565 570

<210>23

<211>1473

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>23

atgacgatcc gctcgaccga ctacgcgctg ctcgcgcagg agagctacca cgacagccag 60

gtcgatgctg acgtcaagct cgatggcatc tcctacaagg tattcgccac cacggacgac 120

cccctcaccg gcttccaggc caccgcttac cagcgccagg atacgggcga ggtggtcatc 180

gcctaccgcg gcacggaatt cgaccgcgaa cccgtgcgcg atggcggcgt cgacgcaggc 240

atggtgttgc ttggcgtcaa cgcccagtca cctgcatccg aggtattcac ccgcgaagtg 300

atcgaaaagg cgaagcacga agccgagctc aacgatcgcg agccgaagat caccgtcacc 360

gggcattccc tcggcggcac cctcgccgaa atcaatgccg cgaaatacgg cctccacggc 420

gaaaccttca atgcctacgg tgcggccagc ctcaagggca tccccgaggg cggcgacacg 480

gtgatcgacc atgtccgcgc cggcgatctc gtcagcgccg ccagcccgca ctacgggcag 540

gtgcgtgtgt acgcagctca gcaggatatc gataccctgc aacatgccgg ctaccgcgac 600

gacagtggca tcttcagcct gcgcaacccc atcaaggcca cggatttcga cgcccacgcg 660

atcgataact tcgtgcccaa cagcaagctg cttggccaat cgatcatcgc tcctgagaac 720

gaagcccgtt acgaagccca caagggcatg atcgatcgct atcgcgatga cgtggccgat 780

atccggaaag gcatctccgc tccctgggaa atccccaagg ccgtcggcga gctgaaggac 840

aagctcgaac acgaagcctt cgagctggcc ggcaagggca tcctcgccgt cgagcacggt 900

gtagccgagg tcgttcacga ggcgaaggaa gggttcgatc atctcaagga aggcttgcac 960

cacgtcaggg aagagatcag cgagggcatc cacgccgtgg aagagaaggc ttccagcgca 1020

tggcacaccc tcacccaccc gaaggaatgg ttcgagcacg acaaacctca agtgaatctc 1080

gaccatcccc agcatccaga caacgccttg ttcaagcagg cgcagggcgc ggtacacgcc 1140

ctcgatgcca cgcaaggccg cacgccagat aggacgagcg accagatcgc aggttctctg 1200

gtggtcgcgg cgcgacgcga tggtctcgag cgggtggacc gcgccgtgct cagcgatgac 1260

actagccggc tctacggcgt gcagggtgcg acggattcgc ccttgaagca gttcaccgag 1320

gtgaacacga cagtggcggc gcaaacgtca ctgcagcaaa gcagccaggc atggcagcag 1380

caagcagaga tcgcgcgaca gaaccaggca accagccagg ctcagcgcat ggaaccgcag 1440

gtgcccccgc aggcaccggc acatggcatg taa 1473

<210>24

<211>490

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>24

Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr

1 5 10 15

His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ser Tyr

20 25 30

Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr

35 40 45

Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly

50 55 60

Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly

65 70 75 80

Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Val Phe

85 90 95

Thr Arg Glu Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp

100 105 110

Arg Glu Pro Lys Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu

115 120 125

Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn

130 135 140

Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr

145 150 155 160

Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro

165 170 175

His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln AsP Ile Asp Thr

180 185 190

Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Phe Ser Leu Arg

195 200 205

Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe

210 215 220

Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn

225 230 235 240

Glu Ala Arg Tyr Glu Ala His Lys Gly Met Ile Asp Arg Tyr Arg Asp

245 250 255

Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro

260 265 270

Lys Ala Val Gly Glu Leu Lys Asp Lys Leu Glu His Glu Ala Phe Glu

275 280 285

Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Val Ala Glu Val

290 295 300

Val His Glu Ala Lys Glu Gly Phe Asp His Leu Lys Glu Gly Leu His

305 310 315 320

His Val Arg Glu Glu Ile Ser Glu Gly Ile His Ala Val Glu Glu Lys

325 330 335

Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu

340 345 350

His Asp Lys Pro Gln Val Asn Leu Asp His Pro Gln His Pro Asp Asn

355 360 365

Ala Leu Phe Lys Gln Ala Gln Gly Ala Val His Ala Leu Asp Ala Thr

370 375 380

Gln Gly Arg Thr Pro Asp Arg Thr Ser Asp Gln Ile Ala Gly Ser Leu

385 390 395 400

Val Val Ala Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val

405 410 415

Leu Ser Asp Asp Thr Ser Arg Leu Tyr Gly Val Gln Gly Ala Thr Asp

420 425 430

Ser Pro Leu Lys Gln Phe Thr Glu Val Asn Thr Thr Val Ala Ala Gln

435 440 445

Thr Ser Leu Gln Gln Ser Ser Gln Ala Trp Gln Gln Gln Ala Glu Ile

450 455 460

Ala Arg Gln Asn Gln Ala Thr Ser Gln Ala Gln Arg Met Glu Pro Gln

465 470 475 480

Val Pro Pro Gln Ala Pro Ala His Gly Met

485 490

<210>25

<211>1098

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>25

atgtgcgcca aagttaaagt agtcaaaata aagacaaaca caggcagccc aaacaaatac 60

cacttcaaga acctcgtctt cgaaggcggc ggcgtgaaag gcattgccta tgtgggagcc 120

cttaccaagc tcgacgagga aggcatcctt caaaacatta agcgcgtggc cggcacctca 180

gcaggagcaa tggtggccgt cctcgtcgga ttgggcttca ccgctaagga gataagcgac 240

atcctgtggg acatcaaatt ccagaacttt ttagacaact catggggcgt gatacgcaac 300

accaatcgtc tgctgacgga atacggctgg tataagggcg agtttttccg cgacctcatg 360

gctgattaca tcaaaagaaa gacagacgat ggcgagatta ctttcgggga gttggaggcc 420

atgagaaaag agggcaagcc cttcttggaa atccatctgg ttggctccga cctcacgaca 480

gggtattcca gagtgttcaa ctccaaaaac accccaaatg tgaaagtcgc cgatgccgcc 540

cgcatctcca tgtcgatacc gctgtttttc tccgctgtga gaggcgtgca aggcgacgac 600

cacctctatg tggacggtgg gcttttggac aactacgcca tcaagatttt cgaccagtcg 660

aaactcgttt cagacaaaaa caacaaaagg aagaccgagt attacaacag gctcaaccag 720

caagtgaacg cgaaagcaac gaaaagcaag acggaatctg tagagtatgt ctacaacaag 780

gagactttgg gcttccgctt ggatgccaaa gaggacatca acctcttcct caaccacgat 840

gatgcccctc aaaaagaaat caagagtttc ttctcttaca ccaaagcttt ggtttccacg 900

ctcatcgatt tccagaacaa tgtacacctg cacagcgacg actggcagcg tacggtctac 960

atcgacacac tcggtgtcag ctccattgac ttcggtctgt caaacacaac gaaacaagct 1020

cttgtcgatt cgggctacaa ctacaccaca gcctacctcg actggtacaa caacgacgag 1080

gataaagcca acaagtaa 1098

<210>26

<211>365

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>26

Met Cys Ala Lys Val Lys Val Val Lys Ile Lys Thr Asn Thr Gly Ser

1 5 10 15

Pro Asn Lys Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val

20 25 30

Lys Gly Ile Ala Tyr Val Gly Ala Leu Thr Lys Leu Asp Glu Glu Gly

35 40 45

Ile Leu Gln Asn Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Met

50 55 60

Val Ala Val Leu Val Gly Leu Gly Phe Thr Ala Lys Glu Ile Ser Asp

65 70 75 80

Ile Leu Trp Asp Ile Lys Phe Gln Asn Phe Leu Asp Asn Ser Trp Gly

85 90 95

Val Ile Arg Asn Thr Asn Arg Leu Leu Thr Glu Tyr Gly Trp Tyr Lys

100 105 110

Gly Glu Phe Phe Arg Asp Leu Met Ala Asp Tyr Ile Lys Arg Lys Thr

115 120 125

Asp Asp Gly Glu Ile Thr Phe Gly Glu Leu Glu Ala Met Arg Lys Glu

130 135 140

Gly Lys Pro Phe Leu Glu Ile His Leu Val Gly Ser Asp Leu Thr Thr

145 150 155 160

Gly Tyr Ser Arg Val Phe Asn Ser Lys Asn Thr Pro Asn Val Lys Val

165 170 175

Ala Asp Ala Ala Arg Ile Ser Met Ser Ile Pro Leu Phe Phe Ser Ala

180 185 190

Val Arg Gly Val Gln Gly Asp Asp His Leu Tyr Val Asp Gly Gly Leu

195 200 205

Leu Asp Asn Tyr Ala Ile Lys Ile Phe Asp Gln Ser Lys Leu Val Ser

210 215 220

Asp Lys Asn Asn Lys Arg Lys Thr Glu Tyr Tyr Asn Arg Leu Asn Gln

225 230 235 240

Gln Val Asn Ala Lys Ala Thr Lys Ser Lys Thr Glu Ser Val Glu Tyr

245 250 255

Val Tyr Asn Lys Glu Thr Leu Gly Phe Arg Leu Asp Ala Lys Glu Asp

260 265 270

Ile Asn Leu Phe Leu Asn His Asp Asp Ala Pro Gln Lys Glu Ile Lys

275 280 285

Ser Phe Phe Ser Tyr Thr Lys Ala Leu Val Ser Thr Leu Ile Asp Phe

290 295 300

Gln Asn Asn Val His Leu His Ser Asp Asp Trp Gln Arg Thr Val Tyr

305 310 315 320

Ile Asp Thr Leu Gly Val Ser Ser Ile Asp Phe Gly Leu Ser Asn Thr

325 330 335

Thr Lys Gln Ala Leu Val Asp Ser Gly Tyr Asn Tyr Thr Thr Ala Tyr

340 345 350

Leu Asp Trp Tyr Asn Asn Asp Glu Asp Lys Ala Asn Lys

355 360 365

<210>27

<211>1287

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>27

gtgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg 60

aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg 120

gtcgaggttc tcggcgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca 180

gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg 240

gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc 300

tccgggatta caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac 360

gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc 420

tggatcagag acctgattgc acagcgagtc gaggcggggc gctccgaggt cctgagccga 480

gccgacgccg atggacggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca 540

tttgccgagc ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc 600

ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg 660

gacatgccga tcgacgtcgc ggtacgcatc tccgcatcgt tgccatggtt tttcaaatcc 720

gtgaaatgga acggctccga atacatagat ggcggctgcc tgtcgaactt cccaatgccg 780

atattcgacg tcgatcccta tcgtggcgac gcatcgtcga aaatccggct cggcatcttc 840

ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatt 900

ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg 960

aaagcttctg cagaacactg ggtcgtcggc atcgacgtcg aaggcgccac ccgcgcgtcg 1020

aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat 1080

agcacgttca agttcgatct ttcggacgct gacaaggagc gcatggccga ggccggcgca 1140

aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt 1200

tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat 1260

tcgtttcgag ccttgatcgc ggcctag 1287

<210>28

<211>428

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>28

Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile

1 5 10 15

Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro

20 25 30

Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly

35 40 45

Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met

50 55 60

Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala

65 70 75 80

Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr

85 90 95

Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys

100 105 110

Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly ThrSer Asp Glu Arg

115 120 125

Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp

130 135 140

Leu Ile Ala Gln Arg Val Glu Ala Gly Arg Ser Glu Val Leu Ser Arg

145 150 155 160

Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys

165 170 175

Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro

180 185 190

Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser

195 200 205

Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile

210 215 220

Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser

225 230 235 240

Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn

245 250 255

Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp AlaSer

260 265 270

Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly

275 280 285

Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser

290 295 300

Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val

305 310 315 320

Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala

325 330 335

Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr

340 345 350

Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser

355 360 365

Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg

370 375 380

Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe

385 390 395 400

Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala

405 410 415

Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala

420 425

<210>29

<211>753

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>29

atgggaaacg gtgcagcagt tggttcgaat gataatggta gagaagaaag tgtttacgta 60

ctttctgtga tcgcctgtaa tgtttattat ttacaaaagt gtgaaggtgg ggcatcgcgt 120

gatagcgtga ttagagaaat caatagccaa actcaacctt taggatatga gattgtagca 180

gattctattc gtgatggtca tattggctct tttgcctgta agatggctgt ctttagaaat 240

aatggaaacg gcaattgtgt tttagcaatc aaagggactg atatgaataa tatcaatgac 300

ttggtgaatg acctaaccat gatattagga ggtattggtt ctgttgctgc aatccaacca 360

acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tacaggtcac 420

tcccttggag gctacatgac tgagatcatc gccaccaatc gtggacttcc aggtattgca 480

ttttgcgcac caggttcaaa tggtcccatt gtaaaattag gtggacaaga gacacctggc 540

tttcacaatg tgaactttga acatgatcca gcaggtaacg ttatgacggg ggtttatact 600

catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg 660

gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa 720

agtcataata cgggttatta ttacccaaaa taa 753

<210>30

<211>250

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>30

Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu

1 5 10 15

Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln

20 25 30

Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn

35 40 45

Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg

50 55 60

Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn

65 70 75 80

Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn

85 90 95

Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile

100 105 110

Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu

115 120 125

Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly

130 135 140

Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala

145 150 155 160

Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln

165 170 175

Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly

180 185 190

Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val

195 200 205

Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe

210 215 220

Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu

225 230 235 240

Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys

245 250

<210>31

<211>1422

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>31

atgaaaaaga aattatgtac atgggctctc gtaacagcga tatcttctgg agttgttgcg 60

attccaaccg tagcatctgc ttgcggaatg ggtgaagtaa tgaaacagga ggatcaagag 120

cacaaacgtg tgaagagatg gtctgcggag catccgcacc atgctaatga aagcacgcac 180

ttatggattg ctcgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa 240

gaaaatgaat tacaattctt aaaaatacct gaatataagg agttatttga aagagggctt 300

tatgatgccg attatcttga tgagtttaac gatggaggta caggtacaat cggtattgat 360

gggctaatta aaggaggctg gaaatctcat ttctatgatc ctgatacgaa aaagaactat 420

aaaggagaag aagaaccaac agccctttcg caaggggata aatattttaa attagcagga 480

gattatttta agaaagaaga ttggaaacaa gctttctatt atttaggtgt tgcgacgcat 540

tacttcacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacatgagt 600

gcaataaagt ttcatagcgc ttttgaaaat tatgtaacga cagttcagac accgtttgaa 660

gtgaaggatg ataagggaac atataatttg gtcaattctg atgatccgaa gcagtggata 720

catgaaacag cgaaactcgc aaaagcagaa attatgaata ttactagtga taatattaaa 780

tctcaatata ataaaggaaa caaagatctt tggcaacaag aagttatgcc agctgtccag 840

aggagtttag agaaagcgca aagaaacacg gcgggattta ttcatttatg gtttaaaaca 900

tatgttggca aaactgcagc tgaagatatt gaaactacac aggtaaaaga ttctaatgga 960

gaagcaatac aagaacaaaa aaaatactac gttgtgccta gtgagttttt aaatagaggt 1020

ttgacctttg aggtatatgc ttcgaatgac tacgcactat tatctaatca cgtagatgat 1080

aataaagttc atggtacacc tgttcagttt gtttttgata aagagaataa cggaattgtt 1140

catcggggag aaagtgtact gctgaaaatg acgcaatcta actatgatga ttatgtattt 1200

cttaattact ctaatatgac aaattggtta catcttgcga aacgaaaaac aaatactgca 1260

cagtttaaag tgtatccaaa tccggataac tcatctgaat atttcctata tacagatgga 1320

tacccggtaa attatcaaga aaatggtaat gggaagagct ggattgagtt aggaaagaaa 1380

acggataaac cgaaagcgtg gaaatttcaa caggcagaat aa 1422

<210>32

<211>473

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(20)

<223>从环境样品中获得

<400>32

Met Lys Lys Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ser Ser

1 5 10 15

Gly Val Val Ala Ile Pro Thr Val Ala Ser Ala Cys Gly Met Gly Glu

20 25 30

Val Met Lys Gln Glu Asp Gln Glu His Lys Arg Val Lys Arg Trp Ser

35 40 45

Ala Glu His Pro His His Ala Asn Glu Ser Thr His Leu Trp Ile Ala

50 55 60

Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln

65 70 75 80

Glu Asn Glu Leu Gln Phe Leu Lys Ile Pro Glu Tyr Lys Glu Leu Phe

85 90 95

Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly

100 105 110

Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys

115 120 125

Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr Lys Gly Glu Glu

130 135 140

Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly

145 150 155 160

Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly

165 170 175

Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala

180 185 190

Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe His Ser Ala Phe

195 200 205

Glu Asn Tyr Val Thr Thr Val Gln Thr Pro Phe Glu Val Lys Asp Asp

210 215 220

Lys Gly Thr Tyr Asn Leu Val Asn Ser Asp Asp Pro Lys Gln Trp Ile

225 230 235 240

His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met Asn Ile Thr Ser

245 250 255

Asp Asn Ile Lys Ser Gln Tyr Asn Lys Gly Asn Lys Asp Leu Trp Gln

260 265 270

Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Lys Ala Gln Arg

275 280 285

Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys

290 295 300

Thr Ala Ala Glu Asp Ile Glu Thr Thr Gln Val Lys Asp Ser Asn Gly

305 310 315 320

Glu Ala Ile Gln Glu Gln Lys Lys Tyr Tyr Val Val Pro Ser Glu Phe

325 330 335

Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ser Asn Asp Tyr Ala

340 345 350

Leu Leu Ser Asn His Val Asp Asp Asn Lys Val His Gly Thr Pro Val

355 360 365

Gln Phe Val Phe Asp Lys Glu Asn Asn Gly Ile Val His Arg Gly Glu

370 375 380

Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asp Tyr Val Phe

385 390 395 400

Leu Asn Tyr Ser Asn Met Thr Asn Trp Leu His Leu Ala Lys Arg Lys

405 410 415

Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asp Asn Ser Ser

420 425 430

Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn

435 440 445

Gly Asn Gly Lys Ser Trp Ile Glu Leu Gly Lys Lys Thr Asp Lys Pro

450 455 460

Lys Ala Trp Lys Phe Gln Gln Ala Glu

465 470

<210>33

<211>792

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>33

atgagagcac tcgtgctggc aggcggtgga gccaagggct cgtttcaagt gggcgtgctg 60

cagcggttca cccccgcaga cttcggtctc gtggtgggat gctcggtcgg agctttaaac 120

gccgcggggt ttgcccacct gggtagccat ggcatcaaag acctctggca agggatcagg 180

agtcgagatg acatcctgtc ccgtgtctgg tggccgtttg gctcagacgg gatcttctcg 240

cagaagcctc ttgaaaagct cgtctccaaa gcatgcacgg gtcctgctcg ggtgccggtc 300

cacgtggcga cggtctgcct tgaacgcggc cttgtccact acgggatctc cggggactct 360

gactttgaga agaaagtgct ggcatcggct gcgatcccag gcgtggtgaa gccagttaag 420

atccatggcg accactacgt cgacggtggt gtcagagaga tctgtccgct gcgtcgagcc 480

atcgacctgg gcgccacgga gatcacagtc atcatgtgcg ctccggaata catcccgacc 540

tggtcgcgta gttcctcgct gttcccgttt gtgaacgtga tgatccggtc tctcgacatc 600

ctgaccgatg agatcctggt caacgacatc gccgagtgcg tggcaaagaa caagatgcca 660

ggtaaacgtc acgtaaagct caccatctac cggccgaaga aagagctcat gggcacgctc 720

gactttgacc ccaaagccat cgccgcaggg atcaaggcag gcaccgaagc ccagccaagg 780

ttctgggagt aa 792

<210>34

<211>263

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>34

Met Arg Ala Leu Val Leu Ala Gly Gly Gly Ala Lys Gly Ser Phe Gln

1 5 10 15

Val Gly Val Leu Gln Arg Phe Thr Pro Ala Asp Phe Gly Leu Val Val

20 25 30

Gly Cys Ser Val Gly Ala Leu Asn Ala Ala Gly Phe Ala His Leu Gly

35 40 45

Ser His Gly Ile Lys Asp Leu Trp Gln Gly Ile Arg Ser Arg Asp Asp

50 55 60

Ile Leu Ser Arg Val Trp Trp Pro Phe Gly Ser Asp Gly Ile Phe Ser

65 70 75 80

Gln Lys Pro Leu Glu Lys Leu Val Ser Lys Ala Cys Thr Gly Pro Ala

85 90 95

Arg Val Pro Val His Val Ala Thr Val Cys Leu Glu Arg Gly Leu Val

100 105 110

His Tyr Gly Ile Ser Gly Asp Ser Asp Phe Glu Lys Lys Val Leu Ala

115 120 125

Ser Ala Ala Ile Pro Gly Val Val Lys Pro Val Lys Ile His Gly Asp

130 135 140

His Tyr Val Asp Gly Gly Val Arg Glu Ile Cys Pro Leu Arg Arg Ala

145 150 155 160

Ile Asp Leu Gly Ala Thr Glu Ile Thr Val Ile Met Cys Ala Pro Glu

165 170 175

Tyr Ile Pro Thr Trp Ser Arg Ser Ser Ser Leu Phe Pro Phe Val Asn

180 185 190

Val Met Ile Arg Ser Leu Asp Ile Leu Thr Asp Glu Ile Leu Val Asn

195 200 205

Asp Ile Ala Glu Cys Val Ala Lys Asn Lys Met Pro Gly Lys Arg His

210 215 220

Val Lys Leu Thr Ile Tyr Arg Pro Lys Lys Glu Leu Met Gly Thr Leu

225 230 235 240

Asp Phe Asp Pro Lys Ala Ile Ala Ala Gly Ile Lys Ala Gly Thr Glu

245 250 255

Ala Gln Pro Arg Phe Trp Glu

260

<210>35

<211>1389

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>35

atgcccgagc cgcccgccgc atgccgttgc gattgcgcct gcgagcgcga ccagcacctt 60

ttttgcaagg gacccaagcg tatcctcgcg ctcgacggcg gcggcgtgcg cggcgccgtc 120

agcgtcgcat tcctcgaacg gatcgaggcg gtgctcgagg cccggctcgg acgcaaggtg 180

ctgctcggcc actggttcga cctgatcggc ggcacctcga cgggcgccat catcggcggc 240

gcgctggcga tgggattcgc ggccgaggac gtccaaagat tctatcacga gctcgcgccg 300

cgggtgttca ggcatccgct cctgcgcatc ggtctcctgc gcccgttccg cgcgaaattc 360

gacgcccgcc tgctgcgcga ggagatccac cgcatcatcg gcgacagcac gctcggcgac 420

aaagcgctga tgaccgggtt cgcgctcgtc gccaagcgga tggacaccgg cagcacctgg 480

atcctcgcca acaacaagcg cagcaaatac tgggaagggc gggacggcgt cgtcggcaac 540

aaggattatc tcctcggcag cctcattcgc gcgagcacgg cggcgccgct gtatttcgac 600

cccgaggagg tcgtgatcgc ggaggcccgc aaggacatcg agggcatcag gggcctgttc 660

gtcgacggcg gcgtcacgcc gcacaacaat ccttcgctcg cgatgctgct gctggcgctg 720

ctcgacgcct accggctgcg ctgggaaacg ggaccggaca agctcacggt cgtctcgatc 780

ggcactggaa cgcatcgcga ccgcgtcgtt cccgacacgc tcggcatggg caagaacgcg 840

aagatcgcgc tgcgcgccat gagctcgctg atgaacgacg tgcacgagct cgcgctcacg 900

cagatgcagt acctcggtga gacgctcacc ccgtggcgca tcaacgacga gctcggcgac 960

atgcggaccg agcggccgcc gcaaggcaag ctcttccgct tcctccgcta cgacgtccgg 1020

ctggagctcg attggatcaa cgaggacgag gagcgccggc gcaagatcaa gaacaaattc 1080

aagcgcgagc tgaccgagac cgacatgatc cgcctgcgca gcctcgacga tccgacgacc 1140

atcccggacc tctacatgct tgcccaggtc gcggccgagg agcaggtcaa ggcggagcac 1200

tggctcggcg acgtgccgga gtggagcgaa ggcgcgcgcc cgtgtgcgcc gcgccggcac 1260

ctgccgccga cgccgccggg ccgctccgag gattcggcgc gcttccgggc cgagaaggcc 1320

gtcggcgagt ggctcagttt tgcgcgcgcg aacatcacgc gcctcatgtc gcggaagccg 1380

ccgggttga 1389

<210>36

<211>462

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>36

Met Pro Glu Pro Pro Ala Ala Cys Arg Cys Asp Cys Ala Cys Glu Arg

1 5 10 15

Asp Gln His Leu Phe Cys Lys Gly Pro Lys Arg Ile Leu Ala Leu Asp

20 25 30

Gly Gly Gly Val Arg Gly Ala Val Ser Val Ala Phe Leu Glu Arg Ile

35 40 45

Glu Ala Val Leu Glu Ala Arg Leu Gly Arg Lys Val Leu Leu Gly His

50 55 60

Trp Phe Asp Leu Ile Gly Gly Thr Ser Thr Gly Ala Ile Ile Gly Gly

65 70 75 80

Ala Leu Ala Met Gly Phe Ala Ala Glu Asp Val Gln Arg Phe Tyr His

85 90 95

Glu Leu Ala Pro Arg Val Phe Arg His Pro Leu Leu Arg Ile Gly Leu

100 105 110

Leu Arg Pro Phe Arg Ala Lys Phe Asp Ala Arg Leu Leu Arg Glu Glu

115 120 125

Ile His Arg Ile Ile Gly Asp Ser Thr Leu Gly Asp Lys Ala Leu Met

130 135 140

Thr Gly Phe Ala Leu Val Ala Lys Arg Met Asp Thr Gly Ser Thr Trp

145 150 155 160

Ile Leu Ala Asn Asn Lys Arg Ser Lys Tyr Trp Glu Gly Arg Asp Gly

165 170 175

Val Val Gly Asn Lys Asp Tyr Leu Leu Gly Ser Leu Ile Arg Ala Ser

180 185 190

Thr Ala Ala Pro Leu Tyr Phe Asp Pro Glu Glu Val Val Ile Ala Glu

195 200 205

Ala Arg Lys Asp Ile Glu Gly Ile Arg Gly Leu Phe Val Asp Gly Gly

210 215 220

Val Thr Pro His Asn Asn Pro Ser Leu Ala Met Leu Leu Leu Ala Leu

225 230 235 240

Leu Asp Ala Tyr Arg Leu Arg Trp Glu Thr Gly Pro Asp Lys Leu Thr

245 250 255

Val Val Ser Ile Gly Thr Gly Thr His Arg Asp Arg Val Val Pro Asp

260 265 270

Thr Leu Gly Met Gly Lys Asn Ala Lys Ile Ala Leu Arg Ala Met Ser

275 280 285

Ser Leu Met Asn Asp Val His Glu Leu Ala Leu Thr Gln Met Gln Tyr

290 295 300

Leu Gly Glu Thr Leu Thr Pro Trp Arg Ile Asn Asp Glu Leu Gly Asp

305 310 315 320

Met Arg Thr Glu Arg Pro Pro Gln Gly Lys Leu Phe Arg Phe Leu Arg

325 330 335

Tyr Asp Val Arg Leu Glu Leu Asp Trp Ile Asn Glu Asp Glu Glu Arg

340 345 350

Arg Arg Lys Ile Lys Asn Lys Phe Lys Arg Glu Leu Thr Glu Thr Asp

355 360 365

Met Ile Arg Leu Arg Ser Leu Asp Asp Pro Thr Thr Ile Pro Asp Leu

370 375 380

Tyr Met Leu Ala Gln Val Ala Ala Glu Glu Gln Val Lys Ala Glu His

385 390 395 400

Trp Leu Gly Asp Val Pro Glu Trp Ser Glu Gly Ala Arg Pro Cys Ala

405 410 415

Pro Arg Arg His Leu Pro Pro Thr Pro Pro Gly Arg Ser Glu Asp Ser

420 425 430

Ala Arg Phe Arg Ala Glu Lys Ala Val Gly Glu Trp Leu Ser Phe Ala

435 440 445

Arg Ala Asn Ile Thr Arg Leu Met Ser Arg Lys Pro Pro Gly

450 455 460

<210>37

<211>1329

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>37

atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt 60

gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta 120

acccgccgct cggcgctgga actgctgaat gccgacsatc tggtcggcaa tgacccggcc 180

gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag 240

aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac 300

gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg 360

gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat 420

gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac 480

gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa 540

gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac 600

aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac 660

accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc 720

tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc 780

gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc 840

aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt 900

attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag 960

gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa 1020

gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg 1080

ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg 1140

gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc 1200

gatctgaatg atccacacat ggatattccg tacsactggc aatgggtgtc gtcgacgcaa 1260

tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca 1320

gtcgtcatc 1329

<210>38

<211>443

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<400>38

Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala

1 5 10 15

Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala

20 25 30

Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu

35 40 45

Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu

50 55 60

Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln

65 70 75 80

Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr

85 90 95

Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp

100 105 110

Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile

115 120 125

Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp

130 135 140

His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn

145 150 155 160

Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala

165 170 175

Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr

180 185 190

Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala

195 200 205

Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu Hi s Thr Val Arg Leu

210 215 220

Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys

225 230 235 240

Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn

245 250 255

Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala

260 265 270

Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val

275 280 285

Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met

290 295 300

Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln

305 310 315 320

Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn

325 330 335

Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro

340 345 350

Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu

355 360 365

Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln

370 375 380

Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly

385 390 395 400

Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val

405 410 415

Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln

420 425 430

Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile

435 440

<210>39

<211>1335

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>39

atggccaacc ccatcgtcat catccacggc tggagcgacg acttcggctc gttccgcaag 60

ctgcgcgact tcctctccac caacctcggc gttccggcga agatcctcaa gctcggcgac 120

tggatctcgc tcgacgacga cgtcggctac gccgacatcg cgatggcgct ggaacgcgcg 180

tggaaggcgg agaaactgcc gaccgcgccg cgttcggtcg acgtcgtcgt gcacagcacc 240

ggcgcgctgg tggtgcgcga atggatgacg cgctaccacg cgcccgaaac cgtgccgatc 300

cagcgcttcc tgcacctggc gccggccaac ttcggctcgc acctcgcgca caagggccgc 360

tcgttcatcg gccgcgcggt gaagggctgg aagaccggct tcgaaaccgg cacccgcatc 420

ctgcgcgggc tggaactcgc ctcgccctac tcgcgcgcgc tggccgagcg cgacctgttc 480

gtggcgccgt cgaagcgctg gtacggcgcc ggccgcatcc tcgccaccgt gctggtcggc 540

aacagcggct actccggcat ccaggccatc gccaacgagg acggctccga cggcaccgtg 600

cgcatcggca ccgccaacct gcaggcggcg cttgcgaagg tggtgttccc gcccggcccg 660

gtcgcgccgg tggtgcagtt ccgcaacatc gcgggcgcca ccgcgttcgc catcgtcgac 720

ggcgacaacc attccgacat caccatgaag gacaagccgt cgaagaccgg catccgcgag 780

gaactgatcc tcggcgcgct gaaggtgcgc gacgccgact tccccgagaa cgccgacggc 840

gcgttcccgt ggcaggcgaa gctcgacgcg aaggccggtg cggccaaggt gtcttcgccc 900

gggcgccaga acaccgtggt gcacctcacc gacagcttcg gcgacgacgt cgtcgatttc 960

ttcttcgagt tctggcgcag cgaacgcagc gacaaggtgt tcgagcagcg cttctacaag 1020

gacgtcatcg acgacgtgca cgtgtacgac ggcaacggcg cgtggcgctc gctcaacctc 1080

gacctcgaca agttcgaggc gctgcgcaag gacccgaagc tcggcttcga gaaactgctg 1140

gtcagcgtgt tcgcctcgcc cgcgaagaag ggcgacgcca aggtcggcta cagcaccgcc 1200

accggccgcg acatcggcgc ctggcacgtc gaaggccgtg acttcgccaa ggccttcacg 1260

ccgcaccgca ccctgttcgt cgacatcgag atcccacgca tcgtcgacga cgcggtgttc 1320

cggttccggg aatag 1335

<210>40

<211>444

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>40

Met Ala Asn Pro Ile Val Ile Ile His Gly Trp Ser Asp Asp Phe Gly

1 5 10 15

Ser Phe Arg Lys Leu Arg Asp Phe Leu Ser Thr Asn Leu Gly Val Pro

20 25 30

Ala Lys Ile Leu Lys Leu Gly Asp Trp Ile Ser Leu Asp Asp Asp Val

35 40 45

Gly Tyr Ala Asp Ile Ala Met Ala Leu Glu Arg Ala Trp Lys Ala Glu

50 55 60

Lys Leu Pro Thr Ala Pro Arg Ser Val Asp Val Val Val His Ser Thr

65 70 75 80

Gly Ala Leu Val Val Arg Glu Trp Met Thr Arg Tyr His Ala Pro Glu

85 90 95

Thr Val Pro Ile Gln Arg Phe Leu His Leu Ala Pro Ala Asn Phe Gly

100 105 110

Ser His Leu Ala His Lys Gly Arg Ser Phe Ile Gly Arg Ala Val Lys

115 120 125

Gly Trp Lys Thr Gly Phe Glu Thr Gly Thr Arg Ile Leu Arg Gly Leu

130 135 140

Glu Leu Ala Ser Pro Tyr Ser Arg Ala Leu Ala Glu Arg Asp Leu Phe

145 150 155 160

Val Ala Pro Ser Lys Arg Trp Tyr Gly Ala Gly Arg Ile Leu Ala Thr

165 170 175

Val Leu Val Gly Asn Ser Gly Tyr Ser Gly Ile Gln Ala Ile Ala Asn

180 185 190

Glu Asp Gly Ser Asp Gly Thr Val Arg Ile Gly Thr Ala Asn Leu Gln

195 200 205

Ala Ala Leu Ala Lys Val Val Phe Pro Pro Gly Pro Val Ala Pro Val

210 215 220

Val Gln Phe Arg Asn Ile Ala Gly Ala Thr Ala Phe Ala Ile Val Asp

225 230 235 240

Gly Asp Asn His Ser Asp Ile Thr Met Lys Asp Lys Pro Ser Lys Thr

245 250 255

Gly IIe Arg Glu Glu Leu Ile Leu Gly Ala Leu Lys Val Arg Asp Ala

260 265 270

Asp Phe Pro Glu Asn Ala Asp Gly Ala Phe Pro Trp Gln Ala Lys Leu

275 280 285

Asp Ala Lys Ala Gly Ala Ala Lys Val Ser Ser Pro Gly Arg Gln Asn

290 295 300

Thr Val Val His Leu Thr Asp Ser Phe Gly Asp Asp Val Val Asp Phe

305 310 315 320

Phe Phe Glu Phe Trp Arg Ser Glu Arg Ser Asp Lys Val Phe Glu Gln

325 330 335

Arg Phe Tyr Lys Asp Val Ile Asp Asp Val His Val Tyr Asp Gly Asn

340 345 350

Gly Ala Trp Arg Ser Leu Asn Leu Asp Leu Asp Lys Phe Glu Ala Leu

355 360 365

Arg Lys Asp Pro Lys Leu Gly Phe Glu Lys Leu Leu Val Ser Val Phe

370 375 380

Ala Ser Pro Ala Lys Lys Gly Asp Ala Lys Val Gly Tyr Ser Thr Ala

385 390 395 400

Thr Gly Arg Asp Ile Gly Ala Trp His Val Glu Gly Arg Asp Phe Ala

405 410 415

Lys Ala Phe Thr Pro His Arg Thr Leu Phe Val Asp Ile Glu Ile Pro

420 425 430

Arg Ile Val Asp Asp Ala Val Phe Arg Phe Arg Glu

435 440

<210>41

<211>1419

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>41

atgacgctcc gatcaacgga ctatgcgctg ctggcgcagg agagctacca cgacagccag 60

gtggacgccg acgtcaagct ggatggcgtg gcgtataaag tcttcgccac caccagcgac 120

gggctcaccg gattccaggc cacggcctac cagcgccagg acaccggcga ggtagtgatt 180

gcgtaccgcg gcacggagtt tgatcgcgag cccgtccgcg acggcggcgt cgatgcgggc 240

atggtgctgc tcggtgtcaa cgcacaggca ccagcgtcgg aagtgttcac ccggcaagtg 300

atcgagaagg cgaaacacga agccgagctc aacgaccgcg aaccgcagat caccgtcacc 360

ggccattccc tcggcggcac cctcgccgag atcaacgccg cgaagtacgg cctccatggc 420

gaaaccttca acgcctacgg cgcagccagc ctcaagggta ttccggaggg cggcgatacc 480

gtcatcgacc acgtccgtgc cggcgatctc gtcagcgcgg ccagccccca ctacgggcag 540

gtacgcgtct acgcggcgca gcaggacatc gatacgctgc aacacgccgg ttaccgcgat 600

gacagcggca tcctcagctt gcgcaacccg atcaaggcca cggatttcga tgcccatgcc 660

atcgataact tcgtgcccaa cagcaagctg ctcggtcagt cgatcatcgc gccggaaaac 720

gtggcgcgtt acgatgccca caaaggcatg gtcgaccgtt accgcgatga cgtggccgat 780

atccgcaagg gcatctcggc gccctgggaa atccccaagg ccatcggcga gctgaaggac 840

accctggagc acgaagcctt cgaactcgcc ggcaagggca ttctcgcggt ggagcacggc 900

ttcgaacatc tcaaggagga gatcggcgaa ggcatccacg ccgtggagga gaaagcttcc 960

agcgcgtggc ataccctcac ccatcccaag gaatggttcg agcacgataa acccaaggtg 1020

accctggacc acccggacca ccccgaccat gccctgttca agcaggcgca gggcgcggtg 1080

cacacagtcg atgcctcgca cggccgcacc cctgacaaga ccagcgacca gatcgccggc 1140

tcgctggtgg tatcggcacg ccgtgacggc cttgagcggg tagaccgcgc tgtactcagc 1200

gatgacgcca accgcctgta cggtgtgcag ggtgcggtgg actcgccgct gaagcaggtc 1260

accgaagtga acaccgccac cgccgcgcag acatcgctcc agcagagcag cgtggcctgg 1320

cagcaacagg cagaaatcgc gcgtcagaac caggcggcaa gccaggctca gcgcatggac 1380

cagcaggtgc cgccgcaggc acccgcgcac ggcatgtaa 1419

<210>42

<211>472

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>42

Met Thr Leu Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr

1 5 10 15

His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Val Ala Tyr

20 25 30

Lys Val Phe Ala Thr Thr Ser Asp Gly Leu Thr Gly Phe Gln Ala Thr

35 40 45

Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly

50 55 60

Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly

65 70 75 80

Met Val Leu Leu Gly Val Asn Ala Gln Ala Pro Ala Ser Glu Val Phe

85 90 95

Thr Arg Gln Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp

100 105 110

Arg Glu Pro Gln Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu

115 120 125

Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn

130 135 140

Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr

145 150 155 160

Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro

165 170 175

His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr

180 185 190

Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg

195 200 205

Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe

210 215 220

Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn

225 230 235 240

Val Ala Arg Tyr Asp Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp

245 250 255

Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro

260 265 270

Lys Ala Ile Gly Glu Leu Lys Asp Thr Leu Glu His Glu Ala Phe Glu

275 280 285

Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Phe Glu His Leu

290 295 300

Lys Glu Glu Ile Gly Glu Gly Ile His Ala Val Glu Glu Lys Ala Ser

305 310 315 320

Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu His Asp

325 330 335

Lys Pro Lys Val Thr Leu Asp His Pro Asp His Pro Asp His Ala Leu

340 345 350

Phe Lys Gln Ala Gln Gly Ala Val His Thr Val Asp Ala Ser His Gly

355 360 365

Arg Thr Pro Asp Lys Thr Ser Asp Gln Ile Ala Gly Ser Leu Val Val

370 375 380

Ser Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val Leu Ser

385 390 395 400

Asp Asp Ala Asn Arg Leu Tyr Gly Val Gln Gly Ala Val Asp Ser Pro

405 410 415

Leu Lys Gln Val Thr Glu Val Asn Thr Ala Thr Ala Ala Gln Thr Ser

420 425 430

Leu Gln Gln Ser Ser Val Ala Trp Gln Gln Gln Ala Glu Ile Ala Arg

435 440 445

Gln Asn Gln Ala Ala Ser Gln Ala Gln Arg Met Asp Gln Gln Val Pro

450 455 460

Pro Gln Ala Pro Ala His Gly Met

465 470

<210>43

<211>1287

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>43

atgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg 60

aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg 120

gtcgaggttc tcggtgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca 180

gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg 240

gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc 300

tccgggatca caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac 360

gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc 420

tggatcagag acctgattgc acagcgagtc gaggcagggc gctcagaggt gctgagccga 480

gccgacgccg acgggcggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca 540

tttgccgaac ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc 600

ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg 660

gacatgccga tcgacgtcgc ggtacgcatc tcggcatcgt tgccatggtt tttcaaatcc 720

gtgaaatgga acggctccga atacatagat ggcggatgcc tgtcgaactt cccaatgccg 780

atattcgacg tcgatcccta tcgtggcgac gcatcgtcga agatccggct cggcatcttc 840

ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatc 900

ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg 960

aaagcctcgg cagaacactg ggtcgtcggc atcgatgtcg agggcgccac ccgcgcgtcg 1020

aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat 1080

agcacgttca agttcgatct ctcagacgcg gacaaggagc gcatggccga ggccggcgca 1140

aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt 1200

tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat 1260

tcgtttcgag ccttgatcgc ggcctag 1287

<210>44

<211>428

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>44

Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile

1 5 10 15

Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro

20 25 30

Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly

35 40 45

Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met

50 55 60

Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala

65 70 75 80

Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr

85 90 95

Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys

100 105 110

Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly Thr Ser Asp Glu Arg

115 120 125

Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp

130 135 140

Leu Ile Ala Gln Arg Val Glu Ala GIy Arg Ser Glu Val Leu Ser Arg

145 150 155 160

Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys

165 170 175

Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro

180 185 190

Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser

195 200 205

Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile

210 215 220

Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser

225 230 235 240

Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn

245 250 255

Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp Ala Ser

260 265 270

Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly

275 280 285

Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser

290 295 300

Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val

305 310 315 320

Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala

325 330 335

Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr

340 345 350

Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser

355 360 365

Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg

370 375 380

Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe

385 390 395 400

Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala

405 410 415

Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala

420 425

<210>45

<211>1038

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>45

atgacaaccc aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60

attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga 120

gggtgcagtg cgggtgcgat taatgcgctg atttttgcgc tgggttacac ggttcgtgag 180

caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggtgtt 240

attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt 300

agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360

ctgcaaaatg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420

gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480

tccatgtcga taccgctgtt ctttgcagcc gtgcgtcacg gtgatcgaca agatgtgtat 540

gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt 600

gatctggcca aagatcccgg tgctgttcgg cgaacgggtt attacaacaa agaaaacgct 660

cgctttcagc ttgagcggcc cggtcatagc ccctatgttt acaatcgcca gaccttgggt 720

ttgcgtcttg atagtcgcga gcagataggg ctctttcgtt atgacgaacc cctcaagggc 780

aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840

caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacattg 900

gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa 960

ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcccgtg 1020

aatagagtgg agtcatag 1038

<210>46

<211>345

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>46

Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val

20 25 30

Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile

50 55 60

Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val

65 70 75 80

Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly

85 90 95

Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly

100 105 110

Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Asn Ala Lys Leu Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg

165 170 175

Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys

180 185 190

Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala

195 200 205

Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu

210 215 220

Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Arg Glu Gln Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln

260 265 270

Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly

275 280 285

Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln

305 310 315 320

Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu

325 330 335

Glu Lys Pro Val Asn Arg Val Glu Ser

340 345

<210>47

<211>1476

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>47

atgtcaacaa aagtagtatt tgtacatgga tggagcgtta ccaacctaaa tacatatggc 60

gaacttccgt tgagattaaa ggccgaagca ataagcagga acctgaacat cgaagtaaat 120

gaaattttcc tgggccgtta tatcagcttt aatgataaca ttacattaga tgacgtttcg 180

cgggctttta atacggccat tagcgaacag ttagacaata cagacaggtt tatatgtatt 240

acacattcta ccggagggcc ggttattcgc gaatggttaa ataaatacta ttataatgaa 300

cgtccaccac taagtcattt aataatgctt gcaccggcca attttggttc ggcattggct 360

cgtttaggga aaagtaaatt aagccgtatt aaaagttggt ttgaaggtgt agaaccaggg 420

cagaaaattt tagactggct ggagtgtgga agcaaccaat cgtggttact aaataaagac 480

tggatcgaca atggcaattt tcagattggc gctgataagt atttcccgtt tgttatcatt 540

ggccagtcga ttgatcgtaa actttacgat catcttaact catataccgg cgagcttggg 600

tccgatggtg tagttcgcac ctcaggagct aatcttaatt cgcggtatat taagcttgtt 660

caggacagaa atacaatagc taatggaaat atttccagta cattacgaat tgccgaatat 720

agagaagctt gtgcaacgcc catacgggta gttagaggta aatcgcattc gggcgatgaa 780

atgggtatca tgaaaagtgt taaaaaagaa attactgatg ccggaagcaa ggaaacaata 840

aatgccatat tcgagtgtat tgaagttaca aacaacgaac aatatcaatc cttaattact 900

aaatttgata acgaaacagc acaggtacaa aaggatgagc tgattgaaac ggaaacagaa 960

ttatttttaa tgcaccgtca tttcattcac gaccgctttt cgcaattcat ttttaaagta 1020

actgactcag aagggcaacc tgttacagat tatgatttaa tttttacagc cgggccacaa 1080

aacgatgcga accacttacc ggaaggattt gccattgaca ggcaacaaaa ttcaaataat 1140

aacgaaacca ttacgtatta ttttaattac gatgtattga aaggggctcc cgcaaatgtt 1200

taccgggacg cattaccagg tatttctatg ctggggctaa ccataaaccc aaggccggac 1260

gaaggttttg taagatatat cccatgcagc attaaagcca attccgagtt gatggaaaaa 1320

gcctttaaac caaattctac taccttggtc gatattgtta ttcaacgtgt agttagcaaa 1380

gaagtttttc ggttggaaaa gttaactggt agctcaatgc caacagacaa agatgggaat 1440

tttaaaaata ctgaacctgg taacgaaata atatga 1476

<210>48

<211>491

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>48

Met Ser Thr Lys Val Val Phe Val His Gly Trp Ser Val Thr Asn Leu

1 5 10 15

Asn Thr Tyr Gly Glu Leu Pro Leu Arg Leu Lys Ala Glu Ala Ile Ser

20 25 30

Arg Asn Leu Asn Ile Glu Val Asn Glu Ile Phe Leu Gly Arg Tyr Ile

35 40 45

Ser Phe Asn Asp Asn Ile Thr Leu Asp Asp Val Ser Arg Ala Phe Asn

50 55 60

Thr Ala Ile Ser Glu Gln Leu Asp Asn Thr Asp Arg Phe Ile Cys Ile

65 70 75 80

Thr His Ser Thr Gly Gly Pro Val Ile Arg Glu Trp Leu Asn Lys Tyr

85 90 95

Tyr Tyr Asn Glu Arg Pro Pro Leu Ser His Leu Ile Met Leu Ala Pro

100 105 110

Ala Asn Phe Gly Ser Ala Leu Ala Arg Leu Gly Lys Ser Lys Leu Ser

115 120 125

Arg Ile Lys Ser Trp Phe Glu Gly Val Glu Pro Gly Gln Lys Ile Leu

130 135 140

Asp Trp Leu Glu Cys Gly Ser Asn Gln Ser Trp Leu Leu Asn Lys Asp

145 150 155 160

Trp Ile Asp Asn Gly Asn Phe Gln Ile Gly Ala Asp Lys Tyr Phe Pro

165 170 175

Phe Val Ile Ile Gly Gln Ser Ile Asp Arg Lys Leu Tyr Asp His Leu

180 185 190

Asn Ser Tyr Thr Gly Glu Leu Gly Ser Asp Gly Val Val Arg Thr Ser

195 200 205

Gly Ala Asn Leu Asn Ser Arg Tyr Ile Lys Leu Val Gln Asp Arg Asn

210 215 220

Thr Ile Ala Asn Gly Asn Ile Ser Ser Thr Leu Arg Ile Ala Glu Tyr

225 230 235 240

Arg Glu Ala Cys Ala Thr Pro Ile Arg Val Val Arg Gly Lys Ser His

245 250 255

Ser Gly Asp Glu Met Gly Ile Met Lys Ser Val Lys Lys Glu Ile Thr

260 265 270

Asp Ala Gly Ser Lys Glu Thr Ile Asn Ala Ile Phe Glu Cys Ile Glu

275 280 285

Val Thr Asn Asn Glu Gln Tyr Gln Ser Leu Ile Thr Lys Phe Asp Asn

290 295 300

Glu Thr Ala Gln Val Gln Lys Asp Glu Leu Ile Glu Thr Glu Thr Glu

305 310 315 320

Leu Phe Leu Met His Arg His Phe Ile His Asp Arg Phe Ser Gln Phe

325 330 335

Ile Phe Lys Val Thr Asp Ser Glu Gly Gln Pro Val Thr Asp Tyr Asp

340 345 350

Leu Ile Phe Thr Ala Gly Pro Gln Asn Asp Ala Asn His Leu Pro Glu

355 360 365

Gly Phe Ala Ile Asp Arg Gln Gln Asn Ser Asn Asn Asn Glu Thr Ile

370 375 380

Thr Tyr Tyr Phe Asn Tyr Asp Val Leu Lys Gly Ala Pro Ala Asn Val

385 390 395 400

Tyr Arg Asp Ala Leu Pro Gly Ile Ser Met Leu Gly Leu Thr Ile Asn

405 410 415

Pro Arg Pro Asp Glu Gly Phe Val Arg Tyr Ile Pro Cys Ser Ile Lys

420 425 430

Ala Asn Ser Glu Leu Met Glu Lys Ala Phe Lys Pro Asn Ser Thr Thr

435 440 445

Leu Val Asp Ile Val Ile Gln Arg Val Val Ser Lys Glu Val Phe Arg

450 455 460

Leu Glu Lys Leu Thr Gly Ser Ser Met Pro Thr Asp Lys Asp Gly Asn

465 470 475 480

Phe Lys Asn Thr Glu Pro Gly Asn Glu Ile Ile

485 490

<210>49

<211>1257

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>49

atgaattttt ggtcctttct tcttagtata accttaccta tgggggtagg cgttgctcat 60

gcacagcccg atacggattt tcaatcggct gagccttatg tctcttctgc gccaatgggg 120

cgacaaactt atacttacgt gcgttgttgg tatcgcacca gccacagtac ggatgatcca 180

gcgacagatt ggcagtgggc gagaaactcc gatggtagct attttacttt gcaaggatac 240

tggtggagct cggtaagact aaaaaatatg ttttacactc aaacctcgca aaatgttatt 300

cgtcagcgct gcgaacacac tttaagcatt aatcatgata atgcggatat tactttttat 360

gcggcggata atcgtttctc attaaaccat acgatttggt cgaatgatcc tgtcatgcag 420

gctaatcaaa tcaacaagat tgtcgcgttt ggtgacagct tgtccgatac cggtaatatt 480

tttaatgccg cgcagtggcg ttttcctaat cccaatagtt ggtttttggg gcatttttct 540

aacggtttgg tatggactga gtacttagct aaacagaaaa acttaccgat atataactgg 600

gcggttggtg gcgctgctgg ggcgaatcaa tatgtggcgt taaccggtgt tacaggccaa 660

gtgaactctt atttacagta catgggtaaa gcgcaaaact atcgtccaca gaataccttg 720

tacactttgg tcttcggttt gaatgatttt atgaattata accgtgaggt tgctgaggtg 780

gcggctgatt ttgaaacggc attacagcgt ttaacgcaag ctggcgcgca aaatatttta 840

atgatgacgc taccggatgt gactaaagca ccacagttta cctactcaac tcaagcggaa 900

atcgacttga ttcaaggtaa aatcaatgcg ttgaacatca agttaaaaca gttgactgcg 960

caatatattt tacaaggcta tgccattcat ctatttgata cttatgagtt atttgattca 1020

atggtcgctg aaccggaaaa gcatggcttt gctaatgcca gtgaaccttg tttgaatctc 1080

acccgttctt cagcggcgga ttatttgtac cgtcatccca ttaccaatac ttgtgctcgt 1140

tatggtgcag acaaatttgt attttgggat gtcacccatc caaccacggc aactcatcgc 1200

tatatttcac aaacgctgtt agcgccgggt aatggattac aatattttaa tttttaa 1257

<210>50

<211>418

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<400>50

Met Asn Phe Trp Ser Phe Leu Leu Ser Ile Thr Leu Pro Met Gly Val

1 5 10 15

Gly Val Ala His Ala Gln Pro Asp Thr Asp Phe Gln Ser Ala Glu Pro

20 25 30

Tyr Val Ser Ser Ala Pro Met Gly Arg Gln Thr Tyr Thr Tyr Val Arg

35 40 45

Cys Trp Tyr Arg Thr Ser His Ser Thr Asp Asp Pro Ala Thr Asp Trp

50 55 60

Gln Trp Ala Arg Asn Ser Asp Gly Ser Tyr Phe Thr Leu Gln Gly Tyr

65 70 75 80

Trp Trp Ser Ser Val Arg Leu Lys Asn Met Phe Tyr Thr Gln Thr Ser

85 90 95

Gln Asn Val Ile Arg Gln Arg Cys Glu His Thr Leu Ser Ile Asn His

100 105 110

Asp Asn Ala Asp Ile Thr Phe Tyr Ala Ala Asp Asn Arg Phe Ser Leu

115 120 125

Asn His Thr Ile Trp Ser Asn Asp Pro Val Met Gln Ala Asn Gln Ile

130 135 140

Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Ile

145 150 155 160

Phe Asn Ala Ala Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp Phe Leu

165 170 175

Gly His Phe Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Lys Gln

180 185 190

Lys Asn Leu Pro Ile Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Ala

195 200 205

Asn Gln Tyr Val Ala Leu Thr Gly Val Thr Gly Gln Val Asn Ser Tyr

210 215 220

Leu Gln Tyr Met Gly Lys Ala Gln Asn Tyr Arg Pro Gln Asn Thr Leu

225 230 235 240

Tyr Thr Leu Val Phe Gly Leu Asn Asp Phe Met Asn Tyr Asn Arg Glu

245 250 255

Val Ala Glu Val Ala Ala Asp Phe Glu Thr Ala Leu Gln Arg Leu Thr

260 265 270

Gln Ala Gly Ala Gln Asn Ile Leu Met Met Thr Leu Pro Asp Val Thr

275 280 285

Lys Ala Pro Gln Phe Thr Tyr Ser Thr Gln Ala Glu Ile Asp Leu Ile

290 295 300

Gln Gly Lys Ile Asn Ala Leu Asn Ile Lys Leu Lys Gln Leu Thr Ala

305 310 315 320

Gln Tyr Ile Leu Gln Gly Tyr Ala Ile His Leu Phe Asp Thr Tyr Glu

325 330 335

Leu Phe Asp Ser Met Val Ala Glu Pro Glu Lys His Gly Phe Ala Asn

340 345 350

Ala Ser Glu Pro Cys Leu Asn Leu Thr Arg Ser Ser Ala Ala Asp Tyr

355 360 365

Leu Tyr Arg His Pro Ile Thr Asn Thr Cys Ala Arg Tyr Gly Ala Asp

370 375 380

Lys Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr His Arg

385 390 395 400

Tyr Ile Ser Gln Thr Leu Leu Ala Pro Gly Asn Gly Leu Gln Tyr Phe

405 410 415

Asn Phe

<210>51

<211>1482

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>51

atgacaatcc gctcaacgga ctatgcgctg ctcgcgcagg agagctacca cgacagccag 60

gtcgatgccg acgtcaaact cgatggcatc gcctacaagg tcttcgccac caccgatgac 120

ccgctcacgg ggttccaggc caccgcgtac cagcgccagg acaccggcga agtcgtcatc 180

gcctatcgtg gtacggaatt cgaccgcgag cccgttcgcg acggcggcgt cgatgccggc 240

atggtgctgc tgggggtgaa tgcccagtcg cctgcctccg agctatttac ccgcgaagtg 300

atcgagaagg cgacgcacga agccgaactc aatgaccgcg agccccggat caccgtgact 360

ggccactccc tcggcggcac cctcgccgaa atcaacgcgg ccaagtacgg cctgcacggc 420

gaaaccttca acgcatacgg tgcggccagc ctcaagggca tcccggaagg cggcaatacc 480

gtgatcgacc acgtgcgcgc tggcgacctc gtcagcgccg ccagcccgca ttacgggcag 540

gtgcgcgtct acgcggccca gcaggatatc gacaccttgc agcatgccgg ctaccgcgac 600

gacagcggca tccttagcct gcgcaacccg atcaaggcca cggatttcga cgcgcacgcc 660

atcgacaact tcgtgccgaa cagcaaactg cttggccagt cgatcatcgc gccggaaaac 720

gaagcccgtt acgaagccca caagggcatg gtcgaccgct accgcgatga cgtggctgac 780

atccgcatgc tcgtctccgc tcccctgaac atcccgcgca ccatcggcga tatcaaggat 840

gccgtggaac gcgaggcatt tgagctggct ggcaagggca tcctcgccgt tgaacacggc 900

atcgaagagg tcgtgcacga ggcaaaggaa ggcttcgagc acctcaagga aggctttgag 960

cacctgaagg aagaagtcag cgagggcttc catgccttcg aggaaaaggc ctccagcgcg 1020

tggcatacgc tgacccatcc caaggaatgg ttcgagcacg acaagccgca ggtcgccctg 1080

aaccacccac agcacccgga caacgaactg ttcaagaagg tgctcgaagg cgtgcaccag 1140

gttgatgcga agcagggtcg ttcacccgac cagctcagtg agaacctggc cgcatcgctt 1200

accgttgccg cacgcaagga aggcctggac aaggtcaacc acgtgctgct cgacgacccc 1260

ggcattcgca cctacgccgt gcagggtgag ctcaactcgc cgttgaagca ggtctccagt 1320

gtcgataacg cccaggcggt cgccacaccg gtggcccaga gcagcgcgca atggcagcag 1380

gctgccgagg cgcggcaggc acagcacaat gaggcgcttg cgcagcagca ggcgcaacag 1440

cagcagaaca accggcccaa ccatggggtt gccggcccgt ga 1482

<210>52

<211>493

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>52

Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr

1 5 10 15

His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ala Tyr

20 25 30

Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr

35 40 45

Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly

50 55 60

Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly

65 70 75 80

Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Leu Phe

85 90 95

Thr Arg Glu Val Ile Glu Lys Ala Thr His Glu Ala Glu Leu Asn Asp

100 105 110

Arg Glu Pro Arg Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu

115 120 125

Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn

130 135 140

Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asn Thr

145 150 155 160

Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro

165 170 175

His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr

180 185 190

Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg

195 200 205

Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe

210 215 220

Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn

225 230 235 240

Glu Ala Arg Tyr Glu Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp

245 250 255

Asp Val Ala Asp Ile Arg Met Leu Val Ser Ala Pro Leu Asn Ile Pro

260 265 270

Arg Thr Ile Gly Asp Ile Lys Asp Ala Val Glu Arg Glu Ala Phe Glu

275 280 285

Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Ile Glu Glu Val

290 295 300

Val His Glu Ala Lys Glu Gly Phe Glu His Leu Lys Glu Gly Phe Glu

305 310 315 320

Hi s Leu Lys Glu Glu Val Ser Glu Gly Phe His Ala Phe Glu Glu Lys

325 330 335

Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu

340 345 350

His Asp Lys Pro Gln Val Ala Leu Asn Hi s Pro Gln His Pro Asp Asn

355 360 365

Glu Leu Phe Lys Lys Val Leu Glu Gly Val His Gln Val Asp Ala Lys

370 375 380

Gln Gly Arg Ser Pro Asp Gln Leu Ser Glu Asn Leu Ala Ala Ser Leu

385 390 395 400

Thr Val Ala Ala Arg Lys Glu Gly Leu Asp Lys Val Asn His Val Leu

405 410 415

Leu Asp Asp Pro Gly Ile Arg Thr Tyr Ala Val Gln Gly Glu Leu Asn

420 425 430

Ser Pro Leu Lys Gln Val Ser Ser Val Asp Asn Ala Gln Ala Val Ala

435 440 445

Thr Pro Val Ala Gln Ser Ser Ala Gln Trp Gln Gln Ala Ala Glu Ala

450 455 460

Arg Gln Ala Gln His Asn Glu Ala Leu Ala Gln Gln Gln Ala Gln Gln

465 470 475 480

Gln Gln Asn Asn Arg Pro Asn His Gly Val Ala Gly Pro

485 490

<210>53

<211>1491

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>53

atgcgtcagg ttacattagt atttgttcat ggctacagcg ttacaaacat cgacacttat 60

ggtgaaatgc cactcaggct ccgcaacgaa ggagccacac gtgatataga aataaaaatt 120

gagaacattt tcctggggcg ctacatcagc tttaatgatg atgtgagatt aaatgatgtt 180

tccagagcat tggaaacagc cgtacaacaa cagattgcac cgggaaataa aaacaattcc 240

cgttacgtat tcatcaccca ctctaccggc ggaccggtag tgagaaactg gtgggatctg 300

tactataaaa acagcacgaa acaatgccct atgagccacc tcattatgct ggctcctgcc 360

aattttggct cggcactggc acaactggga aaaagcaaac taagccgcat taaatcctgg 420

ttcgatggtg tggaacccgg acagaatgta ttgaattggc tggaactggg aagcgcggaa 480

gcatggaagc taaacaccga ctggattaag agtgatggaa gtcagatctc ggcacagggt 540

atttttcctt ttgtgatcat aggtcaggac attgaccgca aattatacga tcatttaaac 600

tcctacaccg gtgagctggg ttccgacggc gtggtgcgtt cggccgcagc caatttaaat 660

gctacttatg taaaactcac acaacctaaa cccaccttgg taaatggaaa actggtaaca 720

ggtaatctgg aaataggaga agtaaaacaa gcgccttata cacccatgcg catcgtctca 780

aaaaaatcgc attccaacaa ggatatggga attatgagaa gtgtactgaa atcaacaaat 840

gatgccaaca gcgccgaaac ggtaaacgcc atttttgact gcattaatgt gaaaacctta 900

accgattacc agagcattgc cacacagttt gattcgcaaa caaaagacgt gcaggaaaat 960

tcaattattg aaagggaaaa aacgcccttt ggaactaaaa actatattca cgaccgtttc 1020

tcccaggtca ttttcagagt aacagacagt gaaggttacc cggttaccag ttttgatctg 1080

atcctcaccg gcggcgaaaa aaatgatccc aacgccttgc ctcagggctt ttttgtggac 1140

agacaatgca acagtgtcaa taaatcgacc attacttatt ttttaaatta cgatattatg 1200

aacggcacac cagctatagc aggtataaga ccggcatcca aaggcatgga aaaactgggt 1260

ctgatcatta acccaaggcc tgaagaaggc tttgtgcgtt acattccctg caaaataaac 1320

acatcgcccg atttgtttga cgccgctctg aaacccaacg ccacaacgct tattgatatt 1380

gtattgcaac gcgtggtaag taccgaagta ttccgctttg aaggaacaga cggggtaacg 1440

ccgcctaaaa aagatttctc gaaagtgaaa cccggaacgg atattatttg a 1491

<210>54

<211>496

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>54

Met Arg Gln Val Thr Leu Val Phe Val His Gly Tyr Ser Val Thr Asn

1 5 10 15

Ile Asp Thr Tyr Gly Glu Met Pro Leu Arg Leu Arg Asn Glu Gly Ala

20 25 30

Thr Arg Asp Ile Glu Ile Lys Ile Glu Asn Ile Phe Leu Gly Arg Tyr

35 40 45

Ile Ser Phe Asn Asp Asp Val Arg Leu Asn Asp Val Ser Arg Ala Leu

50 55 60

Glu Thr Ala Val Gln Gln Gln Ile Ala Pro Gly Asn Lys Asn Asn Ser

65 70 75 80

Arg Tyr Val Phe Ile Thr His Ser Thr Gly Gly Pro Val Val Arg Asn

85 90 95

Trp Trp Asp Leu Tyr Tyr Lys Asn Ser Thr Lys Gln Cys Pro Met Ser

100 105 110

His Leu Ile Met Leu Ala Pro Ala Asn Phe Gly Ser Ala Leu Ala Gln

115 120 125

Leu Gly Lys Ser Lys Leu Ser Arg Ile Lys Ser Trp Phe Asp Gly Val

130 135 140

Glu Pro Gly Gln Asn Val Leu Asn Trp Leu Glu Leu Gly SerAla Glu

145 150 155 160

Ala Trp Lys Leu Asn Thr Asp Trp Ile Lys Ser Asp Gly Ser Gln Ile

165 170 175

Ser Ala Gln Gly Ile Phe Pro Phe Val Ile Ile Gly Gln Asp Ile Asp

180 185 190

Arg Lys Leu Tyr Asp His Leu Asn Ser Tyr Thr Gly Glu Leu Gly Ser

195 200 205

Asp Gly Val Val Arg Ser Ala Ala Ala Asn Leu Asn Ala Thr Tyr Val

210 215 220

Lys Leu Thr Gln Pro Lys Pro Thr Leu Val Asn Gly Lys Leu Val Thr

225 230 235 240

Gly Asn Leu Glu Ile Gly Glu Val Lys Gln Ala Pro Tyr Thr Pro Met

245 250 255

Arg Ile Val Ser Lys Lys Ser His Ser Asn Lys Asp Met Gly Ile Met

260 265 270

Arg Ser Val Leu Lys Ser Thr Asn Asp Ala Asn Ser Ala Glu Thr Val

275 280 285

Asn Ala Ile Phe Asp Cys Ile Asn Val Lys Thr Leu Thr Asp Tyr Gln

290 295 300

Ser Ile Ala Thr Gln Phe Asp Ser Gln Thr Lys Asp Val Gln Glu Asn

305 310 315 320

Ser Ile Ile Glu Arg Glu Lys Thr Pro Phe Gly Thr Lys Asn Tyr Ile

325 330 335

His Asp Arg Phe Ser Gln Val Ile Phe Arg Val Thr Asp Ser Glu Gly

340 345 350

Tyr Pro Val Thr Ser Phe Asp Leu Ile Leu Thr Gly Gly Glu Lys Asn

355 360 365

Asp Pro Asn Ala Leu Pro Gln Gly Phe Phe Val Asp Arg Gln Cys Asn

370 375 380

Ser Val Asn Lys Ser Thr Ile Thr Tyr Phe Leu Asn Tyr Asp Ile Met

385 390 395 400

Asn Gly Thr Pro Ala Ile Ala Gly Ile Arg Pro Ala Ser Lys Gly Met

405 410 415

Glu Lys Leu Gly Leu Ile Ile Asn Pro Arg Pro Glu Glu Gly Phe Val

420 425 430

Arg Tyr Ile Pro Cys Lys Ile Asn Thr Ser Pro Asp Leu Phe Asp Ala

435 440 445

Ala Leu Lys Pro Asn Ala Thr Thr Leu Ile Asp Ile Val Leu Gln Arg

450 455 460

Val Val Ser Thr Glu Val Phe Arg Phe Glu Gly Thr Asp Gly Val Thr

465 470 475 480

Pro Pro Lys Lys Asp Phe Ser Lys Val Lys Pro Gly Thr Asp Ile Ile

485 490 495

<210>55

<211>1041

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>55

atggcttcac aattcagaaa tctggttttt gaaggaggcg gtgtgaaggg catcgcctat 60

atcggcgcea tgcaggtgct ggagcagcgg ggactgctca aggatattgt ccgggtggga 120

ggtaccagtg caggcgccat caacgcgctg atcttttcgc tgggctttac catcaaagag 180

cagcaggata ttctcaactc caccaacttc agggagttta tggacagctc gttcgggttc 240

atccgaaact tccggaggtt atggagcgaa ttcggttgga accgcggcga tgtattttcg 300

gactgggccg gggagctggt gaaagagaag ctcggcaaaa agaacgccac gttcggcgat 360

ctgaaaaagg cgaaacgtcc cgatctgtac gtgatcggca ccaatctctc tacggggttt 420

tccgagacct tttcgcacga acgccacgcc gacatgcctc tggtagatgc ggtgcggata 480

agcatgtcga tcccgctctt ttttgctgca cggaggctgg gaaaacgtaa ggatgtgtat 540

gtggatggcg gggtgatgct caactatccc gtgaagctgt tcgacaggga gaagtatatc 600

gatttggaga aagagaatga ggcggcccgc tatgtggagt actacaatca agagaatgcc 660

cggtttctgc tcgagcggcc cggccgaagc ccttatgtgt ataaccggca gactctcggt 720

ctgcggctcg acacgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc 780

aagcagatca accgtttccc cgaatacgcc agagccctga tcggctcgct gatgcaggta 840

caggagaaca tccacctgaa aagtgacgac tggcagcgaa cgctctacat caacacgctg 900

gatgtgggca ccaccgattt cgacattacc gacgagaaga aaaaagtgct ggtgaatgag 960

gggatcaagg gagcggagac ctatttccgc tggtttgagg atcccgaaga aaaaccggtg 1020

aataaggtga atcttgtctg a 1041

<210>56

<211>346

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>56

Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly Leu

20 25 30

Leu Lys Asp Ile Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile

50 55 60

Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe

65 70 75 80

Ile Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly

85 90 95

Asp Val Phe Ser Asp Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly

100 105 110

Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe

130 135 140

Ser His Glu Arg His Ala Asp Met Pro Leu Val Asp Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg

165 170 175

Lys Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys

180 185 190

Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Asn Glu Ala

195 200 205

Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu

210 215 220

Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Thr Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Arg Ala

260 265 270

Leu Ile Gly Ser Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser

275 280 285

Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asp Ile Thr Asp Glu Lys Lys Lys Val Leu Val Asn Glu

305 310 315 320

Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu

325 330 335

Glu Lys Pro Val Asn Lys Val Asn Leu Val

340 345

<210>57

<211>1413

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>57

atgcaattag tgttcgtaca cgggtggagt gttacccata ccaataccta tggtgaatta 60

cccgaaagtt tggcggcagg cgccgcgaca cacggcctgc agatcgatat caggcacgtt 120

tttctcggca agtacatcag ctttcacgat gaggtgactc tggatgatat agcacgtgcc 180

ttcgacaagg cgctgagaga catgtcgggt gatggtgaca cggtctcgcc tttctcctgt 240

atcacgcatt cgaccggcgg ccctgtcgtt cggcactgga ttaacaaatt ctacggcgcg 300

cgagggctat cgaaactgcc gctggagcat ttggttatgc tggcgcctgc caaccacggc 360

tccagcctgg cggtactcgg caagcaacgt cttggtcgca tcaagtcctg gttcgatggc 420

gtggagcccg gacaaaaagt gctcgactgg ctatcgctgg gcagcaatgg gcaatgggcg 480

ctcaacaggg attttttgag ctaccgcccg gccaaacatg gcttcttccc ttttgttctg 540

acgggccagg gtatagacac aaaattctac gattttttga acagctacct tgtggagccc 600

ggcagtgacg gtgtggttcg cgtggcgggt gccaatatgc attttcgcta cctctccctg 660

gtacaatctg agaccgtatt acacaccccg ggcaaggtgc tacagctgga atataacgag 720

cggcgccccg tgaagtcccc acaagcggta ccgatgggcg tcttctccca atttagccac 780

tctggcgaca agatggggat tatggcagtc aagcgcaaga aagacgcgca tcaaatgatc 840

gtaacggaag tgctgaagtg tctctgcgta tcggacagcg atgaatatca gcaaagaggc 900

cttgaacttg cagaactgac cgccagcgaa cagcgcaagc ccatcgaaga ccaggacaag 960

attatcagcc gctatagcat gctggtattt agagtgcgcg accaggcggg caatacgatc 1020

ggagtgcacg atttcgatat cctcttactg gccggagata cctatagccc cgacaaactg 1080

ccagaggggt tcttcatgga taaacaggcc aatagagatg ccggctcact gatctactat 1140

gtggatgccg acaaaatgtc cgagatgaaa gatggctgct acggactgcg ggtggtcgtg 1200

cggccggaga aagggttttc ctattacaca acaggtgagt tcaggtcaga gggtatcccc 1260

gtggaccgtg tatttgcagc aaacgaaacc acctatattg atatcaccat gaaccgaagt 1320

gtcgatcaaa atgtattccg gttttcgcct gcaacagagc cacctgaaag cttcaaaaga 1380

accacgccct caggtaccga tatcccttca tag 1413

<210>58

<211>470

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>58

Met Gln Leu Val Phe Val His Gly Trp Ser Val Thr His Thr Asn Thr

1 5 10 15

Tyr Gly Glu Leu Pro Glu Ser Leu Ala Ala Gly Ala Ala Thr His Gly

20 25 30

Leu Gln Ile Asp Ile Arg His Val Phe Leu Gly Lys Tyr Ile Ser Phe

35 40 45

His Asp Glu Val Thr Leu Asp Asp Ile Ala Arg Ala Phe Asp Lys Ala

50 55 60

Leu Arg Asp Met Ser Gly Asp Gly Asp Thr Val Ser Pro Phe Ser Cys

65 70 75 80

Ile Thr His Ser Thr Gly Gly Pro Val Val Arg His Trp Ile Asn Lys

85 90 95

Phe Tyr Gly Ala Arg Gly Leu Ser Lys Leu Pro Leu Glu His Leu Val

100 105 110

Met Leu Ala Pro Ala Asn His Gly Ser Ser Leu Ala Val Leu Gly Lys

115 120 125

Gln Arg Leu Gly Arg Ile Lys Ser Trp Phe Asp Gly Val Glu Pro Gly

130 135 140

Gln Lys Val Leu Asp Trp Leu Ser Leu Gly Ser Asn Gly Gln Trp Ala

145 150 155 160

Leu Asn Arg Asp Phe Leu Ser Tyr Arg Pro Ala Lys His Gly Phe Phe

165 170 175

Pro Phe Val Leu Thr Gly Gln Gly Ile Asp Thr Lys Phe Tyr Asp Phe

180 185 190

Leu Asn Ser Tyr Leu Val Glu Pro Gly Ser Asp Gly Val Val Arg Val

195 200 205

Ala Gly Ala Asn Met His Phe Arg Tyr Leu Ser Leu Val Gln Ser Glu

210 215 220

Thr Val Leu His Thr Pro Gly Lys Val Leu Gln Leu Glu Tyr Asn Glu

225 230 235 240

Arg Arg Pro Val Lys Ser Pro Gln Ala Val Pro Met Gly Val Phe Ser

245 250 255

Gln Phe Ser His Ser Gly Asp Lys Met Gly Ile Met Ala Val Lys Arg

260 265 270

Lys Lys Asp Ala His Gln Met Ile Val Thr Glu Val Leu Lys Cys Leu

275 280 285

Cys Val Ser Asp Ser Asp Glu Tyr Gln Gln Arg Gly Leu Glu Leu Ala

290 295 300

Glu Leu Thr Ala Ser Glu Gln Arg Lys Pro Ile Glu Asp Gln Asp Lys

305 310 315 320

Ile Ile Ser Arg Tyr Ser Met Leu Val Phe Arg Val Arg Asp Gln Ala

325 330 335

Gly Asn Thr Ile Gly Val His Asp Phe Asp Ile Leu Leu Leu Ala Gly

340 345 350

Asp Thr Tyr Ser Pro Asp Lys Leu Pro Glu Gly Phe Phe Met Asp Lys

355 360 365

Gln Ala Asn Arg Asp Ala Gly Ser Leu Ile Tyr Tyr Val Asp Ala Asp

370 375 380

Lys Met Ser Glu Met Lys Asp Gly Cys Tyr Gly Leu Arg Val Val Val

385 390 395 400

Arg Pro Glu Lys Gly Phe Ser Tyr Tyr Thr Thr Gly Glu Phe Arg Ser

405 410 415

Glu Gly Ile Pro Val Asp Arg Val Phe Ala Ala Asn Glu Thr Thr Tyr

420 425 430

Ile Asp Ile Thr Met Asn Arg Ser Val Asp Gln Asn Val Phe Arg Phe

435 440 445

Ser Pro Ala Thr Glu Pro Pro Glu Ser Phe Lys Arg Thr Thr Pro Ser

450 455 460

Gly Thr Asp Ile Pro Ser

465 470

<210>59

<211>1038

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>59

atgacaacac aatttagaaa cttgatcttt gaaggcggcg gtgtaaaagg cgttgcttac 60

attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga 120

gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac ggtccgtgag 180

caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt 240

attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt 300

agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360

ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420

gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480

tccatgtcga taccgctgtt ctttgcggca gtgcgtcatg gtgatcgaca agatgtgtat 540

gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt 600

gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct 660

cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720

ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780

aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgct gatgaatgca 840

caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacactc 900

gatgtgggta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa 960

ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg 1020

aatagagtgg agtcatag 1038

<210>60

<211>345

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>60

Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val

20 25 30

Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile

50 55 60

Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val

65 70 75 80

Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly

85 90 95

Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly

100 105 110

Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg

165 170 175

Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys

180 185 190

Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala

195 200 205

Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu

210 215 220

Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln

260 265 270

Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly

275 280 285

Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln

305 310 315 320

Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu

325 330 335

Glu Lys Pro Val Asn Arg Val Glu Ser

340 345

<210>61

<211>1257

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>61

atgacattaa aactctccct gctgatcgcg agcctgagcg ccgtgtctcc agcagtcttg 60

gcaaacgacg tcaatccagc gccactcatg gcgccgtccg aagcggattc cgcgcagacg 120

ctgggcagtc tgacgtacac ctatgttcgc tgctggtatc gtccggctgc gacgcataat 180

gatccttaca ccacctggga gtgggcgaag aacgcggacg gcagtgattt caccattgat 240

ggctattggt ggtcatcggt gagttacaaa aacatgttct ataccgatac tcagcccgat 300

accatcatgc agcgctgtgc agagacgttg gggttaaccc acgataccgc tgacatcacc 360

tatgccgcgg ccgatacccg tttctcctac aaccacacca tctggagcaa cgatgtcgcc 420

aacgcgccga gcaaaatcaa taaggtgatc gcctttggtg acagcctgtc agacacgggc 480

aacattttta acgcctcgca atggcgcttc ccgaacccga actcctggtt tgtcggccac 540

ttctcaaacg ggtttgtctg gaccgagtat ctggcgcaag gtttggggct gcccctctac 600

aactgggccg tgggcggcgc ggcggggcgc aatcaatact gggcgctgac tggcgtgaat 660

gaacaggtca gttcgtacct gacctacatg gagatggcgc cgaattaccg tgcggagaac 720

acgctgttta cactcgaatt cggtctgaat gattttatga actacgaccg ttcactggca 780

gacgtcaaag cagattacag ctcggcgctg attcgtctgg tggaagccgg agcgaaaaat 840

atggtgctgt tgaccctacc ggatgccacg cgcgcgccgc agttccaata ttcaacgcaa 900

gaacacatcg acgaggtgcg cgccaaagtg attggcatga acgcgttcat tcgtgagcag 960

gcacgctact tccagatgca gggcatcaac atttcgctgt ttgacgccta cacgctgttt 1020

gatcagatga tcgccgaccc agccgcgcac ggctttgata atgccagcgc gccatgtctt 1080

gatattcagc gcagctctgc ggcggactat ctctacacgc atgctctggc agccgagtgt 1140

gcctcatccg gttcagaccg ctttgtgttc tgggatgtga ctcacccaac cacggcaacg 1200

catcgctaca tcgccgacca cattctggct accggtgttg cgcagttccc gcgttaa 1257

<210>62

<211>418

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(21)

<223>从环境样品中获得

<400>62

Met Thr Leu Lys Leu Ser Leu Leu Ile Ala Ser Leu Ser Ala Val Ser

1 5 10 15

Pro Ala Val Leu Ala Asn Asp Val Asn Pro Ala Pro Leu Met Ala Pro

20 25 30

Ser Glu Ala Asp Ser Ala Gln Thr Leu Gly Ser Leu Thr Tyr Thr Tyr

35 40 45

Val Arg Cys Trp Tyr Arg Pro Ala Ala Thr His Asn Asp Pro Tyr Thr

50 55 60

Thr Trp Glu Trp Ala Lys Asn Ala Asp Gly Ser Asp Phe Thr Ile Asp

65 70 75 80

Gly Tyr Trp Trp Ser Ser Val Ser Tyr Lys Asn Met Phe Tyr Thr Asp

85 90 95

Thr Gln Pro Asp Thr Ile Met Gln Arg Cys Ala Glu Thr Leu Gly Leu

100 105 110

Thr His Asp Thr Ala Asp Ile Thr Tyr Ala Ala Ala Asp Thr Arg Phe

115 120 125

Ser Tyr Asn His Thr Ile Trp Ser Asn Asp Val Ala AsnAla Pro Ser

130 135 140

Lys Ile Asn Lys Val Ile Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly

145 150 155 160

Asn Ile Phe Asn Ala Ser Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp

165 170 175

Phe Val Gly His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala

180 185 190

Gln Gly Leu Gly Leu Pro Leu Tyr AsnTrp Ala Val Gly Gly Ala Ala

195 200 205

Gly Arg Asn Gln Tyr Trp Ala Leu Thr Gly Val Asn Glu Gln Val Ser

210 215 220

Ser Tyr Leu Thr Tyr Met Glu Met Ala Pro Asn Tyr Arg Ala Glu Asn

225 230 235 240

Thr Leu Phe Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Asp

245 250 255

Arg Ser Leu Ala Asp Val Lys Ala Asp Tyr Ser Ser Ala Leu Ile Arg

260 265 270

Leu Val Glu Ala Gly Ala Lys Asn Met Val Leu Leu Thr Leu Pro Asp

275 280 285

Ala Thr Arg Ala Pro Gln Phe Gln Tyr Ser Thr Gln Glu His Ile Asp

290 295 300

Glu Val Arg Ala Lys Val Ile Gly Met Asn Ala Phe Ile Arg Glu Gln

305 310 315 320

Ala Arg Tyr Phe Gln Met GlnGly Ile Asn Ile Ser Leu Phe Asp Ala

325 330 335

Tyr Thr Leu Phe Asp Gln Met Ile Ala Asp Pro Ala Ala His Gly Phe

340 345 350

Asp Asn Ala Ser Ala Pro Cys Leu Asp Ile Gln Arg Ser Ser Ala Ala

355 360 365

Asp Tyr Leu Tyr Thr His Ala Leu Ala Ala Glu Cys Ala Ser Ser Gly

370 375 380

Ser Asp Arg Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr

385 390 395 400

His Arg Tyr Ile Ala Asp His Ile Leu Ala Thr Gly Val Ala Gln Phe

405 410 415

Pro Arg

<210>63

<211>1242

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>63

atgaaaaata cgttaatttt ggctggctgt atattggcag ctccagccgt cgcagatgac 60

ctaacaatca cccctgaaac tataagtgtg cgctacgcgt ctgaggtgca gaacaaacaa 120

acatacactt atgttcgctg ctggtatcgt ccagcgcaga accatgacga cccttccact 180

gagtgggaat gggctcgtga cgacaatggc gattacttca ctatcgatgg gtactggtgg 240

tcgtctgtct ccttcaaaaa catgttctat accaataccc cgcaaacaga aattgaaaac 300

cgctgtaaag aaacactagg ggttaatcat gatagtgccg atcttcttta ctatgcatca 360

gacaatcgtt tctcctacaa ccatagtatt tggacaaacg acaacgcagt aaacaacaaa 420

atcaatcgta ttgtcgcatt cggtgatagc ctgtctgaca ccggtaatct gtacaatgga 480

tcccaatggg tattccccaa ccgtaattct tggtttctcg gtcacttttc aaacggtttg 540

gtgtggactg aatacttagc gcaaaacaaa aacgtaccac tgtacaactg ggcggtcggt 600

ggcgccgccg gcaccaacca atacgtcgca ttgacaggca tttatgacca agtgacgtct 660

tatcttacgt acatgaagat ggcaaagaac tacaacccaa acaacagttt gatgacgctg 720

gaatttggcc taaatgattt catgaattac ggccgagaag tggcggacgt gaaagctgac 780

ttaagtagcg cattgattcg cttgaccgaa tcaggcgcaa gcaacattct actcttcacg 840

ttaccggacg caacaaaggc accgcagttt aaatattcga ctcaggagga aattgagacc 900

gttcgagcta agattcttga gttcaacact tttattgaag aacaagcgtt actctatcaa 960

gctaaaggac tgaatgtggc cctctacgat gctcatagca tctttgatca gctgacatcc 1020

aatcctaaac aacacggttt tgagaactca acagatgcct gtctgaacat caaccgcagt 1080

tcctctgtcg actaccttta cagtcatgag ctaactaacg attgtgcgta tcatagctct 1140

gataaatatg tgttctgggg agtcactcac ccaaccacag caacacataa atacattgcc 1200

gaccaaatca ttcagaccaa gctagaccag ttcaatttct aa 1242

<210>64

<211>413

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(18)

<223>从环境样品中获得

<400>64

Met Lys Asn Thr Leu Ile Leu Ala Gly Cys Ile Leu Ala Ala Pro Ala

1 5 10 15

Val Ala Asp Asp Leu Thr Ile Thr Pro Glu Thr Ile Ser Val Arg Tyr

20 25 30

Ala Ser Glu Val Gln Asn Lys Gln Thr Tyr Thr Tyr Val Arg Cys Trp

35 40 45

Tyr Arg Pro Ala Gln Asn His Asp Asp Pro Ser Thr Glu Trp Glu Trp

50 55 60

Ala Arg Asp Asp Asn Gly Asp Tyr Phe Thr Ile Asp Gly Tyr Trp Trp

65 70 75 80

Ser Ser Val Ser Phe Lys Asn Met Phe Tyr Thr Asn Thr Pro Gln Thr

85 90 95

Glu Ile Glu Asn Arg Cys Lys Glu Thr Leu Gly Val Asn His Asp Ser

100 105 110

Ala Asp Leu Leu Tyr Tyr Ala Ser Asp Asn Arg Phe Ser Tyr Asn His

115 120 125

Ser Ile Trp Thr Asn Asp Asn Ala Val Asn Asn Lys Ile Asn Arg Ile

130 135 140

Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Tyr Asn Gly

145 150 155 160

Ser Gln Trp Val Phe Pro Asn Arg Asn Ser Trp Phe Leu Gly His Phe

165 170 175

Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Gln Asn Lys Asn Val

180 185 190

Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn Gln Tyr

195 200 205

Val Ala Leu Thr Gly Ile Tyr Asp Gln Val Thr Ser Tyr Leu Thr Tyr

210 215 220

Met Lys Met Ala Lys Asn Tyr Asn Pro Asn Asn Ser Leu Met Thr Leu

225 230 235 240

Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val Ala Asp

245 250 255

Val Lys Ala Asp Leu Ser Ser Ala Leu Ile Arg Leu Thr Glu Ser Gly

260 265 270

Ala Ser Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys Ala Pro

275 280 285

Gln Phe Lys Tyr Ser Thr Gln Glu Glu Ile Glu Thr Val Arg Ala Lys

290 295 300

Ile Leu Glu Phe Asn Thr Phe Ile Glu Glu Gln Ala Leu Leu Tyr Gln

305 310 315 320

Ala Lys Gly Leu Asn Val Ala Leu Tyr Asp Ala His Ser Ile Phe Asp

325 330 335

Gln Leu Thr Ser Asn Pro Lys Gln His Gly Phe Glu Asn Ser Thr Asp

340 345 350

Ala Cys Leu Asn Ile Asn Arg Ser Ser Ser Val Asp Tyr Leu Tyr Ser

355 360 365

His Glu Leu Thr Asn Asp Cys Ala Tyr His Ser Ser Asp Lys Tyr Val

370 375 380

Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr Ile Ala

385 390 395 400

Asp Gln Ile Ile Gln Thr Lys Leu Asp Gln Phe Asn Phe

405 410

<210>65

<211>1164

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>65

atgaaccctt ttcttgaaga taaaattaaa tcctccggtc ccaagaaaat cctcgcctgc 60

gatggcggag gtattttggg tttgatgagc gttgaaatcc tagcaaaaat tgaagcggat 120

ttacgcacta agttaggtaa agaccagaac ttcgtgctcg cggattattt cgattttgtc 180

tgcggcacca gcaccggcgc gattatcgct gcctgtattt ctagtggcat gtcgatggct 240

aaaatacgcc aattctatct cgacagtggg aagcaaatgt tcgataaggc ctccttgctt 300

aagcgcttgc aatacagtta tgacgatgag ccattggcga ggcagttgcg tgcagccttt 360

gatgagcaac tgaaggaaac cgatgccaag ctgggtagtg cgcacctaaa aacgctgttg 420

atgatggtga tgcgtaacca cagcaccgac tcaccttggc cggtttccaa taacccttac 480

gcaaaataca ataatatcgc ccgaaaggat tgcaacctca acctgccttt atggcaattg 540

gtccgtgcca gcaccgccgc tccgacgtat ttcccaccgg aagtcatcac tttcgcagat 600

ggcacacccg aagaatacaa cttcatcttc gtcgacggtg gcgtgaccac ctacaacaac 660

ccagcatatc ttgctttcct aatggccact gccaagcctt atgccctcaa ctggccgaca 720

ggcagcaacc agttattgat cgtttccgta ggcaccggaa gtgccgccaa tgtccgacct 780

aatctggacg tggatgatat gaacctgatc cattttgcca aaaacatccc ttcagccctg 840

atgaatgccg catctgccgg ttgggatatg acctgccggg tattgggtga atgccgccat 900

ggtggcatgt tagatcggga gtttggtgac atggtgatgc ccgcgtcaag agatcttaat 960

tttaccggcc ctaagctttt tacttatatg cgttatgatc ccgatgtttc ctttgagggc 1020

ttgaagacta tcggtatatc agatatcgat ccagccaaaa tgcagcaaat ggattccgtc 1080

aataatattc cagatataca acgggtaggt atcgaatatg ccaaacgcca tgttgataca 1140

gctcattttg aggggtttaa ataa 1164

<210>66

<211>387

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>66

Met Asn Pro Phe Leu Glu Asp Lys Ile Lys Ser Ser Gly Pro Lys Lys

1 5 10 15

Ile Leu Ala Cys Asp Gly Gly Gly Ile Leu Gly Leu Met Ser Val Glu

20 25 30

Ile Leu Ala Lys Ile Glu Ala Asp Leu Arg Thr Lys Leu Gly Lys Asp

35 40 45

Gln Asn Phe Val Leu Ala Asp Tyr Phe Asp Phe Val Cys Gly Thr Ser

50 55 60

Thr Gly Ala Ile Ile Ala Ala Cys Ile Ser Ser Gly Met Ser Met Ala

65 70 75 80

Lys Ile Arg Gln Phe Tyr Leu Asp Ser Gly Lys Gln Met Phe Asp Lys

85 90 95

Ala Ser Leu Leu Lys Arg Leu Gln Tyr Ser Tyr Asp Asp Glu Pro Leu

100 105 110

Ala Arg Gln Leu Arg Ala Ala Phe Asp Glu Gln Leu Lys Glu Thr Asp

115 120 125

Ala Lys Leu Gly Ser Ala His Leu Lys Thr Leu Leu Met Met Val Met

130 135 140

Arg Asn His Ser Thr Asp Ser Pro Trp Pro Val Ser Asn Asn Pro Tyr

145 150 155 160

Ala Lys Tyr Asn Asn Ile Ala Arg Lys Asp Cys Asn Leu Asn Leu Pro

165 170 175

Leu Trp Gln Leu Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Pro

180 185 190

Pro Glu Val Ile Thr Phe Ala Asp Gly Thr Pro Glu Glu Tyr Asn Phe

195 200 205

Ile Phe Val Asp Gly Gly Val Thr Thr Tyr Asn Asn Pro Ala Tyr Leu

210 215 220

Ala Phe Leu Met Ala Thr Ala Lys Pro Tyr Ala Leu Asn Trp Pro Thr

225 230 235 240

Gly Ser Asn Gln Leu Leu Ile Val Ser Val Gly Thr Gly Ser Ala Ala

245 250 255

Asn Val Arg Pro Asn Leu Asp Val Asp Asp Met Asn Leu Ile His Phe

260 265 270

Ala Lys Asn Ile Pro Ser Ala Leu Met Asn Ala Ala Ser Ala Gly Trp

275 280 285

Asp Met Thr Cys Arg Val Leu Gly Glu Cys Arg His Gly Gly Met Leu

290 295 300

Asp Arg Glu Phe Gly Asp Met Val Met Pro Ala Ser Arg Asp Leu Asn

305 310 315 320

Phe Thr Gly Pro Lys Leu Phe Thr Tyr Met Arg Tyr Asp Pro Asp Val

325 330 335

Ser Phe Glu Gly Leu Lys Thr Ile Gly Ile Ser Asp Ile Asp Pro Ala

340 345 350

Lys Met Gln Gln Met Asp Ser Val Asn Asn Ile Pro Asp Ile Gln Arg

355 360 365

Val Gly Ile Glu Tyr Ala Lys Arg His Val Asp Thr Ala His Phe Glu

370 375 380

Gly Phe Lys

385

<210>67

<211>1419

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>67

atggtcattg tcttcgtcca cggatggagc gtgcgcaaca ccaacacgta cgggcagctg 60

cccttgcgtc tcaagaagag cttcaaagcc gccgggaaac agattcaggt cgagaacatc 120

tacctgggcg agtacgtgag ctttgacgac caggtaacag tcgacgacat cgcccgcgca 180

ttcgattgcg cactgcggga aaaactatac gatccggcga cgaagcagtg gacgaagttc 240

gcctgcatca ctcattccac cggcggcccg gtcgcgcgct tgtggatgga tctctactac 300

ggcgccgcca gactggccga gtgcccgatg tcccacctcg tgatgctcgc cccggccaat 360

catggctcgg cccttgccca gctcggcaag agccgcctca gccgcatcaa gagcttcttc 420

gagggtgtcg aaccgggcca gcgcgtcctc gactggctcg aactcggcag tgagctgagt 480

tgggccctca acacgagatg gctcgactac gactgccgcg ccgccgcctg ctgggtcttc 540

accctcaccg gccagcgcat cgaccggagt ttgtacgacc atctcaacag ctataccggt 600

gagcagggat cggatggcgt cgtgcgcgtc gccgcggcca acatgaacac caagctgctg 660

acctttgaac agaaggggcg caagctcgtg ttcacaggcc agaagaagac cgccgacacc 720

ggccttggcg tcgtgccggg ccggtcgcac tccggccgcg acatgggcat catcgccagc 780

gtgcgcggca ccggcgacca tcccaccctg gaatgggtga ctcgttgcct ggccgtcacc 840

gacgtcaaca cgtacgatgc cgtctgtaag gatctggacg ctctcaccgc ccagacccag 900

aaggatgaaa aggtggaaga ggtcaaaggc ctgctgcgga cggtcagata ccagacggac 960

cgctacgtca tgctcgtctt ccgcctgaag aacgaccgcg gcgactacct ctccgattac 1020

gatctcctgc tcaccgccgg acccaactac tcgcccgacg acctgcccga aggcttcttc 1080

gtcgaccgcc aacggaacca gcggaacccg ggcaagctca cttactacct gaactacgac 1140

gccatggcca aattgaaagg taagaccgcc gagggccgtc tgggcttcaa gatcctggcg 1200

cgcccggtga aaggcggcct cgtctactat gaggttgcgg agttccagtc cgacgtgggc 1260

ggcgtcagca gcatgctgca gcccaacgca acagtgatga tcgacatcac cctcaatcgc 1320

aacgtcgacg cgcgcgtctt ccggttcacc gagaatctgc ccacgggtga ccagggcgag 1380

gaaatcagcg gcgtcccgct ggggcagaac gtcccgtag 1419

<210>68

<211>472

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>68

Met Val Ile Val Phe Val His Gly Trp Ser Val Arg Asn Thr Asn Thr

1 5 10 15

Tyr Gly Gln Leu Pro Leu Arg Leu Lys Lys Ser Phe Lys Ala Ala Gly

20 25 30

Lys Gln Ile Gln Val Glu Asn Ile Tyr Leu Gly Glu Tyr Val Ser Phe

35 40 45

Asp Asp Gln Val Thr Val Asp Asp Ile Ala Arg Ala Phe Asp Cys Ala

50 55 60

Leu Arg Glu Lys Leu Tyr Asp Pro Ala Thr Lys Gln Trp Thr Lys Phe

65 70 75 80

Ala Cys Ile Thr His Ser Thr Gly Gly Pro Val Ala Arg Leu Trp Met

85 90 95

Asp Leu Tyr Tyr Gly Ala Ala Arg Leu Ala Glu Cys Pro Met Ser His

100 105 110

Leu Val Met Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Gln Leu

115 120 125

Gly Lys Ser Arg Leu Ser Arg Ile Lys Ser Phe Phe Glu Gly Val Glu

130 135 140

Pro Gly Gln Arg Val Leu Asp Trp Leu Glu Leu Gly Ser Glu Leu Ser

145 150 155 160

Trp Ala Leu Asn Thr Arg Trp Leu Asp Tyr Asp Cys Arg Ala Ala Ala

165 170 175

Cys Trp Val Phe Thr Leu Thr Gly Gln Arg Ile Asp Arg Ser Leu Tyr

180 185 190

Asp His Leu Asn Ser Tyr Thr Gly Glu Gln Gly Ser Asp Gly Val Val

195 200 205

Arg Val Ala Ala Ala Asn Met Asn Thr Lys Leu Leu Thr Phe Glu Gln

210 215 220

Lys Gly Arg Lys Leu Val Phe Thr Gly Gln Lys Lys Thr Ala Asp Thr

225 230 235 240

Gly Leu Gly Val Val Pro Gly Arg Ser His Ser Gly Arg Asp Met Gly

245 250 255

Ile Ile Ala Ser Val Arg Gly Thr Gly Asp His Pro Thr Leu Glu Trp

260 265 270

Val Thr Arg Cys Leu Ala Val Thr Asp Val Asn Thr Tyr Asp Ala Val

275 280 285

Cys Lys Asp Leu Asp Ala Leu Thr Ala Gln Thr Gln Lys Asp Glu Lys

290 295 300

Val Glu Glu Val Lys Gly Leu Leu Arg Thr Val Arg Tyr Gln Thr Asp

305 310 315 320

Arg Tyr Val Met Leu Val Phe Arg Leu Lys Asn Asp Arg Gly Asp Tyr

325 330 335

Leu Ser Asp Tyr Asp Leu Leu Leu Thr Ala Gly Pro Asn Tyr Ser Pro

340 345 350

Asp Asp Leu Pro Glu Gly Phe Phe Val Asp Arg Gln Arg Asn Gln Arg

355 360 365

Asn Pro Gly Lys Leu Thr Tyr Tyr Leu Asn Tyr Asp Ala Met Ala Lys

370 375 380

Leu Lys Gly Lys Thr Ala Glu Gly Arg Leu Gly Phe Lys Ile Leu Ala

385 390 395 400

Arg Pro Val Lys Gly Gly Leu Val Tyr Tyr Glu Val Ala Glu Phe Gln

405 410 415

Ser Asp Val Gly Gly Val Ser Ser Met Leu Gln Pro Asn Ala Thr Val

420 425 430

Met Ile Asp Ile Thr Leu Asn Arg Asn Val Asp Ala Arg Val Phe Arg

435 440 445

Phe Thr Glu Asn Leu Pro Thr Gly Asp Gln Gly Glu Glu Ile Ser Gly

450 455 460

Val Pro Leu Gly Gln Asn Val Pro

465 470

<210>69

<211>1038

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>69

atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60

attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga 120

gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac tgtccgtgag 180

caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt 240

attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat 300

agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360

ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacggggtat 420

gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc 480

tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgaccgaca agatgtgtat 540

gtcgatgggg gtgttcaact taactatccg attaaacttt ttgatcggga gcgttacatt 600

gatctggcca aagatcccgg tgccgttcgg cgaacgggct attacaacaa agaaaacgct 660

cgctttcagc ttgagcggcc gggctatagc ccctatgttt acaatcgcca gaccttgggt 720

ttgcgactag atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780

aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840

caggaaaaga ttcatctaca tggcgatgat tggcagcgca cggtctatat cgatacattg 900

gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgaacag 960

ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttgga gaagcctgtt 1020

aatagagtgg agtcatag 1038

<210>70

<211>345

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>70

Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val

20 25 30

Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile

50 55 60

Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val

65 70 75 80

Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly

85 90 95

Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly

100 105 110

Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg

165 170 175

Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys

180 185 190

Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala

195 200 205

Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu

210 215 220

Glu Arg Pro Gly Tyr Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln

260 265 270

Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly

275 280 285

Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln

305 310 315 320

Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu

325 330 335

Glu Lys Pro Val Asn Arg Val Glu Ser

340 345

<210>71

<211>3264

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>71

atgtcgctat catcaccgcc cgaaaccccc gaaccccccg aacccccgtc acccggcgcg 60

cgatcgctcc ggggaggatg gagccgccgg gtggccggcc tgctggccct ggtgctgctc 120

accgggctcc tccagatcgt cgtgccgctc gcacggcccg ccgcggcggc cgtacagcag 180

cccgcgatga cgtggaacct gcatggggcc aagaagaccg cggaactggt tcccgatctg 240

atgcgtaacc ataacgtcac cgtcgcggcc ctccaggaag tggccaacgg caacttcctg 300

ggcctcactc ccacagagca cgacgtgccc tacctcaagc cggacggcac gacctcgact 360

ccgccggatc cgcagaaatg gcgggtcgag aagtacaacc tcgccaagga cgatgcaacc 420

gctttcgtga tccggaccgg ctccaacaac cgcgggctcg cgatcgtcac cacccaggac 480

gtcggcgatg tctcgcagaa tgtacacgtc gtcaatgtga ccgaggattg ggaaggcaag 540

atgttccccg ccctgggggt gaagatcgac ggcgcctggt actactccat ccacgcctcc 600

accacgccga agcgcgcgaa caacaacgcc ggcactctgg tcgaggacct ctccaagctg 660

cacgagacgg ccgctttcga aggcgactgg gccgcgatgg gcgactggaa ccggtacccc 720

tccgaggact cgaacgccta cgagaaccaacggaagcatc tcaaaggcgc catgcggaca 780

aactttccgg ataatcaggc ggcgttgcgc gaagtcctgg agttcgagtc cgacgaacgc 840

gtcatctggc agggtgcgag gacccacgac cacggcgccg agctcgacta catggtggcc 900

aagggagccg gtaacgacta caaggccagc cgatcgacgt cgaagcacgg ctccgatcac 960

tacccggtgt tcttcggtat tggggacgat tcggacacct gcatgggcgg cacggcgccg 1020

gtggcggcga acgcgccgcg tgcggccgcc accgagtcct gtcccctgga cgacgatctg 1080

ccggccgtca tcgtctcgat gggggacagc tatatctccg gcgagggagg gcgctggcag 1140

ggcaacgcca acacctcctc cgggggcgac tcctggggca ccgaccgggc cgccgacggc 1200

acggaggtct acgagaagaa ctccgaaggc agcgatgcct gtcaccgctc cgacgtcgcg 1260

gagatcaagc gcgccgacat cgccgacatc ccggcggaac gcaggatcaa catcgcctgc 1320

tcgggcgccg agaccaagca cctgctcacc gagaccttca agggtgaaaa gccccagatc 1380

gagcagctcg ccgacgtcgc cgaaacccac cgggtggaca cgatcgtggt ctccatcggc 1440

ggcaacgacc tcgagttcgc cgacatcgtg agccagtgcg ccacggcctt catgctcggg 1500

gaaggcgcgt gtcacacgga cgtcgacgat acccttgata gccggttggg cgatgtgagc 1560

agatccgtct ccgaggttct ggccgccatc cgcgacacca tgatcgaggc cgggcaggac 1620

gataccagct acaagctcgt tctccagtcc taccctgccc cgttgcccgc gtcggatgag 1680

atgcggtaca cgggcgatca ctacgaccgg tacaccgagg gcggctgccc cttctatgac 1740

gtcgacctgg actggacgcg cgacgtcctc atcaaaaaga tcgaagccac gctgcgcggg 1800

gtggccaaga gtgcggatgc ggccttcctc aacctgacgg acacgttcac ggggcacgag 1860

ctgtgctcga agcacacccg acaggcggag tccggcgaat cgctggcgaa tccaatactg 1920

gaacacgagg ccgagtgggt gcgcttcgta ccaggtctca ccacgccggg tgacacggcc 1980

gaagccatcc atccgaatgc gttcggccag cacgccctca gtagctgcct cagccaggcc 2040

gtccggacga tggacgattc ggaccagagg tacttcgagt gcgacgggcg ggacaccgga 2100

aatccccgcc tcgtgtggcc acgcagttcg cccatcgacg ccgtcgtgga gaccgcggac 2160

ggttggcagg gcgacgactt ccggctcgcc gaccactaca tgttccagcg cggcgtctac 2220

gcccgcttca acccggacgc ggaccggagc ggcgcgatcg atccgggccg aatcaccttc 2280

ggccaaaccg acggatggct cggtgaggtg aaggacactt cgaactggcc gagcctgagt 2340

ggaaccgact tcgtcgacgg catcgacgcc gccgccgagg cacgcaccag caccggtcac 2400

cagctgctgc tgttccacag cggcgttgag gacaaccagt acgtgcgggt cgagatggcg 2460

ccgggcacca ctgacgacca gctcgtcagg ggccccgtgc ccatcacgag gtactggccc 2520

ctcttccagg acaccccttt cgaatggggc gtggatgccg ccgcggggga ccagctgaac 2580

cgggcgatgg tcttcaggca cggctatgtg gggctggtgc aggtctccct cgacgctctc 2640

agcgacgaat ggctcgtgga accgacgttg atcggctcgg cgattccggc gctggagggc 2700

accccgttcg agacaggggt ggacgcggcg atcgtgcggc accagcaacc gacggccatg 2760

tgggtcgacc tgatcagcgg tacgcaggtg gtgacgctgc tggtggactt ggacgatctg 2820

tcgaagagca cgtacatgac gagcatcgtg gagatcacga cgatgtggcc gagcctgcgc 2880

ggcagcatct tcgactggac cggcggagag gcgtggaagc cggagaagat gcagatcaag 2940

accggcgcgg gcgatcccta cgacatggac gccgacgacc ggcaggccaa gcctgcggtg 3000

tcgggctcgc acgagcagtg ccgtccggag ggactagcgc agacccccgg cgtgaacacg 3060

ccgtactgcg aggtgtacga caccgacggc cgcgaatggc tgggcgggaa cgggcacgac 3120

aggcgggtca tcggctactt caccggctgg cgcaccggtg agaacgacca gccgcgctac 3180

ctggtgccga acatcccgtg gtcgaaggtg acccacatca actacgcgtt cgcgaaagtc 3240

gacgacgaca acaagatcca aaga 3264

<210>72

<211>1088

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>72

Met Ser Leu Ser Ser Pro Pro Glu Thr Pro Glu Pro Pro Glu Pro Pro

1 5 10 15

Ser Pro Gly Ala Arg Ser Leu Arg Gly Gly Trp Ser Arg Arg Val Ala

20 25 30

Gly Leu Leu Ala Leu Val Leu Leu Thr Gly Leu Leu Gln Ile Val Val

35 40 45

Pro Leu Ala Arg Pro Ala Ala Ala Ala Val Gln Gln Pro Ala Met Thr

50 55 60

Trp Asn Leu His Gly Ala Lys Lys Thr Ala Glu Leu Val Pro Asp Leu

65 70 75 80

Met Arg Asn His Asn Val Thr Val Ala Ala Leu Gln Glu Val Ala Asn

85 90 95

Gly Asn Phe Leu Gly Leu Thr Pro Thr Glu His Asp Val Pro Tyr Leu

100 105 110

Lys Pro Asp Gly Thr Thr Ser Thr Pro Pro Asp Pro Gln Lys Trp Arg

115 120 125

Val Glu Lys Tyr Asn Leu Ala Lys Asp Asp Ala Thr Ala Phe Val Ile

130 135 140

Arg Thr Gly Ser Asn Asn Arg Gly Leu Ala Ile Val Thr Thr Gln Asp

145 150 155 160

Val Gly Asp Val Ser Gln Asn Val His Val Val Asn Val Thr Glu Asp

165 170 175

Trp Glu Gly Lys Met Phe Pro Ala Leu Gly Val LysIle Asp Gly Ala

180 185 190

Trp Tyr Tyr Ser Ile His Ala Ser Thr Thr Pro Lys Arg Ala Asn Asn

195 200 205

Asn Ala Gly Thr Leu Val Glu Asp Leu Ser Lys Leu His Glu Thr Ala

210 215 220

Ala Phe Glu Gly Asp Trp Ala Ala Met Gly Asp Trp Asn Arg Tyr Pro

225 230 235 240

Ser Glu Asp Ser Asn Ala Tyr Glu Asn Gln Arg Lys His Leu Lys Gly

245 250 255

Ala Met Arg Thr Asn Phe Pro Asp Asn Gln Ala Ala Leu Arg Glu Val

260 265 270

Leu Glu Phe Glu Ser Asp Glu Arg Val Ile Trp Gln Gly Ala Arg Thr

275 280 285

His Asp His Gly Ala Glu Leu Asp Tyr Met Val Ala Lys Gly Ala Gly

290 295 300

Asn Asp Tyr Lys Ala Ser Arg Ser Thr Ser Lys His Gly Ser Asp His

305 310 315 320

Tyr Pro Val Phe Phe Gly Ile Gly Asp Asp Ser Asp Thr Cys Met Gly

325 330 335

Gly Thr Ala Pro Val Ala Ala Asn Ala Pro Arg Ala Ala Ala Thr Glu

340 345 350

Ser Cys Pro Leu Asp Asp Asp Leu Pro Ala Va1 Ile Val Ser Met Gly

355 360 365

Asp Ser Tyr Ile Ser Gly Glu Gly Gly Arg Trp Gln Gly Asn Ala Asn

370 375 380

Thr Ser Ser Gly Gly Asp Ser Trp Gly Thr Asp Arg Ala Ala Asp Gly

385 390 395 400

Thr Glu Val Tyr Glu Lys Asn Ser Glu Gly Ser Asp Ala Cys His Arg

405 410 415

Ser Asp Val Ala Glu Ile Lys Arg Ala Asp Ile Ala Asp Ile Pro Ala

420 425 430

Glu Arg Arg Ile Asn Ile Ala Cys Ser Gly Ala Glu Thr Lys His Leu

435 440 445

Leu Thr Glu Thr Phe Lys Gly Glu Lys Pro Gln Ile Glu Gln Leu Ala

450 455 460

Asp Val Ala Glu Thr His Arg Val Asp Thr Ile Val Val Ser Ile Gly

465 470 475 480

Gly Asn Asp Leu Glu Phe Ala Asp Ile Val Ser Gln Cys Ala Thr Ala

485 490 495

Phe Met Leu Gly Glu Gly Ala Cys His Thr Asp Val Asp Asp Thr Leu

500 505 510

Asp Ser Arg Leu Gly Asp Val Ser Arg Ser Val Ser Glu Val Leu Ala

515 520 525

Ala Ile Arg Asp Thr Met Ile Glu Ala Gly Gln Asp Asp Thr Ser Tyr

530 535 540

Lys Leu Val Leu Gln Ser Tyr Pro Ala Pro Leu Pro Ala Ser Asp Glu

545 550 555 560

Met Arg Tyr Thr Gly Asp His Tyr Asp Arg Tyr Thr Glu Gly Gly Cys

565 570 575

Pro Phe Tyr Asp Val Asp Leu Asp Trp Thr Arg Asp Val Leu Ile Lys

580 585 590

Lys Ile Glu Ala Thr Leu Arg Gly Val Ala Lys Ser Ala Asp Ala Ala

595 600 605

Phe Leu Asn Leu Thr Asp Thr Phe Thr Gly His Glu Leu Cys Ser Lys

610 615 620

His Thr Arg Gln Ala Glu Ser Gly Glu Ser Leu Ala Asn Pro Ile Leu

625 630 635 640

Glu His Glu Ala Glu Trp Val Arg Phe Val Pro Gly Leu Thr Thr Pro

645 650 655

Gly Asp Thr Ala Glu Ala Ile His Pro Asn Ala Phe Gly Gln His Ala

660 665 670

Leu Ser Ser Cys Leu Ser Gln Ala Val Arg Thr Met Asp Asp Ser Asp

675 680 685

Gln Arg Tyr Phe Glu Cys Asp Gly Arg Asp Thr Gly Asn Pro Arg Leu

690 695 700

Val Trp Pro Arg Ser Ser Pro Ile Asp Ala Val Val Glu Thr Ala Asp

705 710 715 720

Gly Trp Gln Gly Asp Asp Phe Arg Leu Ala Asp His Tyr Met Phe Gln

725 730 735

Arg Gly Val Tyr Ala Arg Phe Asn Pro Asp Ala Asp Arg Ser Gly Ala

740 745 750

Ile Asp Pro Gly Arg Ile Thr Phe Gly Gln Thr Asp Gly Trp Leu Gly

755 760 765

Glu Val Lys Asp Thr Ser Asn Trp Pro Ser Leu Ser Gly Thr Asp Phe

770 775 780

Val Asp Gly Ile Asp Ala Ala Ala Glu Ala Arg Thr Ser Thr Gly His

785 790 795 800

Gln Leu Leu Leu Phe His Ser Gly Val Glu Asp Asn Gln Tyr Val Arg

805 810 815

Val Glu Met Ala Pro Gly Thr Thr Asp Asp Gln Leu Val Arg Gly Pro

820 825 830

Val Pro Ile Thr Arg Tyr Trp Pro Leu Phe Gln Asp Thr Pro Phe Glu

835 840 845

Trp Gly Val Asp Ala Ala Ala Gly Asp Gln Leu Asn Arg Ala Met Val

850 855 860

Phe Arg His Gly Tyr Val Gly Leu Val Gln Val Ser Leu Asp Ala Leu

865 870 875 880

Ser Asp Glu Trp Leu Val Glu Pro Thr Leu Ile Gly Ser Ala Ile Pro

885 890 895

Ala Leu Glu Gly Thr Pro Phe Glu Thr Gly Val Asp Ala Ala Ile Val

900 905 910

Arg His Gln Gln Pro Thr Ala Met Trp Val Asp Leu Ile Ser Gly Thr

915 920 925

Gln Val Val Thr Leu Leu Val Asp Leu Asp Asp Leu Ser Lys Ser Thr

930 935 940

Tyr Met Thr Ser Ile Val Glu Ile Thr Thr Met Trp Pro Ser Leu Arg

945 950 955 960

Gly Ser Ile Phe Asp Trp Thr Gly Gly Glu Ala Trp Lys Pro Glu Lys

965 970 975

Met Gln Ile Lys Thr Gly Ala Gly Asp Pro Tyr Asp Met Asp Ala Asp

980 985 990

Asp Arg Gln Ala Lys Pro Ala Val Ser Gly Ser His Glu Gln Cys Arg

995 1000 1005

Pro Glu Gly Leu Ala Gln Thr Pro Gly Val Asn Thr Pro Tyr Cys Glu

1010 1015 1020

Val Tyr Asp Thr Asp Gly Arg Glu Trp Leu Gly Gly Asn Gly His Asp

1025 1030 1035 1040

Arg Arg Val Ile Gly Tyr Phe Thr Gly Trp Arg Thr Gly Glu Asn Asp

1045 1050 1055

Gln Pro Arg Tyr Leu Val Pro Asn Ile Pro Trp Ser Lys Val Thr His

1060 1065 1070

Ile Asn Tyr Ala Phe Ala Lys Val Asp Asp Asp Asn Lys Ile Gln Arg

1075 1080 1085

<210>73

<211>753

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>73

atgggaaacg gtgcagcagt tggttccaat gataatggta gagaagaaag tgtttacgta 60

ctttctgtga tcgcctgtaa tgtttattat ttacagaagt gtgaaggtgg ggcatcgcgt 120

gatagcgtga ttagagaaat taatagccaa actcaacctt taggatatga gattgtagca 180

gattctattc gtgatggtca tattggttct tttgcctgta agatggcagt ctttagaaat 240

aatggtaatg gcaattgtgt tttagcgatc aaagggacag atatgaataa tatcaatgac 300

ttggtgaatg atctaaccat gatattagga ggcattggtt ctgttgctgc aatccaacca 360

acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tactggtcac 420

tcccttggag gctacatgac tgaaatcatc gctaccaatc gtggactacc aggtattgca 480

ttttgcgcac caggttcaaa tggtccaatt gtaaaattag gtggacaaga gacacctggc 540

tttcacaatg ttaactttga acatgatcca gcaggtaacg ttatgactgg ggtttatact 600

catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg 660

gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa 720

agtcataata cgggttatta ttacccaaaa taa 753

<210>74

<211>250

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>74

Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu

1 5 10 15

Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln

20 25 30

Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn

35 40 45

Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg

50 55 60

Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn

65 70 75 80

Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn

85 90 95

Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile

100 105 110

Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu

115 120 125

Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly

130 135 140

Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala

145 150 155 160

Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln

165 170 175

Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly

180 185 190

Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val

195 200 205

Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe

210 215 220

Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu

225 230 235 240

Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys

245 250

<210>75

<211>1335

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>75

atgactacta aaatcttttt aattcacgga tggtctgtca agacaacaca aacatatcag 60

gcgctgcacc ttaagttggc agagcaggga tatcagctgg aagatattta cctcgggcgg 120

tatctgtccc ttgaaaatca tatcgaaata cgggatattg caaaagcaat gcaccgtgca 180

ttgctggaga ggattaccga ctggagtcag cctttccatt ttattactca cagtacggga 240

ggtatggtcg ccaaatattg gatattgaat cattataaag gaagtattgc aaaacaaaaa 300

ccactcaaaa atgtagtgtt tctggctgca cctaattttg gttcaaggct ggcacaccat 360

ggacgtacca tgctgggaga aataatggaa ctgggagaaa cagggaagaa gattcttgaa 420

tctctggagt taggaagtgc tttttcgtgg gatgtgaatg agcagttttt taatgcgtcc 480

aattggaaag ataaagaaat aaagttctat aacctgatag gagacagggt caaaacggat 540

ttttttaaat ccaaaatttt tccagctgcg tttgaaagcg ggtcagatat ggtgattcgg 600

gttgcggcag gaaatcagaa ctttgtccgg tacaggtacg atagtcagaa agatagcttt 660

actgttgtca atgagttgaa aggaattgct tttggtgctc tctaccaata tacacattcc 720

aatgatgatt atggaatcct gaacagcatc aaaaaaagtt caacccttga aaaccatcag 780

gcactcagac taattgtaga atgtctgaag gtttcgggag ataaagaata tgaaaatgtt 840

gttgcacagt tggctgcagc gacaaaagaa accagagaaa aacgccaggg atatgcacag 900

ctggatttcc gttttcggga tgatgaaggc tttccaatag atgattatgt tgtagagctg 960

ggagtaatgg taaatggaaa acctaaacca tctaaaacag tagatgacgt gcataagaat 1020

aaaattacac caaaccatct tactgtattc attaacctga aagaactgga acctaatctg 1080

aagtacttta tcaatattaa atcgatatcg gaatcctcca tgtatagtta cgatcctgct 1140

gtcaggacta tagagcttgc ttctaacgag attacaaaaa ttatccgtga ggaccataca 1200

acacagattg atgtgatact ttcccggact cctgctaaaa accttttcat gtttcatcgc 1260

ggagatgatg aagacctaca tgtgacatgg tcgcggtacg gagaaacaaa aagtacaaag 1320

cagggaataa aataa 1335

<210>76

<211>444

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>76

Met Thr Thr Lys Ile Phe Leu Ile His Gly Trp Ser Val Lys Thr Thr

1 5 10 15

Gln Thr Tyr Gln Ala Leu His Leu Lys Leu Ala Glu Gln Gly Tyr Gln

20 25 30

Leu Glu Asp Ile Tyr Leu Gly Arg Tyr Leu Ser Leu Glu Asn His Ile

35 40 45

Glu Ile Arg Asp Ile Ala Lys Ala Met His Arg Ala Leu Leu Glu Arg

50 55 60

Ile Thr Asp Trp Ser Gln Pro Phe His Phe Ile Thr His Ser Thr Gly

65 70 75 80

Gly Met Val Ala Lys Tyr Trp Ile Leu Asn His Tyr Lys Gly Ser Ile

85 90 95

Ala Lys Gln Lys Pro Leu Lys Asn Val Val Phe Leu Ala Ala Pro Asn

100 105 110

Phe Gly Ser Arg Leu Ala His His Gly Arg Thr Met Leu Gly Glu Ile

115 120 125

Met Glu Leu Gly Glu Thr Gly Lys Lys Ile Leu Glu Ser Leu Glu Leu

130 135 140

Gly Ser Ala Phe Ser Trp Asp Val Asn Glu Gln Phe Phe Asn Ala Ser

145 150 155 160

Asn Trp Lys Asp Lys Glu Ile Lys Phe Tyr Asn Leu Ile Gly Asp Arg

165 170 175

Val Lys Thr Asp Phe Phe Lys Ser Lys Ile Phe Pro Ala Ala Phe Glu

180 185 190

Ser Gly Ser Asp Met Val Ile Arg Val Ala Ala Gly Asn Gln Asn Phe

195 200 205

Val Arg Tyr Arg Tyr Asp Ser Gln Lys Asp Ser Phe Thr Val Val Asn

210 215 220

Glu Leu Lys Gly Ile Ala Phe Gly Ala Leu Tyr Gln Tyr Thr His Ser

225 230 235 240

Asn Asp Asp Tyr Gly Ile Leu Asn Ser Ile Lys Lys Ser Ser Thr Leu

245 250 255

Glu Asn His Gln Ala Leu Arg Leu Ile Val Glu Cys Leu Lys Val Ser

260 265 270

Gly Asp Lys Glu Tyr Glu Asn Val Val Ala Gln Leu Ala Ala Ala Thr

275 280 285

Lys Glu Thr Arg Glu Lys Arg Gln Gly Tyr Ala Gln Leu Asp Phe Arg

290 295 300

Phe Arg Asp Asp Glu Gly Phe Pro Ile Asp Asp Tyr Val Val Glu Leu

305 310 315 320

Gly Val Met Val Asn Gly Lys Pro Lys Pro Ser Lys Thr Val Asp Asp

325 330 335

Val His Lys Asn Lys Ile Thr Pro Asn His Leu Thr Val Phe Ile Asn

340 345 350

Leu Lys Glu Leu Glu Pro Asn Leu Lys Tyr Phe Ile Asn Ile Lys Ser

355 360 365

Ile Ser Glu Ser Ser Met Tyr Ser Tyr Asp Pro Ala Val Arg Thr Ile

370 375 380

Glu Leu Ala Ser Asn Glu Ile Thr Lys Ile Ile Arg Glu Asp His Thr

385 390 395 400

Thr Gln Ile Asp Val Ile Leu Ser Arg Thr Pro Ala Lys Asn Leu Phe

405 410 415

Met Phe His Arg Gly Asp Asp Glu Asp Leu His Val Thr Trp Ser Arg

420 425 430

Tyr Gly Glu Thr Lys Ser Thr Lys Gln Gly Ile Lys

435 440

<210>77

<211>1026

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>77

atggcttatc actttaaaaa cttggtcttc gaaggcggtg gcgtgaaagg catcgcctac 60

gtgggtgctc ttgaagtact tgagagagaa ggcattctga aagacatcaa acgcgtggct 120

ggtacttcgg ctggagcgct ggttgccgtc ttaatcagtt tgggctatac cgcccaagaa 180

ttgaaggaca tcctatggaa aatcaatttc caaaactttt tggacagctc gtggggcttg 240

gtgcgcaaca cggcacgttt cattgaggat tacggttggt acaaaggtga gtttttccgc 300

gaattggttg ccggctacat caaggaaaaa acgggcaata gtgaaagcac tttcaaggat 360

ctggccaaat caaaagattt ccgtggcctc agccttattg gtagcgatct gtccacagga 420

tactcaaagg tgttcagcaa cgaattcacc ccaaacgtca aagtagctga tgcagcccgc 480

atctccatgt cgatacccct gtttttcaaa gccgttcgcg gtgtaaacgg tgatggacac 540

atttacgtcg atggtggact gttagacaac tatgccatca aggtgttcga ccgcgtcaat 600

tacgtaaaga ataagaacaa cgtacggtac accgagtatt atgaaaagac caacaagtcg 660

ctgaaaagca aaaacaagct gaccaacgaa tacgtctaca ataaagaaac tttgggcttc 720

cgattggatg ccaaagaaca gattgagatg tttctcgacc atagtataga accaaaggca 780

aaggacattg actcactatt ctcttacacg aaggctttgg tcaccaccct catcgacttt 840

caaaacaatg tacatttgca tagtgacgac tggcaacgca cagtctatat cgactcttta 900

ggtatcagtt ccactgactt cggcatctct gactctaaaa aacagaaact cgtcgattca 960

ggcattttgc atacgcaaaa atacctggat tggtataaca acgacgaaga gaaagccaac 1020

aaatag 1026

<210>78

<211>341

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>78

Met Ala Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Ile Ala Tyr Val Gly Ala Leu Glu Val Leu Glu Arg Glu Gly Ile

20 25 30

Leu Lys Asp Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Leu Val

35 40 45

Ala Val Leu Ile Ser Leu Gly Tyr Thr Ala Gln Glu Leu Lys Asp Ile

50 55 60

Leu Trp Lys Ile Asn Phe Gln Asn Phe Leu Asp Ser Ser Trp Gly Leu

65 70 75 80

Val Arg Asn Thr Ala Arg Phe Ile Glu Asp Tyr Gly Trp Tyr Lys Gly

85 90 95

Glu Phe Phe Arg Glu Leu Val Ala Gly Tyr Ile Lys Glu Lys Thr Gly

100 105 110

Asn Ser Glu Ser Thr Phe Lys Asp Leu Ala Lys Ser Lys Asp Phe Arg

115 120 125

Gly Leu Ser Leu Ile Gly Ser Asp Leu Ser Thr Gly Tyr Ser Lys Val

130 135 140

Phe Ser Asn Glu Phe Thr Pro Asn Val Lys Val Ala Asp Ala Ala Arg

145 150 155 160

Ile Ser Met Ser Ile Pro Leu Phe Phe Lys Ala Val Arg Gly Val Asn

165 170 175

Gly Asp Gly His Ile Tyr Val Asp Gly Gly Leu Leu Asp Asn Tyr Ala

180 185 190

Ile Lys Val Phe Asp Arg Val Asn Tyr Val Lys Asn Lys Asn Asn Val

195 200 205

Arg Tyr Thr Glu Tyr Tyr Glu Lys Thr Asn Lys Ser Leu Lys Ser Lys

210 215 220

Asn Lys Leu Thr Asn Glu Tyr Val Tyr Asn Lys Glu Thr Leu Gly Phe

225 230 235 240

Arg Leu Asp Ala Lys Glu Gln Ile Glu Met Phe Leu Asp His Ser Ile

245 250 255

Glu Pro Lys Ala Lys Asp Ile Asp Ser Leu Phe Ser Tyr Thr Lys Ala

260 265 270

Leu Val Thr Thr Leu Ile Asp Phe Gln Asn Asn Val His Leu His Ser

275 280 285

Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Ser Leu Gly Ile Ser Ser

290 295 300

Thr Asp Phe Gly Ile Ser Asp Ser Lys Lys Gln Lys Leu Val Asp Ser

305 310 315 320

Gly Ile Leu His Thr Gln Lys Tyr Leu Asp Trp Tyr Asn Asn Asp Glu

325 330 335

Glu Lys Ala Asn Lys

340

<210>79

<211>1701

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>79

atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt 60

gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta 120

acccgccgct cggcgctgga actgctgaat gccgacaatc tggtcggcaa tgacccggcc 180

gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag 240

aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac 300

gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg 360

gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat 420

gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac 480

gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa 540

gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac 600

aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac 660

accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc 720

tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc 780

gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc 840

aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt 900

attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag 960

gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa 1020

gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg 1080

ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg 1140

gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc 1200

gatctgaatg atccacacat ggatattccg tacaactggc aatgggtgtc gtcgacgcaa 1260

tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca 1320

gtcgtcatca agaattcgat caatggcgat ccgctggtgg cacctgccgg gctcaagcac 1380

aacaccgatg tttacggtgc accgggtgag gcgattgaat tcattttcgt cggtgatttc 1440

aaccatgagg cgtatttccg caccaaggac aacgcggatc tgttcctgag ttacagcgcg 1500

gtatcgggca agggcttgct gtacaacacg cccaaccagg ccggttatcg tgttcagcct 1560

tatggtgtgc tgtggacgat tgagaatacc tactggaatg atttcctctg gtacaacagc 1620

tcgaacgacc gcatctatgt cagcggcacc ggcgctgcca acaagtcaca ctcccagtgg 1680

attattgacg gcttgcagtg a 1701

<210>80

<211>566

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<400>80

Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala

1 5 10 15

Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala

20 25 30

Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu

35 40 45

Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu

50 55 60

Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln

65 70 75 80

Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr

85 90 95

Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp

100 105 110

Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile

115 120 125

Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp

130 135 140

His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn

145 150 155 160

Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala

165 170 175

Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr

180 185 190

Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala

195 200 205

Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu

210 215 220

Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys

225 230 235 240

Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn

245 250 255

Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala

260 265 270

Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val

275 280 285

Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met

290 295 300

Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln

305 310 315 320

Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn

325 330 335

Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro

340 345 350

Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu

355 360 365

Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln

370 375 380

Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly

385 390 395 400

Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val

405 410 415

Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln

420 425 430

Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile Lys Asn Ser Ile Asn

435 440 445

Gly Asp Pro Leu Val Ala Pro Ala Gly Leu Lys His Asn Thr Asp Val

450 455 460

Tyr Gly Ala Pro Gly Glu Ala Ile Glu Phe Ile Phe Val Gly Asp Phe

465 470 475 480

Asn His Glu Ala Tyr Phe Arg Thr Lys Asp Asn Ala Asp Leu Phe Leu

485 490 495

Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu Tyr Asn Thr Pro Asn

500 505 510

Gln Ala Gly Tyr Arg Val Gln Pro Tyr Gly Val Leu Trp Thr Ile Glu

515 520 525

Asn Thr Tyr Trp Asn Asp Phe Leu Trp Tyr Asn Ser Ser Asn Asp Arg

530 535 540

Ile Tyr Val Ser Gly Thr Gly Ala Ala Asn Lys Ser His Ser Gln Trp

545 550 555 560

Ile Ile Asp Gly Leu Gln

565

<210>81

<211>1422

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>81

atgaaaaaga aattatgtac aatggctctt gtaacagcaa tatcttctgg tgttgttacg 60

attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag 120

cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcaaatga aagtacacat 180

ttatggattg cacgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa 240

gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt 300

tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat 360

gggctaatta gaggagggtg gaaatctcat ttttacgatc ccgatacaag aaagaactat 420

aaaggggaag aagaaccaac agctctttca caaggagata aatattttaa attagcaggt 480

gaatacttta agaagggcga ccaaaaacaa gctttttatt atttaggtgt tgcaacgcat 540

tactttacag atgctactca accaatgcat gctgctaatt ttacagccgt cgacacgagt 600

gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa 660

gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc 720

catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa 780

tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag 840

aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca 900

tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga 960

gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt 1020

ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat 1080

agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt 1140

catcgaggag aaagtgtact gctgaaaatg acgcaatcta actatgataa ttacgtattt 1200

ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca 1260

cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga 1320

tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa 1380

acagatacac caaaagcttg gaaatttata caggctgaat ag 1422

<210>82

<211>473

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(25)

<223>从环境样品中获得

<400>82

Met Lys Lys Lys Leu Cys Thr Met Ala Leu Val Thr Ala Ile Ser Ser

1 5 10 15

Gly Val Val Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu

20 25 30

Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser

35 40 45

Ala Glu His Pro His His Ser Asn Glu Ser Thr His Leu Trp Ile Ala

50 55 60

Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln

65 70 75 80

Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe

85 90 95

Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly

100 105 110

Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys

115 120 125

Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu

130 135 140

Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly

145 150 155 160

Glu Tyr Phe Lys Lys Gly Asp Gln Lys Gln Ala Phe Tyr Tyr Leu Gly

165 170 175

Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala

180 185 190

Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe

195 200 205

Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly

210 215 220

Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile

225 230 235 240

His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn

245 250 255

Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln

260 265 270

Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg

275 280 285

Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn

290 295 300

Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly

305 310 315 320

Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe

325 330 335

Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala

340 345 350

Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val

355 360 365

Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu

370 375 380

Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe

385 390 395 400

Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys

405 410 415

Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser

420 425 430

Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn

435 440 445

Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro

450 455 460

Lys Ala Trp Lys Phe Ile Gln Ala Glu

465 470

<210>83

<211>1290

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>83

atgaaaaaga tagtgattta ttcatttgta gcaggggtta tgacatcagg cggcgtattt 60

gccgccagtg acaatattgt ggagacgtcg accccaccac agcatcaggc cccaagcaga 120

caggacaggg cattattcgc gggtgataca acaacctata taaaatgtgt ctacaaagtg 180

gatggccagg atgacagcaa tccatcctca tcttggttat gggcgaaagt gggtagcaac 240

tatgcgaagc tgaaggggta ttggtataat tcaatgccgc tggcaaacat gttttacact 300

gaagtaccct atgcagaggt gatggacttg tgtaatagca ccctgaaggc ggtaggtgcc 360

aactccactc ttgttattcc atatgcatcg gattacaccc tgtcctatta ctatgtgatt 420

tggaatcaag gggctaacca gccggttatc aacgttggcg gcagagagct tgaccgtatg 480

gtggtctttg gtgacagctt gagcgatacc gtcaatgtct ataacggctc gtacggtacc 540

gtgccgaata gtacctcctg gttattgggc catttctcta acggaaagct ttggcatgaa 600

tacctttcca cggtattgaa tctgcctagc tatgtgtggg cgactggcaa tgcggagagt 660

ggagagaaac ccttctttaa cggattcagt aagcaggtgg attctttcag ggattatcac 720

gctcgcacta aaggctacga tattagcaag acgttgttta ccgttctgtt tggtggaaat 780

gattttataa cggggggaaa aagcgccgat gaggtcattg agcaatatac ggtgtcattg 840

aactacttgg ctcaactagg ggcgaagcag gttgcaattt tccgcttgcc agatttttca 900

gtgataccca gcgtttcaac gtggacagag gctgataagg acaaactgag agagaatagt 960

gttcagttta atgaccaagc cgagaagctg atcgctaaac taaacgcggc acatccccaa 1020

acgacgtttt atacgctgag gttggatgac gcttttaagc aggtgttgga aaacagcgac 1080

caatacggct ttgttaataa gactgatacc tgcctggata tttcccaagg cggatacaac 1140

tatgccattg gggcccgcgc gaaaacggca tgtaagagca gcaatgcggc gtttgtattc 1200

tgggacaata tgcatccgac caccaaaaca cacggattgt tggccgatct tttaaaagat 1260

gatgtggtac gcggcctcgc tgcgccatga 1290

<210>84

<211>429

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(22)

<223>从环境样品中获得

<400>84

Met Lys Lys Ile Val Ile Tyr Ser Phe Val Ala Gly Val Met Thr Ser

1 5 10 15

Gly Gly Val Phe Ala Ala Ser Asp Asn Ile Val Glu Thr Ser Thr Pro

20 25 30

Pro Gln His Gln Ala Pro Ser Arg Gln Asp Arg Ala Leu Phe Ala Gly

35 40 45

Asp Thr Thr Thr Tyr Ile Lys Cys Val Tyr Lys Val Asp Gly Gln Asp

50 55 60

Asp Ser Asn Pro Ser Ser Ser Trp Leu Trp Ala Lys Val Gly Ser Asn

65 70 75 80

Tyr Ala Lys Leu Lys Gly Tyr Trp Tyr Asn Ser Met Pro Leu Ala Asn

85 90 95

Met Phe Tyr Thr Glu Val Pro Tyr Ala Glu Val Met Asp Leu Cys Asn

100 105 110

Ser Thr Leu Lys Ala Val Gly Ala Asn Ser Thr Leu Val Ile Pro Tyr

115 120 125

Ala Ser Asp Tyr Thr Leu Ser Tyr Tyr Tyr Val Ile Trp Asn Gln Gly

130 135 140

Ala Asn Gln Pro Val Ile Asn Val Gly Gly Arg Glu Leu Asp Arg Met

145 150 155 160

Val Val Phe Gly Asp Ser Leu Ser Asp Thr Val Asn Val Tyr Asn Gly

165 170 175

Ser Tyr Gly Thr Val Pro Asn Ser Thr Ser Trp Leu Leu Gly His Phe

180 185 190

Ser Asn Gly Lys Leu Trp His Glu Tyr Leu Ser Thr Val Leu Asn Leu

195 200 205

Pro Ser Tyr Val Trp Ala Thr Gly Asn Ala Glu Ser Gly Glu Lys Pro

210 215 220

Phe Phe Asn Gly Phe Ser Lys Gln Val Asp Ser Phe Arg Asp Tyr His

225 230 235 240

Ala Arg Thr Lys Gly Tyr Asp Ile Ser Lys Thr Leu Phe Thr Val Leu

245 250 255

Phe Gly Gly Asn Asp Phe Ile Thr Gly Gly Lys Ser Ala Asp Glu Val

260 265 270

Ile Glu Gln Tyr Thr Val Ser Leu Asn Tyr Leu Ala Gln Leu Gly Ala

275 280 285

Lys Gln Val Ala Ile Phe Arg Leu Pro Asp Phe Ser Val Ile Pro Ser

290 295 300

Val Ser Thr Trp Thr Glu Ala Asp Lys Asp Lys Leu Arg Glu Asn Ser

305 310 315 320

Val Gln Phe Asn Asp Gln Ala Glu Lys Leu Ile Ala Lys Leu Asn Ala

325 330 335

Ala His Pro Gln Thr Thr Phe Tyr Thr Leu Arg Leu Asp Asp Ala Phe

340 345 350

Lys Gln Val Leu Glu Asn Ser Asp Gln Tyr Gly Phe Val Asn Lys Thr

355 360 365

Asp Thr Cys Leu Asp Ile Ser Gln Gly Gly Tyr Asn Tyr Ala Ile Gly

370 375 380

Ala Arg Ala Lys Thr Ala Cys Lys Ser Ser Asn Ala Ala Phe Val Phe

385 390 395 400

Trp Asp Asn Met His Pro Thr Thr Lys Thr His Gly Leu Leu Ala Asp

405 410 415

Leu Leu Lys Asp Asp Val Val Arg Gly Leu Ala Ala Pro

420 425

<210>85

<211>1038

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>85

atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60

attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga 120

gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa 180

caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt 240

attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt 300

agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360

ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420

gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480

tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat 540

gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt 600

gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct 660

cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720

ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780

aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840

caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg 900

gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa 960

ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg 1020

aatagagtgg agtcatag 1038

<210>86

<211>345

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>86

Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val

20 25 30

Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile

50 55 60

Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val

65 70 75 80

Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly

85 90 95

Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly

100 105 110

Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg

165 170 175

Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys

180 185 190

Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala

195 200 205

Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu

210 215 220

Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln

260 265 270

Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly

275 280 285

Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln

305 310 315 320

Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu

325 330 335

Glu Lys Pro Val Asn Arg Val Glu Ser

340 345

<210>87

<211>870

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>87

atgtcaaaga aactcgtaat atcggtagcg ggcggcggag cactcggaat cggaccactc 60

gcattcctgt gcaagattga acagatgctg ggaaagaaga taccccaggt tgcgcaggca 120

tacgccggca cttcaaccgg agcaataatt gcggcaggac tggccgaagg ctactccgcg 180

catgaactgt tcgacctata caaatcaaat ctcagcaaga tattcaccaa atacagctgg 240

tacaaacgcc tgcagccaac gtgtcctaca tatgacaaca gtaacctaaa gaaattactg 300

aaggacaaat tcaagggcaa ggtcggcgac tggaaaactc ccgtatacat cccggcaaca 360

cacatgaacg gccaatccgt agaaaaggtg tgggacttgg gtgacaagaa tgttgacaag 420

tggtttgcca ttctgacaag taccgcggca ccaacctatt tcgactgcat atacgacgac 480

gagaagaact gctacatcga tggtggcatg tggtgcaacg caccaatcga tgtgcttaat 540

gcaggcctga tcaagtccgg ctggtccaac tacaaggtcc tggacctgga gaccggcatg 600

gacacaccga atacggaaag cggaaacaag acacttctcg gatgggggga atacatcata 660

agcaactggg tagcccgttc cagcaagtcc ggcgaatacg aggtaaaggc cataatcggg 720

gaagacaatg tatgtgttgc ccgtccatac gtaagcaaga aaccgaagat ggatgacgtg 780

gacagcaaga cgctggatga agtcgtggat atctgggaaa actacttcta cgccaagcag 840

aaagacatcg catcgtggct gaaaatctag 870

<210>88

<211>289

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>88

Met Ser Lys Lys Leu Val Ile Ser Val Ala Gly Gly Gly Ala Leu Gly

1 5 10 15

Ile Gly Pro Leu Ala Phe Leu Cys Lys Ile Glu Gln Met Leu Gly Lys

20 25 30

Lys Ile Pro Gln Val Ala Gln Ala Tyr Ala Gly Thr Ser Thr Gly Ala

35 40 45

Ile Ile Ala Ala Gly Leu Ala Glu Gly Tyr Ser Ala His Glu Leu Phe

50 55 60

Asp Leu Tyr Lys Ser Asn Leu Ser Lys Ile Phe Thr Lys Tyr Ser Trp

65 70 75 80

Tyr Lys Arg Leu Gln Pro Thr Cys Pro Thr Tyr Asp Asn Ser Asn Leu

85 90 95

Lys Lys Leu Leu Lys Asp Lys Phe Lys Gly Lys Val Gly Asp Trp Lys

100 105 110

Thr Pro Val Tyr Ile Pro Ala Thr His Met Asn Gly Gln Ser Val Glu

115 120 125

Lys Val Trp Asp Leu Gly Asp Lys Asn Val Asp Lys Trp Phe Ala Ile

130 135 140

Leu Thr Ser Thr Ala Ala Pro Thr Tyr Phe Asp Cys Ile Tyr Asp Asp

145 150 155 160

Glu Lys Asn Cys Tyr Ile Asp Gly Gly Met Trp Cys Asn Ala Pro Ile

165 170 175

Asp Val Leu Asn Ala Gly Leu Ile Lys Ser Gly Trp Ser Asn Tyr Lys

180 185 190

Val Leu Asp Leu Glu Thr Gly Met Asp Thr Pro Asn Thr Glu Ser Gly

195 200 205

Asn Lys Thr Leu Leu Gly Trp Gly Glu Tyr Ile Ile Ser Asn Trp Val

210 215 220

Ala Arg Ser Ser Lys Ser Gly Glu Tyr Glu Val Lys Ala Ile Ile Gly

225 230 235 240

Glu Asp Asn Val Cys Val Ala Arg Pro Tyr Val Ser Lys Lys Pro Lys

245 250 255

Met Asp Asp Val Asp Ser Lys Thr Leu Asp Glu Val Val Asp Ile Trp

260 265 270

Glu Asn Tyr Phe Tyr Ala Lys Gln Lys Asp Ile Ala Ser Trp Leu Lys

275 280 285

Ile

<210>89

<211>1422

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>89

atgaaaaaga aattatgtac actggctttt gtaacagcaa tatcttctat cgctatcaca 60

attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag 120

cacaaacgtg tgaagagatg gtctgcggaa catccacatc atcctaatga aagtacgcac 180

ttatggattg cgcgaaatgc aattcaaata atggcccgta atcaagataa gacggttcaa 240

gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt 300

tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat 360

gggctaatta aaggagggtg gaaatctcat ttttacgatc ccgatacgag aaagaactat 420

aaaggggaag aagaaccaac agctctctct caaggagata aatattttaa attagcaggc 480

gattacttta agaaagagga ttggaaacaa gctttctatt atttaggtgt tgcgacgcac 540

tacttcacag atgctactca gccaatgcat gctgctaatt ttacagccgt cgacacgagt 600

gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa 660

gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc 720

catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa 780

tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag 840

aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca 900

tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga 960

gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt 1020

ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat 1080

agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt 1140

catcgaggag aaagtatact gctgaaaatg acgcaatcta actatgataa ttacgtattt 1200

ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca 1260

cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga 1320

tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa 1380

acagatacac caaaagcttg gaaatttata caggctgaat ag 1422

<210>90

<211>473

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(25)

<223>从环境样品中获得

<400>90

Met Lys Lys Lys Leu Cys Thr Leu Ala Phe Val Thr Ala Ile Ser Ser

1 5 10 15

Ile Ala Ile Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu

20 25 30

Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser

35 40 45

Ala Glu His Pro His His Pro Asn Glu Ser Thr His Leu Trp Ile Ala

50 55 60

Arg Asn Ala Ile Gln Ile Met Ala Arg Asn Gln Asp Lys Thr Val Gln

65 70 75 80

Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe

85 90 95

Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly

100 105 110

Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys

115 120 125

Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu

130 135 140

Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly

145 150 155 160

Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly

165 170 175

Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala

180 185 190

Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe

195 200 205

Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly

210 215 220

Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile

225 230 235 240

His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn

245 250 255

Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln

260 265 270

Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg

275 280 285

Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn

290 295 300

Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly

305 310 315 320

Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe

325 330 335

Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala

340 345 350

Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val

355 360 365

Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu

370 375 380

Ser Ile Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe

385 390 395 400

Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys

405 410 415

Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser

420 425 430

Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn

435 440 445

Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro

450 455 460

Lys Ala Trp Lys Phe Ile Gln Ala Glu

465 470

<210>91

<211>1035

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>91

atgacaaccc aatttagaaa cctgatcttt gagggcggcg gtgtaaaggg cattgcttac 60

gtcggagcaa tgcagattct tgaaaatcgt ggtgtattac aagatattca ccgagtcgga 120

ggttgtagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac agtccgtgag 180

caaaaagaga tcttacaaat taccgatttt aaccagttta tggataactc gtggggtgtt 240

attcgggata ttcgcaggct tgcgagagaa tttggctgga ataagggtaa cttctttaat 300

acctggatag gtgatttgat tcatcgtcgt ttgggtaatc gccgagccac gttcaaagat 360

ctgcaaaagg caaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420

gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480

tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat 540

gtcgatgggg gtgtgcagct taactacccg atcaagctgt ttgatcgaac tcgttatatt 600

gacctcgcca aagatccggg tgctgctcgc cacacgggtt attacaataa agagaatgct 660

cgttttcagc ttgagcgacc gggccacagt ccttatgtgt acaatcgcca aacattaggc 720

ttgcgtcttg acagtcgtga agagatagcg ctgtttcgtt acgacgaacc tcttcagggt 780

aaacccatta agtccttcac tgactacgct cgacaacttt ttggtgcgct gaagaatgca 840

caggaaaaca ttcacctaca tggcgatgat tggcagcgca cggtctatat cgatacattg 900

gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgaacag 960

ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgtttga gaagcctgtg 1020

aatagagtgg agtaa 1035

<210>92

<211>344

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>92

Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Ile Ala Tyr Val Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val

20 25 30

Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile

50 55 60

Leu Gln Ile Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val

65 70 75 80

Ile Arg Asp Ile Arg Arg Leu Ala Arg Glu Phe Gly Trp Asn Lys Gly

85 90 95

Asn Phe Phe Asn Thr Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly

100 105 110

Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg

165 170 175

Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys

180 185 190

Leu Phe Asp Arg Thr Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala

195 200 205

Ala Arg His Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu

210 215 220

Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Arg Glu Glu Ile Ala Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Gln Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln

260 265 270

Leu Phe Gly Ala Leu Lys Asn Ala Gln Glu Asn Ile His Leu His Gly

275 280 285

Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln

305 310 315 320

Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Phe

325 330 335

Glu Lys Pro Val Asn Arg Val Glu

340

<210>93

<211>963

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>93

gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt atcaggggtt 60

ttcgtaccgc tgcagccatc atatgctact gaaaattatc caaatgattt taaactgttg 120

caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca 180

gattatatga gtaatgcaga ttactttaag ggacatgatg ctctgctctt aaatgagctt 240

tttgacaatg gaaattcgaa cgtgctgcta atgaacttat ccaaggaata tacatatcaa 300

acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat 360

tttgtacccg aagatggtgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata 420

cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat 480

gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa 540

gataccgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc 600

aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac 660

tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc 720

aatgcgccta ccgaatattt agggcataac tctacttggg acccagaaac gaacagcatt 780

acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa 840

gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg 900

aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa 960

taa 963

<210>94

<211>320

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(29)

<223>从环境样品中获得

<400>94

Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu

1 5 10 15

Leu Ser Gly Val Phe Val Pro Leu Gln Pro Ser Tyr Ala Thr Glu Asn

20 25 30

Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro

35 40 45

Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser

50 55 60

Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu

65 70 75 80

Phe Asp Asn Gly Asn Ser Asn Val Leu Leu Met Asn Leu Ser Lys G1u

85 90 95

Tyr Thr Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp

100 105 110

Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val

115 120 125

Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr

130 135 140

Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr

145 150 155 160

Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His

165 170 175

Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile

180 185 190

Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn

195 200 205

Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met

210 215 220

Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val

225 230 235 240

Asn Ala Pro Thr Glu Tyr Leu Gly His Asn Ser Thr Trp Asp Pro Glu

245 250 255

Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His

260 265 270

Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp

275 280 285

Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr

290 295 300

Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys

305 310 315 320

<210>95

<211>1038

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>95

atggcttcac aattcaggaa tctggtattt gaaggaggtg gtgtaaaagg gattgcgtac 60

ataggtgcga tgcaggtgct ggatcagcgc ggttatttgg gtgataacat caaacgcgtt 120

ggtggaacca gtgcaggtgc cataaatgcg ctgatttatt cgttaggata tgacatccac 180

gaacaacaag agatactgaa ctctacagat tttaaaaagt ttatggataa ctcttttgga 240

tttgtgaggg atttcagaag gctatggaat gaatttggat ggaatagagg agactttttt 300

cttaaatggt caggtgagct gatcaaaaat aaattgggca cctcaaaagc cacctttcag 360

gatttgaagg atgccggtca gccagatttg tatgtaattg gaacaaattt atcgacgggg 420

ttttccgaga ctttttcata tgaacgtcac cccgatatga ctcttgcaga agccgtaaga 480

atcagtatgt cgcttccgct gtttttcagg gctgtgcggt tgggcgacag gaatgatgta 540

tatgtggatg gtggggttca gctcaattac ccggtaaaac tatttgatcg tgaaaaatat 600

attgatatgg ataatgaggc ggctgcagca cgatttactg attattacaa caaagaaaat 660

gccagatttt cgctccagcg gcctggacga agcccctatg tatataatcg tcaaaccctt 720

ggtttgagac tggatacagc cgaagaaatt gcgcttttca ggtacgatga acccattcag 780

gggaaagaga tcaaacggtt tccggaatat gcaaaggctc tgatcggcgc actaatgcag 840

gtgcaggaaa acatacatct ccacagtgac gactggcagc gtacgctgta tatcaatacc 900

ctggatgtaa aaaccacaga ttttgaatta accgatgaga aaaaaaagga actggtagaa 960

cagggaatcc ttggcgcgga aacctatttc aaatggtttg aagacaggga tgaagtagtt 1020

gtaaaccgcc ttgcttag 1038

<210>96

<211>345

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>96

Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Asp Gln Arg Gly Tyr

20 25 30

Leu Gly Asp Asn Ile Lys Arg Val Gly Gly Thr Ser Ala Gly Ala Ile

35 40 45

Asn Ala Leu Ile Tyr Ser Leu Gly Tyr Asp Ile His Glu Gln Gln Glu

50 55 60

Ile Leu Asn Ser Thr Asp Phe Lys Lys Phe Met Asp Asn Ser Phe Gly

65 70 75 80

Phe Val Arg Asp Phe Arg Arg Leu Trp Asn Glu Phe Gly Trp Asn Arg

85 90 95

Gly Asp Phe Phe Leu Lys Trp Ser Gly Glu Leu Ile Lys Asn Lys Leu

100 105 110

Gly Thr Ser Lys Ala Thr Phe Gln Asp Leu Lys Asp Ala Gly Gln Pro

115 120 125

Asp Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr

130 135 140

Phe Ser Tyr Glu Arg His Pro Asp Met Thr Leu Ala Glu Ala Val Arg

145 150 155 160

Ile Ser Met Ser Leu Pro Leu Phe Phe Arg Ala Val Arg Leu Gly Asp

165 170 175

Arg Asn Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Val

180 185 190

Lys Leu Phe Asp Arg Glu Lys Tyr Ile Asp Met Asp Asn Glu Ala Ala

195 200 205

Ala Ala Arg Phe Thr Asp Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Ser

210 215 220

Leu Gln Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu

225 230 235 240

Gly Leu Arg Leu Asp Thr Ala Glu Glu Ile Ala Leu Phe Arg Tyr Asp

245 250 255

Glu Pro Ile Gln Gly Lys Glu Ile Lys Arg Phe Pro Glu Tyr Ala Lys

260 265 270

Ala Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu His

275 280 285

Ser Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Lys

290 295 300

Thr Thr Asp Phe Glu Leu Thr Asp Glu Lys Lys Lys Glu Leu Val Glu

305 310 315 320

Gln Gly Ile Leu Gly Ala Glu ThrTyr Phe Lys Trp Phe Glu Asp Arg

325 330 335

Asp Glu Val Val Val Asn Arg Leu Ala

340 345

<210>97

<211>1422

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>97

atgaaaagga aactatgtac atgggctctc gtaacagcaa tagcttctag tactgcggta 60

attccaacag cagcagaagc ttgtggatta ggagaagtaa tcaaacaaga gaatcaagag 120

cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcacatga aagtacccat 180

ttatggattg cacaaaatgc gattcaaatt atgagccgta atcaagataa gacggttcaa 240

gaaaatgaat tacaattttt aaatacccct gaatataagg agttatttga aagaggtctt 300

tatgatgctg attaccttga tgaatttaac gatggaggta caggtataat cggcattgat 360

gggctaattc gaggagggtg gaaatctcat ttctacgatc ccgatacaag aaagaactat 420

aaaggggagg aagaaccaac agctctttct caaggagata aatattttaa attagcaggt 480

gaatacttta agaagaatga ttggaaacag gctttctatt atttaggtgt tgcgacgcac 540

tactttacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacaggagt 600

gctataaagt ttcatagtgc ttttgaagat tatgtgacga caattcagga acagtttaaa 660

gtatcagatg gagagggaaa atataattta gtaaattcta atgatccgaa acagtggatc 720

catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga tgtgattaaa 780

tctcactata ataaaggaaa caatgctctt tggcagcaag aagttatgcc agctgttcag 840

agaagtttag aacaagccca aagaaatacg gcgggattta ttcatttatg gtttaaaaca 900

tatgttggaa aaacagctgc tgaagatatt gaaaatacta tagtgaaaga ttctagggga 960

gaagcaatac aagagaataa aaaatacttt gtagtaccaa gtgagttttt aaatagaggc 1020

ttaacatttg aagtgtatgc tgcttatgac tatgcgttat tatctaacca tgtggatgat 1080

aataatattc atggtacacc ggttcaaatt gtatttgata aagaaaataa tgggatcctt 1140

catcaaggag aaagtgcatt gttaaagatg acacaatcca actacgataa ttatgtattt 1200

ctaaattatt ctatcataac aaattgggta catcttgcaa aaagagaaaa caatactgca 1260

cagtttaaag tgtatccaaa tccaaataat ccaactgaat atttcatata tacagatggc 1320

tatccagtta attatcaaga aaaaggtaaa gagaaaagct ggattgtttt aggaaagaaa 1380

acggataaac caaaagcatg gaaatttata caggcggaat aa 1422

<210>98

<211>473

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(25)

<223>从环境样品中获得

<400>98

Met Lys Arg Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ala Ser

1 5 10 15

Ser Thr Ala Val Ile Pro Thr Ala Ala Glu Ala Cys Gly Leu Gly Glu

20 25 30

Val Ile Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser

35 40 45

Ala Glu His Pro His His Ser His Glu Ser Thr His Leu Trp Ile Ala

50 55 60

Gln Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln

65 70 75 80

Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe

85 90 95

Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly

100 105 110

Gly Thr Gly Ile Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys

115 120 125

Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu

130 135 140

Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly

145 150 155 160

Glu Tyr Phe Lys Lys Asn Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly

165 170 175

Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala

180 185 190

Asn Phe Thr Ala Val Asp Arg Ser Ala Ile Lys Phe His Ser Ala Phe

195 200 205

Glu Asp Tyr Val Thr Thr Ile Gln Glu Gln Phe Lys Val Ser Asp Gly

210 215 220

Glu Gly Lys Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile

225 230 235 240

His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn

245 250 255

Asp Val Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln

260 265 270

Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Gln Ala Gln Arg

275 280 285

Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys

290 295 300

Thr Ala Ala Glu Asp Ile Glu Asn Thr Ile Val Lys Asp Ser Arg Gly

305 310 315 320

Glu Ala Ile Gln Glu Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe

325 330 335

Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr AlaA la Tyr Asp Tyr Ala

340 345 350

Leu Leu Ser Asn His Val Asp Asp Asn Asn Ile His Gly Thr Pro Val

355 360 365

Gln Ile Val Phe Asp Lys Glu Asn Asn Gly Ile Leu His Gln Gly Glu

370 375 380

Ser Ala Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe

385 390 395 400

Leu Asn Tyr Ser Ile Ile Thr Asn Trp Val His Leu Ala Lys Arg Glu

405 410 415

Asn Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Thr

420 425 430

Glu Tyr Phe Ile Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Lys

435 440 445

Gly Lys Glu Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Lys Pro

450 455 460

Lys Ala Trp Lys Phe Ile Gln Ala Glu

465 470

<210>99

<211>1053

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>99

atggcaaagc gttttattct ttcgatcgat ggtggtggca ttcgcgggat catcccggcg 60

gccatcctgg tggagctggc caagcggttg gaggggctgc cgcttcacaa ggcattcgac 120

atgatcgccg ggacatccac cggcggcatc attgcggcgg ggctgacatg cccgcatcct 180

gacgatgagg agacggcggc gtgcacgccg accgatcttc tcaagcttta tgtcgatcac 240

ggcggcaaga tcttcgagaa aaacccgatc ctcggcctca tcaacccatt cggcctcaac 300

gatccgcgct accagccaga tgagctggaa aacaggctga aggcgcagct cggcttgacg 360

gcgacgctcg ataaagggct caccaaggtg ctgatcacgg cctatgatat ccagcagcgg 420

caggcgctgt tcatggcaaa caccgacaac gagaacagca atttccgcta ctgggaggca 480

gcgcgggcga catcggccgc acccacctat tttccgccgg cgctgatcga aagggttggc 540

gagaagaaca aggacaagcg cttcgtgcca ttgatcgacg gcggcgtctt cgccaacgat 600

cctatccttg ccgcctatgt ggaggcgcga aagcagaaat ggggcaatga cgagctcgtt 660

ttcctgtcgc ttggtaccgg ccagcaaaac cgcccgatcg cctatcagga ggccaagggc 720

tggggcattt taggctggat gcagccgtct catgacacgc cgctgatctc gatcctgatg 780

cagggacagg cgagcaccgc ctcctatcag gccaatgcgc tgctcaatcc gcccggcacc 840

aagatcgact attcgaccgt ggtgacgaag gacaacgcgg cttcgctcag ctatttccgt 900

ctcgaccggc agctgagctc gaaggagaac gacgcgctgg acgacgcatc gcccgaaaac 960

atcagggcgc tgaaggcaat cgccgcgcaa atcatcaagg ataacgcgcc ggcgctcgac 1020

gaaatcgcca aacgcatcct ggccaaccaa taa 1053

<210>100

<211>350

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>100

Met Ala Lys Arg Phe Ile Leu Ser Ile Asp Gly Gly Gly Ile Arg Gly

1 5 10 15

Ile Ile Pro Ala Ala Ile Leu Val Glu Leu Ala Lys Arg Leu Glu Gly

20 25 30

Leu Pro Leu His Lys Ala Phe Asp Met Ile Ala Gly Thr Ser Thr Gly

35 40 45

Gly Ile Ile Ala Ala Gly Leu Thr Cys Pro His Pro Asp Asp Glu Glu

50 55 60

Thr Ala Ala Cys Thr Pro Thr Asp Leu Leu Lys Leu Tyr Val Asp His

65 70 75 80

Gly Gly Lys Ile Phe Glu Lys Asn Pro Ile Leu Gly Leu Ile Asn Pro

85 90 95

Phe Gly Leu Asn Asp Pro Arg Tyr Gln Pro Asp Glu Leu Glu Asn Arg

100 105 110

Leu Lys Ala Gln Leu Gly Leu Thr AlaThr Leu Asp Lys Gly Leu Thr

115 120 125

Lys Val Leu Ile Thr Ala Tyr Asp Ile Gln Gln Arg Gln Ala Leu Phe

130 135 140

Met Ala Asn Thr Asp Asn Glu Asn Ser Asn Phe Arg Tyr Trp Glu Ala

145 150 155 160

Ala Arg Ala Thr Ser Ala Ala Pro Thr Tyr Phe Pro Pro Ala Leu Ile

165 170 175

Glu Arg Val Gly Glu Lys Asn Lys Asp Lys Arg Phe Val Pro Leu Ile

180 185 190

Asp Gly Gly Val Phe Ala Asn Asp Pro Ile Leu Ala Ala Tyr Val Glu

195 200 205

Ala Arg Lys Gln Lys Trp Gly Asn Asp Glu Leu Val Phe Leu Ser Leu

210 215 220

Gly Thr Gly Gln Gln Asn Arg Pro Ile Ala Tyr Gln Glu Ala Lys Gly

225 230 235 240

Trp Gly Ile Leu Gly Trp Met Gln Pro Ser His Asp Thr Pro Leu Ile

245 250 255

Ser Ile Leu Met Gln Gly Gln Ala Ser Thr Ala Ser Tyr Gln Ala Asn

260 265 270

Ala Leu Leu Asn Pro Pro Gly Thr Lys Ile Asp Tyr Ser Thr Val Val

275 280 285

Thr Lys Asp Asn Ala Ala Ser Leu Ser Tyr Phe Arg Leu Asp Arg Gln

290 295 300

Leu Ser Ser Lys Glu Asn Asp Ala Leu Asp Asp Ala Ser Pro Glu Asn

305 310 315 320

Ile Arg Ala Leu Lys Ala Ile Ala Ala Gln Ile Ile Lys Asp Asn Ala

325 330 335

Pro Ala Leu Asp Glu Ile Ala Lys Arg Ile Leu Ala Asn Gln

340 345 350

<210>101

<211>996

<212>DNA

<213>细菌

<400>101

ttgtcgctcg tcgcgtcgct ccgccgcgcc cccggcgccg ccctggccct cgcgcttgcc 60

gccgccaccc tggccgtgac cgcgcagggc gcgaccgccg cccccgccgc ggccgccgcc 120

gaggccccgc ggctcaaggt gctcacgtac aacacgttcc tgttctcgaa gacgctctac 180

ccgaactggg gccaggacca ccgggccaag gcgatcccca ccgccccctt ctaccagggc 240

caggacgtcg tggtcctcca ggaggccttc gacaactccg cgtcggacgc cctcaaggcg 300

aactccgccg gccagtaccc ctaccagacc cccgtcgtgg gccgcggcac cggcggctgg 360

gacgccaccg gcgggtccta ctcctcgacc acccccgagg acggcggcgt gacgatcctc 420

agcaagtggc cgatcgtccg caaggagcag tacgtctaca aggacgcgtg cggcgccgac 480

tggtggtcca acaagggctt cgcctacgtc gtgctcaacg tgaacggcag caaggtgcac 540

gtcctcggca cccacgccca gtccaccgac ccgggctgct cggcgggcga ggcggtgcag 600

atgcggagcc gccagttcaa ggcgatcgac gccttcctcg acgccaagaa catcccggcg 660

ggcgagcagg tgatcgtcgc cggcgacatg aacgtcgact cgcgcacgcc cgagtacggc 720

accatgctcg ccgacgccgg tctggcggcg gccgacgcgc gcaccggcca cccgtactcc 780

ttcgacaccg agctgaactc gatcgcctcc gagcgctacc cggacgaccc gcgcgaggac 840

ctcgattacg tcctctaccg cgccgggaac gcccgccccg ccaactggac caacaacgtg 900

gtcctggaga agagcgcccc gtggaccgtc tccagctggg gcaagagcta cacctacacc 960

aacctctccg accactaccc ggtcaccggc ttctga 996

<210>102

<211>331

<212>PRT

<213>细菌

<220>

<221>信号

<222>(1)...(39)

<400>102

Leu Ser Leu Val Ala Ser Leu Arg Arg Ala Pro Gly Ala Ala Leu Ala

1 5 10 15

Leu Ala Leu Ala Ala Ala Thr Leu Ala Val Thr Ala Gln Gly Ala Thr

20 25 30

Ala Ala Pro Ala Ala Ala Ala Ala Glu Ala Pro Arg Leu Lys Val Leu

35 40 45

Thr Tyr Asn Thr Phe Leu Phe Ser Lys Thr Leu Tyr Pro Asn Trp Gly

50 55 60

Gln Asp His Arg Ala Lys Ala Ile Pro Thr Ala Pro Phe Tyr Gln Gly

65 70 75 80

Gln Asp Val Val Val Leu Gln Glu Ala Phe Asp Asn Ser Ala Ser Asp

85 90 95

Ala Leu Lys Ala Asn Ser Ala Gly Gln Tyr Pro Tyr Gln Thr Pro Val

100 105 110

Val Gly Arg Gly Thr Gly Gly Trp Asp Ala Thr Gly Gly Ser Tyr Ser

115 120 125

Ser Thr Thr Pro Glu Asp Gly Gly Val Thr Ile Leu Ser Lys Trp Pro

130 135 140

Ile Val Arg Lys Glu Gln Tyr Val Tyr Lys Asp Ala Cys Gly Ala Asp

145 150 155 160

Trp Trp Ser Asn Lys Gly Phe Ala Tyr Val Val Leu Asn Val Asn Gly

165 170 175

Ser Lys Val His Val Leu Gly Thr His Ala Gln Ser Thr Asp Pro Gly

180 185 190

Cys Ser Ala Gly Glu Ala Val Gln Met Arg Ser Arg Gln Phe Lys Ala

195 200 205

Ile Asp Ala Phe Leu Asp Ala Lys Asn Ile Pro Ala Gly Glu Gln Val

210 215 220

Ile Val Ala Gly Asp Met Asn Val Asp Ser Arg Thr Pro Glu Tyr Gly

225 230 235 240

Thr Met Leu Ala Asp Ala Gly Leu Ala Ala Ala Asp Ala Arg Thr Gly

245 250 255

His Pro Tyr Ser Phe Asp Thr Glu Leu Asn Ser Ile Ala Ser Glu Arg

260 265 270

Tyr Pro Asp Asp Pro Arg Glu Asp Leu Asp Tyr Val Leu Tyr Arg Ala

275 280 285

Gly Asn Ala Arg Pro Ala Asn Trp Thr Asn Asn Val Val Leu Glu Lys

290 295 300

Ser Ala Pro Trp Thr Val Ser Ser Trp Gly Lys Ser Tyr Thr Tyr Thr

305 310 315 320

Asn Leu Ser Asp His Tyr Pro Val Thr Gly Phe

325 330

<210>103

<211>2205

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>103

atgagcgaga agaaggagat tcgcgttgcg ttgatcatgg ggggtggcgt cagcctcggc 60

agtttttcgg gtggtgcgct tctcaagacc atcgagctgc tgcagcacac tgcccgcggt 120

ccggcgaaga tcgatgtcgt gaccggtgcc tcggcgggaa gcatgacgct gggcgtagtc 180

atctaccacc tcatgcgggg atcgtcgacc gatgagattc tccgcgatct gaggcggtcg 240

tgggtggaaa tgatctcgtt cgacggcctc tgtccgccga acctgtcccg tcacgacaag 300

ccgagcctgt tttccgatga gatcgtccgg aagatcgcgg ccaccgtcat cgatatgggg 360

cgcaagctcg aggcggctcc tcatccgctt ttcgccgacg aactcgtagc ctcgttcgca 420

ctgacgaacc tgaacggcat ccccgcccgt acggagggcc agctcatccg gcaggcaaag 480

ggaggcggag ggtccgagaa gggctcgaaa tccgttttcg ccgacgccgt gcagactacc 540

tttcaccacg acgtgatgcg attcgtggtg cggcgcgatc acaacgggca aggcagcctg 600

ttcgacagcc gttaccgggc acgcatactc cctccatgga atgttgggaa gggcggcgat 660

gcatgggaag cctttcgcac ggcggctgtt gcctcggggg cgtttccggc cgcatttcct 720

cccgtcgaga tcagccgcaa ccgcgacgaa ttcaacatct ggcccgatcg catcgaggac 780

cagaaggcat ttacgttcga ttacgtggac ggcggggtac ttcgcaacga acccctccgg 840

gaggcgattc acctggccgc gctgcgcgat gagggagcga cggacatcga gcgtgtgttc 900

atcctcatcg acccgaacat cagcggcacc ggcgaggtct tcccgctctc ctataaccag 960

cagatgcgga tcaagccgaa ctacgattcc aacggcgacg tccgacagta cgatctcgat 1020

gtgccggact acaccggcaa tctgatcggg gcgatcggtc ggctgggttc ggtgatcgtc 1080

gggcaggcga cgttccgcga ctggctcaag gctgccaaag tgaacagcca gatcgagtgg 1140

cgacgggaat tgctgcccat tctccgcgac ctgaacccga accccgggga ggaggcgcgc 1200

aggggcgtga acgggatgat cgacaagatc taccggcaaa agtatcagcg cgccctcgag 1260

tcaaagagcg ttccggtcga ggaggtggaa cggcgcgttg ccgaagacat cgaacgggac 1320

ctggcgcggc gccgttcgga ggccggcgac aacgacttca ttgcccggct cctcctgctc 1380

gtcgacctga tcggcaacct gcgtgagaag cagaagctga acatggtggc gatcaccccc 1440

gcttccgcgc cgcacaacga cgggcgcccc ttgccgctgg ccggcaattt tatgttcagc 1500

ttcggggggt tcttcaggga ggagtacagg caatacgact tctcggtcgg cgaattcgca 1560

gcatggaacg tcctgagcac gccggcctcc gagacgccct ttcttgccga gaccgccccg 1620

aaaccgcccg cccgacctcc ccagccgccg gcaatcaatc ctacctaccg ctcactcggc 1680

ccgcccatcc agcagcggtt cgaggagttc gttcgtgggc acgttcgcgc ctttatcgct 1740

tcggtcgctc cgctgggaac gagagggatc gtcacgggca agattggcgg aaagcttcga 1800

acgatgctga tggcctcgcg caacgggaaa tcagagtact tccggcttcg cctctccggc 1860

gttgacgggc tctacctccg aggctccaag ggccgcaacc tgagggcggt taacggatcg 1920

atcgacacgg tcgtcggcgt ctatatcgac gaggaagatc agcaccgcga tgagtttttc 1980

ggtccccatg tcttcggcgc gaacggctca ggctttacga tggaactatg ggagtcccgc 2040

ggttttttcg ggcgtgatcg tcgcgtcgct gtgatcgagt tggagaacaa ccccggcggg 2100

ttcgcaatcg ccgccggatg caggcggcgg cccggcgtgg tgctggatat ggccaggcgt 2160

aacgggcagc cactgcggac ggtggatgtg atggaatttg cgtga 2205

<210>104

<211>734

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>104

Met Ser Glu Lys Lys Glu Ile Arg Val Ala Leu Ile Met Gly Gly Gly

1 5 10 15

Val Ser Leu Gly Ser Phe Ser Gly Gly Ala Leu Leu Lys Thr Ile Glu

20 25 30

Leu Leu Gln His Thr Ala Arg Gly Pro Ala Lys Ile Asp Val Val Thr

35 40 45

Gly Ala Ser Ala Gly Ser Met Thr Leu Gly Val Val Ile Tyr His Leu

50 55 60

Met Arg Gly Ser Ser Thr Asp Glu Ile Leu Arg Asp Leu Arg Arg Ser

65 70 75 80

Trp Val Glu Met Ile Ser Phe Asp Gly Leu Cys Pro Pro Asn Leu Ser

85 90 95

Arg His Asp Lys Pro Ser Leu Phe Ser Asp Glu Ile Val Arg Lys Ile

100 105 110

Ala Ala Thr Val Ile Asp Met Gly Arg Lys Leu Glu Ala Ala Pro His

115 120 125

Pro Leu Phe Ala Asp Glu Leu Val Ala Ser Phe Ala Leu Thr Asn Leu

130 135 140

Asn Gly Ile Pro Ala Arg Thr Glu Gly Gln Leu Ile Arg Gln Ala Lys

145 150 155 160

Gly Gly Gly Gly Ser Glu Lys Gly Ser Lys Ser Val Phe Ala Asp Ala

165 170 175

Val Gln Thr Thr Phe His His Asp Val Met Arg Phe Val Val Arg Arg

180 185 190

Asp His Asn Gly Gln Gly Ser Leu Phe Asp Ser Arg Tyr Arg Ala Arg

195 200 205

Ile Leu Pro Pro Trp Asn Val Gly Lys Gly Gly Asp Ala Trp Glu Ala

210 215 220

Phe Arg Thr Ala Ala Val Ala Ser Gly Ala Phe Pro Ala Ala Phe Pro

225 230 235 240

Pro Val Glu Ile Ser Arg Asn Arg Asp Glu Phe Asn Ile Trp Pro Asp

245 250 255

Arg Ile Glu Asp Gln Lys Ala Phe Thr Phe Asp Tyr Val Asp Gly Gly

260 265 270

Val Leu Arg Asn Glu Pro Leu Arg Glu Ala Ile His Leu Ala Ala Leu

275 280 285

Arg Asp Glu Gly Ala Thr Asp Ile Glu Arg Val Phe Ile Leu Ile Asp

290 295 300

Pro Asn Ile Ser Gly Thr Gly Glu Val Phe Pro Leu Ser Tyr Asn Gln

305 310 315 320

Gln Met Arg Ile Lys Pro Asn Tyr Asp Ser Asn Gly Asp Val Arg Gln

325 330 335

Tyr Asp Leu Asp Val Pro Asp Tyr Thr Gly Asn Leu Ile Gly Ala Ile

340 345 350

Gly Arg Leu Gly Ser Val Ile Val Gly Gln Ala Thr Phe Arg Asp Trp

355 360 365

Leu Lys Ala Ala Lys Val Asn Ser Gln Ile Glu Trp Arg Arg Glu Leu

370 375 380

Leu Pro Ile Leu Arg Asp Leu Asn Pro Asn Pro Gly Glu Glu Ala Arg

385 390 395 400

Arg Gly Val Asn Gly Met Ile Asp Lys Ile Tyr Arg Gln Lys Tyr Gln

405 410 415

Arg Ala Leu Glu Ser Lys Ser Val Pro Val Glu Glu Val Glu Arg Arg

420 425 430

Val Ala Glu Asp Ile Glu Arg Asp Leu Ala Arg ArgArg Ser Glu Ala

435 440 445

Gly Asp Asn Asp Phe Ile Ala Arg Leu Leu Leu Leu Val Asp Leu Ile

450 455 460

Gly Asn Leu Arg Glu Lys Gln Lys Leu Asn Met Val Ala Ile Thr Pro

465 470 475 480

Ala Ser Ala Pro His Asn Asp Gly Arg Pro Leu Pro Leu Ala Gly Asn

485 490 495

Phe Met Phe Ser Phe Gly Gly Phe Phe Arg Glu Glu Tyr Arg Gln Tyr

500 505 510

Asp Phe Ser Val Gly Glu Phe Ala Ala Trp Asn Val Leu Ser Thr Pro

515 520 525

Ala Ser Glu Thr Pro Phe Leu Ala Glu Thr Ala Pro Lys Pro Pro Ala

530 535 540

Arg Pro Pro Gln Pro Pro Ala Ile Asn Pro Thr Tyr Arg Ser Leu Gly

545 550 555 560

Pro Pro Ile Gln Gln Arg Phe Glu Glu Phe Val Arg Gly His Val Arg

565 570 575

Ala Phe Ile Ala Ser Val Ala Pro Leu Gly Thr Arg Gly Ile Val Thr

580 585 590

Gly Lys Ile Gly Gly Lys Leu Arg Thr Met Leu Met Ala Ser Arg Asn

595 600 605

Gly Lys Ser Glu Tyr Phe Arg Leu Arg Leu Ser Gly Val Asp Gly Leu

610 615 620

Tyr Leu Arg Gly Ser Lys Gly Arg Asn Leu Arg Ala Val Asn Gly Ser

625 630 635 640

Ile Asp Thr Val Val Gly Val Tyr Ile Asp Glu Glu Asp Gln His Arg

645 650 655

Asp Glu Phe Phe Gly Pro His Val Phe Gly Ala Asn Gly Ser Gly Phe

660 665 670

Thr Met Glu Leu Trp Glu SerArg Gly Phe Phe Gly Arg Asp Arg Arg

675 680 685

Val Ala Val Ile Glu Leu Glu Asn Asn Pro Gly Gly Phe Ala Ile Ala

690 695 700

Ala Gly Cys Arg Arg Arg Pro Gly Val Val Leu Asp Met Ala Arg Arg

705 710 715 720

Asn Gly Gln Pro Leu Arg Thr Val Asp Val Met Glu Phe Ala

725 730

<210>105

<211>756

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>105

atgaaccgtt gtcggaactc actcaacctc caacttcgcg cggtgaccgt ggcggcgttg 60

gtagtcgtcg catcctcggc cgcgctggcg tgggacagcg cctcgcgcaa tccgacccat 120

cccacccaca gctacctcac cgaatacgcc atcgatcagc ttggggtggc gcggccggag 180

ctccggcaat accgcaagca gatcatcgag ggcgccaaca ccgagctgca cgaactgcca 240

gtcaagggga cggcctatgg cctcgacctc gacgccaagc ggcgggaaca ccgcggcacc 300

aatgccggga cagacgacat cgccggctgg tgggcggaaa gcctccaagc ctatcgcgcc 360

ggtgccaagg aacgcgccta cttcgtgctg ggggtggtgc tgcacatggt cgaggacatg 420

ggcgtgccgg cgcacgcgaa cggcgtctac caccagggca acctgactga attcgacaat 480

ttcgagttca tgggactgtc gaactggaag ccctctttcg ccgacatcaa ccggaccgat 540

ccgggctacg ccgacccgtc gcgctactac gagttcagcc gagattggac ggcggcagac 600

gcacccggct atcgcgaccg cgacagcttc tcgaagacct gggttctcgc cagcccggcc 660

gaacgtcagc tgcttcagaa ccgccagggc cggaccgcca cggtcgccat gtgggcgtta 720

cggagcgcga cgaaggcgtt cgccgggaaa ccctag 756

<210>106

<211>251

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(30)

<223>从环境样品中获得

<400>106

Met Asn Arg Cys Arg Asn Ser Leu Asn Leu Gln Leu Arg Ala Val Thr

1 5 10 15

Val Ala Ala Leu Val Val Val Ala Ser Ser Ala Ala Leu Ala Trp Asp

20 25 30

Ser Ala Ser Arg Asn Pro Thr His Pro Thr His Ser Tyr Leu Thr Glu

35 40 45

Tyr Ala Ile Asp Gln Leu Gly Val Ala Arg Pro Glu Leu Arg Gln Tyr

50 55 60

Arg Lys Gln Ile Ile Glu Gly Ala Asn Thr Glu Leu His Glu Leu Pro

65 70 75 80

Val Lys Gly Thr Ala Tyr Gly Leu Asp Leu Asp Ala Lys Arg Arg Glu

85 90 95

His Arg Gly Thr Asn Ala Gly Thr Asp Asp Ile Ala Gly Trp Trp Ala

100 105 110

Glu Ser Leu Gln Ala Tyr Arg Ala Gly Ala Lys Glu Arg Ala Tyr Phe

115 120 125

Val Leu Gly Val Val Leu His Met Val Glu Asp Met Gly Val Pro Ala

130 135 140

His Ala Asn Gly Val Tyr His Gln Gly Asn Leu Thr Glu Phe Asp Asn

145 150 155 160

Phe Glu Phe Met Gly Leu Ser Asn Trp Lys Pro Ser Phe Ala Asp Ile

165 170 175

Asn Arg Thr Asp Pro Gly Tyr Ala Asp Pro Ser Arg Tyr Tyr Glu Phe

180 185 190

Ser Arg Asp Trp Thr Ala Ala Asp Ala Pro Gly Tyr Arg Asp Arg Asp

195 200 205

Ser Phe Ser Lys Thr Trp Val Leu Ala Ser Pro Ala Glu Arg Gln Leu

210 215 220

Leu Gln Asn Arg Gln Gly Arg Thr Ala Thr Val Ala Met Trp Ala Leu

225 230 235 240

Arg Ser Ala Thr Lys Ala Phe Ala Gly Lys Pro

245 250

<210>107

<211>990

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>107

atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt 60

gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac 120

tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca 180

ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg 240

acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga 300

gggcgtttaa cagatgataa tacgatagtt cttcatcatg gaccattata tctttatgta 360

acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420

attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt 480

agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata 540

agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa 600

tctggaggat ataataattt ttattggcca gataatgaca cgtttacgac aactgtaaat 660

caaaatgtaa atgtaacagt acaagataaa tataaggtga gttatgatga gaaagtaaca 720

tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat 780

attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattacgcg 840

tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctac gagagtgggc 900

tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata 960

agagcgaata agtcacttgt aaaagagtaa 990

<210>108

<211>329

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<220>

<221>结构域

<222>(56)...(195)

<223>磷脂酰肌醇-特异性磷脂酶C，X结构域

<400>108

Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile

1 5 10 15

Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala

20 25 30

Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile

35 40 45

Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp

50 55 60

Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met

65 70 75 80

Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile

85 90 95

Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His

100 105 110

His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu

115 120 125

Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser

130 135 140

Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser

145 150 155 160

Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr

165 170 175

Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu

180 185 190

Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr

195 200 205

Trp Pro Asp Asn Asp Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn

210 215 220

Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Thr

225 230 235 240

Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys

245 250 255

Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala

260 265 270

Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala

275 280 285

Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Val Ile Gln

290 295 300

Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile

305 310 315 320

Arg Ala Asn Lys Ser Leu Val Lys Glu

325

<210>109

<211>990

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>109

atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt 60

gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac 120

tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca 180

ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg 240

acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga 300

gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360

acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420

attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt 480

agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata 540

agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa 600

tctggaggat ataataattt ttattggcca gataatgaga cgtttacgac aactgtaaat 660

caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa 720

tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat 780

attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840

tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctat gagagtgggc 900

tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata 960

agagcgaata agtcacttgt aaaagagtaa 990

<210>110

<211>329

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<220>

<221>结构域

<222>(56)...(195)

<223>从环境样品中获得

<400>110

Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile

1 5 10 15

Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala

20 25 30

Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile

35 40 45

Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp

50 55 60

Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met

65 70 75 80

Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile

85 90 95

Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His

100 105 110

His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu

115 120 125

Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser

130 135 140

Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser

145 150 155 160

Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr

165 170 175

Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu

180 185 190

Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr

195 200 205

Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn

210 215 220

Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys

225 230 235 240

Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys

245 250 255

Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala

260 265 270

Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala

275 280 285

Asn Tyr Met Lys Gln Lys Asn Pro Met Arg Val Gly Trp Val Ile Gln

290 295 300

Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile

305 310 315 320

Arg Ala Asn Lys Ser Leu Val Lys Glu

325

<210>111

<211>828

<212>DNA

<213>细菌

<400>111

gtgggtgccg gggcgatcct tctcaccggg gcccccaccg cctcggccgt ggacacgcgc 60

gcgtggatgg ggggacacgg ggacggcacg ccgctccagc ggctcaccat ccccggcacc 120

cacgactccg gcgcccggtt cggcgggccc tggtcggagt gccagaacac caccatcgcc 180

cagcagctgg acagcgggat ccggttcctg gacgtccggt gccgggtcac cggcgggtcc 240

ttcgccatcc accacggggc ctcctaccag aacatgatgt tcggcgacgt cctcgtcgcc 300

tgccgcgact tcctcgccgc gcacccctcc gagaccgtcc tcatgcgggt caagcaggag 360

tactcgaccg actccgacgc caccttccgg gccgtcttcg acgactacct cgacgcgcgc 420

ggctggcgct ccctgttccg catcggcgac ggggtcccgc tgctcggcga ggcccgcggc 480

cgggtcgtgc tcatcgccga caacggcgga ctgccgggcg gtctgcgctg gggcgacggc 540

tcggccctcg ccatccagga cgactggaac gcgctgcccg accccaagta cgccaagatc 600

gaggcgcact tccgtaccgc cgtcgcccag ccgggccggc tgtacgtgaa cttcgtcagc 660

acctccgcct acctgccgcc ccgctggaac tccgacaacc tcaacccgcg cgtgcaccgc 720

tacctcgaca gcgcggccgc cgcgggcgcg aagggcctcg ggatcgtccc catggacttc 780

cccaacaccc gctcgggtct ggtcgaggcg ctgctccggc acaactga 828

<210>112

<211>275

<212>PRT

<213>细菌

<220>

<221>信号

<222>(1)...(16)

<220>

<221>结构域

<222>(34)...(168)

<223>磷脂酰肌醇-特异性磷脂酶C，X结构域

<400>112

Met Gly Ala Gly Ala Ile Leu Leu Thr Gly Ala Pro Thr Ala Ser Ala

1 5 10 15

Val Asp Thr Arg Ala Trp Met Gly Gly His Gly Asp Gly Thr Pro Leu

20 25 30

Gln Arg Leu Thr Ile Pro Gly Thr His Asp Ser Gly Ala Arg Phe Gly

35 40 45

Gly Pro Trp Ser Glu Cys Gln Asn Thr Thr Ile Ala Gln Gln Leu Asp

50 55 60

Ser Gly Ile Arg Phe Leu Asp Val Arg Cys Arg Val Thr Gly Gly Ser

65 70 75 80

Phe Ala Ile His His Gly Ala Ser Tyr Gln Asn Met Met Phe Gly Asp

85 90 95

Val Leu Val Ala Cys Arg Asp Phe Leu Ala Ala His Pro Ser Glu Thr

100 105 110

Val Leu Met Arg Val Lys Gln Glu Tyr Ser Thr Asp Ser Asp Ala Thr

115 120 125

Phe Arg Ala Val Phe Asp Asp Tyr Leu Asp Ala Arg Gly Trp Arg Ser

130 135 140

Leu Phe Arg Ile Gly Asp Gly Val Pro Leu Leu Gly Glu Ala Arg Gly

145 150 155 160

Arg Val Val Leu Ile Ala Asp Asn Gly Gly Leu Pro Gly Gly Leu Arg

165 170 175

Trp Gly Asp Gly Ser Ala Leu Ala Ile Gln Asp Asp Trp Asn Ala Leu

180 185 190

Pro Asp Pro Lys Tyr Ala Lys Ile Glu Ala His Phe Arg Thr Ala Val

195 200 205

Ala Gln Pro Gly Arg Leu Tyr Val Asn Phe Val Ser Thr Ser Ala Tyr

210 215 220

Leu Pro Pro Arg Trp Asn Ser Asp Asn Leu Asn Pro Arg Val His Arg

225 230 235 240

Tyr Leu Asp Ser Ala Ala Ala Ala Gly Ala Lys Gly Leu Gly Ile Val

245 250 255

Pro Met Asp Phe Pro Asn Thr Arg Ser Gly Leu Val Glu Ala Leu Leu

260 265 270

Arg His Asn

275

<210>113

<211>981

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>113

atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt 60

gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac 120

tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca 180

ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg 240

acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga 300

gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360

acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420

attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt 480

agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata 540

agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa 600

tctggaggat ataataattt ttattggcca gataatgaga cgtttacgac aactgtaaat 660

caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa 720

tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat 780

attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840

tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctat gagagtgggc 900

tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata 960

agagcgaata agtcactgta a 981

<210>114

<211>326

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<220>

<221>结构域

<222>(56)...(195)

<223>磷脂酰肌醇-特异性磷脂酶C，X结构域

<400>114

Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile

1 5 10 15

Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala

20 25 30

Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile

35 40 45

Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp

50 55 60

Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met

65 70 75 80

Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile

85 90 95

Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His

100 105 110

His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu

115 120 125

Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser

130 135 140

Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser

145 150 155 160

Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr

165 170 175

Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu

180 185 190

Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr

195 200 205

Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn

210 215 220

Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys

225 230 235 240

Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys

245 250 255

Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala

260 265 270

Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala

275 280 285

Asn Tyr Met Lys Gln Lys Asn Pro Met Arg Val Gly Trp Val Ile Gln

290 295 300

Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile

305 310 315 320

Arg Ala Asn Lys Ser Leu

325

<210>115

<211>987

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>115

atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt 60

gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatga gcttgaaaat 120

tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca 180

ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg 240

acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga 300

gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360

acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420

attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt 480

agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga agggaatata 540

aagcttggag atgctcgtgg gaaaattata ttactaaaac gatatagtgg tagtaatgaa 600

tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat 660

caaaatgtaa atgtcacagt acaagataaa tataaagtga gttatgatga gaaagtaaac 720

gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat 780

attaatttta taagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840

tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc 900

tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata 960

agagcgaata agtcacttgt aaaatag 987

<210>116

<211>328

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<220>

<221>结构域

<222>(56)...(195)

<223>磷脂酰肌醇-特异性磷脂酶C，X结构域

<400>116

Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val

1 5 10 15

Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala

20 25 30

Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile

35 40 45

Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp

50 55 60

Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met

65 70 75 80

Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile

85 90 95

Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His

100 105 110

His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu

115 120 125

Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser

130 135 140

Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser

145 150 155 160

Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr

165 170 175

Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Ile Leu Leu

180 185 190

Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr

195 200 205

Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn

210 215 220

Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Asn

225 230 235 240

Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val

245 250 255

Asn His Leu Tyr Ile Asn Phe Ile Ser Leu Ser Ser Gly Gly Thr Ala

260 265 270

Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala

275 280 285

Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln

290 295 300

Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile

305 310 315 320

Arg Ala Asn Lys Ser Leu Val Lys

325

<210>117

<211>987

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>117

atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt 60

gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatga gcttgaaaat 120

tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca 180

ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg 240

acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga 300

gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360

acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420

attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt 480

agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga aggaaatata 540

aagcttggag atgctcgtgg gaaaattgta ttactaaaaa gatatagtgg tagtaatgaa 600

tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat 660

caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaaataaac 720

gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat 780

attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840

tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc 900

tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata 960

agagcgaata agtcacttgt aaaatag 987

<210>118

<211>328

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<220>

<221>结构域

<222>(56)...(195)

<223>磷脂酰肌醇-特异性磷脂酶C，X结构域

<400>118

Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val

1 5 10 15

Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala

20 25 30

Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile

35 40 45

Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp

50 55 60

Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met

65 70 75 80

Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile

85 90 95

Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His

100 105 110

His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu

115 120 125

Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser

130 135 140

Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser

145 150 155 160

Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr

165 170 175

Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu

180 185 190

Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr

195 200 205

Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn

210 215 220

Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Ile Asn

225 230 235 240

Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val

245 250 255

Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala

260 265 270

Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala

275 280 285

Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln

290 295 300

Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile

305 310 315 320

Arg Ala Asn Lys Ser Leu Val Lys

325

<210>119

<211>987

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>119

atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt 60

gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatgt gcttgaaaat 120

tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca 180

ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg 240

acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga 300

gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360

acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420

attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt 480

agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga agggaatata 540

aagcttggag atgctcgtgg gaaaattgta ttactaaaaa gatatagtgg tagtaatgaa 600

tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat 660

caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaaataaac 720

gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat 780

attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840

tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc 900

tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata 960

agagcgaata agtcacttgt aaaatag 987

<210>120

<211>328

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<220>

<221>结构域

<222>(56)...(195)

<223>磷脂酰肌醇-特异性磷脂酶C，X结构域

<400>120

Met Asn Asn Lys Lys Phe lle Leu Lys Leu Phe Ile Cys Ser Met Val

1 5 10 15

Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala

20 25 30

Ser Ser Ile Asn Val Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile

35 40 45

Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp

50 55 60

Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp GIy Met

65 70 75 80

Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile

85 90 95

Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His

100 105 110

His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu

115 120 125

Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser

130 135 140

Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser

145 150 155 160

Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr

165 170 175

Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu

180 185 190

Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr

195 200 205

Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn

210 215 220

Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Ile Asn

225 230 235 240

Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val

245 250 255

Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala

260 265 270

Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala

275 280 285

Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln

290 295 300

Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile

305 310 315 320

Arg Ala Asn Lys Ser Leu Val Lys

325

<210>121

<211>990

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>121

atgcgtaata agaagtttat tttgaaatta ttaatatgta gtacggtact tagcaccttt 60

gtatttgctt tcaatgataa gcaaactgtt gcagctagct ctattaatga actcgaaaat 120

tggtctagat ggatgcagcc tatacctgat gacatgccgt tagcaagaat ttcaattcca 180

ggaacacatg atagtggaac gttcaaactg caaaatccga taaagcaagt atggggaatg 240

acgcaagaat atgattttcg ttaccaaatg gatcatgggg ctagaatttt tgatataaga 300

gggcgtttaa cagatgataa tacgatagtc cttcatcatg ggccattata tctttatgta 360

acactgaacg aatttataaa tgaagcgaaa caatttttaa aagataaccc aagtgaaacg 420

attattatgt ctttaaagaa agagtatgag gatatgaaag gggcagaaaa ttcatttagt 480

agtacgtttg aaaaaaaata ttttcttgat cctatctttt taaaaacaga agggaatata 540

aaacttggag atgctcgtgg gaaaattgta ctactaaaaa gatatagtgg tagtaatgaa 600

tctggaggat ataataattt ttattggcca gataacgaga cgtttacgac aactgtaaat 660

caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa 720

tctattaaag atacgataaa tgaaacgatt aacaatagtg aagattttaa tcatctatat 780

attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgca 840

tcctacataa atcctgaaat tgcaaaccat atgaagcaaa agaatcctac gagagtgggc 900

tgggtaattc aagattatat aaatgaaaaa tggtcaccaa tactttatca agaagttata 960

agagcgaata agtcacttat aaaagagtag 990

<210>122

<211>329

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(23)

<223>从环境样品中获得

<220>

<221>结构域

<222>(56)...(195)

<223>磷脂酰肌醇-特异性磷脂酶C，X结构域

<400>122

Met Arg Asn Lys Lys Phe Ile Leu Lys Leu Leu Ile Cys Ser Thr Val

1 5 10 15

Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Thr Val Ala Ala

20 25 30

Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Gln Pro Ile

35 40 45

Pro Asp Asp Met Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp

50 55 60

Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met

65 70 75 80

Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile

85 90 95

Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His

100 105 110

His Gly Pro Leu Tyr Leu Tyr Val Thr Leu Asn Glu Phe Ile Asn Glu

115 120 125

Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser

130 135 140

Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asn Ser Phe Ser

145 150 155 160

Ser Thr Phe Glu Lys Lys Tyr Phe Leu Asp Pro Ile Phe Leu Lys Thr

165 170 175

Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu

180 185 190

Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr

195 200 205

Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn

210 215 220

Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys

225 230 235 240

Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Phe

245 250 255

Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala

260 265 270

Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala

275 280 285

Asn His Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Val Ile Gln

290 295 300

Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Gln Glu Val Ile

305 310 315 320

Arg Ala Asn Lys Ser Leu Ile Lys Glu

325

<210>123

<211>849

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>123

atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcacc agttcaaagt 60

gtagtgtttg cgcaaacaaa taatagtgaa agtcctgcac cgatcttaag atggtcagct 120

gaggacaagc ataatgaggg agttagtact catttgtgga ttgtaaatcg tgcaattgac 180

atcatgtctc gtaatacagc gattgtgaag ccaaatgaaa ctgctttatt aaatgagtgg 240

cgtactgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat 300

agtacatatg cttctcattt ttacgatccg gatactggaa aaacatatat tccttttgcg 360

aaacaggcaa aagaaacagg tacaaaatat tttaaacttg ctggtgaagc atacaaaaat 420

caagatatga aacaggcatt cttctattta ggattatcac ttcattattt aggagatgta 480

aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct 540

aaatatgaaa attttgttga tacaataaaa aataactata tagtttcaga tagtagtgga 600

tattggaatt ggaaaggggc aaacccagaa gattggattc aaggagcagc agtagcggct 660

aaacaagatt atcctggtat tgtgaacgat acgacaaaag attggtttgt aaaagcagct 720

gtatctcaag catatgcaga taaatggcgt gcagaagtaa caccggtgac aggaaaacgc 780

ttaatggagg cacagcgcgt tacagctggt tatattcatt tatggtttga tacgtatgta 840

aatcactaa 849

<210>124

<211>282

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(24)

<223>从环境样品中获得

<220>

<221>结构域

<222>(1)...(281)

<223>锌依赖型磷脂酶C

<400>124

Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala

1 5 10 15

Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro

20 25 30

Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Val

35 40 45

Ser Thr His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg

50 55 60

Asn Thr Ala Ile Val Lys Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp

65 70 75 80

Arg Thr Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro

85 90 95

Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr

100 105 110

Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Glu Thr Gly Thr

115 120 125

Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Lys Asn Gln Asp Met Lys

130 135 140

Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val

145 150 155 160

Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met

165 170 175

Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn

180 185 190

Tyr Ile Val Ser Asp Ser Ser Gly Tyr Trp Asn Trp Lys Gly Ala Asn

195 200 205

Pro Glu Asp Trp Ile Gln Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr

210 215 220

Pro Gly Ile Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala

225 230 235 240

Val Ser Gln Ala Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val

245 250 255

Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile

260 265 270

His Leu Trp Phe Asp Thr Tyr Val Asn His

275 280

<210>125

<211>1710

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>125

atggctgaca acgagttgcc cctggcgcgg cccagggaga cgccgccgtg ccgccccggc 60

acgttcgagc ttgggctcgc cctggctggc gcggtctctg gcggcgccta cgccgcggga 120

gtcctggatt tcttctacga agccctcgag cattggtacg aggccaggga ggcgggagcg 180

ccggtgccca accacgacgt gctcctccgg atcatctcgg gtgcgtcggc gggcagtatc 240

aatggcgtgc tttcgggcat cgcgctgccg taccgttttc cccacgtgca cagcgggccc 300

gcgcccgagg gtgccacggg caaccccttc tacgacgcct gggtgaagcg catcgacgtg 360

cgcgaactgt tgggcaacga agacctggcc gatcccacgc agccggtggc atccctgctc 420

gacgccacct gcctggatac gatcgcgaag gacatgctcg gcttctcggc ggcgccggcc 480

acccggccgt acgtcgctaa tccgctgaaa tgcgtgttca cggtgaccaa cctgcgtggc 540

gttccttacg tcgtgcagtt caagggaaac ccggagatcc ccggccacgg catgatggcc 600

cacgccgact ggctgcgctt cgccgtcgac accgggcagg gcgaccggga tggggaatgg 660

atgttccccg atgaacggct cgtcagcggg ccgagccatg cgcggactcc ggcctggcaa 720

ggtttcatgg aggcggcgct cgcttcgtcg gcgttcccgg ccggcttgcg tttccgcgaa 780

gtcgcccggc cctggagcga ttacgaccag cgcgtcgtgg tggtgcccaa ccaggcgggg 840

gccgcggtcc cggtcccgct cccgccggcc tgggcggagg gcgagggcag cgatggggac 900

taccggttcg tcgcggtgga tggtggcgcg atggacaacg agccgttcga acttgcccgt 960

accgagctgg cgggcacgct cggccgcaat ccacgcgaag ggaaccgggt caaccgcatc 1020

gtgatcatgc tcgatccgtt tcccgaggcc gaggcgccgg gacccgcgga agccgcgagc 1080

acgaatctcg tcgaggcgat ggcctcgctg tttggtgcgt ggaaacagca ggcacggttc 1140

aagccggagg aagtggcgct cgccctggat tcgaccgtgt acagccgctt catgatcgcg 1200

cccagccggc cgtgcatgga gggcgggcca cggtggatcg gtgggcgagc gctcgccgcg 1260

ggtgcgctgg gtggcttctc ggggttcctg gcggaggcat acaggcacca cgatttcctc 1320

ctgggacgcc gcaactgcca acgcttcctc gccgagcgcc tgttgatccc cgcggacaat 1380

ccgatcttcg ccggctggat cgacgatccc tccctgcagg gctacatccg cgagatcgat 1440

ggcgtgcgtt acgccccggt catcccgctg gtgggcggct gccagggctt gcgcgagccg 1500

ttgcccacgt ggccgcgtgg tgcattcgac ctggactcgc tcatgccgct ggtcgagcgc 1560

cgcatgcagc gcctgtattc ggcggctacc gcgacgctcg gtggccgctt cgccacctgg 1620

ctggcgtggc gcttctacct gcgccgcaag ctcctcgacc tggtctcaagccgtatccgt 1680

agcgcattga gggacttcgg cctttggtga 1710

<210>126

<211>569

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>126

Met Ala Asp Asn Glu Leu Pro Leu Ala Arg Pro Arg Glu Thr Pro Pro

1 5 10 15

Cys Arg Pro Gly Thr Phe Glu Leu Gly Leu Ala Leu Ala Gly Ala Val

20 25 30

Ser Gly Gly Ala Tyr Ala Ala Gly Val Leu Asp Phe Phe Tyr Glu Ala

35 40 45

Leu Glu His Trp Tyr Glu Ala Arg Glu Ala Gly Ala Pro Val Pro Asn

50 55 60

His Asp Val Leu Leu Arg Ile Ile Ser Gly Ala Ser Ala Gly Ser Ile

65 70 75 80

Asn Gly Val Leu Ser Gly Ile Ala Leu Pro Tyr Arg Phe Pro His Val

85 90 95

His Ser Gly Pro Ala Pro Glu Gly Ala Thr Gly Asn Pro Phe Tyr Asp

100 105 110

Ala Trp Val Lys Arg Ile Asp Val Arg Glu Leu Leu Gly Asn Glu Asp

115 120 125

Leu Ala Asp Pro Thr Gln Pro Val Ala Ser Leu Leu Asp Ala Thr Cys

130 135 140

Leu Asp Thr Ile Ala Lys Asp Met Leu Gly Phe Ser Ala Ala Pro Ala

145 150 155 160

Thr Arg Pro Tyr Val Ala Asn Pro Leu Lys Cys Val Phe Thr Val Thr

165 170 175

Asn Leu Arg Gly Val Pro Tyr Val Val Gln Phe Lys Gly Asn Pro Glu

180 185 190

Ile Pro Gly His Gly Met Met Ala His Ala Asp Trp Leu Arg Phe Ala

195 200 205

Val Asp Thr Gly Gln Gly Asp Arg Asp Gly Glu Trp Met Phe Pro Asp

210 215 220

Glu Arg Leu Va1 Ser Gly Pro Ser His Ala Arg Thr Pro Ala Trp Gln

225 230 235 240

Gly Phe Met Glu Ala Ala Leu Ala Ser Ser Ala Phe Pro Ala Gly Leu

245 250 255

Arg Phe Arg Glu Val Ala Arg Pro Trp Ser Asp Tyr Asp Gln Arg Val

260 265 270

Val Val Val Pro Asn Gln Ala Gly Ala Ala Val Pro Val Pro Leu Pro

275 280 285

Pro Ala Trp Ala Glu Gly Glu Gly Ser Asp Gly Asp Tyr Arg Phe Val

290 295 300

Ala Val Asp Gly Gly Ala Met Asp Asn Glu Pro Phe Glu Leu Ala Arg

305 310 315 320

Thr Glu Leu Ala Gly Thr Leu Gly Arg Asn Pro Arg Glu Gly Asn Arg

325 330 335

Val Asn Arg Ile Val Ile Met Leu Asp Pro Phe Pro Glu Ala Glu Ala

340 345 350

Pro Gly Pro Ala Glu Ala Ala Ser Thr Asn Leu Val Glu Ala Met Ala

355 360 365

Ser Leu Phe Gly Ala Trp Lys Gln Gln Ala Arg Phe Lys Pro Glu Glu

370 375 380

Val Ala Leu Ala Leu Asp Ser Thr Val Tyr Ser Arg Phe Met Ile Ala

385 390 395 400

Pro Ser Arg Pro Cys Met Glu Gly Gly Pro Arg Trp Ile Gly Gly Arg

405 410 415

Ala Leu Ala Ala Gly Ala Leu Gly Gly Phe Ser Gly Phe Leu Ala Glu

420 425 430

Ala Tyr Arg His His Asp Phe Leu Leu Gly Arg Arg Asn Cys Gln Arg

435 440 445

Phe Leu Ala Glu Arg Leu Leu Ile Pro Ala Asp Asn Pro Ile Phe Ala

450 455 460

Gly Trp Ile Asp Asp Pro Ser Leu Gln Gly Tyr Ile Arg Glu Ile Asp

465 470 475 480

Gly Val Arg Tyr Ala Pro Val Ile Pro Leu Val Gly Gly Cys Gln Gly

485 490 495

Leu Arg Glu Pro Leu Pro Thr Trp Pro Arg Gly Ala Phe Asp Leu Asp

500 505 510

Ser Leu Met Pro Leu Val Glu Arg Arg Met Gln Arg Leu Tyr Ser Ala

515 520 525

Ala Thr Ala Thr Leu Gly Gly Arg Phe Ala Thr Trp Leu Ala Trp Arg

530 535 540

Phe Tyr Leu Arg Arg Lys Leu Leu Asp Leu Val Ser Ser Arg Ile Arg

545 550 555 560

Ser Ala Leu Arg Asp Phe Gly Leu Trp

565

<210>127

<211>1038

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>127

atgacaaccc aatttagaaa cttgatcttt gaaggtggtg gtgtaaaagg agttgcttac 60

attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga 120

ggttgcagtg ccggtgcgat taacgcgctg atttttgcgc tgggttacac ggttcgtgag 180

caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt 240

attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtgg cttctttaat 300

agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaggat 360

ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420

gcagaggttt tttctgccga aagacacccc gatatggagc tagcgacagc ggtgcgcatc 480

tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgatcgaca agatgtgtat 540

gtcgatggag gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt 600

gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaataa agaaaacgct 660

cgctttcagc ttgaacggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720

ttgcgactgg atagtcgaga ggagataggg ctttttcgtt atgacgaacc cctcaagggc 780

aaaccgatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgcg 840

caggaaaaca ttcatctaca tggcgatgat tggcagcgca cggtctatat cgacacactg 900

gatgtgagta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa 960

ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg 1020

aatagagtgg agtcatag 1038

<210>128

<211>345

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(8)...(195)

<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶

<400>128

Met Thr Thr Gln Phe Arg Ash Leu Ile Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val

20 25 30

Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile

50 55 60

Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val

65 70 75 80

Ile Arg Asp I1e Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly

85 90 95

Gly Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly

100 105 110

Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg

165 170 175

Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys

180 185 190

Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala

195 200 205

Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu

210 215 220

Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln

260 265 270

Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly

275 280 285

Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Ser Thr

290 295 300

Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln

305 310 315 320

Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu

325 330 335

Glu Lys Pro Val Asn Arg Val Glu Ser

340 345

<210>129

<211>1434

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>129

atgaaaaaga aaatatgtac attggctctt gtatcagcaa taacttctgg agttgtgacg 60

attccaacgg tagcatctgc ttgcagaata ggcgaagaag taatgaaaca ggagaaacag 120

gataatcaag agcacaaacg tgtgaaaaga tggtctgcgg agcatccgca tcattctaat 180

gaaagcacgc acttatggat tgctcgaaat gcgattcaaa ttatgagtcg taatcaagat 240

aacacggtcc aaaacaatga attacagttc ttaaatattc ctgaatataa ggagttattt 300

gaaagaggac tttatgatgc tgattacctt gatgaattta acgatggcgg tacaggtaca 360

atcggcattg atgggctaat taaaggaggg tggaaatctc atttttatga tccagatacg 420

aaaaagaatt ataaaggaga agaagctcca acagccctta cgcaaggaga taaatatttt 480

aaattagcag gagactattt taagaaagag gatttgaaac aagctttcta ctatttaggt 540

gttgcgactc actatttcac agatgctact cagccaatgc atgctgctaa ttttacagct 600

gtcgacatga gtgcgataaa gtttcatagc gcttttgaaa attatgtaac gacaattcag 660

acgccatttg aagtgaagga tgataaagga acctataatt tggttgattc taatgatccg 720

aagcagtgga tacatgaaac agcgaaactc gcaaaagcgg aaattatgaa tattactaat 780

gatactatta aatctcaata taataaaggg aacaatgatc tttggcaaca aggagttatg 840

ccagctgttc agagaagtct ggaaacagca caaaggaaca cggcaggatt tattcattta 900

tggtttaaaa catatgttgg caaaactgct gctgaagata ttgaaaatac acaagtaaaa 960

gattctaacg gagaagcaat acaagaaaat aaaaaatact acgttgtacc gagtgagttt 1020

ttaaatagag gtttgacctt tgaggtatat gctgcaaatg actacgcact attagctaat 1080

cacgtagatg ataataaagt tcatggtaca cctgttcagt ttgtttttga taaagacaat 1140

aacggaattc ttcatcgggg agaaagtgca ctgatgaaaa tgacgcaatc taactatgct 1200

gattatgtat ttctcaatta ctctaatatg acaaattggg tacatcttgc gaaacgaaaa 1260

acaaatactt cacagtttaa agtgtatcca aatccggata actcatctga atatttctta 1320

tatacagatg gatacccggt aaattatcaa gaaaatggta acggaaagag ctggattgtg 1380

ttaggaaaga aaacggataa accaaaagcg tggaaattta tacaggcgga ataa 1434

<210>130

<211>477

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>信号

<222>(1)...(27)

<220>

<221>结构域

<222>(1)...(307)

<223>锌依赖型磷脂酶C

<400>130

Met Lys Lys Lys Ile Cys Thr Leu Ala Leu Val Ser Ala Ile Thr Ser

1 5 10 15

Gly Val Val Thr Ile Pro Thr Val Ala Ser Ala Cys Arg Ile Gly Glu

20 25 30

Glu Val Met Lys Gln Glu Lys Gln Asp Asn Gln Glu His Lys Arg Val

35 40 45

Lys Arg Trp Ser Ala Glu His Pro His His Ser Asn Glu Ser Thr His

50 55 60

Leu Trp Ile Ala Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp

65 70 75 80

Asn Thr Val Gln Asn Asn Glu Leu Gln Phe Leu Asn Ile Pro Glu Tyr

85 90 95

Lys Glu Leu Phe Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu

100 105 110

Phe Asn Asp Gly Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys

115 120 125

Gly Gly Trp Lys Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr

130 135 140

Lys Gly Glu Glu Ala Pro Thr Ala Leu Thr Gln Gly Asp Lys Tyr Phe

145 150 155 160

Lys Leu Ala Gly Asp Tyr Phe Lys Lys Glu Asp Leu Lys Gln Ala Phe

165 170 175

Tyr Tyr Leu Gly Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro

180 185 190

Met His Ala Ala Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe

195 200 205

His Ser Ala Phe Glu Asn Tyr Val Thr Thr Ile Gln Thr Pro Phe Glu

210 215 220

Val Lys Asp Asp Lys Gly Thr Tyr Asn Leu Val Asp Ser Asn Asp Pro

225 230 235 240

Lys Gln Trp Ile His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met

245 250 255

Asn Ile Thr Asn Asp Thr Ile Lys Ser Gln Tyr Asn Lys Gly Asn Asn

260 265 270

Asp Leu Trp Gln Gln Gly Val Met Pro Ala Val Gln Arg Ser Leu Glu

275 280 285

Thr Ala Gln Arg Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr

290 295 300

Tyr Val Gly Lys Thr Ala Ala Glu Asp Ile Glu Asn Thr Gln Val Lys

305 310 315 320

Asp Ser Asn Gly Glu Ala Ile Gln Glu Asn Lys Lys Tyr Tyr Val Val

325 330 335

Pro Ser Glu Phe Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ala

340 345 350

Asn Asp Tyr Ala Leu Leu Ala Asn His Val Asp Asp Asn Lys Val His

355 360 365

Gly Thr Pro Val Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu

370 375 380

His Arg Gly Glu Ser Ala Leu Met Lys Met Thr Gln Ser Asn Tyr Ala

385 390 395 400

Asp Tyr Val Phe Leu Asn Tyr Ser Asn Met Thr Asn Trp Val His Leu

405 410 415

Ala Lys Arg Lys Thr Asn Thr Ser Gln Phe Lys Val Tyr Pro Asn Pro

420 425 430

Asp Asn Ser Ser Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn

435 440 445

Tyr Gln Glu Asn Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys

450 455 460

Thr Asp Lys Pro Lys Ala Trp Lys Phe Ile Gln Ala Glu

465 470 475

<210>131

<211>927

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>131

atgccgagcc caaaaagtaa tattgatgtt atcagcatcg atggtggtgg aatacgtgga 60

gtattctccg ttacattatt ggatagatta tgtaagacct atcccaatct tcttaagaaa 120

acatatctgt ttgctggaac atctacaggt gggatcattg ccttaggatt agcaaacaac 180

atgacacctc ttgagataag agccttgtac gagaagaacg gttcaaagat atttcataaa 240

tctgtgtggg aaggcgttaa agatttaggt ggaaccatag gtgcaaagta tagtaacaag 300

aatcttaaat ccgttttgaa aaaatacttt ggttcattga agttaaaaga tttatctaaa 360

aaagtactaa tacctacttt tgatttacac tcagacaaag aagaaggcta tccaatgtgg 420

aagcctaagt tctatcacaa ctttgatgga gaaacggaag atatagaaaa gctcgttctt 480

gatgtagcta tgatgacatc agcagcgccc actttcttcc ctacatacaa cgggcatatt 540

gatggcggtg ttgtagccaa caatccatcg atggccgcat tagcccagat tatggatgaa 600

agatatggca tcaatgcctc tgaagttcat attcttaata taggaacagg ttttaaccct 660

gcttatgtta agatgaatcc aggggaagag aaagactggg gtgaacttca gtggataaaa 720

cctttaatca atcttctagt cgatggctct atggatgttt ctacttatta ttgtaagcaa 780

gtcttacgtg ataattttta tagggttaac atgaaattac ctaagaacgt agaaatggat 840

gatcctaatt ctattcctta tttaattgaa cttgcaaact cagttgatct aactgaatgt 900

atcaactggc ttaattcgag gtggtaa 927

<210>132

<211>308

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(11)...(194)

<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶

<400>132

Met Pro Ser Pro Lys Ser Asn Ile Asp Val Ile Ser Ile Asp Gly Gly

1 5 10 15

Gly Ile Arg Gly Val Phe Ser Val Thr Leu Leu Asp Arg Leu Cys Lys

20 25 30

Thr Tyr Pro Asn Leu Leu Lys Lys Thr Tyr Leu Phe Ala Gly Thr Ser

35 40 45

Thr Gly Gly Ile Ile Ala Leu Gly Leu Ala Asn Asn Met Thr Pro Leu

50 55 60

Glu Ile Arg Ala Leu Tyr Glu Lys Asn Gly Ser Lys Ile Phe His Lys

65 70 75 80

Ser Val Trp Glu Gly Val Lys Asp Leu Gly Gly Thr Ile Gly Ala Lys

85 90 95

Tyr Ser Asn Lys Asn Leu Lys Ser Val Leu Lys Lys Tyr Phe Gly Ser

100 105 110

Leu Lys Leu Lys Asp Leu Ser Lys Lys Val Leu Ile Pro Thr Phe Asp

115 120 125

Leu His Ser Asp Lys Glu Glu Gly Tyr Pro Met Trp Lys Pro Lys Phe

130 135 140

Tyr His Asn Phe Asp Gly Glu Thr Glu Asp Ile Glu Lys Leu Val Leu

145 150 155 160

Asp Val Ala Met Met Thr Ser Ala Ala Pro Thr Phe Phe Pro Thr Tyr

165 170 175

Asn Gly His Ile Asp Gly Gly Val Val Ala Asn Asn Pro Ser Met Ala

180 185 190

Ala Leu Ala Gln Ile Met Asp Glu Arg Tyr Gly Ile Asn Ala Ser Glu

195 200 205

Val His Ile Leu Asn Ile Gly Thr Gly Phe Asn Pro Ala Tyr Val Lys

210 215 220

Met Asn Pro Gly Glu Glu Lys Asp Trp Gly Glu Leu Gln Trp Ile Lys

225 230 235 240

Pro Leu IIe Asn Leu Leu Val Asp Gly Ser Met Asp Val Ser Thr Tyr

245 250 255

Tyr Cys Lys Gln Val Leu Arg Asp Asn Phe Tyr Arg Val Asn Met Lys

260 265 270

Leu Pro Lys Asn Val Glu Met Asp Asp Pro Asn Ser Ile Pro Tyr Leu

275 280 285

Ile Glu Leu Ala Asn Ser Val Asp Leu Thr Glu Cys Ile Asn Trp Leu

290 295 300

Asn Ser Arg Trp

305

<210>133

<211>1053

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>133

atgactacac agtttcgcaa tctcgttttc gaaggaggcg gcgtcagggg tatagcctat 60

gtgggggcaa tgcaggttct tgagcaacgg ggaatgctca ggaacataga ccgtgcaggc 120

ggcacgagcg ccggtgcgat taacgcactc atcttttcac tcggctatga cataaggtct 180

cagctcgaaa tactccattc taccgacttt agaaatttta tggatagttc cttcgggata 240

atcagggata tccgccgtct tgcacgggat ttcggatggt acaagggtga tttcttcaca 300

ggctggattg gcaagcttat aaaagacagg ctcggtagcg agaaagcaac tttccgtgac 360

cttgcagaat cagattgtcc cgatctgtat gtgatcggca ccaacctctc aaccggcttc 420

gccgaggtat tctcagccga gagacatccc gatatgcctc ttgcaacggc tgtccgtatc 480

agcatgtcga tccctctatt ttttgctgca atgcgttatg gtccgaggga agacgtattt 540

gtagacggtg gggtagtact caactatcct gtaaagctgt ttgacaggtt gaaatacatt 600

gaaagcgggg agacggagga agccgcacgc tataccgaat attataacag ggagaacgca 660

cggttccttc tcaaaagtcc cgaccgcagt ccctatgttt ataaccgtca gacactgggt 720

ttgcgtctcg atacgcgtga ggagattgca catttccgtt atgacgagcc cctggagggt 780

aaaaaaatca tacgctttac ggattatgca cgggcactcg tttcaacctt gcttcaggtt 840

caggaaaacc agcatctgca cagtgacgac tggcagcgta cagtttacat tgacacactg 900

gatgtgaaga cgactgattt tgatatcacg gataagcaga aggacatcct gataaagcag 960

ggaattaacg gagcggagaa ctatttgggt tggtttgaag acccgtatga aaaacccgcc 1020

aaccgcctgc ccggtggcag caagtctgac tga 1053

<210>134

<211>350

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(8)...(195)

<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶

<400>134

Met Thr Thr Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Arg

1 5 10 15

Gly Ile Ala Tyr Val Gly Ala Met Gln Val Leu Glu Gln Arg Gly Met

20 25 30

Leu Arg Asn Ile Asp Arg Ala Gly Gly Thr Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ser Leu Gly Tyr Asp Ile Arg Ser Gln Leu Glu Ile

50 55 60

Leu His Ser Thr Asp Phe Arg Asn Phe Met Asp Ser Ser Phe Gly Ile

65 70 75 80

Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Tyr Lys Gly

85 90 95

Asp Phe Phe Thr Gly Trp Ile Gly Lys Leu Ile Lys Asp Arg Leu Gly

100 105 110

Ser Glu Lys Ala Thr Phe Arg Asp Leu Ala Glu Ser Asp Cys Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Pro Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Met Arg Tyr Gly Pro Arg

165 170 175

Glu Asp Val Phe Val Asp Gly Gly Val Val Leu Asn Tyr Pro Val Lys

180 185 190

Leu Phe Asp Arg Leu Lys Tyr Ile Glu Ser Gly Glu Thr Glu Glu Ala

195 200 205

Ala Arg Tyr Thr Glu Tyr Tyr Asn Arg Glu Asn Ala Arg Phe Leu Leu

210 215 220

Lys Ser Pro Asp Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Thr Arg Glu Glu Ile Ala His Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Glu Gly Lys Lys Ile Ile Arg Phe Thr Asp Tyr Ala Arg Ala

260 265 270

Leu Val Ser Thr Leu Leu Gln Val Gln Glu Asn Gln His Leu His Ser

275 280 285

Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Lys Thr

290 295 300

Thr Asp Phe Asp Ile Thr Asp Lys Gln Lys Asp Ile Leu Ile Lys Gln

305 310 315 320

Gly Ile Asn Gly Ala Glu Asn Tyr Leu Gly Trp Phe Glu Asp Pro Tyr

325 330 335

Glu Lys Pro Ala Asn Arg Leu Pro Gly Gly Ser Lys Ser Asp

340 345 350

<210>135

<211>1710

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>135

atggctgaca acgagttacc cctggcccgc cccagggaaa cccctccgtg ccgtcccggc 60

acgttcgagc tggggctggc gctcgccggc gcggtatcgg gcggcgccta cgccgcgggc 120

gtgctggatt tcttctacga ggcgctggag cactggtacg acgcgaaggc gaacggtgcg 180

cccgtgccga gccacgacgt gctgctacgg atcatttcag gcgcctccgc gggcagcatc 240

aacggcgtgc tttccggcat cgcgttgccg taccgcttcc cgcacgtgca cagcggaccc 300

gcgccccggc aggcgacggg aaaccccttc tacgacgcgt gggtgaggcg catcgatgta 360

cgcgagctgc tgggcgaggc cgacctggct aacccggcgc ggccgatcac ctcgctgctt 420

gattccagca gcctggatac gatcgcgaag gacatgctcg gctacgccgg cgtgccggcc 480

gcgcgccctt acatcgcgaa cccgctgaaa tgcgtgttca ccgtgacgaa tcttcgcggc 540

gtgccctacg tggtgcagtt caagggcaac cccgagattc ccggccacgg catgatggcg 600

cacgccgatt ggctgcgctt cgccatcgac tcggggcagg gcgaacgcga tggcgcatgg 660

atgttccccg acgagcgcat cgtcagcggc ccgagccatg cgcgcagccc ggcctggcat 720

gcgctcatgg aggcggccct ggcgtcgtcc gcgttcccgg ccggcctgcg cttccgcgag 780

gtggcccggc cgtggagcga ttacgaccag cgcgtggttg tcgtgcccgg tcaggatggc 840

atggcggtgc cggtaccgct gccaccagcg tggggcgaag gggagggtgg gaagggcgac 900

taccgctttg tcgccgtgga tggtggcgcc atggataacg aaccgttcga gctggcccgc 960

acggagcttg cgggcacgat gggccgcaac ccgcgtgaag gtacccgggt gaatcgtatc 1020

gtgattatgc tcgatccgtt tccggaggcc gaggcgcccg gcccctcgga ggcggcgtcg 1080

acgaacctgg tggaagcgat ggcgtcgctg ttcggtgcat ggaagcagca ggcgcggttc 1140

aagcccgagg aagtggcgct ggccctcgat agcacggtgt acagccgctt catgatcgcg 1200

cctagccgcc cctgcacgga tggcggcccg cggtggatcg gcggccgcgc gctcaccgcg 1260

ggcgcactgg gtggcttctc ggggttcctg gccgaggatt accgccacca cgatttcctc 1320

ctgggccggc gtaactgcca gcggtttctc gccgagcggc tgctcgttcc cgcaacgaac 1380

ccgatcttcg ctggatggat cgacgatccc gcactgcagg gctacgtgcg tgagatcgat 1440

ggtgagcgct ttgcccccgt gattccccta gtgggcggct gccaggccct gcaagagccc 1500

ttgccggcgt ggccgcgtgg ggcgttcgac atggatgcgc tcatgcccct ggtcgagaag 1560

cgcatgcagg ccctgtacac ggcggccacc acgaagctgg gtggccgctt cgccatgtgg 1620

ctcgcgtggc gcttcttcat ccgccgcaaa ctcctcgaca tcgtctcaag ccgtatccgc 1680

aatgcgctga aagacttcgg cctttggtga 1710

<210>136

<211>569

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>136

Met Ala Asp Asn Glu Leu Pro Leu Ala Arg Pro Arg Glu Thr Pro Pro

1 5 10 15

Cys Arg Pro Gly Thr Phe Glu Leu Gly Leu Ala Leu Ala Gly Ala Val

20 25 30

Ser Gly Gly Ala Tyr Ala Ala Gly Val Leu Asp Phe Phe Tyr Glu Ala

35 40 45

Leu Glu His Trp Tyr Asp Ala Lys Ala Asn Gly Ala Pro Val Pro Ser

50 55 60

His Asp Val Leu Leu Arg Ile Ile Ser Gly Ala Ser Ala Gly Ser Ile

65 70 75 80

Asn Gly Val Leu Ser Gly Ile Ala Leu Pro Tyr Arg Phe Pro His Val

85 90 95

His Ser Gly Pro Ala Pro Arg Gln Ala Thr Gly Asn Pro Phe Tyr Asp

100 105 110

Ala Trp Val Arg Arg Ile Asp Val Arg Glu Leu Leu Gly Glu Ala Asp

115 120 125

Leu Ala Asn Pro Ala Arg Pro Ile Thr Ser Leu Leu Asp Ser Ser Ser

130 135 140

Leu Asp Thr Ile Ala Lys Asp Met Leu Gly Tyr Ala Gly Val Pro Ala

145 150 155 160

Ala Arg Pro Tyr Ile Ala Asn Pro Leu Lys Cys Val Phe Thr Val Thr

165 170 175

Asn Leu Arg Gly Val Pro Tyr Val Val Gln Phe Lys Gly Asn Pro Glu

180 185 190

Ile Pro Gly His Gly Met Met Ala His Ala Asp Trp Leu Arg Phe Ala

195 200 205

Ile Asp Ser Gly Gln Gly Glu Arg Asp Gly Ala Trp Met Phe Pro Asp

210 215 220

Glu Arg Ile Val Ser Gly Pro Ser His Ala Arg Ser Pro Ala Trp His

225 230 235 240

Ala Leu Met Glu Ala Ala Leu Ala Ser Ser Ala Phe Pro Ala Gly Leu

245 250 255

Arg Phe Arg Glu Val Ala Arg Pro Trp Ser Asp Tyr Asp Gln Arg Val

260 265 270

Val Val Val Pro Gly Gln Asp Gly Met Ala Val Pro Val Pro Leu Pro

275 280 285

Pro Ala Trp Gly Glu Gly Glu Gly Gly Lys Gly Asp Tyr Arg Phe Val

290 295 300

Ala Val Asp Gly Gly Ala Met Asp Asn Glu Pro Phe Glu Leu Ala Arg

305 310 315 320

Thr Glu Leu Ala Gly Thr Met Gly Arg Asn Pro Arg Glu Gly Thr Arg

325 330 335

Val Asn Arg Ile Val Ile Met Leu Asp Pro Phe Pro Glu Ala Glu Ala

340 345 350

Pro Gly Pro Ser Glu Ala Ala Ser Thr Asn Leu Val Glu Ala Met Ala

355 360 365

Ser Leu Phe Gly Ala Trp Lys Gln Gln Ala Arg Phe Lys Pro Glu Glu

370 375 380

Val Ala Leu Ala Leu Asp Ser Thr Val Tyr Ser Arg Phe Met Ile Ala

385 390 395 400

Pro Ser Arg Pro Cys Thr Asp Gly Gly Pro Arg Trp Ile Gly Gly Arg

405 410 415

Ala Leu Thr Ala Gly Ala Leu Gly Gly Phe Ser Gly Phe Leu Ala Glu

420 425 430

Asp Tyr Arg His His Asp Phe Leu Leu Gly Arg Arg Asn Cys Gln Arg

435 440 445

Phe Leu Ala Glu Arg Leu Leu Val Pro Ala Thr Asn Pro Ile Phe Ala

450 455 460

Gly Trp Ile Asp Asp Pro Ala Leu Gln Gly Tyr Val Arg Glu Ile Asp

465 470 475 480

Gly Glu Arg Phe Ala Pro Val Ile Pro Leu Val Gly Gly Cys Gln Ala

485 490 495

Leu Gln Glu Pro Leu Pro Ala Trp Pro Arg Gly Ala Phe Asp Met Asp

500 505 510

Ala Leu Met Pro Leu Val Glu Lys Arg Met Gln Ala Leu Tyr Thr Ala

515 520 525

Ala Thr Thr Lys Leu Gly Gly Arg Phe Ala Met Trp Leu Ala Trp Arg

530 535 540

Phe Phe Ile Arg Arg Lys Leu Leu Asp Ile Val Ser Ser Arg Ile Arg

545 550 555 560

Asn Ala Leu Lys Asp Phe Gly Leu Trp

565

<210>137

<211>1038

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>137

atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60

attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga 120

gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa 180

caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt 240

attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt 300

agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360

ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420

gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480

tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat 540

gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt 600

gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct 660

cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720

ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780

aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840

caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg 900

gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa 960

ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg 1020

aatagagtgg agtcatag 1038

<210>138

<211>345

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(8)...(195)

<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶

<400>138

Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys

1 5 10 15

Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val

20 25 30

Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn

35 40 45

Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile

50 55 60

Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val

65 70 75 80

Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly

85 90 95

Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly

100 105 110

Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp

115 120 125

Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe

130 135 140

Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile

145 150 155 160

Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg

165 170 175

Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys

180 185 190

Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala

195 200 205

Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu

210 215 220

Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly

225 230 235 240

Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu

245 250 255

Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln

260 265 270

Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly

275 280 285

Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr

290 295 300

Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln

305 310 315 320

Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu

325 330 335

Glu Lys Pro Val Asn Arg Val Glu Ser

340 345

<210>139

<211>1692

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>139

atgaaaataa agccgctcac gttttctttt ggattagcag tcactagctc ggtgcaagcc 60

ttcactcaat ttggcggaca aggcgttatg ccgatgggtc acgaatggtt aacgcgcacc 120

gctgctctcg aggtacttaa tgcagagcat atcatcgaag cggatccgaa tgacccaaga 180

tatacttggc aggacggact tgctaaaaac cttgaactta ataccgccca atctgaaatc 240

acgcgcttac aatctcattt aaataataac ccgctctatg agccgagata cgacggtata 300

aactcagcca tcgttggtga acgctgggtc gatattgcag ggtttaacgt cacaacagcc 360

agcgcagacc cgactggccc taattgcttt agcgcagttt cacaagagcc cgcagatatt 420

cagcaagacc actttatgcg ccgctatgat gatattggag gtcaaggtgg agttgatgct 480

gcttatcgcg cacagcaacg atttgtgcaa cactttgtgg atgcggccat ggccgaaaaa 540

aaacgactaa aagtatggga cggtggtggc cattctgcgt tagcagaggt agatcataat 600

tactttttat ttggtcgtgc ggttcaccta tttcaagact catttagtcc agaacacacg 660

gtacggctcc ctcaagataa ctacgaaaaa gtttggcagg ttaaggcata tctttgctca 720

gagggggctg agcaacattc acacgatacc aaagacgtgc tcaactttgc cagtggcgat 780

gttatttggc aacctcaaac ccgactagaa gcaggctggc aatcttacca gatcagcagt 840

atgaagcccg ttgctattgt ggcccttgaa gccagtaaag atctttgggc tgcgtttatt 900

cgcaccatgg cgaccccaaa agcacagaga cgtaacgtgg caacgcaaga agcccaacaa 960

cttgtacaaa actggttgtc ttttgatgag gcccagatgc tgacttggta tcaagatgag 1020

aataagcgtg accatactta tgtgcttgcc cccaatgaaa cgggaaaagg aaaatctctg 1080

gaagcctgta tgacagagct aaaggtaggc actagcagtc aagcagaacg ggttgcgcaa 1140

ctggaagccg agcgtaatca atgcctatac aacattgagg cggaacctgg ctttgcagac 1200

ttaaacgatc cacacctcga tattccatat aactggcgct ggaagtctct gacttggcaa 1260

acgcctccta gtggctggac atacccacaa ctaaatgcag ataccggcga gcaagtcgcc 1320

attaaatcgc cgataaataa tcagtattta tctgcacaaa ctctaagtaa cgacaccccg 1380

atcactctga gtcaagcaca tccaatttcc ttgatccaag tgacgaatgc acagggccag 1440

cactatttta ggagcgctca agccccttca ctatttctgg gttatagcaa caaaattgca 1500

ggctacctca agcttgtaga ttcacccaag caagccctat atacgttgat ttatcaaggt 1560

ggtctttgga atatccaaaa tgaattttgg caacagtata tctggttaaa tcaagacaaa 1620

gagcggccgg aattaaatcg ccatggtgag cctagccaat taaacgctca gtggatggtc 1680

gaacacttat aa 1692

<210>140

<211>563

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(20)

<223>从环境样品中获得

<400>140

Met Lys Ile Lys Pro Leu Thr Phe Ser Phe Gly Leu Ala Val Thr Ser

1 5 10 15

Ser Val Gln Ala Phe Thr Gln Phe Gly Gly Gln Gly Val Met Pro Met

20 25 30

Gly His Glu Trp Leu Thr Arg Thr Ala Ala Leu Glu Val Leu Asn Ala

35 40 45

Glu His Ile Ile Glu Ala Asp Pro Asn Asp Pro Arg Tyr Thr Trp Gln

50 55 60

Asp Gly Leu Ala Lys Asn Leu Glu Leu Asn Thr Ala Gln Ser Glu Ile

65 70 75 80

Thr Arg Leu Gln Ser His Leu Asn Asn Asn Pro Leu Tyr Glu Pro Arg

85 90 95

Tyr Asp Gly Ile Asn Ser Ala Ile Val Gly Glu Arg Trp Val Asp Ile

100 105 110

Ala Gly Phe Asn Val Thr Thr Ala Ser Ala Asp Pro Thr Gly Pro Asn

115 120 125

Cys Phe Ser Ala Val Ser Gln Glu Pro Ala Asp Ile Gln Gln Asp His

130 135 140

Phe Met Arg Arg Tyr Asp Asp Ile Gly Gly Gln Gly Gly Val Asp Ala

145 150 155 160

Ala Tyr Arg Ala Gln Gln Arg Phe Val Gln His Phe Val Asp Ala Ala

165 170 175

Met Ala Glu Lys Lys Arg Leu Lys Val Trp Asp Gly Gly Gly His Ser

180 185 190

Ala Leu Ala Glu Val Asp His Asn Tyr Phe Leu Phe Gly Arg Ala Val

195 200 205

His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu Pro

210 215 220

Gln Asp Asn Tyr Glu Lys Val Trp Gln Val Lys Ala Tyr Leu Cys Ser

225 230 235 240

Glu Gly Ala Glu Gln His Ser His Asp Thr Lys Asp Val Leu Asn Phe

245 250 255

Ala Ser Gly Asp Val Ile Trp Gln Pro Gln Thr Arg Leu Glu Ala Gly

260 265 270

Trp Gln Ser Tyr Gln Ile Ser Ser Met Lys Pro Val Ala Ile Val Ala

275 280 285

Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met Ala

290 295 300

Thr Pro Lys Ala Gln Arg Arg Asn Val Ala Thr Gln Glu Ala Gln Gln

305 310 315 320

Leu Val Gln Asn Trp Leu Ser Phe Asp Glu Ala Gln Met Leu Thr Trp

325 330 335

Tyr Gln Asp Glu Asn Lys Arg Asp His Thr Tyr Val Leu Ala Pro Asn

340 345 350

Glu Thr Gly Lys Gly Lys Ser Leu Glu Ala Cys Met Thr Glu Leu Lys

355 360 365

Val Gly Thr Ser Ser Gln Ala Glu Arg Val Ala Gln Leu Glu Ala Glu

370 375 380

Arg Asn Gln Cys Leu Tyr Asn Ile Glu Ala Glu Pro Gly Phe Ala Asp

385 390 395 400

Leu Asn Asp Pro His Leu Asp Ile Pro Tyr Asn Trp Arg Trp Lys Ser

405 410 415

Leu Thr Trp Gln Thr Pro Pro Ser Gly Trp Thr Tyr Pro Gln Leu Asn

420 425 430

Ala Asp Thr Gly Glu Gln Val Ala Ile Lys Ser Pro Ile Asn Asn Gln

435 440 445

Tyr Leu Ser Ala Gln Thr Leu Ser Asn Asp Thr Pro Ile Thr Leu Ser

450 455 460

Gln Ala His Pro Ile Ser Leu Ile Gln Val Thr Asn Ala Gln Gly Gln

465 470 475 480

His Tyr Phe Arg Ser Ala Gln Ala Pro Ser Leu Phe Leu Gly Tyr Ser

485 490 495

Asn Lys Ile Ala Gly Tyr Leu Lys Leu Val Asp Ser Pro Lys Gln Ala

500 505 510

Leu Tyr Thr Leu Ile Tyr Gln Gly Gly Leu Trp Asn Ile Gln Asn Glu

515 520 525

Phe Trp Gln Gln Tyr Ile Trp Leu Asn Gln Asp Lys Glu Arg Pro Glu

530 535 540

Leu Asn Arg His Gly Glu Pro Ser Gln Leu Asn Ala Gln Trp Met Val

545 550 555 560

Glu His Leu

<210>141

<211>471

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>141

atgcaaaaaa aaaccagtac atgtgaagac gagggeccgt accgggcagt cttgtttgat 60

ttggacggca ccctgttgga tacggagcgg attggggcgg cctcctggga ccatgcggga 120

gacgaattgg gtctgcgggt gccggaggcg gtaaagcggc agatggtggg tcggacgctg 180

ccggatattc atgcaattgt acgggaaggc atgccggacg tggacgcgga tcgtctgctg 240

gagcgggcca atcatcatta tcaccgtttg gtgaccgaag tgccaccgcc ggtgaaggcc 300

ggggcgcggg aactgctgga atggctgaag ggtgctgggg tgcccatggc ggtggcgact 360

tccagccgcc gggttcaggc cgaagacaaa ttaagccgta ccggcctgcg gcattttttt 420

gatgtgattg tggccggcga tgaaatcgcg cggggcaagc cggatccaaa g 471

<210>142

<211>157

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(14)...(157)

<223>haloacid dehalogenase-like hydrolase

<400>142

Met Gln Lys Lys Thr Ser Thr Cys Glu Asp Glu Gly Pro Tyr Arg Ala

1 5 10 15

Val Leu Phe Asp Leu Asp Gly Thr Leu Leu Asp Thr Glu Arg Ile Gly

20 25 30

Ala Ala Ser Trp Asp His Ala Gly Asp Glu Leu Gly Leu Arg Val Pro

35 40 45

Glu Ala Val Lys Arg Gln Met Val Gly Arg Thr Leu Pro Asp Ile His

50 55 60

Ala Ile Val Arg Glu Gly Met Pro Asp Val Asp Ala Asp Arg Leu Leu

65 70 75 80

Glu Arg Ala Asn His His Tyr His Arg Leu Val Thr Glu Val Pro Pro

85 90 95

Pro Val Lys Ala Gly Ala Arg Glu Leu Leu Glu Trp Leu Lys Gly Ala

100 105 110

Gly Val Pro Met Ala Val Ala Thr Ser Ser Arg Arg Val Gln Ala Glu

115 120 125

Asp Lys Leu Ser Arg Thr Gly Leu Arg His Phe Phe Asp Val Ile Val

130 135 140

Ala Gly Asp Glu Ile Ala Arg Gly Lys Pro Asp Pro Lys

145 150 155

<210>143

<211>603

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>143

atgaataaca agagcttcat cacaatccat ggcattcgta agtttggctc ttctcccact 60

cacatgcgcc ctataaacga atcactcctc tctagtaatc tgaggacaat cccagtcaat 120

tatggctaca ccctgctccc aatcacgaac agaaagagtg tttctagggc aattcctgtg 180

ctagaaaacg agctaaagcg agggagggac atcaccctta tcgggtattc taacggcgct 240

tggacagctc tacagcttgc ggaaatggct tatccaatcc aacgtctagt gctcatctct 300

cctgctcttc actctgctca cgccttccct caaatccctt ctcttgagcg tgtagacgtg 360

ttctattgcc ctacagataa tgttggtgat cttgccaaga cttggagggg agttactaga 420

atcatgcctt ggagatggtt ctctccacac ccttacggaa gaatgatgaa aactggattt 480

attggagagg atgaacgtgt ctttaaccac aggcttggcg atcatgtagg ccatgctttc 540

tacaaccatg ctgatgctgt ttcacacatt atagaggtga ttaaatatga aactccttat 600

tag 603

<210>144

<211>200

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>144

Met Asn Asn Lys Ser Phe Ile Thr Ile His Gly Ile Arg Lys Phe Gly

1 5 10 15

Ser Ser Pro Thr His Met Arg Pro Ile Asn Glu Ser Leu Leu Ser Ser

20 25 30

Asn Leu Arg Thr Ile Pro Val Asn Tyr Gly Tyr Thr Leu Leu Pro Ile

35 40 45

Thr Asn Arg Lys Ser Val Ser Arg Ala Ile Pro Val Leu Glu Asn Glu

50 55 60

Leu Lys Arg Gly Arg Asp Ile Thr Leu Ile Gly Tyr Ser Asn Gly Ala

65 70 75 80

Trp Thr Ala Leu Gln Leu Ala Glu Met Ala Tyr Pro Ile Gln Arg Leu

85 90 95

Val Leu Ile Ser Pro Ala Leu His Ser Ala His Ala Phe Pro Gln Ile

100 105 110

Pro Ser Leu Glu Arg Val Asp Val Phe Tyr Cys Pro Thr Asp Asn Val

115 120 125

Gly Asp Leu Ala Lys Thr Trp Arg Gly Val Thr Arg Ile Met Pro Trp

130 135 140

Arg Trp Phe Ser Pro His Pro Tyr Gly Arg Met Met Lys Thr Gly Phe

145 150 155 160

Ile Gly Glu Asp Glu Arg Val Phe Asn His Arg Leu Gly Asp His Val

165 170 175

Gly His Ala Phe Tyr Asn His Ala Asp Ala Val Ser His Ile Ile Glu

180 185 190

Val Ile Lys Tyr Glu Thr Pro Tyr

195 200

<210>145

<211>1197

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>145

atgaacgcaa cctccgcaac gatcgccgcc accgacaccc agcagcgcgg tggcttcgcc 60

ggcaccgatc cgcaaccggt cgatcgggtg ctggccgcac tgatccagga caactacgac 120

cgcgtcgacc agcgtcgcgg cgacccgccg atcgaccgcc cgctgccgca gggctgggcg 180

cgcatgggcg acgacgaagt gcgcgccgcg ggcatcgatc ctgcgatgca gcacgatgcc 240

aagagcggct tcgacgcctc gttctaccgc gacgaccagg gccgggtggc cctggtctat 300

gccggcagcg acgagggcca ggactggaag cacaacttcg gccagggcct gggtttccag 360

gacgcgcagt acgaccaggc gatcgcgctg gcgcgcgagg cgaaatcggc cttcggcgac 420

cagctcgtgc tgtcgggcca gtcgctcggc ggcggcctgg ccgcggcagc gtccatggtc 480

aacgaggtgc ccgcggtgac cttcaacgcc gccggcgtgc acgaccacac ggtcgagcgc 540

tacggcctgg acgcggacgc ggtcaagcgc caggcggacc agggcctggt ccggcactac 600

gtggtcgaga acgacatcct gacccacctg caggagaacg cgttcccgct caatgcggcg 660

atgccggatg cgcccggcgc gcgcatcgac ctgcccgatc cggatccgct gaccacgttc 720

gagaagctgc tgccctggaa gacctggccg caccgcgtgc ataaccacta catcgaggcg 780

gtgatcgagt ccatggacaa ggccggctac acgctcgaag gcgcggcggc gacgcgggat 840

gcgtcgcagg acaccgccaa ccggctgctc gacgattcgg tgcgcgggct cgcgccgcag 900

cgcgaacgcc tcgggctgca ggacgacgac cgcttcttca acgcggccgc cggcatggcc 960

gcctcggccg gacgcgatgg cctgcgcagc atccagcacg tggtcgccac gcccgacggc 1020

cacggcgtgt tcgcggtcga aggcgacctg cgcgacgccg gccaccgccg cagcctggtc 1080

gacgtggaac gcggcgccgc gacgccggtc gaggacagcg tggccagcct gcgcgagcac 1140

gcctcgcgtt ccccggagca ggagccgcag cgggagcgcc acctggcgat ggcctga 1197

<210>146

<211>398

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>146

Met Asn Ala Thr Ser Ala Thr Ile Ala Ala Thr Asp Thr Gln Gln Arg

1 5 10 15

Gly Gly Phe Ala Gly Thr Asp Pro Gln Pro Val Asp Arg Val Leu Ala

20 25 30

Ala Leu Ile Gln Asp Asn Tyr Asp Arg Val Asp Gln Arg Arg Gly Asp

35 40 45

Pro Pro Ile Asp Arg Pro Leu Pro Gln Gly Trp Ala Arg Met Gly Asp

50 55 60

Asp Glu Val Arg Ala Ala Gly Ile Asp Pro Ala Met Gln His Asp Ala

65 70 75 80

Lys Ser Gly Phe Asp Ala Ser Phe Tyr Arg Asp Asp Gln Gly Arg Val

85 90 95

Ala Leu Val Tyr Ala Gly Ser Asp Glu Gly Gln Asp Trp Lys His Asn

100 105 110

Phe Gly Gln Gly Leu Gly Phe Gln Asp Ala Gln Tyr Asp Gln Ala Ile

115 120 125

Ala Leu Ala Arg Glu Ala Lys Ser Ala Phe Gly Asp Gln Leu Val Leu

130 135 140

Ser Gly Gln Ser Leu Gly Gly Gly Leu Ala Ala Ala Ala Ser Met Val

145 150 155 160

Asn Glu Val Pro Ala Val Thr Phe Asn Ala Ala Gly Val His Asp His

165 170 175

Thr Val Glu Arg Tyr Gly Leu Asp Ala Asp Ala Val Lys Arg Gln Ala

180 185 190

Asp Gln Gly Leu Val Arg His Tyr Val Val Glu Asn Asp Ile Leu Thr

195 200 205

His Leu Gln Glu Asn Ala Phe Pro Leu Asn Ala Ala Met Pro Asp Ala

210 215 220

Pro Gly Ala Arg Ile Asp Leu Pro Asp Pro Asp Pro Leu Thr Thr Phe

225 230 235 240

Glu Lys Leu Leu Pro Trp Lys Thr Trp Pro His Arg Val His Asn His

245 250 255

Tyr Ile Glu Ala Val Ile Glu Ser Met Asp Lys Ala Gly Tyr Thr Leu

260 265 270

Glu Gly Ala Ala Ala Thr Arg Asp Ala Ser Gln Asp Thr Ala Asn Arg

275 280 285

Leu Leu Asp Asp Ser Val Arg Gly Leu Ala Pro Gln Arg Glu Arg Leu

290 295 300

Gly Leu Gln Asp Asp Asp Arg Phe Phe Asn Ala Ala Ala Gly Met Ala

305 310 315 320

Ala Ser Ala Gly Arg Asp Gly Leu Arg Ser Ile Gln His Val Val Ala

325 330 335

Thr Pro Asp Gly His Gly Val Phe Ala Val Glu Gly Asp Leu Arg Asp

340 345 350

Ala Gly His Arg Arg Ser Leu Val Asp Val Glu Arg Gly Ala Ala Thr

355 360 365

Pro Val Glu Asp Ser Val Ala Ser Leu Arg Glu His Ala Ser Arg Ser

370 375 380

Pro Glu Gln Glu Pro Gln Arg Glu Arg His Leu Ala Met Ala

385 390 395

<210>147

<211>1104

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>147

atgcaagtca gtggtgcaat ggaagcaata aatcctgcgc agatgaatgc agcggaagtc 60

acttcatcgc aggtatctga ccagatcatc ggcggcgtta gccaggtgcc ggaagcaggt 120

ttagctagtg aagtcggagc aatggcgatg gcacctgctg ctgaagatgc ggcccttgcc 180

gccatggttg ccggccctgc caatcaagcc agttacggca atttgcccag tgactggacg 240

gaagccgact ataatcatgc tctcgacatg gccaagctgt cttcccaagc ttatagccgg 300

ttcaacgata tcaccgtcga tcttctgttg gctccatttg gtggtattgg tgacataaaa 360

gcgcaggatt ttaccaccga taactggcgc ctaatggaca ccagtggcaa gagtgacttt 420

ttcttacccg tacagagcgg gctggacttc actgtttttg aggcggtagc cgatgacccg 480

gcagctaatg tgaaggaagg ggatattgtg ctcgcatttc gcggcagtga gcctacctcc 540

gcaccggatt ggatcaataa tgtaaaacag gcggcgggta attcctctca gtatgctcag 600

gcggtagaag tcgcgaagga gctgcaaggg caggtagacc agtacaatgc agacaataac 660

ctgaccggca atgatgccag aagcctccat tttaccggcc atagcctggg cgggggattg 720

gcaacagcgg ccgcgctggc cacaggcagt agcgctaccg ccttcaatgc agcgggcctt 780

ggggattcca ccctaaagaa ccttgggctc aatgaagggc tggcggcagg cttccacaat 840

aacgttacca atattaatgt ggaaggcgat ctgttgagcg atgccaaccg ccaaaaggat 900

gtctatacca cgggttcagg catcctcgat gaaaccaggc agtatgggga acaggtttgg 960

ctgcagggcg tcgatgataa ggccagattg ggcggaccgc ttaatcccct gataccggga 1020

gtggctgatg acctggcaat ccaggcactc aaccatgcct ggcatgtgta tacctaccag 1080

ttggaaaatc gcaacttcgc ctaa 1104

<210>148

<211>367

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>148

Met Gln Val Ser Gly Ala Met Glu Ala Ile Asn Pro Ala Gln Met Asn

1 5 10 15

Ala Ala Glu Val Thr Ser Ser Gln Val Ser Asp Gln Ile Ile Gly Gly

20 25 30

Val Ser Gln Val Pro Glu Ala Gly Leu Ala Ser Glu Val Gly Ala Met

35 40 45

Ala Met Ala Pro Ala Ala Glu Asp Ala Ala Leu Ala Ala Met Val Ala

50 55 60

Gly Pro Ala Asn Gln Ala Ser Tyr Gly Asn Leu Pro Ser Asp Trp Thr

65 70 75 80

Glu Ala Asp Tyr Asn His Ala Leu Asp Met Ala Lys Leu Ser Ser Gln

85 90 95

Ala Tyr Ser Arg Phe Asn Asp Ile Thr Val Asp Leu Leu Leu Ala Pro

100 105 110

Phe Gly Gly Ile Gly Asp Ile Lys Ala Gln Asp Phe Thr Thr Asp Asn

115 120 125

Trp Arg Leu Met Asp Thr Ser Gly Lys Ser Asp Phe Phe Leu Pro Val

130 135 140

Gln Ser Gly Leu Asp Phe Thr Val Phe Glu Ala Val Ala Asp Asp Pro

145 150 155 160

Ala Ala Asn Val Lys Glu Gly Asp Ile Val Leu Ala Phe Arg Gly Ser

165 170 175

Glu Pro Thr Ser Ala Pro Asp Trp Ile Asn Asn Val Lys Gln Ala Ala

180 185 190

Gly Asn Ser Ser Gln Tyr Ala Gln Ala Val Glu Val Ala Lys Glu Leu

195 200 205

Gln Gly Gln Val Asp Gln Tyr Asn Ala Asp Asn Asn Leu Thr Gly Asn

210 215 220

Asp Ala Arg Ser Leu His Phe Thr Gly His Ser Leu Gly Gly Gly Leu

225 230 235 240

Ala Thr Ala Ala Ala Leu Ala Thr Gly Ser Ser Ala Thr Ala Phe Asn

245 250 255

Ala Ala Gly Leu Gly Asp Ser Thr Leu Lys Asn Leu Gly Leu Asn Glu

260 265 270

Gly Leu Ala Ala Gly Phe His Asn Asn Val Thr Asn Ile Asn Val Glu

275 280 285

Gly Asp Leu Leu Ser Asp Ala Asn Arg Gln Lys Asp Val Tyr Thr Thr

290 295 300

Gly Ser Gly Ile Leu Asp Glu Thr Arg Gln Tyr Gly Glu Gln Val Trp

305 310 315 320

Leu Gln Gly Val Asp Asp Lys Ala Arg Leu Gly Gly Pro Leu Asn Pro

325 330 335

Leu Ile Pro Gly Val Ala Asp Asp Leu Ala Ile Gln Ala Leu Asn His

340 345 350

Ala Trp His Val Tyr Thr Tyr Gln Leu Glu Asn Arg Asn Phe Ala

355 360 365

<210>149

<211>975

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>149

atgagcgtcc aactgcaacc gagccagctc cagccgactt ggcagaaacc gctggaaccc 60

ctggccccgc cgatccaggc ggcaccgccg ctgccgcaag gctcgtacgc cctggacccc 120

agctaccacc cgcagctggc cgcggtcacc gcgaagcagg cgccggccgc caacgccgcg 180

ccggacccga cctcgttcga ccagcaactg cgcggcaagg attcgcaggc catcgacctg 240

gagatggcgc agctctcgca ggcggtctac aaccccgaca ccaagaccgt cggcaactgg 300

acccgtctcg acgacgccca gctgacccag gccggaatcg atcccaagtc gctggagaac 360

agcgacaccg gcttccgcgc cggcatctac accgacggca acggcaagta cgtggtcgcc 420

tacgccggtt ccaacgacgt gcaggactgg atcaccaacg cgcgccaggg catcggctgg 480

gattccaagc agtacgacca ggccgtgcag ctggcccagg acgcgcagca ggccttcggc 540

gagaacatgg tcatcaccgg ccattcgctc ggcggcggcc tggccgcgac cgcggcgctg 600

gccaccgaca ccgccgcagt gaccttcaac gcctccggcg tgcacgacga caccctgcgc 660

ggactgggcc tggacccggg taccgccaag agcgacgccg ccgacggcca gatccgccgc 720

tacaacatcg gcggcgaaat cctgactgcg gcgcaggaag acgtgccgct gctcaacggc 780

attcccgacg cgcccggcca cgagatcaac ctcaacgacc cggacccgcc gaaggccccg 840

gatttcacct ggaacccgat cgagatggcc aagcgcaccg ccgaatacgt ggccgccaag 900

gcgatccgtc cgggcgagct gcacgccatc ggcccggtga tcgaggcgct gcagcagcag 960

acgccctggc aatga 975

<210>150

<211>324

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>150

Met Ser Val Gln Leu Gln Pro Ser Gln Leu Gln Pro Thr Trp Gln Lys

1 5 10 15

Pro Leu Glu Pro Leu Ala Pro Pro Ile Gln Ala Ala Pro Pro Leu Pro

20 25 30

Gln Gly Ser Tyr Ala Leu Asp Pro Ser Tyr His Pro Gln Leu Ala Ala

35 40 45

Val Thr Ala Lys Gln Ala Pro Ala Ala Asn Ala Ala Pro Asp Pro Thr

50 55 60

Ser Phe Asp Gln Gln Leu Arg Gly Lys Asp Ser Gln Ala Ile Asp Leu

65 70 75 80

Glu Met Ala Gln Leu Ser Gln Ala Val Tyr Asn Pro Asp Thr Lys Thr

85 90 95

Val Gly Asn Trp Thr Arg Leu Asp Asp Ala Gln Leu Thr Gln Ala Gly

100 105 110

Ile Asp Pro Lys Ser Leu Glu Asn Ser Asp Thr Gly Phe Arg Ala Gly

115 120 125

Ile Tyr Thr Asp Gly Asn Gly Lys Tyr Val Val Ala Tyr Ala Gly Ser

130 135 140

Asn Asp Val Gln Asp Trp Ile Thr Asn Ala Arg Gln Gly Ile Gly Trp

145 150 155 160

Asp Ser Lys Gln Tyr Asp Gln Ala Val Gln Leu Ala Gln Asp Ala Gln

165 170 175

Gln Ala Phe Gly Glu Asn Met Val Ile Thr Gly His Ser Leu Gly Gly

180 185 190

Gly Leu Ala Ala Thr Ala Ala Leu Ala Thr Asp Thr Ala Ala Val Thr

195 200 205

Phe Asn Ala Ser Gly Val His Asp Asp Thr Leu Arg Gly Leu Gly Leu

210 215 220

Asp Pro Gly Thr Ala Lys Ser Asp Ala Ala Asp Gly Gln Ile Arg Arg

225 230 235 240

Tyr Asn Ile Gly Gly Glu Ile Leu Thr Ala Ala Gln Glu Asp Val Pro

245 250 255

Leu Leu Asn Gly Ile Pro Asp Ala Pro Gly His Glu Ile Asn Leu Asn

260 265 270

Asp Pro Asp Pro Pro Lys Ala Pro Asp Phe Thr Trp Asn Pro Ile Glu

275 280 285

Met Ala Lys Arg Thr Ala Glu Tyr Val Ala Ala Lys Ala Ile Arg Pro

290 295 300

Gly Glu Leu His Ala Ile Gly Pro Val Ile Glu Ala Leu Gln Gln Gln

305 310 315 320

Thr Pro Trp Gln

<210>151

<211>1341

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>151

atgggcggag aacggcaccc cgatggcgtg agcacgatac cggcaacggc ctcggacctg 60

gcgagctttg accgcgccag tggacagctg gcgacattcg ccgcgcctgt cctccacgac 120

agtggcaaac cagacgatcg tctgttcgtc gcggcgttcg acggcaccgg caacagcatg 180

gtcaaggacg cgccggagaa tcacacgaac gttgcgcgca tcgccaggca gatcgagtcc 240

ctgggcgatc ccgccatcgc gcaaggctat gtggaaggcc cgggcacgca gggcggaatc 300

ggcggaggca tcgacctcat gacagggcag agctacgaag cccgcatgga ggacatgtac 360

ctgcagttcg tgaagcaatc cgccgcgtgg ttgaaggaga acccggatgc ggacatccgc 420

atcgccgcca tcggattcag tcgtggcgcg gaacaggcgg ccggcttcac ccggatggtc 480

gaagaacgcg gcatccggaa tccggaaggc gcgcaggtca cgcgcgacgg cgatggtcgg 540

gtactgcgtg tcgactacat cggtccaccg ctgcgcgaac ccggcaccgt catccaggcg 600

gttggcctgt tcgaccccgt cggcacgggt gagccgcgcg atcacgaccg ccgtctgcca 660

ccgtcggtgg tgtcgggttt ccagatcacc gccgacgatg agcggcgcaa cctgttccag 720

tccacccgcg tgatggatcc tggcgtgacc gatggcgggc gcttcctcaa cgtcaccgtc 780

gccggtgcgc acagcgacat cggcggtggc tatacgcagg atggcatcgc gatccgcagc 840

ggcaacctga tgatcgacta cctcaacggt ctgagcgacc ggccattcct ggacaagcgt 900

gaagaaccgt tcgatcccgc tcgcaacgtg atccatcgct ccgaggaaca ccggttcttc 960

taccgcacct cgatctacga caaggcggga acgcgcggga tgcaggagga actcgcgccg 1020

tcgcacctgt gcaggatcga ctgcctcgat gcacagcccc gcaatgaaac gctcgcgcgc 1080

gagctggcct ggcgacccgt cgagatcgga ccggtcccgg tcggcgcgga ggtgtcgcgt 1140

tcgggcggca tggtcgagcg tctgttgcag gcggccaaac acggcgacgg tggcgccgtc 1200

gagcgcatct cgcgggagta tctgcacgga gacgccgggc aggcgtggct gcaggcaggc 1260

cagcagcggc tcgacgccgc ctccatcacg caggcaccac cggtggaacg ccagcaggag 1320

ccggccgcgc tcgcgcgctg a 1341

<210>152

<211>446

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>152

Met Gly Gly Glu Arg His Pro Asp Gly Val Ser Thr Ile Pro Ala Thr

1 5 10 15

Ala Ser Asp Leu Ala Ser Phe Asp Arg Ala Ser Gly Gln Leu Ala Thr

20 25 30

Phe Ala Ala Pro Val Leu His Asp Ser Gly Lys Pro Asp Asp Arg Leu

35 40 45

Phe Val Ala Ala Phe Asp Gly Thr Gly Asn Ser Met Val Lys Asp Ala

50 55 60

Pro Glu Asn His Thr Asn Val AIa Arg Ile Ala Arg Gln Ile Glu Ser

65 70 75 80

Leu Gly Asp Pro Ala Ile Ala Gln Gly Tyr Val Glu Gly Pro Gly Thr

85 90 95

Gln Gly Gly Ile Gly Gly Gly Ile Asp Leu Met Thr Gly Gln Ser Tyr

100 105 110

Glu Ala Arg Met Glu Asp Met Tyr Leu Gln Phe Val Lys Gln Ser Ala

115 120 125

Ala Trp Leu Lys Glu Asn Pro Asp Ala Asp Ile Arg Ile Ala Ala Ile

130 135 140

Gly Phe Ser Arg Gly Ala Glu Gln Ala Ala Gly Phe Thr Arg Met Val

145 150 155 160

Glu Glu Arg Gly Ile Arg Asn Pro Glu Gly Ala Gln Val Thr Arg Asp

165 170 175

Gly Asp Gly Arg Val Leu Arg Val Asp Tyr Ile Gly Pro Pro Leu Arg

180 185 190

Glu Pro Gly Thr Val Ile Gln Ala Val Gly Leu Phe Asp Pro Val Gly

195 200 205

Thr Gly Glu Pro Arg Asp His Asp Arg Arg Leu Pro Pro Ser Val Val

210 215 220

Ser Gly Phe Gln Ile Thr Ala Asp Asp Glu Arg Arg Asn Leu Phe Gln

225 230 235 240

Ser Thr Arg Val Met Asp Pro Gly Val Thr Asp Gly Gly Arg Phe Leu

245 250 255

Asn Val Thr Val Ala Gly Ala His Ser Asp Ile Gly Gly Gly Tyr Thr

260 265 270

Gln Asp Gly Ile Ala Ile Arg Ser Gly Asn Leu Met Ile Asp Tyr Leu

275 280 285

Asn Gly Leu Ser Asp Arg Pro Phe Leu Asp Lys Arg Glu Glu Pro Phe

290 295 300

Asp Pro Ala Arg Asn Val Ile His Arg Ser Glu Glu His Arg Phe Phe

305 310 315 320

Tyr Arg Thr Ser Ile Tyr Asp Lys Ala Gly Thr Arg Gly Met Gln Glu

325 330 335

Glu Leu Ala Pro Ser His Leu Cys Arg Ile Asp Cys Leu Asp Ala Gln

340 345 350

Pro Arg Asn Glu Thr Leu Ala Arg Glu Leu Ala Trp Arg Pro Val Glu

355 360 365

Ile Gly Pro Val Pro Val Gly Ala Glu Val Ser Arg Ser Gly Gly Met

370 375 380

Val Glu Arg Leu Leu Gln Ala Ala Lys His Gly Asp Gly Gly Ala Val

385 390 395 400

Glu Arg Ile Ser Arg Glu Tyr Leu His Gly Asp Ala Gly Gln Ala Trp

405 410 415

Leu Gln Ala Gly Gln Gln Arg Leu Asp Ala Ala Ser Ile Thr Gln Ala

420 425 430

Pro Pro Val Glu Arg Gln Gln Glu Pro Ala Ala Leu Ala Arg

435 440 445

<210>153

<211>384

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>153

atgtctttac tttatgcacc agaagagttt tggctagcag atgtagaaac tttagaaagt 60

gtatgtaatg gctgtggtac tgaaggctgg aaaggtaaac taattcctaa cagcatgtat 120

ggtctagata tacgcattgc ttgtgatatc catgactgga tgtatcactt tggtaagtca 180

gaaaaagata aagaaaaagc agataaagct tttttaaata atcttattcg ccttatcaat 240

gatgaaggtg gcttcttagc ttggcctaga cgttataggg ctatgactta ttataacgca 300

gtcaaagatt ttggtgggcc tgcattttgg gcaaataaaa accctaaggg tactatgaaa 360

gaacctaagg gtactcctgc ttaa 384

<210>154

<211>127

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>154

Met Ser Leu Leu Tyr Ala Pro Glu Glu Phe Trp Leu Ala Asp Val Glu

1 5 10 15

Thr Leu Glu Ser Val Cys Asn Gly Cys Gly Thr Glu Gly Trp Lys Gly

20 25 30

Lys Leu Ile Pro Asn Ser Met Tyr Gly Leu Asp Ile Arg Ile Ala Cys

35 40 45

Asp Ile His Asp Trp Met Tyr His Phe Gly Lys Ser Glu Lys Asp Lys

50 55 60

Glu Lys Ala Asp Lys Ala Phe Leu Asn Asn Leu Ile Arg Leu Ile Asn

65 70 75 80

Asp Glu Gly Gly Phe Leu Ala Trp Pro Arg Arg Tyr Arg Ala Met Thr

85 90 95

Tyr Tyr Asn Ala Val Lys Asp Phe Gly Gly Pro Ala Phe Trp Ala Asn

100 105 110

Lys Asn Pro Lys Gly Thr Met Lys Glu Pro Lys Gly Thr Pro Ala

115 120 125

<210>155

<211>1263

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>155

atgcggacga caactacaaa ttggagacaa atcgtgaaaa gcctgaagct cttcctgatg 60

ggcctttgcc tgttcatttc cgcttcattc gcatcatctg cctatgcact gggcagttac 120

acctacacgt acctgcgctg tttctatcgc gtcgatacat ccccgctgaa gcccaagacc 180

acctacgtct ggggcatcga tccgggcagc ggcggctact accgcatcta tggccgctgg 240

tggaaagacg gcttgctgag ctgggaaaac atgttctaca gcgacgtgtc gcaagatacg 300

ctgaaatcgg tttgccagag cacgctcgcc ggctacggca tcaaccgcag cgtcgcactc 360

tcggcggcgg ccgatacgtc gctctcgctc aattacacgg tgtggaccaa cgacagcgca 420

tcgcagggct cacgcatcaa caaaatcgtc gcattcggcg acagcctgtc ggacaaccag 480

aatctgtaca acgcgaccca atggcaactg ccgaaccgca acagttggtt tctcggccgc 540

ttctcgaatg acaggaactg gatcgaatac ctgtcgagca acgtgaatct gccgatgtac 600

aactgggcag tggcgggcgc ggcggcggat cagtactacg tcatcccggg tgtgtcgcaa 660

caggtcgact cgtggatcac ctacatgcag agcgcgccga attaccaggc cgcgaatacg 720

ctgttcaccg tgcttgtcgg cggcaacgat ctggtgaact acggccggtc tgtcgactcg 780

atcatctccg cggagcagca ggcgctggtg aagatgatca atgccggcgc tcgcaacatc 840

ctgttgctga atctgcccga cgtatcgcgc gcaccggtat tccagtatcg cagcgacgcc 900

gccaccatcg ccgcgcaagt ccgcgacttc aaccagaagc tggcgcaact gcgcgacaat 960

cttcaggcga cgtacggccc gtcgctcgtc attcgcatgt tcgataccta caccttgttc 1020

aacgatctgc tgaacaatcc gaccaactat ggcgtgacga acacctggca gtcctgcctc 1080

gacatcaact cggattccgg gtcgaactat ctttatacct ggccgacgcg cgccgaatgc 1140

accaacgccg acagcttcgt gttctgggac acgctgcacc cgaccacgca tacgcacaag 1200

ctgctgggcg acaatgcggc gaatttcgta cgcgccggtt tccccgcatt gtctgcgcct 1260

tga 1263

<210>156

<211>420

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>信号

<222>(1)...(36)

<220>

<221>结构域

<222>(149)...(406)

<223>GDSL-样脂酶/酰基水解酶

<400>156

Met Arg Thr Thr Thr Thr Asn Trp Arg Gln Ile Val Lys Ser Leu Lys

1 5 10 15

Leu Phe Leu Met Gly Leu Cys Leu Phe Ile Ser Ala Ser Phe Ala Ser

20 25 30

Ser Ala Tyr Ala Leu Gly Ser Tyr Thr Tyr Thr Tyr Leu Arg Cys Phe

35 40 45

Tyr Arg Val Asp Thr Ser Pro Leu Lys Pro Lys Thr Thr Tyr Val Trp

50 55 60

Gly Ile Asp Pro Gly Ser Gly Gly Tyr Tyr Arg Ile Tyr Gly Arg Trp

65 70 75 80

Trp Lys Asp Gly Leu Leu Ser Trp Glu Asn Met Phe Tyr Ser Asp Val

85 90 95

Ser Gln Asp Thr Leu Lys Ser Val Cys Gln Ser Thr Leu Ala Gly Tyr

100 105 110

Gly Ile Asn Arg Ser Val Ala Leu Ser Ala Ala Ala Asp Thr Ser Leu

115 120 125

Ser Leu Asn Tyr Thr Val Trp Thr Asn Asp Ser Ala Ser Gln Gly Ser

130 135 140

Arg Ile Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Asn Gln

145 150 155 160

Asn Leu Tyr Asn Ala Thr Gln Trp Gln Leu Pro Asn Arg Asn Ser Trp

165 170 175

Phe Leu Gly Arg Phe Ser Asn Asp Arg Asn Trp Ile Glu Tyr Leu Ser

180 185 190

Ser Asn Val Asn Leu Pro Met Tyr Asn Trp Ala Val Ala Gly Ala Ala

195 200 205

Ala Asp Gln Tyr Tyr Val Ile Pro Gly Val Ser Gln Gln Val Asp Ser

210 215 220

Trp Ile Thr Tyr Met Gln Ser Ala Pro Asn Tyr Gln Ala Ala Asn Thr

225 230 235 240

Leu Phe Thr Val Leu Val Gly Gly Asn Asp Leu Val Asn Tyr Gly Arg

245 250 255

Ser Val Asp Ser Ile Ile Ser Ala Glu Gln Gln Ala Leu Val Lys Met

260 265 270

Ile Asn Ala Gly Ala Arg Asn Ile Leu Leu Leu Asn Leu Pro Asp Val

275 280 285

Ser Arg Ala Pro Val Phe Gln Tyr Arg Ser Asp Ala Ala Thr Ile Ala

290 295 300

Ala Gln Val Arg Asp Phe Asn Gln Lys Leu Ala Gln Leu Arg Asp Asn

305 310 315 320

Leu Gln Ala Thr Tyr Gly Pro Ser Leu Val Ile Arg Met Phe Asp Thr

325 330 335

Tyr Thr Leu Phe Asn Asp Leu Leu Asn Asn Pro Thr Asn Tyr Gly Val

340 345 350

Thr Asn Thr Trp Gln Ser Cys Leu Asp Ile Asn Ser Asp Ser Gly Ser

355 360 365

Asn Tyr Leu Tyr Thr Trp Pro Thr Arg Ala Glu Cys Thr Asn Ala Asp

370 375 380

Ser Phe Val Phe Trp Asp Thr Leu His Pro Thr Thr His Thr His Lys

385 390 395 400

Leu Leu Gly Asp Asn Ala Ala Asn Phe Val Arg Ala Gly Phe Pro Ala

405 410 415

Leu Ser Ala Pro

420

<210>157

<211>1329

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>157

atgagcctca acagccaaga ctacgctgcg ctatccgaag atgcatacaa ggattatgcg 60

gtcggtcgtc gagcgcctgg tcaagaagaa atcgttccga tcaacgggca caagtacaag 120

atcctcgagc acgttgacaa tcggctgaac ggttatcagg gaacgatcta ccagcgagtc 180

gacaccaatg aaattgtcgt cgcacatcgc ggaaccgaac aaatcgcacg cgatgcgatt 240

ctgaccgatg gtggcatggt cgttgcccgt accaatgtgc aggcgccaga cgcaatcgcg 300

ctgacccaac gcgccctggc ttacgccaag aaggaggggc aggatctcgg ccaacgtccg 360

cctgaggtca ccgtcaccgg ccactccctc ggcggcgctc tggcccagat cacctcgcac 420

cacttcaacg tcaagggcga gaccttcaac gcctatggcg cggtcagcct cagctaccgc 480

atcccggaag gtggcaacac catgatcaac catgtcatgg cctccgatcc ggtcagcgcg 540

gcgtcgccac atttcggcca ggtgcggatc tacgccaggc cgaatgaaat cagcacgctc 600

gccgcgaacg gtttcagcaa tcactcgttg cgcgccctta tccccgaccg gccgatcatc 660

gccgcaggca gctcgttcgg cgcgcacaag ctgggcaact tcctcggtga cggctcggtg 720

ctgcagcacc cggaaacgca gaagctggca aaagacaacg ccaggatgat cgaggaatac 780

cgcgacgacg ttgaattact gcgccgtggt gtcacccgcg cggcgcgggg cattccgggc 840

ggcgccgtcg acctgtacga ccacatccgc ggcccgctgc agcccggtga gccggcacgc 900

cgcgaagcgg agaagaacgg ccatcacacc agcatgctgc gaatggacga tgccaaccat 960

gtgggcaacc cactgttcaa cgacgcgatc cgtggcgtgc acgcgcagga tgtccgcgtc 1020

ggccgggtac cagacgtgat gagcacgcaa ctggcaggca gtctggccgc cgaaatgcac 1080

gcagcaggcg gcaagcgcat cgacgaagtg gtcatgaatg ccgatgcctc gcgcagcttc 1140

gccgtgcagg gccagggcgg tgaccccgcc caccttcgtg tgtcggtgga tacggcagtg 1200

gcgatgaaca ccccgctgga acagagcagc cagcgcatcg accagcaggc cgccgaccag 1260

cgcgttgcgc tggagcgcga ccagcagctg gaacagcagc ggaaccagac ccgcagcctg 1320

caggcctga 1329

<210>158

<211>442

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>158

Met Ser Leu Asn Ser Gln Asp Tyr Ala Ala Leu Ser Glu Asp Ala Tyr

1 5 10 15

Lys Asp Tyr Ala Val Gly Arg Arg Ala Pro Gly Gln Glu Glu Ile Val

20 25 30

Pro Ile Asn Gly His Lys Tyr Lys Ile Leu Glu His Val Asp Asn Arg

35 40 45

Leu Asn Gly Tyr Gln Gly Thr Ile Tyr Gln Arg Val Asp Thr Asn Glu

50 55 60

Ile Val Val Ala His Arg Gly Thr Glu Gln Ile Ala Arg Asp Ala Ile

65 70 75 80

Leu Thr Asp Gly Gly Met Val Val Ala Arg Thr Asn Val Gln Ala Pro

85 90 95

Asp Ala Ile Ala Leu Thr Gln Arg Ala Leu Ala Tyr Ala Lys Lys Glu

100 105 110

Gly Gln Asp Leu Gly Gln Arg Pro Pro Glu Val Thr Val Thr Gly His

115 120 125

Ser Leu Gly Gly Ala Leu Ala Gln Ile Thr Ser His His Phe Asn Val

130 135 140

Lys Gly Glu Thr Phe Asn Ala Tyr Gly Ala Val Ser Leu Ser Tyr Arg

145 150 155 160

Ile Pro Glu Gly Gly Asn Thr Met Ile Asn His Val Met Ala Ser Asp

165 170 175

Pro Val Ser Ala Ala Ser Pro His Phe Gly Gln Val Arg Ile Tyr Ala

180 185 190

Arg Pro Asn Glu Ile Ser Thr Leu Ala Ala Asn Gly Phe Ser Asn His

195 200 205

Ser Leu Arg Ala Leu Ile Pro Asp Arg Pro Ile Ile Ala Ala Gly Ser

210 215 220

Ser Phe Gly Ala His Lys Leu Gly Asn Phe Leu Gly Asp Gly Ser Val

225 230 235 240

Leu Gln His Pro Glu Thr Gln Lys Leu Ala Lys Asp Asn Ala Arg Met

245 250 255

Ile Glu Glu Tyr Arg Asp Asp Val Glu Leu Leu Arg Arg Gly Val Thr

260 265 270

Arg Ala Ala Arg Gly Ile Pro Gly Gly Ala Val Asp Leu Tyr Asp His

275 280 285

Ile Arg Gly Pro Leu Gln Pro Gly Glu Pro Ala Arg Arg Glu Ala Glu

290 295 300

Lys Asn Gly His His Thr Ser Met Leu Arg Met Asp Asp Ala Asn His

305 310 315 320

Val Gly Asn Pro Leu Phe Asn Asp Ala Ile Arg Gly Val His Ala Gln

325 330 335

Asp Val Arg Val Gly Arg Val Pro Asp Val Met Ser Thr Gln Leu Ala

340 345 350

Gly Ser Leu Ala Ala Glu Met His Ala Ala Gly Gly Lys Arg Ile Asp

355 360 365

Glu Val Val Met Asn Ala Asp Ala Ser Arg Ser Phe Ala Val Gln Gly

370 375 380

Gln Gly Gly Asp Pro Ala His Leu Arg Val Ser Val Asp Thr Ala Val

385 390 395 400

Ala Met Asn Thr Pro Leu Glu Gln Ser Ser Gln Arg Ile Asp Gln Gln

405 410 415

Ala Ala Asp Gln Arg ValAla Leu Glu Arg Asp Gln Gln Leu Glu Gln

420 425 430

Gln Arg Asn Gln Thr Arg Ser Leu Gln Ala

435 440

<210>159

<211>1428

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>159

atgtcgatca cgctggtatt cgtgcacggc tggagtgtca caagcaagga cacctacggg 60

aagcttcccg aggccatctc tcaagccgct gcggccgcgg gcatcgatgt agagctgaag 120

gacatctacc tcggccgcta catcagcttt cacgacgagg ttacggtcga cgacatcgcg 180

accgcgatga atcacgcggt ggcgaacgac ttgaaagggg tgaaggagtt ctcgtgcatc 240

acgcactcca cgggcggccc ggtcgtgcgt cgctgggtag atatgttcta cggcgcgaag 300

gacctcgaca actgtccgct gcgtcatctc atcatgctgg cgcctgcaaa ccatggttcc 360

gcgttggccg tcttggggaa gggccgcgtc ggtcgaatcc aggcgtggtg gggtggggtc 420

gagcccggtc agggcgtgct cgactggctt tgcctcggca gctcggaagc gtgggagctc 480

caggacagct tcacggatta ctcgctggac gacgcgaagt tcttcccgtt cgtgctgagc 540

ggcgagacga ttgataagca cttctacgac ttcctcaaca gctatctgga tgaagtgggc 600

tcggatggcg tggttcgtct ggcgggggcc aatctgaact acacgtttat tcggctcgac 660

caaactgaaa agcgttacga cgacggcgag gaaacgggct acatactgac tgttcggccg 720

cggacaaagc cgcgcccacc cgtaacggcg ttcggagtca taccgagcgc gagtcactcg 780

ggtaacgaca tcggcatcat gcgcagcgtc acgccggcga actccgattc gaagcctgtc 840

gtggcgcaaa tcgtgaaatg cctcggcgtg gagacacaag cggattacaa agcgcgtgtc 900

accgagctgg ccgcgttcac cgccgaaacg cagaaagcca acgccgtgca gtacggcggc 960

aaagagcgcc atttcgtgat gttcatcttc cgcatccgcg acgacagagg gcgcacgata 1020

agcgactacg acctgttgct gctcggcgac ggtttccacc cggacaagct gcccaaggga 1080

ttcttcgttg accgtcaacg caatcccaag tcccaggcgc tggtctacta cctcgactac 1140

gacgcgctga cggctgacga cgacaccgac ttaggtattc gagtgaacgc gcgaccgctc 1200

tatagcgcgc ccggagcagc agagccagac gcattcgcgg gctatcgagc cgccgagtat 1260

cgattcacgg gcaaagtact gaagcaattc gtgcgcccga acgaaactgt gtacgtcgac 1320

atcgtgctga atcgcatggt ggacgttgaa acgctccggc tggagcctct ggaaggatcg 1380

ccgcgtgggt cgttcaagaa aactctgccc aaagggccgg tgagttag 1428

<210>160

<211>475

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>160

Met Ser Ile Thr Leu Val Phe Val His Gly Trp Ser Val Thr Ser Lys

1 5 10 15

Asp Thr Tyr Gly Lys Leu Pro Glu Ala Ile Ser Gln Ala Ala Ala Ala

20 25 30

Ala Gly Ile Asp Val Glu Leu Lys Asp Ile Tyr Leu Gly Arg Tyr Ile

35 40 45

Ser Phe His Asp Glu Val Thr Val Asp Asp Ile Ala Thr Ala Met Asn

50 55 60

His Ala Val Ala Asn Asp Leu Lys Gly Val Lys Glu Phe Ser Cys Ile

65 70 75 80

Thr His Ser Thr Gly Gly Pro Val Val Arg Arg Trp Val Asp Met Phe

85 90 95

Tyr Gly Ala Lys Asp Leu Asp Asn Cys Pro Leu Arg His Leu Ile Met

100 105 110

Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Val Leu Gly Lys Gly

115 120 125

Arg Val Gly Arg Ile Gln Ala Trp Trp Gly Gly Val Glu Pro Gly Gln

130 135 140

Gly Val Leu Asp Trp Leu Cys Leu Gly Ser Ser Glu Ala Trp Glu Leu

145 150 155 160

Gln Asp Ser Phe Thr Asp Tyr Ser Leu Asp Asp Ala Lys Phe Phe Pro

165 170 175

Phe Val Leu Ser Gly Glu Thr Ile Asp Lys His Phe Tyr Asp Phe Leu

180 185 190

Asn Ser Tyr Leu Asp Glu Val Gly Ser Asp Gly Val Val Arg Leu Ala

195 200 205

Gly Ala Asn Leu Asn Tyr Thr Phe Ile Arg Leu Asp Gln Thr Glu Lys

210 215 220

Arg Tyr Asp Asp Gly Glu Glu Thr Gly Tyr Ile Leu Thr Val Arg Pro

225 230 235 240

Arg Thr Lys Pro Arg Pro Pro Val Thr Ala Phe Gly Val Ile Pro Ser

245 250 255

Ala Ser His Ser Gly Asn Asp Ile Gly Ile Met Arg Ser Val Thr Pro

260 265 270

Ala Asn Ser Asp Ser Lys Pro Val Val Ala Gln Ile Val Lys Cys Leu

275 280 285

Gly Val Glu Thr Gln Ala Asp Tyr Lys Ala Arg Val Thr Glu Leu Ala

290 295 300

Ala Phe Thr Ala Glu Thr Gln Lys Ala Asn Ala Val Gln Tyr Gly Gly

305 310 315 320

Lys Glu Arg His Phe Val Met Phe Ile Phe Arg Ile Arg Asp Asp Arg

325 330 335

Gly Arg Thr Ile Ser Asp Tyr Asp Leu Leu Leu Leu Gly Asp Gly Phe

340 345 350

His Pro Asp Lys Leu Pro Lys Gly Phe Phe Val Asp Arg Gln Arg Asn

355 360 365

Pro Lys Ser Gln Ala Leu Val Tyr Tyr Leu Asp Tyr Asp Ala Leu Thr

370 375 380

Ala Asp Asp Asp Thr Asp Leu Gly Ile Arg Val Asn Ala Arg Pro Leu

385 390 395 400

Tyr Ser Ala Pro Gly Ala Ala Glu Pro Asp Ala Phe Ala Gly Tyr Arg

405 410 415

Ala Ala Glu Tyr Arg Phe Thr Gly Lys Val Leu Lys Gln Phe Val Arg

420 425 430

Pro Asn Glu Thr Val Tyr Val Asp Ile Val Leu Asn Arg Met Val Asp

435 440 445

Val Glu Thr Leu Arg Leu Glu Pro Leu Glu Gly Ser Pro Arg Gly Ser

450 455 460

Phe Lys Lys Thr Leu Pro Lys Gly Pro Val Ser

465 470 475

<210>161

<21l>1740

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>161

atgaacagaa aattattatc gttatgcttg ggagcaacgt cctgtattgc actatcactt 60

cctgtgcatg catttacgca aaagggtgcg ggtacggaaa tttctaatgg gatacctatg 120

gggcacgaat gggttacgcg tttgtctgca ttggaattgc ttggtggcga tcctattatg 180

ccgccagatc caaatgaccc acgtaaaaac tggactaaag ggaaagccaa aaacctcgat 240

ctttccagcc caggtgcgcg tgcagaagtt gcgcggatta tgagtgttga ttatcacgat 300

aaaatattcc agtcgacgta caaagttgtt ttcgacgcta ttattggcga gcgctgggta 360

gatttggcgg gatataacgt gacgaccagc atgttgggaa aaataaactg ttttgatgct 420

gtagcccaag agccagtaga aatccagtac gatcatttta tgcgtcgtta cgacgagcgc 480

ggtggaaaag gtggagcgac tgctgcgacc aattcacgcg agcgttttgt gcaatatttt 540

gttgcagcgg caatggctcc ccaaacaact atgaaagtat gggatggcgg tgttgttagt 600

gatttggtta ccgtagatag gaattacttt ttatttggca gggctgcgca tttattcgaa 660

gactcattta gttcagaaca tacagtgcgg gtgagtgatg ataattttga actggtgcgc 720

caagtaaaaa gctacatgtg tgctgcaggt tctgaacagc atacgcattc aaatgaaaaa 780

atatttaatt acaccagtgg cgatgttatt tggaaaccgg gtactggttt ggatccaagt 840

tggtccgcat ataaaccaag caacatgaaa accgtcgcat tggtggcgac cgaagcaact 900

aaagatttat gggcagcgtt tattcgctcc atgggcacgc ctatagcgca gcgtgagcag 960

tgggcgcgta aagaggctaa taaactggcc gataattggt tggcttttga taaatacaaa 1020

ctccccgatt ggtatgacat tgaagctcat cgggatgata cctatgtatt ggctgatggg 1080

cagacaggga aaggccaaac tgttgccgct tgtatgcaaa agttgggggt tgcatcaggc 1140

aagcaggagg ataaggttcg ccaattggaa gcagatcaaa aaacctgttt atacaatgtc 1200

gtggctgaag agggatacgc cgatttattt gatcccgcat ttcacatgcc attcaattgg 1260

cgttggaaaa caggccggtt tggtgattgg ttacaaccac cagcaggatg gaaaattcca 1320

actcgtccag cggatacagg cacacgcgtg aatattctca gtgcgacaaa caatctccct 1380

atggtggcag ctgatggtgt aagccataac cagtgggttt atgttaaagc aggttttcct 1440

gcgctgggtt ttatcaaagt gccggatgaa aataatactg acaaaaagaa tagtattttt 1500

tatcgcgtaa ttaatgatcc cgatttattt ttaagttaca acgccactac tggcgcagta 1560

aaactctggg ccagtccgaa ccaggctaat tatgcaactg aaccaaaatc agggaatatt 1620

gcaatcaaga gtttgtattg ggatcaatat atgtggcttt caaacgaatc cccttatatt 1680

acccgtaccg ggaatcccaa aaatttggat gcccaatgga aagaagtagc cgctaagtaa 1740

<210>162

<211>579

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>信号

<222>(1)...(24)

<400>162

Met Asn Arg Lys Leu Leu Ser Leu Cys Leu Gly Ala Thr Ser Cys Ile

1 5 10 15

Ala Leu Ser Leu Pro Val His Ala Phe Thr Gln Lys Gly Ala Gly Thr

20 25 30

Glu Ile Ser Asn Gly Ile Pro Met Gly His Glu Trp Val Thr Arg Leu

35 40 45

Ser Ala Leu Glu Leu Leu Gly Gly Asp Pro Ile Met Pro Pro Asp Pro

50 55 60

Asn Asp Pro Arg Lys Asn Trp Thr Lys Gly Lys Ala Lys Asn Leu Asp

65 70 75 80

Leu Ser Ser Pro Gly Ala Arg Ala Glu Val Ala Arg Ile Met Ser Val

85 90 95

Asp Tyr His Asp Lys Ile Phe Gln Ser Thr Tyr Lys Val Val Phe Asp

100 105 110

Ala Ile Ile Gly Glu Arg Trp Val Asp Leu Ala Gly Tyr Asn Val Thr

115 120 125

Thr Ser Met Leu Gly Lys Ile Asn Cys Phe Asp Ala Val Ala Gln Glu

130 135 140

Pro Val Glu Ile Gln Tyr Asp His Phe Met Arg Arg Tyr Asp Glu Arg

l45 150 155 160

Gly Gly Lys Gly Gly Ala Thr Ala Ala Thr Asn Ser Arg Glu Arg Phe

165 170 175

Val Gln Tyr Phe Val Ala Ala Ala Met Ala Pro Gln Thr Thr Met Lys

180 185 190

Val Trp Asp Gly Gly Val Val Ser Asp Leu Val Thr Val Asp Arg Asn

195 200 205

Tyr Phe Leu Phe Gly Arg Ala Ala His Leu Phe Glu Asp Ser Phe Ser

210 215 220

Ser Glu His Thr Val Arg Val Ser Asp Asp Asn Phe Glu Leu Val Arg

225 230 235 240

Gln Val Lys Ser Tyr Met Cys Ala Ala Gly Ser Glu Gln His Thr His

245 250 255

Ser Asn Glu Lys Ile Phe Asn Tyr Thr Ser Gly Asp Val Ile Trp Lys

260 265 270

Pro Gly Thr Gly Leu Asp Pro Ser Trp Ser Ala Tyr Lys Pro Ser Asn

275 280 285

Met Lys Thr Val Ala Leu Val Ala Thr Glu Ala Thr Lys Asp Leu Trp

290 295 300

Ala Ala Phe Ile Arg Ser Met Gly Thr Pro Ile Ala Gln Arg Glu Gln

305 310 315 320

Trp Ala Arg Lys Glu Ala Asn Lys Leu Ala Asp Asn Trp Leu Ala Phe

325 330 335

Asp Lys Tyr Lys Leu Pro Asp Trp Tyr Asp Ile Glu Ala His Arg Asp

340 345 350

Asp Thr Tyr Val Leu Ala Asp Gly Gln Thr Gly Lys Gly Gln Thr Val

355 360 365

Ala Ala Cys Met Gln Lys Leu Gly Val Ala Ser Gly Lys Gln Glu Asp

370 375 380

Lys Val Arg Gln Leu Glu Ala Asp Gln Lys Thr Cys Leu Tyr Asn Val

385 390 395 400

Val Ala Glu Glu Gly Tyr Ala Asp Leu Phe Asp Pro Ala Phe His Met

405 410 415

Pro Phe Asn Trp Arg Trp Lys Thr Gly Arg Phe Gly Asp Trp Leu Gln

420 425 430

Pro Pro Ala Gly Trp Lys Ile Pro Thr Arg Pro Ala Asp Thr Gly Thr

435 440 445

Arg Val Asn Ile Leu Ser Ala Thr Asn Asn Leu Pro Met Val Ala Ala

450 455 460

Asp Gly Val Ser His Asn Gln Trp Val Tyr Val Lys Ala Gly Phe Pro

465 470 475 480

Ala Leu Gly Phe Ile Lys Val Pro Asp Glu Asn Asn Thr Asp Lys Lys

485 490 495

Asn Ser Ile Phe Tyr Arg Val Ile Asn Asp Pro Asp Leu Phe Leu Ser

500 505 510

Tyr Asn Ala Thr Thr Gly Ala Val Lys Leu Trp Ala Ser Pro Asn Gln

515 520 525

Ala Asn Tyr Ala Thr Glu Pro Lys Ser Gly Asn Ile Ala Ile Lys Ser

530 535 540

Leu Tyr Trp Asp Gln Tyr Met Trp Leu Ser Asn Glu Ser Pro Tyr Ile

545 550 555 560

Thr Arg Thr Gly Asn Pro Lys Asn Leu Asp Ala Gln Trp Lys Glu Val

565 570 575

Ala Ala Lys

<210>163

<211>1104

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>163

atgcaagtca atggtgcaat tgcagttact gatccggcgt tgagcaatgc agtggaagca 60

acctcttacc agacatctga acagattgtg ggtggagtaa gcgaagcggc ggaagcaggg 120

ttggcggcag aagtgggcgc ggcggagacg ttcgctgcag ctgacgatgt tgccctttca 180

tccatggtcg ccggcccggc taatgatgcc tcttacggca acctgcccgc agggtgggat 240

gaggcccggt ttgatcatgc cctggatatg gccaagttgt cctctcaggc ctacagcagt 300

ttcaatgaca gaactgtaga tcttctactg gcgccgttta gcggtatcaa tgacataaaa 360

aatcaagatt tctccaccga taattatctc cctataaatt ccggtggcaa atctgacttc 420

ctgttgcccc tgcagaatgg gctggactat acggtcttcc agcaagtcac cgatcctaat 480

ggtgtcgatc atgccgccaa gactgccggc ggcgatatcg ttctttcctt ccggggcagt 540

gaacccacat ccgccccgga ttgggtgaac aatgtgaagc aggccgctgg ccattctccc 600

caatatgggg ccgcggtaaa tgtggcgagg gatttgcagc agcaagtgga tgcctataat 660

gagaagcatg ggcttgaagg cgacgctgcc atgaagctcc acttcaccgg ccacagcctg 720

ggtggcggat tggccactgc cgctgccctg gctaccggta gcgaagcgac agtctttaat 780

gctgccggtc tctcagacca taccattaac aaccttggcc tggacgcaag ccatgccgac 840

aaggtgacca atattaacgt ggaaggcgat ctgctgagcg atggcaaccg gcagaaggat 900

gctcacacca cgggctctgg tgtctttggc gataccaagc aatatggtga gcaggtctgg 960

ctgcagggtg tagatgaccg cgcaagattt ggcggccctc tcaacttcct ggtgccgggc 1020

tttgtcaacg acctggccat tcaggggctt aatcacgcct ggcatgtgta tacctaccaa 1080

ttggaaaacc gcaactttgc ctga 1104

<210>164

<211>367

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(174)...(296)

<223>脂酶(类3)

<400>164

Met Gln Val Asn Gly Ala Ile Ala Val Thr Asp Pro Ala Leu Ser Asn

1 5 10 15

Ala Val Glu Ala Thr Ser Tyr Gln Thr Ser Glu Gln Ile Val Gly Gly

20 25 30

Val Ser Glu Ala Ala Glu Ala Gly Leu Ala Ala Glu Val Gly Ala Ala

35 40 45

Glu Thr Phe Ala Ala Ala Asp Asp Val Ala Leu Ser Ser Met Val Ala

50 55 60

Gly Pro Ala Asn Asp Ala Ser Tyr Gly Asn Leu Pro Ala Gly Trp Asp

65 70 75 80

Glu Ala Arg Phe Asp His Ala Leu Asp Met Ala Lys Leu Ser Ser Gln

85 90 95

Ala Tyr Ser Ser Phe Asn Asp Arg Thr Val Asp Leu Leu Leu Ala Pro

100 105 110

Phe Ser Gly Ile Asn Asp Ile Lys Asn Gln Asp Phe Ser Thr Asp Asn

115 120 125

Tyr Leu Pro Ile Asn Ser Gly Gly Lys Ser Asp Phe Leu Leu Pro Leu

130 135 140

Gln Asn Gly Leu Asp Tyr Thr Val Phe Gln Gln Val Thr Asp Pro Asn

145 150 155 160

Gly Val Asp His Ala Ala Lys Thr Ala Gly Gly Asp Ile Val Leu Ser

165 170 175

Phe Arg Gly Ser Glu Pro Thr Ser Ala Pro Asp Trp Val Asn Asn Val

180 185 190

Lys Gln Ala Ala Gly His Ser Pro Gln Tyr Gly Ala Ala Val Asn Val

195 200 205

Ala Arg Asp Leu Gln Gln Gln Val Asp Ala TyrAsn Glu Lys His Gly

210 215 220

Leu Glu Gly Asp Ala Ala Met Lys Leu His Phe Thr Gly His Ser Leu

225 230 235 240

Gly Gly Gly Leu Ala Thr Ala Ala Ala Leu Ala Thr Gly Ser Glu Ala

245 250 255

Thr Val Phe Asn Ala Ala Gly Leu Ser Asp His Thr Ile Asn Asn Leu

260 265 270

Gly Leu Asp Ala Ser His Ala Asp Lys Val Thr Asn Ile Asn Val Glu

275 280 285

Gly Asp Leu Leu Ser Asp Gly Asn Arg Gln Lys Asp Ala His Thr Thr

290 295 300

Gly Ser Gly Val Phe Gly Asp Thr Lys Gln Tyr Gly Glu Gln Val Trp

305 310 315 320

Leu Gln Gly Val Asp Asp Arg Ala Arg Phe Gly Gly Pro Leu Asn Phe

325 330 335

Leu Val Pro Gly Phe Val Asn Asp Leu Ala Ile Gln Gly Leu Asn His

340 345 350

Ala Trp His Val Tyr Thr Tyr Gln Leu Glu Asn Arg Asn Phe Ala

355 360 365

<210>165

<21l>927

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>165

atgcccaaat acagaattct tagtttggac ggcggcggaa tccgggggct gctcagcgcg 60

attctgctcg agcggttgga agcggaggca cccaattggc tgagccaggt ggacctgatc 120

gccggcacat ccaccggcgg gatcatcgcc ctgggtctcg ccaaaggcct cagcccaacc 180

caactgcgca atctctatca actgcgcggg gcggcgatat tcgatgattc atggtgggac 240

gacgtgctcg atattgggaa gatttcgggc gcggattatg ataacaagca actcaccaaa 300

gagttgaaga cgattctcgg caacacgaaa ctgcgcgagt tgtcgaagcg ggttttgatt 360

tcgagtttcg atctggacag tgaagagcgc gatcccacca aacgaagttg gacgccgaag 420

ttcttccaca acttcccggg catcgacagc gacggcgagc aactggccta caaggtggcg 480

ctgtacacca gtgccgcgcc gacgtatttt ccgaccgtgg acgggtacat cgatggcggt 540

gtggtggcca acaaccccag catggcagcc ctcgcgcaaa cgcaggacac ccgcgcgctg 600

aaaacaccgc cgcgcttctc cgaaatccgg ctgctctcga tcggcacggg caaatccctc 660

tatcgcatcg aagggcagaa cctggactgg ggctacgccc agtgggccaa gccgctcatc 720

aacatcatga tggacggcgt gatgggtgtg gcagattacc agtgccggca ggtcctggac 780

gacaattatt gccggatttc gcccaccttc ccgcccggcg cggtgtttcc cttggacggt 840

gtcaaacaga ttcccgacct ggtgaccttt gccacttccg tggacctcac gcgcgccgtt 900

cagtggatca agagcaagtg ggcttag 927

<210>166

<211>308

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(7)...(191)

<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶

<400>166

Met Pro Lys Tyr Arg Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly

1 5 10 15

Leu Leu Ser Ala Ile Leu Leu Glu Arg Leu Glu Ala Glu Ala Pro Asn

20 25 30

Trp Leu Ser Gln Val Asp Leu Ile Ala Gly Thr Ser Thr Gly Gly Ile

35 40 45

Ile Ala Leu Gly Leu Ala Lys Gly Leu Ser Pro Thr Gln Leu Arg Asn

50 55 60

Leu Tyr Gln Leu Arg Gly Ala Ala Ile Phe Asp Asp Ser Trp Trp Asp

65 70 75 80

Asp Val Leu Asp Ile Gly Lys Ile Ser Gly Ala Asp Tyr Asp Asn Lys

85 90 95

Gln Leu Thr Lys Glu Leu Lys Thr Ile Leu Gly Asn Thr Lys Leu Arg

100 105 110

Glu Leu Ser Lys Arg Val Leu Ile Ser Ser Phe Asp Leu Asp Ser Glu

115 120 125

Glu Arg Asp Pro Thr Lys Arg Ser Trp Thr Pro Lys Phe Phe His Asn

130 135 140

Phe Pro Gly Ile Asp Ser Asp Gly Glu Gln Leu Ala Tyr Lys Val Ala

145 150 155 160

Leu Tyr Thr Ser Ala Ala Pro Thr Tyr Phe Pro Thr Val Asp Gly Tyr

165 170 175

Ile Asp Gly Gly Val Val Ala Asn Asn Pro Ser Met Ala Ala Leu Ala

180 185 190

Gln Thr Gln Asp Thr Arg Ala Leu Lys Thr Pro Pro Arg Phe Ser Glu

195 200 205

Ile Arg Leu Leu Ser Ile Gly Thr Gly Lys Ser Leu Tyr Arg Ile Glu

210 215 220

Gly Gln Asn Leu Asp Trp Gly Tyr Ala Gln Trp Ala Lys Pro Leu Ile

225 230 235 240

Asn Ile Met Met Asp Gly Val Met Gly Val Ala Asp Tyr Gln Cys Arg

245 250 255

Gln Val Leu Asp Asp Asn Tyr Cys Arg Ile Ser Pro Thr Phe Pro Pro

260 265 270

Gly Ala Val Phe Pro Leu Asp Gly Val Lys Gln Ile Pro Asp Leu Val

275 280 285

Thr Phe Ala Thr Ser Val Asp Leu Thr Arg Ala Val Gln Trp Ile Lys

290 295 300

Ser Lys Trp Ala

305

<210>167

<211>522

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>167

atggcgagga gctggaagtg gaggccgctt cttagctctt tcttattggt atccttggcg 60

cccttctcga cgtccgtgcc ttgcttcaag ctacccggcc ttgagagcgt ggccttctgg 120

ataagcacta ctatgaactt cttcccgttc ctcctctaca cggctatact agcctacgtt 180

aggaaagact acaaaatagt gctagagggg ctcgccctga acgcgttcgt gctcgtcctc 240

aagtactcgt tccacacccc caggccggag ggctctggcc acctaacccc gggctacccc 300

tccggccaca cggcgagggc cttctggctg gcgctcgagc tcgaaggggt ctggaggtac 360

cctatgttaa cctacgcggc tctggtcgcg tggtcgcgcg ttcagctctg cgcgcactac 420

ccgctggacg tagtgggagg agcgttgagc gctttggcct tccgcgactt atgggaggtt 480

ctgctggaga gggtaggagc cttgaggggg cagcgcgctt ag 522

<210>168

<211>173

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>信号

<222>(1)...(30)

<220>

<221>结构域

<222>(48)...(167)

<223>PAP2超家族

<400>168

Met Ala Arg Ser Trp Lys Trp Arg Pro Leu Leu Ser Ser Phe Leu Leu

1 5 10 15

Val Ser Leu Ala Pro Phe Ser Thr Ser Val Pro Cys Phe Lys Leu Pro

20 25 30

Gly Leu Glu Ser Val Ala Phe Trp Ile Ser Thr Thr Met Asn Phe Phe

35 40 45

Pro Phe Leu Leu Tyr Thr Ala Ile Leu Ala Tyr Val Arg Lys Asp Tyr

50 55 60

Lys Ile Val Leu Glu Gly Leu Ala Leu Asn Ala Phe Val Leu Val Leu

65 70 75 80

Lys Tyr Ser Phe His Thr Pro Arg Pro Glu Gly Ser Gly His Leu Thr

85 90 95

Pro Gly Tyr Pro Ser Gly His Thr Ala Arg Ala Phe Trp Leu Ala Leu

100 105 110

Glu Leu Glu Gly Val Trp Arg Tyr Pro Met Leu Thr Tyr Ala Ala Leu

115 120 125

Val Ala Trp Ser Arg Val Gln Leu Cys Ala His Tyr Pro Leu Asp Val

130 135 140

Val Gly Gly Ala Leu Ser Ala Leu Ala Phe Arg Asp Leu Trp Glu Val

145 150 155 160

Leu Leu Glu Arg Val Gly Ala Leu Arg Gly Gln Arg Ala

165 170

<210>169

<211>579

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>169

atgagcattc gcgcagtctt cttcgacctt ggcggagtca tcgtccgcac tgaatatcaa 60

tcaccgcgcc agcagctggc agaccggctt ggcctggact acgatgactt gagcaggatc 120

gtctttgata gcgagacggg catcaaggcg acggttggca cgatcacatc ccagcagcat 180

tgggaagcgg tgatgaaacg cctgaaacgc cctcatgagg aaattaccgc catccgcgat 240

gaattctttg caggcgacat cattgaccgt gagatcatca gtttcctccg ttcactgcgc 300

ggcacctgca aaaccggatt gatctcgaac gcctggagcg acttgcgcga ctttatgaca 360

cgcgaaaaaa taatcgacgc cttcgaccat atcatcatct cgtcggaggt aggtgtggcc 420

aagccggaag cgaagatctt ccagattgcc ctggagcagg ccggggtgag tccgaacgag 480

gcggtgtttg tcgatgattt ttacgtcaat atcgaaggct gtgaaaaagt cggaatgaag 540

ggcattcatt ttaaggaccc cgaatccgct ttggctcaa 579

<210>170

<211>193

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(3)...(187)

<223>卤酸(haloacid)脱卤素酶-样水解酶

<400>170

Met Ser Ile Arg Ala Val Phe Phe Asp Leu Gly Gly Val Ile Val Ara

1 5 10 15

Thr Glu Tyr Gln Ser Pro Arg Gln Gln Leu Ala Asp Arg Leu Gly Leu

20 25 30

Asp Tyr Asp Asp Leu Ser Arg Ile Val Phe Asp Ser Glu Thr Gly Ile

35 40 45

Lys Ala Thr Val Gly Thr Ile Thr Ser Gln Gln His Trp Glu Ala Val

50 55 60

Met Lys Arg Leu Lys Arg Pro His Glu Glu Ile Thr Ala Ile Arg Asp

65 70 75 80

Glu Phe Phe Ala Gly Asp Ile Ile Asp Arg Glu Ile Ile Ser Phe Leu

85 90 95

Arg Ser Leu Arg Gly Thr Cys Lys Thr Gly Leu Ile Ser Asn Ala Trp

100 105 110

Ser Asp Leu Arg Asp Phe Met Thr Arg Glu Lys Ile Ile Asp Ala Phe

115 120 125

Asp His Ile Ile Ile Ser Ser Glu Val Gly Val Ala Lys Pro Glu Ala

130 135 140

Lys Ile Phe Gln Ile Ala Leu Glu Gln Ala Gly Val Ser Pro Asn Glu

145 150 155 160

Ala Val Phe Val Asp Asp Phe Tyr Val Asn Ile Glu Gly Cys Glu Lys

165 170 175

Val Gly Met Lys Gly Ile His Phe Lys Asp Pro Glu Ser Ala Leu Ala

180 185 190

Gln

<210>171

<211>834

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>171

atgggcaaag cgatgttctt cacggcagat gacggggcgc ggctggccta ttctgaccag 60

ggtaaggggc tgccggtcct gtgcctggcc gggctgacgc ggaacatggg cgatttcaat 120

tacgtcgctc cgcatctgtc gggcgtgcgg ctgatccgga tggactatcg cggacgcggg 180

cagtccgacc gcaccggcgc cgccacctat accgtcccgc aggaaggcaa ggatgcgctg 240

gcgctgctgg atcacctggg ggtggacagg gccgcgatcc tgggcacgtc tcgcggcggg 300

ctgatcggga tgctgctggc cgccgtggcg catgaccggc tgctggggct gtgcctgaac 360

gatgtcggcc cggtgatcga gcgcgcgggg ctggagcgga tcttcgacta tgtcgggcgc 420

aacccggcgg cgcggacgca tgaggcgctg gcggaacgac tgcctgcggc catgcccggc 480

ttcacaaatg tccccgatgg ccgttggctg gcggatgcgc agaagcatta cgacgaaacg 540

ccggaggggc tgcggatcaa atatgaccct gccctgcgcg aggcgttcct ggcagccttc 600

gagggcgctg cgccggatct gtggccgctg tgggatgcga ctgcgggact gcccgtcgcg 660

ctgatccggg gggccagttc cgacctgctg tctgctacgg ttgccgccga gatgctgcgc 720

cgccgccccg acacgatctt tgccgaggtt ccgggccgcg cccatgtgcc ttggctggac 780

gagccggaat cgctggatgc gatcaatgcc tggctggatc gctgcgggcg ctag 834

<210>172

<211>277

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<400>172

Met Gly Lys Ala Met Phe Phe Thr Ala Asp Asp Gly Ala Arg Leu Ala

1 5 10 15

Tyr Ser Asp Gln Gly Lys Gly Leu Pro Val Leu Cys Leu Ala Gly Leu

20 25 30

Thr Arg Asn Met Gly Asp Phe Asn Tyr Val Ala Pro His Leu Ser Gly

35 40 45

Val Arg Leu Ile Arg Met Asp Tyr Arg Gly Arg Gly Gln Ser Asp Arg

50 55 60

Thr Gly Ala Ala Thr Tyr Thr Val Pro Gln Glu Gly Lys Asp Ala Leu

65 70 75 80

Ala Leu Leu Asp His Leu Gly Val Asp Arg Ala Ala Ile Leu Gly Thr

85 90 95

Ser Arg Gly Gly Leu Ile Gly Met Leu Leu Ala Ala Val Ala His Asp

100 105 110

Arg Leu Leu Gly Leu Cys Leu Asn Asp Val Gly Pro Val Ile Glu Arg

115 120 125

Ala Gly Leu Glu Arg Ile Phe Asp Tyr Val Gly Arg Asn Pro Ala Ala

130 135 140

Arg Thr His Glu Ala Leu Ala Glu Arg Leu Pro Ala Ala Met Pro Gly

145 150 155 160

Phe Thr Asn Val Pro Asp Gly Arg Trp Leu Ala Asp Ala Gln Lys His

165 170 175

Tyr Asp Glu Thr Pro Glu Gly Leu Arg Ile Lys Tyr Asp Pro Ala Leu

180 185 190

Arg Glu Ala Phe Leu Ala Ala Phe Glu Gly Ala Ala Pro Asp Leu Trp

195 200 205

Pro Leu Trp Asp Ala Thr Ala Gly Leu Pro Val Ala Leu Ile Arg Gly

210 215 220

Ala Ser Ser Asp Leu Leu Ser Ala Thr Val Ala Ala Glu Met Leu Arg

225 230 235 240

Arg Arg Pro Asp Thr Ile Phe Ala Glu Val Pro Gly Arg Ala His Val

245 250 255

Pro Trp Leu Asp Glu Pro Glu Ser Leu Asp Ala Ile Asn Ala Trp Leu

260 265 270

Asp Arg Cys Gly Arg

275

<210>173

<211>642

<212>DNA

<213>未知

<220>

<223>从环境样品中获得

<400>173

gtgagcgggc tggccggggt gctcttcgac atgggtggcg tggtcatgga ctcgccgctg 60

cacgccatcg cgcggtacga gcgggagcgc gggctgccgc cgcactcgat caaccgcgcg 120

atcgcgaccg ccggcgagac gggggcgtgg gcccgactcg agcgcggcga gctgaccgtg 180

gcgacgttct gcgcaccgtt cgaagcggac tgtcgcgccc gcggcgtcga ggtggatggg 240

gcggcggtca tggccgcgat cgccgcggcc ggcgtggcgc gccccgccat gctggaggcg 300

attcgcagac tccgcgcgca cgggctccgc gtcggcgcgc tcaccaacaa ctggcggcga 360

gaaggacccg acgacgacgt gatcccgcac cgtctgcgct cccacttcga cgccttcgtg 420

gaatcacgcg cggtcggcct gcgcaagccc gacccgcgaa tctacgtgct ggcctgccac 480

gagctgggcg tggagccgtc gcggacggcg ttcctcgacg acatcggcgg caacctcaag 540

ccggcgcgcg cgctcgggat ggcgacgatc aaggtggacg acccggagcg ggcgctggtg 600

gagctcggtg tgctcgtgga gatggacctg ctcggcccgt ga 642

<210>174

<211>213

<212>PRT

<213>未知

<220>

<223>从环境样品中获得

<220>

<221>结构域

<222>(4)...(195)

<223>卤酸脱卤素酶样水解酶

<400>174

Met Ser Gly Leu Ala Gly Val Leu Phe Asp Met Gly Gly Val Val Met

1 5 10 15

Asp Ser Pro Leu His Ala Ile Ala Arg Tyr Glu Arg Glu Arg Gly Leu

20 25 30

Pro Pro His Ser Ile Asn Arg Ala Ile Ala Thr Ala Gly Glu Thr Gly

35 40 45

Ala Trp Ala Arg Leu Glu Arg Gly Glu Leu Thr Val Ala Thr Phe Cys

50 55 60

Ala Pro Phe Glu Ala Asp Cys Arg Ala Arg Gly Val Glu Val Asp Gly

65 70 75 80

Ala Ala Val Met Ala Ala Ile Ala Ala Ala Gly Val Ala Arg Pro Ala

85 90 95

Met Leu Glu Ala Ile Arg Arg Leu Arg Ala His Gly Leu Arg Val Gly

100 105 110

Ala Leu Thr Asn Asn Trp Arg Arg Glu Gly Pro Asp Asp Asp Val Ile

115 120 125

Pro His Arg Leu Arg Ser His Phe Asp Ala Phe Val Glu Ser Arg Ala

130 135 140

Val Gly Leu Arg Lys Pro Asp Pro Arg Ile Tyr Val Leu Ala Cys His

145 150 155 160

Glu Leu Gly Val Glu Pro Ser Arg Thr Ala Phe Leu Asp Asp Ile Gly

165 170 175

Gly Asn Leu Lys Pro Ala Arg Ala Leu Gly Met Ala Thr Ile Lys Val

180 185 190

Asp Asp Pro Glu Arg Ala Leu Val Glu Leu Gly Val Leu Val Glu Met

195 200 205

Asp Leu Leu Gly Pro

210

<210>175

<211>245

<212>PRT

<213>未知

<220>

<223>合成的

<400>175

Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile Asn Ser His Leu Trp

1 5 10 15

Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg Asn Thr Thr Ile Val

20 25 30

Asn Pro Asn Glu Thr Ala Leu Leu Ash Glu Trp Arg Ala Asp Leu Glu

35 40 45

Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro Tyr Tyr Asp Asp Ser

50 55 60

Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr Gly Thr Thr Tyr Ile

65 70 75 80

Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala Lys Tyr Phe Asn Leu

85 90 95

Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln Gln Ala Phe Phe Tyr

100 105 110

Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro Met His

115 120 125

Ala Ala Ser Phe Thr Asp Leu Ser Tyr Pro Met Gly Phe His Ser Lys

130 135 140

Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn Tyr Ile Val Ser Asp

145 150 155 160

Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn Pro Glu Asp Trp Ile

165 170 175

Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr Pro Gly Val Val Asn

180 185 190

Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala Val Ser Gln Glu Tyr

195 200 205

Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys Arg Leu

210 215 220

Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile His Leu Trp Phe Asp

225 230 235 240

Thr Tyr Val Asn Arg

245

<210>176

<211>282

<212>PRT

<213>未知

<220>

<221>信号

<222>(1)...(24)

<223>合成的

<400>176

Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala

1 5 10 15

Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro

20 25 30

Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile

35 40 45

Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg

50 55 60

Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp

65 70 75 80

Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro

85 90 95

Tyr Tyr Asp Asp Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr

100 105 110

Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala

115 120 125

Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln

130 135 140

Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val

145 150 155 160

Asn Gln Pro Met His Ala Ala Ser Phe Thr Asp Leu Ser Tyr Pro Met

165 170 175

Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn

180 185 190

Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn

195 200 205

Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr

210 215 220

Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala

225 230 235 240

Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val

245 250 255

Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile

260 265 270

His Leu Trp Phe Asp Thr Tyr Val Asn Arg

275 280

Claims

1.分离的、合成的或重组的核酸，其是编码具有磷脂酶C活性的多肽的核酸，其中所述核酸序列是：

(a)SEQ ID NO：1；

(b)编码SEQ ID NO：2中所阐明的多肽的核酸；或

(c)编码多肽的核酸，所述多肽如SEQ ID NO：2的38至282位氨基酸所示且具有N63D、N131S和N134D的氨基酸修饰。

2.权利要求1所述的核酸，其中所述核酸序列是在SEQ ID NO：1中阐明的所述序列。

3.权利要求1所述的核酸，其中所述核酸序列编码多肽，所述多肽是在SEQID NO：2中所阐明的序列。

4.权利要求1所述的核酸，其中所述磷脂酶活性催化甘油磷酸酯键的水解。

5.表达盒，其具有在权利要求1中所阐述的核酸序列。

6.载体，其具有在权利要求1中所阐述的核酸序列。

7.克隆载体，其具有在权利要求1中所阐述的核酸序列。

8.权利要求7所述的克隆载体，其中所述病毒载体是腺病毒载体、逆转录病毒载体或者腺相关病毒载体。

9.权利要求7所述的克隆载体，其为细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)或者哺乳动物人工染色体(MAC)。

10.转化的细胞，其具有在权利要求1中所阐述的核酸序列。

11.转化的细胞，其具有在权利要求5中所阐述的表达盒。

12.权利要求11所述的转化的细胞，其中所述细胞是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或者植物细胞。

13.分离的、合成的或重组的多肽，其具有磷脂酶C活性，其中所述多肽是：

(i)SEQ ID NO：2中所阐明的氨基酸序列；(ii)由SEQ ID NO：1中所阐明的核酸序列编码；或(iii)(i)或(ii)如SEQ ID NO：2的38至282位氨基酸所示且具有N63D、N131S和N134D的氨基酸修饰的多肽。

14.权利要求13所述的多肽，其中该多肽是在SEQ ID NO：2中所阐明的序列。

15.权利要求13所述的多肽，其中所述磷脂酶C活性催化甘油磷酸酯键的水解。

16.权利要求13所述的多肽，其中所述多肽具有至少一个糖基化位点。

17.权利要求16所述的多肽，其中所述糖基化是N-连接糖基化。

18.权利要求17所述的多肽，其中所述多肽是在巴斯德毕赤酵母(P.pastoris)或者粟酒裂殖酵母(S.pombe.)中表达之后被糖基化。

19.蛋白制剂，其具有在权利要求13中阐明的多肽，其中所述蛋白制剂包括液体、固体或凝胶。

20.固定化多肽，其中所述多肽是权利要求13中所阐明的序列。

21.权利要求20所述的固定化多肽，其中所述多肽固定于细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、阵列或者毛细管。

22.水解、分解或破坏磷脂组合物的方法：

(a)提供权利要求13中所阐明的多肽；

(b)提供具有磷脂的组合物；和

(c)在所述磷脂酶水解、分解或破坏磷脂组合物的条件下，将步骤(a)的多肽与步骤(b)的组合物接触。

23.权利要求22所述的方法，其中所述组合物是含有磷脂的脂双层或膜。

24.权利要求22所述的方法，其中所述组合物是植物细胞、细菌细胞、酵母细胞或动物细胞。

25.去污剂组合物，具有权利要求13中阐明的多肽。

26.权利要求25所述的去污剂组合物，其中所述磷脂酶配制成非含水液体组合物、铸造固体、冻干粉末、粒状形式、微粒形式、压缩片剂、小丸、凝胶形式、膏、气溶胶或浆体形式。

27.油脱胶的方法：

(a)提供权利要求13所阐明的多肽；

(b)提供组合物，该组合物具有含有磷脂的脂肪或油；和

(c)在所述多肽可以催化所述组合物中的磷脂水解的条件下，将步骤(a)的多肽与步骤(b)的组合物接触。

28.权利要求27所述的方法，其中所述含油的组合物是植物油、藻油、鱼油或者脂肪。

29.权利要求28所述的方法，其中所述植物油是米糠油、大豆油、菜籽油、玉米油、来自棕榈仁的油、芥花油、葵花籽油、芝麻油或花生油。

30.权利要求27所述的方法，其中所述多肽水解来自含油组合物中的可水合的和/或不可水合的磷脂(phospholipid)中的磷脂(phosphatide)。

31.权利要求27所述的方法，其中所述多肽在甘油磷酸酯键处水解磷脂，产生甘油二酯和水溶性磷酸化合物。

32.权利要求27所述的方法，其中所述接触是水解油中的水合磷脂。

33.权利要求27所述的方法，其中步骤(c)的水解条件是在碱性pH下，温度从20℃到40℃。

34.权利要求33所述的方法，其中所述碱性条件是pH从pH8到pH10。

35.权利要求27所述的方法，其中步骤(c)的水解条件是反应时间从3分钟到10分钟。

36.权利要求27所述的方法，其中所述多肽结合到过滤器上，使所述含有磷脂的脂肪或油通过所述过滤器。

37.权利要求27所述的方法，其中所述多肽加入到含有磷脂的脂肪或油的溶液中，然后使所述溶液通过过滤器。

38.将不可水合磷脂转化为可水合形式的方法：

(a)提供权利要求13中阐明的多肽；

(c)提供不可水合磷脂；和

(d)在所述多肽将所述不可水合磷脂转化为可水合形式的条件下，将步骤(a)的多肽和步骤(b)的组合物接触。

39.对含有磷脂的组合物进行碱炼的方法：

(a)提供权利要求13中阐明的多肽；

(b)提供磷脂；和

(c)在所述碱炼之前、之中或之后，将步骤(a)的多肽和步骤(b)的组合物接触。

40.权利要求39所述的方法，其中所述具有磷脂酶活性的多肽在加入酸或碱之前加入。

41.权利要求39所述的方法，其中所述具有磷脂酶活性的多肽是在碱炼过程中被加入的，依据磷的水平和游离脂肪酸的水平加入变化水平的酸和碱。

42.权利要求39所述的方法，其中所述具有磷脂酶活性的多肽在碱炼之后被加入：分离以前，在强混合器或阻滞混合器中；加热步骤之后；在离心机中；在皂脚中；在洗涤水中；或在漂白或除臭步骤中。

43.精炼粗油的方法：

(a)提供权利要求13中阐明的多肽；

(b)提供含有磷脂的油；和

(c)在所述多肽能够催化所述油中的磷脂水解的条件下，将步骤(a)的多肽和步骤(b)的油接触。

44.权利要求43所述的方法，其中所述处理时间为小于2小时。

45.权利要求44所述的方法，其中所述处理时间为小于60分钟。

46.权利要求45所述的方法，其中所述处理时间小于30分钟。

47.权利要求43所述的方法，其中所述水解条件是温度在25℃-70℃之间。

48.权利要求43所述的方法，其中所述水解条件是使用苛性碱。

49.权利要求43所述的方法，其中所述水解条件是pH在pH3到pH10之间。

50.权利要求43所述的方法，其中所述水解条件包括添加乳化剂和混合所述油。

51.权利要求43所述的方法，添加破乳剂或加热或冷却，从而促进含水相的分离。

52.权利要求43所述的方法，其中在接触步骤前进行脱胶，以通过离心收集卵磷脂，然后加入PLC、PLA，从而除去不可水合的磷脂。

53.权利要求43所述的方法，其中对于食用油，对粗油进行水脱胶到少于10ppm的磷。

54.权利要求43所述方法，其中添加酸以促进非水合磷脂的水合。

55.对油或脂肪进行脱胶的方法：

(a)提供权利要求13中阐明的多肽；

(b)提供含有磷脂的脂肪或油；和

(c)在所述多肽可以催化所述脂肪或油中磷脂水解条件下，将步骤(a)的多肽和步骤(b)的脂肪或油接触。

56.权利要求1所述的核酸，其中所述多肽催化水解磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)或磷脂酸中的甘油磷酸酯键或其组合。

57.权利要求13所述的多肽，其中所述多肽催化水解磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、或磷脂酸中的甘油磷酸酯键或其组合。

58.权利要求27的方法，其中所述具有磷脂酶活性的多肽具有PLC活性，所述方法增加中性油。

59.权利要求27的方法，其中所述具有磷脂酶活性的多肽具有PLC活性，所述方法增加二酰甘油(DAG)产量，从而增加油相。

60.权利要求27的方法，其中所述水解条件包括碱性pH。

61.权利要求27的方法，其中所述碱性条件足以将由PLC产生的1，2-DAG异构化成1，3-DAG。

62.权利要求27的方法，进一步包括：通过加入硬化物质，以物理方式将由脱胶方法产生的胶除去。

63.权利要求62的方法，其中所述硬化物质包括云母。

64.权利要求27的方法，其中最终脱胶的油产物富集有1，3-DAG。

65.权利要求64的方法，其中最终脱胶的油产物包含不少于1.0％的1，3-DAG。

66.减少胶量并通过减少油被捕获的数量来增加中性油产量的方法：

(a)提供权利要求13中所阐明的多肽；

(b)提供含有磷脂的脂肪或油；和

(c)将步骤(a)的多肽与步骤(b)的组合物在其中所述多肽能够催化水解所述组合物中的磷脂的条件下接触足够的时间，以减少胶量并增加中性油。

67.表达权利要求13的多肽的方法：

(a)提供具有Mut⁺表型的毕赤酵母菌株；

(b)将权利要求1的异源磷脂酶C编码核酸插入所述毕赤酵母菌株中；和

(c)在所述磷脂酶被表达的条件下，培养所述毕赤酵母菌株。

68.权利要求67的方法，其中为所述培养条件补充锌。

69.表达磷脂酶C的细胞系统，包括Mut⁺表型毕赤酵母菌株，该菌株含有可操作性地连接到启动子的异源磷脂酶C编码核酸，所述启动子在所述毕赤酵母菌株中是可操作性的，其中所述磷脂酶C编码核酸是权利要求1的核酸。

70.表达异源蛋白的细胞系统，包括对zeocin具有抗性的毕赤酵母菌株细胞，其中所述异源蛋白由权利要求1的核酸编码。

71.生产zeocin-抗性酵母细胞系统的方法，所述酵母细胞系统用于表达异源蛋白，所述方法包括如下步骤：

(a)提供毕赤酵母某种(Pichia sp.)的细胞和能够表达异源蛋白的异源核酸，其中所述异源蛋白编码核酸是权利要求1的核酸；

(b)将所述细胞培养在包含起始浓度的zeocin的条件下；

(c)选择对所述起始浓度的zeocin具有抗性的细胞，并重新培养在包含更高浓度的zeocin的条件下；和

(d)选择在步骤(c)中培养的、对所述更高浓度的zeocin具有抗性的细胞。