附图简述
下图是本发明的实施方案的例示性说明,并不为了限制权利要求所包含的发明范围。
图1是计算机系统的框图,具体的细节说明参见下文。
图2是过程200的一个方面的流程图,为了确定新序列和数据库中的序列之间的同源性水平,把新的核苷酸或蛋白质序列与数据库中的序列相比较,具体的细节说明参见下文。
图3是举例说明在计算机中确定两个序列是否是同源的过程的实施方案的流程图,具体细节说明参见下文。
图4是举例说明标识符过程的一个方面的流程图,该标识符过程用于检测序列中特征的存在与否,具体的细节说明参见下文。
图5A、5B和5C用图表说明用于模拟PLC-介导的脱胶的典型两相系统,具体的细节说明参见下文。
图6用图表说明了应用本发明的磷脂酶的典型的植物油精炼过程。
图7用图表说明用于物理精炼油的发明的典型脱胶过程,具体的细节说明参见下文。
图8用图表说明用本发明的磷脂酶C进行的磷脂水解,具体的细节说明参见下文。
图9用图表说明了本发明的示例性碱法精炼工艺,说明了用本发明的磷脂酶C作为“碱法精炼辅助剂”(长混合碱法精炼)的一个可选择的实施方案,具体的细节说明参见下文。
图10用图表说明了用本发明的磷脂酶C作为脱胶辅助剂,具体的细节说明参见下文。
图11用图表描述了本发明的示例性核酸和多肽的选择的特征,如在下面进一步详细描述地。
图12图示了来自本发明的两个酶系统的数据,如在下面实施例3中所述。
图13图示了本发明的示例性碱炼工艺,并示出了一个可选的实施方案,包括应用本发明的酶C作为“碱炼助剂”(长混合碱炼(Long Mix Caustic Refining)),如下面详细描述地。
图14示出了本发明方法的另一种示例性变化,其中在工艺中使用了两个离心步骤,如下面详细描述地。
图15示出了本发明方法的另一种示例性变化,其中在工艺中使用了三个离心步骤,如下面详细描述地。
图16示出了本发明方法的另一种示例性变化,其使用酸处理并在脱胶步骤之前具有离心步骤,如下面详细描述地。
图17示出了体外消化试验的结果,其中本发明的磷脂酶C变体,如下面实施例4中详细描述地。
图18示出了使用本发明的示例性酶进行的分批发酵罐培养的结果,如下面实施例5中详细描述地。
图19示出了本发明的巴斯德毕赤酵母MutS菌株的氧吸收速率(″OUR″)比较结果,如下面实施例5中详细描述地。
图20示出了本发明的巴斯德毕赤酵母MutS菌株的甲醇消耗图结果,如下面实施例5中详细描述地。
图21示出了本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物的“OUR”图,如下面实施例5中详细描述地。
图22示出了SDS-PAGE的结果,显示了在培养物中产生的PLC蛋白的质量,和与之相应的、本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物的“OUR”图,如下面实施例5中详细描述地。
图23示出了SDS-PAGE的结果,显示了活性PLC的数量,该活性PLC位于本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物的胞内,如下面实施例5中详细描述地。
图24示出了与活性PLC相关的酵母细胞形态学变化的可视化图——本发明SEQ ID NO:2的示例性PLC酶的重组形式,如下面实施例5中详细描述地。
图25用概述了数据,显示了在95h TFT(总发酵时间),在毕赤酵母中,使用本发明SEQ ID NO:2的示例性PLC酶进行的PLC生产性能的状态,如下面实施例5中详细描述地。
图26是表,概述了数据,这些数据来自对本发明的示例性zeocin-适应的细胞菌落的表达筛选,如下面实施例5中详细描述地。
图27示出了数据,这些数据显示,在含有本发明的示例性zeocin-适应的细胞菌落的培养物中,PLC蛋白水平是较高的,如下面实施例5中详细描述地。
图28示出了数据,这些数据显示了本发明的zeocin-适应的细胞菌落与对照的生长比较,如下面实施例5中详细描述地。
图29示出了加热试验的结果,显示了本发明SEQ ID NO:2的示例性酶的热稳定性,图中指出了条件,如下面实施例5中详细描述地。
图30示出了总结加热试验的NMR数据,证明了本发明SEQ ID NO:2的示例性酶的热稳定性,如下面实施例6中详细描述地。
图31、32和33示出了数据,这些数据证明了SEQ ID NO:2的热稳定性,使用p-NPPC,条件为图中显示的条件,如下面实施例6中详细描述地。
图34示出了数据,这些数据证明了SEQ ID NO:2的热稳定性,使用DSC分析,如下面实施例6中详细描述地。
不同图中的类似参考符号表明类似的元素。
发明详述
本发明提供了磷脂酶,例如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷脂酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽,编码它们的多核苷酸,以及制备和应用它们的方法。本发明提供了有效地切割油诸如植物油中的甘油磷酸酯键,例如油籽磷脂,从而产生水可提取的磷酸化的碱和甘油二酯的酶。一方面,本发明的磷脂酶具有脂酰水解酶(LAH)的活性。在可选择的方面,本发明的磷脂酶可以切割磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸和/或鞘磷脂或它们的组合中的甘油磷酸酯键(glycerophosphate esterlinkage)。例如,在一个方面,本发明的磷脂酶对一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE和PS;PS和PE;PS和PI;PI和PE;PS、PI和PC;PE、PI和PC;或PE、PS、PI和PC具有特异性作用。
本发明的磷脂酶(如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷脂酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽)可以用于植物油的酶法脱胶,这是因为磷酸部分可溶于水,并且容易去除。甘油二酯产物将仍存留在油中,从而降低损失。本发明的PLCs可以用作在商业上的油脱胶诸如ENZYMAX
工艺中的PLA1s和PLA2s的补充或者替代,在所述ENZYMAX
工艺中磷脂是由PLA1和PLA2水解的。
在一方面,本发明的磷脂酶在高温和/或低温下,或者在较宽的温度范围内,具有活性,例如,它们可以在20℃到90℃,30℃到80℃,或者在40℃到70℃的温度范围具有活性。本发明也提供在碱性pH或者酸性pH,例如低的水酸度具有活性的本发明的磷脂酶。在可选择的方面,本发明的磷脂酶可以在酸性pH低至pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0和pH3.5或更加酸性(即pH<3.5) 的条件下仍具有活性。在可选择的方面,本发明的磷脂酶可以在碱性pH高至pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、pH10或碱性更大(即pH>10)的条件下具有活性。一方面,本发明的磷脂酶在低水活度(低的水含量)条件下,在约40℃到约70℃、75℃或80℃或更高温度之间的温度下具有活性。
本发明也提供了用于进一步修饰本发明的示范性磷脂酶以产生具有期望特性的酶的方法。例如,由本发明方法产生的磷脂酶可以具有改变了的底物特异性、底物结合特异性、底物切割型式、热稳定性、pH/活性曲线、pH/稳定性曲线(如在较低pH值,例如pH<6或者pH<5,或者较高的pH值,如pH>9的情况下稳定性提高)、对于氧化作用的稳定性、Ca2+依赖性、比活性和类似特性。本发明提供对于任何感兴趣特性的改变。例如,这些改变可以产生与母本磷脂酶相比具有改变的pH和温度活性曲线的变异体。
在一方面,本发明的磷脂酶被用于各种植物油处理步骤中,如植物油提取中,特别地,用在称为“油脱胶”的过程中去除“磷脂胶(phospholipid gums)”,如本文所述。本发明提供了组合物(例如包含本发明的酶)和由各种来源生产植物油的工艺,所述各种来源如米糠、大豆、油菜、花生、芝麻、向日葵和玉米。本发明的磷脂酶可以在任何植物油加工步骤中被用于替代PLA,例如磷脂酶A2。
定义
术语“磷脂酶”包括具有任何磷脂酶活性的酶,例如,切割油中,如植物油中的甘油磷酸酯键(催化水解甘油磷酸酯键)。本发明的磷脂酶活性可以产生可水提取的磷酸化的碱以及甘油二酯。本发明的磷脂酶活性也包括在高温、低温、碱性pH和酸性pH条件下水解甘油磷酸酯键。术语“磷脂酶活性”也包括切割甘油磷酸酯以产生可水提取的磷酸化的碱以及甘油二酯。术语“磷脂酶活性”也包括切割磷脂中甘油和磷酸的酯键。术语“磷脂酶活性”也包括其它的活性,如结合并水解底物的能力,底物如油,例如植物油,底物也包括植物和动物磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶B(PLB)活性,如磷脂酶B1或者磷脂酶B2活性,包括溶血磷脂酶(LPL)活性和/或溶血磷脂酶-转酰基酶(LPTA)活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;和/或patatin活性或它们的任何组合。磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中或者任何茄属植物(Solanum)如马铃薯(Solanum tuberosum.)中的糖蛋白。磷脂酶活性可以包括patatin酶活性,如patatin酯酶活性(见,例如,Jimenez(2002)Biotechnol.Prog.18:635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。磷脂酶活性可以包括对一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE和PS;PS和PE;PS和PI;PI和PE;PS、PI和PC;PE、PI和PC;或PE、PS、PI和PC,或它们的任何组合具有特异性作用。
在一个方面,本发明的磷脂酶可以具有多功能活性,例如一种或多种本文中描述的酶活性的组合。例如,在一个方面,本发明的多肽具有酶活性,但是缺少脂酶活性,或缺少影响中性油(甘油三酯)组分的任何酶活性。在特定的工艺中,例如在脱胶工艺中使用这样的多肽可能是有利的,在脱胶工艺中,中性油组分不受损害(减少、降解例如水解)是重要的。因此,在一个方面,本发明提供了脱胶工艺,该工艺包括使用具有磷脂酶活性但是缺少脂酶活性的本发明多肽。
在一个方面,本发明的PLC磷脂酶利用(例如催化水解)各种磷脂底物,包括磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)和/或磷脂酸或它们的组合。此外,这些酶对这些磷脂的溶血磷脂形式具有不同程度的活性。在各个方面,本发明的PLC酶可以对磷脂酰胆碱和磷脂酰乙醇胺作为底物显示出偏好性。
在一个方面,本发明的磷脂酰肌醇PLC磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的磷脂酰肌醇PLC酶可以对磷脂酰肌醇作为底物显示出偏好性。
在一个方面,本发明的patatin酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的patatin可以基于氨基序列相似性的保守性。在不同的方面,这些酶展示出多组不同的生物化学特性,并可以进行PLA1、PLA2、PLC或PLD酶类的特征性反应。
在一个方面,本发明的PLD磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在一个方面,这些酶可用于进行转酯反应,以产生具有一定结构的磷脂。
术语“抗体”包括源自、建模自(modeled after)或者实质上编码自一种或多种免疫球蛋白基因或其片段的肽或者多肽,其能够特异地结合于抗原或者表位,参见,例如Fundamental lmmunology,Third Edition,W.B.Paul,ed.,Raven Press,N.Y.(1993);Wilson(1994)J.Immunol.Methods 175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods 25:85-97。术语抗体包括抗原结合部分,即,“抗原结合位点”(例如,保持了结合抗原能力的片段、子序列、互补决定区(CDRs),包括:(i)Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,包括在铰链区通过二硫键连接两个Fab片段的二价片段;(iii)由VH和CH1结构域组成的Fd片段;(iv)由抗体单臂的VL和VH结构域组成的Fv片段,(v)由VH结构域组成的dAb片段(Ward et al.,(1989)Nature 341:544-546);以及(vi)分离的互补决定区(CDR)。单链抗体也被包括于术语“抗体”中。
在此应用的术语“阵列(array)”或者“微阵列(microarray)”或者“生物芯片(biochip)”或者“芯片(chip)”是许多靶元素,每一个靶元素包括确定量的一个或者多个多肽(包括抗体)或者固定于底物表面积的确定区域上的核酸,参见下面进一步的具体讨论。
正如在此所用地,术语“计算机”,“计算机程序”和“处理器”以它们最广的含义使用,并整合所有这样的设备,如以下详细描述的。
特定的多肽或者蛋白的“编码序列”或者“编码特定的多肽或者蛋白的序列”,是指当置于合适的调控序列的控制下可以转录和翻译成多肽或者蛋白的核酸序列。
在此使用的术语“表达盒(expression cassette)”是指在宿主细胞中可以影响结构基因表达(即,编码蛋白质,如本发明的磷脂酶的序列)的核苷酸序列,所述宿主细胞与所述核苷酸序列相容。表达盒包括至少一个可以可操作地连接至编码多肽的序列上的启动子;并且,可选择地,连接有其它的序列例如,转录终止信号。也可以应用进行表达所必要的或有帮助的额外的因子,例如,增强子。如在此所应用的“可操作地连接(Operably linked)”是指连接DNA序列上游的启动子,这样该启动子能够介导该DNA序列的转录。因此,表达盒也包括质粒、表达载体、重组病毒、任何形式的重组的“裸露DNA”载体,和类似物。“载体”包括可以感染、转染、瞬间或者永久转导细胞的核酸。将被认识到,载体可以是裸露的核酸,或者与蛋白或者脂类复合的核酸。载体可选择地包括病毒或者细菌的核酸和/或蛋白,和/或膜(如,细胞膜,病毒的脂包膜,等等)。载体包括,但不限于复制子(如,RNA复制子,细菌噬菌体),DNA片段可以连接到其上,并被复制。载体因此包括,但不限于是RNA,自主复制的环状或者线性的DNA或者RNA(如,质粒、病毒以及类似物,参见,如,美国专利No.5,217,879),并且也包括表达载体和非表达质粒。当重组微生物或者细胞培养物被描述容纳“表达载体”时,其包括染色体外的环状和线性DNA,和已经整合进入宿主染色体的DNA。当载体由宿主细胞维持时,该载体可以在细胞有丝分裂期间作为自主结构由细胞稳定地复制,或者整合入宿主基因组中。
“质粒”的命名为在大写字母和/或数字之前和/或之后加上小写字母“p”。在此使用的起始质粒(starting plasmid)可以通过商业渠道获得,通过公共渠道自由获得,或者按照公开的程序从可利用的质粒构建得到。此外,与那些在此描述的质粒等价的质粒是在本领域是已知的,并且对普通技术人员而言是显而易见的。
术语“基因”是指参与产生多肽链的DNA片段,包括,在编码区的前面和后面的区域,如头部和尾部,启动子和增强子,以及适当情况下,单个编码片段(外显子)之间的插入序列(内含子),等等。
如在此应用的短语“核酸”或者“核酸序列”是指寡核苷酸、核苷酸、多核苷酸、或者是指它们中的任何之一的片段,是指基因组或者合成来源的DNA或者 RNA(如,mRNA、rRNA、tRNA、iRNA),其可以是单链的或者双链的,并且可以代表有义链或者无义链,是指肽核酸(PNA),或者是指任何DNA样或者RNA样的物质,天然的或者合成来源的,包括如,iRNA,核糖核蛋白(如双链iRNA,如iRNPs)。该术语包括核酸,即,寡核苷酸,包括天然核苷酸的已知类似物。该术语也包括具有合成骨架的核酸样结构,见,如,Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry 36:8692-8698;Samstag(1996)Antisense Nucleic Acid Drug Dev 6:153-156。
在此应用的“氨基酸”或者“氨基酸序列”是指寡肽,肽,多肽,或者蛋白序列,或者是指这些序列中的任何序列的片段、部分或亚基,并且是指天然产生的或者合成的分子。
在此应用的术语“多肽”和“蛋白”是指通过肽键或者修饰的肽键相互连接在一起的氨基酸,即,肽等排体,可以含有除了20个基因编码的氨基酸外的修饰氨基酸。术语“多肽”也指肽或者多肽片段,基序(motif)和类似物。该术语也包括糖基化的多肽。本发明的肽或者多肽也包括所有“模拟”和“肽模拟”形式,如下面进一步描述地。
如在此所应用的,术语“分离的”是指从起始的环境(如,如果是天然发生的,那么就是天然环境)中移取的物质。例如,存在于活动物中的天然发生的多核苷酸或者多肽不是分离的,但是,如果该同样的多核苷酸或者多肽,与天然系统中的一些或者所有的共存物分离,那么就是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或者多肽可以是一个组合物的一部分,并且仍然是分离,这是因为这样的载体或者组合物不是天然环境的一部分。正如在此使用的,分离的物质或者组合物也可以是“纯化”的组合物,即,它并不需要绝对的纯度;相反,认为其是相对性的定义。从文库中得到的单个核酸可以经过常规纯化为具有电泳均一性。可选择的方面,本发明提供从基因组DNA或者从文库中的其它序列中或者其它的环境中纯化至少一个、两个、三个、四个、五个或者更多数量级的核酸。
正如在此应用的,术语“重组子”是邻接于“骨架”核酸的核酸,而在天然环境下它们并不邻接。在一方面,核酸代表了核酸“骨架分子”群体中5%或者更多数目的核酸插入物。本发明的“骨架分子”包括核酸,如表达载体、自主复制核酸、病毒、整合性核酸,和用于维持或者操作感兴趣的核酸插入物的其他的载体或者核酸。在一方面,富集的核酸代表了重组骨架分子群体中的15%、20%、30%、40%、50%、60%、70%、80%、90%或者更多数目的核酸插入物。“重组”多肽或者蛋白是指由重组DNA技术产生的多肽或者蛋白,如,从用编码所需多肽或者蛋白的外源DNA构建物转化的细胞产生。“合成的”多肽或者蛋白是那些通过化学合成制备的多肽或者蛋白,如下面进一步描述地。
如下面进一步讨论地,当在启动子处启动转录的RNA聚合酶将编码序列转录成为mRNA时,启动子序列被“可操作地连接于”编码序列。
“寡核苷酸”是指单链多脱氧核苷酸或者两个互补的多脱氧核苷酸链,它们可以通过化学合成。这样合成寡核苷酸在5’没有磷酸,因此在激酶存在时,不通过ATP加入磷酸的情况下,不能连接于另一个寡核苷酸。合成的寡核苷酸将连接于没有脱磷酸化的片段。
在两核酸或者多肽上下文中的短语“实质上相同(substantially identical)”,是指当为了获得最大对应性(correspondence)而比较和比对时,具有至少50%、60%、70%、75%、80%、85%、90%、95%、98%或者99%的核苷酸或者氨基酸残基(序列)同一性的两个或者多个序列,所述最大对应性用任何已知的序列比较算法测量,如以下详细讨论的,或者通过目测的方法测量。在可选择的方面,本发明提供与本发明的示范性序列,如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8等等在核酸或者多肽的至少大约100个残基、150个残基、200个残基、300个残基、400个残基的区域内或者从约50个残基到全长之间的区域内,实质上相同的核酸和多肽序列。本发明的核酸序列可以在多肽编码区域的整个长度上实质上相同。
另外的,“实质上相同(substantially identical)”的氨基酸序列是与参考序列差异一个或者多个保守性或者非保守性的氨基酸取代、缺失或者插入的序列,特别地,当这样的取代发生在分子的非活性位点的位置上,只要多肽基本上保留了它的功能特性。保守氨基酸的取代,例如,用一个氨基酸取代另一个同类的氨基酸(如,将一个疏水氨基酸,如异亮氨酸、缬氨酸、亮氨酸或者甲硫氨酸置换为另一个疏水氨基酸,或者将极性氨基酸置换为另一个极性氨基酸,如,将赖氨酸置换为精氨酸,将谷氨酸置换为天冬氨酸或者,将谷酰胺置换为天冬酰胺)。可以缺失一个或者多个氨基酸,例如,从磷脂酶多肽中缺失一个或者多个氨基酸,从而对多肽结构进行修饰,而并不显著改变其生物活性。例如,可以去除对于磷脂酶的生物活性并不需要的氨基或者羧基端氨基酸。可以通过很多的方法分析本发明修饰的多肽序列的磷脂酶活性,包括将修饰的多肽序列与磷脂酶底物接触,并且确定是否修饰的多肽减少了分析中的特异底物的量或者增加了功能性磷脂酶与底物的酶促反应的生物产物的量,如下面进一步论述地。
“杂交”是指通过碱基配对,核酸链与互补链结合的过程。杂交反应可能是敏感的并且具有选择性,这样可以鉴定在样品中以低浓度存在的感兴趣的特定的序列。合适的严格条件可以通过例如,预杂交和杂交溶液中的盐和甲酰胺浓度,或者杂交温度来确定,并且本领域是熟知的。例如,严格性的增加可以通过降低盐浓度,增加甲酰胺的浓度,或者提高杂交温度,改变杂交时间予以实现,如下面所详细描述地。在可选择的方面,本发明的核酸通过它们可以在各种的严格条件下(如,高,中,和低)杂交的能力来确定,如在此所阐明地。
术语“变异体”是指在一个或者多个碱基对、密码子、内含子、外显子、或者氨基酸残基(分别地)被修饰,但仍保持本发明的磷脂酶的生物活性的本发明的多核苷酸或者多肽。变异体可以通过很多种方法产生,例如,易错PCR、重排、寡核苷酸定向诱变、装配PCR、有性PCR诱变、体外诱变、盒式诱变、递归整体诱变、指数整体诱变、定点诱变、基因重装配,GSSMTM和它们的组合。在此包括了产生在一定的pH或温度下具有活性的磷脂酶,例如,不同与野生型磷脂酶的突变体技术。
术语“饱和诱变(saturation mutagenesis)”、基因位点饱和诱变TM(GSSMTM)或者“GSSMTM”,包括应用简并的寡核苷酸引物将点突变引入多核苷酸中的方法,如下的详细解释。
术语“优化的定向进化系统(optimized directed evolution system)”或者“优化的定向进化(optimized directed evolution)”包括对相关核酸序列,例如,相关基因的片段重新进行装配的方法,并在下面进行了详细解释。
术语“合成连接重装配(synthetic ligation reassembly)”或者“SLR”包括以非随机的方式连接寡核苷酸片段的方法,并在下面进行了详细解释。
核酸的产生和操作
本发明提供分离的或重组的核酸(例如示范性的SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ IDNO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ IDNO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ IDNO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ IDNO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173),包括编码本发明的多肽和磷脂酶的表达盒,如表达载体。本发明也包括应用本发明的核酸发现新 的磷脂酶序列的方法。也提供用于修饰本发明核酸的方法,例如,合成连接重装配、优化的定向进化系统和/或饱和诱变。
通过,如,克隆和表达cDNA文库,通过PCR扩增信使或者基因组DNA,和类似方法,发明的核酸可以制备,合成和/或进行操作。在实践本发明的方法中,通过操作模板核酸,可以修饰同源基因,正如在此所述的。本发明可以和本领域已知的其它任何方法或者方案或者装置结合进行实践,这些方法或者方案或者装置在科学和专利的文献中得到充分描述。
一般技术
用于实践本发明的核酸,不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或者它们的杂合体,都可以自不同的来源分离,进行遗传工程改造,扩增,和/或表达/重组产生。从这些核酸产生的重组多肽可以单独分离或者克隆,并且检测所需的活性。可以应用任何重组表达系统,包括细菌、哺乳动物、酵母、昆虫或者植物细胞表达系统。
可选择地,这些核酸可以通过已知的化学合成技术在体外合成,如在如Adams(1983)J.Am.Chem,Soc.105:661;Belousov(1997)Nucleic Acids Res.25:3440-3444;Frenkel(1995)Free Radic.Biol.Med.19:373-380;Blommers(1994)Biochemistry 33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066中描述的。
用于核酸操作的技术,如,亚克隆,探针标记(如,使用Klenow聚合酶的随机引物标记,切口平移,扩增),测序,杂交等等,这些方法在科学和专利文献中已充分描述,参见,如,Sambrook,ed.,MOLECULAR CLONING:ALABORATORY MANUAL(2ND ED.),Vols.1-3,Cold Spring Harbor Laboratory,(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,New York(1997);LABORATORY TECHNIQUES INBIOCHEMSTRY AND MOLECULAR BIOLOGY:HYBRlDlZATION WITHNUCLEIC ACID PROBES,Part I.Theory and Nucleic Acid Preparation,Tijssen,ed.Elsevier,N.Y.(1993)。
获得和操作用于实践本发明方法的核酸另一有用方法是从基因组样品中克隆,并且如果需要,筛选和再克隆从例如,基因组克隆或者cDNA克隆中分离或者扩增的插入物。在发明方法中使用的核酸的来源包括包含于如,哺乳动物人工染色体(MACs)中的基因组或者cDNA文库,见如,美国专利5,721,118,6,025,155;人类人工染色体,见,如,Rosenfeld(1997)Nat.Genet.15:333-335,酵母人工染色体(YAC);细菌人工染色体(BAC);P1人工染色体,见,如,Woon(1998)Genomics 50:306-316;P1衍生的载体(PACs),见,如,Kern(1997)Biotechniques 23:120-124,粘粒、重组病毒、噬菌体或者质粒。
在一方面,编码本发明多肽的核酸在适当的阶段与能够指导翻译的多肽或者片段分泌的前导序列装配在一起。
本发明提供融合蛋白和编码融合蛋白的核酸。本发明的多肽可以与异源的肽或者多肽融合,如N-末端鉴定肽,其赋予了所需的特征,如增加的稳定性或者简化的纯化方法。本发明的肽和多肽也可以以与一个或者多个连接其上的额外的结构域形成融合蛋白的形式合成并表达,从而,如,产生更具免疫源性的肽,更容易分离重组合成肽,鉴定和分离抗体和表达抗体的B细胞,等等。有利于检测和纯化的结构域包括,如,允许在固定化金属上纯化的金属螯合肽,如,聚组氨酸序列(polyhistidine tracks)和组氨酸-色氨酸模块(histidine-tryptophan modules),允许在固定的免疫球蛋白上纯化的蛋白A结构域,以及在FLAGS延伸/亲和纯化系统(FLAGS extension/affinity purification system,Immunex Corp,Seattle WA)中使用的结构域。在纯化结构域和含有基序的肽或者多肽之间,包含可以切割的连接序列如因子Xa或者肠激酶(lnvitrogen,San Diego CA)的接头序列,以便于纯化。例如,表达载体可能包括连接于六个组氨酸残基的编码表位的核酸序列,然后是硫氧还蛋白和肠激酶切割位点(见,如,Williams(1995)Biochemistry 34:1787-1797,Dobeli(1998)Protein Expr.Purif.12:404-414)。组氨酸残基有利于检测和纯化,而肠激酶切割位点提供从融合蛋白的剩余物中纯化表位的方法。与编码融合蛋白的载体相关的技术以及应用融合蛋白的技术,在科学和专利文献中已充分描述,参见例如例如Kroll(1993)DNA Cell.Biol.,12:441-53。
转录和翻译控制序列
本发明提供可操作地与表达(如,转录和翻译)控制序列如,启动子或者增强子连接以指导或者调控RNA的合成/表达的本发明核酸(如,DNA)序列。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp启动子。典型的真核启动子包括CMV即刻早期、HSV胸腺嘧啶激酶、早期和晚期SV40,来自逆转录病毒的LTRs和鼠金属硫蛋白I。
适于在细菌中表达多肽的启动子包括大肠杆菌lac或者trp启动子,lacI启动子,lacZ启动子,T3启动子,T7启动子,gpt启动子,λPR启动子,λPL启动子,来自编码糖酵解的酶如,3-磷酸甘油激酶(PGK)的操纵子的启动子,和酸性磷酸酶启动子。真核启动子包括CMV即刻早期启动子,HSV胸腺嘧啶激酶启动子,热休克启动子,早期和晚期SV40启动子,来自逆转录病毒的LTRs,和鼠金属硫蛋白I启动子。也可以应用已知的在原核或者真核细胞或者其病毒中控制基因表达的其它启动子。
表达载体和克隆载体
本发明提供包括发明的核酸,如,编码发明的磷脂酶的序列的表达载体和克隆载体。本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒、粘粒、fosmids、细菌人工染色体、病毒DNA(如,牛痘、腺病毒、 禽类痘病毒、伪狂犬病病毒和SV40衍生物),以P1为基础的人工染色体、酵母质粒、酵母人工染色体以及对感兴趣的特定宿主(如杆菌属(Bacillus),曲霉属(Aspergillus)和酵母)特异的任何其它载体。本发明的载体可以包括染色体的,非染色体的和合成的DNA序列。很多合适的载体为本领域技术熟练人员所了解,并且可以买到。典型的载体包括:细菌的:pQE载体(Qiagen)、pBluescript质粒、pNH载体、λ-ZAP载体(Stratagene);ptrc99a、pKK223-3、pDR540、pRIT2T(Pharmacia);真核的:PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以应用任何其它的质粒或其他的载体,只要它们可以在宿主中复制并且有活力。低拷贝数或者高拷贝数的载体可以应用于本发明。
表达载体可以包括启动子,用于翻译起始的核糖体结合位点和转录终止子。载体也包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起始位点,任何必要的核糖体结合位点,多腺苷酸化位点,剪接供体和受体位点,转录终止序列,和5′侧非转录序列。在一些方面,源于SV40的剪接和多聚腺苷酸化位点的DNA序列可以用于提供所需的非-转录遗传元件。
在一个方面,表达载体含有一个或者多个选择性标记基因,使得可以选择含有该载体的宿主细胞。这些选择标记包括编码二氢叶酸还原酶的基因或对赋予真核细胞培养物对新霉素有抗性的基因,大肠杆菌中赋予抗四环素或者抗氨苄青霉素的基因,以及酿酒酵母(S.cerevisiae)的TRP1基因。启动子区域可以使用氯霉素转移酶(CAT)载体或者具有选择标记的其它载体,从任何所需基因中选择。
在真核细胞中表达多肽或者其片段的载体也包含增加表达水平的增强子。增强子是DNA的顺式作用元件,一般长度从大约10到大约300bp,其作用于启动子,增强启动子的转录。例子包括在复制起点的旁侧100到270bp的SV40增强子,巨细胞病毒的早期启动子增强子,在复制起点的旁侧的多瘤增强子,和腺病毒增强子。
DNA序列可以以各种的程序插入到载体中。一般而言,用适合的限制性内切酶消化插入片段和载体之后,将DNA序列连接于载体的期望位置上。各种克隆技术是本领域已知的,例如,如在Ausubel和Sambrook中所描述的技术。这样的程序和其它程序被认为是在本领域的技术人员的知识范围之内。
载体可以是质粒,病毒颗粒或者噬菌体的形式。其它的载体包括染色体的,非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒,噬菌体DNA,杆状病毒,酵母质粒,源于质粒和噬菌体DNA组合的载体,病毒DNA如牛痘,腺病毒,禽类痘病毒,和伪狂犬病病毒。例如,Sambrook描述了原核和真核宿主中使用的多种克隆和表达载体。
可以应用的特定细菌载体包括可以从商业渠道获得的质粒,包括下述为人熟知的克隆载体的遗传元件:pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden),GEM1(Promega Biotec,Madison,WI,USA)pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174、pBlueScript II KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK223-3、pDR540、pRIT5(Pharmacia)、pKK232-8和pCM7。特别的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,也可以应用任何其它的载体,只要它在宿主细胞可以复制和繁殖。
宿主细胞和转化的细胞
本发明也提供包括发明核酸序列,如,编码本发明磷脂酶的序列,本发明的载体的转化的细胞。宿主细胞可以是本领域技术熟练人员所熟悉的任何宿主细胞,包括原核细胞,真核细胞,如,细菌细胞,真菌细胞,酵母细胞,哺乳动物细胞,昆虫细胞,或者植物细胞。本发明的酶可以在任何宿主细胞中表达,例如任何细菌细胞、任何酵母细胞,例如巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母(Schizosaccharomyces pombe)。示范性的细菌细胞包括大肠杆菌(E.coli)、乳酸乳球菌(Lactococcus lactis)、链霉菌属(Streptomyces)、枯草芽孢杆菌(Bacillussubtilis)、鼠伤寒沙门菌(Salmonella typhimurium)和杆菌属(Bacillus)、链霉菌属和葡萄球菌属(staphylococcus)中的任何菌株。示例性的昆虫细胞包括果蝇S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9)。示例性的动物细胞包括CHO、COS或者黑色素瘤(Bowes melanoma)或者任何小鼠或者人类细胞系。适当的宿主的选择是在本领域技术人员的能力之内。
可以应用任何不同的技术将载体引入到宿主细胞,这些技术包括转化、转染、转导、病毒感染、基因枪或者Ti-介导的基因转移。特定的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂质体转染或者电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。
适当地,工程化的宿主细胞可以在传统营养培养基中培养,该培养基经修改以适于激活启动子,选择转化子或者扩增发明的基因。随后转化适当的宿主株,并且该宿主株生长至适当的细胞密度,通过适当的方法(如,温度变换或者化学诱导)诱导所选择的启动子,细胞可以被额外培养一段时间,以使得它们产生所需的多肽或者其片段。
细胞通过离心收集,通过物理或者化学的方法破碎,得到的粗提取物保留用于进一步的纯化。用于表达蛋白的微生物细胞可以通过任何方便的方法破碎,包括冷冻-解冻循环、超声波破碎、机械破碎,或者应用细胞裂解剂。这样的方法为本领域技术人员所熟悉。表达的多肽或者片段可以通过下述方法从重组细胞培养物中回收纯化,这些方法包括硫酸铵或者乙醇沉淀、酸法抽提、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟基磷灰石层析和植物凝集素层析。如果必要的话,可以在实现多肽的构象化作用中应用蛋白重新折叠步骤。如果需要,可以应用高效液相色谱(HPLC)进行最终的纯化步骤。
各种哺乳动物培养系统可以用来表达重组蛋白。哺乳动物表达系统的例子包括猴肾成纤维细胞COS-7细胞系和能够从相容性载体中表达蛋白的其它的细胞系,如C127、3T3、CHO、Hela和BHK细胞系。
宿主细胞中的构建物可以以传统的方式用来产生重组序列编码的基因产物。取决于在重组产生程序中采用的宿主,含有载体的宿主细胞产生的多肽可以是糖基化的或者是非糖基化的。本发明的多肽可以包括,也可以不包括起始的甲硫氨酸氨基酸残基。
无细胞的翻译系统可能也用于产生本发明的多肽。无细胞翻译系统可以应用从含有可操作性地连接到编码多肽或其片段的核酸的启动子的DNA构建物转录得到的mRNA。在一些方面,DNA构建物可以,在进行体外转录反应前,先线性化。然后转录的mRNA与合适的无细胞翻译提取物如,兔网织红细胞提取物一起温育,来产生所需的多肽或者其片段。
表达载体可以含有一个或者多个选择性标记基因,提供用于选择转化的宿主细胞的表型特征,如,二氢叶酸还原酶和用于真核细胞培养物的新霉素抗性,或者如大肠杆菌中的四环素或者氨苄青霉素抗性。
示范性磷脂酶C酶(具有SEQ ID NO:2中阐明的序列)已在各种宿主系统中以活性形式被过量表达,这些系统包括革兰氏阴性细菌,诸如大肠杆菌,革兰氏阳性细菌,诸如任何杆菌属菌株(例如枯草芽孢杆菌、蜡质芽孢杆菌(Bacilluscereus))、酵母宿主细胞(包括例如巴斯德毕赤酵母、酵母属某种(Saccharomycessp.),诸如酿酒酵母(S.cerevisiae)和粟酒裂殖酵母)和乳酸乳球菌(Lactococcuslactis)或哺乳动物、真菌、植物或昆虫细胞。在每一宿主系统中,由各种构建物表达活性酶。这些核酸表达构建物可以包含编码全长开放阅读框(由信号序列、前序列和成熟蛋白编码序列组成)的核苷酸,或它们可以包含这些遗传元件的亚组,单独或者与异源遗传元件组合,其充当信号序列和/或成熟开放阅读框的前序列。这些系统中的每一个可以充当表达PLC的商用生产性宿主,以用于之前描述的酶法油脱胶工艺。
核酸的扩增
在实践本发明时,编码本发明多肽的核酸,或者修饰的核酸可以例如通过扩增被复制。本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对。在一方面,引物对能够扩增本发明的核酸序列,如,包括示范性的SEQ IDNO:1,或者其子序列;如SEQ ID NO:3所阐明的序列,或者其子序列;如SEQ IDNO:5所阐明的序列,或者其子序列;如SEQ ID NO:7所阐明的序列,或者其子序列,等等。本领域技术人员可以设计用于这些序列的任何部分或全长的扩增引物序列对。
本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增包括本发明序列或者其片段或子序列的核酸。扩增引物 序列对的其中一个或每一个成员可以包括含有该序列的至少大约10到50个连续碱基的寡核苷酸,或者包括含有该序列的大约12、13、14、15、16、17、18、19、20、21、22、23、24或者25个连续碱基的寡核苷酸。
本发明提供扩增引物对,其中引物对包括具有在本发明核酸的大约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第一成员,和具有在第一成员的互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第二成员。本发明提供通过扩增产生的磷脂酶,如应用本发明的扩增引物对进行聚合酶链式反应(PCR)。本发明提供使用本发明的扩增引物对,通过扩增,例如,聚合酶链式反应(PCR)制备磷脂酶的方法。在一方面,扩增引物对从文库,例如,基因文库,如环境文库中扩增核酸。
扩增反应也可以用于定量样品中的核酸(如在细胞样品中的信息的量),标记核酸(如,用于阵列或者印迹),检测核酸,或者定量样品中特异核酸的量。在发明的一个方面,扩增分离自细胞或者DNA文库的信息。技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增的方法是本领域所熟知的,并且包括,如,聚合酶链式反应,PCR(见,如,PCR PROTOCOLS,A GUIDE TO METHODS ANDAPPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGIES(1995),ed.Innis,Academic Press,Inc.,N.Y.,连接酶链式反应(LCR)(见,如,Wu(1989)Genomics 4:560,Landegren(1988)Science 241:1077;Barringer(1990)Gene 89:117);转录扩增(见,如,Kwoh(1989)Proc.Natl.Acad.Sci.USA 86:1173),和自支持序列复制(见如,Guatelli(1990)Proc.Natl,Asad.Sci.USA 87:1874);Qβ复制酶扩增(见,如,Simth(1997)J.Clin.Microbiol.35:1477-1491);自动的Qβ复制酶扩增分析(见,如,Burg(1996)Mol.Cell.Probes 10:257-271)和其它RNA聚合酶介导的技术(如,NASBA,Cangene,Mississauga,Ontario);也见,例如,Berger(1987)Methods Enzymol.152:307-316;Sambrook;Ausubel;美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology 13:563-564。
确定序列同一性的程度
本发明提供包括与本发明的示例性核酸(例如SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、 SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ IDNO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ IDNO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ IDNO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ IDNO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173,和编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ IDNO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ IDNO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ IDNO:168、SEQ ID NO:170、SEQ ID NO:172或SEQ ID NO:174的核酸)在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或者更多个残基的范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的序列的分离的或者重组的核酸。序列同一性(同源性)的程度 可以应用任何计算机程序和相关参数来确定,包括那些在本文所描述的,如用默认参数的BLAST 2.2.2.或者FASTA 3.0t78版。在可选择的实施方案中,序列同一性可以是在核酸或者多肽的至少大约5、10、20、30、40、50、100、150、200、250、300、350、400个连续残基,或者全长的范围内。序列同一性(同源性)的程度可以应用任何计算机程序和相关联的参数来确定,包括那些在本文所说明的,如使用默认参数的BLAST 2.2.2.或者FASTA 3.0t78版。
图11用图表描述了本发明的示例性核酸和多肽的选择的特征,包括示例性序列与公共数据库的序列同一性比较。图11中描述的所有序列已针对两组数据库进行了BLAST搜索(如在下面详细描述的)。第一数据库获自NCBI(美国国家生物技术信息中心)。对这些数据库进行搜索所获得的所有结果参见名称为“NR描述(NR Description)”、“NR登记码(NR Accession Code)”、“NR E值(NR Evalue)”或“NR生物(NR Organism)”的各栏。“NR”指由NCBI维护的非冗余(Non-Redundant)核苷酸数据库。该数据库是GenBank、GenBank更新和EMBL更新的综合。栏“NR描述(NR Description)”中的条目指任何给定的NCBI记录中的描述行(definition line),其包括了对序列的描述,诸如来源生物、基因名称/蛋白质名称,或对序列的一些功能描述。“NR登记码(NR Accession Code)”一栏中的条目指给予序列记录的独特标识符(identifier)。“NR E值(NR Evalue)”一栏中的条目指期望值(E值),其代表了这样的可能性:同在询问序列(query sequence)(本发明的序列)与数据库序列之间发现的比对分值一样良好的比对分值,发现于在随机序列之间相同的数量的比较中的概率,如在当前的BLAST搜索中所进行的。“NR生物(NR Organism)”一栏中的条目指被鉴定为关系最密切的BLAST命中(hit)的序列的来源生物。第二组数据库统称为GeneseqTM数据库,其可从Thomson Derwent(Philadelphia,PA)获得。对该数据库所作搜索的所有结果参见名称为“Geneseq蛋白质描述(Geneseq ProteinDescription)”、“Geneseq蛋白质登记码(Geneseq Protein Accession Code)”、“Geneseq蛋白质E值(Geneseq Protein Evalue)”、“Geneseq DNA描述(Geneseq DNADescription)”、“Geneseq DNA登记码(Geneseq DNA Accession Code)”、“GeneseqDNA E值(Geneseq DNA Evalue)”各栏中。这些栏中发现的信息与上述NR各栏中发现的信息类似,除了它来自对GeneseqTM数据库而不是对NCBI数据库进行的BLAST搜索。此外,该表包括“预测的EC编号(Predicted EC No.)”一栏。EC编号是根据标准化的酶命名法的方案赋予一类酶的编号,该命名法是由国际生物化学和分子生物学联合会(IUBMB)的命名委员会的酶部(Enzyme Commission of theNomenclature Committee of International Union of Biochemistry and MolecularBiology)开发的。在“预测的EC编号”栏中的结果是由对Kegg(Kyoto Encyclopediaof Genes and Genomes)数据库的BLAST搜索结果来确定的。如果最高BLAST匹配(top BLAST match)的E值等于或小于e-6,那么赋予该最高匹配的EC编号进入表中。最高命中(top hit)的EC编号用作向导,用于指出本发明序列的EC编号可能 是什么。“询问DNA长度(Query DNA Length)”和“询问蛋白质长度(Query ProteinLength)”这两栏分别指本发明的序列中核苷酸的数目或氨基酸的数目,本发明的序列被用于对NCBI或Geneseq数据库进行搜索或查询。“Geneseq或NR DNA长度(Geneseq or NR DNA Length)”、“Geneseq或NR蛋白质长度(Geneseq or NR ProteinLength)”这两栏分别指从BLAST搜索获得的最高匹配的序列中的核苷酸的数目或氨基酸的数目。这些栏中给出的结果是来自返回(return)了较低的E值的搜索,它们或者来自NCBI数据库或者来自Geneseq数据库。“Geneseq或NR%ID蛋白质(Geneseq or NR%ID Protein)”和“Geneseq或NR%ID DNA(Geneseq or NR%IDDNA)”指本发明序列与最高BLAST匹配的序列之间的序列同一性百分比。这些栏中给出的结果是来自返回(return)了较低的E值的搜索,它们或者来自NCBI数据库或者来自Geneseq数据库。
同源性序列也包括RNA序列,其中尿嘧啶替代了在核酸序列中的胸腺嘧啶。同源序列可以应用在此描述的任何程序得到或者可以由校正测序错误得到。应该理解到的是,在此所列的核酸序列可以以传统的单字符格式来表示(见,如,Stryer,Lubert.Biochemistry 3rd Ed.,W.H.Freeman & Co.,New York)或者以记录序列中的核苷酸的身份的任何其他格式来表示。
在本发明的这一方面,可以使用在此指明的各种序列比较程序。蛋白和/或核酸序列同一性(同源性)可以应用本领域已知的任何序列比较算法和程序评估。这样的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA、和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85(8):2444-2448,1988;Altschul et al.,J.Mol.Biol.215(3):403-410,1990;Thompson et al.,NucleicAcids Res.22(2):4673-4680,1994;Higgins et al.,Methods Enzymol.266:383-402,1996;Altschul et al.,J.Mol.Biol.215(3):403-410,1990;Altschul et al.,NatureGenetics 3:266-272,1993)。
同源性或者同一性可以应用序列分析软件来测定(如,遗传学计算机组的序列分析软件包,Uinversity of Wisconsin Biotechnology Center,1710 UniversityAvenue,Madison,WI 53705)。这样的软件通过对各种缺失、替换和其它修饰进行同源性水平赋值来匹配相似的序列。在两个或者多个核酸或者多肽序列的情况下,术语“同源性”和“同一性”是指两个或者多个序列或者子序列,当在比较窗口或者指定区域中应用任何数量的序列比较算法或者手动比对和目测来测定,通过比较和比对以便获得最大的一致性时,它们是相同的或者具有特定百分比的相同氨基酸残基或者核苷酸。对于序列比较,一个序列可以作为参照序列(示范性序列SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4,、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8,等等)与待测序列进行比较。当应用序列比较算法,待测序列和参照序列被输入到计算机中,指定子序列坐标,如果必 要,指定序列算法程序参数。可以应用默认程序参数,或者指定选择性参数。依据程序参数,序列比较算法计算待测序列和参照序列的序列同一性百分比。
在此应用的“比较窗口(comparison window)”,包括涉及任一数目的连续残基的片段。例如,在发明可选择的方面,当两个序列优化比对后,将范围从20到本发明的示范性序列的全长的连续残基,与相同数目的连续位置的参照序列进行比较,所述示范性序列例如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8等等。如果参照序列与发明的示范性序列例如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8等具有必要的序列同一性,如,50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多的序列同一性,那么该序列是属于本发明的范围。在可选择的实施方案中,当两个序列优化地比对后,将范围从大约20到600、大约50到200、和大约100到150的序列,与同样数目的连续位置的参照序列进行比较。用于比较的序列比对方法是本领域所熟知的。用于比较的优化序列比对可以用下述方法实施,例如,Smith & Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法、Needleman & Wunsch,J.Mol.Biol.48:443,1970的同源比对算法、Person & Lipman,Proc,Nat′l.Acad.Sci.USA 85:2444,1988的相似性搜索法、这些算法的计算机化执行(GAP、BESTFIT、FASTA和TFASTA,于WisconsinGenetics Software Package,Genetics Computer Group,575 Science Dr.,Madison,WI),或者通过手动比对和目测完成。用于确定同源性或者同一性的其它算法包括,例如,除了BLAST程序外(在美国国家生物信息中心的基本局部比对搜索工具(Basic Local Alignment Search Tool))、ALIGN、AMAS(多比对的序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋白多序列比对(ProteinMultiple Sequence Alignment))、ASSET(比对片段的统计评估工具(Aligned SegmentStatistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN(生物序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BLocksIMProved Searcher)、FASTA,Intervals & Points,BMB、CLUSTAL V、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸比对工具(Forced NucleotideAlignment Tool))、Framealign、Framesearch、DYNAMIC、FILTER、FSAP(Fristensky序列分析包)、GAP(通用比对程序(Global Alignment Program))、GENAL、GIBBS、GenQuest、ISSC(灵敏性序列比较(Sensitive Sequence Comparison))、LALIGN(局部序列比对(Local Sequence Alignment))、LCP(局部含量程序(Local Content Program))、MACAW(多比对构建和分析工作台(Multiple AlignmentConstruction & Analysis Workbench))、MAP(多比对程序(Multiple AlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多序列比对(Pattern-InducedMulti-sequence Alignment))、SAGA(遗传算法进行的序列比对(Sequence Alignmentby Genetic Algorithm))和WHAT-IF。这样的比对程序也可以用于筛选基因组数据库,鉴定具有实质上相同的序列的多核苷酸序列。目前已经有很多基因组数据库可用,例如,人类基因组的实质部分可以作为人类基因组测序计划(Gibbs,1995)的一部分。几个基因组已经测序完成,如,生殖道支原体(M.genitalium)(Fraseret al.,1995),甲烷球菌(M.jannaschii)(Bult et al.,1996),流感嗜血菌(H.influenzae)(Fleischmann et al.,1995),大肠杆菌(Blattner et al.,1997),和酵母(S.cerevisiae)(Mewes et al.,1997),和果蝇(D.melanogaster)(Adams etal.,2000)。模式生物的基因组测序中已经取得了显著的进展,如小鼠,线虫(C.elegans),和拟南芥(Arabadopsis sp.)。含有具有某些功能性信息注解的基因组信息的数据库由不同的组织保持,并且可以通过因特网进行访问。
BLAST、BLAST 2.0和BLAST 2.2.2算法也用于实践发明。这些算法在,如,Altschul(1977)Nuc.Acids Res.25:3389-3402;Altschul(1990)J.Mol.Biol.215:403-410中有描述。进行BLAST分析的软件可以通过美国国家生物技术信息中心(the National Center for Biotechnology Information)公开得到。这一算法包括首先通过鉴别待询序列(query sequence)中长度为W的短的字串来确定高分序列对(high scoring sequence pairs,HSPs),所述高分序列对在与数据库序列中同样长度的字串联配时,匹配或者满足某个正值的阈值T。T是指邻近字串(neighborhood word)的分数阈值(Altschul等,如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着每一个序列向两个方向延伸,只要累积的联配分数在增加。对于核苷酸序列,使用参数M(一对匹配残基的奖励分数;总是大于0)来计算累积分数;对于氨基酸序列,使用记分矩阵来计算累计分数。出现下面情况时,字串在各个方向上的延伸便停止:累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分为负的残基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)默认的是:字串长度(W)为11,期望值(E)为10,M=5,N=-4,对两条链进行比较。对于氨基酸序列,BLASTP程序默认:字串长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)联配(B)为50,期望值(E)为10,M=5,N=-4,对两条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分析(参见,例如,Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability,P(N)),其表示两 个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在受测核酸和参考核酸的比较中,如果最小合计概率小于大约0.2,更优选地小于0.01,最优选地小于大约0.001,就认为该核酸与参考序列相似。一方面,应用基本局部对比搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。例如,五个特定的BLAST程序可以用来进行以下的任务:(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较;(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较;(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较;(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较;(5)TBLASTX把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。BLAST程序通过确定相似片段来确定同源性序列,所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoringsegment pairs)”,该受测序列优选地从蛋白或者核酸序列数据库得到。高分片段对优选地利用记分矩阵来鉴定(即,联配),很多的记分矩阵在本领域是已知的。优选地,应用的记分矩阵为BLOSUM62矩阵(Gonnet等,Science 256:1443-1445,1992;Henikoff和Henikoff,Proteins 17:49-61,1993)。较少不优选地,也可以应用PAM或者PAM250矩阵(参见如,Schwartz和Dayhoff,eds.,1978,Matrices forDetecting Distance Relationships:Atlas of protein Sequence and Structure,Washingion:National Biomedical Research Foundation)。
本发明的一方面,为了确定是否核酸具有发明范围内的必需的序列同一性,应用NCBI BLAST 2.2.2程序,默认值的选择是blastp。在BLAST 2.2.2程序中,有大约38个设置选择。在发明的该示范性方面,除了默认的过滤设置外,应用所有的默认值(即除了过滤设置为关闭(OFF)外,所有的参数设定为默认值),在该位置上应用“-FF”设置,其使得不能进行过滤。由于短的序列长度的缘故,默认过滤的使用经常导致与Karlin-Altschul犯规。
如上所述,用于本发明的该示范性方面并被用来测定图11中值的默认值包括:
“低复杂性过滤器(Filter for low complexity):开启(ON)
>字长:3
>矩阵:Blosum62
>缺口成本:存在值:11
>延伸:1”
其它的默认值设置为:低复杂性过滤器关闭(off),蛋白质字长为3,BLOSUM62矩阵,缺口存在罚值-11,并且缺口延伸罚值-1。
示范性的NCBI BLAST 2.2.2程序设置在下面的实施例1中阐明。注意,“-W”选项默认值为0。这是指,如果没有设置,对于蛋白,字长默认值为3,对于核苷酸,字长默认值为11。
计算机系统和计算机程序产品
为了确定和鉴定序列同一性、结构同源性、基序等等,本发明的多肽或核酸序列可以在计算机可以读取和访问的任何介质上储存,记录和操作。相应地,本发明提供计算机,计算机系统,计算机可读介质,计算机程序产品和类似物,在其上记录和储存有本发明的核酸和多肽序列,例如,本发明的示例性序列,如,SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8,等。正如在此使用的,词语“记录”和“存储”是指将信息存储到计算机介质中的过程。技术人员很容易地采用任何已知的方法将信息记录到计算机可读介质上,从而产生包括发明的一个或者多个核酸和/或多肽序列的产品。
本发明的另一方面是其上已记录有发明的至少一个核酸和/或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质、闪存。例如,计算机可读介质可以是硬盘、软盘、磁带、闪存、CD-ROM、数码多功能光盘(DVD)、随机存储器(RAM)、或只读存储器(ROM)或本领域技术人员知道的任何类型的介质。
本发明的方面包括系统(如,以因特网为基础的系统),特别地计算机系统,其存储和操作在此描述的序列和序列信息。计算机系统100的一个例子描述在图1的方块图中。正如在此所使用的,“计算机系统”是指用于分析本发明的核苷酸和多肽序列的硬件组件、软件组件以及数据存储组件。计算机系统100可以包括用于序列数据处理、访问和操作的处理器。处理器105可以是任何已知类型的中央处理器如,例如,Intel公司的奔腾III处理器或者Sun,Motorola,Compaq、AMD或者International Business Machines(IBM)类似的处理器。计算机系统100是一种通用系统,其包括处理器105和用于存储数据的一个或者多个内部数据存储组件110,和一个或者多个用于检索存储于数据存储装置的数据的数据检索装置。本领域技术人员可以很容易地知道,任何一个目前可得到的计算机系统是合适的。
在一方面,计算机系统100包括连接于总线(bus)的处理器105,该总线连接于主存储器115(优选地,作为RAW执行)和一个或者更多的内部数据存储装置110,如硬盘驱动器和/或其上存储有数据的其它计算机可读介质。计算机系统100可以进一步包括一个或者多个用于读取存储于内部数据存储装置110上的数据的数据检索装置118。
数据检索装置118可以为,例如,软盘驱动器、光盘驱动器、磁带驱动器,或者可以(如通过因特网)连接于远端数据存储系统的调制解调器等等。在一些 实施方案中,内部的数据存储装置110是可移动的计算机可读介质,例如含有控制逻辑和/或在其中记录有数据的软盘、光盘、磁带等。有利的是,计算机系统100可以包括或运行适当的软件程序,从插入到数据检索装置中的数据存储部分读取控制逻辑和/或数据。
计算机系统100包括用于给计算机应用者显示输出的结果的显示器120。应当注意到,计算机系统100可以在网络中或者宽域网中与其它的计算机系统125a-c相联,提供集中化的计算机系统100访问。访问和处理本发明的核苷酸或者氨基酸序列的软件可以在执行过程中驻留在主存储器115中。
在一些方面,计算机系统100可以进一步包括比较发明的核酸序列的序列比较算法。算法和序列可以储存在计算机可读的介质中。“序列比较算法”是指一个或多个程序,其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数据储存装置中存储的其它的核苷酸序列和/或化合物。例如,序列比较算法可将储存在计算机可读介质上的示范性序列,例如SEQ ID NO:1,SEQ ID NO:2,SEQID NO:3,SEQ ID.NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SBQ ID NO:8等的核苷酸序列与储存在计算机可读介质上的参考序列比较,以鉴定同源性或结构基序。
以上算法应用的参数可以依据所研究的序列长度和同源性水平而加以调整。在一些方面,在使用者没有给出指令的情况下,算法使用的参数可以应用默认参数。图2是说明过程200的一个方面的流程图,这个处理过程是为了确定新序列和数据库中的序列间的同源性水平,把新的核苷酸或者蛋白序列与数据库中的序列加以比较。含有序列的数据库可以是存储于计算机系统100的私人数据库,或者公共的数据库,如通过因特网可以访问到的GENBANK。过程200开始于起始状态201,然后移至状态202,其中待比较的新序列存储在计算机系统100的存储器上。如上讨论,存储器可以是任何形式的存储器,包括RAM或者内部存储设备。
过程200然后移至状态204,其中序列数据库被打开以用于分析和比较。然后,过程200移至状态206,其中存储在数据库的第一个序列读取到计算机的存储器中。然后在状态210中进行比较,确定第一序列是否与第二序列相同。重要的是,注意到这一步骤并不限于在所述新序列和数据库中的第一序列间进行准确的比较。本领域技术人员熟知比较两个核苷酸或者蛋白序列的方法,尽管它们并不完全相同。例如,为了提高两个待测序列间的同源性水平,可以在一个序列中引入空位。在比较过程中控制是否往序列中引入空位或者其它特征的参数一般由计算机系统的使用者输入。
一旦在状态210下进行两个序列的比较,在决定状态210下作出两个序列是否相同的决定。当然,术语“相同”并不限于绝对相同的序列。在过程200中,在使用者输入的同源性参数范围内的序列将标记为“相同”。如果决定了两个序列是相 同的,过程200移至状态214,其中给使用者显示了来自数据库的所述序列的名称。这一状态可以告诉使用者具有被显示的名称的序列满足输入的同源性限制。一旦被存储的序列的名称显示给使用者,过程200移至决定状态218,其中确定在数据库中是否存在更多的序列。如果在数据库中没有更多的序列存在,那么过程200终止于结束状态220。然而,如果在数据库中存在更多的序列,那么过程200移至状态224,其中指示器移至数据库的下一个序列以便可以与所述的新序列比较。以这种方式,所述的新序列与数据库中的每一个序列进行联配和比较。
应当注意,如果在决定状态212作出了决定,序列没有同源性,那么过程200将立即移至决定状态218,以确定在数据库中是否有任何其它的序列用于比较。同样地,发明的一方面是包括处理器,其上储存有本发明的核酸序列的数据存储装置以及用于进行比较的序列比较器的计算机系统。序列比较器可以指示待比较序列之间的同源性水平或者鉴定结构基序,或者可以确定与这些核酸代码和多肽代码相比较的序列中的结构基序。
图3是说明在计算机中确定两个序列是否具有同源性的过程250的一个实施方案的流程图。过程250开始于起始状态252,然后移至状态254,其中待比较的第一序列被存储于存储器中。待比较的第二序列然后在状态256被存储于存储器中。过程250然后移至状态260,其中读取第一序列的第一个字符,然后到状态262,其中读取第二序列的第一个字符。应当理解,如果序列是核苷酸序列,那么所述字符一般将是A、T、C、G或者U。如果序列是蛋白质序列,那么它可以是单字母的氨基酸代码,以便第一序列和第二序列可以很容易地进行比较。然后在决定状态264作出是否两个字符是否相同的确定结果。如果它们是相同的,那么过程250移至状态268,其中读取第一序列和第二序列的下一个字符。然后确定所述的下一字符是否相同。如果相同,那么过程250继续这一循环直到两个字符是不同的。如果确定了接下来的两个字符并不相同,过程250移至决定状态274,确定在两个序列中是否有任何更多的字符要读取。如果没有任何更多的字符被读取,那么过程250移至状态276,其中第一序列和第二序列的同源性水平显示给使用者。通过计算序列间相同字符占第一序列中字符总数的比例来确定同源性水平。这样,如果第一个100核苷酸序列的每一个字符都与第二序列的每一个字符联配,那么同源性水平将是100%。
可选择地,计算机程序可以比较参照序列与本发明的序列,以确定是否序列在一个或者多个位置上不同。程序可以记录本发明序列或参照序列中插入、缺失或者替换的核苷酸或者氨基酸残基的长度和同一性。计算机程序可以是确定是否参照序列与本发明的序列相比,含有单核苷酸多态性(SNP),或者是否本发明的序列含有已知序列的SNP的程序。因此,在一些方面,计算机程序是鉴定SNPs的程序。该方法可以通过以上描述的计算机系统和描述在图3中的方法来完成。
该方法可以通过应用计算机程序读取本发明序列和参照序列,并且用计算机程序来鉴定差异来进行。
在其他方面,以计算机为基础的系统包括鉴定本发明的核酸或者多肽中的特征的标识符(identifier)。“标识符”是指鉴定核酸序列中的某些特征的一个或者多个程序。例如,标识符可以包括鉴定核酸序列中的开放阅读框架(ORF)的程序。图4是说明用于检测序列中特征存在与否的标识符过程300的一个方面的流程图。过程300起始于起始状态302,然后移至状态304,其中待检测特征的第一序列存储于计算机系统100的存储器115上。过程300然后移至状态306,在该状态下,打开具有序列特征的数据库。这样数据库将包括一系列每一个特征的属性和特征的名称。例如,特征名称可以是“起始密码子”,特征属性为“ATG”。另一个例子是特征名称为“TAATAA盒”,特征属性为“TAATAA”。这样的数据库的例子是由威斯康辛大学遗传学计算机组(University of Wisconsin Genetics ComputerGroup)制作。可选择地,特征可以是结构多肽基序,如α螺旋、β折叠,或者功能性多肽基序,如酶的活性位点、螺旋-转角-螺旋基序或者本领域技术知道的其他基序。一旦在状态306打开特征数据库,过程300移至状态308,其中第一特征从数据库中读取。然后在状态310中进行第一特征的属性与第一序列的比较。然后在决定状态316下作出决定,是否在第一序列中发现所述特征的属性。如果发现该属性,过程300移至状态318,其中所发现的特征的名称显示给使用者。过程300然后移至决定状态320,在其中作出是否在数据库中存在更多的特征的决定。如果不存在更多的特征,过程300终止于结束状态324。然而,如果数据库中确实存在有更多的特征,那么过程300在状态326读取下一个序列特征,并且循环回到状态310,其中该下一个特征的属性与第一序列进行比较。如果在决定状态316中所述特征的属性没有在所述第一序列中发现,那么为了决定在数据库中是否存在更多特征,过程300直接移至决定状态320。因此,在一方面,本发明提供了鉴定开放阅读框架(ORFs)的计算机程序。
本发明的核酸序列,或本发明的多肽序列可在各种数据处理程序中以多种格式被储存和进行操作。例如,本发明的核酸序列,或本发明的多肽序列,可以以文本形式储存在字处理文件如Microsoft WORD或WORDPERFECT中,或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程序如DB2、SYBAS或ORACL中。另外,许多计算机程序和数据库都可用作序列比较算法、标识符、或参考核苷酸序列或多肽序列的来源,所述参考核苷酸序列或多肽序列要与本发明的核酸序列进行比较。用于实践本发明的程序和数据库包括,但不限于:MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(MolecularApplications Group)、Look(Molecular Applications Group)、MacLook(MolecularApplications Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci. USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(Molecular Simulations Inc.)、Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular SimulationsInc.)、Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.),Homology(Molecular Simulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(MolecularSimulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLab Diversity Explorer(Molecular SimulationsInc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular SimulationsInc.)、MDL可用化学制品目录数据库(Available Chemicals Directory database)、MDL药品数据报告数据库(Drug Data Report data base)、综合医药化学数据库(Comprehensive Medicinal Chemistry database)、德温特世界药物索引数据库(World Drug Index database)、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。其它的程序和数据库对于本公开内容的所述技术领域内的技术人员是显而易见的。
应用以上的程序可能检测到的基序包括:编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化作用位点、泛素化位点、α螺旋、β折叠、编码引导被编码蛋白的分泌的信号肽的信号序列、涉及转录调控的序列如同源框、酸性伸展(acidicstretches)、酶的活性位点、底物结合位点以及酶切割位点。
核酸的杂交
本发明提供了可在严格条件下与本发明的示例性序列例如在SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ IDNO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ IDNO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、 SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ IDNO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ IDNO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173中阐明的序列或者编码包括在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ IDNO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ IDNO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ IDNO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ IDNO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172或SEQ ID NO:174中阐明的序列的多肽的核酸杂交的分离的或者重组的核酸。严格条件可以是高度严格条件,中度严格条件,低度严格条件,包括在此描述的高度的和降低的严格条件。在可选择的方面,本发明的核酸根据它们在严格条件下杂交的能力来定义,它们可以在大约5个残基到某分子例如本发明的示范性核酸的全长之间。例如,它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400个或更多个残基。比全长核酸较短的核酸也包括在内。这些核酸可以用作如,杂交探针、标记探针、PCR寡核苷酸探针、iRNA(单链或者双链)、编码抗体结合肽(表位)的序列或反义序列、基序、活性位点、结合结构域、调控结构域以及类似物。
在一方面,本发明的核酸通过其在高的严格条件下杂交的能力定义,该高严格性包括条件为大约37℃到42℃,大约50%的甲酰胺。在一方面,本发明的核酸通过其在降低的严格条件下杂交的能力定义,该降低的严格性包括条件为大约30℃到35℃,大约35%到25%的甲酰胺。可选择地,本发明的核酸通过其可以在 高严格条件下杂交的能力定义,该高严格性包括条件为42℃,50%的甲酰胺中,5×SSPE,0.3%的SDS,封闭核酸重复序列,如cot-1或者鲑鱼精DNA(例如,200n/ml剪切的和变性的鲑鱼精DNA)。在一方面,本发明的核酸通过其在降低的严格条件下杂交的能力定义,该降低的严格性条件包括降低的温度35℃,35%的甲酰胺。
杂交以后,滤膜可以在50℃,用6×SSC,0.5%的SDS洗涤。超过25%的甲酰胺,这些条件认为是“中度”条件,低于25%的甲酰胺,这些条件认为是“低度”条件。“中度”杂交条件的一个特定例子是上面的杂交在甲酰胺为30%时进行。“低严格性”杂交条件的特定例子是上面的杂交在甲酰胺为10%时进行。
与特定水平的严格性相对应的温度范围可以进一步通过计算感兴趣的核酸中嘌呤与嘧啶的比例,并且相应地调节温度来缩小。本发明的核酸也通过其在Ausubel和Sambrook中所述的高度、中度、低度严格条件下杂交的能力来定义。对上面的范围和条件所作的变化可以用于实施本发明,并且是本领域技术人员所熟知的。下面进一步描述了杂交条件。
寡核苷酸探针和应用方法
本发明也提供了用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探针。一方面,探针包括在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ IDNO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ IDNO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ IDNO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173中阐述的序列的至少10个连续的碱基。可选择地,本发明的探针可以是本发明的序列中所阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、50、55、 60、65、70、75、80、90、100或150,或更多,或大约10到50、大约20到60、大约30到70个连续碱基。这些探针通过结合或者杂交来鉴定核酸。这些探针可以用于本发明的阵列中,见下面的讨论,包括,例如,毛细管阵列。本发明的探针也可以用于分离其它的核酸或多肽。
本发明的探针可以用于确定是否生物样品,如土壤样品,含有具有本发明的核酸序列的生物或者可以从其获得该核酸的生物。在这样的程序中,获得潜在地隐藏了可从其分离得到核酸的生物体的生物样品,并且从该样品获得核酸。在允许探针与样品中存在的任何互补序列特异性杂交的条件下,将核酸与探针接触。在必要的情况下,为了确定允许探针特异地与互补序列杂交的条件,可以让探针与来自已知含有互补序列的样品中的互补序列相接触,同时与不含有互补序列的对照序列相接触。杂交条件,如杂交缓冲液中的盐浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度,可以进行被变化以确定允许所述探针特异地与互补的核酸杂交的条件(参见有关特异性杂交条件的论述)。
如果样品含有可以从其中分离出所述核酸的生物体,那么探针的特异性杂交可以被检测到。杂交可以通过使用可检测试剂标记所述探针来检测,所述的可检测试剂例如放射性同位素、荧光染料或者能够催化形成可检测产物的酶。使用标记探针来检测在样品中存在的互补核酸的很多方法对于本领域技术人员是熟悉的。这些方法包括Southern印迹、Northern印迹、菌落杂交方法以及点印迹。这些程序中的每一个的方案在Ansubel和Sambrook中给出。
作为选择,可以在一个扩增反应中使用一种以上的探针(其中的至少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含有包括本发明的核酸序列的生物体(如,从中分离出所述核酸的生物体)。在一方面,所述探针包括寡核苷酸。一方面,所述扩增反应可以包括PCR反应。PCR的实验方案见前面Ausubel和Sambrook的如上的所述(参见有关扩增反应的讨论)。在这些程序中,所述样品中的核酸与所述探针相接触,进行所述扩增反应,检测任何得到的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳,并用嵌入剂如溴化乙啶染胶来进行检测。可选择地,一种或者多种探针可以用放射性同位素标记,并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物的存在。
源自位于本发明序列的3’或者5’末端附近的序列的探针也可以用于染色体移步(chromosome walking)程序中,以鉴定含有另外的序列如基因组序列的克隆。这样的方法允许从宿主生物体中分离出编码其他感兴趣的蛋白的基因。
在一方面,本发明的核酸被用作探针来鉴定和分离相关的核酸。在一些方面,所述的相关的核酸可以是来自某些生物体的cDNA或者基因组DNA,但是这些生物体不是本发明的核酸起初被分离出来的那些生物体。在这样的程序中,核酸样品与所述探针在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体的核酸的杂交然后采用以上描述的任何方法来检测。
在核酸杂交反应中,用于达到特定严格水平的条件可以根据待杂交核酸的性质来进行改变。例如,在选择杂交条件时要考虑核酸杂交区域的长度、互补程度、核苷酸序列组成(如,GC对AT含量的比率)、以及核酸类型(如,RNA对DNA)。另外考虑是否其中一个核酸固定于,如滤膜上。杂交可以在低严格性,中度严格性或者高严格性的条件下进行。作为核酸杂交的例子,含有固定化变性核酸的聚合物膜首先在45℃下,在由0.9M NaCl、50mM NaH2PO4,pH 7.0、5.0mMNa2EDTA、0.5%SDS、10×Denhardt′s和0.5mg/ml多核腺苷酸组成的溶液中预杂交30分钟。然后将大约2×107cpm(比活性4-9×108cpm/ug)的32P末端标记的寡核苷酸探针加入到溶液中。在12-16小时的温育以后,膜在室温(RT)下于含有0.5%SDS的1×SET(150mM NaCl、20mM Tris盐酸,pH 7.8、1mM Na2EDTA)中洗涤30分钟,然后在新鲜配制的1×SET,在Tm-10℃下,再洗涤寡核苷酸探针30分钟。然后将膜暴露于自显影膜上来检测杂交信号。
通过改变用于鉴定核酸,如与可检测探针杂交的cDNA或者基因组DNA的杂交条件的严格性,可以鉴定和分离与探针具有不同同源性水平的核酸。可以通过在低于探针的解链温度下改变温度进行杂交而使严格性变化。解链温度,Tm,是指(在定义的离子强度和pH下)50%的靶序列与精确互补的探针杂交的温度。非常严格的条件被选择为与特定的探针的Tm值相等或比其低大约5℃。探针的解链温度可以通过应用以下的经验公式计算:对于在14到70个核苷酸长度的探针,应用此公式计算解链温度:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中的N是探针的长度。如果杂交在含有甲酰胺的溶液中进行,解链温度可以通过应用以下的公式来计算:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其中的N是探针的长度。预杂交可以在6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg变性的鲑鱼精DNA片段或者6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg变性的鲑鱼精DNA片段、50%甲酰胺中进行。SSC和Denhardt′s和其他溶液的配方列于例如Sambrook中。
通过在以上所列的预杂交溶液中加入可以检测到的探针来进行杂交。当所述探针包括双链DNA时,它应在加入到杂交缓冲液前被变性。滤膜与杂交缓冲液接触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA或者基因组DNA杂交。对于超过200个核苷酸长度的探针,杂交的过程可以是在低于Tm温度15-25℃进行。对于较短的探针,如寡核苷酸探针,杂交的过程可以是在低于Tm温度5-10℃下进行。在一个方面,在6×SSC溶液中的杂交过程在大约68℃进行。在一个方面,在含有50%甲酰胺的溶液中的杂交在大约42℃进行。考虑所有前述的杂交在高严格条件下进行。
杂交以后,洗涤滤膜以去除任何非特异结合的可检测探针。洗涤滤膜所用的严格性也可以根据正被杂交的核酸的性质、正被杂交的核酸的长度、互补的程度,核苷酸序列的组成(如,GC对AT的含量),以及核酸类型(如,RNA对 DNA)来进行变化。逐渐增高的严格条件洗涤的例子如下:2×SSC,0.1%SDS,室温下15分钟,(低严格性);0.1×SSC,0.5%SDS,室温下30分钟到1小时(中度严格性);0.1×SSC,0.5%SDS,杂交温度和68℃之间,15到30分钟(高严格性);0.15M NaCl,在72℃下15分钟(极高严格性)。最后的低严格性洗涤可以在0.1×SSC,室温下进行。以上的例子仅仅示出了可以用于实施本发明,例如洗涤滤膜的一组条件。本领域技术人员将知道,对于不同严格性洗涤有无数方案,所有这些方案都可以用于实施本发明。
已经与探针杂交的核酸可以通过放射自显影或者其它传统的技术来确定。可以改变以上的程序来鉴定具有与探针序列具有降低水平的同源性的核酸。例如为了获得与可检测探针具有降低水平的同源性的核酸,可以应用不太严格的条件。例如,在含有Na+浓度为大约1M的杂交缓冲液中,杂交温度可以以5℃的幅度从68℃降低到42℃。杂交后,滤膜用2×SSC,0.5%SDS,在杂交温度下洗膜。超过50℃,这些条件认为是“中度”条件,低于50℃,这些条件认为是“低度”条件。“中度”杂交条件的例子是上面的杂交在55℃进行。“低严格性”杂交条件的特定例子是上面的杂交在45℃进行。
可选择地,杂交在缓冲液,如含有甲酰胺的6×SSC中,在42℃下进行。在这种情况下,杂交缓冲液中甲酰胺的浓度可以以5%的幅度从50%降低到0%,以鉴定与探针具有降低的同源性水平的克隆。杂交后,滤膜可以用6×SSC,0.5%SDS在50℃下洗涤。认为当甲酰胺浓度大于25%时为“中度”条件,而低于25%时为“低度”条件。“中度”杂交条件的特定例子是当以上的杂交在30%的甲酰胺中进行时。“低严格性”杂交条件的特定例子是当以上的杂交在10%的甲酰胺中进行时。
本发明的这些探针和方法可以用于分离具有与本发明的核酸序列有至少大约99%、至少98%、至少97%、至少96%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或者至少50%同源性的序列的核酸,所述本发明的核酸序列包括它们的至少大约10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或者500个连续的碱基,和与之互补的序列。同源性可以应用在此所述的比对算法测定。例如,同源的多核苷酸可以具有在此描述的其中一个编码序列的天然发生的等位基因突变体的编码序列。当与本发明的核酸比较时,这样的等位基因突变体可以具有一个或者多个核苷酸的取代、缺失或者添加。
此外,本发明的探针和方法可以用于分离编码与本发明多肽具有至少大约99%,至少95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少55%或者至少50%序列同一性(同源性)的多肽的核酸,正如应用序列比对算法(如,使用默认参数的FASTA版本3.0t78的算法,或者具有在此阐明的示范性设置的BLAST 2.2.2程序)确定的,所述本发明多肽包括 它们的至少5、10、15、20、25、30、35、40、50、75、100或者150个连续的氨基酸。
抑制磷脂酶的表达
本发明进一步提供与本发明的核酸序列如磷脂酶编码核酸互补的核酸(如,本发明的核酸序列的反义序列)。反义序列可以抑制磷脂酶编码基因的转运,剪接或者转录。抑制可以通过靶向基因组DNA或者信使RNA而起作用。例如,通过杂交和/或切割,可以抑制被靶向的核酸的转录或者功能。本发明提供的特别有效的一套抑制物包括能够结合磷脂酶基因或者信息的寡核苷酸,在每一种情况下,都可阻止或者抑制磷脂酶的产生或者发挥功能。结合是通过序列特异性的杂交实现的。另一类有用的抑制物包括引起磷脂酶信息失活或者切割的寡核苷酸。该寡核苷酸可以具有引起此种切割的酶活性,如核酶。该寡核苷酸可以进行化学修饰,或者偶联到能够切割互补核酸的酶或组分上。人们可以筛选具有许多不同的此类寡核苷酸的文库,以获得那些具有期望的活性的寡核苷酸。
磷脂酶表达的抑制可以具有多种不同的工业用途。例如,抑制磷脂酶的表达可以减慢或者阻止酸败。当脂类或多肽,如,结构脂类或者多肽,被酶促降解时,可能发生酸败。这可以导致水果和蔬菜的变质或者腐败。一方面,应用可以抑制磷脂酶的表达和/或活性的本发明组合物,例如,抗体、反义寡核苷酸、核酶和RNAi,可以用于减缓或者阻止酸败。因此,在一方面,本发明提供方法和组合物,包括将本发明的抗体、反义寡核苷酸、核酶和RNAi应用于植物或者植物产品(如,水果、种籽、根、叶等),以阻止或者延缓酸败。这些组分也可以由植物(如,转基因植物)或者其它生物(如,用本发明的磷脂酶基因转化的细菌或者其它微生物)表达。
用于抑制磷脂酶表达的本发明的组分(如反义物、iRNA、核酶、抗体)可以用作药物组分。
反义寡核苷酸
本发明提供能够结合磷脂酶信息的反义寡核苷酸,该反义寡核苷酸可以通过靶向mRNA来抑制磷脂酶活性。设计反义寡核苷酸的策略在科学和专利文献中已经充分说明,并且技术人员可以应用本发明的新的试剂来设计这样的磷脂酶寡核苷酸。例如,用于筛选有效的反义寡核苷酸的基因步行/RNA作图试验方案是本领域所熟知的,参见,如,Ho(2000)Methods Enzymol.314:168-183,该文献描述了RNA作图分析方法,该作图分析方法以标准的分子技术为基础,为有效的反义序列选择提供了简单而可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。
也可以应用天然存在的核酸作为反义寡核苷酸。反义寡核苷酸可以是任何长度;例如,在可选择的方面,反义寡核苷酸在大约5到100、大约10到80、大约15到60、大约18到40之间。最佳长度可以通过常规的筛选方法来确定。反义 寡核苷酸可以以任何浓度存在。最佳浓度可以通过常规的筛选方法来确定。已经知道有许多能够解决该潜在的问题的合成的,非天然存在的核苷和核酸类似物。例如,可以应用含有非离子性骨架,如N-(2-氨基乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有硫代磷酸连接的反义寡核苷酸,如,WO 97/03211;WO 96/39154;Mata(1997)Toxicol Appl Pharmacol 144:189-197;AntisenseTherapeutics,ed.Agrawal(Humana Press,Totowa,N.J.,1996)所述。本发明提供的具有合成的DNA骨架类似物的反义寡核苷酸也可以包括磷-二硫代、甲基磷酸盐、磷阿米酮、烷基磷三酯、氨基磺酸盐、3’-硫代乙缩醛、甲叉(甲基亚胺)、3′-N-氨基甲酸酯剂和吗啉代氨基甲酸酯核酸,如以上所述。
可以应用组合化学的方法产生大量的寡核苷酸,可以对这些寡核苷酸快速筛选,以获得对任何靶,如本发明的有义和反义磷脂酶序列,具有适当的结合亲和性和特异性的特定的寡核苷酸(见,如,Gold(1995)J.of Biol.Chem.270:13581-13584)。
抑制性核酶
本发明提供可以结合磷脂酶信息的核酶,其可以通过靶向mRNA来抑制磷脂酶的酶活性。设计核酶和选择用于靶向作用的对磷脂酶具特异性的反义序列在科学和专利文献中已经充分说明,并且技术人员可以应用本发明的新型试剂来设计这样的核酶。核酶通过核酶的靶RNA结合部分结合靶RNA起作用,该核酶的靶RNA结合部分与切割靶RNA的RNA的酶活部分非常接近。因此,核酶通过互补的碱基配对作用识别并且结合靶RNA,并且一旦结合于正确的位点,将酶法切割靶RNA并且使靶RNA失活。如果切割发生在编码序列中,以这种方式进行的靶RNA的切割将破坏其指导编码蛋白合成的能力。当核酶结合并且切割其靶RNA后,一般情况下,将从RNA上释放,因此能够反复地结合和切割新的靶标。
在一些情况下,核酶的酶本质决定了其比其它技术如反义技术(其中核酸分子简单地结合于核酸靶来阻止其转录、翻译或者与其它分子的缔合)更优越,这是因为导致有效治疗作用所必需的有效的核酶浓度低于反义寡核苷酸的浓度。这一潜在的优点反映了核酶可以以酶的方式起作用的能力。由此,单个核酶分子可以切割靶RNA的很多分子。此外,核酶是典型的高度特异性的抑制剂,其抑制的特异性不仅仅依赖于结合的碱基配对机制,也依赖于分子抑制其结合的RNA表达的机制。即,抑制是通过切割RNA靶来引起的,因此特异性是通过靶向的RNA的切割速率与非-靶向的RNA的切割速率之比来定义。该切割机制取决于参与碱基配对的因素以外的因素。因此,核酶的特异性作用高于结合于同一个RNA位点的反义寡核苷酸的作用。
具有酶活的核酶RNA分子可以以锤头基序(hammerhead motif)形成,但也可以以发夹、肝炎δ病毒、I类内含子或者RNaseP样RNA(与RNA的引导序列有关)基序形成。Rossi(1992)Aids Research and Human Retroviruses 8:183描 述了此类锤头基序的例子;Hampel(1989)Biochemistry 28:4929,和Hampel(1990)Nuc.Acids Res.18:299中描述了发夹基序;Perrotta(1992)Biochemistry 31:16中描述了肝炎δ病毒基序;Guerrier-Takada(1983)Cell 35:849中描述了RNaseP基序;Cech美国专利4,987,071中描述了I类内含子。描述这些特异基序的目的不是限制性的;本领域技术人员将认识到,本发明的酶RNA分子具有与一个或者多个靶基因RNA区域互补的特异性底物结合位点,并且具有在底物结合位点内或者周围赋予该分子以RNA切割活性的核苷酸序列。
RNA干涉(RNAi)
在一方面,本发明提供包括本发明的磷脂酶序列的RNA抑制分子,即所谓的“RNAi”分子。RNAi分子包括双链RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表达。一方面,RNAi是长度为大约15、16、17、18、19、20、21、22、23、24、25或者更长的双螺旋核苷酸。虽然发明并不受限于任何特别的作用机理,但是RNAi可以进入细胞,并且引起相似或相同序列的单链RNA(ssRNA),包括内源性mRNA的降解。当细胞暴露于双链RNA(dsANA)时,来自同源基因的mRNA被称为RNA干涉(RNAi)的过程选择性地降解。RNAi背后的可能的基本机理是,将与特定的基因序列匹配的双链RNA(dsANA)断裂形成称之为短干扰RNA的短片段,该短片段可以触发与其序列匹配的mRNA的降解。在一方面,本发明的RNAi在基因沉默治疗中使用,参见,例如Shuey(2002)Drug Discov.Today7:1040-1046。在一方面,本发明提供使用本发明的RNAi选择性降解RNA的方法。该方法可以在体外、离体或在体内进行。一方面,本发明的RNAi分子可以用于在细胞,器官或动物内产生功能丧失的突变。产生RNAi分子和使用RNAi分子选择性降解RNA的方法在本领域是众所周知的,参见,例如美国专利6,506,559;6,511,824;6,515,109;6,489,127。
核酸修饰
本发明提供产生本发明的核酸例如那些编码磷脂酶的核酸的变体的方法。在可选择的实施方案中,本发明提供了修饰本发明的酶的方法,例如通过随意或随机方法,或非随机方法或定向进化方法,诸如基因位点饱和诱变TM(GSSMTM)对其编码序列进行突变,以改变酶的活性pH范围或最佳活性pH范围,活性温度范围或最佳活性温度范围、特异性、活性(动力学);酶对糖基化、磷酸化或金属(例如Ca、Mg、Zn、Fe、Na)的应用,例如以影响pH/温度稳定性。本发明提供了修饰本发明的酶的方法,例如通过GSSMTM对其编码序列进行突变,以增加它对蛋白酶活性的抗性。本发明提供了修饰本发明的酶的方法,例如通过GSSMTM对其编码序列进行突变,以改变酶对Ca、Mg、Na具有特异性但不会螯合Zn的金属螯合剂的应用。本发明提供了修饰本发明的酶的方法,例如通过GSSMTM对其编码序列进行突变,其将具有期望的活性组合,例如PI、PA和PC/PE特异性PLCs。
这些方法可以重复或者在不同的组合中使用,产生与模板核酸编码的磷脂酶相比具有改变的或不同的活性或者改变的或不同的稳定性的磷脂酶。这些方法也可以重复或者在不同的组合中使用,例如,产生基因/信息表达、信息翻译或者信息稳定性上的变化。另一方面,细胞的遗传组分可以通过,例如离体的同源基因修饰,然后再插入细胞中而加以改变。
本发明的核酸可以通过任何方法改变。例如,无规或随机方法,或者,非随机方法,或者“定向进化”方法。
基因的随机突变的方法在本领域是众所周知的,见,例如,美国专利5,830,696。例如,诱变剂可以用于随机突变基因。诱变剂包括,例如,紫外光或者γ-辐射,或者化学诱变剂,例如,丝裂霉素、亚硝酸、光致活性补骨脂素,它们单独使用或组合使用,以诱导可以通过重组进行修复的DNA断裂。其他化学诱变剂包括,例如,重亚硫酸钠、亚硝酸、羟胺、肼或者甲酸。其他诱变剂是核苷酸前体的类似物,例如,亚硝基胍,5-溴尿嘧啶,2-氨基嘌呤,或者吖啶。这些试剂可以代替核苷酸前体加入到PCR反应中,从而使序列突变。也可以使用嵌入试剂例如原黄素、吖啶黄、阿的平和类似物。
可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如,Rice(1992)Proc.Natl.Acad.Sci.USA 89:5467-5471;或者组合式多重盒式诱变,参见如,Crameri(1995)Biotechinques 18:194-196。可选择地,核酸,如基因,可以在无规或“随机”片段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793.。在可选择的方面,修饰、增加或者删除可以通过易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因重装配、基因位点饱和诱变TM(GSSMTM)、合成连接重装配(SLR)、重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成、和/或者这些方法和其它方法的组合产生。
以下的出版物描述了各种递归重组程序和/或可以整入到本发明的方法中的方法:Stemmer(1999)“Molecular breeding of viruses for targeting and other clinicalproperties”Tumor Targeting 4:1-4;Ness(1999)Nature Biotechnology 17:893-896;Chang(1999)“Evolution of a cytokine using DNA family shuffling”NatureBiotechnology 17:793-797;Minshull(1999)“Protein evolution by molecularbreeding”Current Opinion in Chemical Biology 3:284-290;Christians(1999)“Directedevolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17:259-264;Crameri(1998)“DNA shuffling of a family of genesfrom diverse species accelerates directed evolution”Nature 391:288-291;Crameri (1997)“Molecular evolution of an arsenate detoxification pathway by DNAshuffling”Nature Biotechnology 15:436-438;Zhang(1997)“Directed-evolution of aneffective fucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94:4504-4509;Patten等(1997)“Applications of DNA Shuffling toPharmaceuticals and Vaccines”Current Opinion in Biotechnology 8:724-733;Crameri等(1996)“Construction and evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2:100-103;Crameri等(1996)“Improved green fluorescent proteinby molecular evolution using DNA shuffling”Nature Biotechnology 14:315-319;Gates等(1996)“Affinity selective isolation of ligands from peptide libraries through displayon a lac repressor ′headpiece dimer′”Journal of Molecular Biology 255:373-386;Stemmer(1996)“Sexual PCR and Assembly PCR”In:The Encyclopedia of MolecularBiology.VCH Publishers,New York.447-457页;Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations of mutant andwildtype cassettes”BioTechniques 18:194-195;Stemmer等(1995)“Single-stepassembly of a gene and entire plasmid form large numbers ofoligodeoxyribonucleotides”Gene,164:49-53;Stemmer(1995)“The Evolution ofMolecular Computation”Science 270:1510;Stemmer(1995)“Searching SequenceSpace”Bio/Technology 13:549-553;Stemmer(1994)“Rapid evolution of a protein invitro by DNA shuffling”Nature 370:389-391;和Stemmer(1994)“DNA shuffling byrandom fragmentation and reassembly:In vitro recombination for molecularevolution”Proc.Natl.Acad.Sci.USA 91:10747-10751。
产生多样性的突变方法包括,例如,定点诱变(Ling等.(1997)“Approachesto DNA mutagenesis:an overview”Anal Biochem.254(2):157-178;Dale等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57:369-374;Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19:423-462;Botstein & Shortle(1985)“Strategies and applications of in vitromutagenesis”Science 229:1193-1201;Carter(1986)“Site-directed mutagenesis”Biochem.J.237:1-7;Kunkel(1987)“The efficiency of oligonucleotide directedmutagenesis”在Nucleic Acids & Molecular Biology(Eckstein,F.和Lilley,D.M.J.eds.,Springer Verlag,Berlin));使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等(1987)“Rapid and efficient site-specificmutagenesis without phenotypic selection”Methods in Enzymol.154,367-382;和Bass等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242:240-245);寡核苷酸诱导的定点诱变(Methods in Enzymol.100:468-500(1983);Methods in Enzymol.154:329-350(1987);Zoller & Smith(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient and general procedure for the production of point mutations in any DNA fragment”NucleicAcids Res.10:6487-6500;Zoller & Smith(1983)“Oligonucleotide-directedmutagenesis of DNA fragments cloned into M13 vectors”Methods in Enzymol.100:468-500和Zoller & Smith(1987)Oligonucleotide-directed mutagenesis:a simplemethod using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等(1985)“The use of phosphorothioate-modified DNA in restriction enzyme reactions to preparenicked DNA”Nucl.Acids Res.13:8749-8764;Taylor等(1985)“The rapid generationof oligonucleotide-directed mutations at high frequency usingphosphorothioate-modified DNA”Nucl.Acids Res.13:8765-8787(1985);Nakamaye(1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioategroups and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.14:9679-9698;Sayers等(1988)“Y-T Exonucleases in phosphorothioate-basedoligonucleotide-directed mutagenesis”Nucl.Asids Res.16:791-802;和Sayers等(1988)“Strand specific cleavage of phosphorothioate-containing DNA by reactionwith restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16:803-814);使用缺口双重DNA的诱变(Kramer等(1984)“The gapped duplexDNA approach to oligonucleotide-directed mutation construetion”Nucl.Acids Res.12:9441-9456;Kramer & Fritz(1987)Methods in Enzymol.“Oligonucleotide-directedconstruction of mutations via gapped duplex DNA”154:350-367;Kramer等(1988)“Improved enzymatic in vitro reactions in the gapped duplex DNA approach tooligonucleotide-directed construction of mutations”Nucl.Acids Res.16:7207;和Fritz等(1988)“Oligonucleotide-directed construction of mutations:a gapped duplex DNAprocedure without enzymatic reactions in vitro”Nucl.Acids Res.16:6987-6999)。
可以用于实践本发明方法的另外的实验方案包括点错配修复(Kramer(1984)“Point Mismatch Repair”Cell 38:879-887),应用修复缺陷型宿主株的诱变(Carter等(1985)“Improved oligonucleotide site-directed mutagenesis using M13vectors”Nucl.Acids Res.13:4431-4443;和Carter(1987)“Improvedoligonucleotide-directed mutagenesis using M13 vectors”Methods in Enzymol.154:382-403),缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate largedeletions”Nucl.Acids Res.14:5115),限制-选择和限制-纯化(Wells等(1986)“Importance of hydrogen-bond formation in stabilizing the transition state ofsubtilisin”Phil.Trans.R.Soc.Lond.A 317:415-423),通过全基因合成的诱变(Nambiar等(1984)“Total synthesis and cloning of a gene coding for the ribonucleaseS protein”Science 223:1299-1301;Sakamar和Khorana(1988)“Total synthesis andexpression of a gene for the a-subunit of bovine rod outer segment guaninenucleotide-binding protein(trahsducin)”Nucl.Acids Res.14:6361-6372;Wells等 (1985)“Cassette mutagenesis:an efficient method for generation of multiplemutations at defined sites”Gene 34:315-323;和Grundstrom等(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene synthesis”Nucl.Acids Res.13:3305-3316),双链断裂修复(Mandecki(1986),Arnold(1993)“Proteinengineering for unusual environments”Current Opinion in Biotechnology 4:450-455.“Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli:amethod for site-speciflc mutagenesis”Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的细节在Methods in Enzymology的154卷中有说明,其中也描述了用于解决各种诱变方法遇到的问题的有用的控制。
也参见Stemmer的美国专利5,605,793(1997年2月25日),“Methods forIn Vitro Recombination;”Stemmer等人的美国专利5,811,238(1998年9月22日)“Methods for Generating Polynucleotides having Desired Characteristics by IterativeSelection and Recombination;”Stemmer等人的美国专利5,830,721(1998年11月3日),“DNA Mutagenesis by Random Fragmentation and Reassembly;”Stemmer等人的美国专利5,834,252(1998年11月10日)“End-Complementary PolymeraseReaction;”Minshull等人的美国专利5,837,458(1998年11月17日),“Methods andCompositions for Cellular and Metabolic Engineering;”WO 95/22625,Stemmer和Cramen,“Mutagenesis by Random Fragmentation and Reassembly;”Stemmer和Lipschutz的WO 96/33207“End Complementary Polymerase Chain Reaction;”Stemmer和Crameri的WO 97/20078“Methods for Generating Polynucleotideshaving Desired Characteristics by Iterative Selection and Recombination;”Minshull和Stemmer的WO 97/35966,“Methods and Compositions for Cellular and MetabolicEngineering;”Punnonen等人的WO 99/41402“Targeting of Genetic VaccineVectors;”Punnonen等人的WO 99/41383“Antigen Library Immunization;”Punnonen等人的WO 99/41369“Genetic Vaccine Vector Engineering;”Punnonen等人的WO99/41368“Optimization of Immunomodulatory Properties of Genetic Vaccines;”Stemmet和Crameri的EP 752008“DNA Mutagenesis by Random Fragmentation andReassembly;”Stemmer的EP 0932670“Evolving Cellular DNA Uptake by RecursiveSequence Recombination;”Stemmer等人的WO 99/23107,“Modification of VirusTropism and Host Range by Viral Genome Shuffling;”Apt等人的WO 99/21979,“Human Papillomavirus Vectors;”del Cardayre等人的WO 98/31837“Evolution ofWhole Cells and Organisms by Recursive Sequence Recombination;”Patten和Stemmer的WO 98/27230“Methods and Compositions for Polypeptide Engineering,”Stemmet等人的WO 98/27230,“Methods for Optimization of Gene Therapy byRecursive Sequence Shuffling and Selection,”WO 00/00632,“Methods for GeneratingHighly Diverse Libraries,”WO 00/09679,“Methods for Obtaining in VitroRecombined Polynucleotide Sequence Banks and Resulting Sequences,”Arnold等人 的WO 98/42832,“Recombination of Polynucleotide Sequences Using Random orDefined Primers,”Arnold等人的WO 99/29902,“Method for Creating Polynucleotideand Polypeptide Sequences,”Vind的WO 98/41 653,“An in Vitro Method forConstruction of a DNA Library,”Borchert等人的WO 98/41622,“Method forconstructing a Library Using DNA Shuffling,”和Pati和Zarling的WO 98/42727,“Sequence Alterations using Homologous Recombination.”。
某些美国申请提供了关于产生不同多样性的方法的细节,包括Patten等人的“SHUFFLING OF CODON ALTEAED GENES”,1999年9月28日提交,(美国系列号09/407,800);del Cardayre等人的“EVOLUTION OF WHOLE CELLS ANDORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”,提交于1998年7月15日(美国系列号09/166,188)和1999年7月15日(美国系列号09/354,922);Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACIDRECOMBINATION”,提交于1999年9月28日(美国系列号09/408,392)和Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,提交于2000年1月18日(PCT/US00/01203);Welch等人的“USE OFCODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETICSHUFFLING”,提交于1999年9月28日(美国系列号09/408,393);Selifonov等人的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDS& POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,提交于2000年1月18日(PCT/US00/01202)和,例如,Selifonov等人的“METHODS FOR MAKINGCHARACTER STRINGS,POLYNUCLEOTIDS & POLYPEPTIDES HAVINGDESIRED CHARACTERISTICS”,提交于2000年7月18日(美国系列号09/618,579),Selifonov和Stemmer的“METHODS OF POPULATING DATASTRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”,提交于2000年1月18日(PCT/US00/01138);和Affholter的“SINGLE-STRANDED NUCLEICACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACIDFRAGMENT ISOLATION”,提交于2000年9月6日(美国系列号09/656,549)。
非随机的或者“定向进化”的方法包括例如,饱和诱变(例如GSSMTM)、合成的连接重装配(SLR),或者它们的组合,它们被用来修饰本发明的核酸,以产生具有新的或者改变的性质(例如,在高的酸性或碱性条件,高温和类似条件下具有活性)的磷脂酶。由修饰了的核酸编码的多肽可以在测定磷脂酶或者其它活性之前对活性进行筛选。可以应用任何测试形式或者方案,如,用毛细管阵列平台。参见,如,美国专利6,280,926;5,939,250。
饱和诱变,或GSSMTM
在本发明的一个方面中,非随机的基因修饰,“定向进化过程”,被用于产生具有新的或者改变的特性的磷脂酶。本方法的各种变化已经被称为“基因位点诱 变”、“位点饱和诱变”、“基因位点饱和诱变TM”或者简单地称为“GSSMTM”。饱和诱变可以与别的诱变过程相结合。见,例如,美国专利6,171,820;6,238,884。一方面,GSSMTM包括提供模板多核苷酸和众多的寡核苷酸,其中每种寡核苷酸包括与模板多核苷酸同源的序列,因此靶向模板多核苷酸中的特异序列,以及为同源基因的变异体的序列;通过使用寡核苷酸复制模板多核苷酸,产生包括非随机序列变异的子代多核苷酸,从而产生包括同源基因序列变异体的多核苷酸。
在一方面,将含有简并N,N,G/T序列的密码子引物用于往多核苷酸中引入点突变,以便产生一组子代多肽,其中在每个氨基酸位置都是全范围的单氨基酸取代,例如被靶向待修饰的酶活性位点或者配体结合位点中的氨基酸残基。这些寡核苷酸可以包括连续的第一同源序列,简并N,N,G/T序列,和任选地,第二同源序列。从使用这些寡核苷酸得到的下游的子代翻译产物包括多肽上的每个氨基酸位点的所有可能的氨基酸变异,这是因为N,N,G/T序列的简并性包括所有20种氨基酸的密码子。在一方面,一个这样的简并寡核苷酸(包括,例如,一个简并N,N,G/T盒)用于使亲代多核苷酸模板中的每个最初密码子进行全范围的密码子取代。在另一方面,使用至少两个简并盒——或者在相同的寡核苷酸中,或者在不相同的寡核苷酸中,以使亲代多核苷酸模板中的至少两个最初密码子进行全范围的密码子取代。例如,一个寡核苷酸中可以含有一个以上的N,N,G/T序列,以在一个以上的位点上引入氨基酸突变。大量的这些N,N,G/T序列可以直接相邻,或者被一个或多个另外的核苷酸序列隔开。在另一方面,适用于引入添加或者缺失的寡核苷酸可以单独使用或者与含有N,N,G/T序列的密码子联合使用,以引入氨基酸添加、缺失和/或取代的任何组合或者排列组合。
在一方面,应用含有邻接的N,N,G/T三联体,即简并的(N,N,G/T)n序列的寡核苷酸,可以在两个或者多个邻近的氨基酸位置同时进行诱变。另一方面,可以应用简并度比N,N,G/T序列小的简并盒。例如,在一些例子中,(如,在一个寡核苷酸中)应用包括仅仅一个N的简并三联体序列是理想的,其中所述的N可以是在三联体的第一、第二或者第三的位置。在剩下的两个位置可以使用包括任何组合和排列的任何其它的碱基。作为选择,在一些例子中,(如,在一个寡核苷酸中)使用简并的N,N,N三联体序列是理想的。
一方面,应用简并的三联体(如N,N,G/T三联体),可以系统地而容易地在多肽的每一和所有氨基酸位置中产生完整范围的可能的天然氨基酸(对应于所有20个氨基酸)(在可供选择的方面,所述方法也包括在每一个氨基酸残基或者密码子位置产生比所有可能的种类要少的替换)。例如,对于100个氨基酸的多肽,可以产生2000个不同的种类(即,每个位置可能的20种氨基酸×100个氨基酸位置)。通过应用含有简并N,N,G/T三联体的一段寡核苷酸或者一套寡核苷酸,32个不同的序列可以编码所有20种可能的天然氨基酸。因此,在使用至少一种这样的寡核苷酸进行亲本多核苷酸序列饱和诱变的反应容器中,产生了32种不同的 子代寡核苷酸,它们编码20种不同的多肽。相反地,在定点突变中,应用非简并的寡核苷酸导致在每个反应容器中仅仅有一种子代多肽产物。非简并的寡核苷酸可以选择性地与公开的简并引物组合使用;例如,在工作多肽中,可以应用非简并的寡核苷酸来产生特异的点突变。这就提供了一种手段来获得特定的沉默点突变、导致相应的氨基酸变化的点突变、以及引起终止密码子产生和多肽片段相应的表达终止的点突变。
一方面,每一个饱和诱变反应容器中含有编码至少20种子代多肽(如,磷脂酶)分子的多核苷酸,因此所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中的被诱变的密码子位置的特定氨基酸位置(其它的例子使用了少于20个天然的组合)。产生于每个饱和诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使用例如表达载体克隆至合适的宿主,如大肠杆菌宿主),然后进行表达的筛选。当通过筛选确定显示出有利的性质变化(例如与亲本多肽比较,在碱性、酸性条件下磷脂酶活性增强)的单个子代多肽时,就可以用测序来确定其中所含有的相应的有利的氨基酸取代。
一方面,如在此所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变,可以在超过一个的氨基酸位置确定出的有利的氨基酸变化。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者多种新的子代分子。例如,如果在多肽的三个氨基酸位置的每一个位置确定出2个特定的有利的氨基酸变化,这样出现的排列就包括在每一个位置的3种可能性(与原来的氨基酸没有变化,和两个有利变化中的每一个)和3个位置。这样,就有3×3×3或者27种总的可能性,包括先前检查出的7种——6种单点突变(即,在三个位置的每一个有2个)和在任何位置中都没有变化的1种。
另一方面,为了改变序列,定点饱和诱变可以与任何随机的或非随机方法一起使用,例如,合成的连接重装配(见下文),重排,嵌合,重组和其他诱变过程和诱变剂。本发明提供以重复方式使用任何诱变过程,包括饱和诱变。
合成的连接重组装(SLR)
本发明提供称为“合成连接重装配”,或者简单地称为“SLR”的非随机基因修饰系统,这是一种“定向进化方法”,以产生具有新的或者改变的特性的磷脂酶。SLR是非随机地把寡核苷酸片段连接在一起的方法。此方法与随机的寡核苷酸重排不同,因为核酸构件不被随机重排、串联或者随机地嵌合,而是非随机组装。参见,例如,美国专利申请系列号(USSN)09/332,835,题目是”Synthetic LigationReassembty in Directed Evolution”,于1999年6月14日提交(“USSN 09/332,835”)。一方面,SLR包括以下步骤:a)提供模板多核苷酸,其中该模板多核苷酸包括编码同源基因的序列;(b)提供多个构建模块多核苷酸,其中所述的构建模块多核苷酸被设计为可与模板多核苷酸在预定的序列处交叉装配(cross-over reassemble),而且所述的构建模块多核苷酸包括所述同源基因的变异体序列以及在变异序列两 侧与模板多核苷酸同源的序列;(c)将模板多核苷酸与构建模块多核苷酸结合,以便构建模块多核苷酸与模板多核苷酸交叉装配,产生包含同源基因序列变异的多核苷酸。
SLR并不依赖于在待重新组装的多核苷酸之间存在高水平的同源性。这样,这一方法可以用于非随机地产生包括超过10100个不同嵌合体的子代分子文库。SLR可以用于产生包括超过101000个不同子代嵌合体的文库。这样,本发明的这些方面包括用于产生一套最终的具有按设计选择的整个装配顺序的嵌合核酸分子的非随机方法。这一方法包括按设计产生大量特定的核酸构建模块的步骤,这些核酸构建模块具有可以应用的相互间相容的可以连接的末端,然后装配这些核酸构建模块,这样就完成了按设计的全部装配顺序。
将被装配的核酸构建模块的相互相容的可连接的末端对于这种类型的顺序装配被认为是“适用的”,如果它们使得构建模块以预先制定的顺序联接的话。因此,核酸构建模块被偶联的总体装配顺序是通过可连接末端的设计来特异化的。如果不止一个装配步骤将要被应用,那么核酸构建模块被偶联的总体装配顺序也通过装配步骤的先后次序来特异化。一方面,退火的构建模块用酶处理,如用连接酶(如,T4 DNA连接酶)处理,以完成构建模块间的共价键结合。
一方面,寡核苷酸构建模块的设计通过分析一套祖先核酸序列模板而获得,该模板作为产生子代一套最终的嵌合多核苷酸的基础。这些亲本寡核苷酸模板作为序列信息源,辅助待诱变例如待嵌合或者重排的核酸构建模块的设计。
在这一方法的一个方面,为了选择一个或者多个分界点(demarcationpoints),对多个亲本核酸模板的序列进行联配。所述分界点可以位于同源的区域,并且可以包括一个或者多个核苷酸。这些分界点在一个方面由至少两个祖先模板中共有。所述分界点可以因此用于描绘将要产生的寡核苷酸构建模块的边界,以便重新排列亲本寡核苷酸。在祖先分子中确定和选择的分界点用作装配最终的嵌合子代分子的潜在的嵌合位点。分界点可以是至少两个亲本多核苷酸序列共同的同源区域(包括至少一个同源核苷酸碱基)。可选择地,分界点可以是由至少半数的亲本多核苷酸序列共同拥有的同源区域,或者,是由至少三分之二的亲本多核苷酸序列共同拥有的同源区域。甚至更优选地,可应用的分界点是至少四分之三的亲本多核苷酸序列共同拥有的同源区域,或者,是几乎所有的亲本多核苷酸序列共同拥有的同源区域。一方面,分界点是由所有的亲本多核苷酸序列共同拥有的同源区域。
一方面,为了产生一个全面的子代嵌合多核苷酸文库,连接重装配过程被尽可能充分地实施。换句话说,核酸构建模块的所有可能顺序的组合存在于一套最终的嵌合核酸分子中。同时,另一方面,每个组合中的装配顺序(即,各个构建模块的装配顺序,按各个最终的嵌合核酸序列的5’到3’的方向)是按照以上所 述设计的(或者是非随机的)。由于本发明的非随机性质,产生不需要的副产物的可能性大大降低。
在另一方面,系统地实施连接重装配的方法。例如,实施本方法来产生系统区分化的子代分子文库,划分开的文库可以系统地进行筛选,例如逐个的筛选。换句话说,通过选择性的和审慎的应用特定的核酸构建模块,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这就允许进行系统的检查和筛选步骤。因此,这些方法允许对很可能是很大数目的子代分子以较小的组进行系统性检测。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,所以这些方法可以产生包括很大数目的子代分子的文库(或者一套分子)。由于该连接重装配发明的非随机性,产生的子代分子在一个方面包括具有依设计而选择的全部装配序列的最终嵌合核酸分子的文库。饱和诱变和优化的定向进化方法也可以用于产生不同的子代分子种类。可以理解,本发明在分界点的选择、核酸构建模块的大小和数目以及偶联的大小和设计方面提供了选择和控制的自由度。更进一步理解的是,本发明的操作对分子间同源性的要求被大大放松了。实际上,甚至可以在有较少分子间同源性或者没有分子间同源性的区域选择区别点。例如,由于密码子的摆动性,即,密码子的简并,核苷酸的替代可以被引入到核酸构建模块中而并不改变在相应的祖先模板中起初编码的氨基酸。可选择地,密码子可以被改变以至于原先的氨基酸的编码被改变。本发明提供了这样的替换,它们能够被引入到核酸构建模块中,由此增加分子间同源的分界点的发生率,这样就允许在构建模块之间实现更多数目的偶联,这又使得更多数目的子代嵌合分子产生。
另一方面,构件产生的步骤的合成特性允许设计和引入核苷酸(例如,一个或者多个核苷酸,其可以是,例如密码子或内含子或者调控序列),其以后可以任选地在体外过程(例如,通过诱变)或者体内过程(例如,通过利用宿主微生物的基因剪切能力)中被除去。应该理解的是,在许多情况中,除了产生适用的分界点的潜在好处之外,由于许多别的原因,这些核苷酸的引入也是理想的。
一方面,核酸构件被用于引入内含子。因此,功能性的内含子被引入进根据在此描述的方法产生的人造基因中。人工引入的内含子可以在宿主细胞中发挥基因剪切的功能,作用方式如同天然产生的内含子发挥基因剪切的功能的方式。
优化的定向进化系统
本发明提供了一种非随机的基因修改系统,命名为“优化的定向进化系统”,其可以用来产生具有新的或者改变的特性的磷脂酶。优化的定向进化涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用,其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列, 其中产生的群体显著地富集了具有预定数目遗传交换事件(crossover events)的序列。
遗传交换事件是在嵌合序列中的一个点,在这里,发生从一个亲本变异体到另一个亲本变异体的序列转换。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
此外,这一方法与其他系统相比,提供了一种用于探究巨大数量的可能的蛋白变异体的方便手段。以前,例如,如果在反应中产生了1013个嵌合分子,测试这样大数目的嵌合突变体的特定活性将会非常困难。此外,子代群体的相当部分将具有很高数目的遗传交换事件,其中得到的蛋白不大可能具有增高水平的特定活性。通过应用这些方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以偏向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多核苷酸中的哪一个可能影响到特定的性质时,这时便提供了更加可控制的变量。
产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡核苷酸。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡核苷酸混合在一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变异体。在USSN 09/332,835中可以发现另外的信息。对应于每一个亲本变异体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如,为了发现具有如在高温下的更高活性的嵌合变异体,可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子,对应于每一个亲本变异体的每一部分可以产生一套50个寡核苷酸序列。因此,在连接重装配过程中,在每一个嵌合序列中有可能有超过50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变异体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔数量存在于连接反应中,有可能在一些位置中来自同一亲本多核苷酸的寡核苷酸将相互一个个连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一个寡核苷酸的浓度保持不变,那么将会有1/3的可能性(假定3个亲本):来自同一个亲本变异体的寡核苷酸将在嵌合序列内连接,而不产生遗传交换。
相应的,可以确定概率密度函数(PDF),以预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给定了一套确定数目的亲本变异体、对应于每种变体的寡核苷酸、以及在连接反应中的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法,可 以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用,通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点,在这里,发生从一个亲本变异体到另一个亲本变异体的序列转换。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
此外,这些方法与其他系统相比,提供了一种用于探究大数量的可能蛋白变异体空间的方便手段。通过应用在这里描述的方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013个嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多核苷酸中的哪一个可能影响到特定的性质时,这时便提供了更加可控制数量的变量。
一方面,该方法通过产生对应于每一个亲本序列的片段或者部分的寡核苷酸,产生嵌合子代多核苷酸序列。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡核苷酸混合一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变异体。也可参见USSN 09/332,835。
对应于每一个亲本变异体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如,为了发现具有如在高温下的更高活性的嵌合变异体,可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子,对应于每一个亲本变异体的每一部分可以产生一套50个寡核苷酸序列。因此,在连接重装配过程中,在每一个嵌合序列中有可能有超过50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变异体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔数量存在于连接反应中,有可能在一些位置中来自同一亲本多核苷酸的寡核苷酸将相互一个个连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一个寡核苷酸的浓度保持不变,那么将会有1/3的可能性(假定3个亲本):来自同一个亲本变异体的寡核苷酸将在嵌合序列内连接,而不产生遗传交换。
因此,可以确定概率密度函数(PDF),以预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给定了一套确定数目的亲本变异体、对应于每种变体的寡核苷酸、以及在连接反应中的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。
确定遗传交换事件
本发明的实施方案包括系统和软件,它们接受所需的遗传交换的概率密度函数(PDF)、待重新装配的亲本基因的数目以及重新装配的片段数目作为输入量。该程序输出“片段PDF”,它可以用于确定用于获得重新装配的基因和那些基因的估计的遗传交换PDF的具体方法。于此说明的过程优选地在MATLAB
(TheMathworks,Natick,Massachusetts)中进行,MATLAB
是一种用于技术计算的程序语言和开发环境。
迭代过程(iterative process)
在实践本发明时,这些过程可以迭代反复。例如,对产生改变的磷脂酶表型的核酸(或者,所述核酸)进行鉴定,重新分离,再修饰,再检测活性。此过程可以反复重复,直到得到所需的表型。例如,整个生物化学的合成代谢或者分解代谢途径可以在细胞中设计,包括磷脂酶活性。
类似地,如果确定了特定的寡核苷酸对于所有所需的性质(如,新的磷脂酶表型)没有影响,那么就可以合成包括这段序列在内的更大的亲本寡核苷酸,从而将作为变量的这段序列去除。由于将这段序列合并到更大的序列中,可以避免任何遗传交换事件,所以在子代多核苷酸中,这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系,以及哪些与所需的性质无关的重复实践,可以更有效地探寻可能提供特定性质或者活性的所有蛋白变异体。
体内重排
分子的体内重排用在本发明的提供本发明的多肽如抗体、磷脂酶和类似物的变异体的方法中。体内重排可以利用细胞重组多聚体的天然特性来进行。尽管体内的重组提供了实现分子多样性的主要的天然途径,遗传重组仍然是一种相对复杂的过程,其涉及1)同源性识别;2)链切割,链侵入,和导致产生重组交叉(recombination chiasma)的代谢步骤;和最后3)交叉消除至分离的重组分子。交叉的形成需要同源序列的识别。
一方面,本发明提供由至少第一个多核苷酸和第二个多核苷酸产生杂合多核苷酸的方法。本发明可以用于通过将共有具部分序列同源性的至少一个区域的至少第一多核苷酸和第二多核苷酸引入到合适的宿主细胞中而产生杂合多核苷 酸。该具部分序列同源性的区域促进导致产生杂合多核苷酸的序列识别的过程。正如在此使用的,术语“杂合多核苷酸”是由本发明的方法产生的任何核苷酸序列,含有从至少两个最初多核苷酸序列得到的序列。这样的杂合多核苷酸可以由促进DNA分子间的序列整合的分子间重组事件产生。另外,这样的杂合多核苷酸可以由利用重复序列以改变DNA分子中的核苷酸序列的分子内还原性重配过程产生。
产生序列变异体
本发明也提供使用本发明的核酸和多肽产生本发明的核酸和磷脂酶序列变异体,或者分离磷脂酶例如磷脂酶的序列变异体的方法。一方面,本发明提供本发明的磷脂酶基因的变异体,所述基因可以使用任何方法改变,包括,例如随机方法,或者非随机方法,或者“定向进化”方法,如上描述。
分离的变异体可以是天然发生的。变异体也可以体外产生。变异体可以使用遗传工程技术,例如定点诱变,随机化学诱变,核酸外切酶III缺失程序和标准克隆技术产生。做为选择,这样的变异体,片段,类似物或衍生物可以使用化学合成或者修饰程序产生。产生变异体的别的方法也为本领域技术人员所熟悉。这些方法包括修饰从天然分离物得到的核酸序列,产生编码具有特性的多肽的核酸的程序,所述特性增加它们在工业或实验室应用中的价值。在这些程序中,产生并且表征大量与从天然分离物得到的序列相比具有一个或多个核苷酸差异的变异体序列。这些核苷酸差异可以导致产生相对于由天然分离物的核酸编码的多肽而言的氨基酸变化。
例如,变异体可以使用易错PCR产生。在易错PCR中,PCR在DNA聚合酶复制保真度低的情况下进行,这样在PCR产物的全长中获得高比率的点突变。易错PCR在,例如Leung,D.W.,等,Technique,1:11-15,1989)和Caldwell,R.C.&Joyce G.F.,PCR Methods Applic.,2:28-33,1992中有描述。简要而言,在这些程序中,为了在全长的PCR产物中得到高比率的变突变,将待诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶和合适浓度的dNTP混合。例如,反应使用20毫微微摩尔(fmoles)待诱变的核酸,每种PCR引物30皮摩尔,反应缓冲液包括50mM KCl,10mM Tris HCl(PH8.3)和0.01%明胶,7mM MgCl2,0.5mMMnCl2,5单位的Taq聚合酶,0.2mM dGTP,0.2mM dATP,1mM dCTP和1mM dTTP。PCR进行30个循环,每个循环为94℃1分钟,45℃1分钟,72℃1分钟。然而,应该理解地是,这些参数可以适当的改变。将诱变的核酸克隆进入合适的载体中,并评估诱变的核酸编码的多肽的活性。
变异体也可以使用寡核苷酸定向诱变产生,在感兴趣的任何克隆DNA中产生位点专一的变异。寡核苷酸诱变在,例如,Reidhaar-Olson(1988)Science241:53-57中有描述。简要地,在这些程序中,合成待被引入到克隆的DNA中的许多具有一个或多个突变的双链寡核苷酸,并且插入到待诱变的克隆DNA中。回收含有经诱变的DNA的克隆,并评定经诱变的DNA编码的多肽的活性。
另一个产生变异体的方法是装配PCR。装配PCR涉及由小的DNA片段的混合物装配出PCR产物。在同一个容器中平行进行很多不同的PCR反应,其中,一个反应的产物用作另外一个反应的引物。装配PCR在例如美国专利5,965,408中有说明。
还有一个产生变异体的方法是有性PCR诱变。在有性PCR诱变中,由于基于序列同源性的DNA分子的随机片段化,在不同的但是高度相关的DNA序列的DNA分子之间,在体外强行发生同源重组,然后通过PCR反应的引物延伸,遗传交换得到固定。有性PCR诱变在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA 91:10747-10751中描述。简要地说,在这样的程序中,多个待重组的核酸用DNase消化,产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段,重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR反应。例如,PCR可以这样进行:将纯化的片段重悬于含有0.2mM的各种dNTP、2.2mM MgCl2、50mM KCl、10mM的Tris-HCl,pH 9.0以及0.1%的Triton X-100的溶液中,其浓度为10-30ng/μl,以100∶1的比例在反应混合物中加入2.5Units的Taq聚合酶,用以下的条件进行PCR:94℃60秒,94℃30秒,50-55℃30秒,72℃30秒(30-45次),然后72℃进行5分钟。然而,这些参数可以进行适当的变化。在一些方面,寡核苷酸可以包括在该PCR反应中。在其它的一些方面,DNA聚合酶I的Klenow片段可以用于第一轮PCR反应,而Taq聚合酶可以用于后续的PCR反应。重组序列经过分离并评估它们编码的多肽的活性。
变异体也可以通过体内诱变产生。在一些方面,感兴趣的序列中的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生,所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖将最终产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在,例如,PCT公开号WO91/16427中有描述。
变异体也可以通过应用盒式诱变产生。在盒式诱变中,双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸“盒子”替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。
递归整体诱变也可以用于产生变异体。递归整体诱变是一种用于蛋白质工程(蛋白突变)的算法,它的开发是为了产生表型相关的突变体组成的多样性群体,其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA 89:7811-7815中有描述。
在一些方面,用指数整体诱变产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程,其中一小组的残基被随机化,同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整 体诱变在如,Delegrave(1993)Biotechnology Res.11:1548-1552中有描述。随机和定点诱变在如,Amold(1993)Current Opinion in Biotechnology 4:450-455中有描述。
在一些方面,变异体利用重排方法产生,其中编码不同的多肽的多个核酸的部分被融合在一起,产生编码嵌合多肽的嵌合核酸序列,其描述于美国专利5,965,408;5,939,250中。
本发明也提供本发明的多肽变异体,包括其中一个或多个氨基酸残基(例如,本发明的示范性多肽的氨基酸残基)被保守的或不保守的氨基酸残基(例如,保守的氨基酸残基)取代,这样的取代的氨基酸残基可以是或者不是由遗传密码编码的氨基酸残基。保守的取代是多肽中给定的氨基酸被具有相似特征的另一个氨基酸取代。因此,本发明的多肽包括本发明的序列的保守取代,包括但不局限于以下取代:脂肪族氨基酸,例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸被另一个脂肪族氨基酸取代;丝氨酸被苏氨酸取代,或者相反;酸性残基例如天冬氨酸和谷氨酸被另一酸性残基取代;具有酰胺基团的残基,例如天冬酰胺和谷氨酰胺被另一具有酰胺基团的残基取代;碱性残基例如赖氨酸和精氨酸与另一碱性残基互换;芳香族残基例如苯丙氨酸、酪氨酸被另一芳香族残基取代。其他变异体是本发明的多肽的一个或多个氨基酸残基包括取代基团的那些变异体。
包括在本发明范围中的其他变异体是多肽与另一化合物,例如可以增加多肽半寿期的化合物,例如聚乙二醇缔合的那些变异体。
在本发明范围内的另外的变异体中,另外的氨基酸融合到多肽上,如前导序列、分泌序列、蛋白原序列(proprotein sequence)或者有利于纯化、富集或者使所述多肽稳定的序列。
在一些方面,发明的多肽变异体、片段、衍生物和类似物保持与示范性多肽相同的生物功能或活性,例如在此描述的磷脂酶活性。另一些方面,变异体、片段、衍生物或类似物包括原蛋白(proprotein),这样,变异体,片段,衍生物或类似物可以通过切割原蛋白部分产生活性多肽被而活化。
密码子优化,实现宿主细胞中高水平的蛋白表达
本发明提供修饰编码磷脂酶的核酸,以便改变密码子使用(codon usage)的方法。一方面,本发明提供修饰编码磷脂酶的核酸中的密码子,以增加或降低其在宿主细胞中的表达的方法。本发明也提供了编码经修饰而增强其在宿主细胞中的表达的磷脂酶的核酸、经过这样的修饰的磷脂酶,和制备经修饰的磷脂酶的方法。该方法包括确定编码磷脂酶的核酸中“非-偏爱的”或者“较不偏爱的”密码子,并且用编码同样氨基酸的“偏爱的密码子”作为替换密码子替换一个或者多个这样的非-偏爱或者较不偏爱的密码子,并且在所述核酸中至少一个非-偏爱或者较不偏爱的密码子被编码相同氨基酸的偏爱密码子替换。偏爱密码子是在宿主细胞基因 的编码序列中被优先使用的密码子,而不偏爱的或者较不偏爱的密码子是指在宿主细胞基因的编码序列中较少使用的密码子。
用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此,本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸,以及由所述的密码子被改变的核酸编码的多肽。示范性的宿主细胞包括革兰氏阴性细菌,如大肠杆菌;革兰氏阳性细菌,芽孢杆菌属(Bacillus)(蜡状芽孢杆菌(B.cereus))或链霉菌、加氏乳酸杆菌(Lactobacillus gasseri)、乳酸乳球菌(Lactococcus lactis)、乳脂乳球菌(Lactococcus cremoris)、枯草芽孢杆菌。示范性的宿主细胞也包括真核生物体,如,各种酵母,如酵母属的种(Saccharomyces sp.),包括酿酒酵母、粟酒裂殖酵母、巴斯德毕赤酵母和乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)、黑曲霉(Aspergillus niger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此,本发明也包括在这些生物体和生物物种中的表达被优化的核酸和多肽。
例如,从细菌细胞中分离的编码磷脂酶的核酸密码子被修饰,以便该核酸在不同于获得该磷脂酶的细菌的细菌细胞、酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中优化表达。优化密码子的方法在本领域是已知的,参见如,美国专利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)Protein Expr.Purif.12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect.Immun.69:7250-7253,描述了在鼠系统中优化密码子;Outchkourov(2002)Protein Expr.Purif.24:18-24,描述了在酵母中优化密码子;Feng(2000)Biochemistry39:15399-15409,描述了在大肠杆菌中优化密码子;Humphreys(2000)Protein Expr.Purif 20:252-264,描述了大肠杆菌中导致分泌的优化密码子使用。
转基因非-人类的动物
本发明提供了包含本发明的核酸、多肽、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因非人类动物。转基因非人动物可以是,例如,包括本发明的核酸的山羊、兔、绵羊、猪、牛、大鼠和小鼠。这些动物可以作为,例如体内研究磷脂酶活性的模型使用,或者体内筛选磷脂酶活性的调节物的模型使用。欲在转基因非人动物中表达的多肽的编码序列可以设计为组成型的,或者组织特异性、发育特异性或者诱导转录调控因子的控制之下。转基因非人动物可以用本领域已知的任何方法设计和产生;参见,例如美国专利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571,这些专利描述了产生和使用转化的细胞和卵,以及转基因小鼠、大鼠、兔、绵羊、猪和母牛。也参见,例如Pollock(1999)J.Immunol.Methods 231:147-157,描述在转基因 产奶动物的奶中产生重组蛋白;Baguisi(1999)Nat.Biotechnol.17:456-461,描述转基因山羊的产生。美国专利6,211,428,描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人类哺乳动物。美国专利5,387,742,描述了把克隆的重组子或者合成的DNA序列注射至鼠受精卵中,移植注射的卵至假孕的雌鼠中,并且生长成为转基因鼠,它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992,描述了制备和应用转基因鼠,它的基因组具有编码淀粉样蛋白原(APP)的基因的断裂。
“基因敲除动物(knockout animals)”也可以用于实践本发明的方法。例如,在一方面,本发明的转基因动物或者修饰的动物包括“基因敲除动物”,如“基因敲除鼠”,它被工程改造,不会表达或不能表达磷脂酶。
转基因植物和种子
本发明提供了包含本发明的核酸、多肽(例如磷脂酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因植物和种子。本发明也提供了包含本发明的核酸和/或多肽(例如磷脂酶)的植物产物,如油、种子、叶、提取物以及类似物。转基因植物可以是双子叶的(双子叶植物)或者单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如,美国专利6,309,872。
本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如,核酸或者表达构建物可以导入到所需的植物宿主的基因组中,或者,核酸或者表达构建物可以是附加体。可以导入到所需植物的基因组中,这样宿主的磷脂酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”,其中例如同源重组导致的基因序列的插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已知的,参见,如,Strepp(1998)Proc Natl.Acad.Sci.USA95:4368-4373;Miao(1995)Plant J 7:359-365。参见下面的转基因植物的讨论。
本发明的核酸可以将所需的性质赋予基本上任何植物,例如,含油籽的植物,如水稻,大豆,油菜籽,向日葵子,芝麻和花生。为了优化或改变宿主磷脂酶的表达,本发明的核酸可以用于控制植物代谢途径。这可以改变植物中磷脂酶的活性。作为选择,本发明的磷脂酶可以用于产生转基因植物,以产生天然情形下不由此植物产生的化合物。这可以降低生产成本或产生新的产品。
一方面,产生转基因植物的第一步骤涉及制备在植物细胞中表达的表达构建物。这些技术是本领域熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列以及选择适当的基因终止序列。典型的组成型启动子是来自花椰菜花叶病毒的CaMV35S,它一般在植物中导致高水平的表达。其它的 启动子更具特异性,并且对植物的内部或者外部环境中的暗示有反应。典型的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。
一方面,修饰核酸来实现在植物细胞中更强的表达。例如,本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率,而一些植物优选G-C核苷酸对。因此,编码序列中的A-T核苷酸可以用G-C核苷酸取代,而不显著改变氨基酸序列,可以增强在植物细胞中基因产物的产生。
为了鉴定已经成功整合了转移基因的植物细胞或者组织,可以将选择性标记基因加入到基因构建物中。这可能是必要的,因为在植物细胞中完成基因的整合和表达是一个小概率事件,仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白,所述试剂一般对植物有毒性,如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时,只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样,为了有恰当的功能,标记基因也需要启动子和终止序列。
一方面,转基因植物或种子制备方法包括将发明的序列,和任选地,标记基因整合到目标表达构建物(例如,质粒)中,同时定位启动子和终止子序列。这可以包括将修饰的基因通过合适方法转入植物中。例如,构建物可以应用如电穿孔和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中,或者构建物可以应用弹道方法(ballistic methods),如,DNA微粒轰击(DNA particlebombardment)的方法直接引入到植物组织中。例如,参见如,Christou(1997)Plant Mol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature 327:70-73;Talcumi(1997)Genes Genet.Syst.72:63-69,讨论了应用微粒轰击引入转基因到小麦中;Adam(1997)如上,应用微粒轰击将YACs引入至植物细胞中。例如,Rinehart(1997)如上,用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明;而且,可以通过商业渠道获得BioRad(Biolistics)PDS-2000微粒加速设备;也参见,John,美国专利5,608,148;和Ellis,美国专利5,681,730,描述了微粒介导的裸子植物的转化。
一方面,原生质体可以被固定,并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易,但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化,其中的DNA被包裹于钨微射弹(tungsten microprojectiles)上,射出物的大小为细胞大小的1/100,它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生,一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。
核酸,例如表达构建物也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化,如,烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol. Biol.33:989-999),参见Porta(1996)“Use of viral replicons for the expression of genesin plants”,Mol.Biotechnol.5:209-221。
可选择地,核酸,如表达构建物,可以与合适的T-DNA旁侧区域组合,并导入到传统的根癌农杆菌宿主载体中。根癌农杆菌宿主的毒力功能将在植物细胞受该细菌感染时,引导构建物和邻近的标记插入至植物细胞DNA中。根癌农杆菌介导的转化技术,包括disarming和二元载体的应用,在科学文献中有详细的说明。参见,如,Horsch(1984)Science 233:496-498;Fraley(1983)Proc.Natl.Acad.Sci.USA 80:4803(1983);Gene Transfer to Plants,Potrykus,ed.(Springer-Verlag,Berlin 1995)。根癌农杆菌细胞的DNA被包含在细菌染色体中,也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(~20kb长)和一系列毒力(virulence)基因,T-DNA在感染过程中被转移到植物细胞中,毒力基因则引导所述感染过程。根癌农杆菌可以通过伤口感染植物:当植物的根或者茎受伤,它释放某种化学信号,作为对这种信号的响应,根癌农杆菌的毒力基因被激活,并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录,然后将自身插入到暴露的植物DNA中。为了应用根癌农杆菌作为转基因载体,必须去除T-DNA的肿瘤诱导部分,而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间,从这里转移到植物细胞并且整合到植物的染色体中。
本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化,参见Hiei(1997)Plant Mol.Biol.35:205-218。也参见如,Horsch,Science(1984)233:496;Fraley(1983)Proc.Natl Acad.Sci USA 80:4803;Thykjaer(1997)如上;Park(1996)Plant Mol.Biol.32:1135-1148,讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin,美国专利5,712,135,描述了包含在谷类或者其它单子叶植物的细胞中的具有功能性的基因的DNA的稳定整合过程。
一方面,第三步可以包括能够将整合的靶基因传递至下一代的完整植物的选择和再生。这样的再生技术依赖于对组织培养生长培养基中的某些植物激素的操作,典型地,依赖于与所需的核苷酸序列一同引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明,Evans等,Protoplastslsolation and Culture,Handbook of Plant Cell Culture,124-176页,MacMillilanPublishing Company,New York,1983;和Binding,Regeneration of Plants,PlantProtoplasts,21-73页,CRC Press,Boca Raton,1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.ofplant Phys.38:467-486中有概括性的说明。为了从转基因组织如未成熟的胚胎获得整个植物,它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件 下培养,即称为组织培养的过程。一旦整个植物再生并且产生种子,便开始评价子代。
在表达序列盒稳定地整入到转基因植物之后,其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术,这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化,包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此,本发明的种子可以来自本发明的两个转基因植物的杂交,或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(如,磷脂酶)时,所需的效应(例如,表达本发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。
本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草,如牧草(蓝草,早熟禾属Poa),饲料草如羊茅属,黑麦草属,温带草,如翦股颖属(Agrostis),和谷类,如,小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草、豆类,如羽扇豆、马铃薯、甜菜、豌豆、蚕豆和大豆,以及十字花科植物(Brassicaceae属),如花椰菜,油菜籽,和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样,本发明的转基因植物和种子包括很宽范围的植物,包括,但不限于,以下属的种:腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、油菜属(Brassica)、柑桔属(Citrus)、Citrullus、辣椒属(Capsicum)、Carthamus、椰子属(Cocos)、咖啡属(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、Daucus、Elaeis、Fragaria、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、Majorana、苜蓿属(Medicago)、烟草属(Nicotiana)、Olea、Oryza、Panieum、Pannisetum、鳄梨属(Persea)、菜豆属(Phaseolus)、Pistachia、Pisum、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、Sinapis、茄属(Solanum)、高粱属(Sorghum)、Theobromus、Trigonella、小麦属(Triticum)、野豌豆属(Vicia)、Vitis、Vigna、和玉蜀黍属(Zea)。
在可供选择的实施方式中,本发明的核酸在植物(例如,转基因植物),如含油籽植物,例如水稻、大豆、油菜籽、向日葵子、芝麻和花生中表达。本发明的核酸可以在含纤维细胞的植物,包括例如,棉花、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、balsa、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻中表达。在可供选择的实施方式中,本发明的转基因植物可以是棉 属(Gossypium)的成员,包括任何棉(Gossypium)种的成员,如,亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。
本发明也提供用于大量生产本发明的多肽(例如磷脂酶或抗体)的转基因植物。例如,参见Palingren(1997)Trends Genet.13:348;Chong(1997)TransgenicRes.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′,2′)启动子,应用根癌农杆菌介导的叶片圆盘(leaf disc)转化方法,在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。
应用已知的程序,技术人员可以通过检测在转基因植物中转基因mRNA或者蛋白的增加或者减少来筛选本发明的植物。检测和定量mRNA或者蛋白的方法是本领域熟知的。
多肽或肽
本发明提供了与本发明的示范性序列例如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ IDNO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ IDNO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ IDNO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ IDNO:168、SEQ ID NO:170、SEQ ID NO:172,or SEQ ID NO:174具有序列同一性(例如,至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)序列同一性)的分离 的或重组的多肽。如以上讨论的,同一性可以在多肽的全长范围内,或者,同一性可以在其子序列,例如,至少大约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多残基的范围内。本发明的多肽也可以比示例性多肽(例如,SEQ ID NO:2、SEQ ID NO:4、SBQ ID NO:6、SEQ ID NO:8等)的全长要短。在可选择的实施方案中,本发明提供大小在大约5到多肽全长范围的多肽(肽,片段),所述多肽例如酶,如磷脂酶,例如,磷脂酶;示例性大小为大约5、10、15、20、25、30、35,40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400或更多残基,例如,SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8等的示例性磷脂酶的连续残基。本发明的肽可以用作,例如,标记探针、抗原、耐受原、基序、磷脂酶活性位点、结合结构域、调控结构域和类似物。
一方面,多肽具有磷脂酶活性,例如,切割甘油磷酸酯键,水解磷酸酯键的能力,包括马铃薯块茎蛋白(patatin),脂酰水解酶(LAH),磷脂酶A,B,C和/或磷脂酶D活性,或它们的任意组合。
在可选择的方面,本发明的示例性多肽具有磷脂酶活性,信号序列位置、最初来源,如在下表1中所阐述。为了帮助阅读此表,例如在第一排,其中SEQ IDNO:143、144指具有在SEQ ID NO:144中阐述的序列的多肽,和由SEQ ID NO:143编码的多肽,它们具有PLA-特异性PLA活性,最初分离自未知来源;另一个例子在SEQ ID NO:167,168行,其中167、168指具有在SEQ ID NO:168中阐述的序列的多肽,和由SEQ ID NO:167编码的多肽,它们具有磷脂酸磷酸酶活性,信号序列在位置1至30(“AA1-30”指氨基酸残基1至30,等等),即MARSWKWRPLLSSFLLVSLAPFSTSVPCFK,最初分离自未知来源。本发明提供也包含信号序列的肽,和嵌合多肽,其中所述肽和嵌合多肽包含表1中所阐述的信号序列,如下面所述。
表1
SEQ ID NO: |
酶类型 |
信号 序列 位置 (AA= 氨基 酸) |
信号(AA) |
来 源 |
143, 144 |
PA-特异 性PLA |
|
|
未 知 |
25,26 |
Patatin |
|
|
未 知 |
77,78 |
Patatin |
|
|
未 |
[0384]
|
|
|
|
知 |
35,36 |
Patatin |
|
|
未 知 |
125, 126 |
Patatin |
|
|
未 知 |
135, 136 |
Patatin |
|
|
未 知 |
99,100 |
Patatin |
|
|
未 知 |
65,66 |
Patatin |
|
|
未 知 |
87,88 |
Patatin |
|
|
未 知 |
86,87 |
Patatin |
|
|
未 知 |
45,46 |
Patatin |
|
|
未 知 |
59,60 |
Patatin |
|
|
未 知 |
13,14 |
Patatin |
|
|
未 知 |
71,72 |
Patatin |
|
|
未 知 |
55,56 |
Patatin |
|
|
未 知 |
33,34 |
Patatin |
|
|
未 知 |
91,92 |
Patatin |
|
|
未 知 |
103, 104 |
Patatin |
|
|
未 知 |
11,12 |
Patatin |
|
|
未 知 |
17,18 |
Patatin |
|
|
未 知 |
[0385]
95,96 |
Patatin |
|
|
未 知 |
43,44 |
Patatin |
|
|
未 知 |
27,28 |
Patatin |
|
|
未 知 |
131, 132 |
Patatin |
|
|
未 知 |
127, 128 |
Patatin |
|
|
未 知 |
133, 134 |
Patatin |
|
|
未 知 |
137, 138 |
Patatin |
|
|
未 知 |
165, 166 |
Patatin |
|
|
未 知 |
167, 168 |
磷脂酸磷 酸酶 |
AA1-30 |
MARSWKWRPLLSSFLLVSLAPFSTSVPCF K
|
未 知 |
169, 170 |
磷脂酸磷 酸酶 |
|
|
未 知 |
171, 172 |
磷脂酸磷 酸酶 |
|
|
未 知 |
173, 174 |
磷脂酸磷 酸酶 |
|
|
未 知 |
111, 112 |
磷脂酰肌 醇PLC |
AA1-16 |
MGAGAILLTGAPTASA |
细 菌 |
107, 108 |
磷脂酰肌 醇PLC |
AA1-23 |
MSNKKFILKLFICSTILSTFVFA
|
未 知 |
109, 110 |
磷脂酰肌 醇PLC |
AA1-23 |
MSNKKFILKLFICSTILSTFVFA
|
未 知 |
113, 114 |
磷脂酰肌 醇PLC |
AA1-23 |
MSNKKFILKLFICSTILSTFVFA
|
未 知 |
117, 118 |
磷脂酰肌 醇PLC |
AA1-23 |
MNNKKFILKLFICSMVLSAFVFA
|
未 知 |
119, 120 |
磷脂酰肌 醇PLC |
AA1-23 |
MNNKKFILKLFICSMVLSAFVFA
|
未 知 |
[0386]
|
醇PLC |
|
|
知 |
115, 116 |
磷脂酰肌 醇PLC |
AA1-23 |
MNNKKFILKLFICSMVLSAFVFA
|
未 知 |
121, 122 |
磷脂酰肌 醇PLC |
AA1-23 |
MRNKKFILKLLICSTVLSTFVFA
|
未 知 |
141, 142 |
磷脂酶 |
|
|
未 知 |
155, 156 |
磷脂酶 |
AA1-36 |
MRTTTTNWRQIVKSLKLFLMGLCLFISASF ASSAYA
|
未 知 |
159, 160 |
磷脂酶 |
|
|
未 知 |
145, 146 |
PLA |
|
|
未 知 |
147, 148 |
PLA |
|
|
未 知 |
149, 150 |
PLA |
|
|
未 知 |
151, 152 |
PLA |
|
|
未 知 |
153, 154 |
PLA |
|
|
未 知 |
157, 158 |
PLA |
|
|
未 知 |
163, 164 |
PLA |
|
|
未 知 |
101, 102 |
PLC |
AA1-39 |
LSLVASLRRAPGAALALALAAATLAVTAQ GATAAPAAAAA |
细 菌 |
1,2 |
PLC |
AA1-24 |
MKKKVLALAAMVALAAPVQSVVFAQ
|
未 知 |
3,4 |
PLC |
AA1-24 |
MKRKILAIASVIALTAPIQSVAFAH
|
未 知 |
5,6 |
PLC |
AA1-24 |
MKRKILAIASVIALTAPIQSVAFAH
|
未 知 |
97,98 |
PLC |
AA1-25 |
MKRKLCTWALVTAIASSTAVIPTAAE
|
未 知 |
[0387]
7,8 |
PLC |
AA1-29 |
MITLIKKCLLVLTMTLLLGVFVPLQPSHAT
|
未 知 |
31,32 |
PLC |
AA1-20 |
MKKKLCTWALVTAISSGWAI
|
未 知 |
81,82 |
PLC |
AA1-25 |
MKKKLCTMALVTAISSGVVTIPTEAQ
|
未 知 |
93,94 |
PLC |
AA1-29 |
MITLIKKCLLVLTMTLLSGVFVPLQPSYAT
|
未 知 |
89,90 |
PLC |
AA1-25 |
MKKKLCTLAFVTAISSIAITIPTEAQ
|
未 知 |
123, 124 |
PLC |
AA1-24 |
MKKKVLALAAMVALAAPVQSVVFA
|
未 知 |
129, 130 |
PLC |
AA1-27 |
MKKKICTLALVSAITSGVVTIPTVASA
|
未 知 |
139, 140 |
PLC |
AA1-20 |
MKIKPLTFSFGLAVTSSVQA
|
未 知 |
105, 106 |
PLC |
AA1-30 |
MNRCRNSLNLQLRAVTVAALVVVASSAA LAW
|
未 知 |
9,10 |
PLC |
AA1-20 |
MKLLRVFVCVFALLSAHSKAD
|
未 知 |
47,48 |
PLD |
|
|
未 知 |
15,16 |
PLD |
|
|
未 知 |
41,42 |
PLD |
|
|
未 知 |
23,24 |
PLD |
|
|
未 知 |
51,52 |
PLD |
|
|
未 知 |
53,54 |
PLD |
|
|
未 知 |
19,20 |
PLD |
AA1-19 |
MKKTTLVLALLMPFGAASAQ
|
未 知 |
75,76 |
PLD |
|
|
未 |
[0388]
|
|
|
|
知 |
57,58 |
PLD |
|
|
未知 |
63,64 |
PLD |
AA1-18 |
MKNTLILAGCILAAPAVAD |
未知 |
79,80 |
PLD |
AA1-23 |
MRNFSKGLTSILLSIATSTSAMAF |
未知 |
37,38 |
PLD |
AA1-23 |
MRNFSKGLTSILLSIATSTSAMAF |
未知 |
61,62 |
PLD |
AA1-21 |
MTLKLSLLIASLSAVSPAVLAN |
未知 |
67,68 |
PLD |
|
无 |
未知 |
83,84 |
PLD |
AA1-21 |
MKKIVIYSFVAGVMTSGGVFAA |
未知 |
49,50 |
PLD |
AA1-23 |
MNFWSFLLSITLPMGVGVAHAQPD |
未知 |
39,40 |
PLD |
|
|
未知 |
73,74 |
PLD |
|
|
未知 |
29,30 |
PLD |
|
|
未知 |
21,22 |
PLD |
AA1-28 |
MQQHKLRNFNKGLTGVVLSVLTSTSAMA F
|
未知 |
71,72 |
PLD |
|
|
未知 |
161,162 |
PLD |
AA1-24 |
MNRKLLSLCLGATSCIALSLPVHA |
未知 |
在一个方面,本发明提供了具有SEQ ID NO:107、SEQ ID NO:109、SEQ IDNO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ IDNO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、 SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ IDNO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171和/或SEQ ID NO:173中阐明的序列的多肽,和其子序列,例如它们的具有磷脂酶活性,例如磷脂酶C(PLC)活性的活性位点(“催化结构域”)。在一个方面,多肽具有磷脂酶活性,但是缺少中性油(甘油三酯)水解活性。例如,在一个方面,多肽具有磷脂酶活性,但是缺少影响中性油(甘油三酯)组分的任何活性。在一个方面,本发明提供了脱胶工艺,该工艺包括使用具有磷脂酶活性但是缺少脂酶活性的本发明多肽。
本发明的多肽和肽可以从天然来源分离,可以合成,或者是重组产生的多肽。肽和蛋白质可以体外或体内重组表达。本发明的肽和多肽可以使用本领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本领域熟知的化学方法,全部地或部分地合成,见,例如Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223;Horn(1980)Nucleic Acids Res.Symp.Ser.225-232;Banga,A.K.,Therapeutic Peptides and Proteins,Formulation,Processing and Delivery Systems(1995)Technomic Publishing Co.,Lancaster,PA。例如,肽合成可以使用各种固相技术进行(见,例如,Roberge(1995)Science 269:202,Metrifield(1997)MethodsEnzymol.289:3-13),并且可以例如使用ABI 431A肽合成仪(Perkin Elmer),根据生产商提供的指导自动合成。
本发明的肽和多肽也可以糖基化。糖基化可以通过化学方法或者利用细胞生物合成机制在翻译后加上,其中后一种方式包括使用已知的糖基化基序,该糖基化基序可以是序列本来所拥有的,或者可以作为肽加上,或者加在编码序列的核酸中。糖基化可以是O-连接的或N-连接的。
本发明的肽和多肽,如以上描述的,包括所有的“模拟的”和“肽模拟的”形式。术语“模拟的”和“肽模拟的”指的是基本上具有与发明的多肽相同结构和/或功能特征的合成化学化合物。模拟物可以是完全由合成的、非天然的氨基酸类似物组成,或者是部分天然肽氨基酸和部分氨基酸的非天然类似物组成的嵌合分子。模拟物也可以含有任何量的天然氨基酸保守取代,只要这样的取代基本上不改变模拟物的结构和/或活性。如同作为保守变异体的本发明多肽的情况,常规实验可以确定模拟物是否在发明的范围内,即,其结构和/或功能是否基本上没有被改变。因此,一方面,假如模拟物具有磷脂酶活性,那么该模拟物在本发明的范围内。
本发明的多肽模拟物组合物可以含有非天然结构组分的任何组合。在可选择的方面,本发明的模拟物组合物包括以下三种结构基团的一种或所有:a)不是天然酰胺键(“肽键”)连接的残基连接基团,b)取代天然发生的氨基酸残基的非天然残基,或者c)诱导二级结构模拟,即诱导或稳定二级结构例如β-转角、γ-转角、β-折叠、α-螺旋构象和类似结构的残基。例如,当所有残基或一些残基通过化学方式,而不是天然肽键的方式连接时,本发明的多肽可以表征为模拟物。各个肽模拟物残基可以通过肽键、别的化学键或者偶联方式,例如,戊二醛,N-羟基 琥珀酰亚胺酯、双功能马来酰亚胺、N,N′-二环己基碳二亚胺(DCC)或者N,N′-二异丙基碳二亚胺(DIC)连接。可以作为常规的酰胺键(“肽键”)连接的替代连接基团包括,例如,南五味子酮(例如,-C(=O)-CH2-,针对-C(=O)NH)、氨基亚甲基(CH2-NH)、乙烯、烯烃(CH=CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4-)、噻唑、反向酰胺(retroamide)、硫代酰胺或酯(见,例如,Spatola(1983),Chemistry and Biochemistry of Amino Acids,Peptides and Proteins,VOl.7,pp267-357,“Peptide Backbone Modifications,”Marcell Dekker,NY)。
本发明的多肽也可以由于含有所有或一些取代天然发生的氨基酸残基的非天然残基,而表征为模拟物。非天然残基在科学文献和专利文献中得到充分地描述;一些用作天然氨基酸残基的模拟物的示例性的非天然组分和指导描述于下。芳香族氨基酸的模拟物可以通过被下述氨基酸取代产生,例如,D-或L-萘丙氨酸(naphylalanine);D-或L-苯基甘氨酸,D-或L-2噻吩丙氨酸(thieneylalanine);D-或L-1、-2、3-或4-芘基丙氨酸;D-或L-3噻吩丙氨酸(thieneylalanine);D-或L-(2-吡啶基)-丙氨酸;D-或L-(3-吡啶基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸;D-或L-(4-异丙基)-苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或L-p-二苯基苯基丙氨酸;K-或L-p-甲氧基二苯基苯基丙氨酸;D-或L-2-吲哚-(烷基)丙氨酸;和D-或L-alkylainines,或非酸性氨基酸,其中烷基可以是取代的或不取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、sec-isotyl、异戊基或非酸性氨基酸。非天然氨基酸的芳香环包括,例如,噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯和吡啶基芳香环。
酸性氨基酸的模拟物可以通过用以下的取代来产生,如,保持有负电荷的非羧酸氨基酸;(膦酰基)丙氨酸;硫酸化的苏氨酸。羧基侧链(如,天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰,所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮鎓-4,4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如,(除了赖氨酸和精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸的取代产生,其中烷基如以上定义。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂在优选为碱性的条件下反应而产生,所述的常规试剂包括如苯乙二醛、2,3-丁二酮、1,2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-acetylimidizol和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺 反应而产生;得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-imidozoyl)丙酸;氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸盐;2-氯汞-4硝基苯酚,或者,氯-7-硝基苯并-氧杂-1,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如methyl picolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应,和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括,例如,2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或者对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括,例如,由脯氨酸和赖氨酸的羟基化作用产生的模拟物;由丝氨酰或者苏氨酰的羟基的磷酸化作用产生的模拟物;由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物;由N-末端胺的乙酰化作用而产生的模拟物;由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物;或者,由C-末端羧基的酰胺化而产生的模拟物。
本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。因此,任何天然发生的L-构型(也可以被称为R或者S,取决于化学实体的结构)的氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代,相反手性的氨基酸称为D-氨基酸,但也可以称R-或者S-型。
本发明也提供了通过天然过程,如,翻译后加工(如,磷酸化,酰化以及类似作用)或者化学修饰技术修饰本发明的多肽的方法,以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解,相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解过程、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用,和转移RNA介导氨基酸添加到蛋白质中,如精氨酰化。参见,如,Creighton,T.E.,Proteins-Structure and Molecular Properties 2nd Ed.,W.H.Freeman和Company,New York(1993);Posttranslational Covalent Modification ofProteins,B.C.Johnson,Ed.,Academic Press,New York,11-12页(1983)。
固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,Solid PhasePeptide Synthesis,第二版,Pierce Chemical Co.,Rockford,III,11-12页),并且这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearch Biochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法,它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行,而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时,一个板的杆或者钉被倒转并插入到另一个板的相应孔或者贮存器中,所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤,即是,反转和插入所述杆和钉的顶端至适当的溶液中,将氨基酸构建成所要的肽。此外,大量的FMOC肽合成系统是可利用的。例如,应用Applied Biosystems,Inc.的Model 431ATM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得,或者通过直接的合成或者通过用其它已知的技术将一系列片段偶联起来的合成。
磷脂酶
本发明提供新的磷脂酶,编码磷脂酶的核酸,结合磷脂酶的抗体,代表酶的抗原位点(表位)和活性位点的肽,调控和结合结构域,和产生和使用它们的方法。一方面,本发明的多肽具有磷脂酶活性,或者如以上描述的的磷脂酶活性(例如,切割磷酸甘油酯键,缺少脂酶活性,等等)的任何组合。在可选择的方面,本发明的磷脂酶具有由在此描述的示范性磷脂酶的活性修饰而得的活性。
本发明包括具有或不具有信号序列的磷脂酶和信号序列本身。本发明包括本发明的酶的片段或子序列,例如包含催化结构域(活性位点)、结合位点、调控结构域、表位、信号序列、前原结构域(prepro domains)和类似物的肽或多肽,或由它们组成的肽或多肽。本发明也包括固定化的磷脂酶、抗磷脂酶抗体和它们的片段。本发明包括杂合物(heterocomplexes),例如,包括本发明的磷脂酶的融合蛋质、异二聚体等。代表酶的抗原位点(表位)、活性位点、结合位点、信号序列和类似物的肽可以用常规的筛选方案测定。
本发明的这些酶和过程可以用于取得对高磷含量的油,特别是大米、大豆、玉米、油菜和向日葵油更彻底的脱胶。例如,在一个方面,一旦用PI-PLC切割,磷脂酰肌醇被转化为二酰基甘油和磷酸肌醇(phosphoinositol)。在离心期间,二酰基甘油与水相分开(从而提高油产量),磷酸肌醇与水相分开,其中它作为重相的组分被去除。本发明的酶,例如本发明的PI-PLC可以被掺入到化学或物理油精炼过程中。
在可选的实施方案中,本发明的酶具有磷脂酰肌醇特异性磷脂酶C(PI-PLC)活性、磷脂酰胆碱特异性磷脂酶C活性、磷脂酸磷酸酶活性、磷脂酶A活性和/或patatin-相关磷脂酶活性。这些酶可以单独使用,或者相互之间或与本发明的其他酶或其他酶组合使用。在一个方面,本发明提供了这样的方法,其中这些酶(包括本发明的磷脂酰肌醇特异性磷脂酶C(PIPLC)、磷脂酰胆碱特异性磷脂酶C和/或磷脂酶D(与磷酸酶结合)、磷脂酸磷酸酶、磷脂酶A、patatin-相关磷脂酶)被单独或组合使用,用于使油脱胶,所述油诸如诸如植物油,例如高磷油,诸如,大豆油、玉米油、油菜油、米糠油和向日葵油。本发明的这些酶和过程可以用于取得对高磷含量的油,特别是大豆、玉米、油菜、米糠和向日葵油更彻底的脱胶。一旦用PI-PLC切割,磷脂酰肌醇被转化为二酰基甘油和磷酸肌醇。在离心期间,二酰基甘油与水相分开(提高油产量),磷酸肌醇与水相分开,其中它作为重相的组分被去除。本发明的酶,例如本发明的PI-PLC可以被掺入到化学或物理油精炼过程中。
在一个方面,本发明提供了组合物,例如溶液,其包括在中性pH的柠檬酸钠,以水合不可水合物。例如,本发明提供了pH范围在约4至9或约5至8或约6至7的柠檬酸钠溶液,其可以用来水合在高磷油中的不可水合的磷脂(包括本发明的酶)。在一个方面,非水合磷脂的水合是通过螯合与磷脂相关的钙和镁进行的,从而使得之前不可溶的磷脂盐更容易地在水相中分开。在一个方面,一旦磷脂向水/油介面移动或进入水相,本发明的磷脂酶(例如本发明的磷脂酶特异性磷酸水解酶)或其他磷脂酶,将会把该磷脂转化为二酰基甘油和磷酸酯。在一个方面,一旦加入酸和碱,钙和镁金属的含量将降低(参见有关碱过程的论述)
本发明的酶是高度选择性的催化剂。与别的酶一样,它们催化常规的合成化学术所不能比拟的具有精巧的立体选择性、区域选择性和化学选择性的反应。而且,本发明的酶是非常多用的。它们可以经改变而在有机溶剂中具有功能,可在极端pH(例如,高pH和低pH)、极端温度(例如,高温和低温)、极端盐度水平(例如,高盐度和低盐度)下操作,并且催化结构上与它们的天然的、生理学上的底物无关的化合物的反应。本发明的酶可以设计为与大范围的天然和非天然底物具有反应活性,因此,使得能事实上修饰任何有机先导化合物。本发明的酶也可以设计为具有高度的对映选择性和区域选择性。这些酶所展示出的高度的官能基团选择性使得人们能明了产生新的活性化合物的合成顺序中的每一个反应。本发明的酶也可以设计为催化许多与它们的天然生理功能无关的不同的反应。
本发明开发了酶的独特催化特性。然而,在化学转化中,生物催化剂(即,纯化的酶或粗酶,非活细胞或活细胞)的使用一般要求确定与特异的起始化合物反应的特定生物催化剂。本发明使用经选择的生物催化剂,即,本发明的酶,和对在许多起始化合物中都存在的功能基团具有特异性的反应条件。每种生物催化剂对一种功能基团,或几种相关功能基团特异,可以与含有这种功能基团的多种 起始化合物反应。生物催化反应由单个的起始化合物产生一个衍生物群体。这些衍生物可以经过另一轮生物催化途径,产生第二个群体衍生化合物。生物催化衍生化作用的每次重复都可以产生数千种最初化合物的变异体。
酶在起始化合物的特异位点反应,不影响该分子的其余部分,这个过程使用常规的化学方法是难以达到的。此高度的生物催化特异性提供了确定文库中单个活性酶的方法。文库是用一系列用于产生该文库的生物催化反应表征,是一个所谓的“生物合成史”。筛选文库的生物学活性以及追踪生物合成史,可确定产生该活性化合物的特异反应顺序。重复反应顺序,测定合成的化合物的结构。这种鉴定方式,与别的合成和筛选方法不同,不要求固定化技术,化合物可以在溶液中合成,并且实际上使用任何类型的筛选分析方法进行任意进行检测。需要注意的是,酶反应对功能基团的高度特异性使得可以“追踪”形成生物催化产生的文库的特异性酶反应。
本发明也提供使用本发明的核酸、多肽和抗体,来发现新的磷脂酶的方法。一方面,筛选λ-噬菌体文库以基于表达发现磷脂酶。在筛选中使用λ-噬菌体文库可以允许如下事项:检测毒性克隆;改进与底物的接触;降低对工程改造宿主的要求,绕开任何由文库的大量排除所致的潜在偏差;和,在低克隆密度下的快速生长。λ-噬菌体文库的筛选可以在液相或在固相中进行。在液相中筛选赋予分析条件的更大灵活性;额外的底物灵活性;对弱克隆更为灵敏;比固相筛选易于自动化。
许多程序步骤使用机器自动化进行,每天可以完成几千种生物催化反应和筛选分析,同时确保高度准确和再现性(见以下的阵列讨论)。结果,衍生化合物的文库可以在大概数周内获得。对分子,包括小分子修饰的进一步教导,见PCT/US94/09174。
磷脂酶信号序列和催化结构域
本发明提供磷脂酶的信号序列(例如,信号肽(SPs)),例如含有信号序列的肽和/或嵌合多肽,其中所述肽或嵌合多肽具有表1中示出的信号序列,或如下面示出的信号序列。本发明提供了编码这些信号序列(SPs,例如具有含有本发明多肽的氨基末端残基的序列的肽,或具有由本发明多肽的氨基末端残基组成的序列的肽)的核酸。一方面,本发明提供了信号序列,其包括这样的肽,该肽包含本发明多肽的残基1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到29、1到30、1到31、1到32或1到33中所阐述的序列,或该肽由所述序列组成,所述本发明的多肽例如SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、 SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ IDNO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172或SEQ ID NO:174。这些肽中的任何肽可以是嵌合蛋白例如重组蛋白的一部分。信号序列肽可以与本发明的其他酶(例如本发明的磷脂酶,从中本得不到该信号序列),或与其他磷脂酶,或与任何多肽相配,如下进一步论述。
示例性的信号序列列于表1和SEQ ID列表中,如,SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6的残基1到24;SEQ ID NO:8的残基1到29;SEQ ID NO:10的残基1到20;SEQ ID NO:20的残基1到19;SEQ ID NO:22的残基1到28;SEQ ID NO:32的残基1到20;SEQ ID NO:38的残基1到23;对于本发明的其它示例性信号序列,参见表1和SEQ ID列表。
在一些方面,本发明的磷脂酶无信号序列。在一个方面,本发明提供了缺少所有或部分信号序列的磷脂酶。在一个方面,本发明提供了编码来自一种磷脂酶的信号序列的核酸序列,该核酸序列可操作性地连接到不同的磷脂酶的核酸序列上,或者,任选地,来自非磷脂酶蛋白的信号序列也可以是期望的。
磷脂酶前原结构域(prepro domains)、结合结构域和催化结构域
如上所述,除了信号序列(例如信号肽(SPs)),本发明提供了前原结构域、结合结构域(例如底物结合结构域)和催化结构域(CDs)。本发明的SP结构域、结合结构域、前原结构域和/或CDs可以是分离的或重组的肽,或可以是融合蛋白的一部分,例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CDs)(例如″活性位点″)、前原结构域、结合结构域和信号序列(SPs,例如具有含有本发明多肽的氨基末端残基的序列的肽,或具有由本发明多肽的氨基末端残基组成的序列的肽)的核酸。
本发明的磷脂酶的信号序列(SPs)、结合结构域、催化结构域(CDs)和/或前原序列(prepro sequences)可以是分离的肽,或者连接于其他磷脂酶或者非磷脂酶多肽的序列,如,作为融合(嵌合)蛋白。在一方面,包含本发明磷脂酶信号序列SPs和/或前原序列的多肽含有与本发明磷脂酶异源的序列(例如,包含本发明的SP和/或前原序列以及其他磷脂酶或非磷脂酶蛋白的序列的融合蛋白)。在一个方面,本发明提供了具有异源CDs、SPs和/或前原序列,例如具有酵母信号序列的序列的本发明磷脂酶。本发明的磷脂酶可以包括异源的CDs、SPs和/或前原序列,它们在载体中,例如在pPIC系列载体(lnvitrogen,Carlsbad,CA)中。
一方面,本发明的SPs、CDs和/或前原序列在鉴定了新型的磷脂酶多肽之后来确定。分选蛋白质并且转运蛋白质至它们的细胞内合适位置的途径,一般被称为蛋白质定向转运途径(protein targeting pathways)。在所有这些定向转运系统中的最重要成员之一是在新合成多肽的氨基端的短氨基酸序列,叫做信号序列。信号序列引导蛋白质至细胞的合适位置定位,并且在转运过程中或者当蛋白到达其最终的目的地之后去除。大多数溶酶体蛋白,膜蛋白,或者分泌蛋白具有氨基末端信号序列,该序列标记这些蛋白用于转移到内质网的腔中。信号序列的长度可以在从13到45或更多个氨基酸残基内进行变化。本领域技术人员知道识别信号序列的各种方法。例如,一方面,通过称为SignalP的方法来鉴定新型的水解酶信号肽。SignalP应用识别信号肽和它们的切割位点的组合的神经网络。(Nielsen,et al.,“Identification of prokaryotic and eukaryotic signal peptides and prediction oftheir cleavage sites.”Protein Engineering,vol.10,no.1,p.1~6(1997)。
在一个方面,本发明的磷脂酶不必具有SPs和/或前原序列,和/或催化结构域(CDs)。在一个方面,本发明提供缺少所有或部分SP、CD和/或前原结构域的磷脂酶。在一个方面,本发明提供了编码来自一种磷脂酶的信号序列(SP)、CD和/或前原序列的核酸序列,其可操作性地连接到不同的磷脂酶的核酸序列上,或任选地,来自非磷脂酶蛋白的信号序列(SP)、CD和/或前原结构域也是可期待的。
本发明也提供了分离的或者重组的多肽,含有本发明的信号序列(SPs)、前区域和/或催化结构域(CDs),以及异源序列。异源序列是与SP、前区域和/或CD非天然相关(如,对于磷脂酶)的序列。与SP、前区域和/或CD非天然相关的序列可以在SP、前区域和/或CD的氨基末端,羧基末端,和/或在SP和/或CD的末端。一方面,本发明提供了分离的或者重组的多肽,包括(或者由…组成)这样的多肽,该多肽包括本发明的信号序列(SPs)、前区域和/或催化结构域(CDs),条件是其并不与和与其有天然联系的任何序列有联系(如磷脂酶序列)。相似地,一方面,本发明提供了编码这些多肽的分离的或者重组的核酸。所以,在一个方面,本发明的分离或者重组核酸包含有本发明的信号序列(SP)、前区域和/或催化结构域(CD)以及异源序列(即是,与本发明的信号序列(SP)、前区域和/ 或催化结构域(CD)的编码序列并不天然关联的序列)的编码序列。异源序列可以在3’末端、5’末端,和/或在SP、前区域和/或CD编码序列的末端。
本发明的多肽包括活性形式的或无活性形式的磷脂酶。例如,本发明的多肽包括成熟作用或对前序列加工之前的前蛋白,对前序列加工例如通过前蛋白-加工酶,例如前蛋白转化酶对前蛋白加工产生“有活性的”成熟蛋白。本发明的多肽包括因其他原因而失活的磷脂酶,这些原因例如翻译后加工事件而“激活”之前无活性,例如内-或外肽酶或蛋白酶作用、磷酸化作用事件、酰胺化作用、糖基化作用、去糖基化、硫酸化作用、二聚体化事件和/或类似作用。鉴定“前”区域序列、CDs、结合结构域和信号序列的方法是常规的,并且是本领域熟知的,参见例如Van deVen(1993)Crit.Rev.Oncog.4(2):115-136;用于鉴定蛋白质-蛋白质相互作用的酵母双杂交筛选,由Miller(2004)Methods MoI.Biol.261:247-62;Heyninck(2004)Methods MoI.Biol.282:223-41,USPN 6,617,122;6,190,874描述。例如,为了鉴定前区域,从胞外空间纯化蛋白质,测定N-端蛋白质序列,并与未加工的形式作比较。
本发明的多肽可以作为蛋白质制剂配制成任何液体、固体、半固体或凝胶形式。例如,本发明的蛋白质制品可以包括这样的制剂,其含有非水液体组合物、铸造固体、粉末、冻干的粉末、粒状形式、颗粒形式、压缩的片剂、小球、丸、凝胶形式、水凝胶、膏、气溶胶、雾剂、洗液或浆状制剂。
本发明的多肽包括所有的活性形式,包括本发明酶的活性子序列,例如催化结构域(CDs)或活性位点。在一个方面,本发明提供下面阐述的催化结构域或活性位点。在一个方面,本发明提供了肽或多肽或等同物,其包括通过使用数据库诸如Pfam(其收集了大量的多序列比对和覆盖了许多常见的蛋白质家族的隐藏的Markov模型,The Pfam protein families database,A.Bateman,E.Birney,L.Cerruti,R.Durbin,L.Etwiller,S.R.Eddy,S.Griffiths-Jones,K.L.Howe,M.Marshall,and E.L.L.Sonnhammer,Nucleic Acids Research,30(1):276-280,2002)而预测到的活性结构域,或由这些预测到的活性结构域组成。
本发明提供了本发明酶的N-端或C-端子序列(例如信号序列、前序列)与其他多肽、活性蛋白质或蛋白质片段的融合物。本发明的酶(例如磷脂酶C酶)可以通过将酶作为无活性的融合蛋白表达而产生,该无活性的融合蛋白随后通过蛋白质水解切割事件激活(使用内源性或外源性蛋白酶活性,例如胰蛋白酶),切割导致融合蛋白伴侣和成熟的酶,例如磷脂酶C酶分离。在一个方面,本发明的融合蛋白由杂合核苷酸构建物表达,该构建物编码单个开放阅读框,含有下述元件:融合蛋白的核苷酸序列、接头序列(定义为编码连接两个柔性较小的蛋白区域的柔性氨基酸序列的核苷酸序列)、蛋白酶切割识别位点、和成熟酶(例如本发明的任何酶,例如磷脂酶)序列。在可选的方面,融合蛋白可以包含果胶裂解酶序列、木聚糖酶序列、磷脂酸磷酸酶序列或另一序列,例如之前显示在感兴趣的宿主细胞中过量表达的序列。
可以使用任何宿主系统(参见上面论述),例如任何细菌,例如革兰氏阳性细菌,诸如杆菌属,或革兰氏阴性细菌,诸如大肠杆菌,或任何酵母,例如巴斯德毕赤酵母。嵌合核苷酸构建物中的核苷酸序列的排列可以基于用每一融合构建物获得的蛋白质表达水平来测定。在一个方面,从核苷酸构建物的5′端至构建物的3′端,核苷酸序列如下装配而成:信号序列/融合蛋白/接头序列/蛋白酶切割识别位点/成熟酶(例如本发明的任何酶,例如磷脂酶)或信号序列/前序列/成熟酶/接头序列/融合蛋白。酶(例如本发明的任何酶,例如磷脂酶)作为无活性融合蛋白表达,可以提高酶序列的总表达水平,可以减少与活性酶过表达相关的任何潜在的毒性,和/或可以增加使用之前的货架期,这是因为在融合蛋白,例如果胶裂解酶与酶,例如磷脂酶蛋白分离之前是无活性的。
在各个方面,本发明提供了激活作为融合蛋白表达的本发明的磷脂酶的具体的制剂。在一个方面,使用蛋白质水解活性或潜的蛋白质水解活性结合氨基-末端或羧基末端肽酶,来激活最初作为无活性的融合蛋白表达磷脂酶活性。该激活事件可以用各种方法实现,并且是在应用于油脱胶之前的制备/储存过程的各种时间点时进行。本发明的示例性工艺包括:在将融合构建物分泌到发酵介质中后由生产性宿主表达的内源活性进行的切割;在宿主细胞破裂之后,由激活的内源性蛋白酶活性进行的切割,或与胞内表达的融合构建物接触;使粗或纯化的融合构建物通过具有固定化的蛋白酶活性的柱,以在制备酶制剂之前完成切割和酶(例如本发明的磷脂酶,例如磷脂酶C)激活作用。用可溶性的蛋白质水解活性源处理粗的或纯化的融合构建物;在油精炼中,使用可溶性的或不溶性的蛋白质水解活性源,激活磷脂酶(例如本发明的磷脂酶,例如磷脂酶C),之后立即用于各工艺中;和/或在减低的温度(例如在约4℃至20℃之间的任何温度),通过使融合构建物制剂持续循环通过具有固定化的蛋白酶活性的柱,来激活(例如本发明的磷脂酶,例如磷脂酶C)磷脂酶活性。该激活事件可以在传递到使用位置之前完成,或它可以在油精炼中原位发生。
糖基化
本发明的肽和多肽(例如水解酶,抗体)也可以进行糖基化,例如在一个方面,含有至少一个糖基化位点,例如N-连接或O-连接的糖基化。在一个方面,多肽可以在巴斯德毕赤酵母或粟酒裂殖酵母中表达后进行糖基化。糖基化可以在翻译后以化学的方式或通过胞内生物合成机制加入,其中后者整合使用已知的糖基化基序,其对于序列来说可以天然的,或可以作为肽加入,或加入到核酸编码序列中。
在一个方面,本发明提供了含有N-连接的糖基化的SEQ ID NO:2的多肽,如下表中所述。
全长SEQ ID NO:2(在一个方面其由SEQ ID NO:1编码)开放阅读框编码七(7)个潜在的天冬酰胺-连接的(N-连接)糖基化位点。野生型SEQ ID NO:2开放阅读框在能够进行糖基化的宿主(例如,巴斯德毕赤酵母、酿酒酵母、粟酒裂殖酵母或哺乳动物细胞)中的表达,导致产生糖基化的SEQ ID NO:2磷脂酶,其由于存在N-连接的糖基化作用基本上没有活性。用PNGase F或内切糖苷酶H对野生型糖基化的SEQ ID NO:2进行酶促去糖基化作用,导致激活SEQ ID NO:2活性。此外,通过诱变对一个或多个N-连接的糖基化位点进行修饰(以便该位点不再被识别为N-连接的糖基化位点,并且糖基化不再发生在那个位点),导致产生具有不同程度的活性增加的SEQ ID NO:2。
相比在相同的宿主细胞中表达的野生型开放阅读框,对SEQ ID NO:2糖基化位点4、5和/或6中编码天冬酰胺的核苷酸密码子进行诱变(例如将天冬酰胺转化为天冬氨酸),导致产生具有增加的PLC活性的酶(在巴斯德毕赤酵母中表达的三联突变体具有与在非糖基化宿主如大肠杆菌中表达的野生型序列基本上相同的比活性和功能活性)。在N-连接的糖基化共有序列(NXS/T)中通过诱变丝氨酸或苏氨酸残基来废除N-连接的糖基化位点也是可能的,例如通过在这些位置改变这些核苷酸密码子产生缬氨酸或异亮氨酸,以代替丝氨酸或苏氨酸。使用该策略来除去N-连接的糖基化位点也导致在具有糖基化作用的宿主表达系统中产生活性SEQ ID NO:2磷脂酶。
磷脂酶活性的分析
本发明提供了具有磷脂酶活性或磷脂酶活性的任何组合的分离的、合成的或者重组的多肽(例如酶、抗体),以及编码它们的核酸。本领域已知的很多磷脂酶分析方法中的任何方法都可以来用于确定是否多肽具有磷脂酶活性,并且是否是属于本发明的范围。用于确定磷脂酶A、B、D和C,patatin和脂酰水解酶活性或脂酶活性的常规方案是本领域已知的。
示例性的活性分析包括混浊度分析、羟甲香豆素磷酸胆碱(荧光)分析、Amplex red(荧光)磷脂酶分析、薄层色谱分析(TLC)、细胞裂解分析和p-硝基 苯基磷脂酰胆碱分析。应用这些分析方法,可以很快地筛查出具有磷脂酶活性的多肽、肽或抗体。
磷脂酶活性可以包括脂酰水解酶(LAH)活性,参见如,Jimenez(2001)Lipids 36:1169-1174,该文献描述了用于确定patatin的脂酰水解酶活性的以十八烷基乙烯乙二醇单十二烷基醚为基础的混合微胶粒分析。Pinsirodom(2000)J.Agric.Food Chem.48:155-160,该文献描述了示例性的脂酰水解酶(LAH)patatin活性。
在以下文献中说明了用于确定磷脂酶活性的混浊度分析,如,在Kauffmann(2001)“Conversion of Bacillus thermocatenulatus lipase into an efficientphospholipase with increased activity towards long-chain fatty acyl substrates bydirected evolution and rational design”Protein Engineering 14:919-928;Ibrahim(1995)“Evidence implicating phospholipase as a virulence factor of Candida albicans,”Infect.Immun.63:1993-1998。
用于确定磷脂酶活性的羟甲香豆素(荧光)磷酸胆碱分析方法描述在下述文献中,例如Goode(1997)”Evidence for cell surface and internal phospholipaseactivity in ascidian eggs,”Develop.Growth Differ.39:655-660;Diaz(1999)”Directfluorescence-based lipase activity assay,”BioTechniques 27:696-700。
用于确定磷脂酶活性的Amplex Red(荧光)磷脂酶分析可以作为试剂盒获得,如,应用来自Molecular Probes Inc.(Eugene,OR)的Amplex Red磷脂酰胆碱特异性磷脂酶分析试剂盒,按照制造商的说明,检测磷脂酰胆碱特异性磷脂酶。在荧光微板读数器中,使用560±10nm的激发光和590±10nm的荧光检测,测量荧光。该分析在极低酶浓度时也灵敏。
确定磷脂酶活性的薄层色谱分析(TLC)描述在Reynolds(1991)Methodsin Enzymol.197:3-13;Taguchi(1975)“Phospholipase from Clostridium novyi typeA.I,”Biochim.Biophys.Acta 409:75-85中。薄层色谱分析(TLC)是用于检测磷脂酶活性的广泛应用的技术。已经应用了该方法的不同的经改良的方法从液相分析混合物提取磷脂酶。在一些PLC的分析中,通过浆氯仿/甲醇(2∶1)加入到反应混合物中来终止水解。未反应的起始物以及二酰基甘油通过抽提进入有机相,并且可以通过TLC分离,首基(head group)产物仍存在水相中。为了获得对磷脂消化更精确的测定,可以使用放射性标记的底物(参见,如,Reynolds(1991)Methodsin Enzymol.197:3-13)。产物和反应物的比率可以用于计算单位时间内的底物水解的实际摩尔数。如果所有的成分相同提取,提取中的任何损失将相同地影响所有的成分。磷脂消化产物的分离可以通过硅胶TCL来完成,用氯仿/甲醇/水(65∶25∶4)作为溶剂系统(参见,如,Taguchi(1975)Biochim.Biophys.Acta 409:75-85)。[391]确定磷脂酶活性的p-硝基苯磷脂酰胆碱分析描述于例如Korbsrisate(1999)J.Clin.Microbiol.37:3742-3745;Berka(1981)Infect.Immun.34:1071-1074。该 分析方法基于酶法水解底物类似物p-硝基苯磷脂酰胆碱,释放黄色的生色化合物p-硝基苯,可以在405nm检测到。该底物方便用于进行高通量筛选。
基于红细胞裂解,细胞裂解分析可以检测具有细胞裂解活性的磷脂酶。毒性磷脂酶可以与真核细胞膜作用,并水解磷脂酰胆碱和鞘磷脂,引起细胞裂解,参见,如,Titall(1993)Microbiol.Rev.57:347-366。
杂合(嵌合)磷脂酶和肽文库
一方面,本发明提供了杂合磷脂酶和融合蛋白,包括肽文库,其含有本发明的序列。本发明的肽文库可以用于分离靶标如磷脂酶底物、受体、酶的肽调节物(如激活剂或者抑制剂)。本发明的肽文库可以用于鉴定靶的正常结合伴侣,如配基,例如,细胞因子、激素和类似物。一方面,本发明提供了包括本发明的信号序列(SP)和/或催化结构域(CD)以及异源序列的嵌合蛋白(参见以上)。
本发明也提供了应用本发明核酸和多肽,来产生“改进的”和杂合的磷脂酶的方法。例如,本发明提供了用于产生具有活性的酶的方法,所述活性如,在极端碱性pH值和/或酸性pHs、高和低的温度、渗透压和类似条件下的磷脂酶活性(如,磷脂酶A、B、C或者D活性、patatin酯酶活性、甘油磷酸酯键的切割、植物油中磷脂的酯连接的切割)。本发明提供了用于产生杂合酶(如,杂合磷脂酶)的方法。
一方面,本发明的方法通过应用细胞内过程产生新的杂合多核苷酸,该过程整合第一多核苷酸的序列,这样所得到的杂合多核苷酸编码表现出源于第一生物活性多肽的活性的多肽。例如,第一多核苷酸可以是编码本发明示例性的磷脂酶(如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8等)的示例性核酸序列(如SEQ ID NO:1、SEQ ID NO:3、SBQ ID NO:5、SEQ ID NO:7等)。第一核酸可以编码来自一种生物的酶,其在特定的环境条件下,如高盐的条件下有效地发挥作用。它可以与由源于不同生物体的第二多核苷酸所编码的酶“整合”,该酶可以在不同的环境条件下如极端的高温条件下,有效地发挥作用。例如,两个核酸可以通过例如重组和/或还原性重配产生杂合分子。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸可以编码表现出由原始多核苷酸编码的两种酶的特性的酶。因此,由杂合多核苷酸编码的酶可以在第一和第二多核苷酸编码的酶共有的环境条件下,如高盐和极端温度下有效地发挥作用。
可选择地,由本发明的方法得到的杂合多肽可以表现出原始酶所没有显示出的特异化酶活性。例如,在编码磷脂酶活性的多核苷酸重组和/或还原性重配以后,由杂合多核苷酸编码得到的杂合多肽可以通过被筛查来自每一种起始酶的特异活性,即,磷脂酶对之起作用的键的类型以及磷脂酶发挥作用的温度。这样,例如,可以筛查磷脂酶,来查明那些可以将杂种磷脂酶从起初的磷脂酶分辨出来的化学功能,如:(a)酰胺(肽键),即是,磷脂酶;(b)酯键,即是磷脂酶 和脂酶;(c)乙醛缩,即是糖苷酶,和,例如,杂合多肽起作用时的温度、pH或者盐浓度。
待与本发明的核酸“整合”的多核苷酸来源可以从下述情形中分离:个体生物(“分离物”),生长于成分确定培养基的生物群(“富集培养物”),或者,未经培养的生物(“环境样品”)。由于其使人们可以接近未开发的具生物多样性的资源,应用培养物依赖性(culture-independent)方法来得到编码来自环境样品的新型生物活性的多核苷酸是最优选的。“环境文库”是从环境样品中产生,并且代表了天然发生生物体的全体基因组,环境文库保存在克隆载体中,载体可以在适合的原核宿主中繁殖扩增。因为克隆DNA起初是从环境样品中直接提取,文库并不限于可以生长于纯培养基中的小部分的原核生物。此外,存在于这些样品中的环境DNA的标准化,可以允许其更加平等地代表在起始样品中存在的所有种的DNA。这就可以显著增加从样品的次要组成中发现感兴趣基因的效率,该样品中的次要组成与优势种相比,可能少了几个数量级。
例如,从一个或者更多的未培养的微生物产生的基因文库中,筛查感兴趣的活性。编码感兴趣的生物活性分子的潜在途径,首先在原核生物细胞中以基因表达文库的方式被捕获。编码感兴趣活性的多核苷酸分离自这样的文库,并且引入到宿主细胞中。将宿主细胞生长于促进重组和/或还原性重配的环境中,从而产生具有新型的或者增强活性的潜在的生物活性分子。
可以制备杂合多核苷酸的微生物包括原核微生物如真细菌和古细菌,低等真核微生物如真菌、一些藻和原生动物。多核苷酸可以是分离自环境样品,在这种情况下,核酸被回收而不需培养某一种生物体,或者是从一种或者多种培养的生物中回收。在一方面,这样的微生物可以是适于极端环境的,如,嗜高温的、嗜冷的、冷育的、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的磷脂酶的多核苷酸可以用于制备杂合酶。这样的酶可以在地表温泉和深海的热火山口超过100℃的温度有作用,在北极水域低于0℃的温度有作用,在死海的饱和的盐环境下有作用,在pH值在0附近例如煤层沉积物和地热富硫矿泉中起作用,或者在pH值超过11例如污水污泥中有作用。例如,来自极端条件下的生物体的几种被克隆和被表达的磷脂酶在很宽的温度和pH范围内表现出高活性。
在此描述的选择和分离的多核苷酸,包括至少一种本发明的核酸,被引入到适当的宿主细胞中。适当的宿主细胞是可以促进重组和/或还原性重配的任何细胞。选择的多核苷酸可以在包括合适控制序列的载体中。宿主细胞可以是较高等的真核生物细胞,如哺乳动物细胞,或者较低等的真核生物细胞,如,酵母细胞,或者优选地,宿主细胞可以是原核细胞,如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染,或电穿孔(Davis等人,1986)来实现。
示范性的适当的宿主包括:细菌细胞,如大肠杆菌、链霉菌、鼠伤寒沙门氏菌;真菌细胞,如酵母;昆虫细胞如果蝇S2和草地夜蛾Sf9;动物细胞如CHO、COS或者黑色素瘤细、胞腺病毒;和植物细胞(也可参见上面的论述)。选择适合的宿主用于重组和/或还原性重配或者仅仅用于表达重组蛋白被认为是在本领域技术人员已知的范围内。可以用于重组和/或还原性重配或者仅仅用于表达重组蛋白的哺乳动物细胞培养系统包括:猴肾纤维原细胞的COS-7细胞系,其在“SV40-transformed simian cells support the replication of early SV40 mutants”(Gluzman,1981)中有说明,C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体可以包括复制起点、合适的启动子和增强子,以及必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列,以及5’旁侧的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于提供所需的非转录的遗传学元件。
含有感兴趣多核苷酸的宿主细胞(用于重组和/或还原性重配或者仅仅用于表达重组蛋白)可以在传统的营养培养基中培养,对该培养基进行改变以适于激活启动子,选择转化子或者扩增基因。培养的条件,如温度,pH和类似因素是那些之前选择用于表达条件的宿主细胞所使用的,并且对于普通技术人员是显而易见的。经鉴定具有特异酶活性的克隆可以随后进行测序,以鉴定编码具有增强活性的酶的多核苷酸序列。
另一方面,本发明的核酸和方法可以用于产生用于生物化学途径的新型多核苷酸,所述生物化学途径如,来自一个或者多个操纵子或者基因簇或者其部分的途径。例如,细菌和很多的真核生物具有调控基因的协调机制,其中所述基因的产物参与相关的过程。基因成簇排列在单个染色体上,在结构上称“基因簇”,它们在单个调控序列的控制下一起转录,所述调控序列包括起始整个簇的转录的单个启动子。因此,基因簇是指一组或者相同或者相关的相邻基因,一般是指功能上相关的邻近的基因。
基因簇DNA可以从不同的生物体中分离出来并且连接到载体中,特别是含有表达调控序列的载体,所述表达控制序列可以控制和调控可检测蛋白或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于引入外源DNA使用具有非常大的容量的载体,特别适合用于这样的基因簇,在这里通过括大肠杆菌的f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒,在接合过程中它能实现自身的高频率转移,f-因子对于获得和稳定扩增大DNA片段,如来自混合的微生物样品的基因簇是理想的。可以使用“Fosmids”、粘粒或者细菌人工染色体(BAC)载体作为克隆载体。它们源于大肠杆菌f因子,可以稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时,这就有可能得到以稳定的“环境DNA文库”形式存在的大的基因组片段。粘粒载体最初是设计用来克隆和扩增基因组DNA的大片段。应用粘粒载体的克隆在Sambrook 等,Molecular Cloning:A Laboratory Mannual,第二版,Cold Spring HarborLaboratory Press(1989)中有详细说明。一旦连接到适当的载体,含有不同的聚酮化合物合成酶基因簇的两个或者多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选,以寻找在起初的基因簇没有发现的增强的活性。
因此,一方面,本发明涉及使用本发明的核酸序列产生具有生物活性的杂合多肽以及筛选具有活性(例如,增强的活性)的多肽的方法,该方法通过:
1)以可操作性连接的方式导入至少第一多核苷酸(例如本发明的核酸),和导入至少第二多核苷酸到合适的宿主细胞,所述的至少第一多核苷酸和第二多核苷酸共有具有部分序列同源性的至少一个区域;
2)在促进序列重新组织的条件下培养宿主细胞,得到可操作性连接的杂合多核苷酸;
3)表达由所述杂合多核苷酸编码的杂合多肽;
4)在有利于鉴定期望的生物活性(例如增强的磷脂酶活性)的条件下筛选所述的杂合多肽;和
5)分离编码该杂合多肽的多核苷酸。
用于筛选各种酶活性的方法对于本领域技术人员是已知的,关于它的讨论贯穿于本说明书。当要分离本发明的多核苷酸和多肽时,可以应用这些方法。
体内重配可以集中在“分子间”的过程上,统称为“重组”。在细菌中,它一般被视为是“RecA-依赖”的现象。本发明可以依赖于宿主细胞的重组过程来重组和重配序列,或者依赖于细胞介导还原过程的能力,通过缺失来减少细胞中的准-重复序列的复杂性。该“还原性重配”过程通过分子内的、RecA-依赖过程而发生。因此,在本发明的一方面,应用本发明的核酸,通过还原性重配过程,产生新型的多核苷酸。该方法包括产生含有连续序列(起始的编码序列)的构建物,它们插入到合适的载体中,并且然后将它们引入到合适的宿主细胞。单个分子同一性的重配通过在构建物中具有同源性区域的连续序列间的组合过程,或者准-重复单位间的组合过程而发生。重配过程重组和/或降低重复序列的复杂性和程度,并且导致产生新型的分子种类。
可以引用各种处理来提高重配效率。这些处理可以包括用紫外光,或者损坏DNA的化学试剂处理,和/或使用表现增高水平的“遗传不稳定性”的宿主细胞系。因此,这样的重配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然特性。
重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排列出现;以相似序列的连续单元出现。一旦连接,在连续序列之间的连接处变 得本质上无形,并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板内容,在模板上可以发生滑移事件。因此,含有准重复的构建物有效地提供了足够的分子弹性,缺失(和潜在的插入)事件实际上可以在准重复单元内的任何地方发生。当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然,细胞就不能区别各个单元。因此,还原过程可以在整个序列中发生。相反地,当例如,所述单元以头对头存在,而不是头对尾,相邻单元的头尾倒置,这样缺失的形成将有利于不连续单元的失去。因此,在本发明的一个方面,待重配序列是处于相同的方向。准重复序列的随机定向将会导致重配效率的损失,而序列的一致定向将会提供最高的效率。然而,虽然具有较少的相同定向的连续序列会降低效率,但是仍然可以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效率的准重复序列制备构建物。
应用各种方法中的任何一种,可以将序列装配成头对尾的定向,包括以下方法:a)可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括poly-A头和poly-T尾的引物将提供定向。这通过具有由RNA制备引物的头几个碱基来完成,而且随后用RNaseH可以很容易去除RNA。b)可以应用包括独特的限制酶切割位点的引物。这需要多个位点、一组独特的序列、和重复的合成和连接步骤。c)引物的内部几个碱基可以被硫醇化,并且用外切酶来产生合适的具有尾巴的分子。
重配序列的回收依赖于具有下降的重复指数(RI)的克隆载体的确定。被重配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有降低的RI的克隆载体的回收可以这样被完成,即:1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。2)通过物理程序对缩短的载体进行物理回收。在这一情况下,克隆载体将应用标准的质粒分离程序进行回收,或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。3)插入物的大小下降时,对含有可以选择的断裂基因的载体进行回收。4)应用表达载体以及适当的选择,使用定向选择技术。
相关的生物体的编码序列(例如,基因)可以表现出高度的同源性,并且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明中。然而,这一过程并不限于这种几乎相同的重复。
以下是本发明的示例性方法。编码性核酸序列(准-重复)来自三个(3)种,包括本发明的核酸。每一序列编码具有一套不同特征的蛋白质,包括本发明的酶。每一个序列在序列的唯一位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共同被扩增并且被连接到随机的组合中,以便所有可能的排列交换和组合可以在连接的分子群体中获得。准-重复单位的数目可以通过装配条件来控制。在构建物中,准-重复单位的平均数目通过重复指数(RI)来定义。一旦形成,构建物可以,或不必按照出版的方法通过琼脂糖凝胶来按大小分离,插入到克隆 载体,并且转染到合适的宿主细胞中。然后细胞进行繁殖,并且进行“还原性重配”。如果需要,还原性重配过程的速率可以通过引入DNA损伤来刺激。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导,还是通过“分子间”的机制由重组类似的事件来介导是不重要的。最终的结果是分子被重配,得到所有可能的组合。在一个方面,本方法包括一个额外的步骤,即对重排的文库成员进行筛选,以确定具有与一种预定的大分子如蛋白质受体、寡聚糖、病毒颗粒或者其它的预定的化合物或者结构结合或者不同方式地相互作用,或者催化一个特定的反应(如,酶的催化结构域)的能力的个别的重排文库成员。从这样的文库所鉴定得到的多肽,如,磷脂酶可以用于各种目的,例如在此说明的工业过程和/或可以进行改组和/或选择的一个或者多个另外的循环。
在另一方面,可以预见,在重组或重配之前,或者在重组或重配的过程中,通过本发明的方法产生的多核苷酸可以用试剂处理或进行加工,这些处理或加工促进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其编码的多肽的多样性。促进诱变的试剂和过程可以包括,但不限于:(+)-CC-1065,或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley,(1992);能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见,例如,van de Poll等(1992)),或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也见,van de Poll等(1992),751-758页);三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物,如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷酸盐(“Tris-BP”)、1,2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4,5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的尤其优选的方法由紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)组成。特别包含的方法是DNA加合物或者来自多核苷酸或者多核苷酸库的含有DNA加合物的多核苷酸,在进一步的处理前,其可以通过包括加热含有所述多核苷酸的溶液的过程进行释放或者去除。
筛选方法学和“在线”监视设备
在实践本发明的方法中,可以应用各种设备和方法学,结合使用本发明的多肽和核酸,例如,来筛选具有磷脂酶活性的多肽,来筛选作为潜在的活性调节物的化合物(如,酶活性的增强或者抑制),以获得结合于本发明多肽的抗体,获得与本发明核酸杂交的核酸和类似物。
固定化的酶固体支持物
磷脂酶,其片段以及编码该酶和片段的核酸可以附于固体支持物上。这对于工业过程中磷脂酶的使用常常是经济的且有效的。例如,磷脂酶(或其活性片 段)的联合物或者混合物——其用于特定的化学反应——可以附于固体支持物,并且浸于处理容器中。酶反应因此可以进行。随后,可以将固体支持物从容器中取出,同时取出的是固定在支持物上的酶,用于重复使用。在本发明的一个实施方案中,将分离的本发明核酸附着于固体支持物。在本发明的另一个实施方案中,固体支持物是选自凝胶、树脂、聚合物、陶瓷、玻璃、微电极以及它们的任意组合。
例如,用于本发明的固体支持物包括凝胶。凝胶的一些例子包括琼脂糖(Sepharose)、明胶、戊二醛、壳聚糖处理的戊二醛、白蛋白-戊二醛、壳聚糖-黄原胶、toyopearl胶(聚合胶)、藻酸盐、藻酸盐-聚赖氨酸、角叉菜胶、琼脂糖、glyoxyl琼脂糖、磁性琼脂糖、葡聚糖-琼脂糖、聚(氨基甲酰磺酸盐)水凝胶、BSA-PEG水凝胶、磷酸化的聚乙烯醇(PVA)、单氨基乙基-N-氨基乙基(MANA)氨基,或者它们的任意组合。
用于本发明的另一固体支持物是树脂或者聚合物。树脂或者聚合物的一些例子包括纤维素、丙烯酰胺、尼龙、人造纤维、聚酯、阴离子交换树脂、AMBERLITETMXAD-7、AMBERLITETMXAD-8、AMBERLITETMIRA-94、AMBERLITETMIRC-50、聚乙烯、聚丙烯酸、聚甲基丙烯酸酯或者它们的任何组合。
用于本发明的另一类型固体支持物是陶瓷。一些例子包括非多孔陶瓷、多孔陶瓷、SiO2、Al2O3。用于本发明的另一类固体支持物是玻璃。一些例子包括非多孔玻璃、多孔玻璃、氨基丙基玻璃或者它们的任何组合。可以应用的另一类型固体支持物是微电极。一个例子是聚乙烯亚胺涂层磁铁。石墨颗粒可以用于固体支持物。
用于实施本发明的其他示例性固体支持物包括硅藻土产品和硅酸盐。一些例子包括CELITE
、KENITE
、DIACTIV
、PRIMISIL
、DIAFIL
硅藻土和MICRO-CEL
、CALFLO
、SILASORB
TM和CELKATE
合成硅酸钙和硅酸镁。固体支持物的其他例子是细胞,诸如血红细胞。
固定化方法
有许多本领域技术人员已知的用于将酶或者其片段,或者核酸固定化在固体支持物上的方法。这样的方法的一些例子包括:如,产生静电液滴的方法、电化学方法、通过吸收、共价结合、交联、化学反应或者化学工艺、封装、捕集、通过藻酸钙,或者通过聚(2-羟乙基甲基丙烯酸)进行固定化的方法。类似的方法在下述文献中:Enzymology,Immobilized Enzymes and Cells,Part C.1987.AcademicPress.S.P.Colowick和N.O.Kaplan编辑,Volume 136;和Immobilization ofEnzymes and Cells.1997.Humana Press.Edited,G.F.Bickerstaff编辑.Series:Methods in Biotechnology,由J.M.Walker编辑。
毛细管阵列
毛细管阵列,如GIGAMATRIXTM,Diversa Corporation,San Diego,CA,可以用于本发明的方法。本发明的核酸或者多肽可以固定于或者施用于阵列,包括毛细管阵列。阵列可以用于筛选或者监控能够结合或者调节本发明核酸或者多肽活性的组分(如,小分子,抗体,核酸等)文库。毛细管阵列提供了另一个系统用于固定和筛查样品。例如,样品筛选设备可以包括形成由相临的毛细管组成的阵列的许多毛细管,其中每一个毛细管包括至少一个确定的保持样品的腔的壁。该设备也可以进一步包括置于阵列中邻近毛细管之间的空隙物质,以及在空隙物质内形成的一个或者多个参照的标记。用于筛选样品的毛细管,其中毛细管经修改以适合结合在毛细管阵列中,可以包括限定保留样品的腔的第一壁,以及由过滤材料形成的第二壁,用于过滤被提供给腔以激发样品的激发能。
多肽或者核酸,如,配基,可以引入第一成分到毛细管阵列中的至少一部分毛细管。毛细管阵列中的每一个毛细管可以包括至少一个确定保留第一组分的腔的壁。在第一组分后,引入气泡至毛细管中。可以将第二组分引入到毛细管中,其中第二组分是通过气泡与第一组分分开。令人感兴趣的样品可以作为用可检测的颗粒标记的第一液体引入到毛细管阵列的毛细管中,其中毛细管阵列中的每一个毛细管包括至少一个限定保留第一液体和可检测颗粒的腔的壁,并且其中至少一个壁用将可检测颗粒结合到至少一个壁的结合材料包被。该方法可以进一步包括从毛细管中去除第一液体,其中结合的可检测颗粒仍保留在毛细管中,然后将第二液体引入到毛细管中。
毛细管阵列可以包括很多的单个的毛细管,包括由至少一个限定腔的外壁。毛细管的外壁可以是一个或者多个融合在一起的壁。相似地,壁限定的腔是圆柱形、正方形、六角形或者任何其它的几何性状,只要壁形成保留液体或者样品的腔即可。毛细管阵列中的毛细管可以非常接近地固定在一起,以形成平面结构。毛细管可以通过融合(如,当毛细管由玻璃制成时)、胶粘、粘合或者通过夹具并列结合在一起。毛细管阵列可以由任何数量的单个毛细管构成,例如,范围从100到4,000,000个毛细管。毛细管阵列可以形成具有大约100,000或者更多单个毛细管结合在一起的微滴定板。
阵列,或“生物芯片”
本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测化合物(例如,小分子、抗体、核酸等等)的结合或者调控本发明的核酸或者多肽的活性的能力。例如,在本发明的一方面,一个被监测的参数是磷脂酶基因的转录表达。细胞的一种或者多种或者所有的转录物可以通过阵列或者“生物芯片”上的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。通过应用微型芯片上的核酸“阵列”,细胞的一 些或者所有转录物可以同时被量化。可选择地,包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新型的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。
本发明可以用任何已知的“阵列”进行实践,所述“阵列”也被指作“微阵列”或者“核酸阵列”或者“多肽阵列”或者“抗体阵列”或者“生物芯片”,或者它们的变体。阵列一般是多个“点”或者“靶元素”,每一个靶元素包括确定数量的一种或者多种生物分子,例如,固定于基底表面的确定区域、用于特异结合一种样品分子如mRNA转录物的寡核苷酸。
在实践本发明的方法时,任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地整入,或者也引入它们的变化,例如在下列文献中说明的:美国专利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,996;6,022,963;6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752;5,434,049;还例如,WO 99/51773;WO 99/09217;WO97/46313;WO 96/17958;还例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques 23:1087-1092;Kern(1997)Biotechniques23:120-124;Solinas-Toldo(1997)Genes,Chromosomes & Cancer 20:399-407;Bowtell(1999)Nature Genetics Supp.21:25-32。也参见出版的美国专利申请20010018642;20010019827;20010016322;20010014449;20010014448;20010012537;20010008765。
抗体和基于抗体的筛选方法
本发明提供了可与本发明的磷脂酶特异结合的分离出的或重组的抗体。这些抗体可用来分离、鉴定或定量本发明的磷脂酶或相关的多肽。这些抗体可以用于抑制本发明酶的活性。这些抗体可以用于分离与本发明那些物质相关的多肽,如,相关的磷脂酶。抗体可以用于免疫沉淀,染色(如FACS)、免疫亲和柱等等。如果需要的话,编码特异抗原的核酸序列可以通过免疫方法获得,随后分离出多肽或者核酸,进行扩增或者克隆,将多肽固定在本发明的阵列上。可供选择地,本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构,如,抗体的亲和性可以增加或者降低。而且,制备或者修饰抗体的能力可以是通过本发明的方法改造入细胞的表型。
免疫、产生或者分离抗体(多克隆的或者单克隆的)的方法是本领域技术人员所了解的,并且在科学和专利文献中有描述,参见,如,Coligan,CURRENTPROTOCOLS IN IMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASICAND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications,Los Altos,CA(“Stites”);Goding,MONOCLONAL ANTIBODIES:PRINCIPLES AND PRACTICE(第2版)Academic Press,New York,NY(1986);Kohler(1975)Nature256:495;Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold SpringHarbor Publications,New York。除了使用动物的传统的体内方法外,抗体也可以在体外产生,例如,应用表达重组抗体结合位点的噬菌体展示文库。参见如,Hoogenboom(1997)Trends Biotechnol.15:62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26:27-45。
多肽可以用于产生可以特异性结合本发明多肽的抗体。得到的抗体可以用于免疫亲和层析方法中,来分离或者纯化多肽或者确定是否多肽存在于生物样品中。在这样的程序中,将蛋白制备物,如提取物,或者生物样品与能够特异性结合本发明的其中一个多肽的抗体相接触。
在免疫亲和程序中,将抗体附着于固体支持物,如珠或者其它的柱基质。在抗体特异性结合本发明多肽中的一个多肽的条件下,将蛋白制备物置于与抗体接触。洗涤去除非特异性结合的蛋白后,洗脱特异性结合的多肽。
在生物样品中的蛋白结合抗体的能力可以通过应用本领域技术人员熟悉的任何不同的方法来测定。例如,结合可以通过用可检测的标记如荧光试剂、酶标或者放射性同位素标记抗体来测定结合。可选择地,抗体与样品的结合可以应用其上具有这样的可检测标记的第二抗体来检测。特定的分析包ELISA分析、夹心法分析、放射免疫分析以及Western印迹。
产生的针对本发明多肽的多克隆抗体可以通过直接注射该多肽至动物中而得到,或者将该多肽施用动物例如,非人类动物而得到。这样得到的抗体随后结合于该多肽本身。以这样的方式,可以应用仅仅编码多肽片段的序列来产生可以结合整个天然多肽的抗体。这样的抗体随后可以用于从表达多肽的细胞中分离该多肽。
为了制备单克隆抗体,可使用可通过连续细胞系培养来产生抗体的任何技术。实例包括杂交瘤技术、trioma技术、人B-细胞杂交瘤技术和EBV-杂交瘤技术(参见例如Cole(1985)Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,pp.77-96)。
可以对产生单链抗体的技术(参见,如,美国专利编号4,946,778)进行调整,用于产生针对本发明多肽的单链抗体。可选择地,可以用转基因鼠来表达针对这些多肽或者其片段的人源化的抗体。
产生的针对本发明多肽的抗体可以用于从其它的生物体和样品中筛选类似的多肽。在这样的技术中,将来自该生物体的多肽与该抗体接触,检测特异性结合抗体的那些多肽。以上所述的任何程序可以用于检测抗体结合。
试剂盒
本发明提供了包括以下成分的试剂盒,如,核酸,表达盒,载体,细胞,多肽(如含有至少一种本发明的磷脂酶的试剂盒)和/或本发明的抗体(如含有至少一种本发明的抗体的试剂盒)。该试剂盒也可以含有指导性材料,来指导本发明的方法学和工业应用,正如在此所述。
本发明酶的工业和医学应用
本发明提供了使用本发明的多肽,例如磷脂酶和本发明的其他酶,例如磷脂酶A、B、C和D、patatins的许多工业应用和医学应用,包括转换不可水合的磷脂至水合形式、油脱胶,处理来自植物、鱼、藻类和类似物的油,在此仅仅指出了几种应用。在任何这些可选择的工业应用和医学应用中,酶可以以特定的顺序加入,例如具有不同的特异性的磷脂酶以特定顺序加入,例如首先加入具有PC-和PE-水解活性的酶(或加入两种酶,一种具有PC-水解活性,另一种具有PE-水解活性),然后加入具有PI-水解活性(例如PLC活性)的酶,或其任何组合。
任何或所有本发明的方法可用于“加工级”,例如在约15,000;25,000;50,000;75,000或100,000lbs精炼油/天至约1、2、3、4、5或6百万或更多lbs精炼油/天级别上进行的油加工或精炼。
在工业应用中使用磷脂酶的方法是本领域所熟知的。例如,本发明的磷脂酶和方法可以用于处理脂肪和油,如,在日本专利申请公布H6-306386中所述,该申请描述了将存在于油和脂肪的磷脂转化为含有磷酸基团的水溶性物质。
本发明的磷脂酶可以用于处理植物油和磷脂,如那些来源于或者分离自米糠、大豆、油菜、棕榈、棉籽、玉米、棕榈仁、椰子、花生、芝麻、向日葵的植物油和磷脂。本发明的磷脂酶可以用于处理提炼油,如,那些来自果籽的油,如葡萄籽、杏仁、琉璃苣等。本发明的磷脂酶可以用于处理以不同形式存在的油和磷脂,包括粗制品形式、脱胶的、胶、洗涤水、黏土、硅石、皂脚和类似物。本发明的磷脂酶可以用于处理高磷含量的油、鱼油、动物油、植物油、藻类油和类似物。在本发明的任何方面,任何时候可以应用磷脂酶C,一种选择包括应用本发明的磷脂酶D和磷酸酶(如,应用PLD/磷酸酶的组合来提高高磷含量油如大豆豆油的产量)。
本发明的磷脂酶可以用于处理和制备食用油、生物柴油,用于药物学和化妆品的脂质体、结构磷脂和结构脂类。本发明的磷脂酶可以用于油提取。本发明的磷脂酶可以用于处理和制备各种肥皂。
加工食用油:产生1,3-二酰基甘油(1,3DAG)
本发明提供了使用本发明的酶(或多种酶)来制备1,3-二酰基甘油(1,3DAG)的工艺。在一个方面,磷脂酶C或磷脂酶D加磷酸酶产生1,2-二酰基甘油;这提高了在食用油精炼期间的油产量。当用于包括碱中和步骤的工艺时,例如作为碱 精炼助剂,多达70%的1,2-二酰基甘油(1,2DAG)进行了酰基转移,被转化为1,3-DAG。1,3-DAG具有增加的健康益处,因此使用PLC作为碱炼助剂产生具有增加的营养价值的油。
本发明提供了使用本发明的酶(或多种酶)制备和加工食用油的工艺,包括产生具有增加数量的1,3-DAG的食用油。二酰基甘油是许多食用油中天然存在的化合物。在本发明方法,例如油脱胶工艺的一个方面,碱(苛性碱)引起PLC产生的1,2-DAG异构化成1,3-DAG,其提供超过1,2-DAG的营养健康价值,例如1,3-DAG作为能量被燃烧掉,而不是作为脂肪被储存起来(1,2-DAG则是这样)。通过在碱炼工艺开始时加入PLC(酸和碱随后),本发明的方法产生提高水平的1,3-DAG(减少1,2-DAG)。从营养角度看,1,3-DAG优于1,2-DAG。在可选择的方面,本发明包括使用本发明的PLC的油脱胶工艺,从而产生含有不少于0.5%、1.0%、2.0%或3.0%或更多1,3-DAG的最终脱胶的油产物。
因此,本发明提供(通过酯交换作用)制备精炼油(例如二酰基甘油)——包括食用油——的工艺,其含有增加水平的1,3-二酰基甘油(1,3-DAG),如在实施例13中所示,其中磷脂酶,诸如本发明的酶,是“前期加载型的(front-loaded)”,或在加入酸或者碱之前加入。由甘油三酯的酶促水解产生DAG,通过异构化由1,2DAG产生1,3DAG。相比传统的食用油,含有1,3DAG的食用油显示出不同的代谢效应。1,3DAG和1,2DAG或甘油三酯之间代谢途经的差异使得较大部分的来自1,3二酰基甘油的脂肪酸作为能源被燃烧掉,而不是作为脂肪储存起来。临床研究已经显示,经常食用DAG油作为明智膳食(sensible diet)的一部分,能帮助个体控制他们的体重和体内脂肪。此外,1,3DAG的代谢减少血流中循环的餐后甘油三酯。因为肥胖和增高的血脂是与慢性疾病包括心血管疾病和II型糖尿病相关的危险因素,这些与生活方式相关的健康状况可以受到有规律的消耗DAG油这样的有益方式的影响。
可以通过各种方法食用含DAG的油。因此,在一个方面,本发明提供使用本发明的酶制备食物的工艺,食物例如具有增加水平的1,3-DAG二酰基甘油的焙烤食物,和含有二酰基甘油油的焙烤食物。在一个方面,焙烤食物是饼干、蛋糕和类似的焙烤食物。
在可选择的实施方案中,可以用于本发明方法,包括食用油加工方法的酶的组合包括(其中在该组合中的一种、若干种或所有酶包含本发明的酶):
。PLC+PI-PLC+PLA(PLC反应完成后加入PLA);
。PLD+磷酸酶+PI-PLC,然后加入PLA;或
。PLC或(PLC+PI-PLC)+PLA,对磷脂酸具有特异性(所有的酶同时或依次加入)。
油脱胶和植物油的处理
本发明的酶(例如具有脂酶、磷脂酶、酯酶和/或糖苷酶或等同活性的多肽)可以用于各种植物油加工步骤中,诸如用于植物油提取,特别地,用于在称为“油脱胶”的工艺中除去“磷脂胶”。
本发明的这些工艺可用于“加工级”,例如在约15,000;25,000;50,000;75,000或100,000lbs精炼的油/天至约1、2、3、4、5或6百万或更多lbs精炼的油/天的级别上。
在一个方面,本发明提供了油脱胶的方法,该方法包括使用本发明的磷脂酶,例如本发明的PLC。在一个方面,该方法还包括添加另一磷脂酶(其也可以是本发明的磷脂酶),例如本发明的其他PLC、PLA、PLB、PLB或patatin或具有溶血磷脂酶-转酰基酶(LPTA)活性或溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)或它们的组合的酶,和/或patatin样磷脂酶(其也可以是本发明的酶)。在一个方面,所有酶一起加入,或可选择地,酶以特定的顺序加入,例如加入PLC后加入PLA和/或patatin;或者首先加入具有PC和PE活性的酶或许多酶,然后加入PI PLC。
在一个方面,因磷脂酶(例如,本发明的PLC)处理的结果,该过程使得产量提高。在一个方面,因磷脂酶(例如,本发明的PLA)处理的结果,该过程使得油中的磷含量额外地减少。
在一个方面,本发明提供了这样的工艺,包括使用本发明的磷脂酶,例如本发明的PLC来减少胶的量并通过减少油被捕获的数量来增加中性油(甘油三酯)产量。在一个方面,本发明提供这样的工艺,包括使用本发明的磷脂酶,例如本发明的PLC来增加中性油和二酰甘油(DAG)的产量,以增加油相。在可选择的方面,本发明的方法(例如脱胶方法)可以包含一种或多种其他的酶,诸如蛋白酶、淀粉酶、角质酶、另一磷脂酶(包括例如本发明的酶)、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳糖酶、木聚糖酶、氧化酶,例如乳糖酶和/或过氧化物酶或具有等同活性的多肽,或其组合。
本发明的磷脂酶可以用于各种植物油处理步骤,如在植物油的提取中,特别地,用于在上述称为“油脱胶”的过程中去除“磷脂胶”。本发明提供了用于处理不同来源的植物油的方法,所述来源如米糠、大豆、油菜、花生和其它的果实、芝麻、向日葵、棕榈和玉米。该方法可以与基于用如己烷提取的工艺联合,随后将粗提取物精炼成食用油,其中包括使用本发明酶和方法。精炼顺序的第一步骤是所谓的“脱胶”过程,其用于通过加入水来分离磷脂。分离通过脱胶沉淀的物质,并且进一步处理成卵磷脂混合物。商业上应用的卵磷脂,如大豆卵磷脂和向日葵卵磷脂,是半固体的或者是非常粘稠的物质。它们是由极性脂类和油的混合物组成,其中,极性脂类主要是磷脂,油主要是甘油三酯。
本发明的磷脂酶可以用于任何“脱胶”过程,包括水脱胶、ALCON油脱胶(如,用于大豆)、safinco脱胶、“超脱胶”、UF脱胶、TOP脱胶、单脱胶 (uni-degumming)、干法脱胶和ENZYMAXTM脱胶。参见,美国专利6,355,693;6,162,623;6,103,505;6,001,640;5,558,781;5,264,367。本发明方法整合的各种脱胶过程描述于Bockisch,M.(1998)In Fats and Oils Handbook,The extraction ofVegetable Oils(Chapter 5),345~445,AOCS Press,Champaign,Illinois。本发明的磷脂酶可以用于甘油三酸酯油的酶促脱胶的工业应用,如在EP 513 709中所述。
在一个方面,本发明的磷脂酶用于处理植物油,例如粗油,诸如米糠、大豆、油菜、花和类似物。在一个方面,这提高脱胶工艺的效率。在一个方面,本发明提供了在低水条件下进行酶脱胶的方法,例如在约0.1%至20%水,或0.5%至10%水的范围内。在一个方面,这提高了在离心期间,重相从油相的分离水平。对这些相提高的分离水平能够导致磷脂更有效地从油中去除,包括可水合的和不可水合的油。在一个方面,这能够产生含有较少捕获的中性油(甘油三酯)的胶组分,从而提高脱胶工艺期间的总油产量。
在一个方面,本发明的磷脂酶,例如具有PLC活性的多肽用于处理油(例如植物油,例如粗油,诸如米糠、大豆、油菜、花和类似物),例如用于脱胶工艺,以减少胶量和通过减少油捕获而增加中性油含量。在一个方面,本发明的磷脂酶,例如具有PLC活性的多肽,用于生产二酰甘油(DAG)和用于增加油相。
本发明的磷脂酶可以用于酶促脱胶的工业应用,如,在CA1102795中所述,其描述了通过加入至少50%重量百分比的水从谷物脂类中分离极性脂类的方法。以其应用的原理是加入水到粗油混合物的角度来看,该方法是经过改良的脱胶过程。
一方面,本发明提供了酶促过程,包括应用本发明磷脂酶(如,PLC),包括水解在油中的水合磷脂,温度为约20℃到40℃,碱性pH,如pH为大约pH8到pH10,反应时间为大约3到10分钟。这可以导致油中的最终磷水平少于10ppm。本发明也提供了酶促过程,包括应用本发明磷脂酶(如,PLC),包括水解油中可水合的和不可水合的磷脂,温度大约50℃到60℃,pH值略低于中性,例如大约pH5到pH6.5,反应时间为大约30到60分钟的条件下。这可以导致油中的最终磷水平少于10ppm。
在一方面,本发明提供了酶促过程,该过程利用磷脂酶C酶水解甘油磷酸酯键,从而使得能将磷脂中的二酰甘油部分返回到油中,如植物油、鱼油或者藻类的油(“磷脂酶C(PLC)苛性碱精炼助剂”);和,在脱胶步骤中将磷脂含量减少至对于待物理精炼的高磷油足够低的水平(磷脂酶C(PLC)脱胶助剂”)。这两种方法能够产生不同价值并且具有不同的目标应用。
在本发明各种示例性过程中,很多不同的步骤组成了核心的漂白和脱臭精炼过程之前的脱胶过程。这些步骤包括,加热、混合、维持、分离和干燥。在加热步骤以后,加入水,常常是酸,并且混合,以便使得不溶性的磷脂“胶”凝聚成可以被分离的颗粒。虽然在脱胶过程中水分离很多磷脂,但是部分磷脂是以钙盐或 者镁盐的形式存在的不可水合的磷脂(NHPs)。脱胶过程通过加入酸处理这些NHPs。在磷脂水合以后,油被混合,维持并且通过离心分离。最后,将油干燥并且贮存、运输或者精炼,如图6所示。得到的胶既可以进一步处理以获得卵磷脂产物,也可以加回到食物中。
在本发明各种示例性工艺中,磷的水平被降到低至对于物理精炼足够低。与苛性碱精炼相比,该分离过程可能导致潜在更高的产量损失。此外,脱胶过程可能产生不能以商业卵磷脂出售的废物,参见,例如图7,图7是物理精炼油的示例性的脱胶过程。因此,这些过程并没有取得显著的市场份额,碱精炼过程继续统治着米糠、大豆、油菜和向日葵工业。然而,注意,用于特殊脱胶过程的磷脂酶C酶将降低胶的形成,并且将磷脂中的甘油二酯部分返回到油中。
在一个方面,本发明提供了在胶组分中使用本发明的PLC的方法。在该方法的一个方面,将油加入到粗油中,以产生乳状液,这导致磷脂酰胆碱、磷脂酰乙醇胺和磷脂酰肌醇移入水相(水脱胶)。离心之后,这些磷脂是含水胶组分的主要组分。胶组分中的磷脂可以用磷脂酶C或磷脂酶D加磷酸酶(或其他组合,参见下面描述)处理,以产生二酰甘油(DAG)和磷酸酯。在此时,DAG可以从其他胶组分中提取出来,并在适合于对DAG进行转酯作用的条件下用脂酶处理,产生期望的三酰甘油(结构性类脂)。
在另一方面,利用在PLC反应后例如通过加入碱增加胶的pH,大部分的1,2-DAG可以被转化为1,3-DAG。1,3-DAG然后可以从胶中提取出来,并在合适的条件下与脂酶反应,以在sn2位置对1,3-DAG进行转酯作用,从而产生期望的结构性三酰甘油。
在可选择的方面,用于转酯反应的脂肪酸,可以来自各种来源,包括粗油中发现的游离脂肪酸。
在一个方面,来自水脱胶的磷脂与本发明的PLC组合使用,产生结构性类脂。水脱胶的油可以暴露于PLC和/或PLD(其中之一或两者可以是本发明的酶)加磷酸酶或这些组合中的其中一种,然后暴露于PLA(可以是本发明的酶),以将磷减少至适合于碱或物理精炼的水平。
在可选择的实施方案中,可以用于本发明方法包括这些脱胶工艺的酶的组合包括(其中该组合中的一种、若干种或所有酶包含本发明的酶):
。PLC+PI-PLC+PLA(PLC反应完成后加入PLA);
。PLD+磷酸酶+PI-PLC,然后加入PLA;或
。PLC或(PLC+PI-PLC)+PLA,对磷脂酸具有特异性(所有的酶同时或依次加入)。
碱法精炼(caustic refining)
本发明提供了在碱炼中使用磷脂酶(包括本发明的酶)的过程,其中酶被用作碱炼助剂。在可选择的方面,PLC或PLD和/或磷酸酶用于滴加的过程,既可以在碱法中和精炼过程(既可以连续精炼也可以间歇精炼)之前,期间,或者之后。加入的酶量可以根据工艺来变化。用于本工艺的水的水平可以是低水平的,例如约0.5到5%。可选择地,通过多次,将苛性碱加入至该工艺中。此外,该过程可以在不同的温度下(25℃到70℃),不同的酸或碱条件下,并且在变化的pH值(4到12)下进行。可以使用浓的碱溶液,例如比11%的工业标准浓度更大,以减少胶的量。在可选的方面,浓的碱溶液浓度在约12%至50%之间,例如约20%、30%、40%、50%或60%或更浓。
在一方面,本发明的磷脂酶C在甘油磷酸酯键处水解磷脂,产生甘油二酯和水溶性的磷酸化合物。水解的磷脂进入到水相,而甘油二酯留在油相中,如在图8所说明的。PLC“碱炼助剂”的一个目的是将在中和过程中形成的磷脂胶转化为二酰甘油,二酰甘油将又转移回到油相。相反地,“PLC脱胶助剂”的一个目的是将粗油中的磷脂降低为少于百万分之十(10ppm)的磷当量。
可以用于碱炼过程的酸,包括但是并不限于,磷酸、柠檬酸、抗坏血酸、磺酸、反丁烯二酸、顺丁烯二酸、盐酸和/或乙酸。酸被用于水合不可水合的磷脂。可以应用的碱包括但不限于,KOH和NaOH。碱被用于中和游离脂肪酸。可选择地,磷脂酶,或者更特别地,PLC或者PLD和磷酸酶,用于从胶/皂脚中纯化植物固醇。
在碱炼前加入磷脂酶的本发明的可选择的实施方案是在植物中表达磷脂酶。在另一个实施方案中,在压碎植物、种籽或者其它的植物部分期间加入磷脂酶。可选择地,在压碎后,但是在精炼前(即是在容器中)加入磷脂酶。此外,在有酸或无酸的条件下,加入磷脂酶作为精炼预处理。
已经描述过的本发明的另一个实施方案,是在碱炼过程期间加入磷脂酶。在这一过程,酸和碱的水平依赖于磷的水平和游离脂肪酸的水平而变化。此外,该过程使用宽的温度和pH范围,这依赖于所应用的酶的种类。
在本发明的另一个实施方案中,磷脂酶在碱炼后加入(图9)。在一个例子中,在分离前,磷脂酶加入到强力混合器(intense mixer)或者滞留混合器(retention mixer)。可选择地,磷脂酶在加热步骤后加入。在另一个实施方案,磷脂酶在离心步骤中加入。在额外的实施方案中,磷脂酶加入到皂脚中。可选择地,磷脂酶加入到洗涤水中。在另一个例子中,磷脂酶在漂白和/或脱臭步骤中加入。
在一个方面,在漂白和脱臭之前,磷脂酶,例如磷脂酶C,本发明的酶将水解中和过的粗的和脱胶的油中水合和非水合磷脂的磷脂。本发明的示例性的“碱炼”工艺在图9和图13中示出。图9包括静态混合器(static mixer)的示例性时间、温度和pH(30至60分钟、50至60℃,pH 5至6.5)和滞留时间(3至10分钟,20-40℃)。
目标酶可以作为滴加物(drop-in product)应用于现有的碱法中和工艺中,如在图9中所示。在该方面,如果酶在加入碱之后加入,酶将不必经受极端的pH水平。如图13(酶“前载型”示例性工艺)所示,任何磷脂酶,包括本发明的磷脂酶,诸如PLC、PLB、PLA和/或PLC都可以用于粗油脱胶工艺,如Bailey′s Industrial Oil & FatProducts v.4(ed.Y.H.Hui)中所述。图14和图15示出了本发明方法的变化,其中两个或三个离心步骤分别用于所述工艺中,其可以用于加工任何油,例如植物油,诸如粗的大豆油,如图中所示。图15的示例性方法在碱炼之前具有离心步骤(除了碱炼之后和水洗之前,和水洗之后的离心步骤),而图14的示例性方法在碱炼之前并没有离心步骤。图16示出了该工艺的另一示例性变化,其使用酸处理并在脱胶步骤之前有离心步骤;该示例性工艺用于处理任何油,例如植物油诸如粗的豆油,如图所示。
一方面,本发明的磷脂酶使得磷除至低到物理精炼可接受的水平。一方面,本发明的PLC将在漂白和脱臭前,水解来自粗油中水合和非水合磷脂的磷脂。在目前的脱胶操作中,靶酶可以作为点滴形式的产品应用,参见例如图10。假如在商业设备中为亚最佳状态的混合,很可能需要酸来引起非水合的磷脂与酶在油/水的界面上接触。因此,一方面,应用本发明的酸稳定性PLC。
一方面,本发明的PLC脱胶助剂工艺可以减少表2中示出的一个或者所有三个项目的损失。在PLC过程中相关的损失,以质量为基础计算,据估计可以为大约0.8%,相对地,由于磷脂的去除,则为5.2%。
表2:由PLC产品所致的损失
|
碱炼助剂 |
脱胶助剂 |
1)胶形成和分离中的油损失2.1% |
X |
X |
2)在加入苛性碱中皂化的油3.1% |
|
X |
3)在漂白中黏土中捕获的油*<1.0% |
X |
X |
总产量损失~5.2% |
~2.1% |
~5.2% |
本发明该过程的另外潜在的益处包括如下:
◆减少的吸附剂—对较低水平(<5ppm)的磷,需要较少的吸附剂
◆较低的化学剂用量—与非水合磷脂的水合作用相关的化学剂和工艺成本较少
◆较低的废物产生—需要较少的水来从油中去除磷
通过本发明的方法(如“脱胶”)处理的油包括植物油种籽,如,大豆油、油菜籽油、米糠油和向日葵油。一方面,本发明的“PLC碱炼助剂”可以比目前的碱炼工艺节约1.2%。精炼助剂应用用于豆油,该豆油已经针对卵磷脂进行脱胶,并且这些也从值/加载计算中扣除。
本发明工艺的执行目标可以根据应用而变化,并且更特异地,根据酶加入的点而变化,参见表3。
表3应用的执行目标
可以应用本发明磷脂酶,如,磷脂酶A1的其它工艺可以将非水合的天然磷脂转化为至水合的形式。一方面,该酶对热敏感。因为对油加热可以破坏酶,这可能是需要的。然而,脱胶反应必须调节为pH 4-5以及60℃来适应该酶。在300个单位/kg的油饱和剂量时,该示例性工艺的成功之处在于将以前的水脱胶油的磷含量降至≤10ppm P。优点可以是减少的H2O含量,而且在应用、处理和废物中所导致的节约。表4列出了本发明酶的示例性的工业应用:
表4:示例性应用
|
碱炼助剂 |
脱胶助剂 |
豆油/卵磷脂产生 |
X |
|
化学精炼的豆油、向日葵油、油菜油 |
X |
X |
低磷脂油(如,棕榈) |
|
X |
[0561] 除了这些不同的“脱胶“工艺,本发明的磷脂酶可以用于任何的植物油处理步骤。例如,在任何植物油的处理步骤中,本发明的磷脂酶可以用于替代PLA,如磷脂酶A2。用本发明的方法“处理”或者“脱胶”的油包括大豆油、油菜籽油、玉米油、来自棕榈仁的油、油菜油、向日葵油、芝麻油、花生油、米糠油和类似油。该工艺的主要产物包括甘油三酯。
在一种示例性工艺中,当酶加入到粗制油,并且与粗制油反应时,每1kg的粗制油所应用的磷脂酶的量为约10-10,000单位,或者,可选择地,约100-2,000单位。酶处理进行5分钟到10个小时,温度为30℃到90℃,或者,可选择地,约40℃到70℃。条件可以依赖于酶的最适温度而变化。加入用于溶解酶的水的量为,每100重量份的粗制油使用5-1,000重量份的水,或者可选择地,大约每100重量份的粗制油使用大约10到200重量份的水。
一旦这样的酶处理过程完成后,用合适的方式,如离心分离器分离酶液体,并得到经处理的油。以这样的工艺对胶状物进行酶分解所产生的含磷化合物实际上全部被转移到水相,并且从油相中去除。一旦酶处理完成后,如果需要,处理的油可以另外用水或者有机或者无机酸洗涤,如乙酸、柠檬酸、磷酸、琥珀酸和等同的酸,或用盐溶液洗涤。
在超滤脱胶的一个示例性过程中,在过滤前,将酶结合于过滤器,或者将酶加入到油中,或定时用酶清洗过滤器。
在磷脂酶介导的物理精炼助剂的示例性工艺中,将水和酶加入到粗制油中(例如粗植物油)。一方面,本发明的PLC或者PLD以及磷酸酶用于该工艺中。在磷脂酶介导的物理精炼中,水可以是低水平的,即0.5-5%,处理时间应当短(少于2小时,或者少于60分钟,或者少于30分钟,或者少于15分钟,或者少于5分钟)。该工艺可以在不同的pH(如,3-10),不同的温度(25℃到70℃)下,应用不同的酸和/或碱进行。
在可选择的方面,水脱胶首先进行,通过离心收集卵磷脂,然后加入本发明的PLC或PLC和PLA以去除非水合的磷脂(该工艺应当在低的水浓度下进行)。另一方面,对粗制油进行水脱胶至低于10ppm(食用油),随后进行物理精炼(对于生物柴油低于50ppm)。一方面,加入乳化剂,和/或将粗制油置于强力混合器中促进混合。可选择地,加入破乳剂,和/或对粗制油加热来促进水相的分离。另一方面,加入酸来促进非水合磷脂的水合。另外地,磷脂酶可以用于介导从胶/皂脚中纯化植物固醇。
在一个方面,本发明提供了用于油脱胶的组合物和方法(其可以包括使用本发明的磷脂酶),包括使用变化数量的酸和碱,而不制备皂脚。使用本发明油脱胶的这一方面,酸(包括磷酸和/或柠檬酸)可以用于水合高磷含量油(包括大豆、油菜和向日葵)中的非水合的磷脂。一旦磷脂被水合,加入碱,可以提高水相的pH:加入的碱的量可以为酶活性产生有利的pH,但不会导致在油中形成显著的皂 脚组分。因为不形成皂脚,油中的游离脂肪酸可以在下游除去,这发生在脱胶步骤之后,漂白和脱臭期间。
本发明的酶可用于改进油提取和油脱胶效果(例如植物油)。在一个方面,本发明的PLC和至少一种植物细胞壁降解剂(例如纤维素酶、半纤维素酶或类似物,以使细胞壁柔软并增加提取时的产量)被用于本发明的工艺中。在该使用本发明的酶以改进油提取和油脱胶的示例性方法中,本发明的磷脂酶C以及其他水解酶(例如纤维素酶、半纤维素酶、酯酶、蛋白酶和/或磷酸酶)用于与油生产(包括但是不限于大豆、油菜、向日葵、米糠油)相关的破碎步骤期间。通过在溶剂提取之前使用酶,或代替溶剂提取,有可能增加油产量和减少粗油中水合和非水合的磷脂的数量。非水合磷脂的减少可以归因于在与钙或镁络合之前,潜在的非水合磷脂转化为二酰甘油和相应的磷酸酯。粗油中磷脂总的减少量将提高精炼期间的产量,并有可能无需在漂白和脱臭之前独立的脱胶步骤。
在一个方面,本发明提供了将本发明的磷脂酶(例如本发明的磷脂酶-特异性磷酸水解酶)或另一磷脂酶用于修改的“有机精炼过程”的工艺,其可以包括将酶(例如PLC)加入盛有柠檬酸的桶中。
本发明的酶可以用于任何油处理方法,如,脱胶或等同的工艺。例如,本发明的酶可以用于美国专利5,558,781;5,264,367;6,001,640所描述的工艺中。USPN5,558,781所描述的工艺应用磷脂酶A1,A2或B,实质上降解了油中的卵磷脂,其作为乳化剂发挥作用。
通过应用本发明的磷脂酶,如具有磷脂酶A和/或B活性的多肽,本发明的酶和方法可以用于旨在减少包含高含量非水合磷的食用油中的含磷组分的过程中,如在EP专利号:EP 0869167中所述。一方面,食用油是粗制油,所谓的“非-脱胶油”。一方面,该方法处理非脱胶油,包括压榨油或者提取油,或者其混合物,它们来自,例如油菜籽、大豆、芝麻、花生、玉米、米糠或向日葵。在粗制油中,磷脂含量可以从0.5到3%w/w之间变化,对应于磷含量的范围为200到1200ppm,或者在250到1200ppm范围内。除了磷脂,粗制油也可以含有低浓度的碳水化合物、糖化合物,和Ca、Mg和Fe的金属/磷脂酸复合物。一方面,工艺包括用本发明的磷脂酶处理磷脂或者溶血磷脂,以便水解脂肪酰基基团。一方面,磷脂或者溶血磷脂包括卵磷脂或者溶血卵磷脂。本工艺的一方面,食用油具有的磷含量为在大约50到250ppm之间,而且该工艺包括用本发明的磷脂酶处理油,以便水解大部分的磷脂,并且从油中分离含有水解的磷脂的水相。一方面,酶法脱胶过程之前,对油进行水脱胶。一方面,该方法生产动物饲料,所述生产包括将本发明磷脂酶与饲料物质以及至少一种磷脂混合。
本发明的酶和方法可以用于油脱胶过程,正如在WO 98/18912所描述的。本发明的磷脂酶可以降低食用油中的磷脂含量。该工艺可以包括用本发明的磷脂酶处理油,来水解大部分的磷脂,并且从油中分离含有水解的磷脂的水相。该工 艺可以用于纯化含有磷脂的任何食用油,如,植物油,例如大豆油、米糠油、油菜籽油和向日葵油、鱼油,藻类油和动物油和类似油。在用酶处理以前,植物油优选地进行预处理,例如通过湿法精炼去除粘质(黏液)。在开始用磷脂酶处理之时,该油可能含有约50-250ppm的磷,或约50至约1500ppm的磷,或更多的磷,如磷脂,并且本发明的工艺可以将该值降低到约5-10ppm以下。
本发明的酶可以用于如1993年4月25日提交的日本申请H5-132283所述的工艺,该日本申请包括纯化油和脂肪的工艺,该工艺包括步骤:将油和脂肪中的磷脂转化为含磷酸基团的水溶性物质,并且作为水溶性物质去除它们。酶的作用是用于转化成水溶性物质。优选使用的酶是具有磷脂酶C活性的酶。
本发明的酶可以用于如“Organic Refining Process,”(ORP)(IPH,Omaha,NE)所述的工艺,其是精炼种子油的一种方法。ORP可能具有优于传统化学精炼的优点,包括提高的精油产量、增值的副产品、较低的资金成本和更低的环境成本。
本发明的酶可以用于处理油或脂肪,动物或者植物的,未加工的、半加工的或者精炼的油或脂肪的工艺,包括将本发明的至少一种酶加入到这样的油或者脂肪中,该酶能够水解和/或解聚在油中含有的非甘油酯化合物,例如EP申请号:82870032.8所述。本发明用于水解和/或解聚在油中含有的非甘油酯化合物的示例性方法为:
1)在油和脂肪中,加入之前溶解于少量合适溶剂(例如,水)中的本发明的酶或者酶复合物,并混合。大量的溶剂是可能的,但是选择对该酶无毒性的和适合的溶剂。这一加入可以在逐次加载的工艺中进行,也可以在连续的工艺中进行。按照该工艺,加入到油和脂肪中所必需的酶量的范围可以依赖于酶以及待处理的产物,范围从约5到400ppm,或约约20到400ppm;例如,对于1000kg的油或者脂肪0.005kg至0.4kg的酶,并且优选地5到100ppm,即,对于1000kg的油从0.005kg到0.1kg的酶,这些值应该理解为对于浓缩的酶而言,即没有稀释剂或者溶剂。
2)使油或者脂肪通过固体或者半固体支持物上的本发明酶组成的固定的或者不溶性过滤床,支持物优选呈现多孔的或者纤维性结构。在这一技术中,酶被捕获于支持物的多孔或者纤维结构的微孔中。这些由例如,树脂或合成的多聚物,纤维素碳酸盐,凝胶如琼脂糖,具有多孔结构的多聚物或共聚物的丝构成,从而将处于溶液中的酶的小液滴捕获在它们的微孔中。关于酶的浓度,有可能达到支持物的饱和水平。
3)以微小的液滴形式,将油和脂肪分散在稀释的酶溶液中,在可选择的方面,含有约0.05到4%,或含有约0.2到4%体积的本发明的酶。这一技术描述在例如比利时专利595,219中。具有圆锥形的盖子的几米高的圆柱形柱子充满了稀释的酶溶液。对于这一目的,选择在待处理的油或者脂肪中无毒和不可溶混的溶剂,优 选水。柱子的底部装配了分配系统,在其中,油或者脂肪以极端分割的形式(每m2大约10,000流量)连续注入。这样形成无数的油或者脂肪的液滴,液滴在酶溶液中缓慢地升高并且碰到表面,从而在反应器的圆锥形盖子的顶部被连续排出。
棕榈油可以在用本发明酶处理前进行预处理。例如,将大约30kg的未处理的棕榈油加热到+50℃。在蒸馏水中制备具有纤维素酶和果胶酶的1%溶液。在强烈搅拌几分钟下,将这些中的每一个以600g加入到油的水相溶液中。然后,在中度搅拌的条件下,将油保持在+50℃,总反应时间是两个小时。然后,将温度升高到+90℃,以使酶失活,并制备用于过滤和进一步处理的混合物。将油在真空中干燥,并使用过滤助剂进行过滤。
本发明的酶可以用在如EP专利EP 0 513 709 B2所述的工艺中。例如,本发明提供了通过使用本发明的磷脂酶的酶促分解作用,减少动物和植物油中的含磷成分的含量的工艺。在可选择的方面,将磷含量为约50至1500ppm,或约50至250ppm的预先除去粘液的动物和植物油与有机羧酸混合搅拌,并将所得到的混合物的pH值设定为约pH 4至pH 6,将含有本发明的磷脂酶A1、A2或者B的酶溶液被加入到该混合物中,在混合容器中,通过强力搅拌,形成微小的液滴,在其中,形成相对于油的重量百分比为0.5到5%的乳状液,所述的乳化作用的进行通过至少一个后续的反应容器,在涡旋运动下,在反应时间为从0.1到10个小时下,在温度的范围为20℃到80℃下进行,当从含水溶液中分离后,处理的油具有的磷含量在5ppm以下。
有机精炼工艺可以用于粗制油和脱胶油。该工艺在控制的工艺条件下,应用在线方式加入有机酸,并与传统的离心分离相结合。从植物油磷脂(“VOP”)自然分离的水被再循环,并再次使用。有机精炼工艺的结果为,总的水用量可以大大降低。
本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利6,162,623中所述。在这一示例性的方法中,本发明提供了两亲性的酶。该酶可以固定化,如,通过制备含有连续疏水相以及含有酶以及酶载剂的分散水相的乳状液,并且从分散相中去除水,直到该相变成固体酶包被的颗粒。该酶可以是脂酶。固定的脂酶可以用于由脂酶催化的反应,如甘油一酯、甘油二酯或者甘油三酯的分子内酯化作用,或者当脂酶是磷脂酶时,从甘油三酯油去除磷脂。水相可以含有发酵液,可食用的甘油三酯油可以是疏水相,载剂包括糖类、淀粉、葡聚糖、水溶性纤维素衍生物和发酵残余物。这一示例性的方法可以用于处理甘油三酯、甘油二酯、甘油单酯、甘油、磷脂、糖脂或脂肪酸,它们可以存在于疏水相中。在一方面,用于去除甘油三酯油中的磷脂的工艺包括,混合含有磷脂的甘油三酯油与含有本发明磷脂酶的制备物;将磷脂水解为溶血磷脂;从油中分离水解的磷脂,其中磷脂酶是固定化的磷脂酶。
本发明的磷脂酶和方法也可以应用于用酶法处理食用油,如在美国专利号6,127,137中所述。这一示例性方法水解完整磷脂的两个脂酰基团。用于该示例性方法的本发明的磷脂酶没有脂酶活性,并且其在很低的pH下具有活性。这些特征使其非常适于油脱胶,这是因为油的酶法和碱法水解(皂化作用)可能均受到抑制。在一方面,本发明提供水解磷脂或者溶血磷脂中的脂酰基团的工艺,包括用磷脂酶处理磷脂或者溶血磷脂,所述磷脂酶水解磷脂中的两个脂酰基团并且基本上无脂酶活性的。一方面,本发明的磷脂酶的最佳作用温度为约50℃,测定的条件是在pH 3到pH 4下进行10分钟,并且最佳pH为大约pH 3,测定的条件是在40℃下进行10分钟。一方面,磷脂或者溶血磷脂包括卵磷脂,或者溶血卵磷脂。一方面,在大部分的磷脂水解后,从油中分离含有水解的磷脂的水相。一方面,本发明提供了工艺,用于从食用油中去除磷脂,包括用本发明磷脂酶的水溶液的分散体,在pH 1.5至pH 3下处理油,并从油中分离含有水解的磷脂的水相。一方面,在用磷脂酶处理前,处理油以除去粘质。一方面,在用磷脂酶处理前,该油含有磷脂,其量相当于50到250ppm的磷。一方面,在存在0.5到5%的水的条件下,在30℃到45℃,用磷脂酶处理1到12个小时,磷脂酶的剂量为0.1到10mg/l。
本发明的磷脂酶和方法也可以用于用酶解处理食用油,如在美国专利号6,025,171中所述。在这一示例性的方法中,本发明的酶是固定化的,通过制备含有连续疏水相的乳状液,如甘油三酯油,和含有两亲性酶的分散水相,如本发明的脂酶或者磷脂酶,和在水相中部分溶解和部分不溶解的载剂物质,并且从水相中去除水,一直到该相变为固体酶包被的载剂颗粒。因为水相已经用水溶性物质饱和了,载剂物质的非溶解部分可以是在水和油中不溶的物质,或者一种以未溶解形式存在的水溶性物质。水相可以用含有发酵残留物和生物物质的粗制脂酶发酵液形成,它们可以作为载剂物质。固定的脂酶可以用于油中的酯重排和脱酸化。反应后,固定的酶可以通过加入水再生,用于以后的反应,并且得到载剂的部分溶解,且所形成的含有酶和载剂的水相分散到疏水相中,通过该疏水相蒸发除水,又一次形成酶包被的载剂颗粒。
本发明的磷脂酶和方法也可以用酶解处理食用油,如在美国专利号6,143,545中所述。该示例性方法应用本发明的磷脂酶来降低在食用油中含磷组分的含量,该食用油中包括高含量的非水合磷。一方面,该方法用于降低食用油中的含磷组分的含量,油中含有非水合磷的含量为至少50ppm,通过预处理食用油,在60℃测定,通过加入含有柠檬酸单水合物的水溶液(加入的水对油为4.8%w/w;在水相中的(柠檬酸)=106mM,在水/油乳剂中的=4.6mM)维持30分钟;转移10ml的在油乳状液中的预处理水至试管中;在沸水浴中加热乳状液30分钟;在5000rpm离心10分钟,转移大约8ml的上层(油)相至新的试管中,并且放置24小时;从上清相中取2克,用于测定在食用油中的非水合磷的含量(ppm)。该方法也可以包括在从大约pH 5到8的pH条件下,让油接触本发明的磷脂酶A 或者B的水溶液(如,PLA1、PLA2或PLB),该溶液在油中进行乳化,直到油的含磷量下降到小于11ppm,然后从处理的油中分离含水相。
本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利5,532,163中所述。本发明提供精炼油和脂肪的工艺,通过该工艺,待处理的油和脂肪中的磷脂可以被有效地分解和去除。一方面,本发明提供精炼油和脂肪的工艺,包括,在乳状液中,使油和脂肪与本发明的酶反应,例如,与具有分解甘油磷脂中甘油-脂肪酸酯键的活性的酶(如,本发明的PLA2)反应;也提供了另一个工艺,其中用酶处理的油和脂肪用水或者酸性水溶液洗涤。一方面,用于洗涤步骤的酸性水溶液是至少一种酸的溶液,如,柠檬酸、乙酸、磷酸以及它们的盐。一方面,乳化条件为每100重量份数的油和脂肪应用30重量份数或者更多的水。因为油和脂肪可以不用传统的碱法精炼步骤来纯化,所以可以减少洗涤废水和工业废物的产生。此外,由于归因于它们被包括在这些废物中所致的天然油和脂肪的损失并不在本发明的工艺中发生,所以油的回收产量增加。一方面,本发明提供了用于精炼含有大约100到10,000ppm的磷脂的油和脂肪的工艺,包括:在乳化的条件下,将所述的油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸酯键活性的本发明的酶进行反应。一方面,本发明提供了用于精炼含有大约100到10,000ppm的磷脂的油和脂肪的工艺,包括:在乳化的条件下,将所述的油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸酯键活性的本发明的酶反应;并且随后用洗涤水清洗处理的油和脂肪。
本发明的磷脂酶和方法也可以用于酶法处理食用油,例如,在美国专利号5,264,367中所述。可食用植物油或动物油,如油,例如大豆油——其已经通过湿法精炼去除了粘质——的含磷成分的含量以及铁含量,通过下述方法降低:通过将所述油与本发明的酶,如磷脂酶A1、A2或者B的水溶液接触,进行酶促降解,然后从处理的油中分离水相。一方面,本发明提供了酶促方法,用于降低油中的含磷组分以及含铁组分的含量,该油已经进行了精炼,去除了粘质。已经进行精炼去除了粘质的油,可以用本发明的酶处理,如用磷脂酶C、A1、A2或者B处理。可以实现低于5ppm的磷含量,低于1ppm的铁含量。低的铁含量可以有助于油的稳定性。
本发明的磷脂酶和方法也可以用于制备酯交换的油,如在美国专利中5,288,619所描述的。本发明提供了酶促酯交换的方法,用于制备具有低的反式酸(tran-acid)和低中间物链脂肪酸(low intermediate chain fatty acid)含量的人造黄油。该方法包括以下步骤:提供含有硬脂酸来源材料和可食用的液体植物油的酯交换反应混合物;应用1-,3-位置特异性脂酶对硬脂酸来源材料和植物油进行酯交换;然后,最后氢化脂肪酸混合物,来提供再循环的硬脂酸来源材料,用于与植物油进行再循环反应。本发明也提供了制备酯交换油的逆流方法(counter-currentmethod)。该方法包括下述步骤:提供含有1-,3-位置特异性脂酶的酯交换反应区域; 将植物油引入酯交换区域;引入硬脂酸来源物质;传输超临界气体或者亚临界液化气体逆流流体;在反应区域中进行甘油三酯流与硬脂酸或者硬脂酸单酯流的酯交换反应;撤掉酯交换的甘油三酯人造黄油流;撤掉逆流流体相;对酯交换的硬脂酸或者硬脂酸单酯进行氢化作用,来提供氢化的再循环硬脂酸来源物质;并将氢化的再循环硬脂酸源物质引入到反应区域。
一方面,高度不饱和的磷脂化合物可以通过适当地应用本发明的磷脂酶C,以去除sn-3位置的磷酸基团,随后进行1,3脂酶酰基酯的合成,而转变为甘油三酯。2-取代的磷脂可以直接用作功能性食物成分,或者随后可以应用本发明的固定化的磷脂酶C,选择性地在反应器160中进行水解,以便产生1-甘油二酯,随后进行在此描述的酶促酯化反应,来产生具有2-取代的多不饱和脂肪酸组分的甘油三酯产物。
本发明的磷脂酶和方法也可以用于植物油酶促脱胶过程,如在美国专利6,001,640中所描述的。该发明方法包括,在食用油的生产中的脱胶步骤。来自植物油的可水合磷脂通过之前的水相脱胶过程已经被去除,用本发明的磷脂酶进行酶促处理使植物油不含有非水合磷脂。该工艺可以是温和的、经济的并且对环境无不良影响。仅仅水解溶血卵磷脂而不水解卵磷脂的磷脂酶用于该脱胶过程。
一方面,为了使得本发明的酶能起作用,两相,含有酶的油相和水相,必须充分混合。仅仅搅拌它们可能是不够的。如果其溶解于少量的水中,如0.5-5%重量百分比(相对于油),并且以这一形式在油中进行乳化,从而形成直径少于10微米的液滴(重均),则有助于酶在油中很好地分散开。液滴可以小于1微米。可以以径向速率超过100cm/秒进行剧烈的搅拌。应用外部旋转泵,油也可以在反应器中循环。含有酶的水相也可以通过超声作用充分分散。可以应用分散仪器。
酶反应可能发生在油相和水相之间的边界面上。所有这些混合措施的目标在于,为含有酶的水相产生最大可能的表面积。表面活性剂的加入增加了水相的微分散。所以,在一些情况下,将HLB值高于9的表面活性剂,如十二烷基硫酸钠加入到酶溶液中,如在EP-A 0 513 709中所描述的。增加乳化作用的类似有效的方法是加入溶血卵磷脂。加入量的范围相对于油在0.001%到1%之间,相对于油而言。酶处理期间的温度不是至关重要的。可以应用的温度在20℃到80℃之间,但是后者只能应用很短的时间。在该方面,应用具有良好的温度和/或低pH值耐受性的本发明磷脂酶。最佳的应用温度在30℃到50℃之间。处理的时间取决于温度,并且在增高温度时,处理时间可以变短。时间从0.1到10小时,或者从1到5小时一般就足够了。反应发生在脱胶反应器中,其可以划分为几个阶段,如在DE-A 43 39 556中所描述的。因此,可以进行连续操作,也可以进行间歇性操作。反应可以在不同的温度阶段中进行。例如,温育可以在40℃下进行3小时,然后在60℃下进行1小时。如果反应阶段式进行,也可能在各个阶段调节不同的pH值。例如,在第一阶段,溶液pH值可以调节到7,例如,通过加入柠檬酸溶液, 在第二阶段,将pH值调节到2.5。然而,在至少一个阶段,酶溶液的pH值必须低于4或者低于3。如果pH值被后续调节到低于这一水平,可能会损害效果。因此,柠檬酸可以在酶被混合到油中之前被加入至酶溶液中。
在酶处理完成以后,酶溶液以及包含在酶溶液中的NHP的分解产物,可以例如通过离心的方式,从油相中分批或连续地分离出来。由于酶具有高水平的稳定性,并且包含在溶液中的分解产物的量较少(它们可能沉淀为污泥),同一含水酶相可以重复应用几次。也有可能从污泥中释放出酶,参见,如,DE-A 43 39556,因此基本上没有污泥的酶溶液可以被再次使用。在这一脱胶工艺的一个方面中,得到含有少于15ppm磷的油。一个目标是磷含量少于10ppm;或者少于5ppm。在磷含量低于10ppm的情况下,按照蒸馏脱酸工艺进一步处理油是十分可能的。许多其它的离子,如镁、钙、锌以及铁,可以从油中去除,如低于0.1ppm。这样,该产品为在进一步的处理和储存中具有好的耐氧化性具有理想的前提条件。
本发明的磷脂酶和方法也可以用于降低植物油和动物油中含磷组分的量,如在EP专利的EP 05 13709中所述。在这一方法中,之前已经经过了脱泥处理的植物和动物油例如大豆油中的含磷组分尤其是磷脂如卵磷脂的含量,以及铁的含量,通过应用本发明的磷脂酶A1、A2或者B的酶促降解作用而被降低。
本发明的磷脂酶和方法也可以用于精炼脂肪或者油,如在JP 06306386所述。本发明提供了用于精炼脂肪或者油的工艺,该工艺包括将在脂肪或者油中的磷脂转化成水溶性的含磷基团物质的步骤,并且除去该物质的步骤。本发明酶(如,PLC)的作用被用于将磷脂转化成这种物质。因此,有可能在无需进行碱炼步骤的情况下,精炼脂肪或者油,碱炼步骤产生含有碱性废水和大量油的工业废物。由于中性脂肪或者油逃逸到废物中的损失可以降低到零,所以可以实现产量的增加。在一方面,胶状物质被转化成水溶性物质,通过加入本发明的具有磷脂酶C活性的酶,作为水溶性物质而被去除,这在粗制油的脱胶过程和进行酶处理的阶段中进行。一方面,本发明的磷脂酶C具有切割存在于磷脂中的甘油和磷酸的酯键的活性。如果需要,该方法可以包括用水或者酸性水溶液洗涤经过酶处理的油。一方面,加入本发明的酶,并且与粗制油反应。所用的磷脂酶C的量可以是每公斤粗制油,10到10,000单位,或大约100到2,000单位。
本发明的磷脂酶和方法也可以用于水脱胶过程,如,在Dijstra,Albert J.,et al.,Oleagineux,Corps Gras,Lipides(1998),5(5),367-370中。在该示例性的方法中,水脱胶过程被用于产生卵磷脂,并且用于使用脱胶酸和漂白土的干法脱胶过程。这一方法可能仅仅对于低磷脂含量的油是经济可行的,如,棕榈油、月桂油等。对于具有高NHP含量的种子油,应用酸精炼过程,其中该过程在榨油机中进行,以便允许经由粗粉(meal)的胶清除。一方面,该酸精炼油是在物理精炼之前进行的一个可能的“精炼(polishing)”操作。
本发明的磷脂酶和方法也可以用于脱胶过程,如在Dijkstra,et al.,Res.Dev.Dep.,N.V.Vandemoortele Coord.Cent.,Izegem,Belg.JAOCS,J.Am.Oil Chem.Soc.(1989),66:1002-1009中所述。在该示例性的方法中,总的脱胶过程包括将酸,如磷酸或者柠檬酸分散至大豆油中,允许接触一定的时间,随后将碱,如苛性钠或者硅酸钠混合到油包酸(acid-in-oil)乳状液中。这可以将中和度低保持在足够低的水平,以避免形成肥皂,这是因为那会导致油损失的增加。随后,油通过离心分离器,在这种情况下,大多数胶状物从油流中去除,产生具有最少油含量的胶相(gumphase)。油流随后通过第二离心分离器中,以去除所有残留的胶,得到稀释的胶相,其进行再循环。洗涤和干燥或者在线碱法精炼完成该工艺。在采用全部的脱胶工艺以后,与经典的碱法精炼工艺相比,实现了总产量增加大约0.5%。完全脱胶的油然后可以进行碱精炼,漂白和脱臭,或者被漂白和物理精炼。
本发明的磷脂酶和方法也可以用于去除植物油如大豆油中的不可水合磷脂,如在Hvolby,et al.,Sojakagefabr.,Copenhagen,Den.,J.Amer.Oil Chem.Soc.(1971)48:503-509中所描述。在这一示例性的方法中,水脱胶的油,在不同的固定pH值下,与含有和不含有Ca++、Mg/Ca结合试剂的缓冲液,以及表面活性剂混合。不可水合的磷脂可以作为微胶粒或者混合乳化剂组分在未转化的状态下去除。更进一步地,不可水合磷脂可以通过转化为解离形式而去除,例如通过从磷脂中去除Mg和Ca,该过程可以通过酸化或者通过用Mg/Ca络合或者Mg/Ca沉淀试剂处理来完成。不可水合磷脂的去除或者化学转化可能导致乳状液形成减少,和来自乳状液层和皂脚中的脱酸化油的分离有所改善。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Buchold,et al.,Frankfurt/Main,Germany.Fett Wissenschaft Technologie(1993),95(8),300-304中所述。在本发明的用于食用植物油脱胶的这一示例性工艺中,用本发明酶如,磷脂酶A2的水悬浮液,来水解结合在磷脂sn2位上的脂肪酸,得到不溶于油的1-酰基-溶血磷脂,并且因此更适用于物理分离。甚至加入少量的相当于大约700lecitase单位/公斤油,得到的残留磷浓度少于10ppm,这样化学精炼是可以用物理精炼替代的,省略了中和、皂脚破裂和废水处理的必要。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如EnzyMax.Dahlke,Klaus.Dept.G-PDO,Lurgi O1-Gas,Chemie,GmbH,Frankfurt,Germany.Oleagineux,Corps Gras,Lipides(1997),4(1),55-57中所述。该示例性过程是一个用于物理精炼几乎任何种类油的脱胶过程。通过酶催化的水解,磷脂转化为水溶性的溶血磷脂,其可以通过离心从油中分离得到。在酶法脱胶的油中,残留的磷含量可以低至2ppm P。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Cleenewerck,et al.,N.V.Vamo Mills,Izegem,Belg.Fett Wissenschaft Technologie(1992),94:3 17-22,和Clausen,Kim;Nielsen,Munk.Novozymes A/S,Den.Dansk Kemi(2002)83(2):24-27 所述。本发明的磷脂酶和方法可以整合酸对植物油进行的预精炼工艺,如在下述文献中所述:Nilsson-Johansson,et al.,Fats Oils Div.,Alfa-Laval Food Eng.AB,Tumba,Swed.Fett Wissenschaft Technologie(1988),90(11),447-51;以及,Munch,Ernst W.Cereol Deutschland GmbH,Mannheim,Germany.Editor(s):Wilson,RichardF.Proceedings of the World Conference on Oilseed Processing Utilization,Cancun,Mexico,Nov.12-17,2000(2001),Meeting Date2000,17-20。
本发明的磷脂酶和方法也可以用于植物油中的脱胶,如在Jerzewska,et al.,Inst.Przemyslu Miesnego i Tluszczowego,Warsaw,Pol.,Tluszcze Jadalne(2001),36(3/4),97-110中所述。在本发明的这一工艺中,通过应用本发明的磷脂酶A2对水合的低-芥酸油菜籽油进行酶法脱胶。该酶可以催化磷脂中甘油部分的中心碳原子连接的脂肪酸酯键的水解。它也可以水解不可水合的磷脂为它们相对应的可水合的溶血化合物。对于非纯化的酶制备物,加入2%的制备物4小时,可以得到更好的结果(87%P去除率)。
在本发明的油脱胶(或使用本发明酶的油脱胶工艺)的另一示例性工艺中,加入酸性聚合物,例如藻酸盐或果胶。在本发明的该油脱胶工艺中,将酸性聚合物(例如藻酸或果胶或更加可溶性的盐形式)加入到含有少量水(例如在约0.5至5%范围内)的粗油中。在该方面中,通过结合粗油中的钙和/或镁,酸性聚合物可以减少和/或分裂磷脂-金属络合物,从而提高不可水合的磷脂的溶解性。在可选择的方面,这些磷脂将移动到油/水介面或进入水相,并且转化为二酰甘油和相应的侧链,或者完整的磷脂将作为重相的组分被随后的离心除去。在水相中酸性聚合物的存在也可以增加水相的密度,并提高从油(轻)相分离重相的效果。
本发明的油脱胶(或使用本发明酶的油脱胶工艺)的一个示例性工艺改变脱臭程序,以获得二酰甘油(DAG)组分。在可选择的方面,如果必要或需要,在酶助脱胶之后,可以修改脱臭条件(温度、压力、蒸馏设备的构造),以达到提高游离脂肪酸(FFA)从二酰甘油/三酰甘油组分分离的结果,或进一步修饰以从三酰甘油组分分离出二酰甘油。这些修饰的结果是,使用本发明的方法,有可能获得更好级别的FFA和二酰甘油,如果本发明的酶(例如磷脂酶,或PLC或PLC和磷酸酶的组合)被用于在物理精炼工艺中对食用油脱胶的话。
在各个方面,实施在此描述的本发明方法(或使用本发明的酶),具有许多优点诸如:减少或消除溶剂和溶剂回收步骤;降低资金成本;减少下游精炼成本;减少化学品使用,设备,工艺时间,能源(热能)和水使用/废水产生;产生更高质量的油;在一些烹饪和煎炒应用中可以使用无需精炼的压榨机压出的油(该压出的油可以具有优异的稳定性,色泽和气味特征和高维生素E含量);产生更高质量的膳食;产生更低脂肪含量的膳食(目前,出自机械压榨的膳食引起反刍动物的消化问题);产生提高的营养特性——降低水平的芥子油苷、鞣酸、芥子碱、植酸(如 在Technology and Solvents for Extracting Oilseeds and Nonpetroleum Oils,AOCS1997中所述)。
在一个方面,本发明提供了精炼植物油(例如大豆油、玉米油、棉籽油、棕榈油、花生油、油菜籽油、红花油、向日葵油、芝麻籽油、米糠油、椰子油或油菜油)和它们的副产物的工艺,和对卵磷脂脱臭的工艺,例如在美国专利6,172,248或6,172,247中所述,其中的方法包括使用至少一种本发明的酶,例如本发明的磷脂酶C。因此,本发明提供了包含至少一种本发明的酶的卵磷脂和植物油。在示例性有机酸精炼工艺中,将植物油与稀释的含水有机酸溶液组合,并进行高度剪切,以将酸溶液充分分散在油中。将所得的酸和油混合物在低剪切下混合一段足够的时间,以将污染物整合到水合的杂质相中,从而产生纯化的植物油相。在该示例性工艺中,可以使用混合器或循环系统(例如循环水桶)和/或磷脂或卵磷脂储存桶,如在美国专利4,240,972、4,049,686、6,172,247或6,172,248中所述。这些工艺可以作为间歇或连续工艺操作。粗或脱胶的植物油可以由储存桶供应(例如通过泵)并可以加热。待纯化的植物油可以是粗的或“脱胶的”油。
在一个方面,本发明的磷脂酰肌醇-PLC(PI-PLC)酶用于植物油脱胶。本发明的PI-PLC酶可以单独使用,或与其他的酶(例如,本发明的PLC、PLD、磷酸酶)组合使用,以提高植物油(包括大豆油、油菜油和向日葵油)脱胶期间的油产量。PI-PLC可以优选地将磷脂酰肌醇转化为1,2-二酰甘油(DAG)和磷酸肌醇(phosphoinositol),但是它也可以对其他磷脂表现出活性,包括磷脂酰胆碱、磷脂酰乙醇胺、磷酯酰丝氨酸或磷脂酸或其组合。对植物油进行酶处理导致捕获在较小的胶组分中的油的数量减少,这增加了酶处理的植物油中的DAG的数量并增加了中性油,从而实现产量增加。
含油种子的酶法加工
本发明提供了酶法加工含油种子,包括大豆、油菜、椰子、鳄梨和橄榄糊的组合物(例如酶)和方法。在一个方面,本发明的这些工艺可以增加油产量,并提高获得的膳食的营养质量。在一些方面,使用本发明的酶和方法来酶法加工含油种子,将具有经济和环境利益,并为油萃取和加工人类和动物食物提供了可供选择的技术。在可选择的方面,本发明的工艺包括使用本发明的磷脂酶、其他磷脂酶、蛋白酶、磷酸酶、植酸酶、木聚糖酶、淀粉酶(例如α-淀粉酶)、葡聚糖酶(例如β-葡聚糖酶)、聚半乳糖醛酸酶、半乳糖脂酶、纤维素酶、半纤维素酶、果胶酶和其他降解植物细胞壁的酶、以及混合酶制剂和细胞裂解剂。
在可选择的方面,本发明的工艺可以与其他工艺联合实施,例如酶处理,例如用碳水化合物酶处理,包括纤维素酶、半纤维素酶和其他副降解活性,或与化学工艺联合,例如己烷提取大豆油工艺。当在溶剂萃取之前进行酶法处理时,酶法处理可以增加油萃取率达8-10%。
在可选择的方面,本发明的工艺可以用水萃取工艺实施。水萃取方法对于油萃取来说可能是环境上更清洁的可选择的技术。水工艺的低萃取产量可以通过使用这样的酶克服,即该酶水解形成含油种子细胞壁的结构多糖,或水解形成细胞和类脂体膜的蛋白质,例如,利用包括纤维素酶、半纤维素酶和/或原果胶酶在内的酶进行消化,用于从大豆细胞提取油。在一个方面,根据Kasai(2003)J.Agric.Food Chem.51:6217-6222的描述,用本发明的酶实施本方法,该文献报道了消化细胞壁最有效的酶是纤维素酶。
在一个方面,蛋白酶与本发明的方法一起使用。已经评价了蛋白酶和纤维素酶对油和蛋白质提取产量的操作变量和酶活性以及其他工艺参数,诸如酶浓度、水解时间、颗粒大小和固液比的联合效应。在一个方面,根据Rosenthal(2001)Enzyme and Microb.Tech.28:499-509的描述,用本发明的酶实施本方法,该文献报道了使用蛋白酶能比使用热处理面粉时的对照产生明显较高的油和蛋白质产量。
在一个方面,全蛋白、果胶和半纤维素提取与本发明方法一起使用。植物细胞由一系列的多糖组成,其常常与蛋白质和酚类化合物缔合或被蛋白质和酚类化合物替代。这些碳水化合物中的大部分只是被消化酶部分消化或低效利用。通过加工或降解性酶处理来破裂这些结构,可以提高它们的营养可利用率。在一个方面,根据Ouhida(2002)J.Agric.Food Chem.50:1933-1938的描述,用本发明的酶实施本方法,该文献报道了全蛋白、果胶和半纤维素提取之后大大降解了大豆细胞壁纤维素(高达20%)。
在一个方面,本发明的方法进一步包括在处理种子例如油菜籽中结合各种酶处理,这些处理包括使用蛋白酶、纤维素酶和半纤维素酶(相互之间和与本发明的一种或多种酶的各种联合)。例如,所述方法可以包括在传统工艺之前,在用酶温育期间,在20至40水份中酶法处理油菜种子,如Sosulski(1990)Proc.Can.Inst.Food Sci.Technol.3:656所述。本发明的方法可以进一步结合蛋白酶、α-淀粉酶、聚半乳糖醛酸酶(相互之间和与本发明的一种或多种酶的各种联合),以水解椰子粉中的细胞物质和释放椰子油,该椰子油可以通过离心回收,如McGlone(1986)J.ofFood Sci.51:695-697所述。本发明的方法可以进一步以不同的组合方式结合果胶酶、α-淀粉酶、蛋白酶、纤维素酶(相互之间和与本发明的一种或多种酶的各种联合),以在酶法提取鳄梨油期间明显提高产量(在最好的情况下~70%),如Buenrostro(1986)Biotech.Letters 8(7):505-506所述。在本发明的橄榄油提取工艺中,用纤维素酶、半纤维素酶、聚半乳糖醛酸酶、果胶-转甲基酶、蛋白酶和它们的组合(相互之间和与本发明的一种或多种酶的组合)处理橄榄糊,如,例如Montedoro(1976)Acta Vitamin.Enzymol.(Milano)30:13所述。
从植物油中纯化植物固醇
本发明提供了方法,用于从植物油中纯化植物固醇和三萜,或者植物甾醇。应用本发明的磷脂酶和方法可以纯化的植物固醇,包括β-谷固醇、菜油甾醇(campesterol)、豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、24-脱氢胆甾醇、chalinasterol、多孔甾醇、穿贝海绵甾醇(clionasterol)和菜子甾醇(brassicasterol)。植物固醇是用于健康和营养工业的重要农产品。因此,本发明的磷脂酶和方法可用于制备用于化妆品制造的乳化剂以及用于生产激素药物的甾体中间物和前体。本发明的磷脂酶和方法用于制备(如,纯化)植物固醇和它们的酯的类似物,用作具有心血管健康价值的降低胆固醇的试剂。本发明的磷脂酶和方法用于纯化植物甾醇,植物甾醇通过抑制在消化道中的胆固醇吸收,来降低血清中的胆固醇水平。本发明的磷脂酶和方法用于纯化具有在极低的浓度下具有免疫调节特征的植物甾醇,包括增强的T淋巴细胞的细胞应答和天然杀伤细胞对癌细胞系的细胞毒性活性。本发明的磷脂酶和方法用于纯化植物甾醇,用于治疗肺结核、类风湿性关节炎、HIV感染病人的处理和免疫应力的抑制,例如,在马拉松选手中。
本发明的磷脂酶和方法用于纯化存在于日用植物油(如,椰子、油菜、可可豆脂油、玉米、棉籽、亚麻、橄榄、棕榈、花生、米糠、红花、芝麻、大豆、向日葵油)的甾醇部分中的甾醇成分,如,谷固醇(40.2-92.3%)、菜油甾醇(2.6-38.6%)、豆甾醇(0-31%)和5-燕麦固醇(1.5-29%)。
本发明的方法可以结合油籽中植物来源固醇的分离,该分离通过下述方法完成:用氯仿-甲醇、己烷、二氯甲烷或者丙酮进行抽提,然后进行皂化作用和层析法纯化,以获得富集的总甾醇。可选择地,植物样品可以通过应用超临界二氧化碳的超临界流体提取,以得到总脂类提取物,从中可以富集和分离甾醇。对于甾醇化合物的随后表征和定量,粗分离物可以通过很多不同的色谱技术纯化和分离,包括柱层析(CC)、气相色谱、薄层色谱(TLC)、正相高效液相色谱(HPLC)、反相高效液相色谱和毛细管电色谱。在所有的色谱分离和分离技术中,对于样品清理、纯化、定性分析和测试样品中固醇的初步估计而言,CC和TCL程序的应用是最容易进行的,成本上承受得起的并且是适当的。
在可食用油的精炼过程中,植物油中的植物固醇作为副产物而丧失。本发明的磷脂酶和方法应用从这样的副产物中分离的植物固醇,来制备从这样的副产物中分离得到的富集植物固醇的产物。本发明的植物固醇分离和纯化方法可以合并油处理工艺中的工业副产物,并且可以包括如分子蒸馏、液-液提取和结晶的操作。
本发明的方法可以结合液体抽提来提取植物固醇的工艺。例如,本发明的方法可以应用非极性溶剂如己烷(一般用于提取大部分种类的植物油),定量地提取游离的植物固醇和植物固酰脂肪酸酯。固醇糖苷和脂肪酰化固醇糖苷仅仅被己烷部分提取,增强的溶剂极性产生更高百分比的抽提率。可以应用的一个程序是Bligh和Dyer的氯仿-甲醇方法,用于提取所有的固醇脂类,包括磷脂。一个定 性分离和定量分析的植物固醇脂类的示例性方法包括将脂类提取物注入HPLC系统。
本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如在美国专利号6,303,803中所描述的。这是降低含有固醇的脂肪和油中的固醇含量的方法。其是基于胆固醇和其它甾醇对于形成疏水流体双层如磷脂双层的两性分子的亲和性,是一个高效和具有成本效率的过程。磷脂的聚集体与,例如含有甾醇的脂肪或者油在含水环境下接触,随后进行混合。聚集的磷脂混合物的分子结构对胆固醇和其它甾醇具有高亲和性,可以从脂肪和油中选择性地去除这样的分子。水相分离混合物被混合足够长的时间,以便通过分配甾醇到磷脂聚集体部分中,从而选择性地降低脂肪/油产物中的甾醇含量。甾醇含量降低的脂肪或者油被从水相分离混合物中分离。可选择地,相应的富集甾醇的组分也可以被从水相分离混合物中分离。这些步骤可以在环境温度下进行,涉及加热的成本被最小化,同样地,产物因为热而降解的可能性也被最小化。另外,需要最少量的设备,并且因为所有需要的材料都是食品级的,该方法不需要在操作、废物处理或者最终产物的污染方面有特别预防措施。
本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如,在美国专利号5,880,300所描述。将磷脂聚集体与,如含有甾醇的脂肪或者油在含水环境中接触,然后进行混合。在充分混合后,甾醇含量降低的脂肪或者油从含水分离混合物中分离出来。可选择地,相应的甾醇富集的磷脂也可以从含水分离混合物中分离。植物(如蔬菜)油含有植物甾醇(植物固醇),它们也可以应用本发明的方法去除。该方法可以用于商业处理循环的任何阶段的脂肪/油产品。例如,本发明的工艺可以用于精炼、漂白和脱臭的油(“RBD油”),或者在达到RBD状态之前的加工过程的任何阶段。与RBD之前的油(pre-RBD oil)相比,尽管RBD油可能具有改变的密度,本过程易于改变而适合于RBD也适合于RBD之前的油,或者适于各种其它的脂肪/油产品,这是是通过改变磷脂含量、磷脂组成、磷脂∶水的比例、温度、压力、混合条件和分离条件而进行的,如下所述。
可选择地,本发明的酶和方法可以用于在油加工的中间步骤中分离植物甾醇或者其它甾醇。例如,已知在植物油的脱臭中植物甾醇丧失。含有甾醇的蒸馏部分——例如来自处理的中间阶段,可以进行以上所述的甾醇抽提程序。这提供了富含甾醇的卵磷脂或者其它磷脂物质,其可以进一步处理以便回收抽提的甾醇。
去污剂组合物
本发明提供了包括一种或者多种本发明磷脂酶的去污剂组合物,和制备和使用这些组合物的方法。本发明并入了所有制备和使用去污剂组合物的方法,参见例如美国专利6,413,928;6,399,561;6,365,561;6,380,147。去污剂组合物可以是一个和两个部分的含水组合物、非含水液体组合物、铸塑固体、粒形形式、微 粒形式、压缩片剂、凝胶和/或膏状物以及浆状物形式。本发明也提供能够应用这些去污剂组合物快速去除各种食物污迹、食物残留物膜和其它微小的食物组合物的方法。本发明的磷脂酶可以通过磷脂的催化水解来帮助去除污染。本发明的磷脂酶可以用在洗盘去污剂和纺织品洗涤去污剂中。
实际的活性酶含量依赖于去污剂组合物的制造方法,并且并不是决定性的,只要去污剂溶液具有所需的酶促活性。一方面,存在于最终溶液中的磷脂酶的量的范围为,在每克去污剂组合物中,大约0.001mg到0.5mg。选择用于本发明的工艺和产品的特定酶,依赖于最终用途的条件,包括产品物理形式、应用pH、应用温度和待降解或者改变的污物类型。对于任何给定的一套应用条件,可以选择酶以提供最佳的活性和稳定性。在一个方面,本发明的多肽在大约4到大约12的pH范围,大约20℃到大约95℃的温度范围内有活性。本发明的去污剂可以包括阳离子、半极性非离子的或者兼性离子表面活性剂;或者其混合物。
本发明的磷脂酶可以配制成粉末去污剂和液体去污剂,其pH值在4.0到12.0之间,以重量百分比计算,含量水平为约0.01%到大约5%(优选地0.1%到0.5%)。这些去污剂组合物也可以包括其它的酶如已知的蛋白酶、纤维素酶、脂酶或内切糖苷酶,以及助洗剂和稳定剂。本发明磷脂酶的加入到传统的清洗组合物中,并不产生任何特定的应用限制。换句话说,只要pH在以上的范围内,温度低于所述酶的变性温度,适于去污剂的任何温度和pH也适于本组合物。此外,本发明的多肽可以用于不含去污剂的洗涤组合物中,此外,或者可以单独应用,或者可以与助洗剂和稳定剂组合应用。
本发明提供了包括去污剂的洗涤或消毒组合物,和/或用于洗涤和/或消毒硬表面的消毒组合物,适用于洗涤和/或消毒织品的去污剂组合物,洗盘组合物,口腔清洗组合物,牙齿清洗组合物,和/或隐形眼镜清洗溶液。
一方面,本发明提供了洗涤对象的方法,该方法包括在足以洗涤的条件下,使该对象与本发明的磷脂酶接触。可以包括本发明的磷脂酶,作为去污剂添加剂。本发明的去污剂组合物可以,例如,配制成包括本发明磷脂酶的手洗或机洗去污剂组合物。适用于对染色织物进行预处理的洗涤添加剂可以包括本发明的磷脂酶。织物柔软剂组合物可以包括本发明的磷脂酶。可选择地,本发明的磷脂酶可以被配制为去污剂组合物,用于一般家用硬表面的清洗操作。在可选择的方面,本发明的去污剂添加剂和去污剂组合物可以包括一种或者多种其它的酶,如蛋白酶、脂酶、角质酶、另一种磷脂酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,如乳糖酶和/或过氧化物酶。选择本发明酶的特性以与选定的去污剂相容(即,最适pH,与其它酶和非酶成分相容等等),并且所述酶以有效量存在。在一方面,本发明的磷脂酶用于从织物中去除恶臭物质。可以用于实践本发明的各种去污剂组合物和用于制备它们的方法描述在下述 专利中,例如美国专利6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。
废物处理
本发明的磷脂酶可以用于废物处理。一方面,本发明提供了应用本发明磷脂酶的固体废物消化过程。该方法可以包括减少基本上未处理的固体废物的量和体积。固体废物可以用酶消化过程处理,这是在酶溶液(包括本发明的磷脂酶)存在的条件下,在控制的温度下进行的。固体废物可以转化为液化废物和任何残留固体废物。所得到的液化废物可以与所述的任何残留固体废物分离。参见如美国专利5,709,796。
解毒
磷脂酶(例如本发明的PLCs、patatins)可以用于解毒方法,例如对内毒素,如包含脂多糖(LPS)的组合物进行解毒,并且,本发明提供了使用至少一种本发明酶的解毒方法,所述酶例如patatin,具有如SEQ ID NO:12(由SEQ ID NO:11编码)、SEQ ID NO:14(由SEQ ID NO:13编码)、SEQ ID NO:18(由SEQ ID NO:17编码)、SEQ ID NO:26(由SEQ ID NO:25编码)、SEQ ID NO:28(由SEQ ID NO:27编码)、SEQ ID NO:34(由SEQ ID NO:33编码)、SEQ ID NO:36(由SEQ ID NO:35编码)、SEQ ID NO:44(由SEQ ID NO:43编码)、SEQ ID NO:46(由SEQ ID NO:45编码)、SEQ ID NO:56(由SEQ ID NO:55编码)、SEQ ID NO:60(由SEQ ID NO:59编码)、SEQ ID NO:66(由SEQ ID NO:65编码)、SEQ ID NO:72(由SEQ ID NO:71编码)、SEQ ID NO:78(由SEQ ID NO:77编码)、SEQ ID NO:87(由SEQ ID NO:86编码)、SEQ ID NO:88(由SEQ ID NO:87编码)、SEQ ID NO:92(由SEQ ID NO:91编码)、SEQ ID NO:96(由SEQ ID NO:95编码)、SEQ ID NO:100(由SEQ ID NO:99编码)、SEQ ID NO:104(由SEQ ID NO:103编码)、SEQ ID NO:126(由SEQ ID NO:125编码)、SEQ ID NO:128(由SEQ ID NO:127编码)、SEQ ID NO:132(由SEQ ID NO:131编码)、SEQ ID NO:134(由by SEQ ID NO:133编码)、SEQ ID NO:136(由SEQ IDNO:135)或SEQ ID NO:138(由SEQ ID NO:137)阐述的序列。在一个方面,本发明的磷脂酶用于对脂多糖(LPS)解毒。在一个方面,该解毒作用是通过对来自类脂A的2′和/或3′脂肪酸链进行脱酰作用。在一个方面,本发明的磷脂酶(例如PLC、patatin)用于水解来自类脂例如类脂A(例如来自细菌内毒素)的2′-月桂酰和/或3′-肉豆蔻酰链。在一个方面,本发明的方法用于破坏内毒素,例如来自革兰氏阴性细菌,如来自大肠杆菌的毒素。在一个方面,本发明的磷脂酶(例如PLC、patatin)被用于改善毒素中毒(例如来自进行性革兰氏阴性感染)的效应,或预防性地防止感染(例如动物或人的感染)期间的内毒素效应。因此,本发明提供包含本发明的磷脂酶(例 如PLC、patatin)的药物组合物,和使用本发明的水解酶来改善或预防脂多糖(LPS)毒性作用的方法,例如在脓血症期间。
加工食物
本发明的磷脂酶可以用于加工食物,例如以改变它们的稳定性、贮存期、风味、质地,提高它们的营养价值和类似情况。例如,在一个方面,本发明的磷脂酶用于产生酸性磷脂,用于控制食物的苦味。
在一个方面,本发明提供了使用本发明的磷脂酶制备奶酪的工艺(因此,本发明也提供了包含本发明磷脂酶的奶酪)。在一个方面,本发明的酶(例如磷脂酶A、溶血磷脂酶或其组合)被用于加工奶酪,以增强风味、增加产量和/或“稳定”奶酪,例如通过降低“(去油(oil-off))”的趋势来进行,或在一个方面,本发明的酶用于从酪乳加工奶酪。本发明的这些工艺可以结合任何方法或方案,例如在美国专利6,551,635和6,399,121、WO 03/070013、WO 00/054601中所述。例如,在一个方面,本发明的磷脂酶被用于稳定乳或含乳组合物例如奶油中的脂肪乳状物,以及用于稳定乳制组合物,例如用于制备奶油或液体奶油。在一个方面,本发明提供了使用至少一种本发明酶来增强奶酪的风味的工艺,该工艺包括在含水介质中,在产生增强的奶酪风味的条件下(例如减少的苦味),温育蛋白、脂肪和蛋白酶和脂肪酶,如WO 99/66805所述。在一个方面,本发明的磷脂酶用于增强奶酪(例如凝乳)的风味,这通过在升高的温度,例如在约75℃至95℃之间,用水、蛋白酶和脂酶(本发明的酶)混合来进行,如在美国专利4,752,483中所述。在一个方面,本发明的磷脂酶用于通过在将凝结剂加入到牛奶之前将本发明的酶(例如脂酶或磷脂酶)加入到奶酪(例如酪乳)中,或在挤压之前将本发明的酶加入到含盐凝乳中来促进奶酪老化,如美国专利4,707,364中所述。在一个方面,本发明的脂酶用于降解牛奶脂肪中的甘油三酯来释放游离脂肪酸,从而增强风味。蛋白酶也可以用于本发明的这些工艺的任何工艺中,参见例如Brindisi(2001)J.of Food Sci.66:1100-1107。在另一个方面,酯酶、脂酶、磷脂酶和/或蛋白酶的组合可以用于本发明的这些工艺或任何工艺。
在一个方面,本发明的磷脂酶用于减少食物中例如油诸如具有高含量的不可水合磷组分的植物油中的磷组分含量,如WO 98/26057所述。
本发明的磷脂酶的其它用途
本发明的磷脂酶也可以用于研究磷酸肌醇(PI)信号系统;用于诊断、预后和双极性紊乱治疗的开发(参见如,Pandey(2002)Neuropsychopharmacology26:216-228);作为抗氧化剂;作为修饰的磷脂;作为发泡剂和胶凝剂;产生用于血管形成组织的血管生成性类脂;用于鉴定磷脂酶,如PLA、PLB、PLC、PLD和/或patatin调节剂(激动剂或者拮抗剂),如作为抑制剂而用作抗瘤剂、消炎剂 以及作为止痛剂。它们可以用于产生酸性磷脂,用于控制食品和药物中的苦味。它们可以用于脂肪纯化。它们可以用于鉴定用于治疗病毒性、炎症性、过敏性和心血管疾病的肽抑制剂。它们可以用于制备疫苗。它们可以用于制备多不饱和脂肪酸甘油酯和磷脂酰甘油。
本发明的磷脂酶,例如,PLA和PLC酶,用于产生免疫毒素和各种治疗剂,用于抗癌治疗。
本发明的磷脂酶可以与其它用于脱色(即,去除叶绿素)的酶和去污剂(参见以上)联合使用,如,与其它的酶(如,脂酶、蛋白酶、酯酶、磷酸酶)联合使用。例如,在应用PLC的任何场合中,都可以组合应用PLD和磷酸酶,以产生与PLC单独使用相同的结果。
下表概述了本发明的若干示例性工艺和制剂:
通过糖基化作用使酶的活性失活和调节酶的活性
本发明提供这样的方法,包括使用重组技术制备和表达具有生物活性的酶或其他蛋白,例如有害的或有毒的酶,(其中所述酶或其他蛋白正常情况下未糖基化)它们为无活性或活性较低但是可再活化的形式。该方法包括将一个或多个糖基化位点(例如N-连接的或O-连接的糖基化作用)加入到具有生物活性的酶或其他蛋白(例如本发明的酶)中,这是通过下述步骤进行的:对编码序列进行工程化以整合入新的糖基化位点(多个位点);在真核细胞或工程化的等同物中或在能够进行翻译后糖基化的体外系统中表达变体编码序列。例如,3个氨基酸的序列NXS/T是真核细胞中的糖基化位点,而原核细胞不是这样的。因此,本发明包括将至少一个三氨基酸序列NXS/T加入到蛋白中,以便它的活性因翻译后糖基化的缘故而减少或失活。
糖基化作用可以导致产生加入到N残基的2个N-乙酰葡萄糖胺(NGlucNac)分子。随后的加入可以生物种特异性的。在大部分的种中,甘露糖(Mann)然后被 加入到NGlucNa上,Mann残基的数目从10至100。唾液酸在一些物种中也可以被加入。在毕赤酵母中,在加入NglucNac之后,10至25个Mann残基可以被添加。
这些方法包括使用任何去糖基化酶或一组酶,它们中的许多酶可能已被鉴定和/或可以通过商业渠道获得。例如,内切糖苷酶H在最后一个NGlucNac处进行切割,留下一个NClucNac依然连接在N残基上。PNGaseF酶切割掉所有的糖,并将N残基的氨基侧链转化成羟基,从而使酶中的N氨基酸变成天冬氨酸(D)氨基酸。因此,所述方法包括体内或体外使用内切糖苷酶H和/或PNGaseF或等价的酶,从而部分或完全地再激活工程化的“临时失活的”蛋白。
该方法包括将酶或其他多肽靶向至宿主分泌途径,以便所述酶被糖基化。设计新的糖基化位点,这样,糖基化作用使酶失活,或修饰它的活性,例如减少它的活性,或者以另外的方式修饰活性,诸如阻止底物结合位点。因为酶是失活的或是活性较低,这些酶的活性的负面影响不再限制蛋白在宿主细胞中的积聚,所以有害的或有毒的酶可以以更高的水平表达。通过移去糖,例如使用商业上可获得的去糖基化酶,例如通过使用全细胞工程化方法体外除去糖,或体内除去糖,失活的、糖基化的酶可以被重新活化(部分或完全)。
在一个方面,将真核糖基化靶位点诸如NXS/T加入到任何蛋白,例如本发明的酶。这使本领域技术人员能够将糖基化位点加入到感兴趣的蛋白,并期望当通过将那个蛋白表达在真核宿主细胞中并将该蛋白靶向宿主细胞的分泌途径使得那个蛋白被糖基化时,将那个蛋白转化为临时失活的蛋白。
因此,本发明提供了产生在正常情况下数量巨大时由于害处或毒性太大而不能被宿主细胞耐受的酶。该效果可以是临时性的,因为它可以重新产生活性酶(通过去糖基化作用,例如通过翻译后修饰/去糖基化作用),以用于需要活性酶的进一步的工作。
在一个方面,本发明提供了制备和表达具有生物活性的蛋白的方法,该蛋白的活性通过糖基化作用而临时失活,该方法包括:(a)提供编码具有生物活性的蛋白的核酸,其中所述蛋白在天然情况下是非糖基化的;(b)将至少一个糖基化基序编码序列插入到编码蛋白的核酸中,其中糖基化形式的蛋白是无活性的;(c)将靶向序列插入蛋白,这样该蛋白被导向宿主细胞的分泌途径,其中所述宿主细胞能够识别糖基化基序并糖基化该蛋白;和(d)在宿主细胞中表达修饰的核酸。在一个方面,该方法进一步包括对表达的蛋白去糖基化,从而再次激活蛋白例如酶诸如本发明的酶的活性。在一个方面,宿主细胞是真核细胞。在一个方面,通过去糖基化作用,或者化学的方法或者酶促的方法,体外再次激活失活的表达的重组蛋白。
确定一个或多个糖基化基序的设置以临时性地失活蛋白,仅仅涉及制备变体蛋白编码核酸的常规方法,例如通过GSSMTM,和常规筛选方案,例如活性或结合分析方法。
由于糖基化作用的缘故,其活性对宿主细胞有害的酶被致失活。因为它是无活性的,所以它可以以高得多的水平积聚在真核宿主细胞中。因为它不再具有活性,所以它不再能够发挥其负面作用。有毒的酶的失活作用是临时性的,这是因为使用EndoH或PNGase F对该酶进行去糖基化作用能完全恢复酶的正常活性。大量糖基化的、失活的酶积聚在培养基中,这表明,宿主细胞完全耐受无活性形式的酶。
本发明参照以下的实施例来进一步说明;然而,应当理解地是,本发明并不限于这些实施例。
实施例6:热稳定性PLC
本发明提供了热稳定性磷脂酶。具有SEQ ID NO:2中所阐明的序列的示例性酶的热稳定性得到了证明。使用SEQ ID NO:2证明了本发明可比较的磷脂的热稳定性。在两个不同的系统中测试了SEQ ID NO:2的活性:水中和在油中。在含水系统中,替代底物(p-nppc)用于测量活性;该酶在86℃开始丧失活性。然而,在油分析中,在85℃,水解大豆油中存在的PC和PE底物时,该酶显示出良好的活性。检测相同的酶的Tm,发现它在15mg/mL时为86℃,并且是不可逆的。
图29示出了使用10U的SEQ ID NO:2时的85℃加热试验的结果,条件如图中所示。图30示出了总结该加热试验的NMR数据。图31、32和33所示出的数据概述了使用p-NPPC时的SEQ ID NO:2的热稳定性,在图中所示的条件下。图34示出了来自DSC分析的数据,显示了SEQ ID NO:2的热稳定性,酶浓度为15mg/mL,Tm为86℃。
序列表
<110>戴弗萨公司
GRAMATIKOVA,Svetlana
HAZLEWOOD,Geoff
BARTON,Nelson
LAM,David
<120>磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
<130>56446-20042.49
<150>10/796,907
<151>2004-03-08
<160>176
<170>FastSEQ for Windows Version 4.0
<210>1
<211>849
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>1
atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcgcc agttcaaagt 60
gtagtatttg cacaaacaaa taatagtgaa agtcctgcac cgattttaag atggtcagct 120
gaggataagc ataatgaggg gattaactct catttgtgga ttgtaaatcg tgcaattgac 180
atcatgtctc gtaatacaac gattgtgaat ccgaatgaaa ctgcattatt aaatgagtgg 240
cgtgctgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat 300
agtacatatg cttctcactt ttatgatccg gatactggaa caacatatat tccttttgcg 360
aaacatgcaa aagaaacagg cgcaaaatat tttaaccttg ctggtcaagc ataccaaaat 420
caagatatgc agcaagcatt cttctactta ggattatcgc ttcattattt aggagatgtg 480
aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct 540
aaatacgaaa attttgttga tacaataaaa aataactata ttgtttcaga tagcaatgga 600
tattggaatt ggaaaggagc aaacccagaa gattggattg aaggagcagc ggtagcagct 660
aaacaagatt atcctggcgt tgtgaacgat acgacaaaag attggtttgt aaaagcagcc 720
gtatctcaag aatatgcaga taaatggcgt gcggaagtaa caccggtgac aggaaagcgt 780
ttaatggaag cgcagcgcgt tacagctggt tatattcatt tgtggtttga tacgtatgta 840
aatcgctaa 849
<210>2
<211>282
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(24)
<223>从环境样品中获得
<400>2
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
1 5 10 15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
20 25 30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile
35 40 45
Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
50 55 60
Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65 70 75 80
Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
85 90 95
Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
100 105 110
Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala
115 120 125
Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln
130 135 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145 150 155 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met
165 170 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
180 185 190
Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn
195 200 205
Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
210 215 220
Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225 230 235 240
Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
245 250 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
260 265 270
His Leu Trp Phe Asp Thr Tyr Val Asn Arg
275 280
<210>3
<211>852
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>3
atgaaaagaa aaattttagc tatagcttcc gtaattgctt taacagctcc tatccaaagt 60
gtggcgtttg cgcatgaaaa tggtcaccaa gatccaccaa ttgctctaaa gtggtcagca 120
gaatctatac ataatgaagg agtaagttct catttatgga ttgtaaacag agccattgat 180
attatgtccc aaaatacgac tgttgtgaag caaaatgaga cagctctatt aaatgaatgg 240
cgtacggatc tagagaaagg catttactct gcggattatg aaaacccata ctatgataat 300
tccacattcg cttcacactt ctatgatcct gattcaggaa aaacgtatat tccatttgct 360
aaacaagcaa agcaaacagg agcgaaatat tttaaattag ctggtgaagc ttatcaaaat 420
aaagatctga aaaacgcatt cttttattta ggattatcac ttcactattt aggggatgtc 480
aaccaaccaa tgcatgcagc aaactttact aatatttcgc atccatttgg cttccactca 540
aaatatgaaa atttcgttga tacagtgaaa gacaattata gagtaacgga tggaaatggc 600
tattggaatt ggcaaagtgc aaatccagaa gagtgggttc atgcatcagc atcagcagca 660
aaagctgatt ttccatcaat tgttaatgat aagacgaaaa attggttcct aaaagcagct 720
gtatcacaag actctgctga taaatggcgt gcagaagtaa caccgataac aggaaaacgt 780
ttaatggaag cgcagcgtgt tacagctgga tatatccatt tatggtttga tacgtacgtg 840
aataacaaat aa 852
<210>4
<211>283
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(24)
<223>从环境样品中获得
<400>4
Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala
1 5 10 15
Pro Ile Gln Ser Val Ala Phe Ala His Glu Asn Gly His Gln Asp Pro
20 25 30
Pro Ile Ala Leu Lys Trp Ser Ala Glu Ser Ile His Asn Glu Gly Val
35 40 45
Ser Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln
50 55 60
Asn Thr Thr Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp
65 70 75 80
Arg Thr Asp Leu Glu Lys Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
85 90 95
Tyr Tyr Asp Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser
100 105 110
Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala
115 120 125
Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys
130 135 140
Asn Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145 150 155 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe
165 170 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn
180 185 190
Tyr Arg Val Thr Asp Gly Asn Gly Tyr Trp Asn Trp Gln Ser Ala Asn
195 200 205
Pro Glu Glu Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe
210 215 220
Pro Ser Ile Val Asn Asp Lys Thr Lys Asn Trp Phe Leu Lys Ala Ala
225 230 235 240
Val Ser Gln Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Ile
245 250 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
260 265 270
His Leu Trp Phe Asp Thr Tyr Val Asn Asn Lys
275 280
<210>5
<211>843
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>5
atgaaaagaa aaattttagc tatagcttct gtaattgctt taacagctcc tattcaaagt 60
gtggcgtttg cgcatgaatc tgatgggcct attgctttaa gatggtcagc ggaatctgta 120
cataatgaag gagtaagttc tcatttatgg attgtaaaca gagcaattga tattatgtcc 180
caaaatacga ctgtggtgaa gcaaaatgag acagctctat taaatgaatg gcgtacgaat 240
ttggaggaag gtatttattc tgcagattat aaaaacccat actatgataa ttccacattc 300
gcttcacact tctatgatcc tgattcagaa aaaacgtata ttccatttgc taaacaagca 360
aagcaaacgg gagcaaagta ttttaaatta gctggtgaag cttatcaaaa taaagatctg 420
aaaaatgcat tcttttattt aggattatca cttcattatt taggggatgt caatcaacca 480
atgcatgcag caaactttac taacatttcg catccatttg gcttccactc aaaatatgaa 540
aacttcgttg atacagtgaa agacaattat agagtaacag atggagatgg ctattggaat 600
tggaaaagtg caaatccaga agagtgggtt catgcatcag catcagcagc aaaagctgat 660
ttcccatcaa ttgttaatga taatacgaaa agttggttcc taaaagcagc ggtatcacaa 720
gactctgctg acaaatggcg tgctgaagta acaccggtaa caggaaaacg tttaatggaa 780
gcacagcgta ttacagctgg atatattcat ttatggtttg atacgtacgt gaataacaaa 840
taa 843
<210>6
<211>280
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(24)
<223>从环境样品中获得
<400>6
Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala
1 5 10 15
Pro Ile Gln Ser Val Ala Phe Ala His Glu Ser Asp Gly Pro Ile Ala
20 25 30
Leu Arg Trp Ser Ala Glu Ser Val His Asn Glu Gly Val Ser Ser His
35 40 45
Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln Asn Thr Thr
50 55 60
Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp Arg Thr Asn
65 70 75 80
Leu Glu Glu Gly Ile Tyr Ser Ala Asp Tyr Lys Asn Pro Tyr Tyr Asp
85 90 95
Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser Glu Lys Thr
100 105 110
Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala Lys Tyr Phe
115 120 125
Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys Asn Ala Phe
130 135 140
Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro
145 150 155 160
Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe Gly Phe His
165 170 175
Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn Tyr Arg Val
180 185 190
Thr Asp Gly Asp Gly Tyr Trp Asn Trp Lys Ser Ala Asn Pro Glu Glu
195 200 205
Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe Pro Ser Ile
210 215 220
Val Asn Asp Asn Thr Lys Ser Trp Phe Leu Lys Ala Ala Val Ser Gln
225 230 235 240
Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys
245 250 255
Arg Leu Met Glu Ala Gln Arg Ile Thr Ala Gly Tyr Ile His Leu Trp
260 265 270
Phe Asp Thr Tyr Val Asn Asn Lys
275 280
<210>7
<211>963
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>7
gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt gttaggggtt 60
ttcgtaccgc tgcagccatc acatgctact gaaaattatc caaatgattt taaactgttg 120
caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca 180
gattatatga gtaatgcaga ttacttcaag ggacatgatg ctctgctctt aaatgagctt 240
tttgacaatg gaaattcgaa catgctgcta atgaacttat ccacggaata tccatatcaa 300
acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat 360
tttgtacccg aagatggcgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata 420
cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat 480
gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa 540
gatactgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc 600
aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac 660
tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc 720
aatgcgccta ccgaatattt agggcatagc tctacttggg acccagaaac gaacagcatt 780
acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa 840
gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg 900
aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa 960
taa 963
<210>8
<211>320
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(29)
<223>从环境样品中获得
<400>8
Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu
1 5 10 15
Leu Leu Gly Val Phe Val Pro Leu Gln Pro Ser His Ala Thr Glu Asn
20 25 30
Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro
35 40 45
Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser
50 55 60
Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu
65 70 75 80
Phe Asp Asn Gly Asn Ser Asn Met Leu Leu Met Asn Leu Ser Thr Glu
85 90 95
Tyr Pro Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp
100 105 110
Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val
115 120 125
Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr
130 135 140
Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr
145 150 155 160
Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His
165 170 175
Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile
180 185 190
Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn
195 200 205
Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met
210 215 220
Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val
225 230 235 240
AsnAla Pro Thr Glu Tyr Leu Gly His Ser Ser Thr Trp Asp Pro Glu
245 250 255
Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His
260 265 270
Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp
275 280 285
Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr
290 295 300
Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys
305 310 315 320
<210>9
<211>999
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>9
atgaaattac tgcgtgtctt tgtgtgcgtt tttgctttac tcagcgcaca cagcaaagcc 60
gatacactta aagtaatggc ttataatatt atgcaactaa acgtacaaga ttgggatcaa 120
gcaaatcgtg cacagcgctt gccaaacgtc atatctcaat taagtgacag tcctgatgtc 180
attcttatca gcgaagcgtt tagcagccaa tcagaatctg cgttagcgca acttgctcaa 240
ctttaccctt atcaaactcc caatgttggc gaagactgta gtggcgctgg ctggcaaagc 300
ttaacgggta actgctcgaa tagccccttt gtgatccgcg gtggagtggt gattttatct 360
aagtacccca tcattacgca aaaagcccat gtgtttaata acagcctgac tgatagttgg 420
gattatttag caaacaaagg tttcgcttat gttgaaatag aaaaacatgg caaacgttac 480
caccttattg gcacgcattt acaagcaacg catgatggcg acacagaagc tgagcatatt 540
gtgagaatgg gtcaattaca agagatacaa gatttcattc aaagcgagca aattcacact 600
tctgagccgg tcattatcgg cggtgatatg aacgtagagt ggagcaagca atctgaaatt 660
acagatatgc tcgaagtggt tcgcagccgt ctaattttca acacacctga agttggctct 720
ttctctgcaa aacacaactg gtttaccaaa gctaacgcct actatttcga ctacagctta 780
gagtataacg acacgctcga ttatgtactt tggcatgcag accataagca acccaccaat 840
accccagaaa tgttagtacg ttacccaaaa gcagagcgtg acttttactg gcgttactta 900
cgcggaaatt ggaacttacc ttctggccgt tattatcatg atggatacta taacgaactg 960
tctgatcact acccagtgca agttaacttt gaattttaa 999
<210>10
<211>332
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(20)
<223>从环境样品中获得
<400>10
Met Lys Leu Leu Arg Val Phe Val Cys Val Phe Ala Leu Leu Ser Ala
1 5 10 15
His Ser Lys Ala Asp Thr Leu Lys Val Met Ala Tyr Asn Ile Met Gln
20 25 30
Leu Asn Val Gln Asp Trp Asp Gln Ala Asn Arg Ala Gln Arg Leu Pro
35 40 45
Asn Val Ile Ser Gln Leu Ser Asp Ser Pro Asp Val Ile Leu Ile Ser
50 55 60
Glu Ala Phe Ser Ser Gln Ser Glu Ser Ala Leu Ala Gln Leu Ala Gln
65 70 75 80
Leu Tyr Pro Tyr Gln Thr Pro Asn Val Gly Glu Asp Cys Ser Gly Ala
85 90 95
Gly Trp Gln Ser Leu Thr Gly Asn Cys Ser Asn Ser Pro Phe Val Ile
100 105 110
Arg Gly Gly Val Val Ile Leu Ser Lys Tyr Pro Ile Ile Thr Gln Lys
115 120 125
Ala His Val Phe Asn Asn Ser Leu Thr Asp Ser Trp Asp Tyr Leu Ala
130 135 140
Asn Lys Gly Phe Ala Tyr Val Glu Ile Glu Lys His Gly Lys Arg Tyr
145 150 155 160
His Leu Ile Gly Thr His Leu Gln Ala Thr His Asp Gly Asp Thr Glu
165 170 175
Ala Glu His Ile Val Arg Met Gly Gln Leu Gln Glu Ile Gln Asp Phe
180 185 190
Ile Gln Ser Glu Gln Ile His Thr Ser Glu Pro Val Ile Ile Gly Gly
195 200 205
Asp Met Asn Val Glu Trp Ser Lys Gln Ser Glu Ile Thr Asp Met Leu
210 215 220
Glu Val Val Arg Ser Arg Leu Ile Phe Asn Thr Pro Glu Val Gly Ser
225 230 235 240
Phe Ser Ala Lys His Asn Trp Phe Thr Lys Ala Asn Ala Tyr Tyr Phe
245 250 255
Asp Tyr Ser Leu Glu Tyr Asn Asp Thr Leu Asp Tyr Val Leu Trp His
260 265 270
Ala Asp His Lys Gln Pro Thr Asn Thr Pro Glu Met Leu Val Arg Tyr
275 280 285
Pro Lys Ala Glu Arg Asp Phe Tyr Trp Arg Tyr Leu Arg Gly Asn Trp
290 295 300
Asn Leu Pro Ser Gly Arg Tyr Tyr His Asp Gly Tyr Tyr Asn Glu Leu
305 310 315 320
Ser Asp His Tyr Pro Val Gln Val Asn Phe Glu Phe
325 330
<210>11
<211>1041
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>11
atggcttcac aattcaggaa tctggttttt gaaggaggcg gtgtaaaggg aatcgcctat 60
atcggcgcca tgcaggtgct ggagcagcgc ggacatttgg agcacgttgt gagggtggga 120
ggaacaagtg caggggctat taacgctctc attttttcgc tgggctttac cattaaagag 180
cagcaggata ttctcaattc caccaacttc agggagttta tggacagctc tttcggattt 240
gtgcgaaact tcagaaggct ctggagtgaa ttcgggtgga accgcggtga tgtgttttcg 300
gagtgggcag gagagctggt gaaagagaaa ctcggcaaga agaacgccac cttcggcgat 360
ctgaaaaaag cgaagcgccc cgatctctac gttatcggaa ccaacctctc caccgggttt 420
tccgagactt tttcgcatga acgccacgcc aacatgccgc tggtggatgc ggtgcggatc 480
agcatgtcga tcccgctctt ttttgcggca cgcagacttg gcaaacgaag cgatgtgtat 540
gtggatggag gtgttatgct caactacccg gtaaagctgt tcgacaggga gaaatacatc 600
gatttggaga aggagaaaga ggcagcccgc tacgtggagt actacaatca agagaatgcc 660
cggtttctgc ttgagcggcc cggccgaagc ccgtacgttt acaaccggca gaccctaggc 720
ctgcggctcg actcgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc 780
aaacagatca accgcttccc cgaatatgcc aaagccctga tcggtgcact gatgcaggtg 840
caggagaaca tccacctgaa aagcgacgac tggcagcgaa cgctctacat caacacgctg 900
gatgtgggta ccacagattt cgacattaat gacgagaaga aaaaagtgct ggtgaatgag 960
ggaatcaagg gagcggaaac ctacttccgc tggtttgagg atcccgaagc taaaccggtg 1020
aacaaggtgg atttggtctg a 1041
<210>12
<211>346
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>12
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly His
20 25 30
Leu Glu His Val Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile
50 55 60
Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe
65 70 75 80
Val Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly
85 90 95
Asp Val Phe Ser Glu Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly
100 105 110
Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe
130 135 140
Ser His Glu Arg His Ala Asn Met Pro Leu Val Asp Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg
165 170 175
Ser Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys
180 185 190
Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Lys Glu Ala
195 200 205
Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu
210 215 220
Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Lys Ala
260 265 270
Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser
275 280 285
Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asp Ile Asn Asp Glu Lys Lys Lys Val Leu Val Asn Glu
305 310 315 320
Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu
325 330 335
Ala Lys Pro Val Asn Lys Val Asp Leu Val
340 345
<210>13
<211>1038
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>13
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca cagagtcgga 120
gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac ggtccgtgag 180
caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt 240
attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat 300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggtat 420
gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc 480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgaacgaca agatgtgtat 540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt 600
gatctggtca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct 660
cgctttcagc ttgagcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720
ttgcgactgg atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840
caggaaaaca ttcatctaca tggcgatgat tgggcgcgca cggtctatat cgatacattg 900
gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgagcaa 960
ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg 1020
aatagagtgg agtcatag 1038
<210>14
<211>345
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>14
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
20 25 30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
50 55 60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65 70 75 80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly
85 90 95
Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
100 105 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Glu Arg
165 170 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
180 185 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Val Lys Asp Pro Gly Ala
195 200 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
210 215 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
260 265 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly
275 280 285
Asp Asp Trp Ala Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305 310 315 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu
325 330 335
Glu Lys Pro Val Asn Arg Val Glu Ser
340 345
<210>15
<211>1344
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>15
atgctggtca tcattcatgg ctggagcgat gaggcgggct cgttcaagac cctggccaga 60
cgtttggcca aggcgccacc cgagggcctc gggacgcagg tcacggaaat ccatctgggt 120
gattatgtgt ccctggatga ccaggtgacg ttcaatgatc tggtcgatgc catggccaga 180
gcctggagcg atcgtggtct gcccacggcc ccgcgcagcg tcgatgccgt cgtgcacagc 240
accggcggcc tggtgatccg cgactggctc acgcagctgt acacgccgga aacagccccc 300
attcgtcgcc tgctgatgct cgctccggcc aatttcggct cgccgctggc acacaccgga 360
cgcagcatga tcggccgggt caccaagggc tggaagggca cgcggctctt tgaaacgggc 420
aagcacattc tcaaagggct cgaactggcc agcccctacg cctgggcgct ggccgaacgc 480
gatctgttca gcgatcagaa ctattatggc gccgggcgca tcctgtgcac tgtcctggtg 540
ggcaacgccg gttatcgcgg catcagcgcc gtcgccaacc ggcccggcac ggacggcacc 600
gtgcgcgtca gcagcgccaa tctccaagcg gccaggatgc tgctcgattt cagcgccagt 660
ccacaggctg agccggaatt caccctgcac gacagcaccg cggaaattgc cttcggcatc 720
gccgacgagg aagaccacag caccatcgcc gccaaggatc gcggcccgcg caaggcagtc 780
acctgggaac tgattctcaa agccctgcag atcgaggatg caagctttgc tcaatggtgc 840
cggcagatgc aggagcattc cgcggccgtg acggaaacgg cggaaaagcg ccgcaatgtt 900
cactacaaca gcttccagaa taccgtcgtg cgcgtggtgg acaaccacgg tgccgccgtg 960
caggattatc tcatcgagtt ttacatgaat gatgatcgca aactccgcga tcagcgcctc 1020
acccagcgcc tgcaggagca ggtgattacc aacgtgcacg gctacggtga cgacaagtcc 1080
tatcgcagca tgctgatcaa ctgcacggag ctctatgcgc tgatgtccag accgcaggat 1140
cgcctgaaca tcagcatcac cgcctatccg gatctctcca agggactggt ggggtatcgc 1200
acctacacgg acgaggatat cggttccctc tctctggatg cagcgcagat ccgaaagctc 1260
tttaagccgc accgtaccct gttgatgaca ctgtgcctgc aacgctatca gaaagatgat 1320
gtgttccgat tcagggatgt ttga 1344
<210>16
<211>447
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>16
Met Leu Val Ile Ile His Gly Trp Ser Asp Glu Ala Gly Ser Phe Lys
1 5 10 15
Thr Leu Ala Arg Arg Leu Ala Lys Ala Pro Pro Glu Gly Leu Gly Thr
20 25 30
Gln Val Thr Glu Ile His Leu Gly Asp Tyr Val Ser Leu Asp Asp Gln
35 40 45
Val Thr Phe Asn Asp Leu Val Asp Ala Met Ala Arg Ala Trp Ser Asp
50 55 60
Arg Gly Leu Pro Thr Ala Pro Arg Ser Val Asp Ala Val Val His Ser
65 70 75 80
Thr Gly Gly Leu Val Ile Arg Asp Trp Leu Thr Gln Leu Tyr Thr Pro
85 90 95
Glu Thr Ala Pro Ile Arg Arg Leu Leu Met Leu Ala Pro Ala Asn Phe
100 105 110
Gly Ser Pro Leu Ala His Thr Gly Arg Ser Met Ile Gly Arg Val Thr
115 120 125
Lys Gly Trp Lys Gly Thr Arg Leu Phe Glu Thr Gly Lys His Ile Leu
130 135 140
Lys Gly Leu Glu Leu Ala Ser Pro Tyr Ala Trp Ala Leu Ala Glu Arg
145 150 155 160
Asp Leu Phe Ser Asp Gln Asn Tyr Tyr Gly Ala Gly Arg Ile Leu Cys
165 170 175
Thr Val Leu Val Gly Asn Ala Gly Tyr Arg Gly Ile Ser Ala Val Ala
180 185 190
Asn Arg Pro Gly Thr Asp Gly Thr Val Arg Val Ser Ser Ala Asn Leu
195 200 205
Gln Ala Ala Arg Met Leu Leu Asp Phe Ser Ala Ser Pro Gln Ala Glu
210 215 220
Pro Glu Phe Thr Leu His Asp Ser Thr Ala Glu Ile Ala Phe Gly Ile
225 230 235 240
Ala Asp Glu Glu Asp His Ser Thr Ile Ala Ala Lys Asp Arg Gly Pro
245 250 255
Arg Lys Ala Val Thr Trp Glu Leu Ile Leu Lys Ala Leu Gln Ile Glu
260 265 270
Asp Ala Ser Phe Ala Gln Trp Cys Arg Gln Met Gln Glu His Ser Ala
275 280 285
Ala Val Thr Glu Thr Ala Glu Lys Arg Arg Asn Val His Tyr Asn Ser
290 295 300
Phe Gln Asn Thr Val Val Arg Val Val Asp Asn His Gly Ala Ala Val
305 310 315 320
Gln Asp Tyr Leu Ile Glu Phe Tyr Met Asn Asp Asp Arg Lys Leu Arg
325 330 335
Asp Gln Arg Leu Thr Gln Arg Leu Gln Glu Gln Val Ile Thr Asn Val
340 345 350
His Gly Tyr Gly Asp Asp Lys Ser Tyr Arg Ser Met Leu Ile Asn Cys
355 360 365
Thr Glu Leu Tyr Ala Leu Met Ser Arg Pro Gln Asp Arg Leu Asn Ile
370 375 380
Ser Ile Thr Ala Tyr Pro Asp Leu Ser Lys Gly Leu Val Gly Tyr Arg
385 390 395 400
Thr Tyr Thr Asp Glu Asp Ile Gly Ser Leu Ser Leu Asp Ala Ala Gln
405 410 415
Ile Arg Lys Leu Phe Lys Pro His Arg Thr Leu Leu Met Thr Leu Cys
420 425 430
Leu Gln Arg Tyr Gln Lys Asp Asp Val Phe Arg Phe Arg Asp Val
435 440 445
<210>17
<211>1137
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>17
atgaaaaaaa gccttcaaca acatcttgcc gctgacggca gcccaaagaa tattctttct 60
ctcgacgggg gaggaatcag aggggctttg acccttggtt ttctcaaaaa aatagaaagc 120
atcctgcagg aaaaacatgg gaaggactat ctcctttgcg atcactttga tttgatcggt 180
ggaacttcca caggctccat cattgcagca gcattggcta taggcatgac agtggaggaa 240
atcactaaaa tgtatatgga tctgggcgga aaaattttcg gcaagaaaag gagtttctgg 300
agaccctggg aaactgcgaa atacttgaaa gcaggatatg accacaaagc tcttgaaaag 360
agtctgaaag atgctttcca ggattttctt ttaggaagtg accaaattag aacaggtctt 420
tgtatagtag ccaaaagagc agataccaat agtatatggc cattgattaa ccaccccaaa 480
ggaaaattct atgattcaga acaaggcaaa aacaaaaata tccccttatg gcaggcagta 540
agggcgagta ccgctgctcc aacctatttc gctccacaat taatagatgt gggtgatggt 600
caaaaggctg cttttgtgga cggaggggta agcatggcca ataaccccgc attaaccctg 660
ttaaaagtgg ctacacttaa aggttttcct tttcattggc caatgggaga agacaaactg 720
accatagttt cagtaggcac cggatatagt gttttccaaa gacaaaaggg tgaaatcacc 780
aaagcttcct tattaacttg ggccaaaaac gtcccggaaa tgttgatgca ggatgcttct 840
tggcagaatc agaccatact tcagtggatt tctaaatccc ccactgcaca ttccatagat 900
atggaaatgg aagaccttag agatgacttt ctaggcggaa gaccactcat caaatacctc 960
aggtacaact tccccttgac agtaaatgat ctcaatggat tgaagcttgg gaaaagcttt 1020
acccaaaaag aggtcgaaga tttggtggaa atgagcaatg cacataaccg agaggagttg 1080
tataggattg gggagaaggc ggctgaaggg tcggtaaaaa aagaacattt tgaataa 1137
<210>18
<211>378
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>18
Met Lys Lys Ser Leu Gln Gln His Leu Ala Ala Asp Gly Ser Pro Lys
1 5 10 15
Asn Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly Ala Leu Thr Leu
20 25 30
Gly Phe Leu Lys Lys Ile Glu Ser Ile Leu Gln Glu Lys His Gly Lys
35 40 45
Asp Tyr Leu Leu Cys Asp His Phe Asp Leu Ile Gly Gly Thr Ser Thr
50 55 60
Gly Ser Ile Ile Ala Ala Ala Leu Ala Ile Gly Met Thr Val Glu Glu
65 70 75 80
Ile Thr Lys Met Tyr Met Asp Leu Gly Gly Lys Ile Phe Gly Lys Lys
85 90 95
Arg Ser Phe Trp Arg Pro Trp Glu Thr Ala Lys Tyr Leu Lys Ala Gly
100 105 110
Tyr Asp His Lys Ala Leu Glu Lys Ser Leu Lys Asp Ala Phe Gln Asp
115 120 125
Phe Leu Leu Gly Ser Asp Gln Ile Arg Thr Gly Leu Cys Ile Val Ala
130 135 140
Lys Arg Ala Asp Thr Asn Ser Ile Trp Pro Leu Ile Asn His Pro Lys
145 150 155 160
Gly Lys Phe Tyr Asp Ser Glu Gln Gly Lys Asn Lys Asn Ile Pro Leu
165 170 175
Trp Gln Ala Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Ala Pro
180 185 190
Gln Leu Ile Asp Val Gly Asp Gly Gln Lys Ala Ala Phe Val Asp Gly
195 200 205
Gly Val Ser Met Ala Asn Asn Pro Ala Leu Thr Leu Leu Lys Val Ala
210 215 220
Thr Leu Lys Gly Phe Pro Phe His Trp Pro Met Gly Glu Asp Lys Leu
225 230 235 240
Thr Ile Val Ser Val Gly Thr Gly Tyr Ser Val Phe Gln Arg Gln Lys
245 250 255
Gly Glu Ile Thr Lys Ala Ser Leu Leu Thr Trp Ala Lys Asn Val Pro
260 265 270
Glu Met Leu Met Gln Asp Ala Ser Trp Gln Asn Gln Thr Ile Leu Gln
275 280 285
Trp Ile Ser Lys Ser Pro Thr Ala His Ser Ile Asp Met Glu Met Glu
290 295 300
Asp Leu Arg Asp Asp Phe Leu Gly Gly Arg Pro Leu Ile Lys Tyr Leu
305 3l0 315 320
Arg Tyr Asn Phe Pro Leu Thr Val Asn Asp Leu Asn Gly Leu Lys Leu
325 330 335
Gly Lys Ser Phe Thr Gln Lys Glu Val Glu Asp Leu Val Glu Met Ser
340 345 350
Asn Ala His Asn Arg Glu Glu Leu Tyr Arg Ile Gly Glu Lys Ala Ala
355 360 365
Glu Gly Ser Val Lys Lys Glu His Phe Glu
370 375
<210>19
<211>1248
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>19
atgaaaaaga caacgttagt tttggctcta ttgatgccat ttggtgccgc ctccgcacaa 60
gacaatagta tgactccaga agcaatcaca tcagctcaag tcgcacaaac acaatcagcc 120
tccacctata cctacgttag gtgttggtat cgaacagacg caagccatga ttcaccagca 180
accgactggg agtgggctag aaaggaaaac ggagactatt acaccattga cggttactgg 240
tggtcatcga tctcctttaa aaatatgttc tatagcgaga ctcctcaaca agagatcaag 300
cagcgttgtg tagacacctt ggatgttcag cacgacaaag ccgacatcac ctactttgcc 360
gctgacaacc gcttctctta caaccattct atctggacta acgatcacgg ctttcaagcg 420
aaccaaatca accgaatagt cgcttttggc gatagtcttt cagacacggg caacctattt 480
aatgggtcac aatggatttt ccctaaccct aattcttggt tcttgggtca cttctctaac 540
ggcttcgttt ggactgaata cttggctaac gctaagggcg ttccactcta taactgggct 600
gtgggtggcg cagcaggaac caaccaatat gtcgctctaa ctggtgtcta tgatcaggtc 660
acttcgtacc tgacttacat gaagatggcg aaaaattatc gcccagagaa cacactattc 720
acattagagt ttggattgaa tgactttatg aattacggac gtgaagtagc tgatgtaaaa 780
gctgacttta gtagcgcact gattcgcctc accgacgctg gcgcaaaaaa cattctgttg 840
ttcaccctac cagatgcgac caaagcccct cagtttaagt actcaacggc ccaagaaatc 900
gagacagttc gtggcaagat tctggcgttc aaccagttca tcaaagaaca agcagagtac 960
tatcaaagca aaggtgacaa cgtgatccta tttgatgcgc acgctctatt ctctagcatc 1020
accagcgacc cacaaaaaca cgggttcaga aacgcaaaag atgcctgcct agatattaat 1080
cgtagtgcat ctcaagacta cctatacagc catagtctga ccaacgactg tgcaacctat 1140
ggttctgata gctatgtatt ttggggcgta acacacccaa ccacagcaac tcataaatac 1200
atcgcaacgc atatactgat gaattcaatg tcgaccttcg acttttaa 1248
<210>20
<211>415
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(19)
<223>从环境样品中获得
<400>20
Met Lys Lys Thr Thr Leu Val Leu Ala Leu Leu Met Pro Phe Gly Ala
1 5 10 15
Ala Ser Ala Gln Asp Asn Ser Met Thr Pro Glu Ala Ile Thr Ser Ala
20 25 30
Gln Val Ala Gln Thr Gln Ser Ala Ser Thr Tyr Thr Tyr Val Arg Cys
35 40 45
Trp Tyr Arg Thr Asp Ala Ser His Asp Ser Pro Ala Thr Asp Trp Glu
50 55 60
Trp Ala Arg Lys Glu Asn Gly Asp Tyr Tyr Thr Ile Asp Gly Tyr Trp
65 70 75 80
Trp Ser Ser Ile Ser Phe Lys Asn Met Phe Tyr Ser Glu Thr Pro Gln
85 90 95
Gln Glu Ile Lys Gln Arg Cys Val Asp Thr Leu Asp Val Gln His Asp
100 105 110
Lys Ala Asp Ile Thr Tyr Phe Ala Ala Asp Asn Arg Phe Ser Tyr Asn
115 120 125
His Ser Ile Trp Thr Asn Asp His Gly Phe Gln Ala Asn Gln Ile Asn
130 135 140
Arg Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Phe
145 150 155 160
Asn Gly Ser Gln Trp Ile Phe Pro Asn Pro Asn Ser Trp Phe Leu Gly
165 170 175
His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala Asn Ala Lys
180 185 190
Gly Val Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn
195 200 205
Gln Tyr Val Ala Leu Thr Gly Val Tyr Asp Gln Val Thr Ser Tyr Leu
210 215 220
Thr Tyr Met Lys Met Ala Lys Asn Tyr Arg Pro Glu Asn Thr Leu Phe
225 230 235 240
Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val
245 250 255
Ala Asp Val Lys Ala Asp Phe Ser Ser Ala Leu Ile Arg Leu Thr Asp
260 265 270
Ala Gly Ala Lys Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys
275 280 285
Ala Pro Gln Phe Lys Tyr Ser Thr Ala Gln Glu Ile Glu Thr Val Arg
290 295 300
Gly Lys Ile Leu Ala Phe Asn Gln Phe Ile Lys Glu Gln Ala Glu Tyr
305 310 315 320
Tyr Gln Ser Lys Gly Asp Asn Val Ile Leu Phe Asp Ala His Ala Leu
325 330 335
Phe Ser Ser Ile Thr Ser Asp Pro Gln Lys His Gly Phe Arg Asn Ala
340 345 350
Lys Asp Ala Cys Leu Asp Ile Asn Arg Ser Ala Ser Gln Asp Tyr Leu
355 360 365
Tyr Ser His Ser Leu Thr Asn Asp Cys Ala Thr Tyr Gly Ser Asp Ser
370 375 380
Tyr Val Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr
385 390 395 400
Ile Ala Thr His Ile Leu Met Asn Ser Met Ser Thr Phe Asp Phe
405 410 415
<210>21
<211>1716
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>21
atgcagcagc ataaattgag gaatttcaac aagggattga ccggcgtcgt attgagcgta 60
ttgacctcta ccagcgccat ggcttttaca caaatcggtg gcggcggcgc gattccgatg 120
ggccatgaat ggctcacgcg cagatccgca ctggaattat taaatgcaga ccatatcgtc 180
tccaacgacc cgctcgaccc acgcttgggc tggagccagg gcttggccaa aaatttggat 240
ctctccaatg cattgaacga agtgcagcgc atccagagcg ttaccaagac caacgcactt 300
tatgaaccac gctatgatga cgtgttttct gcgattgtcg gcgaacgctg ggtggacacg 360
gccggtttca acgttgcgaa ggctaccgtc ggtaaaatcg attgtttcag cgcggtcgcg 420
caagaacctg ccgatgttca gcaagaccat ttcatgcgtc gttacgatga cgtgggcgga 480
caaggtggcg ttaacgccgc acgccgcggg caacaacgtt tcatcaccca tttcatcaac 540
gccgcgatgg ccgaagaaaa aagcataaaa gcgtgggacg gcggtggata ctccacgctg 600
gaaaaagtca gccacaatta tttcttgttt ggtcgcgctg tgcatttgtt ccaggattct 660
ttcagcccgg aacacaccgt gcgtctgccg caagacaact acgaaaaagt acgtcaggta 720
aaagcctatc tgtgttccga aggcgcagag caacatacgc ataacgcgca ggatgcgatc 780
agcttcacca gcggcgacgt tatctggaag aaaaacaccc gtctggatgc cggctggagc 840
acctacaaac ccagcaatat gaaacccgtt gccttggtgg cgatggaagc ctcgaaggac 900
ttgtgggccg ccttcattcg caccatggcc gcaccgcgca gcgagcgtcg cgccattgct 960
cagcaagagg cacaaacgct ggtaaacaac tggttgtcgt tcgacgaaca ggaaatgctg 1020
agctggtacg acgaagaaac tcatcgcgat cacacttacg tgctcgaacc cggccagaac 1080
ggccccggta tttccatgtt cgattgcatg gtgggtctgg gcgtgacgtc tggcagccag 1140
gctgcgcgtg tggccgaact ggatcaacaa cgtcgccagt gcttgttcaa cgtcaaggcc 1200
accaccggtt acagcgatct gaacgatccg cacatggata tcccgtataa ctggcaatgg 1260
acgtcgacca cgcagtggaa agtgccaagc gcgagctgga cgattccgca gttgccggcc 1320
gacgcaggca agaaagtgac gatcaaaaac gccatcaacg gcaatccgct ggtagcgccg 1380
gctggcgtca aacacaacag cgatatttat tccgcgccgg gtgaagccat cgaattcatt 1440
ttcgtcggtg actacaacaa tgagtcttat ctgcgctcga aaaaagatgc ggatttgttc 1500
ttgagctaca gtgcggtatc cggcaagggc ttgctgtaca acacaccgaa tcaggcaggt 1560
tatcgcgtga aaccggcggg cgtgctgtgg acgatcgaga acacctactg gaatgatttc 1620
ctgtggttca acagttcgaa caaccgcatc tacgtaagcg gcacgggcga tgccaacaag 1680
ttacattcac agtggatcat tgacggtctg aaataa 1716
<210>22
<211>571
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(28)
<223>从环境样品中获得
<400>22
Met Gln Gln His Lys Leu Arg Asn Phe Asn Lys Gly Leu Thr Gly Val
1 5 10 15
Val Leu Ser Val Leu Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile
20 25 30
Gly Gly Gly Gly Ala Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg
35 40 45
Ser Ala Leu Glu Leu Leu Asn Ala Asp His Ile Val Ser Asn Asp Pro
50 55 60
Leu Asp Pro Arg Leu Gly Trp Ser Gln Gly Leu Ala Lys Asn Leu Asp
65 70 75 80
Leu Ser Asn Ala Leu Asn Glu Val Gln Arg Ile Gln Ser Val Thr Lys
85 90 95
Thr Asn Ala Leu Tyr Glu Pro Arg Tyr Asp Asp Val Phe Ser Ala Ile
100 105 110
Val Gly Glu Arg Trp Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala
115 120 125
Thr Val Gly Lys Ile Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala
130 135 140
Asp Val Gln Gln Asp His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly
145 150 155 160
Gln Gly Gly Val Asn Ala Ala Arg Arg Gly Gln Gln Arg Phe Ile Thr
165 170 175
His Phe Ile Asn Ala Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp
180 185 190
Asp Gly Gly Gly Tyr Ser Thr Leu Glu Lys Val Ser His Asn Tyr Phe
195 200 205
Leu Phe Gly Arg Ala Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu
210 215 220
His Thr Val Arg Leu Pro Gln Asp Asn Tyr Glu Lys Val Arg Gln Val
225 230 235 240
Lys Ala Tyr Leu Cys Ser Glu Gly Ala Glu Gln His Thr His Asn Ala
245 250 255
Gln Asp Ala Ile Ser Phe Thr Ser Gly Asp Val Ile Trp Lys Lys Asn
260 265 270
Thr Arg Leu Asp Ala Gly Trp Ser Thr Tyr Lys Pro Ser Asn Met Lys
275 280 285
Pro Val Ala Leu Val Ala Met Glu Ala Ser Lys Asp Leu Trp Ala Ala
290 295 300
Phe Ile Arg Thr Met Ala Ala Pro Arg Ser Glu Arg Arg Ala Ile Ala
305 310 315 320
Gln Gln Glu Ala Gln Thr Leu Val Asn Asn Trp Leu Ser Phe Asp Glu
325 330 335
Gln Glu Met Leu Ser Trp Tyr Asp Glu Glu Thr His Arg Asp His Thr
340 345 350
Tyr Val Leu Glu Pro Gly Gln Asn Gly Pro Gly Ile Ser Met Phe Asp
355 360 365
Cys Met Val Gly Leu Gly Val Thr Ser Gly Ser Gln Ala Ala Arg Val
370 375 380
Ala Glu Leu Asp Gln Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala
385 390 395 400
Thr Thr Gly Tyr Ser Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr
405 410 415
Asn Trp Gln Trp Thr Ser Thr Thr Gln Trp Lys Val Pro Ser Ala Ser
420 425 430
Trp Thr Ile Pro Gln Leu Pro Ala Asp Ala Gly Lys Lys Val Thr Ile
435 440 445
Lys Asn Ala Ile Asn Gly Asn Pro Leu Val Ala Pro Ala Gly Val Lys
450 455 460
His Asn Ser Asp Ile Tyr Ser Ala Pro Gly Glu Ala Ile Glu Phe Ile
465 470 475 480
Phe Val Gly Asp Tyr Asn Asn Glu Ser Tyr Leu Arg Ser Lys Lys Asp
485 490 495
Ala Asp Leu Phe Leu Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu
500 505 510
Tyr Asn Thr Pro Asn Gln Ala Gly Tyr Arg Val Lys Pro Ala Gly Val
515 520 525
Leu Trp Thr Ile Glu Asn Thr Tyr Trp Asn Asp Phe Leu Trp Phe Asn
530 535 540
Ser Ser Asn Asn Arg Ile Tyr Val Ser Gly Thr Gly Asp Ala Asn Lys
545 550 555 560
Leu His Ser Gln Trp Ile Ile Asp Gly Leu Lys
565 570
<210>23
<211>1473
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>23
atgacgatcc gctcgaccga ctacgcgctg ctcgcgcagg agagctacca cgacagccag 60
gtcgatgctg acgtcaagct cgatggcatc tcctacaagg tattcgccac cacggacgac 120
cccctcaccg gcttccaggc caccgcttac cagcgccagg atacgggcga ggtggtcatc 180
gcctaccgcg gcacggaatt cgaccgcgaa cccgtgcgcg atggcggcgt cgacgcaggc 240
atggtgttgc ttggcgtcaa cgcccagtca cctgcatccg aggtattcac ccgcgaagtg 300
atcgaaaagg cgaagcacga agccgagctc aacgatcgcg agccgaagat caccgtcacc 360
gggcattccc tcggcggcac cctcgccgaa atcaatgccg cgaaatacgg cctccacggc 420
gaaaccttca atgcctacgg tgcggccagc ctcaagggca tccccgaggg cggcgacacg 480
gtgatcgacc atgtccgcgc cggcgatctc gtcagcgccg ccagcccgca ctacgggcag 540
gtgcgtgtgt acgcagctca gcaggatatc gataccctgc aacatgccgg ctaccgcgac 600
gacagtggca tcttcagcct gcgcaacccc atcaaggcca cggatttcga cgcccacgcg 660
atcgataact tcgtgcccaa cagcaagctg cttggccaat cgatcatcgc tcctgagaac 720
gaagcccgtt acgaagccca caagggcatg atcgatcgct atcgcgatga cgtggccgat 780
atccggaaag gcatctccgc tccctgggaa atccccaagg ccgtcggcga gctgaaggac 840
aagctcgaac acgaagcctt cgagctggcc ggcaagggca tcctcgccgt cgagcacggt 900
gtagccgagg tcgttcacga ggcgaaggaa gggttcgatc atctcaagga aggcttgcac 960
cacgtcaggg aagagatcag cgagggcatc cacgccgtgg aagagaaggc ttccagcgca 1020
tggcacaccc tcacccaccc gaaggaatgg ttcgagcacg acaaacctca agtgaatctc 1080
gaccatcccc agcatccaga caacgccttg ttcaagcagg cgcagggcgc ggtacacgcc 1140
ctcgatgcca cgcaaggccg cacgccagat aggacgagcg accagatcgc aggttctctg 1200
gtggtcgcgg cgcgacgcga tggtctcgag cgggtggacc gcgccgtgct cagcgatgac 1260
actagccggc tctacggcgt gcagggtgcg acggattcgc ccttgaagca gttcaccgag 1320
gtgaacacga cagtggcggc gcaaacgtca ctgcagcaaa gcagccaggc atggcagcag 1380
caagcagaga tcgcgcgaca gaaccaggca accagccagg ctcagcgcat ggaaccgcag 1440
gtgcccccgc aggcaccggc acatggcatg taa 1473
<210>24
<211>490
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>24
Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
1 5 10 15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ser Tyr
20 25 30
Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr
35 40 45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
50 55 60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65 70 75 80
Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Val Phe
85 90 95
Thr Arg Glu Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp
100 105 110
Arg Glu Pro Lys Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
115 120 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
130 135 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr
145 150 155 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
165 170 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln AsP Ile Asp Thr
180 185 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Phe Ser Leu Arg
195 200 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
210 215 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225 230 235 240
Glu Ala Arg Tyr Glu Ala His Lys Gly Met Ile Asp Arg Tyr Arg Asp
245 250 255
Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro
260 265 270
Lys Ala Val Gly Glu Leu Lys Asp Lys Leu Glu His Glu Ala Phe Glu
275 280 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Val Ala Glu Val
290 295 300
Val His Glu Ala Lys Glu Gly Phe Asp His Leu Lys Glu Gly Leu His
305 310 315 320
His Val Arg Glu Glu Ile Ser Glu Gly Ile His Ala Val Glu Glu Lys
325 330 335
Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu
340 345 350
His Asp Lys Pro Gln Val Asn Leu Asp His Pro Gln His Pro Asp Asn
355 360 365
Ala Leu Phe Lys Gln Ala Gln Gly Ala Val His Ala Leu Asp Ala Thr
370 375 380
Gln Gly Arg Thr Pro Asp Arg Thr Ser Asp Gln Ile Ala Gly Ser Leu
385 390 395 400
Val Val Ala Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val
405 410 415
Leu Ser Asp Asp Thr Ser Arg Leu Tyr Gly Val Gln Gly Ala Thr Asp
420 425 430
Ser Pro Leu Lys Gln Phe Thr Glu Val Asn Thr Thr Val Ala Ala Gln
435 440 445
Thr Ser Leu Gln Gln Ser Ser Gln Ala Trp Gln Gln Gln Ala Glu Ile
450 455 460
Ala Arg Gln Asn Gln Ala Thr Ser Gln Ala Gln Arg Met Glu Pro Gln
465 470 475 480
Val Pro Pro Gln Ala Pro Ala His Gly Met
485 490
<210>25
<211>1098
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>25
atgtgcgcca aagttaaagt agtcaaaata aagacaaaca caggcagccc aaacaaatac 60
cacttcaaga acctcgtctt cgaaggcggc ggcgtgaaag gcattgccta tgtgggagcc 120
cttaccaagc tcgacgagga aggcatcctt caaaacatta agcgcgtggc cggcacctca 180
gcaggagcaa tggtggccgt cctcgtcgga ttgggcttca ccgctaagga gataagcgac 240
atcctgtggg acatcaaatt ccagaacttt ttagacaact catggggcgt gatacgcaac 300
accaatcgtc tgctgacgga atacggctgg tataagggcg agtttttccg cgacctcatg 360
gctgattaca tcaaaagaaa gacagacgat ggcgagatta ctttcgggga gttggaggcc 420
atgagaaaag agggcaagcc cttcttggaa atccatctgg ttggctccga cctcacgaca 480
gggtattcca gagtgttcaa ctccaaaaac accccaaatg tgaaagtcgc cgatgccgcc 540
cgcatctcca tgtcgatacc gctgtttttc tccgctgtga gaggcgtgca aggcgacgac 600
cacctctatg tggacggtgg gcttttggac aactacgcca tcaagatttt cgaccagtcg 660
aaactcgttt cagacaaaaa caacaaaagg aagaccgagt attacaacag gctcaaccag 720
caagtgaacg cgaaagcaac gaaaagcaag acggaatctg tagagtatgt ctacaacaag 780
gagactttgg gcttccgctt ggatgccaaa gaggacatca acctcttcct caaccacgat 840
gatgcccctc aaaaagaaat caagagtttc ttctcttaca ccaaagcttt ggtttccacg 900
ctcatcgatt tccagaacaa tgtacacctg cacagcgacg actggcagcg tacggtctac 960
atcgacacac tcggtgtcag ctccattgac ttcggtctgt caaacacaac gaaacaagct 1020
cttgtcgatt cgggctacaa ctacaccaca gcctacctcg actggtacaa caacgacgag 1080
gataaagcca acaagtaa 1098
<210>26
<211>365
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>26
Met Cys Ala Lys Val Lys Val Val Lys Ile Lys Thr Asn Thr Gly Ser
1 5 10 15
Pro Asn Lys Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val
20 25 30
Lys Gly Ile Ala Tyr Val Gly Ala Leu Thr Lys Leu Asp Glu Glu Gly
35 40 45
Ile Leu Gln Asn Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Met
50 55 60
Val Ala Val Leu Val Gly Leu Gly Phe Thr Ala Lys Glu Ile Ser Asp
65 70 75 80
Ile Leu Trp Asp Ile Lys Phe Gln Asn Phe Leu Asp Asn Ser Trp Gly
85 90 95
Val Ile Arg Asn Thr Asn Arg Leu Leu Thr Glu Tyr Gly Trp Tyr Lys
100 105 110
Gly Glu Phe Phe Arg Asp Leu Met Ala Asp Tyr Ile Lys Arg Lys Thr
115 120 125
Asp Asp Gly Glu Ile Thr Phe Gly Glu Leu Glu Ala Met Arg Lys Glu
130 135 140
Gly Lys Pro Phe Leu Glu Ile His Leu Val Gly Ser Asp Leu Thr Thr
145 150 155 160
Gly Tyr Ser Arg Val Phe Asn Ser Lys Asn Thr Pro Asn Val Lys Val
165 170 175
Ala Asp Ala Ala Arg Ile Ser Met Ser Ile Pro Leu Phe Phe Ser Ala
180 185 190
Val Arg Gly Val Gln Gly Asp Asp His Leu Tyr Val Asp Gly Gly Leu
195 200 205
Leu Asp Asn Tyr Ala Ile Lys Ile Phe Asp Gln Ser Lys Leu Val Ser
210 215 220
Asp Lys Asn Asn Lys Arg Lys Thr Glu Tyr Tyr Asn Arg Leu Asn Gln
225 230 235 240
Gln Val Asn Ala Lys Ala Thr Lys Ser Lys Thr Glu Ser Val Glu Tyr
245 250 255
Val Tyr Asn Lys Glu Thr Leu Gly Phe Arg Leu Asp Ala Lys Glu Asp
260 265 270
Ile Asn Leu Phe Leu Asn His Asp Asp Ala Pro Gln Lys Glu Ile Lys
275 280 285
Ser Phe Phe Ser Tyr Thr Lys Ala Leu Val Ser Thr Leu Ile Asp Phe
290 295 300
Gln Asn Asn Val His Leu His Ser Asp Asp Trp Gln Arg Thr Val Tyr
305 310 315 320
Ile Asp Thr Leu Gly Val Ser Ser Ile Asp Phe Gly Leu Ser Asn Thr
325 330 335
Thr Lys Gln Ala Leu Val Asp Ser Gly Tyr Asn Tyr Thr Thr Ala Tyr
340 345 350
Leu Asp Trp Tyr Asn Asn Asp Glu Asp Lys Ala Asn Lys
355 360 365
<210>27
<211>1287
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>27
gtgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg 60
aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg 120
gtcgaggttc tcggcgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca 180
gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg 240
gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc 300
tccgggatta caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac 360
gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc 420
tggatcagag acctgattgc acagcgagtc gaggcggggc gctccgaggt cctgagccga 480
gccgacgccg atggacggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca 540
tttgccgagc ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc 600
ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg 660
gacatgccga tcgacgtcgc ggtacgcatc tccgcatcgt tgccatggtt tttcaaatcc 720
gtgaaatgga acggctccga atacatagat ggcggctgcc tgtcgaactt cccaatgccg 780
atattcgacg tcgatcccta tcgtggcgac gcatcgtcga aaatccggct cggcatcttc 840
ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatt 900
ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg 960
aaagcttctg cagaacactg ggtcgtcggc atcgacgtcg aaggcgccac ccgcgcgtcg 1020
aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat 1080
agcacgttca agttcgatct ttcggacgct gacaaggagc gcatggccga ggccggcgca 1140
aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt 1200
tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat 1260
tcgtttcgag ccttgatcgc ggcctag 1287
<210>28
<211>428
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>28
Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile
1 5 10 15
Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro
20 25 30
Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly
35 40 45
Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met
50 55 60
Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala
65 70 75 80
Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr
85 90 95
Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys
100 105 110
Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly ThrSer Asp Glu Arg
115 120 125
Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp
130 135 140
Leu Ile Ala Gln Arg Val Glu Ala Gly Arg Ser Glu Val Leu Ser Arg
145 150 155 160
Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys
165 170 175
Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro
180 185 190
Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser
195 200 205
Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile
210 215 220
Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser
225 230 235 240
Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn
245 250 255
Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp AlaSer
260 265 270
Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly
275 280 285
Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser
290 295 300
Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val
305 310 315 320
Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala
325 330 335
Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr
340 345 350
Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser
355 360 365
Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg
370 375 380
Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe
385 390 395 400
Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala
405 410 415
Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala
420 425
<210>29
<211>753
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>29
atgggaaacg gtgcagcagt tggttcgaat gataatggta gagaagaaag tgtttacgta 60
ctttctgtga tcgcctgtaa tgtttattat ttacaaaagt gtgaaggtgg ggcatcgcgt 120
gatagcgtga ttagagaaat caatagccaa actcaacctt taggatatga gattgtagca 180
gattctattc gtgatggtca tattggctct tttgcctgta agatggctgt ctttagaaat 240
aatggaaacg gcaattgtgt tttagcaatc aaagggactg atatgaataa tatcaatgac 300
ttggtgaatg acctaaccat gatattagga ggtattggtt ctgttgctgc aatccaacca 360
acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tacaggtcac 420
tcccttggag gctacatgac tgagatcatc gccaccaatc gtggacttcc aggtattgca 480
ttttgcgcac caggttcaaa tggtcccatt gtaaaattag gtggacaaga gacacctggc 540
tttcacaatg tgaactttga acatgatcca gcaggtaacg ttatgacggg ggtttatact 600
catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg 660
gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa 720
agtcataata cgggttatta ttacccaaaa taa 753
<210>30
<211>250
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>30
Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu
1 5 10 15
Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln
20 25 30
Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn
35 40 45
Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg
50 55 60
Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn
65 70 75 80
Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn
85 90 95
Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile
100 105 110
Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu
115 120 125
Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly
130 135 140
Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala
145 150 155 160
Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln
165 170 175
Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly
180 185 190
Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val
195 200 205
Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe
210 215 220
Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu
225 230 235 240
Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys
245 250
<210>31
<211>1422
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>31
atgaaaaaga aattatgtac atgggctctc gtaacagcga tatcttctgg agttgttgcg 60
attccaaccg tagcatctgc ttgcggaatg ggtgaagtaa tgaaacagga ggatcaagag 120
cacaaacgtg tgaagagatg gtctgcggag catccgcacc atgctaatga aagcacgcac 180
ttatggattg ctcgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa 240
gaaaatgaat tacaattctt aaaaatacct gaatataagg agttatttga aagagggctt 300
tatgatgccg attatcttga tgagtttaac gatggaggta caggtacaat cggtattgat 360
gggctaatta aaggaggctg gaaatctcat ttctatgatc ctgatacgaa aaagaactat 420
aaaggagaag aagaaccaac agccctttcg caaggggata aatattttaa attagcagga 480
gattatttta agaaagaaga ttggaaacaa gctttctatt atttaggtgt tgcgacgcat 540
tacttcacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacatgagt 600
gcaataaagt ttcatagcgc ttttgaaaat tatgtaacga cagttcagac accgtttgaa 660
gtgaaggatg ataagggaac atataatttg gtcaattctg atgatccgaa gcagtggata 720
catgaaacag cgaaactcgc aaaagcagaa attatgaata ttactagtga taatattaaa 780
tctcaatata ataaaggaaa caaagatctt tggcaacaag aagttatgcc agctgtccag 840
aggagtttag agaaagcgca aagaaacacg gcgggattta ttcatttatg gtttaaaaca 900
tatgttggca aaactgcagc tgaagatatt gaaactacac aggtaaaaga ttctaatgga 960
gaagcaatac aagaacaaaa aaaatactac gttgtgccta gtgagttttt aaatagaggt 1020
ttgacctttg aggtatatgc ttcgaatgac tacgcactat tatctaatca cgtagatgat 1080
aataaagttc atggtacacc tgttcagttt gtttttgata aagagaataa cggaattgtt 1140
catcggggag aaagtgtact gctgaaaatg acgcaatcta actatgatga ttatgtattt 1200
cttaattact ctaatatgac aaattggtta catcttgcga aacgaaaaac aaatactgca 1260
cagtttaaag tgtatccaaa tccggataac tcatctgaat atttcctata tacagatgga 1320
tacccggtaa attatcaaga aaatggtaat gggaagagct ggattgagtt aggaaagaaa 1380
acggataaac cgaaagcgtg gaaatttcaa caggcagaat aa 1422
<210>32
<211>473
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(20)
<223>从环境样品中获得
<400>32
Met Lys Lys Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ser Ser
1 5 10 15
Gly Val Val Ala Ile Pro Thr Val Ala Ser Ala Cys Gly Met Gly Glu
20 25 30
Val Met Lys Gln Glu Asp Gln Glu His Lys Arg Val Lys Arg Trp Ser
35 40 45
Ala Glu His Pro His His Ala Asn Glu Ser Thr His Leu Trp Ile Ala
50 55 60
Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65 70 75 80
Glu Asn Glu Leu Gln Phe Leu Lys Ile Pro Glu Tyr Lys Glu Leu Phe
85 90 95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
100 105 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys
115 120 125
Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr Lys Gly Glu Glu
130 135 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145 150 155 160
Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
165 170 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
180 185 190
Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe His Ser Ala Phe
195 200 205
Glu Asn Tyr Val Thr Thr Val Gln Thr Pro Phe Glu Val Lys Asp Asp
210 215 220
Lys Gly Thr Tyr Asn Leu Val Asn Ser Asp Asp Pro Lys Gln Trp Ile
225 230 235 240
His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met Asn Ile Thr Ser
245 250 255
Asp Asn Ile Lys Ser Gln Tyr Asn Lys Gly Asn Lys Asp Leu Trp Gln
260 265 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Lys Ala Gln Arg
275 280 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys
290 295 300
Thr Ala Ala Glu Asp Ile Glu Thr Thr Gln Val Lys Asp Ser Asn Gly
305 310 315 320
Glu Ala Ile Gln Glu Gln Lys Lys Tyr Tyr Val Val Pro Ser Glu Phe
325 330 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ser Asn Asp Tyr Ala
340 345 350
Leu Leu Ser Asn His Val Asp Asp Asn Lys Val His Gly Thr Pro Val
355 360 365
Gln Phe Val Phe Asp Lys Glu Asn Asn Gly Ile Val His Arg Gly Glu
370 375 380
Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asp Tyr Val Phe
385 390 395 400
Leu Asn Tyr Ser Asn Met Thr Asn Trp Leu His Leu Ala Lys Arg Lys
405 410 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asp Asn Ser Ser
420 425 430
Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
435 440 445
Gly Asn Gly Lys Ser Trp Ile Glu Leu Gly Lys Lys Thr Asp Lys Pro
450 455 460
Lys Ala Trp Lys Phe Gln Gln Ala Glu
465 470
<210>33
<211>792
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>33
atgagagcac tcgtgctggc aggcggtgga gccaagggct cgtttcaagt gggcgtgctg 60
cagcggttca cccccgcaga cttcggtctc gtggtgggat gctcggtcgg agctttaaac 120
gccgcggggt ttgcccacct gggtagccat ggcatcaaag acctctggca agggatcagg 180
agtcgagatg acatcctgtc ccgtgtctgg tggccgtttg gctcagacgg gatcttctcg 240
cagaagcctc ttgaaaagct cgtctccaaa gcatgcacgg gtcctgctcg ggtgccggtc 300
cacgtggcga cggtctgcct tgaacgcggc cttgtccact acgggatctc cggggactct 360
gactttgaga agaaagtgct ggcatcggct gcgatcccag gcgtggtgaa gccagttaag 420
atccatggcg accactacgt cgacggtggt gtcagagaga tctgtccgct gcgtcgagcc 480
atcgacctgg gcgccacgga gatcacagtc atcatgtgcg ctccggaata catcccgacc 540
tggtcgcgta gttcctcgct gttcccgttt gtgaacgtga tgatccggtc tctcgacatc 600
ctgaccgatg agatcctggt caacgacatc gccgagtgcg tggcaaagaa caagatgcca 660
ggtaaacgtc acgtaaagct caccatctac cggccgaaga aagagctcat gggcacgctc 720
gactttgacc ccaaagccat cgccgcaggg atcaaggcag gcaccgaagc ccagccaagg 780
ttctgggagt aa 792
<210>34
<211>263
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>34
Met Arg Ala Leu Val Leu Ala Gly Gly Gly Ala Lys Gly Ser Phe Gln
1 5 10 15
Val Gly Val Leu Gln Arg Phe Thr Pro Ala Asp Phe Gly Leu Val Val
20 25 30
Gly Cys Ser Val Gly Ala Leu Asn Ala Ala Gly Phe Ala His Leu Gly
35 40 45
Ser His Gly Ile Lys Asp Leu Trp Gln Gly Ile Arg Ser Arg Asp Asp
50 55 60
Ile Leu Ser Arg Val Trp Trp Pro Phe Gly Ser Asp Gly Ile Phe Ser
65 70 75 80
Gln Lys Pro Leu Glu Lys Leu Val Ser Lys Ala Cys Thr Gly Pro Ala
85 90 95
Arg Val Pro Val His Val Ala Thr Val Cys Leu Glu Arg Gly Leu Val
100 105 110
His Tyr Gly Ile Ser Gly Asp Ser Asp Phe Glu Lys Lys Val Leu Ala
115 120 125
Ser Ala Ala Ile Pro Gly Val Val Lys Pro Val Lys Ile His Gly Asp
130 135 140
His Tyr Val Asp Gly Gly Val Arg Glu Ile Cys Pro Leu Arg Arg Ala
145 150 155 160
Ile Asp Leu Gly Ala Thr Glu Ile Thr Val Ile Met Cys Ala Pro Glu
165 170 175
Tyr Ile Pro Thr Trp Ser Arg Ser Ser Ser Leu Phe Pro Phe Val Asn
180 185 190
Val Met Ile Arg Ser Leu Asp Ile Leu Thr Asp Glu Ile Leu Val Asn
195 200 205
Asp Ile Ala Glu Cys Val Ala Lys Asn Lys Met Pro Gly Lys Arg His
210 215 220
Val Lys Leu Thr Ile Tyr Arg Pro Lys Lys Glu Leu Met Gly Thr Leu
225 230 235 240
Asp Phe Asp Pro Lys Ala Ile Ala Ala Gly Ile Lys Ala Gly Thr Glu
245 250 255
Ala Gln Pro Arg Phe Trp Glu
260
<210>35
<211>1389
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>35
atgcccgagc cgcccgccgc atgccgttgc gattgcgcct gcgagcgcga ccagcacctt 60
ttttgcaagg gacccaagcg tatcctcgcg ctcgacggcg gcggcgtgcg cggcgccgtc 120
agcgtcgcat tcctcgaacg gatcgaggcg gtgctcgagg cccggctcgg acgcaaggtg 180
ctgctcggcc actggttcga cctgatcggc ggcacctcga cgggcgccat catcggcggc 240
gcgctggcga tgggattcgc ggccgaggac gtccaaagat tctatcacga gctcgcgccg 300
cgggtgttca ggcatccgct cctgcgcatc ggtctcctgc gcccgttccg cgcgaaattc 360
gacgcccgcc tgctgcgcga ggagatccac cgcatcatcg gcgacagcac gctcggcgac 420
aaagcgctga tgaccgggtt cgcgctcgtc gccaagcgga tggacaccgg cagcacctgg 480
atcctcgcca acaacaagcg cagcaaatac tgggaagggc gggacggcgt cgtcggcaac 540
aaggattatc tcctcggcag cctcattcgc gcgagcacgg cggcgccgct gtatttcgac 600
cccgaggagg tcgtgatcgc ggaggcccgc aaggacatcg agggcatcag gggcctgttc 660
gtcgacggcg gcgtcacgcc gcacaacaat ccttcgctcg cgatgctgct gctggcgctg 720
ctcgacgcct accggctgcg ctgggaaacg ggaccggaca agctcacggt cgtctcgatc 780
ggcactggaa cgcatcgcga ccgcgtcgtt cccgacacgc tcggcatggg caagaacgcg 840
aagatcgcgc tgcgcgccat gagctcgctg atgaacgacg tgcacgagct cgcgctcacg 900
cagatgcagt acctcggtga gacgctcacc ccgtggcgca tcaacgacga gctcggcgac 960
atgcggaccg agcggccgcc gcaaggcaag ctcttccgct tcctccgcta cgacgtccgg 1020
ctggagctcg attggatcaa cgaggacgag gagcgccggc gcaagatcaa gaacaaattc 1080
aagcgcgagc tgaccgagac cgacatgatc cgcctgcgca gcctcgacga tccgacgacc 1140
atcccggacc tctacatgct tgcccaggtc gcggccgagg agcaggtcaa ggcggagcac 1200
tggctcggcg acgtgccgga gtggagcgaa ggcgcgcgcc cgtgtgcgcc gcgccggcac 1260
ctgccgccga cgccgccggg ccgctccgag gattcggcgc gcttccgggc cgagaaggcc 1320
gtcggcgagt ggctcagttt tgcgcgcgcg aacatcacgc gcctcatgtc gcggaagccg 1380
ccgggttga 1389
<210>36
<211>462
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>36
Met Pro Glu Pro Pro Ala Ala Cys Arg Cys Asp Cys Ala Cys Glu Arg
1 5 10 15
Asp Gln His Leu Phe Cys Lys Gly Pro Lys Arg Ile Leu Ala Leu Asp
20 25 30
Gly Gly Gly Val Arg Gly Ala Val Ser Val Ala Phe Leu Glu Arg Ile
35 40 45
Glu Ala Val Leu Glu Ala Arg Leu Gly Arg Lys Val Leu Leu Gly His
50 55 60
Trp Phe Asp Leu Ile Gly Gly Thr Ser Thr Gly Ala Ile Ile Gly Gly
65 70 75 80
Ala Leu Ala Met Gly Phe Ala Ala Glu Asp Val Gln Arg Phe Tyr His
85 90 95
Glu Leu Ala Pro Arg Val Phe Arg His Pro Leu Leu Arg Ile Gly Leu
100 105 110
Leu Arg Pro Phe Arg Ala Lys Phe Asp Ala Arg Leu Leu Arg Glu Glu
115 120 125
Ile His Arg Ile Ile Gly Asp Ser Thr Leu Gly Asp Lys Ala Leu Met
130 135 140
Thr Gly Phe Ala Leu Val Ala Lys Arg Met Asp Thr Gly Ser Thr Trp
145 150 155 160
Ile Leu Ala Asn Asn Lys Arg Ser Lys Tyr Trp Glu Gly Arg Asp Gly
165 170 175
Val Val Gly Asn Lys Asp Tyr Leu Leu Gly Ser Leu Ile Arg Ala Ser
180 185 190
Thr Ala Ala Pro Leu Tyr Phe Asp Pro Glu Glu Val Val Ile Ala Glu
195 200 205
Ala Arg Lys Asp Ile Glu Gly Ile Arg Gly Leu Phe Val Asp Gly Gly
210 215 220
Val Thr Pro His Asn Asn Pro Ser Leu Ala Met Leu Leu Leu Ala Leu
225 230 235 240
Leu Asp Ala Tyr Arg Leu Arg Trp Glu Thr Gly Pro Asp Lys Leu Thr
245 250 255
Val Val Ser Ile Gly Thr Gly Thr His Arg Asp Arg Val Val Pro Asp
260 265 270
Thr Leu Gly Met Gly Lys Asn Ala Lys Ile Ala Leu Arg Ala Met Ser
275 280 285
Ser Leu Met Asn Asp Val His Glu Leu Ala Leu Thr Gln Met Gln Tyr
290 295 300
Leu Gly Glu Thr Leu Thr Pro Trp Arg Ile Asn Asp Glu Leu Gly Asp
305 310 315 320
Met Arg Thr Glu Arg Pro Pro Gln Gly Lys Leu Phe Arg Phe Leu Arg
325 330 335
Tyr Asp Val Arg Leu Glu Leu Asp Trp Ile Asn Glu Asp Glu Glu Arg
340 345 350
Arg Arg Lys Ile Lys Asn Lys Phe Lys Arg Glu Leu Thr Glu Thr Asp
355 360 365
Met Ile Arg Leu Arg Ser Leu Asp Asp Pro Thr Thr Ile Pro Asp Leu
370 375 380
Tyr Met Leu Ala Gln Val Ala Ala Glu Glu Gln Val Lys Ala Glu His
385 390 395 400
Trp Leu Gly Asp Val Pro Glu Trp Ser Glu Gly Ala Arg Pro Cys Ala
405 410 415
Pro Arg Arg His Leu Pro Pro Thr Pro Pro Gly Arg Ser Glu Asp Ser
420 425 430
Ala Arg Phe Arg Ala Glu Lys Ala Val Gly Glu Trp Leu Ser Phe Ala
435 440 445
Arg Ala Asn Ile Thr Arg Leu Met Ser Arg Lys Pro Pro Gly
450 455 460
<210>37
<211>1329
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>37
atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt 60
gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta 120
acccgccgct cggcgctgga actgctgaat gccgacsatc tggtcggcaa tgacccggcc 180
gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag 240
aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac 300
gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg 360
gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat 420
gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac 480
gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa 540
gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac 600
aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac 660
accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc 720
tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc 780
gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc 840
aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt 900
attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag 960
gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa 1020
gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg 1080
ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg 1140
gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc 1200
gatctgaatg atccacacat ggatattccg tacsactggc aatgggtgtc gtcgacgcaa 1260
tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca 1320
gtcgtcatc 1329
<210>38
<211>443
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<400>38
Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala
1 5 10 15
Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala
20 25 30
Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu
35 40 45
Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu
50 55 60
Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln
65 70 75 80
Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr
85 90 95
Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp
100 105 110
Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile
115 120 125
Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp
130 135 140
His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn
145 150 155 160
Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala
165 170 175
Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr
180 185 190
Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala
195 200 205
Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu Hi s Thr Val Arg Leu
210 215 220
Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys
225 230 235 240
Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn
245 250 255
Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala
260 265 270
Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val
275 280 285
Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met
290 295 300
Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln
305 310 315 320
Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn
325 330 335
Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro
340 345 350
Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu
355 360 365
Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln
370 375 380
Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly
385 390 395 400
Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val
405 410 415
Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln
420 425 430
Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile
435 440
<210>39
<211>1335
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>39
atggccaacc ccatcgtcat catccacggc tggagcgacg acttcggctc gttccgcaag 60
ctgcgcgact tcctctccac caacctcggc gttccggcga agatcctcaa gctcggcgac 120
tggatctcgc tcgacgacga cgtcggctac gccgacatcg cgatggcgct ggaacgcgcg 180
tggaaggcgg agaaactgcc gaccgcgccg cgttcggtcg acgtcgtcgt gcacagcacc 240
ggcgcgctgg tggtgcgcga atggatgacg cgctaccacg cgcccgaaac cgtgccgatc 300
cagcgcttcc tgcacctggc gccggccaac ttcggctcgc acctcgcgca caagggccgc 360
tcgttcatcg gccgcgcggt gaagggctgg aagaccggct tcgaaaccgg cacccgcatc 420
ctgcgcgggc tggaactcgc ctcgccctac tcgcgcgcgc tggccgagcg cgacctgttc 480
gtggcgccgt cgaagcgctg gtacggcgcc ggccgcatcc tcgccaccgt gctggtcggc 540
aacagcggct actccggcat ccaggccatc gccaacgagg acggctccga cggcaccgtg 600
cgcatcggca ccgccaacct gcaggcggcg cttgcgaagg tggtgttccc gcccggcccg 660
gtcgcgccgg tggtgcagtt ccgcaacatc gcgggcgcca ccgcgttcgc catcgtcgac 720
ggcgacaacc attccgacat caccatgaag gacaagccgt cgaagaccgg catccgcgag 780
gaactgatcc tcggcgcgct gaaggtgcgc gacgccgact tccccgagaa cgccgacggc 840
gcgttcccgt ggcaggcgaa gctcgacgcg aaggccggtg cggccaaggt gtcttcgccc 900
gggcgccaga acaccgtggt gcacctcacc gacagcttcg gcgacgacgt cgtcgatttc 960
ttcttcgagt tctggcgcag cgaacgcagc gacaaggtgt tcgagcagcg cttctacaag 1020
gacgtcatcg acgacgtgca cgtgtacgac ggcaacggcg cgtggcgctc gctcaacctc 1080
gacctcgaca agttcgaggc gctgcgcaag gacccgaagc tcggcttcga gaaactgctg 1140
gtcagcgtgt tcgcctcgcc cgcgaagaag ggcgacgcca aggtcggcta cagcaccgcc 1200
accggccgcg acatcggcgc ctggcacgtc gaaggccgtg acttcgccaa ggccttcacg 1260
ccgcaccgca ccctgttcgt cgacatcgag atcccacgca tcgtcgacga cgcggtgttc 1320
cggttccggg aatag 1335
<210>40
<211>444
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>40
Met Ala Asn Pro Ile Val Ile Ile His Gly Trp Ser Asp Asp Phe Gly
1 5 10 15
Ser Phe Arg Lys Leu Arg Asp Phe Leu Ser Thr Asn Leu Gly Val Pro
20 25 30
Ala Lys Ile Leu Lys Leu Gly Asp Trp Ile Ser Leu Asp Asp Asp Val
35 40 45
Gly Tyr Ala Asp Ile Ala Met Ala Leu Glu Arg Ala Trp Lys Ala Glu
50 55 60
Lys Leu Pro Thr Ala Pro Arg Ser Val Asp Val Val Val His Ser Thr
65 70 75 80
Gly Ala Leu Val Val Arg Glu Trp Met Thr Arg Tyr His Ala Pro Glu
85 90 95
Thr Val Pro Ile Gln Arg Phe Leu His Leu Ala Pro Ala Asn Phe Gly
100 105 110
Ser His Leu Ala His Lys Gly Arg Ser Phe Ile Gly Arg Ala Val Lys
115 120 125
Gly Trp Lys Thr Gly Phe Glu Thr Gly Thr Arg Ile Leu Arg Gly Leu
130 135 140
Glu Leu Ala Ser Pro Tyr Ser Arg Ala Leu Ala Glu Arg Asp Leu Phe
145 150 155 160
Val Ala Pro Ser Lys Arg Trp Tyr Gly Ala Gly Arg Ile Leu Ala Thr
165 170 175
Val Leu Val Gly Asn Ser Gly Tyr Ser Gly Ile Gln Ala Ile Ala Asn
180 185 190
Glu Asp Gly Ser Asp Gly Thr Val Arg Ile Gly Thr Ala Asn Leu Gln
195 200 205
Ala Ala Leu Ala Lys Val Val Phe Pro Pro Gly Pro Val Ala Pro Val
210 215 220
Val Gln Phe Arg Asn Ile Ala Gly Ala Thr Ala Phe Ala Ile Val Asp
225 230 235 240
Gly Asp Asn His Ser Asp Ile Thr Met Lys Asp Lys Pro Ser Lys Thr
245 250 255
Gly IIe Arg Glu Glu Leu Ile Leu Gly Ala Leu Lys Val Arg Asp Ala
260 265 270
Asp Phe Pro Glu Asn Ala Asp Gly Ala Phe Pro Trp Gln Ala Lys Leu
275 280 285
Asp Ala Lys Ala Gly Ala Ala Lys Val Ser Ser Pro Gly Arg Gln Asn
290 295 300
Thr Val Val His Leu Thr Asp Ser Phe Gly Asp Asp Val Val Asp Phe
305 310 315 320
Phe Phe Glu Phe Trp Arg Ser Glu Arg Ser Asp Lys Val Phe Glu Gln
325 330 335
Arg Phe Tyr Lys Asp Val Ile Asp Asp Val His Val Tyr Asp Gly Asn
340 345 350
Gly Ala Trp Arg Ser Leu Asn Leu Asp Leu Asp Lys Phe Glu Ala Leu
355 360 365
Arg Lys Asp Pro Lys Leu Gly Phe Glu Lys Leu Leu Val Ser Val Phe
370 375 380
Ala Ser Pro Ala Lys Lys Gly Asp Ala Lys Val Gly Tyr Ser Thr Ala
385 390 395 400
Thr Gly Arg Asp Ile Gly Ala Trp His Val Glu Gly Arg Asp Phe Ala
405 410 415
Lys Ala Phe Thr Pro His Arg Thr Leu Phe Val Asp Ile Glu Ile Pro
420 425 430
Arg Ile Val Asp Asp Ala Val Phe Arg Phe Arg Glu
435 440
<210>41
<211>1419
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>41
atgacgctcc gatcaacgga ctatgcgctg ctggcgcagg agagctacca cgacagccag 60
gtggacgccg acgtcaagct ggatggcgtg gcgtataaag tcttcgccac caccagcgac 120
gggctcaccg gattccaggc cacggcctac cagcgccagg acaccggcga ggtagtgatt 180
gcgtaccgcg gcacggagtt tgatcgcgag cccgtccgcg acggcggcgt cgatgcgggc 240
atggtgctgc tcggtgtcaa cgcacaggca ccagcgtcgg aagtgttcac ccggcaagtg 300
atcgagaagg cgaaacacga agccgagctc aacgaccgcg aaccgcagat caccgtcacc 360
ggccattccc tcggcggcac cctcgccgag atcaacgccg cgaagtacgg cctccatggc 420
gaaaccttca acgcctacgg cgcagccagc ctcaagggta ttccggaggg cggcgatacc 480
gtcatcgacc acgtccgtgc cggcgatctc gtcagcgcgg ccagccccca ctacgggcag 540
gtacgcgtct acgcggcgca gcaggacatc gatacgctgc aacacgccgg ttaccgcgat 600
gacagcggca tcctcagctt gcgcaacccg atcaaggcca cggatttcga tgcccatgcc 660
atcgataact tcgtgcccaa cagcaagctg ctcggtcagt cgatcatcgc gccggaaaac 720
gtggcgcgtt acgatgccca caaaggcatg gtcgaccgtt accgcgatga cgtggccgat 780
atccgcaagg gcatctcggc gccctgggaa atccccaagg ccatcggcga gctgaaggac 840
accctggagc acgaagcctt cgaactcgcc ggcaagggca ttctcgcggt ggagcacggc 900
ttcgaacatc tcaaggagga gatcggcgaa ggcatccacg ccgtggagga gaaagcttcc 960
agcgcgtggc ataccctcac ccatcccaag gaatggttcg agcacgataa acccaaggtg 1020
accctggacc acccggacca ccccgaccat gccctgttca agcaggcgca gggcgcggtg 1080
cacacagtcg atgcctcgca cggccgcacc cctgacaaga ccagcgacca gatcgccggc 1140
tcgctggtgg tatcggcacg ccgtgacggc cttgagcggg tagaccgcgc tgtactcagc 1200
gatgacgcca accgcctgta cggtgtgcag ggtgcggtgg actcgccgct gaagcaggtc 1260
accgaagtga acaccgccac cgccgcgcag acatcgctcc agcagagcag cgtggcctgg 1320
cagcaacagg cagaaatcgc gcgtcagaac caggcggcaa gccaggctca gcgcatggac 1380
cagcaggtgc cgccgcaggc acccgcgcac ggcatgtaa 1419
<210>42
<211>472
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>42
Met Thr Leu Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
1 5 10 15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Val Ala Tyr
20 25 30
Lys Val Phe Ala Thr Thr Ser Asp Gly Leu Thr Gly Phe Gln Ala Thr
35 40 45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
50 55 60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65 70 75 80
Met Val Leu Leu Gly Val Asn Ala Gln Ala Pro Ala Ser Glu Val Phe
85 90 95
Thr Arg Gln Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp
100 105 110
Arg Glu Pro Gln Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
115 120 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
130 135 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr
145 150 155 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
165 170 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
180 185 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg
195 200 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
210 215 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225 230 235 240
Val Ala Arg Tyr Asp Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp
245 250 255
Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro
260 265 270
Lys Ala Ile Gly Glu Leu Lys Asp Thr Leu Glu His Glu Ala Phe Glu
275 280 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Phe Glu His Leu
290 295 300
Lys Glu Glu Ile Gly Glu Gly Ile His Ala Val Glu Glu Lys Ala Ser
305 310 315 320
Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu His Asp
325 330 335
Lys Pro Lys Val Thr Leu Asp His Pro Asp His Pro Asp His Ala Leu
340 345 350
Phe Lys Gln Ala Gln Gly Ala Val His Thr Val Asp Ala Ser His Gly
355 360 365
Arg Thr Pro Asp Lys Thr Ser Asp Gln Ile Ala Gly Ser Leu Val Val
370 375 380
Ser Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val Leu Ser
385 390 395 400
Asp Asp Ala Asn Arg Leu Tyr Gly Val Gln Gly Ala Val Asp Ser Pro
405 410 415
Leu Lys Gln Val Thr Glu Val Asn Thr Ala Thr Ala Ala Gln Thr Ser
420 425 430
Leu Gln Gln Ser Ser Val Ala Trp Gln Gln Gln Ala Glu Ile Ala Arg
435 440 445
Gln Asn Gln Ala Ala Ser Gln Ala Gln Arg Met Asp Gln Gln Val Pro
450 455 460
Pro Gln Ala Pro Ala His Gly Met
465 470
<210>43
<211>1287
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>43
atgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg 60
aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg 120
gtcgaggttc tcggtgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca 180
gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg 240
gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc 300
tccgggatca caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac 360
gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc 420
tggatcagag acctgattgc acagcgagtc gaggcagggc gctcagaggt gctgagccga 480
gccgacgccg acgggcggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca 540
tttgccgaac ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc 600
ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg 660
gacatgccga tcgacgtcgc ggtacgcatc tcggcatcgt tgccatggtt tttcaaatcc 720
gtgaaatgga acggctccga atacatagat ggcggatgcc tgtcgaactt cccaatgccg 780
atattcgacg tcgatcccta tcgtggcgac gcatcgtcga agatccggct cggcatcttc 840
ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatc 900
ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg 960
aaagcctcgg cagaacactg ggtcgtcggc atcgatgtcg agggcgccac ccgcgcgtcg 1020
aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat 1080
agcacgttca agttcgatct ctcagacgcg gacaaggagc gcatggccga ggccggcgca 1140
aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt 1200
tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat 1260
tcgtttcgag ccttgatcgc ggcctag 1287
<210>44
<211>428
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>44
Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile
1 5 10 15
Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro
20 25 30
Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly
35 40 45
Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met
50 55 60
Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala
65 70 75 80
Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr
85 90 95
Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys
100 105 110
Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly Thr Ser Asp Glu Arg
115 120 125
Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp
130 135 140
Leu Ile Ala Gln Arg Val Glu Ala GIy Arg Ser Glu Val Leu Ser Arg
145 150 155 160
Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys
165 170 175
Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro
180 185 190
Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser
195 200 205
Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile
210 215 220
Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser
225 230 235 240
Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn
245 250 255
Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp Ala Ser
260 265 270
Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly
275 280 285
Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser
290 295 300
Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val
305 310 315 320
Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala
325 330 335
Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr
340 345 350
Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser
355 360 365
Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg
370 375 380
Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe
385 390 395 400
Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala
405 410 415
Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala
420 425
<210>45
<211>1038
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>45
atgacaaccc aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga 120
gggtgcagtg cgggtgcgat taatgcgctg atttttgcgc tgggttacac ggttcgtgag 180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggtgtt 240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt 300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360
ctgcaaaatg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420
gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480
tccatgtcga taccgctgtt ctttgcagcc gtgcgtcacg gtgatcgaca agatgtgtat 540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt 600
gatctggcca aagatcccgg tgctgttcgg cgaacgggtt attacaacaa agaaaacgct 660
cgctttcagc ttgagcggcc cggtcatagc ccctatgttt acaatcgcca gaccttgggt 720
ttgcgtcttg atagtcgcga gcagataggg ctctttcgtt atgacgaacc cctcaagggc 780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacattg 900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa 960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcccgtg 1020
aatagagtgg agtcatag 1038
<210>46
<211>345
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>46
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
20 25 30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
50 55 60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65 70 75 80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
85 90 95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
100 105 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Asn Ala Lys Leu Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
165 170 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
180 185 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
195 200 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
210 215 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Arg Glu Gln Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
260 265 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
275 280 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305 310 315 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
325 330 335
Glu Lys Pro Val Asn Arg Val Glu Ser
340 345
<210>47
<211>1476
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>47
atgtcaacaa aagtagtatt tgtacatgga tggagcgtta ccaacctaaa tacatatggc 60
gaacttccgt tgagattaaa ggccgaagca ataagcagga acctgaacat cgaagtaaat 120
gaaattttcc tgggccgtta tatcagcttt aatgataaca ttacattaga tgacgtttcg 180
cgggctttta atacggccat tagcgaacag ttagacaata cagacaggtt tatatgtatt 240
acacattcta ccggagggcc ggttattcgc gaatggttaa ataaatacta ttataatgaa 300
cgtccaccac taagtcattt aataatgctt gcaccggcca attttggttc ggcattggct 360
cgtttaggga aaagtaaatt aagccgtatt aaaagttggt ttgaaggtgt agaaccaggg 420
cagaaaattt tagactggct ggagtgtgga agcaaccaat cgtggttact aaataaagac 480
tggatcgaca atggcaattt tcagattggc gctgataagt atttcccgtt tgttatcatt 540
ggccagtcga ttgatcgtaa actttacgat catcttaact catataccgg cgagcttggg 600
tccgatggtg tagttcgcac ctcaggagct aatcttaatt cgcggtatat taagcttgtt 660
caggacagaa atacaatagc taatggaaat atttccagta cattacgaat tgccgaatat 720
agagaagctt gtgcaacgcc catacgggta gttagaggta aatcgcattc gggcgatgaa 780
atgggtatca tgaaaagtgt taaaaaagaa attactgatg ccggaagcaa ggaaacaata 840
aatgccatat tcgagtgtat tgaagttaca aacaacgaac aatatcaatc cttaattact 900
aaatttgata acgaaacagc acaggtacaa aaggatgagc tgattgaaac ggaaacagaa 960
ttatttttaa tgcaccgtca tttcattcac gaccgctttt cgcaattcat ttttaaagta 1020
actgactcag aagggcaacc tgttacagat tatgatttaa tttttacagc cgggccacaa 1080
aacgatgcga accacttacc ggaaggattt gccattgaca ggcaacaaaa ttcaaataat 1140
aacgaaacca ttacgtatta ttttaattac gatgtattga aaggggctcc cgcaaatgtt 1200
taccgggacg cattaccagg tatttctatg ctggggctaa ccataaaccc aaggccggac 1260
gaaggttttg taagatatat cccatgcagc attaaagcca attccgagtt gatggaaaaa 1320
gcctttaaac caaattctac taccttggtc gatattgtta ttcaacgtgt agttagcaaa 1380
gaagtttttc ggttggaaaa gttaactggt agctcaatgc caacagacaa agatgggaat 1440
tttaaaaata ctgaacctgg taacgaaata atatga 1476
<210>48
<211>491
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>48
Met Ser Thr Lys Val Val Phe Val His Gly Trp Ser Val Thr Asn Leu
1 5 10 15
Asn Thr Tyr Gly Glu Leu Pro Leu Arg Leu Lys Ala Glu Ala Ile Ser
20 25 30
Arg Asn Leu Asn Ile Glu Val Asn Glu Ile Phe Leu Gly Arg Tyr Ile
35 40 45
Ser Phe Asn Asp Asn Ile Thr Leu Asp Asp Val Ser Arg Ala Phe Asn
50 55 60
Thr Ala Ile Ser Glu Gln Leu Asp Asn Thr Asp Arg Phe Ile Cys Ile
65 70 75 80
Thr His Ser Thr Gly Gly Pro Val Ile Arg Glu Trp Leu Asn Lys Tyr
85 90 95
Tyr Tyr Asn Glu Arg Pro Pro Leu Ser His Leu Ile Met Leu Ala Pro
100 105 110
Ala Asn Phe Gly Ser Ala Leu Ala Arg Leu Gly Lys Ser Lys Leu Ser
115 120 125
Arg Ile Lys Ser Trp Phe Glu Gly Val Glu Pro Gly Gln Lys Ile Leu
130 135 140
Asp Trp Leu Glu Cys Gly Ser Asn Gln Ser Trp Leu Leu Asn Lys Asp
145 150 155 160
Trp Ile Asp Asn Gly Asn Phe Gln Ile Gly Ala Asp Lys Tyr Phe Pro
165 170 175
Phe Val Ile Ile Gly Gln Ser Ile Asp Arg Lys Leu Tyr Asp His Leu
180 185 190
Asn Ser Tyr Thr Gly Glu Leu Gly Ser Asp Gly Val Val Arg Thr Ser
195 200 205
Gly Ala Asn Leu Asn Ser Arg Tyr Ile Lys Leu Val Gln Asp Arg Asn
210 215 220
Thr Ile Ala Asn Gly Asn Ile Ser Ser Thr Leu Arg Ile Ala Glu Tyr
225 230 235 240
Arg Glu Ala Cys Ala Thr Pro Ile Arg Val Val Arg Gly Lys Ser His
245 250 255
Ser Gly Asp Glu Met Gly Ile Met Lys Ser Val Lys Lys Glu Ile Thr
260 265 270
Asp Ala Gly Ser Lys Glu Thr Ile Asn Ala Ile Phe Glu Cys Ile Glu
275 280 285
Val Thr Asn Asn Glu Gln Tyr Gln Ser Leu Ile Thr Lys Phe Asp Asn
290 295 300
Glu Thr Ala Gln Val Gln Lys Asp Glu Leu Ile Glu Thr Glu Thr Glu
305 310 315 320
Leu Phe Leu Met His Arg His Phe Ile His Asp Arg Phe Ser Gln Phe
325 330 335
Ile Phe Lys Val Thr Asp Ser Glu Gly Gln Pro Val Thr Asp Tyr Asp
340 345 350
Leu Ile Phe Thr Ala Gly Pro Gln Asn Asp Ala Asn His Leu Pro Glu
355 360 365
Gly Phe Ala Ile Asp Arg Gln Gln Asn Ser Asn Asn Asn Glu Thr Ile
370 375 380
Thr Tyr Tyr Phe Asn Tyr Asp Val Leu Lys Gly Ala Pro Ala Asn Val
385 390 395 400
Tyr Arg Asp Ala Leu Pro Gly Ile Ser Met Leu Gly Leu Thr Ile Asn
405 410 415
Pro Arg Pro Asp Glu Gly Phe Val Arg Tyr Ile Pro Cys Ser Ile Lys
420 425 430
Ala Asn Ser Glu Leu Met Glu Lys Ala Phe Lys Pro Asn Ser Thr Thr
435 440 445
Leu Val Asp Ile Val Ile Gln Arg Val Val Ser Lys Glu Val Phe Arg
450 455 460
Leu Glu Lys Leu Thr Gly Ser Ser Met Pro Thr Asp Lys Asp Gly Asn
465 470 475 480
Phe Lys Asn Thr Glu Pro Gly Asn Glu Ile Ile
485 490
<210>49
<211>1257
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>49
atgaattttt ggtcctttct tcttagtata accttaccta tgggggtagg cgttgctcat 60
gcacagcccg atacggattt tcaatcggct gagccttatg tctcttctgc gccaatgggg 120
cgacaaactt atacttacgt gcgttgttgg tatcgcacca gccacagtac ggatgatcca 180
gcgacagatt ggcagtgggc gagaaactcc gatggtagct attttacttt gcaaggatac 240
tggtggagct cggtaagact aaaaaatatg ttttacactc aaacctcgca aaatgttatt 300
cgtcagcgct gcgaacacac tttaagcatt aatcatgata atgcggatat tactttttat 360
gcggcggata atcgtttctc attaaaccat acgatttggt cgaatgatcc tgtcatgcag 420
gctaatcaaa tcaacaagat tgtcgcgttt ggtgacagct tgtccgatac cggtaatatt 480
tttaatgccg cgcagtggcg ttttcctaat cccaatagtt ggtttttggg gcatttttct 540
aacggtttgg tatggactga gtacttagct aaacagaaaa acttaccgat atataactgg 600
gcggttggtg gcgctgctgg ggcgaatcaa tatgtggcgt taaccggtgt tacaggccaa 660
gtgaactctt atttacagta catgggtaaa gcgcaaaact atcgtccaca gaataccttg 720
tacactttgg tcttcggttt gaatgatttt atgaattata accgtgaggt tgctgaggtg 780
gcggctgatt ttgaaacggc attacagcgt ttaacgcaag ctggcgcgca aaatatttta 840
atgatgacgc taccggatgt gactaaagca ccacagttta cctactcaac tcaagcggaa 900
atcgacttga ttcaaggtaa aatcaatgcg ttgaacatca agttaaaaca gttgactgcg 960
caatatattt tacaaggcta tgccattcat ctatttgata cttatgagtt atttgattca 1020
atggtcgctg aaccggaaaa gcatggcttt gctaatgcca gtgaaccttg tttgaatctc 1080
acccgttctt cagcggcgga ttatttgtac cgtcatccca ttaccaatac ttgtgctcgt 1140
tatggtgcag acaaatttgt attttgggat gtcacccatc caaccacggc aactcatcgc 1200
tatatttcac aaacgctgtt agcgccgggt aatggattac aatattttaa tttttaa 1257
<210>50
<211>418
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<400>50
Met Asn Phe Trp Ser Phe Leu Leu Ser Ile Thr Leu Pro Met Gly Val
1 5 10 15
Gly Val Ala His Ala Gln Pro Asp Thr Asp Phe Gln Ser Ala Glu Pro
20 25 30
Tyr Val Ser Ser Ala Pro Met Gly Arg Gln Thr Tyr Thr Tyr Val Arg
35 40 45
Cys Trp Tyr Arg Thr Ser His Ser Thr Asp Asp Pro Ala Thr Asp Trp
50 55 60
Gln Trp Ala Arg Asn Ser Asp Gly Ser Tyr Phe Thr Leu Gln Gly Tyr
65 70 75 80
Trp Trp Ser Ser Val Arg Leu Lys Asn Met Phe Tyr Thr Gln Thr Ser
85 90 95
Gln Asn Val Ile Arg Gln Arg Cys Glu His Thr Leu Ser Ile Asn His
100 105 110
Asp Asn Ala Asp Ile Thr Phe Tyr Ala Ala Asp Asn Arg Phe Ser Leu
115 120 125
Asn His Thr Ile Trp Ser Asn Asp Pro Val Met Gln Ala Asn Gln Ile
130 135 140
Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Ile
145 150 155 160
Phe Asn Ala Ala Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp Phe Leu
165 170 175
Gly His Phe Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Lys Gln
180 185 190
Lys Asn Leu Pro Ile Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Ala
195 200 205
Asn Gln Tyr Val Ala Leu Thr Gly Val Thr Gly Gln Val Asn Ser Tyr
210 215 220
Leu Gln Tyr Met Gly Lys Ala Gln Asn Tyr Arg Pro Gln Asn Thr Leu
225 230 235 240
Tyr Thr Leu Val Phe Gly Leu Asn Asp Phe Met Asn Tyr Asn Arg Glu
245 250 255
Val Ala Glu Val Ala Ala Asp Phe Glu Thr Ala Leu Gln Arg Leu Thr
260 265 270
Gln Ala Gly Ala Gln Asn Ile Leu Met Met Thr Leu Pro Asp Val Thr
275 280 285
Lys Ala Pro Gln Phe Thr Tyr Ser Thr Gln Ala Glu Ile Asp Leu Ile
290 295 300
Gln Gly Lys Ile Asn Ala Leu Asn Ile Lys Leu Lys Gln Leu Thr Ala
305 310 315 320
Gln Tyr Ile Leu Gln Gly Tyr Ala Ile His Leu Phe Asp Thr Tyr Glu
325 330 335
Leu Phe Asp Ser Met Val Ala Glu Pro Glu Lys His Gly Phe Ala Asn
340 345 350
Ala Ser Glu Pro Cys Leu Asn Leu Thr Arg Ser Ser Ala Ala Asp Tyr
355 360 365
Leu Tyr Arg His Pro Ile Thr Asn Thr Cys Ala Arg Tyr Gly Ala Asp
370 375 380
Lys Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr His Arg
385 390 395 400
Tyr Ile Ser Gln Thr Leu Leu Ala Pro Gly Asn Gly Leu Gln Tyr Phe
405 410 415
Asn Phe
<210>51
<211>1482
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>51
atgacaatcc gctcaacgga ctatgcgctg ctcgcgcagg agagctacca cgacagccag 60
gtcgatgccg acgtcaaact cgatggcatc gcctacaagg tcttcgccac caccgatgac 120
ccgctcacgg ggttccaggc caccgcgtac cagcgccagg acaccggcga agtcgtcatc 180
gcctatcgtg gtacggaatt cgaccgcgag cccgttcgcg acggcggcgt cgatgccggc 240
atggtgctgc tgggggtgaa tgcccagtcg cctgcctccg agctatttac ccgcgaagtg 300
atcgagaagg cgacgcacga agccgaactc aatgaccgcg agccccggat caccgtgact 360
ggccactccc tcggcggcac cctcgccgaa atcaacgcgg ccaagtacgg cctgcacggc 420
gaaaccttca acgcatacgg tgcggccagc ctcaagggca tcccggaagg cggcaatacc 480
gtgatcgacc acgtgcgcgc tggcgacctc gtcagcgccg ccagcccgca ttacgggcag 540
gtgcgcgtct acgcggccca gcaggatatc gacaccttgc agcatgccgg ctaccgcgac 600
gacagcggca tccttagcct gcgcaacccg atcaaggcca cggatttcga cgcgcacgcc 660
atcgacaact tcgtgccgaa cagcaaactg cttggccagt cgatcatcgc gccggaaaac 720
gaagcccgtt acgaagccca caagggcatg gtcgaccgct accgcgatga cgtggctgac 780
atccgcatgc tcgtctccgc tcccctgaac atcccgcgca ccatcggcga tatcaaggat 840
gccgtggaac gcgaggcatt tgagctggct ggcaagggca tcctcgccgt tgaacacggc 900
atcgaagagg tcgtgcacga ggcaaaggaa ggcttcgagc acctcaagga aggctttgag 960
cacctgaagg aagaagtcag cgagggcttc catgccttcg aggaaaaggc ctccagcgcg 1020
tggcatacgc tgacccatcc caaggaatgg ttcgagcacg acaagccgca ggtcgccctg 1080
aaccacccac agcacccgga caacgaactg ttcaagaagg tgctcgaagg cgtgcaccag 1140
gttgatgcga agcagggtcg ttcacccgac cagctcagtg agaacctggc cgcatcgctt 1200
accgttgccg cacgcaagga aggcctggac aaggtcaacc acgtgctgct cgacgacccc 1260
ggcattcgca cctacgccgt gcagggtgag ctcaactcgc cgttgaagca ggtctccagt 1320
gtcgataacg cccaggcggt cgccacaccg gtggcccaga gcagcgcgca atggcagcag 1380
gctgccgagg cgcggcaggc acagcacaat gaggcgcttg cgcagcagca ggcgcaacag 1440
cagcagaaca accggcccaa ccatggggtt gccggcccgt ga 1482
<210>52
<211>493
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>52
Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
1 5 10 15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ala Tyr
20 25 30
Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr
35 40 45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
50 55 60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65 70 75 80
Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Leu Phe
85 90 95
Thr Arg Glu Val Ile Glu Lys Ala Thr His Glu Ala Glu Leu Asn Asp
100 105 110
Arg Glu Pro Arg Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
115 120 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
130 135 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asn Thr
145 150 155 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
165 170 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
180 185 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg
195 200 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
210 215 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225 230 235 240
Glu Ala Arg Tyr Glu Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp
245 250 255
Asp Val Ala Asp Ile Arg Met Leu Val Ser Ala Pro Leu Asn Ile Pro
260 265 270
Arg Thr Ile Gly Asp Ile Lys Asp Ala Val Glu Arg Glu Ala Phe Glu
275 280 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Ile Glu Glu Val
290 295 300
Val His Glu Ala Lys Glu Gly Phe Glu His Leu Lys Glu Gly Phe Glu
305 310 315 320
Hi s Leu Lys Glu Glu Val Ser Glu Gly Phe His Ala Phe Glu Glu Lys
325 330 335
Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu
340 345 350
His Asp Lys Pro Gln Val Ala Leu Asn Hi s Pro Gln His Pro Asp Asn
355 360 365
Glu Leu Phe Lys Lys Val Leu Glu Gly Val His Gln Val Asp Ala Lys
370 375 380
Gln Gly Arg Ser Pro Asp Gln Leu Ser Glu Asn Leu Ala Ala Ser Leu
385 390 395 400
Thr Val Ala Ala Arg Lys Glu Gly Leu Asp Lys Val Asn His Val Leu
405 410 415
Leu Asp Asp Pro Gly Ile Arg Thr Tyr Ala Val Gln Gly Glu Leu Asn
420 425 430
Ser Pro Leu Lys Gln Val Ser Ser Val Asp Asn Ala Gln Ala Val Ala
435 440 445
Thr Pro Val Ala Gln Ser Ser Ala Gln Trp Gln Gln Ala Ala Glu Ala
450 455 460
Arg Gln Ala Gln His Asn Glu Ala Leu Ala Gln Gln Gln Ala Gln Gln
465 470 475 480
Gln Gln Asn Asn Arg Pro Asn His Gly Val Ala Gly Pro
485 490
<210>53
<211>1491
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>53
atgcgtcagg ttacattagt atttgttcat ggctacagcg ttacaaacat cgacacttat 60
ggtgaaatgc cactcaggct ccgcaacgaa ggagccacac gtgatataga aataaaaatt 120
gagaacattt tcctggggcg ctacatcagc tttaatgatg atgtgagatt aaatgatgtt 180
tccagagcat tggaaacagc cgtacaacaa cagattgcac cgggaaataa aaacaattcc 240
cgttacgtat tcatcaccca ctctaccggc ggaccggtag tgagaaactg gtgggatctg 300
tactataaaa acagcacgaa acaatgccct atgagccacc tcattatgct ggctcctgcc 360
aattttggct cggcactggc acaactggga aaaagcaaac taagccgcat taaatcctgg 420
ttcgatggtg tggaacccgg acagaatgta ttgaattggc tggaactggg aagcgcggaa 480
gcatggaagc taaacaccga ctggattaag agtgatggaa gtcagatctc ggcacagggt 540
atttttcctt ttgtgatcat aggtcaggac attgaccgca aattatacga tcatttaaac 600
tcctacaccg gtgagctggg ttccgacggc gtggtgcgtt cggccgcagc caatttaaat 660
gctacttatg taaaactcac acaacctaaa cccaccttgg taaatggaaa actggtaaca 720
ggtaatctgg aaataggaga agtaaaacaa gcgccttata cacccatgcg catcgtctca 780
aaaaaatcgc attccaacaa ggatatggga attatgagaa gtgtactgaa atcaacaaat 840
gatgccaaca gcgccgaaac ggtaaacgcc atttttgact gcattaatgt gaaaacctta 900
accgattacc agagcattgc cacacagttt gattcgcaaa caaaagacgt gcaggaaaat 960
tcaattattg aaagggaaaa aacgcccttt ggaactaaaa actatattca cgaccgtttc 1020
tcccaggtca ttttcagagt aacagacagt gaaggttacc cggttaccag ttttgatctg 1080
atcctcaccg gcggcgaaaa aaatgatccc aacgccttgc ctcagggctt ttttgtggac 1140
agacaatgca acagtgtcaa taaatcgacc attacttatt ttttaaatta cgatattatg 1200
aacggcacac cagctatagc aggtataaga ccggcatcca aaggcatgga aaaactgggt 1260
ctgatcatta acccaaggcc tgaagaaggc tttgtgcgtt acattccctg caaaataaac 1320
acatcgcccg atttgtttga cgccgctctg aaacccaacg ccacaacgct tattgatatt 1380
gtattgcaac gcgtggtaag taccgaagta ttccgctttg aaggaacaga cggggtaacg 1440
ccgcctaaaa aagatttctc gaaagtgaaa cccggaacgg atattatttg a 1491
<210>54
<211>496
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>54
Met Arg Gln Val Thr Leu Val Phe Val His Gly Tyr Ser Val Thr Asn
1 5 10 15
Ile Asp Thr Tyr Gly Glu Met Pro Leu Arg Leu Arg Asn Glu Gly Ala
20 25 30
Thr Arg Asp Ile Glu Ile Lys Ile Glu Asn Ile Phe Leu Gly Arg Tyr
35 40 45
Ile Ser Phe Asn Asp Asp Val Arg Leu Asn Asp Val Ser Arg Ala Leu
50 55 60
Glu Thr Ala Val Gln Gln Gln Ile Ala Pro Gly Asn Lys Asn Asn Ser
65 70 75 80
Arg Tyr Val Phe Ile Thr His Ser Thr Gly Gly Pro Val Val Arg Asn
85 90 95
Trp Trp Asp Leu Tyr Tyr Lys Asn Ser Thr Lys Gln Cys Pro Met Ser
100 105 110
His Leu Ile Met Leu Ala Pro Ala Asn Phe Gly Ser Ala Leu Ala Gln
115 120 125
Leu Gly Lys Ser Lys Leu Ser Arg Ile Lys Ser Trp Phe Asp Gly Val
130 135 140
Glu Pro Gly Gln Asn Val Leu Asn Trp Leu Glu Leu Gly SerAla Glu
145 150 155 160
Ala Trp Lys Leu Asn Thr Asp Trp Ile Lys Ser Asp Gly Ser Gln Ile
165 170 175
Ser Ala Gln Gly Ile Phe Pro Phe Val Ile Ile Gly Gln Asp Ile Asp
180 185 190
Arg Lys Leu Tyr Asp His Leu Asn Ser Tyr Thr Gly Glu Leu Gly Ser
195 200 205
Asp Gly Val Val Arg Ser Ala Ala Ala Asn Leu Asn Ala Thr Tyr Val
210 215 220
Lys Leu Thr Gln Pro Lys Pro Thr Leu Val Asn Gly Lys Leu Val Thr
225 230 235 240
Gly Asn Leu Glu Ile Gly Glu Val Lys Gln Ala Pro Tyr Thr Pro Met
245 250 255
Arg Ile Val Ser Lys Lys Ser His Ser Asn Lys Asp Met Gly Ile Met
260 265 270
Arg Ser Val Leu Lys Ser Thr Asn Asp Ala Asn Ser Ala Glu Thr Val
275 280 285
Asn Ala Ile Phe Asp Cys Ile Asn Val Lys Thr Leu Thr Asp Tyr Gln
290 295 300
Ser Ile Ala Thr Gln Phe Asp Ser Gln Thr Lys Asp Val Gln Glu Asn
305 310 315 320
Ser Ile Ile Glu Arg Glu Lys Thr Pro Phe Gly Thr Lys Asn Tyr Ile
325 330 335
His Asp Arg Phe Ser Gln Val Ile Phe Arg Val Thr Asp Ser Glu Gly
340 345 350
Tyr Pro Val Thr Ser Phe Asp Leu Ile Leu Thr Gly Gly Glu Lys Asn
355 360 365
Asp Pro Asn Ala Leu Pro Gln Gly Phe Phe Val Asp Arg Gln Cys Asn
370 375 380
Ser Val Asn Lys Ser Thr Ile Thr Tyr Phe Leu Asn Tyr Asp Ile Met
385 390 395 400
Asn Gly Thr Pro Ala Ile Ala Gly Ile Arg Pro Ala Ser Lys Gly Met
405 410 415
Glu Lys Leu Gly Leu Ile Ile Asn Pro Arg Pro Glu Glu Gly Phe Val
420 425 430
Arg Tyr Ile Pro Cys Lys Ile Asn Thr Ser Pro Asp Leu Phe Asp Ala
435 440 445
Ala Leu Lys Pro Asn Ala Thr Thr Leu Ile Asp Ile Val Leu Gln Arg
450 455 460
Val Val Ser Thr Glu Val Phe Arg Phe Glu Gly Thr Asp Gly Val Thr
465 470 475 480
Pro Pro Lys Lys Asp Phe Ser Lys Val Lys Pro Gly Thr Asp Ile Ile
485 490 495
<210>55
<211>1041
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>55
atggcttcac aattcagaaa tctggttttt gaaggaggcg gtgtgaaggg catcgcctat 60
atcggcgcea tgcaggtgct ggagcagcgg ggactgctca aggatattgt ccgggtggga 120
ggtaccagtg caggcgccat caacgcgctg atcttttcgc tgggctttac catcaaagag 180
cagcaggata ttctcaactc caccaacttc agggagttta tggacagctc gttcgggttc 240
atccgaaact tccggaggtt atggagcgaa ttcggttgga accgcggcga tgtattttcg 300
gactgggccg gggagctggt gaaagagaag ctcggcaaaa agaacgccac gttcggcgat 360
ctgaaaaagg cgaaacgtcc cgatctgtac gtgatcggca ccaatctctc tacggggttt 420
tccgagacct tttcgcacga acgccacgcc gacatgcctc tggtagatgc ggtgcggata 480
agcatgtcga tcccgctctt ttttgctgca cggaggctgg gaaaacgtaa ggatgtgtat 540
gtggatggcg gggtgatgct caactatccc gtgaagctgt tcgacaggga gaagtatatc 600
gatttggaga aagagaatga ggcggcccgc tatgtggagt actacaatca agagaatgcc 660
cggtttctgc tcgagcggcc cggccgaagc ccttatgtgt ataaccggca gactctcggt 720
ctgcggctcg acacgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc 780
aagcagatca accgtttccc cgaatacgcc agagccctga tcggctcgct gatgcaggta 840
caggagaaca tccacctgaa aagtgacgac tggcagcgaa cgctctacat caacacgctg 900
gatgtgggca ccaccgattt cgacattacc gacgagaaga aaaaagtgct ggtgaatgag 960
gggatcaagg gagcggagac ctatttccgc tggtttgagg atcccgaaga aaaaccggtg 1020
aataaggtga atcttgtctg a 1041
<210>56
<211>346
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>56
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly Leu
20 25 30
Leu Lys Asp Ile Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile
50 55 60
Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe
65 70 75 80
Ile Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly
85 90 95
Asp Val Phe Ser Asp Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly
100 105 110
Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe
130 135 140
Ser His Glu Arg His Ala Asp Met Pro Leu Val Asp Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg
165 170 175
Lys Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys
180 185 190
Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Asn Glu Ala
195 200 205
Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu
210 215 220
Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Thr Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Arg Ala
260 265 270
Leu Ile Gly Ser Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser
275 280 285
Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asp Ile Thr Asp Glu Lys Lys Lys Val Leu Val Asn Glu
305 310 315 320
Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu
325 330 335
Glu Lys Pro Val Asn Lys Val Asn Leu Val
340 345
<210>57
<211>1413
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>57
atgcaattag tgttcgtaca cgggtggagt gttacccata ccaataccta tggtgaatta 60
cccgaaagtt tggcggcagg cgccgcgaca cacggcctgc agatcgatat caggcacgtt 120
tttctcggca agtacatcag ctttcacgat gaggtgactc tggatgatat agcacgtgcc 180
ttcgacaagg cgctgagaga catgtcgggt gatggtgaca cggtctcgcc tttctcctgt 240
atcacgcatt cgaccggcgg ccctgtcgtt cggcactgga ttaacaaatt ctacggcgcg 300
cgagggctat cgaaactgcc gctggagcat ttggttatgc tggcgcctgc caaccacggc 360
tccagcctgg cggtactcgg caagcaacgt cttggtcgca tcaagtcctg gttcgatggc 420
gtggagcccg gacaaaaagt gctcgactgg ctatcgctgg gcagcaatgg gcaatgggcg 480
ctcaacaggg attttttgag ctaccgcccg gccaaacatg gcttcttccc ttttgttctg 540
acgggccagg gtatagacac aaaattctac gattttttga acagctacct tgtggagccc 600
ggcagtgacg gtgtggttcg cgtggcgggt gccaatatgc attttcgcta cctctccctg 660
gtacaatctg agaccgtatt acacaccccg ggcaaggtgc tacagctgga atataacgag 720
cggcgccccg tgaagtcccc acaagcggta ccgatgggcg tcttctccca atttagccac 780
tctggcgaca agatggggat tatggcagtc aagcgcaaga aagacgcgca tcaaatgatc 840
gtaacggaag tgctgaagtg tctctgcgta tcggacagcg atgaatatca gcaaagaggc 900
cttgaacttg cagaactgac cgccagcgaa cagcgcaagc ccatcgaaga ccaggacaag 960
attatcagcc gctatagcat gctggtattt agagtgcgcg accaggcggg caatacgatc 1020
ggagtgcacg atttcgatat cctcttactg gccggagata cctatagccc cgacaaactg 1080
ccagaggggt tcttcatgga taaacaggcc aatagagatg ccggctcact gatctactat 1140
gtggatgccg acaaaatgtc cgagatgaaa gatggctgct acggactgcg ggtggtcgtg 1200
cggccggaga aagggttttc ctattacaca acaggtgagt tcaggtcaga gggtatcccc 1260
gtggaccgtg tatttgcagc aaacgaaacc acctatattg atatcaccat gaaccgaagt 1320
gtcgatcaaa atgtattccg gttttcgcct gcaacagagc cacctgaaag cttcaaaaga 1380
accacgccct caggtaccga tatcccttca tag 1413
<210>58
<211>470
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>58
Met Gln Leu Val Phe Val His Gly Trp Ser Val Thr His Thr Asn Thr
1 5 10 15
Tyr Gly Glu Leu Pro Glu Ser Leu Ala Ala Gly Ala Ala Thr His Gly
20 25 30
Leu Gln Ile Asp Ile Arg His Val Phe Leu Gly Lys Tyr Ile Ser Phe
35 40 45
His Asp Glu Val Thr Leu Asp Asp Ile Ala Arg Ala Phe Asp Lys Ala
50 55 60
Leu Arg Asp Met Ser Gly Asp Gly Asp Thr Val Ser Pro Phe Ser Cys
65 70 75 80
Ile Thr His Ser Thr Gly Gly Pro Val Val Arg His Trp Ile Asn Lys
85 90 95
Phe Tyr Gly Ala Arg Gly Leu Ser Lys Leu Pro Leu Glu His Leu Val
100 105 110
Met Leu Ala Pro Ala Asn His Gly Ser Ser Leu Ala Val Leu Gly Lys
115 120 125
Gln Arg Leu Gly Arg Ile Lys Ser Trp Phe Asp Gly Val Glu Pro Gly
130 135 140
Gln Lys Val Leu Asp Trp Leu Ser Leu Gly Ser Asn Gly Gln Trp Ala
145 150 155 160
Leu Asn Arg Asp Phe Leu Ser Tyr Arg Pro Ala Lys His Gly Phe Phe
165 170 175
Pro Phe Val Leu Thr Gly Gln Gly Ile Asp Thr Lys Phe Tyr Asp Phe
180 185 190
Leu Asn Ser Tyr Leu Val Glu Pro Gly Ser Asp Gly Val Val Arg Val
195 200 205
Ala Gly Ala Asn Met His Phe Arg Tyr Leu Ser Leu Val Gln Ser Glu
210 215 220
Thr Val Leu His Thr Pro Gly Lys Val Leu Gln Leu Glu Tyr Asn Glu
225 230 235 240
Arg Arg Pro Val Lys Ser Pro Gln Ala Val Pro Met Gly Val Phe Ser
245 250 255
Gln Phe Ser His Ser Gly Asp Lys Met Gly Ile Met Ala Val Lys Arg
260 265 270
Lys Lys Asp Ala His Gln Met Ile Val Thr Glu Val Leu Lys Cys Leu
275 280 285
Cys Val Ser Asp Ser Asp Glu Tyr Gln Gln Arg Gly Leu Glu Leu Ala
290 295 300
Glu Leu Thr Ala Ser Glu Gln Arg Lys Pro Ile Glu Asp Gln Asp Lys
305 310 315 320
Ile Ile Ser Arg Tyr Ser Met Leu Val Phe Arg Val Arg Asp Gln Ala
325 330 335
Gly Asn Thr Ile Gly Val His Asp Phe Asp Ile Leu Leu Leu Ala Gly
340 345 350
Asp Thr Tyr Ser Pro Asp Lys Leu Pro Glu Gly Phe Phe Met Asp Lys
355 360 365
Gln Ala Asn Arg Asp Ala Gly Ser Leu Ile Tyr Tyr Val Asp Ala Asp
370 375 380
Lys Met Ser Glu Met Lys Asp Gly Cys Tyr Gly Leu Arg Val Val Val
385 390 395 400
Arg Pro Glu Lys Gly Phe Ser Tyr Tyr Thr Thr Gly Glu Phe Arg Ser
405 410 415
Glu Gly Ile Pro Val Asp Arg Val Phe Ala Ala Asn Glu Thr Thr Tyr
420 425 430
Ile Asp Ile Thr Met Asn Arg Ser Val Asp Gln Asn Val Phe Arg Phe
435 440 445
Ser Pro Ala Thr Glu Pro Pro Glu Ser Phe Lys Arg Thr Thr Pro Ser
450 455 460
Gly Thr Asp Ile Pro Ser
465 470
<210>59
<211>1038
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>59
atgacaacac aatttagaaa cttgatcttt gaaggcggcg gtgtaaaagg cgttgcttac 60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga 120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac ggtccgtgag 180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt 240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt 300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480
tccatgtcga taccgctgtt ctttgcggca gtgcgtcatg gtgatcgaca agatgtgtat 540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt 600
gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct 660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgct gatgaatgca 840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacactc 900
gatgtgggta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa 960
ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg 1020
aatagagtgg agtcatag 1038
<210>60
<211>345
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>60
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
20 25 30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
50 55 60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65 70 75 80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
85 90 95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
100 105 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
165 170 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
180 185 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
195 200 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
210 215 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
260 265 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
275 280 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305 310 315 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu
325 330 335
Glu Lys Pro Val Asn Arg Val Glu Ser
340 345
<210>61
<211>1257
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>61
atgacattaa aactctccct gctgatcgcg agcctgagcg ccgtgtctcc agcagtcttg 60
gcaaacgacg tcaatccagc gccactcatg gcgccgtccg aagcggattc cgcgcagacg 120
ctgggcagtc tgacgtacac ctatgttcgc tgctggtatc gtccggctgc gacgcataat 180
gatccttaca ccacctggga gtgggcgaag aacgcggacg gcagtgattt caccattgat 240
ggctattggt ggtcatcggt gagttacaaa aacatgttct ataccgatac tcagcccgat 300
accatcatgc agcgctgtgc agagacgttg gggttaaccc acgataccgc tgacatcacc 360
tatgccgcgg ccgatacccg tttctcctac aaccacacca tctggagcaa cgatgtcgcc 420
aacgcgccga gcaaaatcaa taaggtgatc gcctttggtg acagcctgtc agacacgggc 480
aacattttta acgcctcgca atggcgcttc ccgaacccga actcctggtt tgtcggccac 540
ttctcaaacg ggtttgtctg gaccgagtat ctggcgcaag gtttggggct gcccctctac 600
aactgggccg tgggcggcgc ggcggggcgc aatcaatact gggcgctgac tggcgtgaat 660
gaacaggtca gttcgtacct gacctacatg gagatggcgc cgaattaccg tgcggagaac 720
acgctgttta cactcgaatt cggtctgaat gattttatga actacgaccg ttcactggca 780
gacgtcaaag cagattacag ctcggcgctg attcgtctgg tggaagccgg agcgaaaaat 840
atggtgctgt tgaccctacc ggatgccacg cgcgcgccgc agttccaata ttcaacgcaa 900
gaacacatcg acgaggtgcg cgccaaagtg attggcatga acgcgttcat tcgtgagcag 960
gcacgctact tccagatgca gggcatcaac atttcgctgt ttgacgccta cacgctgttt 1020
gatcagatga tcgccgaccc agccgcgcac ggctttgata atgccagcgc gccatgtctt 1080
gatattcagc gcagctctgc ggcggactat ctctacacgc atgctctggc agccgagtgt 1140
gcctcatccg gttcagaccg ctttgtgttc tgggatgtga ctcacccaac cacggcaacg 1200
catcgctaca tcgccgacca cattctggct accggtgttg cgcagttccc gcgttaa 1257
<210>62
<211>418
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(21)
<223>从环境样品中获得
<400>62
Met Thr Leu Lys Leu Ser Leu Leu Ile Ala Ser Leu Ser Ala Val Ser
1 5 10 15
Pro Ala Val Leu Ala Asn Asp Val Asn Pro Ala Pro Leu Met Ala Pro
20 25 30
Ser Glu Ala Asp Ser Ala Gln Thr Leu Gly Ser Leu Thr Tyr Thr Tyr
35 40 45
Val Arg Cys Trp Tyr Arg Pro Ala Ala Thr His Asn Asp Pro Tyr Thr
50 55 60
Thr Trp Glu Trp Ala Lys Asn Ala Asp Gly Ser Asp Phe Thr Ile Asp
65 70 75 80
Gly Tyr Trp Trp Ser Ser Val Ser Tyr Lys Asn Met Phe Tyr Thr Asp
85 90 95
Thr Gln Pro Asp Thr Ile Met Gln Arg Cys Ala Glu Thr Leu Gly Leu
100 105 110
Thr His Asp Thr Ala Asp Ile Thr Tyr Ala Ala Ala Asp Thr Arg Phe
115 120 125
Ser Tyr Asn His Thr Ile Trp Ser Asn Asp Val Ala AsnAla Pro Ser
130 135 140
Lys Ile Asn Lys Val Ile Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly
145 150 155 160
Asn Ile Phe Asn Ala Ser Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp
165 170 175
Phe Val Gly His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala
180 185 190
Gln Gly Leu Gly Leu Pro Leu Tyr AsnTrp Ala Val Gly Gly Ala Ala
195 200 205
Gly Arg Asn Gln Tyr Trp Ala Leu Thr Gly Val Asn Glu Gln Val Ser
210 215 220
Ser Tyr Leu Thr Tyr Met Glu Met Ala Pro Asn Tyr Arg Ala Glu Asn
225 230 235 240
Thr Leu Phe Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Asp
245 250 255
Arg Ser Leu Ala Asp Val Lys Ala Asp Tyr Ser Ser Ala Leu Ile Arg
260 265 270
Leu Val Glu Ala Gly Ala Lys Asn Met Val Leu Leu Thr Leu Pro Asp
275 280 285
Ala Thr Arg Ala Pro Gln Phe Gln Tyr Ser Thr Gln Glu His Ile Asp
290 295 300
Glu Val Arg Ala Lys Val Ile Gly Met Asn Ala Phe Ile Arg Glu Gln
305 310 315 320
Ala Arg Tyr Phe Gln Met GlnGly Ile Asn Ile Ser Leu Phe Asp Ala
325 330 335
Tyr Thr Leu Phe Asp Gln Met Ile Ala Asp Pro Ala Ala His Gly Phe
340 345 350
Asp Asn Ala Ser Ala Pro Cys Leu Asp Ile Gln Arg Ser Ser Ala Ala
355 360 365
Asp Tyr Leu Tyr Thr His Ala Leu Ala Ala Glu Cys Ala Ser Ser Gly
370 375 380
Ser Asp Arg Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr
385 390 395 400
His Arg Tyr Ile Ala Asp His Ile Leu Ala Thr Gly Val Ala Gln Phe
405 410 415
Pro Arg
<210>63
<211>1242
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>63
atgaaaaata cgttaatttt ggctggctgt atattggcag ctccagccgt cgcagatgac 60
ctaacaatca cccctgaaac tataagtgtg cgctacgcgt ctgaggtgca gaacaaacaa 120
acatacactt atgttcgctg ctggtatcgt ccagcgcaga accatgacga cccttccact 180
gagtgggaat gggctcgtga cgacaatggc gattacttca ctatcgatgg gtactggtgg 240
tcgtctgtct ccttcaaaaa catgttctat accaataccc cgcaaacaga aattgaaaac 300
cgctgtaaag aaacactagg ggttaatcat gatagtgccg atcttcttta ctatgcatca 360
gacaatcgtt tctcctacaa ccatagtatt tggacaaacg acaacgcagt aaacaacaaa 420
atcaatcgta ttgtcgcatt cggtgatagc ctgtctgaca ccggtaatct gtacaatgga 480
tcccaatggg tattccccaa ccgtaattct tggtttctcg gtcacttttc aaacggtttg 540
gtgtggactg aatacttagc gcaaaacaaa aacgtaccac tgtacaactg ggcggtcggt 600
ggcgccgccg gcaccaacca atacgtcgca ttgacaggca tttatgacca agtgacgtct 660
tatcttacgt acatgaagat ggcaaagaac tacaacccaa acaacagttt gatgacgctg 720
gaatttggcc taaatgattt catgaattac ggccgagaag tggcggacgt gaaagctgac 780
ttaagtagcg cattgattcg cttgaccgaa tcaggcgcaa gcaacattct actcttcacg 840
ttaccggacg caacaaaggc accgcagttt aaatattcga ctcaggagga aattgagacc 900
gttcgagcta agattcttga gttcaacact tttattgaag aacaagcgtt actctatcaa 960
gctaaaggac tgaatgtggc cctctacgat gctcatagca tctttgatca gctgacatcc 1020
aatcctaaac aacacggttt tgagaactca acagatgcct gtctgaacat caaccgcagt 1080
tcctctgtcg actaccttta cagtcatgag ctaactaacg attgtgcgta tcatagctct 1140
gataaatatg tgttctgggg agtcactcac ccaaccacag caacacataa atacattgcc 1200
gaccaaatca ttcagaccaa gctagaccag ttcaatttct aa 1242
<210>64
<211>413
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(18)
<223>从环境样品中获得
<400>64
Met Lys Asn Thr Leu Ile Leu Ala Gly Cys Ile Leu Ala Ala Pro Ala
1 5 10 15
Val Ala Asp Asp Leu Thr Ile Thr Pro Glu Thr Ile Ser Val Arg Tyr
20 25 30
Ala Ser Glu Val Gln Asn Lys Gln Thr Tyr Thr Tyr Val Arg Cys Trp
35 40 45
Tyr Arg Pro Ala Gln Asn His Asp Asp Pro Ser Thr Glu Trp Glu Trp
50 55 60
Ala Arg Asp Asp Asn Gly Asp Tyr Phe Thr Ile Asp Gly Tyr Trp Trp
65 70 75 80
Ser Ser Val Ser Phe Lys Asn Met Phe Tyr Thr Asn Thr Pro Gln Thr
85 90 95
Glu Ile Glu Asn Arg Cys Lys Glu Thr Leu Gly Val Asn His Asp Ser
100 105 110
Ala Asp Leu Leu Tyr Tyr Ala Ser Asp Asn Arg Phe Ser Tyr Asn His
115 120 125
Ser Ile Trp Thr Asn Asp Asn Ala Val Asn Asn Lys Ile Asn Arg Ile
130 135 140
Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Tyr Asn Gly
145 150 155 160
Ser Gln Trp Val Phe Pro Asn Arg Asn Ser Trp Phe Leu Gly His Phe
165 170 175
Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Gln Asn Lys Asn Val
180 185 190
Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn Gln Tyr
195 200 205
Val Ala Leu Thr Gly Ile Tyr Asp Gln Val Thr Ser Tyr Leu Thr Tyr
210 215 220
Met Lys Met Ala Lys Asn Tyr Asn Pro Asn Asn Ser Leu Met Thr Leu
225 230 235 240
Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val Ala Asp
245 250 255
Val Lys Ala Asp Leu Ser Ser Ala Leu Ile Arg Leu Thr Glu Ser Gly
260 265 270
Ala Ser Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys Ala Pro
275 280 285
Gln Phe Lys Tyr Ser Thr Gln Glu Glu Ile Glu Thr Val Arg Ala Lys
290 295 300
Ile Leu Glu Phe Asn Thr Phe Ile Glu Glu Gln Ala Leu Leu Tyr Gln
305 310 315 320
Ala Lys Gly Leu Asn Val Ala Leu Tyr Asp Ala His Ser Ile Phe Asp
325 330 335
Gln Leu Thr Ser Asn Pro Lys Gln His Gly Phe Glu Asn Ser Thr Asp
340 345 350
Ala Cys Leu Asn Ile Asn Arg Ser Ser Ser Val Asp Tyr Leu Tyr Ser
355 360 365
His Glu Leu Thr Asn Asp Cys Ala Tyr His Ser Ser Asp Lys Tyr Val
370 375 380
Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr Ile Ala
385 390 395 400
Asp Gln Ile Ile Gln Thr Lys Leu Asp Gln Phe Asn Phe
405 410
<210>65
<211>1164
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>65
atgaaccctt ttcttgaaga taaaattaaa tcctccggtc ccaagaaaat cctcgcctgc 60
gatggcggag gtattttggg tttgatgagc gttgaaatcc tagcaaaaat tgaagcggat 120
ttacgcacta agttaggtaa agaccagaac ttcgtgctcg cggattattt cgattttgtc 180
tgcggcacca gcaccggcgc gattatcgct gcctgtattt ctagtggcat gtcgatggct 240
aaaatacgcc aattctatct cgacagtggg aagcaaatgt tcgataaggc ctccttgctt 300
aagcgcttgc aatacagtta tgacgatgag ccattggcga ggcagttgcg tgcagccttt 360
gatgagcaac tgaaggaaac cgatgccaag ctgggtagtg cgcacctaaa aacgctgttg 420
atgatggtga tgcgtaacca cagcaccgac tcaccttggc cggtttccaa taacccttac 480
gcaaaataca ataatatcgc ccgaaaggat tgcaacctca acctgccttt atggcaattg 540
gtccgtgcca gcaccgccgc tccgacgtat ttcccaccgg aagtcatcac tttcgcagat 600
ggcacacccg aagaatacaa cttcatcttc gtcgacggtg gcgtgaccac ctacaacaac 660
ccagcatatc ttgctttcct aatggccact gccaagcctt atgccctcaa ctggccgaca 720
ggcagcaacc agttattgat cgtttccgta ggcaccggaa gtgccgccaa tgtccgacct 780
aatctggacg tggatgatat gaacctgatc cattttgcca aaaacatccc ttcagccctg 840
atgaatgccg catctgccgg ttgggatatg acctgccggg tattgggtga atgccgccat 900
ggtggcatgt tagatcggga gtttggtgac atggtgatgc ccgcgtcaag agatcttaat 960
tttaccggcc ctaagctttt tacttatatg cgttatgatc ccgatgtttc ctttgagggc 1020
ttgaagacta tcggtatatc agatatcgat ccagccaaaa tgcagcaaat ggattccgtc 1080
aataatattc cagatataca acgggtaggt atcgaatatg ccaaacgcca tgttgataca 1140
gctcattttg aggggtttaa ataa 1164
<210>66
<211>387
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>66
Met Asn Pro Phe Leu Glu Asp Lys Ile Lys Ser Ser Gly Pro Lys Lys
1 5 10 15
Ile Leu Ala Cys Asp Gly Gly Gly Ile Leu Gly Leu Met Ser Val Glu
20 25 30
Ile Leu Ala Lys Ile Glu Ala Asp Leu Arg Thr Lys Leu Gly Lys Asp
35 40 45
Gln Asn Phe Val Leu Ala Asp Tyr Phe Asp Phe Val Cys Gly Thr Ser
50 55 60
Thr Gly Ala Ile Ile Ala Ala Cys Ile Ser Ser Gly Met Ser Met Ala
65 70 75 80
Lys Ile Arg Gln Phe Tyr Leu Asp Ser Gly Lys Gln Met Phe Asp Lys
85 90 95
Ala Ser Leu Leu Lys Arg Leu Gln Tyr Ser Tyr Asp Asp Glu Pro Leu
100 105 110
Ala Arg Gln Leu Arg Ala Ala Phe Asp Glu Gln Leu Lys Glu Thr Asp
115 120 125
Ala Lys Leu Gly Ser Ala His Leu Lys Thr Leu Leu Met Met Val Met
130 135 140
Arg Asn His Ser Thr Asp Ser Pro Trp Pro Val Ser Asn Asn Pro Tyr
145 150 155 160
Ala Lys Tyr Asn Asn Ile Ala Arg Lys Asp Cys Asn Leu Asn Leu Pro
165 170 175
Leu Trp Gln Leu Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Pro
180 185 190
Pro Glu Val Ile Thr Phe Ala Asp Gly Thr Pro Glu Glu Tyr Asn Phe
195 200 205
Ile Phe Val Asp Gly Gly Val Thr Thr Tyr Asn Asn Pro Ala Tyr Leu
210 215 220
Ala Phe Leu Met Ala Thr Ala Lys Pro Tyr Ala Leu Asn Trp Pro Thr
225 230 235 240
Gly Ser Asn Gln Leu Leu Ile Val Ser Val Gly Thr Gly Ser Ala Ala
245 250 255
Asn Val Arg Pro Asn Leu Asp Val Asp Asp Met Asn Leu Ile His Phe
260 265 270
Ala Lys Asn Ile Pro Ser Ala Leu Met Asn Ala Ala Ser Ala Gly Trp
275 280 285
Asp Met Thr Cys Arg Val Leu Gly Glu Cys Arg His Gly Gly Met Leu
290 295 300
Asp Arg Glu Phe Gly Asp Met Val Met Pro Ala Ser Arg Asp Leu Asn
305 310 315 320
Phe Thr Gly Pro Lys Leu Phe Thr Tyr Met Arg Tyr Asp Pro Asp Val
325 330 335
Ser Phe Glu Gly Leu Lys Thr Ile Gly Ile Ser Asp Ile Asp Pro Ala
340 345 350
Lys Met Gln Gln Met Asp Ser Val Asn Asn Ile Pro Asp Ile Gln Arg
355 360 365
Val Gly Ile Glu Tyr Ala Lys Arg His Val Asp Thr Ala His Phe Glu
370 375 380
Gly Phe Lys
385
<210>67
<211>1419
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>67
atggtcattg tcttcgtcca cggatggagc gtgcgcaaca ccaacacgta cgggcagctg 60
cccttgcgtc tcaagaagag cttcaaagcc gccgggaaac agattcaggt cgagaacatc 120
tacctgggcg agtacgtgag ctttgacgac caggtaacag tcgacgacat cgcccgcgca 180
ttcgattgcg cactgcggga aaaactatac gatccggcga cgaagcagtg gacgaagttc 240
gcctgcatca ctcattccac cggcggcccg gtcgcgcgct tgtggatgga tctctactac 300
ggcgccgcca gactggccga gtgcccgatg tcccacctcg tgatgctcgc cccggccaat 360
catggctcgg cccttgccca gctcggcaag agccgcctca gccgcatcaa gagcttcttc 420
gagggtgtcg aaccgggcca gcgcgtcctc gactggctcg aactcggcag tgagctgagt 480
tgggccctca acacgagatg gctcgactac gactgccgcg ccgccgcctg ctgggtcttc 540
accctcaccg gccagcgcat cgaccggagt ttgtacgacc atctcaacag ctataccggt 600
gagcagggat cggatggcgt cgtgcgcgtc gccgcggcca acatgaacac caagctgctg 660
acctttgaac agaaggggcg caagctcgtg ttcacaggcc agaagaagac cgccgacacc 720
ggccttggcg tcgtgccggg ccggtcgcac tccggccgcg acatgggcat catcgccagc 780
gtgcgcggca ccggcgacca tcccaccctg gaatgggtga ctcgttgcct ggccgtcacc 840
gacgtcaaca cgtacgatgc cgtctgtaag gatctggacg ctctcaccgc ccagacccag 900
aaggatgaaa aggtggaaga ggtcaaaggc ctgctgcgga cggtcagata ccagacggac 960
cgctacgtca tgctcgtctt ccgcctgaag aacgaccgcg gcgactacct ctccgattac 1020
gatctcctgc tcaccgccgg acccaactac tcgcccgacg acctgcccga aggcttcttc 1080
gtcgaccgcc aacggaacca gcggaacccg ggcaagctca cttactacct gaactacgac 1140
gccatggcca aattgaaagg taagaccgcc gagggccgtc tgggcttcaa gatcctggcg 1200
cgcccggtga aaggcggcct cgtctactat gaggttgcgg agttccagtc cgacgtgggc 1260
ggcgtcagca gcatgctgca gcccaacgca acagtgatga tcgacatcac cctcaatcgc 1320
aacgtcgacg cgcgcgtctt ccggttcacc gagaatctgc ccacgggtga ccagggcgag 1380
gaaatcagcg gcgtcccgct ggggcagaac gtcccgtag 1419
<210>68
<211>472
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>68
Met Val Ile Val Phe Val His Gly Trp Ser Val Arg Asn Thr Asn Thr
1 5 10 15
Tyr Gly Gln Leu Pro Leu Arg Leu Lys Lys Ser Phe Lys Ala Ala Gly
20 25 30
Lys Gln Ile Gln Val Glu Asn Ile Tyr Leu Gly Glu Tyr Val Ser Phe
35 40 45
Asp Asp Gln Val Thr Val Asp Asp Ile Ala Arg Ala Phe Asp Cys Ala
50 55 60
Leu Arg Glu Lys Leu Tyr Asp Pro Ala Thr Lys Gln Trp Thr Lys Phe
65 70 75 80
Ala Cys Ile Thr His Ser Thr Gly Gly Pro Val Ala Arg Leu Trp Met
85 90 95
Asp Leu Tyr Tyr Gly Ala Ala Arg Leu Ala Glu Cys Pro Met Ser His
100 105 110
Leu Val Met Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Gln Leu
115 120 125
Gly Lys Ser Arg Leu Ser Arg Ile Lys Ser Phe Phe Glu Gly Val Glu
130 135 140
Pro Gly Gln Arg Val Leu Asp Trp Leu Glu Leu Gly Ser Glu Leu Ser
145 150 155 160
Trp Ala Leu Asn Thr Arg Trp Leu Asp Tyr Asp Cys Arg Ala Ala Ala
165 170 175
Cys Trp Val Phe Thr Leu Thr Gly Gln Arg Ile Asp Arg Ser Leu Tyr
180 185 190
Asp His Leu Asn Ser Tyr Thr Gly Glu Gln Gly Ser Asp Gly Val Val
195 200 205
Arg Val Ala Ala Ala Asn Met Asn Thr Lys Leu Leu Thr Phe Glu Gln
210 215 220
Lys Gly Arg Lys Leu Val Phe Thr Gly Gln Lys Lys Thr Ala Asp Thr
225 230 235 240
Gly Leu Gly Val Val Pro Gly Arg Ser His Ser Gly Arg Asp Met Gly
245 250 255
Ile Ile Ala Ser Val Arg Gly Thr Gly Asp His Pro Thr Leu Glu Trp
260 265 270
Val Thr Arg Cys Leu Ala Val Thr Asp Val Asn Thr Tyr Asp Ala Val
275 280 285
Cys Lys Asp Leu Asp Ala Leu Thr Ala Gln Thr Gln Lys Asp Glu Lys
290 295 300
Val Glu Glu Val Lys Gly Leu Leu Arg Thr Val Arg Tyr Gln Thr Asp
305 310 315 320
Arg Tyr Val Met Leu Val Phe Arg Leu Lys Asn Asp Arg Gly Asp Tyr
325 330 335
Leu Ser Asp Tyr Asp Leu Leu Leu Thr Ala Gly Pro Asn Tyr Ser Pro
340 345 350
Asp Asp Leu Pro Glu Gly Phe Phe Val Asp Arg Gln Arg Asn Gln Arg
355 360 365
Asn Pro Gly Lys Leu Thr Tyr Tyr Leu Asn Tyr Asp Ala Met Ala Lys
370 375 380
Leu Lys Gly Lys Thr Ala Glu Gly Arg Leu Gly Phe Lys Ile Leu Ala
385 390 395 400
Arg Pro Val Lys Gly Gly Leu Val Tyr Tyr Glu Val Ala Glu Phe Gln
405 410 415
Ser Asp Val Gly Gly Val Ser Ser Met Leu Gln Pro Asn Ala Thr Val
420 425 430
Met Ile Asp Ile Thr Leu Asn Arg Asn Val Asp Ala Arg Val Phe Arg
435 440 445
Phe Thr Glu Asn Leu Pro Thr Gly Asp Gln Gly Glu Glu Ile Ser Gly
450 455 460
Val Pro Leu Gly Gln Asn Val Pro
465 470
<210>69
<211>1038
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>69
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga 120
gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac tgtccgtgag 180
caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt 240
attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat 300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacggggtat 420
gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc 480
tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgaccgaca agatgtgtat 540
gtcgatgggg gtgttcaact taactatccg attaaacttt ttgatcggga gcgttacatt 600
gatctggcca aagatcccgg tgccgttcgg cgaacgggct attacaacaa agaaaacgct 660
cgctttcagc ttgagcggcc gggctatagc ccctatgttt acaatcgcca gaccttgggt 720
ttgcgactag atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840
caggaaaaga ttcatctaca tggcgatgat tggcagcgca cggtctatat cgatacattg 900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgaacag 960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttgga gaagcctgtt 1020
aatagagtgg agtcatag 1038
<210>70
<211>345
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>70
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
20 25 30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
50 55 60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65 70 75 80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly
85 90 95
Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
100 105 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
165 170 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
180 185 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
195 200 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
210 215 220
Glu Arg Pro Gly Tyr Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
260 265 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
275 280 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305 310 315 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
325 330 335
Glu Lys Pro Val Asn Arg Val Glu Ser
340 345
<210>71
<211>3264
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>71
atgtcgctat catcaccgcc cgaaaccccc gaaccccccg aacccccgtc acccggcgcg 60
cgatcgctcc ggggaggatg gagccgccgg gtggccggcc tgctggccct ggtgctgctc 120
accgggctcc tccagatcgt cgtgccgctc gcacggcccg ccgcggcggc cgtacagcag 180
cccgcgatga cgtggaacct gcatggggcc aagaagaccg cggaactggt tcccgatctg 240
atgcgtaacc ataacgtcac cgtcgcggcc ctccaggaag tggccaacgg caacttcctg 300
ggcctcactc ccacagagca cgacgtgccc tacctcaagc cggacggcac gacctcgact 360
ccgccggatc cgcagaaatg gcgggtcgag aagtacaacc tcgccaagga cgatgcaacc 420
gctttcgtga tccggaccgg ctccaacaac cgcgggctcg cgatcgtcac cacccaggac 480
gtcggcgatg tctcgcagaa tgtacacgtc gtcaatgtga ccgaggattg ggaaggcaag 540
atgttccccg ccctgggggt gaagatcgac ggcgcctggt actactccat ccacgcctcc 600
accacgccga agcgcgcgaa caacaacgcc ggcactctgg tcgaggacct ctccaagctg 660
cacgagacgg ccgctttcga aggcgactgg gccgcgatgg gcgactggaa ccggtacccc 720
tccgaggact cgaacgccta cgagaaccaacggaagcatc tcaaaggcgc catgcggaca 780
aactttccgg ataatcaggc ggcgttgcgc gaagtcctgg agttcgagtc cgacgaacgc 840
gtcatctggc agggtgcgag gacccacgac cacggcgccg agctcgacta catggtggcc 900
aagggagccg gtaacgacta caaggccagc cgatcgacgt cgaagcacgg ctccgatcac 960
tacccggtgt tcttcggtat tggggacgat tcggacacct gcatgggcgg cacggcgccg 1020
gtggcggcga acgcgccgcg tgcggccgcc accgagtcct gtcccctgga cgacgatctg 1080
ccggccgtca tcgtctcgat gggggacagc tatatctccg gcgagggagg gcgctggcag 1140
ggcaacgcca acacctcctc cgggggcgac tcctggggca ccgaccgggc cgccgacggc 1200
acggaggtct acgagaagaa ctccgaaggc agcgatgcct gtcaccgctc cgacgtcgcg 1260
gagatcaagc gcgccgacat cgccgacatc ccggcggaac gcaggatcaa catcgcctgc 1320
tcgggcgccg agaccaagca cctgctcacc gagaccttca agggtgaaaa gccccagatc 1380
gagcagctcg ccgacgtcgc cgaaacccac cgggtggaca cgatcgtggt ctccatcggc 1440
ggcaacgacc tcgagttcgc cgacatcgtg agccagtgcg ccacggcctt catgctcggg 1500
gaaggcgcgt gtcacacgga cgtcgacgat acccttgata gccggttggg cgatgtgagc 1560
agatccgtct ccgaggttct ggccgccatc cgcgacacca tgatcgaggc cgggcaggac 1620
gataccagct acaagctcgt tctccagtcc taccctgccc cgttgcccgc gtcggatgag 1680
atgcggtaca cgggcgatca ctacgaccgg tacaccgagg gcggctgccc cttctatgac 1740
gtcgacctgg actggacgcg cgacgtcctc atcaaaaaga tcgaagccac gctgcgcggg 1800
gtggccaaga gtgcggatgc ggccttcctc aacctgacgg acacgttcac ggggcacgag 1860
ctgtgctcga agcacacccg acaggcggag tccggcgaat cgctggcgaa tccaatactg 1920
gaacacgagg ccgagtgggt gcgcttcgta ccaggtctca ccacgccggg tgacacggcc 1980
gaagccatcc atccgaatgc gttcggccag cacgccctca gtagctgcct cagccaggcc 2040
gtccggacga tggacgattc ggaccagagg tacttcgagt gcgacgggcg ggacaccgga 2100
aatccccgcc tcgtgtggcc acgcagttcg cccatcgacg ccgtcgtgga gaccgcggac 2160
ggttggcagg gcgacgactt ccggctcgcc gaccactaca tgttccagcg cggcgtctac 2220
gcccgcttca acccggacgc ggaccggagc ggcgcgatcg atccgggccg aatcaccttc 2280
ggccaaaccg acggatggct cggtgaggtg aaggacactt cgaactggcc gagcctgagt 2340
ggaaccgact tcgtcgacgg catcgacgcc gccgccgagg cacgcaccag caccggtcac 2400
cagctgctgc tgttccacag cggcgttgag gacaaccagt acgtgcgggt cgagatggcg 2460
ccgggcacca ctgacgacca gctcgtcagg ggccccgtgc ccatcacgag gtactggccc 2520
ctcttccagg acaccccttt cgaatggggc gtggatgccg ccgcggggga ccagctgaac 2580
cgggcgatgg tcttcaggca cggctatgtg gggctggtgc aggtctccct cgacgctctc 2640
agcgacgaat ggctcgtgga accgacgttg atcggctcgg cgattccggc gctggagggc 2700
accccgttcg agacaggggt ggacgcggcg atcgtgcggc accagcaacc gacggccatg 2760
tgggtcgacc tgatcagcgg tacgcaggtg gtgacgctgc tggtggactt ggacgatctg 2820
tcgaagagca cgtacatgac gagcatcgtg gagatcacga cgatgtggcc gagcctgcgc 2880
ggcagcatct tcgactggac cggcggagag gcgtggaagc cggagaagat gcagatcaag 2940
accggcgcgg gcgatcccta cgacatggac gccgacgacc ggcaggccaa gcctgcggtg 3000
tcgggctcgc acgagcagtg ccgtccggag ggactagcgc agacccccgg cgtgaacacg 3060
ccgtactgcg aggtgtacga caccgacggc cgcgaatggc tgggcgggaa cgggcacgac 3120
aggcgggtca tcggctactt caccggctgg cgcaccggtg agaacgacca gccgcgctac 3180
ctggtgccga acatcccgtg gtcgaaggtg acccacatca actacgcgtt cgcgaaagtc 3240
gacgacgaca acaagatcca aaga 3264
<210>72
<211>1088
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>72
Met Ser Leu Ser Ser Pro Pro Glu Thr Pro Glu Pro Pro Glu Pro Pro
1 5 10 15
Ser Pro Gly Ala Arg Ser Leu Arg Gly Gly Trp Ser Arg Arg Val Ala
20 25 30
Gly Leu Leu Ala Leu Val Leu Leu Thr Gly Leu Leu Gln Ile Val Val
35 40 45
Pro Leu Ala Arg Pro Ala Ala Ala Ala Val Gln Gln Pro Ala Met Thr
50 55 60
Trp Asn Leu His Gly Ala Lys Lys Thr Ala Glu Leu Val Pro Asp Leu
65 70 75 80
Met Arg Asn His Asn Val Thr Val Ala Ala Leu Gln Glu Val Ala Asn
85 90 95
Gly Asn Phe Leu Gly Leu Thr Pro Thr Glu His Asp Val Pro Tyr Leu
100 105 110
Lys Pro Asp Gly Thr Thr Ser Thr Pro Pro Asp Pro Gln Lys Trp Arg
115 120 125
Val Glu Lys Tyr Asn Leu Ala Lys Asp Asp Ala Thr Ala Phe Val Ile
130 135 140
Arg Thr Gly Ser Asn Asn Arg Gly Leu Ala Ile Val Thr Thr Gln Asp
145 150 155 160
Val Gly Asp Val Ser Gln Asn Val His Val Val Asn Val Thr Glu Asp
165 170 175
Trp Glu Gly Lys Met Phe Pro Ala Leu Gly Val LysIle Asp Gly Ala
180 185 190
Trp Tyr Tyr Ser Ile His Ala Ser Thr Thr Pro Lys Arg Ala Asn Asn
195 200 205
Asn Ala Gly Thr Leu Val Glu Asp Leu Ser Lys Leu His Glu Thr Ala
210 215 220
Ala Phe Glu Gly Asp Trp Ala Ala Met Gly Asp Trp Asn Arg Tyr Pro
225 230 235 240
Ser Glu Asp Ser Asn Ala Tyr Glu Asn Gln Arg Lys His Leu Lys Gly
245 250 255
Ala Met Arg Thr Asn Phe Pro Asp Asn Gln Ala Ala Leu Arg Glu Val
260 265 270
Leu Glu Phe Glu Ser Asp Glu Arg Val Ile Trp Gln Gly Ala Arg Thr
275 280 285
His Asp His Gly Ala Glu Leu Asp Tyr Met Val Ala Lys Gly Ala Gly
290 295 300
Asn Asp Tyr Lys Ala Ser Arg Ser Thr Ser Lys His Gly Ser Asp His
305 310 315 320
Tyr Pro Val Phe Phe Gly Ile Gly Asp Asp Ser Asp Thr Cys Met Gly
325 330 335
Gly Thr Ala Pro Val Ala Ala Asn Ala Pro Arg Ala Ala Ala Thr Glu
340 345 350
Ser Cys Pro Leu Asp Asp Asp Leu Pro Ala Va1 Ile Val Ser Met Gly
355 360 365
Asp Ser Tyr Ile Ser Gly Glu Gly Gly Arg Trp Gln Gly Asn Ala Asn
370 375 380
Thr Ser Ser Gly Gly Asp Ser Trp Gly Thr Asp Arg Ala Ala Asp Gly
385 390 395 400
Thr Glu Val Tyr Glu Lys Asn Ser Glu Gly Ser Asp Ala Cys His Arg
405 410 415
Ser Asp Val Ala Glu Ile Lys Arg Ala Asp Ile Ala Asp Ile Pro Ala
420 425 430
Glu Arg Arg Ile Asn Ile Ala Cys Ser Gly Ala Glu Thr Lys His Leu
435 440 445
Leu Thr Glu Thr Phe Lys Gly Glu Lys Pro Gln Ile Glu Gln Leu Ala
450 455 460
Asp Val Ala Glu Thr His Arg Val Asp Thr Ile Val Val Ser Ile Gly
465 470 475 480
Gly Asn Asp Leu Glu Phe Ala Asp Ile Val Ser Gln Cys Ala Thr Ala
485 490 495
Phe Met Leu Gly Glu Gly Ala Cys His Thr Asp Val Asp Asp Thr Leu
500 505 510
Asp Ser Arg Leu Gly Asp Val Ser Arg Ser Val Ser Glu Val Leu Ala
515 520 525
Ala Ile Arg Asp Thr Met Ile Glu Ala Gly Gln Asp Asp Thr Ser Tyr
530 535 540
Lys Leu Val Leu Gln Ser Tyr Pro Ala Pro Leu Pro Ala Ser Asp Glu
545 550 555 560
Met Arg Tyr Thr Gly Asp His Tyr Asp Arg Tyr Thr Glu Gly Gly Cys
565 570 575
Pro Phe Tyr Asp Val Asp Leu Asp Trp Thr Arg Asp Val Leu Ile Lys
580 585 590
Lys Ile Glu Ala Thr Leu Arg Gly Val Ala Lys Ser Ala Asp Ala Ala
595 600 605
Phe Leu Asn Leu Thr Asp Thr Phe Thr Gly His Glu Leu Cys Ser Lys
610 615 620
His Thr Arg Gln Ala Glu Ser Gly Glu Ser Leu Ala Asn Pro Ile Leu
625 630 635 640
Glu His Glu Ala Glu Trp Val Arg Phe Val Pro Gly Leu Thr Thr Pro
645 650 655
Gly Asp Thr Ala Glu Ala Ile His Pro Asn Ala Phe Gly Gln His Ala
660 665 670
Leu Ser Ser Cys Leu Ser Gln Ala Val Arg Thr Met Asp Asp Ser Asp
675 680 685
Gln Arg Tyr Phe Glu Cys Asp Gly Arg Asp Thr Gly Asn Pro Arg Leu
690 695 700
Val Trp Pro Arg Ser Ser Pro Ile Asp Ala Val Val Glu Thr Ala Asp
705 710 715 720
Gly Trp Gln Gly Asp Asp Phe Arg Leu Ala Asp His Tyr Met Phe Gln
725 730 735
Arg Gly Val Tyr Ala Arg Phe Asn Pro Asp Ala Asp Arg Ser Gly Ala
740 745 750
Ile Asp Pro Gly Arg Ile Thr Phe Gly Gln Thr Asp Gly Trp Leu Gly
755 760 765
Glu Val Lys Asp Thr Ser Asn Trp Pro Ser Leu Ser Gly Thr Asp Phe
770 775 780
Val Asp Gly Ile Asp Ala Ala Ala Glu Ala Arg Thr Ser Thr Gly His
785 790 795 800
Gln Leu Leu Leu Phe His Ser Gly Val Glu Asp Asn Gln Tyr Val Arg
805 810 815
Val Glu Met Ala Pro Gly Thr Thr Asp Asp Gln Leu Val Arg Gly Pro
820 825 830
Val Pro Ile Thr Arg Tyr Trp Pro Leu Phe Gln Asp Thr Pro Phe Glu
835 840 845
Trp Gly Val Asp Ala Ala Ala Gly Asp Gln Leu Asn Arg Ala Met Val
850 855 860
Phe Arg His Gly Tyr Val Gly Leu Val Gln Val Ser Leu Asp Ala Leu
865 870 875 880
Ser Asp Glu Trp Leu Val Glu Pro Thr Leu Ile Gly Ser Ala Ile Pro
885 890 895
Ala Leu Glu Gly Thr Pro Phe Glu Thr Gly Val Asp Ala Ala Ile Val
900 905 910
Arg His Gln Gln Pro Thr Ala Met Trp Val Asp Leu Ile Ser Gly Thr
915 920 925
Gln Val Val Thr Leu Leu Val Asp Leu Asp Asp Leu Ser Lys Ser Thr
930 935 940
Tyr Met Thr Ser Ile Val Glu Ile Thr Thr Met Trp Pro Ser Leu Arg
945 950 955 960
Gly Ser Ile Phe Asp Trp Thr Gly Gly Glu Ala Trp Lys Pro Glu Lys
965 970 975
Met Gln Ile Lys Thr Gly Ala Gly Asp Pro Tyr Asp Met Asp Ala Asp
980 985 990
Asp Arg Gln Ala Lys Pro Ala Val Ser Gly Ser His Glu Gln Cys Arg
995 1000 1005
Pro Glu Gly Leu Ala Gln Thr Pro Gly Val Asn Thr Pro Tyr Cys Glu
1010 1015 1020
Val Tyr Asp Thr Asp Gly Arg Glu Trp Leu Gly Gly Asn Gly His Asp
1025 1030 1035 1040
Arg Arg Val Ile Gly Tyr Phe Thr Gly Trp Arg Thr Gly Glu Asn Asp
1045 1050 1055
Gln Pro Arg Tyr Leu Val Pro Asn Ile Pro Trp Ser Lys Val Thr His
1060 1065 1070
Ile Asn Tyr Ala Phe Ala Lys Val Asp Asp Asp Asn Lys Ile Gln Arg
1075 1080 1085
<210>73
<211>753
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>73
atgggaaacg gtgcagcagt tggttccaat gataatggta gagaagaaag tgtttacgta 60
ctttctgtga tcgcctgtaa tgtttattat ttacagaagt gtgaaggtgg ggcatcgcgt 120
gatagcgtga ttagagaaat taatagccaa actcaacctt taggatatga gattgtagca 180
gattctattc gtgatggtca tattggttct tttgcctgta agatggcagt ctttagaaat 240
aatggtaatg gcaattgtgt tttagcgatc aaagggacag atatgaataa tatcaatgac 300
ttggtgaatg atctaaccat gatattagga ggcattggtt ctgttgctgc aatccaacca 360
acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tactggtcac 420
tcccttggag gctacatgac tgaaatcatc gctaccaatc gtggactacc aggtattgca 480
ttttgcgcac caggttcaaa tggtccaatt gtaaaattag gtggacaaga gacacctggc 540
tttcacaatg ttaactttga acatgatcca gcaggtaacg ttatgactgg ggtttatact 600
catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg 660
gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa 720
agtcataata cgggttatta ttacccaaaa taa 753
<210>74
<211>250
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>74
Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu
1 5 10 15
Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln
20 25 30
Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn
35 40 45
Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg
50 55 60
Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn
65 70 75 80
Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn
85 90 95
Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile
100 105 110
Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu
115 120 125
Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly
130 135 140
Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala
145 150 155 160
Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln
165 170 175
Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly
180 185 190
Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val
195 200 205
Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe
210 215 220
Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu
225 230 235 240
Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys
245 250
<210>75
<211>1335
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>75
atgactacta aaatcttttt aattcacgga tggtctgtca agacaacaca aacatatcag 60
gcgctgcacc ttaagttggc agagcaggga tatcagctgg aagatattta cctcgggcgg 120
tatctgtccc ttgaaaatca tatcgaaata cgggatattg caaaagcaat gcaccgtgca 180
ttgctggaga ggattaccga ctggagtcag cctttccatt ttattactca cagtacggga 240
ggtatggtcg ccaaatattg gatattgaat cattataaag gaagtattgc aaaacaaaaa 300
ccactcaaaa atgtagtgtt tctggctgca cctaattttg gttcaaggct ggcacaccat 360
ggacgtacca tgctgggaga aataatggaa ctgggagaaa cagggaagaa gattcttgaa 420
tctctggagt taggaagtgc tttttcgtgg gatgtgaatg agcagttttt taatgcgtcc 480
aattggaaag ataaagaaat aaagttctat aacctgatag gagacagggt caaaacggat 540
ttttttaaat ccaaaatttt tccagctgcg tttgaaagcg ggtcagatat ggtgattcgg 600
gttgcggcag gaaatcagaa ctttgtccgg tacaggtacg atagtcagaa agatagcttt 660
actgttgtca atgagttgaa aggaattgct tttggtgctc tctaccaata tacacattcc 720
aatgatgatt atggaatcct gaacagcatc aaaaaaagtt caacccttga aaaccatcag 780
gcactcagac taattgtaga atgtctgaag gtttcgggag ataaagaata tgaaaatgtt 840
gttgcacagt tggctgcagc gacaaaagaa accagagaaa aacgccaggg atatgcacag 900
ctggatttcc gttttcggga tgatgaaggc tttccaatag atgattatgt tgtagagctg 960
ggagtaatgg taaatggaaa acctaaacca tctaaaacag tagatgacgt gcataagaat 1020
aaaattacac caaaccatct tactgtattc attaacctga aagaactgga acctaatctg 1080
aagtacttta tcaatattaa atcgatatcg gaatcctcca tgtatagtta cgatcctgct 1140
gtcaggacta tagagcttgc ttctaacgag attacaaaaa ttatccgtga ggaccataca 1200
acacagattg atgtgatact ttcccggact cctgctaaaa accttttcat gtttcatcgc 1260
ggagatgatg aagacctaca tgtgacatgg tcgcggtacg gagaaacaaa aagtacaaag 1320
cagggaataa aataa 1335
<210>76
<211>444
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>76
Met Thr Thr Lys Ile Phe Leu Ile His Gly Trp Ser Val Lys Thr Thr
1 5 10 15
Gln Thr Tyr Gln Ala Leu His Leu Lys Leu Ala Glu Gln Gly Tyr Gln
20 25 30
Leu Glu Asp Ile Tyr Leu Gly Arg Tyr Leu Ser Leu Glu Asn His Ile
35 40 45
Glu Ile Arg Asp Ile Ala Lys Ala Met His Arg Ala Leu Leu Glu Arg
50 55 60
Ile Thr Asp Trp Ser Gln Pro Phe His Phe Ile Thr His Ser Thr Gly
65 70 75 80
Gly Met Val Ala Lys Tyr Trp Ile Leu Asn His Tyr Lys Gly Ser Ile
85 90 95
Ala Lys Gln Lys Pro Leu Lys Asn Val Val Phe Leu Ala Ala Pro Asn
100 105 110
Phe Gly Ser Arg Leu Ala His His Gly Arg Thr Met Leu Gly Glu Ile
115 120 125
Met Glu Leu Gly Glu Thr Gly Lys Lys Ile Leu Glu Ser Leu Glu Leu
130 135 140
Gly Ser Ala Phe Ser Trp Asp Val Asn Glu Gln Phe Phe Asn Ala Ser
145 150 155 160
Asn Trp Lys Asp Lys Glu Ile Lys Phe Tyr Asn Leu Ile Gly Asp Arg
165 170 175
Val Lys Thr Asp Phe Phe Lys Ser Lys Ile Phe Pro Ala Ala Phe Glu
180 185 190
Ser Gly Ser Asp Met Val Ile Arg Val Ala Ala Gly Asn Gln Asn Phe
195 200 205
Val Arg Tyr Arg Tyr Asp Ser Gln Lys Asp Ser Phe Thr Val Val Asn
210 215 220
Glu Leu Lys Gly Ile Ala Phe Gly Ala Leu Tyr Gln Tyr Thr His Ser
225 230 235 240
Asn Asp Asp Tyr Gly Ile Leu Asn Ser Ile Lys Lys Ser Ser Thr Leu
245 250 255
Glu Asn His Gln Ala Leu Arg Leu Ile Val Glu Cys Leu Lys Val Ser
260 265 270
Gly Asp Lys Glu Tyr Glu Asn Val Val Ala Gln Leu Ala Ala Ala Thr
275 280 285
Lys Glu Thr Arg Glu Lys Arg Gln Gly Tyr Ala Gln Leu Asp Phe Arg
290 295 300
Phe Arg Asp Asp Glu Gly Phe Pro Ile Asp Asp Tyr Val Val Glu Leu
305 310 315 320
Gly Val Met Val Asn Gly Lys Pro Lys Pro Ser Lys Thr Val Asp Asp
325 330 335
Val His Lys Asn Lys Ile Thr Pro Asn His Leu Thr Val Phe Ile Asn
340 345 350
Leu Lys Glu Leu Glu Pro Asn Leu Lys Tyr Phe Ile Asn Ile Lys Ser
355 360 365
Ile Ser Glu Ser Ser Met Tyr Ser Tyr Asp Pro Ala Val Arg Thr Ile
370 375 380
Glu Leu Ala Ser Asn Glu Ile Thr Lys Ile Ile Arg Glu Asp His Thr
385 390 395 400
Thr Gln Ile Asp Val Ile Leu Ser Arg Thr Pro Ala Lys Asn Leu Phe
405 410 415
Met Phe His Arg Gly Asp Asp Glu Asp Leu His Val Thr Trp Ser Arg
420 425 430
Tyr Gly Glu Thr Lys Ser Thr Lys Gln Gly Ile Lys
435 440
<210>77
<211>1026
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>77
atggcttatc actttaaaaa cttggtcttc gaaggcggtg gcgtgaaagg catcgcctac 60
gtgggtgctc ttgaagtact tgagagagaa ggcattctga aagacatcaa acgcgtggct 120
ggtacttcgg ctggagcgct ggttgccgtc ttaatcagtt tgggctatac cgcccaagaa 180
ttgaaggaca tcctatggaa aatcaatttc caaaactttt tggacagctc gtggggcttg 240
gtgcgcaaca cggcacgttt cattgaggat tacggttggt acaaaggtga gtttttccgc 300
gaattggttg ccggctacat caaggaaaaa acgggcaata gtgaaagcac tttcaaggat 360
ctggccaaat caaaagattt ccgtggcctc agccttattg gtagcgatct gtccacagga 420
tactcaaagg tgttcagcaa cgaattcacc ccaaacgtca aagtagctga tgcagcccgc 480
atctccatgt cgatacccct gtttttcaaa gccgttcgcg gtgtaaacgg tgatggacac 540
atttacgtcg atggtggact gttagacaac tatgccatca aggtgttcga ccgcgtcaat 600
tacgtaaaga ataagaacaa cgtacggtac accgagtatt atgaaaagac caacaagtcg 660
ctgaaaagca aaaacaagct gaccaacgaa tacgtctaca ataaagaaac tttgggcttc 720
cgattggatg ccaaagaaca gattgagatg tttctcgacc atagtataga accaaaggca 780
aaggacattg actcactatt ctcttacacg aaggctttgg tcaccaccct catcgacttt 840
caaaacaatg tacatttgca tagtgacgac tggcaacgca cagtctatat cgactcttta 900
ggtatcagtt ccactgactt cggcatctct gactctaaaa aacagaaact cgtcgattca 960
ggcattttgc atacgcaaaa atacctggat tggtataaca acgacgaaga gaaagccaac 1020
aaatag 1026
<210>78
<211>341
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>78
Met Ala Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Ile Ala Tyr Val Gly Ala Leu Glu Val Leu Glu Arg Glu Gly Ile
20 25 30
Leu Lys Asp Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Leu Val
35 40 45
Ala Val Leu Ile Ser Leu Gly Tyr Thr Ala Gln Glu Leu Lys Asp Ile
50 55 60
Leu Trp Lys Ile Asn Phe Gln Asn Phe Leu Asp Ser Ser Trp Gly Leu
65 70 75 80
Val Arg Asn Thr Ala Arg Phe Ile Glu Asp Tyr Gly Trp Tyr Lys Gly
85 90 95
Glu Phe Phe Arg Glu Leu Val Ala Gly Tyr Ile Lys Glu Lys Thr Gly
100 105 110
Asn Ser Glu Ser Thr Phe Lys Asp Leu Ala Lys Ser Lys Asp Phe Arg
115 120 125
Gly Leu Ser Leu Ile Gly Ser Asp Leu Ser Thr Gly Tyr Ser Lys Val
130 135 140
Phe Ser Asn Glu Phe Thr Pro Asn Val Lys Val Ala Asp Ala Ala Arg
145 150 155 160
Ile Ser Met Ser Ile Pro Leu Phe Phe Lys Ala Val Arg Gly Val Asn
165 170 175
Gly Asp Gly His Ile Tyr Val Asp Gly Gly Leu Leu Asp Asn Tyr Ala
180 185 190
Ile Lys Val Phe Asp Arg Val Asn Tyr Val Lys Asn Lys Asn Asn Val
195 200 205
Arg Tyr Thr Glu Tyr Tyr Glu Lys Thr Asn Lys Ser Leu Lys Ser Lys
210 215 220
Asn Lys Leu Thr Asn Glu Tyr Val Tyr Asn Lys Glu Thr Leu Gly Phe
225 230 235 240
Arg Leu Asp Ala Lys Glu Gln Ile Glu Met Phe Leu Asp His Ser Ile
245 250 255
Glu Pro Lys Ala Lys Asp Ile Asp Ser Leu Phe Ser Tyr Thr Lys Ala
260 265 270
Leu Val Thr Thr Leu Ile Asp Phe Gln Asn Asn Val His Leu His Ser
275 280 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Ser Leu Gly Ile Ser Ser
290 295 300
Thr Asp Phe Gly Ile Ser Asp Ser Lys Lys Gln Lys Leu Val Asp Ser
305 310 315 320
Gly Ile Leu His Thr Gln Lys Tyr Leu Asp Trp Tyr Asn Asn Asp Glu
325 330 335
Glu Lys Ala Asn Lys
340
<210>79
<211>1701
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>79
atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt 60
gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta 120
acccgccgct cggcgctgga actgctgaat gccgacaatc tggtcggcaa tgacccggcc 180
gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag 240
aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac 300
gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg 360
gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat 420
gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac 480
gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa 540
gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac 600
aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac 660
accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc 720
tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc 780
gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc 840
aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt 900
attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag 960
gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa 1020
gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg 1080
ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg 1140
gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc 1200
gatctgaatg atccacacat ggatattccg tacaactggc aatgggtgtc gtcgacgcaa 1260
tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca 1320
gtcgtcatca agaattcgat caatggcgat ccgctggtgg cacctgccgg gctcaagcac 1380
aacaccgatg tttacggtgc accgggtgag gcgattgaat tcattttcgt cggtgatttc 1440
aaccatgagg cgtatttccg caccaaggac aacgcggatc tgttcctgag ttacagcgcg 1500
gtatcgggca agggcttgct gtacaacacg cccaaccagg ccggttatcg tgttcagcct 1560
tatggtgtgc tgtggacgat tgagaatacc tactggaatg atttcctctg gtacaacagc 1620
tcgaacgacc gcatctatgt cagcggcacc ggcgctgcca acaagtcaca ctcccagtgg 1680
attattgacg gcttgcagtg a 1701
<210>80
<211>566
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<400>80
Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala
1 5 10 15
Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala
20 25 30
Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu
35 40 45
Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu
50 55 60
Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln
65 70 75 80
Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr
85 90 95
Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp
100 105 110
Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile
115 120 125
Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp
130 135 140
His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn
145 150 155 160
Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala
165 170 175
Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr
180 185 190
Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala
195 200 205
Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu
210 215 220
Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys
225 230 235 240
Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn
245 250 255
Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala
260 265 270
Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val
275 280 285
Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met
290 295 300
Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln
305 310 315 320
Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn
325 330 335
Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro
340 345 350
Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu
355 360 365
Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln
370 375 380
Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly
385 390 395 400
Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val
405 410 415
Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln
420 425 430
Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile Lys Asn Ser Ile Asn
435 440 445
Gly Asp Pro Leu Val Ala Pro Ala Gly Leu Lys His Asn Thr Asp Val
450 455 460
Tyr Gly Ala Pro Gly Glu Ala Ile Glu Phe Ile Phe Val Gly Asp Phe
465 470 475 480
Asn His Glu Ala Tyr Phe Arg Thr Lys Asp Asn Ala Asp Leu Phe Leu
485 490 495
Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu Tyr Asn Thr Pro Asn
500 505 510
Gln Ala Gly Tyr Arg Val Gln Pro Tyr Gly Val Leu Trp Thr Ile Glu
515 520 525
Asn Thr Tyr Trp Asn Asp Phe Leu Trp Tyr Asn Ser Ser Asn Asp Arg
530 535 540
Ile Tyr Val Ser Gly Thr Gly Ala Ala Asn Lys Ser His Ser Gln Trp
545 550 555 560
Ile Ile Asp Gly Leu Gln
565
<210>81
<211>1422
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>81
atgaaaaaga aattatgtac aatggctctt gtaacagcaa tatcttctgg tgttgttacg 60
attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag 120
cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcaaatga aagtacacat 180
ttatggattg cacgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa 240
gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt 300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat 360
gggctaatta gaggagggtg gaaatctcat ttttacgatc ccgatacaag aaagaactat 420
aaaggggaag aagaaccaac agctctttca caaggagata aatattttaa attagcaggt 480
gaatacttta agaagggcga ccaaaaacaa gctttttatt atttaggtgt tgcaacgcat 540
tactttacag atgctactca accaatgcat gctgctaatt ttacagccgt cgacacgagt 600
gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa 660
gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc 720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa 780
tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag 840
aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca 900
tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga 960
gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt 1020
ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat 1080
agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt 1140
catcgaggag aaagtgtact gctgaaaatg acgcaatcta actatgataa ttacgtattt 1200
ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca 1260
cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga 1320
tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa 1380
acagatacac caaaagcttg gaaatttata caggctgaat ag 1422
<210>82
<211>473
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(25)
<223>从环境样品中获得
<400>82
Met Lys Lys Lys Leu Cys Thr Met Ala Leu Val Thr Ala Ile Ser Ser
1 5 10 15
Gly Val Val Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu
20 25 30
Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
35 40 45
Ala Glu His Pro His His Ser Asn Glu Ser Thr His Leu Trp Ile Ala
50 55 60
Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65 70 75 80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
85 90 95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
100 105 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys
115 120 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
130 135 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145 150 155 160
Glu Tyr Phe Lys Lys Gly Asp Gln Lys Gln Ala Phe Tyr Tyr Leu Gly
165 170 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
180 185 190
Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe
195 200 205
Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly
210 215 220
Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225 230 235 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
245 250 255
Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
260 265 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg
275 280 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn
290 295 300
Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly
305 310 315 320
Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
325 330 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala
340 345 350
Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val
355 360 365
Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu
370 375 380
Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385 390 395 400
Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys
405 410 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser
420 425 430
Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
435 440 445
Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro
450 455 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465 470
<210>83
<211>1290
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>83
atgaaaaaga tagtgattta ttcatttgta gcaggggtta tgacatcagg cggcgtattt 60
gccgccagtg acaatattgt ggagacgtcg accccaccac agcatcaggc cccaagcaga 120
caggacaggg cattattcgc gggtgataca acaacctata taaaatgtgt ctacaaagtg 180
gatggccagg atgacagcaa tccatcctca tcttggttat gggcgaaagt gggtagcaac 240
tatgcgaagc tgaaggggta ttggtataat tcaatgccgc tggcaaacat gttttacact 300
gaagtaccct atgcagaggt gatggacttg tgtaatagca ccctgaaggc ggtaggtgcc 360
aactccactc ttgttattcc atatgcatcg gattacaccc tgtcctatta ctatgtgatt 420
tggaatcaag gggctaacca gccggttatc aacgttggcg gcagagagct tgaccgtatg 480
gtggtctttg gtgacagctt gagcgatacc gtcaatgtct ataacggctc gtacggtacc 540
gtgccgaata gtacctcctg gttattgggc catttctcta acggaaagct ttggcatgaa 600
tacctttcca cggtattgaa tctgcctagc tatgtgtggg cgactggcaa tgcggagagt 660
ggagagaaac ccttctttaa cggattcagt aagcaggtgg attctttcag ggattatcac 720
gctcgcacta aaggctacga tattagcaag acgttgttta ccgttctgtt tggtggaaat 780
gattttataa cggggggaaa aagcgccgat gaggtcattg agcaatatac ggtgtcattg 840
aactacttgg ctcaactagg ggcgaagcag gttgcaattt tccgcttgcc agatttttca 900
gtgataccca gcgtttcaac gtggacagag gctgataagg acaaactgag agagaatagt 960
gttcagttta atgaccaagc cgagaagctg atcgctaaac taaacgcggc acatccccaa 1020
acgacgtttt atacgctgag gttggatgac gcttttaagc aggtgttgga aaacagcgac 1080
caatacggct ttgttaataa gactgatacc tgcctggata tttcccaagg cggatacaac 1140
tatgccattg gggcccgcgc gaaaacggca tgtaagagca gcaatgcggc gtttgtattc 1200
tgggacaata tgcatccgac caccaaaaca cacggattgt tggccgatct tttaaaagat 1260
gatgtggtac gcggcctcgc tgcgccatga 1290
<210>84
<211>429
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(22)
<223>从环境样品中获得
<400>84
Met Lys Lys Ile Val Ile Tyr Ser Phe Val Ala Gly Val Met Thr Ser
1 5 10 15
Gly Gly Val Phe Ala Ala Ser Asp Asn Ile Val Glu Thr Ser Thr Pro
20 25 30
Pro Gln His Gln Ala Pro Ser Arg Gln Asp Arg Ala Leu Phe Ala Gly
35 40 45
Asp Thr Thr Thr Tyr Ile Lys Cys Val Tyr Lys Val Asp Gly Gln Asp
50 55 60
Asp Ser Asn Pro Ser Ser Ser Trp Leu Trp Ala Lys Val Gly Ser Asn
65 70 75 80
Tyr Ala Lys Leu Lys Gly Tyr Trp Tyr Asn Ser Met Pro Leu Ala Asn
85 90 95
Met Phe Tyr Thr Glu Val Pro Tyr Ala Glu Val Met Asp Leu Cys Asn
100 105 110
Ser Thr Leu Lys Ala Val Gly Ala Asn Ser Thr Leu Val Ile Pro Tyr
115 120 125
Ala Ser Asp Tyr Thr Leu Ser Tyr Tyr Tyr Val Ile Trp Asn Gln Gly
130 135 140
Ala Asn Gln Pro Val Ile Asn Val Gly Gly Arg Glu Leu Asp Arg Met
145 150 155 160
Val Val Phe Gly Asp Ser Leu Ser Asp Thr Val Asn Val Tyr Asn Gly
165 170 175
Ser Tyr Gly Thr Val Pro Asn Ser Thr Ser Trp Leu Leu Gly His Phe
180 185 190
Ser Asn Gly Lys Leu Trp His Glu Tyr Leu Ser Thr Val Leu Asn Leu
195 200 205
Pro Ser Tyr Val Trp Ala Thr Gly Asn Ala Glu Ser Gly Glu Lys Pro
210 215 220
Phe Phe Asn Gly Phe Ser Lys Gln Val Asp Ser Phe Arg Asp Tyr His
225 230 235 240
Ala Arg Thr Lys Gly Tyr Asp Ile Ser Lys Thr Leu Phe Thr Val Leu
245 250 255
Phe Gly Gly Asn Asp Phe Ile Thr Gly Gly Lys Ser Ala Asp Glu Val
260 265 270
Ile Glu Gln Tyr Thr Val Ser Leu Asn Tyr Leu Ala Gln Leu Gly Ala
275 280 285
Lys Gln Val Ala Ile Phe Arg Leu Pro Asp Phe Ser Val Ile Pro Ser
290 295 300
Val Ser Thr Trp Thr Glu Ala Asp Lys Asp Lys Leu Arg Glu Asn Ser
305 310 315 320
Val Gln Phe Asn Asp Gln Ala Glu Lys Leu Ile Ala Lys Leu Asn Ala
325 330 335
Ala His Pro Gln Thr Thr Phe Tyr Thr Leu Arg Leu Asp Asp Ala Phe
340 345 350
Lys Gln Val Leu Glu Asn Ser Asp Gln Tyr Gly Phe Val Asn Lys Thr
355 360 365
Asp Thr Cys Leu Asp Ile Ser Gln Gly Gly Tyr Asn Tyr Ala Ile Gly
370 375 380
Ala Arg Ala Lys Thr Ala Cys Lys Ser Ser Asn Ala Ala Phe Val Phe
385 390 395 400
Trp Asp Asn Met His Pro Thr Thr Lys Thr His Gly Leu Leu Ala Asp
405 410 415
Leu Leu Lys Asp Asp Val Val Arg Gly Leu Ala Ala Pro
420 425
<210>85
<211>1038
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>85
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga 120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa 180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt 240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt 300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat 540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt 600
gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct 660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg 900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa 960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg 1020
aatagagtgg agtcatag 1038
<210>86
<211>345
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>86
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
20 25 30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
50 55 60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65 70 75 80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
85 90 95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
100 105 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
165 170 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
180 185 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
195 200 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
210 215 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
260 265 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
275 280 285
Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305 310 315 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
325 330 335
Glu Lys Pro Val Asn Arg Val Glu Ser
340 345
<210>87
<211>870
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>87
atgtcaaaga aactcgtaat atcggtagcg ggcggcggag cactcggaat cggaccactc 60
gcattcctgt gcaagattga acagatgctg ggaaagaaga taccccaggt tgcgcaggca 120
tacgccggca cttcaaccgg agcaataatt gcggcaggac tggccgaagg ctactccgcg 180
catgaactgt tcgacctata caaatcaaat ctcagcaaga tattcaccaa atacagctgg 240
tacaaacgcc tgcagccaac gtgtcctaca tatgacaaca gtaacctaaa gaaattactg 300
aaggacaaat tcaagggcaa ggtcggcgac tggaaaactc ccgtatacat cccggcaaca 360
cacatgaacg gccaatccgt agaaaaggtg tgggacttgg gtgacaagaa tgttgacaag 420
tggtttgcca ttctgacaag taccgcggca ccaacctatt tcgactgcat atacgacgac 480
gagaagaact gctacatcga tggtggcatg tggtgcaacg caccaatcga tgtgcttaat 540
gcaggcctga tcaagtccgg ctggtccaac tacaaggtcc tggacctgga gaccggcatg 600
gacacaccga atacggaaag cggaaacaag acacttctcg gatgggggga atacatcata 660
agcaactggg tagcccgttc cagcaagtcc ggcgaatacg aggtaaaggc cataatcggg 720
gaagacaatg tatgtgttgc ccgtccatac gtaagcaaga aaccgaagat ggatgacgtg 780
gacagcaaga cgctggatga agtcgtggat atctgggaaa actacttcta cgccaagcag 840
aaagacatcg catcgtggct gaaaatctag 870
<210>88
<211>289
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>88
Met Ser Lys Lys Leu Val Ile Ser Val Ala Gly Gly Gly Ala Leu Gly
1 5 10 15
Ile Gly Pro Leu Ala Phe Leu Cys Lys Ile Glu Gln Met Leu Gly Lys
20 25 30
Lys Ile Pro Gln Val Ala Gln Ala Tyr Ala Gly Thr Ser Thr Gly Ala
35 40 45
Ile Ile Ala Ala Gly Leu Ala Glu Gly Tyr Ser Ala His Glu Leu Phe
50 55 60
Asp Leu Tyr Lys Ser Asn Leu Ser Lys Ile Phe Thr Lys Tyr Ser Trp
65 70 75 80
Tyr Lys Arg Leu Gln Pro Thr Cys Pro Thr Tyr Asp Asn Ser Asn Leu
85 90 95
Lys Lys Leu Leu Lys Asp Lys Phe Lys Gly Lys Val Gly Asp Trp Lys
100 105 110
Thr Pro Val Tyr Ile Pro Ala Thr His Met Asn Gly Gln Ser Val Glu
115 120 125
Lys Val Trp Asp Leu Gly Asp Lys Asn Val Asp Lys Trp Phe Ala Ile
130 135 140
Leu Thr Ser Thr Ala Ala Pro Thr Tyr Phe Asp Cys Ile Tyr Asp Asp
145 150 155 160
Glu Lys Asn Cys Tyr Ile Asp Gly Gly Met Trp Cys Asn Ala Pro Ile
165 170 175
Asp Val Leu Asn Ala Gly Leu Ile Lys Ser Gly Trp Ser Asn Tyr Lys
180 185 190
Val Leu Asp Leu Glu Thr Gly Met Asp Thr Pro Asn Thr Glu Ser Gly
195 200 205
Asn Lys Thr Leu Leu Gly Trp Gly Glu Tyr Ile Ile Ser Asn Trp Val
210 215 220
Ala Arg Ser Ser Lys Ser Gly Glu Tyr Glu Val Lys Ala Ile Ile Gly
225 230 235 240
Glu Asp Asn Val Cys Val Ala Arg Pro Tyr Val Ser Lys Lys Pro Lys
245 250 255
Met Asp Asp Val Asp Ser Lys Thr Leu Asp Glu Val Val Asp Ile Trp
260 265 270
Glu Asn Tyr Phe Tyr Ala Lys Gln Lys Asp Ile Ala Ser Trp Leu Lys
275 280 285
Ile
<210>89
<211>1422
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>89
atgaaaaaga aattatgtac actggctttt gtaacagcaa tatcttctat cgctatcaca 60
attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag 120
cacaaacgtg tgaagagatg gtctgcggaa catccacatc atcctaatga aagtacgcac 180
ttatggattg cgcgaaatgc aattcaaata atggcccgta atcaagataa gacggttcaa 240
gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt 300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat 360
gggctaatta aaggagggtg gaaatctcat ttttacgatc ccgatacgag aaagaactat 420
aaaggggaag aagaaccaac agctctctct caaggagata aatattttaa attagcaggc 480
gattacttta agaaagagga ttggaaacaa gctttctatt atttaggtgt tgcgacgcac 540
tacttcacag atgctactca gccaatgcat gctgctaatt ttacagccgt cgacacgagt 600
gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa 660
gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc 720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa 780
tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag 840
aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca 900
tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga 960
gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt 1020
ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat 1080
agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt 1140
catcgaggag aaagtatact gctgaaaatg acgcaatcta actatgataa ttacgtattt 1200
ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca 1260
cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga 1320
tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa 1380
acagatacac caaaagcttg gaaatttata caggctgaat ag 1422
<210>90
<211>473
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(25)
<223>从环境样品中获得
<400>90
Met Lys Lys Lys Leu Cys Thr Leu Ala Phe Val Thr Ala Ile Ser Ser
1 5 10 15
Ile Ala Ile Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu
20 25 30
Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
35 40 45
Ala Glu His Pro His His Pro Asn Glu Ser Thr His Leu Trp Ile Ala
50 55 60
Arg Asn Ala Ile Gln Ile Met Ala Arg Asn Gln Asp Lys Thr Val Gln
65 70 75 80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
85 90 95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
100 105 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys
115 120 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
130 135 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145 150 155 160
Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
165 170 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
180 185 190
Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe
195 200 205
Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly
210 215 220
Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225 230 235 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
245 250 255
Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
260 265 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg
275 280 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn
290 295 300
Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly
305 310 315 320
Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
325 330 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala
340 345 350
Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val
355 360 365
Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu
370 375 380
Ser Ile Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385 390 395 400
Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys
405 410 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser
420 425 430
Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
435 440 445
Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro
450 455 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465 470
<210>91
<211>1035
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>91
atgacaaccc aatttagaaa cctgatcttt gagggcggcg gtgtaaaggg cattgcttac 60
gtcggagcaa tgcagattct tgaaaatcgt ggtgtattac aagatattca ccgagtcgga 120
ggttgtagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac agtccgtgag 180
caaaaagaga tcttacaaat taccgatttt aaccagttta tggataactc gtggggtgtt 240
attcgggata ttcgcaggct tgcgagagaa tttggctgga ataagggtaa cttctttaat 300
acctggatag gtgatttgat tcatcgtcgt ttgggtaatc gccgagccac gttcaaagat 360
ctgcaaaagg caaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420
gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat 540
gtcgatgggg gtgtgcagct taactacccg atcaagctgt ttgatcgaac tcgttatatt 600
gacctcgcca aagatccggg tgctgctcgc cacacgggtt attacaataa agagaatgct 660
cgttttcagc ttgagcgacc gggccacagt ccttatgtgt acaatcgcca aacattaggc 720
ttgcgtcttg acagtcgtga agagatagcg ctgtttcgtt acgacgaacc tcttcagggt 780
aaacccatta agtccttcac tgactacgct cgacaacttt ttggtgcgct gaagaatgca 840
caggaaaaca ttcacctaca tggcgatgat tggcagcgca cggtctatat cgatacattg 900
gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgaacag 960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgtttga gaagcctgtg 1020
aatagagtgg agtaa 1035
<210>92
<211>344
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>92
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Ile Ala Tyr Val Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
20 25 30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
50 55 60
Leu Gln Ile Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65 70 75 80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Glu Phe Gly Trp Asn Lys Gly
85 90 95
Asn Phe Phe Asn Thr Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
100 105 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
165 170 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
180 185 190
Leu Phe Asp Arg Thr Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
195 200 205
Ala Arg His Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
210 215 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Ala Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Gln Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
260 265 270
Leu Phe Gly Ala Leu Lys Asn Ala Gln Glu Asn Ile His Leu His Gly
275 280 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305 310 315 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Phe
325 330 335
Glu Lys Pro Val Asn Arg Val Glu
340
<210>93
<211>963
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>93
gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt atcaggggtt 60
ttcgtaccgc tgcagccatc atatgctact gaaaattatc caaatgattt taaactgttg 120
caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca 180
gattatatga gtaatgcaga ttactttaag ggacatgatg ctctgctctt aaatgagctt 240
tttgacaatg gaaattcgaa cgtgctgcta atgaacttat ccaaggaata tacatatcaa 300
acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat 360
tttgtacccg aagatggtgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata 420
cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat 480
gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa 540
gataccgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc 600
aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac 660
tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc 720
aatgcgccta ccgaatattt agggcataac tctacttggg acccagaaac gaacagcatt 780
acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa 840
gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg 900
aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa 960
taa 963
<210>94
<211>320
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(29)
<223>从环境样品中获得
<400>94
Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu
1 5 10 15
Leu Ser Gly Val Phe Val Pro Leu Gln Pro Ser Tyr Ala Thr Glu Asn
20 25 30
Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro
35 40 45
Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser
50 55 60
Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu
65 70 75 80
Phe Asp Asn Gly Asn Ser Asn Val Leu Leu Met Asn Leu Ser Lys G1u
85 90 95
Tyr Thr Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp
100 105 110
Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val
115 120 125
Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr
130 135 140
Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr
145 150 155 160
Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His
165 170 175
Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile
180 185 190
Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn
195 200 205
Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met
210 215 220
Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val
225 230 235 240
Asn Ala Pro Thr Glu Tyr Leu Gly His Asn Ser Thr Trp Asp Pro Glu
245 250 255
Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His
260 265 270
Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp
275 280 285
Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr
290 295 300
Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys
305 310 315 320
<210>95
<211>1038
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>95
atggcttcac aattcaggaa tctggtattt gaaggaggtg gtgtaaaagg gattgcgtac 60
ataggtgcga tgcaggtgct ggatcagcgc ggttatttgg gtgataacat caaacgcgtt 120
ggtggaacca gtgcaggtgc cataaatgcg ctgatttatt cgttaggata tgacatccac 180
gaacaacaag agatactgaa ctctacagat tttaaaaagt ttatggataa ctcttttgga 240
tttgtgaggg atttcagaag gctatggaat gaatttggat ggaatagagg agactttttt 300
cttaaatggt caggtgagct gatcaaaaat aaattgggca cctcaaaagc cacctttcag 360
gatttgaagg atgccggtca gccagatttg tatgtaattg gaacaaattt atcgacgggg 420
ttttccgaga ctttttcata tgaacgtcac cccgatatga ctcttgcaga agccgtaaga 480
atcagtatgt cgcttccgct gtttttcagg gctgtgcggt tgggcgacag gaatgatgta 540
tatgtggatg gtggggttca gctcaattac ccggtaaaac tatttgatcg tgaaaaatat 600
attgatatgg ataatgaggc ggctgcagca cgatttactg attattacaa caaagaaaat 660
gccagatttt cgctccagcg gcctggacga agcccctatg tatataatcg tcaaaccctt 720
ggtttgagac tggatacagc cgaagaaatt gcgcttttca ggtacgatga acccattcag 780
gggaaagaga tcaaacggtt tccggaatat gcaaaggctc tgatcggcgc actaatgcag 840
gtgcaggaaa acatacatct ccacagtgac gactggcagc gtacgctgta tatcaatacc 900
ctggatgtaa aaaccacaga ttttgaatta accgatgaga aaaaaaagga actggtagaa 960
cagggaatcc ttggcgcgga aacctatttc aaatggtttg aagacaggga tgaagtagtt 1020
gtaaaccgcc ttgcttag 1038
<210>96
<211>345
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>96
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Asp Gln Arg Gly Tyr
20 25 30
Leu Gly Asp Asn Ile Lys Arg Val Gly Gly Thr Ser Ala Gly Ala Ile
35 40 45
Asn Ala Leu Ile Tyr Ser Leu Gly Tyr Asp Ile His Glu Gln Gln Glu
50 55 60
Ile Leu Asn Ser Thr Asp Phe Lys Lys Phe Met Asp Asn Ser Phe Gly
65 70 75 80
Phe Val Arg Asp Phe Arg Arg Leu Trp Asn Glu Phe Gly Trp Asn Arg
85 90 95
Gly Asp Phe Phe Leu Lys Trp Ser Gly Glu Leu Ile Lys Asn Lys Leu
100 105 110
Gly Thr Ser Lys Ala Thr Phe Gln Asp Leu Lys Asp Ala Gly Gln Pro
115 120 125
Asp Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr
130 135 140
Phe Ser Tyr Glu Arg His Pro Asp Met Thr Leu Ala Glu Ala Val Arg
145 150 155 160
Ile Ser Met Ser Leu Pro Leu Phe Phe Arg Ala Val Arg Leu Gly Asp
165 170 175
Arg Asn Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Val
180 185 190
Lys Leu Phe Asp Arg Glu Lys Tyr Ile Asp Met Asp Asn Glu Ala Ala
195 200 205
Ala Ala Arg Phe Thr Asp Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Ser
210 215 220
Leu Gln Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu
225 230 235 240
Gly Leu Arg Leu Asp Thr Ala Glu Glu Ile Ala Leu Phe Arg Tyr Asp
245 250 255
Glu Pro Ile Gln Gly Lys Glu Ile Lys Arg Phe Pro Glu Tyr Ala Lys
260 265 270
Ala Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu His
275 280 285
Ser Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Lys
290 295 300
Thr Thr Asp Phe Glu Leu Thr Asp Glu Lys Lys Lys Glu Leu Val Glu
305 310 315 320
Gln Gly Ile Leu Gly Ala Glu ThrTyr Phe Lys Trp Phe Glu Asp Arg
325 330 335
Asp Glu Val Val Val Asn Arg Leu Ala
340 345
<210>97
<211>1422
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>97
atgaaaagga aactatgtac atgggctctc gtaacagcaa tagcttctag tactgcggta 60
attccaacag cagcagaagc ttgtggatta ggagaagtaa tcaaacaaga gaatcaagag 120
cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcacatga aagtacccat 180
ttatggattg cacaaaatgc gattcaaatt atgagccgta atcaagataa gacggttcaa 240
gaaaatgaat tacaattttt aaatacccct gaatataagg agttatttga aagaggtctt 300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtataat cggcattgat 360
gggctaattc gaggagggtg gaaatctcat ttctacgatc ccgatacaag aaagaactat 420
aaaggggagg aagaaccaac agctctttct caaggagata aatattttaa attagcaggt 480
gaatacttta agaagaatga ttggaaacag gctttctatt atttaggtgt tgcgacgcac 540
tactttacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacaggagt 600
gctataaagt ttcatagtgc ttttgaagat tatgtgacga caattcagga acagtttaaa 660
gtatcagatg gagagggaaa atataattta gtaaattcta atgatccgaa acagtggatc 720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga tgtgattaaa 780
tctcactata ataaaggaaa caatgctctt tggcagcaag aagttatgcc agctgttcag 840
agaagtttag aacaagccca aagaaatacg gcgggattta ttcatttatg gtttaaaaca 900
tatgttggaa aaacagctgc tgaagatatt gaaaatacta tagtgaaaga ttctagggga 960
gaagcaatac aagagaataa aaaatacttt gtagtaccaa gtgagttttt aaatagaggc 1020
ttaacatttg aagtgtatgc tgcttatgac tatgcgttat tatctaacca tgtggatgat 1080
aataatattc atggtacacc ggttcaaatt gtatttgata aagaaaataa tgggatcctt 1140
catcaaggag aaagtgcatt gttaaagatg acacaatcca actacgataa ttatgtattt 1200
ctaaattatt ctatcataac aaattgggta catcttgcaa aaagagaaaa caatactgca 1260
cagtttaaag tgtatccaaa tccaaataat ccaactgaat atttcatata tacagatggc 1320
tatccagtta attatcaaga aaaaggtaaa gagaaaagct ggattgtttt aggaaagaaa 1380
acggataaac caaaagcatg gaaatttata caggcggaat aa 1422
<210>98
<211>473
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(25)
<223>从环境样品中获得
<400>98
Met Lys Arg Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ala Ser
1 5 10 15
Ser Thr Ala Val Ile Pro Thr Ala Ala Glu Ala Cys Gly Leu Gly Glu
20 25 30
Val Ile Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
35 40 45
Ala Glu His Pro His His Ser His Glu Ser Thr His Leu Trp Ile Ala
50 55 60
Gln Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65 70 75 80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
85 90 95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
100 105 110
Gly Thr Gly Ile Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys
115 120 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
130 135 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145 150 155 160
Glu Tyr Phe Lys Lys Asn Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
165 170 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
180 185 190
Asn Phe Thr Ala Val Asp Arg Ser Ala Ile Lys Phe His Ser Ala Phe
195 200 205
Glu Asp Tyr Val Thr Thr Ile Gln Glu Gln Phe Lys Val Ser Asp Gly
210 215 220
Glu Gly Lys Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225 230 235 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
245 250 255
Asp Val Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
260 265 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Gln Ala Gln Arg
275 280 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys
290 295 300
Thr Ala Ala Glu Asp Ile Glu Asn Thr Ile Val Lys Asp Ser Arg Gly
305 310 315 320
Glu Ala Ile Gln Glu Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
325 330 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr AlaA la Tyr Asp Tyr Ala
340 345 350
Leu Leu Ser Asn His Val Asp Asp Asn Asn Ile His Gly Thr Pro Val
355 360 365
Gln Ile Val Phe Asp Lys Glu Asn Asn Gly Ile Leu His Gln Gly Glu
370 375 380
Ser Ala Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385 390 395 400
Leu Asn Tyr Ser Ile Ile Thr Asn Trp Val His Leu Ala Lys Arg Glu
405 410 415
Asn Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Thr
420 425 430
Glu Tyr Phe Ile Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Lys
435 440 445
Gly Lys Glu Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Lys Pro
450 455 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465 470
<210>99
<211>1053
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>99
atggcaaagc gttttattct ttcgatcgat ggtggtggca ttcgcgggat catcccggcg 60
gccatcctgg tggagctggc caagcggttg gaggggctgc cgcttcacaa ggcattcgac 120
atgatcgccg ggacatccac cggcggcatc attgcggcgg ggctgacatg cccgcatcct 180
gacgatgagg agacggcggc gtgcacgccg accgatcttc tcaagcttta tgtcgatcac 240
ggcggcaaga tcttcgagaa aaacccgatc ctcggcctca tcaacccatt cggcctcaac 300
gatccgcgct accagccaga tgagctggaa aacaggctga aggcgcagct cggcttgacg 360
gcgacgctcg ataaagggct caccaaggtg ctgatcacgg cctatgatat ccagcagcgg 420
caggcgctgt tcatggcaaa caccgacaac gagaacagca atttccgcta ctgggaggca 480
gcgcgggcga catcggccgc acccacctat tttccgccgg cgctgatcga aagggttggc 540
gagaagaaca aggacaagcg cttcgtgcca ttgatcgacg gcggcgtctt cgccaacgat 600
cctatccttg ccgcctatgt ggaggcgcga aagcagaaat ggggcaatga cgagctcgtt 660
ttcctgtcgc ttggtaccgg ccagcaaaac cgcccgatcg cctatcagga ggccaagggc 720
tggggcattt taggctggat gcagccgtct catgacacgc cgctgatctc gatcctgatg 780
cagggacagg cgagcaccgc ctcctatcag gccaatgcgc tgctcaatcc gcccggcacc 840
aagatcgact attcgaccgt ggtgacgaag gacaacgcgg cttcgctcag ctatttccgt 900
ctcgaccggc agctgagctc gaaggagaac gacgcgctgg acgacgcatc gcccgaaaac 960
atcagggcgc tgaaggcaat cgccgcgcaa atcatcaagg ataacgcgcc ggcgctcgac 1020
gaaatcgcca aacgcatcct ggccaaccaa taa 1053
<210>100
<211>350
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>100
Met Ala Lys Arg Phe Ile Leu Ser Ile Asp Gly Gly Gly Ile Arg Gly
1 5 10 15
Ile Ile Pro Ala Ala Ile Leu Val Glu Leu Ala Lys Arg Leu Glu Gly
20 25 30
Leu Pro Leu His Lys Ala Phe Asp Met Ile Ala Gly Thr Ser Thr Gly
35 40 45
Gly Ile Ile Ala Ala Gly Leu Thr Cys Pro His Pro Asp Asp Glu Glu
50 55 60
Thr Ala Ala Cys Thr Pro Thr Asp Leu Leu Lys Leu Tyr Val Asp His
65 70 75 80
Gly Gly Lys Ile Phe Glu Lys Asn Pro Ile Leu Gly Leu Ile Asn Pro
85 90 95
Phe Gly Leu Asn Asp Pro Arg Tyr Gln Pro Asp Glu Leu Glu Asn Arg
100 105 110
Leu Lys Ala Gln Leu Gly Leu Thr AlaThr Leu Asp Lys Gly Leu Thr
115 120 125
Lys Val Leu Ile Thr Ala Tyr Asp Ile Gln Gln Arg Gln Ala Leu Phe
130 135 140
Met Ala Asn Thr Asp Asn Glu Asn Ser Asn Phe Arg Tyr Trp Glu Ala
145 150 155 160
Ala Arg Ala Thr Ser Ala Ala Pro Thr Tyr Phe Pro Pro Ala Leu Ile
165 170 175
Glu Arg Val Gly Glu Lys Asn Lys Asp Lys Arg Phe Val Pro Leu Ile
180 185 190
Asp Gly Gly Val Phe Ala Asn Asp Pro Ile Leu Ala Ala Tyr Val Glu
195 200 205
Ala Arg Lys Gln Lys Trp Gly Asn Asp Glu Leu Val Phe Leu Ser Leu
210 215 220
Gly Thr Gly Gln Gln Asn Arg Pro Ile Ala Tyr Gln Glu Ala Lys Gly
225 230 235 240
Trp Gly Ile Leu Gly Trp Met Gln Pro Ser His Asp Thr Pro Leu Ile
245 250 255
Ser Ile Leu Met Gln Gly Gln Ala Ser Thr Ala Ser Tyr Gln Ala Asn
260 265 270
Ala Leu Leu Asn Pro Pro Gly Thr Lys Ile Asp Tyr Ser Thr Val Val
275 280 285
Thr Lys Asp Asn Ala Ala Ser Leu Ser Tyr Phe Arg Leu Asp Arg Gln
290 295 300
Leu Ser Ser Lys Glu Asn Asp Ala Leu Asp Asp Ala Ser Pro Glu Asn
305 310 315 320
Ile Arg Ala Leu Lys Ala Ile Ala Ala Gln Ile Ile Lys Asp Asn Ala
325 330 335
Pro Ala Leu Asp Glu Ile Ala Lys Arg Ile Leu Ala Asn Gln
340 345 350
<210>101
<211>996
<212>DNA
<213>细菌
<400>101
ttgtcgctcg tcgcgtcgct ccgccgcgcc cccggcgccg ccctggccct cgcgcttgcc 60
gccgccaccc tggccgtgac cgcgcagggc gcgaccgccg cccccgccgc ggccgccgcc 120
gaggccccgc ggctcaaggt gctcacgtac aacacgttcc tgttctcgaa gacgctctac 180
ccgaactggg gccaggacca ccgggccaag gcgatcccca ccgccccctt ctaccagggc 240
caggacgtcg tggtcctcca ggaggccttc gacaactccg cgtcggacgc cctcaaggcg 300
aactccgccg gccagtaccc ctaccagacc cccgtcgtgg gccgcggcac cggcggctgg 360
gacgccaccg gcgggtccta ctcctcgacc acccccgagg acggcggcgt gacgatcctc 420
agcaagtggc cgatcgtccg caaggagcag tacgtctaca aggacgcgtg cggcgccgac 480
tggtggtcca acaagggctt cgcctacgtc gtgctcaacg tgaacggcag caaggtgcac 540
gtcctcggca cccacgccca gtccaccgac ccgggctgct cggcgggcga ggcggtgcag 600
atgcggagcc gccagttcaa ggcgatcgac gccttcctcg acgccaagaa catcccggcg 660
ggcgagcagg tgatcgtcgc cggcgacatg aacgtcgact cgcgcacgcc cgagtacggc 720
accatgctcg ccgacgccgg tctggcggcg gccgacgcgc gcaccggcca cccgtactcc 780
ttcgacaccg agctgaactc gatcgcctcc gagcgctacc cggacgaccc gcgcgaggac 840
ctcgattacg tcctctaccg cgccgggaac gcccgccccg ccaactggac caacaacgtg 900
gtcctggaga agagcgcccc gtggaccgtc tccagctggg gcaagagcta cacctacacc 960
aacctctccg accactaccc ggtcaccggc ttctga 996
<210>102
<211>331
<212>PRT
<213>细菌
<220>
<221>信号
<222>(1)...(39)
<400>102
Leu Ser Leu Val Ala Ser Leu Arg Arg Ala Pro Gly Ala Ala Leu Ala
1 5 10 15
Leu Ala Leu Ala Ala Ala Thr Leu Ala Val Thr Ala Gln Gly Ala Thr
20 25 30
Ala Ala Pro Ala Ala Ala Ala Ala Glu Ala Pro Arg Leu Lys Val Leu
35 40 45
Thr Tyr Asn Thr Phe Leu Phe Ser Lys Thr Leu Tyr Pro Asn Trp Gly
50 55 60
Gln Asp His Arg Ala Lys Ala Ile Pro Thr Ala Pro Phe Tyr Gln Gly
65 70 75 80
Gln Asp Val Val Val Leu Gln Glu Ala Phe Asp Asn Ser Ala Ser Asp
85 90 95
Ala Leu Lys Ala Asn Ser Ala Gly Gln Tyr Pro Tyr Gln Thr Pro Val
100 105 110
Val Gly Arg Gly Thr Gly Gly Trp Asp Ala Thr Gly Gly Ser Tyr Ser
115 120 125
Ser Thr Thr Pro Glu Asp Gly Gly Val Thr Ile Leu Ser Lys Trp Pro
130 135 140
Ile Val Arg Lys Glu Gln Tyr Val Tyr Lys Asp Ala Cys Gly Ala Asp
145 150 155 160
Trp Trp Ser Asn Lys Gly Phe Ala Tyr Val Val Leu Asn Val Asn Gly
165 170 175
Ser Lys Val His Val Leu Gly Thr His Ala Gln Ser Thr Asp Pro Gly
180 185 190
Cys Ser Ala Gly Glu Ala Val Gln Met Arg Ser Arg Gln Phe Lys Ala
195 200 205
Ile Asp Ala Phe Leu Asp Ala Lys Asn Ile Pro Ala Gly Glu Gln Val
210 215 220
Ile Val Ala Gly Asp Met Asn Val Asp Ser Arg Thr Pro Glu Tyr Gly
225 230 235 240
Thr Met Leu Ala Asp Ala Gly Leu Ala Ala Ala Asp Ala Arg Thr Gly
245 250 255
His Pro Tyr Ser Phe Asp Thr Glu Leu Asn Ser Ile Ala Ser Glu Arg
260 265 270
Tyr Pro Asp Asp Pro Arg Glu Asp Leu Asp Tyr Val Leu Tyr Arg Ala
275 280 285
Gly Asn Ala Arg Pro Ala Asn Trp Thr Asn Asn Val Val Leu Glu Lys
290 295 300
Ser Ala Pro Trp Thr Val Ser Ser Trp Gly Lys Ser Tyr Thr Tyr Thr
305 310 315 320
Asn Leu Ser Asp His Tyr Pro Val Thr Gly Phe
325 330
<210>103
<211>2205
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>103
atgagcgaga agaaggagat tcgcgttgcg ttgatcatgg ggggtggcgt cagcctcggc 60
agtttttcgg gtggtgcgct tctcaagacc atcgagctgc tgcagcacac tgcccgcggt 120
ccggcgaaga tcgatgtcgt gaccggtgcc tcggcgggaa gcatgacgct gggcgtagtc 180
atctaccacc tcatgcgggg atcgtcgacc gatgagattc tccgcgatct gaggcggtcg 240
tgggtggaaa tgatctcgtt cgacggcctc tgtccgccga acctgtcccg tcacgacaag 300
ccgagcctgt tttccgatga gatcgtccgg aagatcgcgg ccaccgtcat cgatatgggg 360
cgcaagctcg aggcggctcc tcatccgctt ttcgccgacg aactcgtagc ctcgttcgca 420
ctgacgaacc tgaacggcat ccccgcccgt acggagggcc agctcatccg gcaggcaaag 480
ggaggcggag ggtccgagaa gggctcgaaa tccgttttcg ccgacgccgt gcagactacc 540
tttcaccacg acgtgatgcg attcgtggtg cggcgcgatc acaacgggca aggcagcctg 600
ttcgacagcc gttaccgggc acgcatactc cctccatgga atgttgggaa gggcggcgat 660
gcatgggaag cctttcgcac ggcggctgtt gcctcggggg cgtttccggc cgcatttcct 720
cccgtcgaga tcagccgcaa ccgcgacgaa ttcaacatct ggcccgatcg catcgaggac 780
cagaaggcat ttacgttcga ttacgtggac ggcggggtac ttcgcaacga acccctccgg 840
gaggcgattc acctggccgc gctgcgcgat gagggagcga cggacatcga gcgtgtgttc 900
atcctcatcg acccgaacat cagcggcacc ggcgaggtct tcccgctctc ctataaccag 960
cagatgcgga tcaagccgaa ctacgattcc aacggcgacg tccgacagta cgatctcgat 1020
gtgccggact acaccggcaa tctgatcggg gcgatcggtc ggctgggttc ggtgatcgtc 1080
gggcaggcga cgttccgcga ctggctcaag gctgccaaag tgaacagcca gatcgagtgg 1140
cgacgggaat tgctgcccat tctccgcgac ctgaacccga accccgggga ggaggcgcgc 1200
aggggcgtga acgggatgat cgacaagatc taccggcaaa agtatcagcg cgccctcgag 1260
tcaaagagcg ttccggtcga ggaggtggaa cggcgcgttg ccgaagacat cgaacgggac 1320
ctggcgcggc gccgttcgga ggccggcgac aacgacttca ttgcccggct cctcctgctc 1380
gtcgacctga tcggcaacct gcgtgagaag cagaagctga acatggtggc gatcaccccc 1440
gcttccgcgc cgcacaacga cgggcgcccc ttgccgctgg ccggcaattt tatgttcagc 1500
ttcggggggt tcttcaggga ggagtacagg caatacgact tctcggtcgg cgaattcgca 1560
gcatggaacg tcctgagcac gccggcctcc gagacgccct ttcttgccga gaccgccccg 1620
aaaccgcccg cccgacctcc ccagccgccg gcaatcaatc ctacctaccg ctcactcggc 1680
ccgcccatcc agcagcggtt cgaggagttc gttcgtgggc acgttcgcgc ctttatcgct 1740
tcggtcgctc cgctgggaac gagagggatc gtcacgggca agattggcgg aaagcttcga 1800
acgatgctga tggcctcgcg caacgggaaa tcagagtact tccggcttcg cctctccggc 1860
gttgacgggc tctacctccg aggctccaag ggccgcaacc tgagggcggt taacggatcg 1920
atcgacacgg tcgtcggcgt ctatatcgac gaggaagatc agcaccgcga tgagtttttc 1980
ggtccccatg tcttcggcgc gaacggctca ggctttacga tggaactatg ggagtcccgc 2040
ggttttttcg ggcgtgatcg tcgcgtcgct gtgatcgagt tggagaacaa ccccggcggg 2100
ttcgcaatcg ccgccggatg caggcggcgg cccggcgtgg tgctggatat ggccaggcgt 2160
aacgggcagc cactgcggac ggtggatgtg atggaatttg cgtga 2205
<210>104
<211>734
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>104
Met Ser Glu Lys Lys Glu Ile Arg Val Ala Leu Ile Met Gly Gly Gly
1 5 10 15
Val Ser Leu Gly Ser Phe Ser Gly Gly Ala Leu Leu Lys Thr Ile Glu
20 25 30
Leu Leu Gln His Thr Ala Arg Gly Pro Ala Lys Ile Asp Val Val Thr
35 40 45
Gly Ala Ser Ala Gly Ser Met Thr Leu Gly Val Val Ile Tyr His Leu
50 55 60
Met Arg Gly Ser Ser Thr Asp Glu Ile Leu Arg Asp Leu Arg Arg Ser
65 70 75 80
Trp Val Glu Met Ile Ser Phe Asp Gly Leu Cys Pro Pro Asn Leu Ser
85 90 95
Arg His Asp Lys Pro Ser Leu Phe Ser Asp Glu Ile Val Arg Lys Ile
100 105 110
Ala Ala Thr Val Ile Asp Met Gly Arg Lys Leu Glu Ala Ala Pro His
115 120 125
Pro Leu Phe Ala Asp Glu Leu Val Ala Ser Phe Ala Leu Thr Asn Leu
130 135 140
Asn Gly Ile Pro Ala Arg Thr Glu Gly Gln Leu Ile Arg Gln Ala Lys
145 150 155 160
Gly Gly Gly Gly Ser Glu Lys Gly Ser Lys Ser Val Phe Ala Asp Ala
165 170 175
Val Gln Thr Thr Phe His His Asp Val Met Arg Phe Val Val Arg Arg
180 185 190
Asp His Asn Gly Gln Gly Ser Leu Phe Asp Ser Arg Tyr Arg Ala Arg
195 200 205
Ile Leu Pro Pro Trp Asn Val Gly Lys Gly Gly Asp Ala Trp Glu Ala
210 215 220
Phe Arg Thr Ala Ala Val Ala Ser Gly Ala Phe Pro Ala Ala Phe Pro
225 230 235 240
Pro Val Glu Ile Ser Arg Asn Arg Asp Glu Phe Asn Ile Trp Pro Asp
245 250 255
Arg Ile Glu Asp Gln Lys Ala Phe Thr Phe Asp Tyr Val Asp Gly Gly
260 265 270
Val Leu Arg Asn Glu Pro Leu Arg Glu Ala Ile His Leu Ala Ala Leu
275 280 285
Arg Asp Glu Gly Ala Thr Asp Ile Glu Arg Val Phe Ile Leu Ile Asp
290 295 300
Pro Asn Ile Ser Gly Thr Gly Glu Val Phe Pro Leu Ser Tyr Asn Gln
305 310 315 320
Gln Met Arg Ile Lys Pro Asn Tyr Asp Ser Asn Gly Asp Val Arg Gln
325 330 335
Tyr Asp Leu Asp Val Pro Asp Tyr Thr Gly Asn Leu Ile Gly Ala Ile
340 345 350
Gly Arg Leu Gly Ser Val Ile Val Gly Gln Ala Thr Phe Arg Asp Trp
355 360 365
Leu Lys Ala Ala Lys Val Asn Ser Gln Ile Glu Trp Arg Arg Glu Leu
370 375 380
Leu Pro Ile Leu Arg Asp Leu Asn Pro Asn Pro Gly Glu Glu Ala Arg
385 390 395 400
Arg Gly Val Asn Gly Met Ile Asp Lys Ile Tyr Arg Gln Lys Tyr Gln
405 410 415
Arg Ala Leu Glu Ser Lys Ser Val Pro Val Glu Glu Val Glu Arg Arg
420 425 430
Val Ala Glu Asp Ile Glu Arg Asp Leu Ala Arg ArgArg Ser Glu Ala
435 440 445
Gly Asp Asn Asp Phe Ile Ala Arg Leu Leu Leu Leu Val Asp Leu Ile
450 455 460
Gly Asn Leu Arg Glu Lys Gln Lys Leu Asn Met Val Ala Ile Thr Pro
465 470 475 480
Ala Ser Ala Pro His Asn Asp Gly Arg Pro Leu Pro Leu Ala Gly Asn
485 490 495
Phe Met Phe Ser Phe Gly Gly Phe Phe Arg Glu Glu Tyr Arg Gln Tyr
500 505 510
Asp Phe Ser Val Gly Glu Phe Ala Ala Trp Asn Val Leu Ser Thr Pro
515 520 525
Ala Ser Glu Thr Pro Phe Leu Ala Glu Thr Ala Pro Lys Pro Pro Ala
530 535 540
Arg Pro Pro Gln Pro Pro Ala Ile Asn Pro Thr Tyr Arg Ser Leu Gly
545 550 555 560
Pro Pro Ile Gln Gln Arg Phe Glu Glu Phe Val Arg Gly His Val Arg
565 570 575
Ala Phe Ile Ala Ser Val Ala Pro Leu Gly Thr Arg Gly Ile Val Thr
580 585 590
Gly Lys Ile Gly Gly Lys Leu Arg Thr Met Leu Met Ala Ser Arg Asn
595 600 605
Gly Lys Ser Glu Tyr Phe Arg Leu Arg Leu Ser Gly Val Asp Gly Leu
610 615 620
Tyr Leu Arg Gly Ser Lys Gly Arg Asn Leu Arg Ala Val Asn Gly Ser
625 630 635 640
Ile Asp Thr Val Val Gly Val Tyr Ile Asp Glu Glu Asp Gln His Arg
645 650 655
Asp Glu Phe Phe Gly Pro His Val Phe Gly Ala Asn Gly Ser Gly Phe
660 665 670
Thr Met Glu Leu Trp Glu SerArg Gly Phe Phe Gly Arg Asp Arg Arg
675 680 685
Val Ala Val Ile Glu Leu Glu Asn Asn Pro Gly Gly Phe Ala Ile Ala
690 695 700
Ala Gly Cys Arg Arg Arg Pro Gly Val Val Leu Asp Met Ala Arg Arg
705 710 715 720
Asn Gly Gln Pro Leu Arg Thr Val Asp Val Met Glu Phe Ala
725 730
<210>105
<211>756
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>105
atgaaccgtt gtcggaactc actcaacctc caacttcgcg cggtgaccgt ggcggcgttg 60
gtagtcgtcg catcctcggc cgcgctggcg tgggacagcg cctcgcgcaa tccgacccat 120
cccacccaca gctacctcac cgaatacgcc atcgatcagc ttggggtggc gcggccggag 180
ctccggcaat accgcaagca gatcatcgag ggcgccaaca ccgagctgca cgaactgcca 240
gtcaagggga cggcctatgg cctcgacctc gacgccaagc ggcgggaaca ccgcggcacc 300
aatgccggga cagacgacat cgccggctgg tgggcggaaa gcctccaagc ctatcgcgcc 360
ggtgccaagg aacgcgccta cttcgtgctg ggggtggtgc tgcacatggt cgaggacatg 420
ggcgtgccgg cgcacgcgaa cggcgtctac caccagggca acctgactga attcgacaat 480
ttcgagttca tgggactgtc gaactggaag ccctctttcg ccgacatcaa ccggaccgat 540
ccgggctacg ccgacccgtc gcgctactac gagttcagcc gagattggac ggcggcagac 600
gcacccggct atcgcgaccg cgacagcttc tcgaagacct gggttctcgc cagcccggcc 660
gaacgtcagc tgcttcagaa ccgccagggc cggaccgcca cggtcgccat gtgggcgtta 720
cggagcgcga cgaaggcgtt cgccgggaaa ccctag 756
<210>106
<211>251
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(30)
<223>从环境样品中获得
<400>106
Met Asn Arg Cys Arg Asn Ser Leu Asn Leu Gln Leu Arg Ala Val Thr
1 5 10 15
Val Ala Ala Leu Val Val Val Ala Ser Ser Ala Ala Leu Ala Trp Asp
20 25 30
Ser Ala Ser Arg Asn Pro Thr His Pro Thr His Ser Tyr Leu Thr Glu
35 40 45
Tyr Ala Ile Asp Gln Leu Gly Val Ala Arg Pro Glu Leu Arg Gln Tyr
50 55 60
Arg Lys Gln Ile Ile Glu Gly Ala Asn Thr Glu Leu His Glu Leu Pro
65 70 75 80
Val Lys Gly Thr Ala Tyr Gly Leu Asp Leu Asp Ala Lys Arg Arg Glu
85 90 95
His Arg Gly Thr Asn Ala Gly Thr Asp Asp Ile Ala Gly Trp Trp Ala
100 105 110
Glu Ser Leu Gln Ala Tyr Arg Ala Gly Ala Lys Glu Arg Ala Tyr Phe
115 120 125
Val Leu Gly Val Val Leu His Met Val Glu Asp Met Gly Val Pro Ala
130 135 140
His Ala Asn Gly Val Tyr His Gln Gly Asn Leu Thr Glu Phe Asp Asn
145 150 155 160
Phe Glu Phe Met Gly Leu Ser Asn Trp Lys Pro Ser Phe Ala Asp Ile
165 170 175
Asn Arg Thr Asp Pro Gly Tyr Ala Asp Pro Ser Arg Tyr Tyr Glu Phe
180 185 190
Ser Arg Asp Trp Thr Ala Ala Asp Ala Pro Gly Tyr Arg Asp Arg Asp
195 200 205
Ser Phe Ser Lys Thr Trp Val Leu Ala Ser Pro Ala Glu Arg Gln Leu
210 215 220
Leu Gln Asn Arg Gln Gly Arg Thr Ala Thr Val Ala Met Trp Ala Leu
225 230 235 240
Arg Ser Ala Thr Lys Ala Phe Ala Gly Lys Pro
245 250
<210>107
<211>990
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>107
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt 60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac 120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca 180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg 240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga 300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg gaccattata tctttatgta 360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt 480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata 540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa 600
tctggaggat ataataattt ttattggcca gataatgaca cgtttacgac aactgtaaat 660
caaaatgtaa atgtaacagt acaagataaa tataaggtga gttatgatga gaaagtaaca 720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat 780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattacgcg 840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctac gagagtgggc 900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata 960
agagcgaata agtcacttgt aaaagagtaa 990
<210>108
<211>329
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
<400>108
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
1 5 10 15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
20 25 30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
35 40 45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
50 55 60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65 70 75 80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
85 90 95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
100 105 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
115 120 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
130 135 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145 150 155 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
165 170 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
180 185 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
195 200 205
Trp Pro Asp Asn Asp Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
210 215 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Thr
225 230 235 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
245 250 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
260 265 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
275 280 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Val Ile Gln
290 295 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305 310 315 320
Arg Ala Asn Lys Ser Leu Val Lys Glu
325
<210>109
<211>990
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>109
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt 60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac 120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca 180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg 240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga 300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt 480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata 540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa 600
tctggaggat ataataattt ttattggcca gataatgaga cgtttacgac aactgtaaat 660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa 720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat 780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctat gagagtgggc 900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata 960
agagcgaata agtcacttgt aaaagagtaa 990
<210>110
<211>329
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>从环境样品中获得
<400>110
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
1 5 10 15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
20 25 30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
35 40 45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
50 55 60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65 70 75 80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
85 90 95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
100 105 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
115 120 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
130 135 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145 150 155 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
165 170 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
180 185 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
195 200 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
210 215 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225 230 235 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
245 250 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
260 265 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
275 280 285
Asn Tyr Met Lys Gln Lys Asn Pro Met Arg Val Gly Trp Val Ile Gln
290 295 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305 310 315 320
Arg Ala Asn Lys Ser Leu Val Lys Glu
325
<210>111
<211>828
<212>DNA
<213>细菌
<400>111
gtgggtgccg gggcgatcct tctcaccggg gcccccaccg cctcggccgt ggacacgcgc 60
gcgtggatgg ggggacacgg ggacggcacg ccgctccagc ggctcaccat ccccggcacc 120
cacgactccg gcgcccggtt cggcgggccc tggtcggagt gccagaacac caccatcgcc 180
cagcagctgg acagcgggat ccggttcctg gacgtccggt gccgggtcac cggcgggtcc 240
ttcgccatcc accacggggc ctcctaccag aacatgatgt tcggcgacgt cctcgtcgcc 300
tgccgcgact tcctcgccgc gcacccctcc gagaccgtcc tcatgcgggt caagcaggag 360
tactcgaccg actccgacgc caccttccgg gccgtcttcg acgactacct cgacgcgcgc 420
ggctggcgct ccctgttccg catcggcgac ggggtcccgc tgctcggcga ggcccgcggc 480
cgggtcgtgc tcatcgccga caacggcgga ctgccgggcg gtctgcgctg gggcgacggc 540
tcggccctcg ccatccagga cgactggaac gcgctgcccg accccaagta cgccaagatc 600
gaggcgcact tccgtaccgc cgtcgcccag ccgggccggc tgtacgtgaa cttcgtcagc 660
acctccgcct acctgccgcc ccgctggaac tccgacaacc tcaacccgcg cgtgcaccgc 720
tacctcgaca gcgcggccgc cgcgggcgcg aagggcctcg ggatcgtccc catggacttc 780
cccaacaccc gctcgggtct ggtcgaggcg ctgctccggc acaactga 828
<210>112
<211>275
<212>PRT
<213>细菌
<220>
<221>信号
<222>(1)...(16)
<220>
<221>结构域
<222>(34)...(168)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
<400>112
Met Gly Ala Gly Ala Ile Leu Leu Thr Gly Ala Pro Thr Ala Ser Ala
1 5 10 15
Val Asp Thr Arg Ala Trp Met Gly Gly His Gly Asp Gly Thr Pro Leu
20 25 30
Gln Arg Leu Thr Ile Pro Gly Thr His Asp Ser Gly Ala Arg Phe Gly
35 40 45
Gly Pro Trp Ser Glu Cys Gln Asn Thr Thr Ile Ala Gln Gln Leu Asp
50 55 60
Ser Gly Ile Arg Phe Leu Asp Val Arg Cys Arg Val Thr Gly Gly Ser
65 70 75 80
Phe Ala Ile His His Gly Ala Ser Tyr Gln Asn Met Met Phe Gly Asp
85 90 95
Val Leu Val Ala Cys Arg Asp Phe Leu Ala Ala His Pro Ser Glu Thr
100 105 110
Val Leu Met Arg Val Lys Gln Glu Tyr Ser Thr Asp Ser Asp Ala Thr
115 120 125
Phe Arg Ala Val Phe Asp Asp Tyr Leu Asp Ala Arg Gly Trp Arg Ser
130 135 140
Leu Phe Arg Ile Gly Asp Gly Val Pro Leu Leu Gly Glu Ala Arg Gly
145 150 155 160
Arg Val Val Leu Ile Ala Asp Asn Gly Gly Leu Pro Gly Gly Leu Arg
165 170 175
Trp Gly Asp Gly Ser Ala Leu Ala Ile Gln Asp Asp Trp Asn Ala Leu
180 185 190
Pro Asp Pro Lys Tyr Ala Lys Ile Glu Ala His Phe Arg Thr Ala Val
195 200 205
Ala Gln Pro Gly Arg Leu Tyr Val Asn Phe Val Ser Thr Ser Ala Tyr
210 215 220
Leu Pro Pro Arg Trp Asn Ser Asp Asn Leu Asn Pro Arg Val His Arg
225 230 235 240
Tyr Leu Asp Ser Ala Ala Ala Ala Gly Ala Lys Gly Leu Gly Ile Val
245 250 255
Pro Met Asp Phe Pro Asn Thr Arg Ser Gly Leu Val Glu Ala Leu Leu
260 265 270
Arg His Asn
275
<210>113
<211>981
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>113
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt 60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac 120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca 180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg 240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga 300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt 480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata 540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa 600
tctggaggat ataataattt ttattggcca gataatgaga cgtttacgac aactgtaaat 660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa 720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat 780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctat gagagtgggc 900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata 960
agagcgaata agtcactgta a 981
<210>114
<211>326
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
<400>114
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
1 5 10 15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
20 25 30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
35 40 45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
50 55 60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65 70 75 80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
85 90 95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
100 105 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
115 120 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
130 135 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145 150 155 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
165 170 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
180 185 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
195 200 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
210 215 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225 230 235 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
245 250 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
260 265 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
275 280 285
Asn Tyr Met Lys Gln Lys Asn Pro Met Arg Val Gly Trp Val Ile Gln
290 295 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305 310 315 320
Arg Ala Asn Lys Ser Leu
325
<210>115
<211>987
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>115
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt 60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatga gcttgaaaat 120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca 180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg 240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga 300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt 480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga agggaatata 540
aagcttggag atgctcgtgg gaaaattata ttactaaaac gatatagtgg tagtaatgaa 600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat 660
caaaatgtaa atgtcacagt acaagataaa tataaagtga gttatgatga gaaagtaaac 720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat 780
attaatttta taagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc 900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata 960
agagcgaata agtcacttgt aaaatag 987
<210>116
<211>328
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
<400>116
Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val
1 5 10 15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
20 25 30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
35 40 45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
50 55 60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65 70 75 80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
85 90 95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
100 105 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
115 120 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
130 135 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145 150 155 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
165 170 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Ile Leu Leu
180 185 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
195 200 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
210 215 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Asn
225 230 235 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
245 250 255
Asn His Leu Tyr Ile Asn Phe Ile Ser Leu Ser Ser Gly Gly Thr Ala
260 265 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
275 280 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
290 295 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305 310 315 320
Arg Ala Asn Lys Ser Leu Val Lys
325
<210>117
<211>987
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>117
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt 60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatga gcttgaaaat 120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca 180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg 240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga 300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt 480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga aggaaatata 540
aagcttggag atgctcgtgg gaaaattgta ttactaaaaa gatatagtgg tagtaatgaa 600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat 660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaaataaac 720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat 780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc 900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata 960
agagcgaata agtcacttgt aaaatag 987
<210>118
<211>328
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
<400>118
Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val
1 5 10 15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
20 25 30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
35 40 45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
50 55 60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65 70 75 80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
85 90 95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
100 105 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
115 120 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
130 135 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145 150 155 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
165 170 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
180 185 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
195 200 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
210 215 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Ile Asn
225 230 235 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
245 250 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
260 265 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
275 280 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
290 295 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305 310 315 320
Arg Ala Asn Lys Ser Leu Val Lys
325
<210>119
<211>987
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>119
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt 60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatgt gcttgaaaat 120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca 180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg 240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga 300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta 360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg 420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt 480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga agggaatata 540
aagcttggag atgctcgtgg gaaaattgta ttactaaaaa gatatagtgg tagtaatgaa 600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat 660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaaataaac 720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat 780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg 840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc 900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata 960
agagcgaata agtcacttgt aaaatag 987
<210>120
<211>328
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
<400>120
Met Asn Asn Lys Lys Phe lle Leu Lys Leu Phe Ile Cys Ser Met Val
1 5 10 15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
20 25 30
Ser Ser Ile Asn Val Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
35 40 45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
50 55 60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp GIy Met
65 70 75 80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
85 90 95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
100 105 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
115 120 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
130 135 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145 150 155 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
165 170 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
180 185 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
195 200 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
210 215 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Ile Asn
225 230 235 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
245 250 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
260 265 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
275 280 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
290 295 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305 310 315 320
Arg Ala Asn Lys Ser Leu Val Lys
325
<210>121
<211>990
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>121
atgcgtaata agaagtttat tttgaaatta ttaatatgta gtacggtact tagcaccttt 60
gtatttgctt tcaatgataa gcaaactgtt gcagctagct ctattaatga actcgaaaat 120
tggtctagat ggatgcagcc tatacctgat gacatgccgt tagcaagaat ttcaattcca 180
ggaacacatg atagtggaac gttcaaactg caaaatccga taaagcaagt atggggaatg 240
acgcaagaat atgattttcg ttaccaaatg gatcatgggg ctagaatttt tgatataaga 300
gggcgtttaa cagatgataa tacgatagtc cttcatcatg ggccattata tctttatgta 360
acactgaacg aatttataaa tgaagcgaaa caatttttaa aagataaccc aagtgaaacg 420
attattatgt ctttaaagaa agagtatgag gatatgaaag gggcagaaaa ttcatttagt 480
agtacgtttg aaaaaaaata ttttcttgat cctatctttt taaaaacaga agggaatata 540
aaacttggag atgctcgtgg gaaaattgta ctactaaaaa gatatagtgg tagtaatgaa 600
tctggaggat ataataattt ttattggcca gataacgaga cgtttacgac aactgtaaat 660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa 720
tctattaaag atacgataaa tgaaacgatt aacaatagtg aagattttaa tcatctatat 780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgca 840
tcctacataa atcctgaaat tgcaaaccat atgaagcaaa agaatcctac gagagtgggc 900
tgggtaattc aagattatat aaatgaaaaa tggtcaccaa tactttatca agaagttata 960
agagcgaata agtcacttat aaaagagtag 990
<210>122
<211>329
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
<400>122
Met Arg Asn Lys Lys Phe Ile Leu Lys Leu Leu Ile Cys Ser Thr Val
1 5 10 15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Thr Val Ala Ala
20 25 30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Gln Pro Ile
35 40 45
Pro Asp Asp Met Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
50 55 60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65 70 75 80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
85 90 95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
100 105 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu Asn Glu Phe Ile Asn Glu
115 120 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
130 135 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asn Ser Phe Ser
145 150 155 160
Ser Thr Phe Glu Lys Lys Tyr Phe Leu Asp Pro Ile Phe Leu Lys Thr
165 170 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
180 185 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
195 200 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
210 215 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225 230 235 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Phe
245 250 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
260 265 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
275 280 285
Asn His Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Val Ile Gln
290 295 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Gln Glu Val Ile
305 310 315 320
Arg Ala Asn Lys Ser Leu Ile Lys Glu
325
<210>123
<211>849
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>123
atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcacc agttcaaagt 60
gtagtgtttg cgcaaacaaa taatagtgaa agtcctgcac cgatcttaag atggtcagct 120
gaggacaagc ataatgaggg agttagtact catttgtgga ttgtaaatcg tgcaattgac 180
atcatgtctc gtaatacagc gattgtgaag ccaaatgaaa ctgctttatt aaatgagtgg 240
cgtactgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat 300
agtacatatg cttctcattt ttacgatccg gatactggaa aaacatatat tccttttgcg 360
aaacaggcaa aagaaacagg tacaaaatat tttaaacttg ctggtgaagc atacaaaaat 420
caagatatga aacaggcatt cttctattta ggattatcac ttcattattt aggagatgta 480
aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct 540
aaatatgaaa attttgttga tacaataaaa aataactata tagtttcaga tagtagtgga 600
tattggaatt ggaaaggggc aaacccagaa gattggattc aaggagcagc agtagcggct 660
aaacaagatt atcctggtat tgtgaacgat acgacaaaag attggtttgt aaaagcagct 720
gtatctcaag catatgcaga taaatggcgt gcagaagtaa caccggtgac aggaaaacgc 780
ttaatggagg cacagcgcgt tacagctggt tatattcatt tatggtttga tacgtatgta 840
aatcactaa 849
<210>124
<211>282
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(24)
<223>从环境样品中获得
<220>
<221>结构域
<222>(1)...(281)
<223>锌依赖型磷脂酶C
<400>124
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
1 5 10 15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
20 25 30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Val
35 40 45
Ser Thr His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
50 55 60
Asn Thr Ala Ile Val Lys Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65 70 75 80
Arg Thr Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
85 90 95
Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
100 105 110
Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Glu Thr Gly Thr
115 120 125
Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Lys Asn Gln Asp Met Lys
130 135 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145 150 155 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met
165 170 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
180 185 190
Tyr Ile Val Ser Asp Ser Ser Gly Tyr Trp Asn Trp Lys Gly Ala Asn
195 200 205
Pro Glu Asp Trp Ile Gln Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
210 215 220
Pro Gly Ile Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225 230 235 240
Val Ser Gln Ala Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
245 250 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
260 265 270
His Leu Trp Phe Asp Thr Tyr Val Asn His
275 280
<210>125
<211>1710
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>125
atggctgaca acgagttgcc cctggcgcgg cccagggaga cgccgccgtg ccgccccggc 60
acgttcgagc ttgggctcgc cctggctggc gcggtctctg gcggcgccta cgccgcggga 120
gtcctggatt tcttctacga agccctcgag cattggtacg aggccaggga ggcgggagcg 180
ccggtgccca accacgacgt gctcctccgg atcatctcgg gtgcgtcggc gggcagtatc 240
aatggcgtgc tttcgggcat cgcgctgccg taccgttttc cccacgtgca cagcgggccc 300
gcgcccgagg gtgccacggg caaccccttc tacgacgcct gggtgaagcg catcgacgtg 360
cgcgaactgt tgggcaacga agacctggcc gatcccacgc agccggtggc atccctgctc 420
gacgccacct gcctggatac gatcgcgaag gacatgctcg gcttctcggc ggcgccggcc 480
acccggccgt acgtcgctaa tccgctgaaa tgcgtgttca cggtgaccaa cctgcgtggc 540
gttccttacg tcgtgcagtt caagggaaac ccggagatcc ccggccacgg catgatggcc 600
cacgccgact ggctgcgctt cgccgtcgac accgggcagg gcgaccggga tggggaatgg 660
atgttccccg atgaacggct cgtcagcggg ccgagccatg cgcggactcc ggcctggcaa 720
ggtttcatgg aggcggcgct cgcttcgtcg gcgttcccgg ccggcttgcg tttccgcgaa 780
gtcgcccggc cctggagcga ttacgaccag cgcgtcgtgg tggtgcccaa ccaggcgggg 840
gccgcggtcc cggtcccgct cccgccggcc tgggcggagg gcgagggcag cgatggggac 900
taccggttcg tcgcggtgga tggtggcgcg atggacaacg agccgttcga acttgcccgt 960
accgagctgg cgggcacgct cggccgcaat ccacgcgaag ggaaccgggt caaccgcatc 1020
gtgatcatgc tcgatccgtt tcccgaggcc gaggcgccgg gacccgcgga agccgcgagc 1080
acgaatctcg tcgaggcgat ggcctcgctg tttggtgcgt ggaaacagca ggcacggttc 1140
aagccggagg aagtggcgct cgccctggat tcgaccgtgt acagccgctt catgatcgcg 1200
cccagccggc cgtgcatgga gggcgggcca cggtggatcg gtgggcgagc gctcgccgcg 1260
ggtgcgctgg gtggcttctc ggggttcctg gcggaggcat acaggcacca cgatttcctc 1320
ctgggacgcc gcaactgcca acgcttcctc gccgagcgcc tgttgatccc cgcggacaat 1380
ccgatcttcg ccggctggat cgacgatccc tccctgcagg gctacatccg cgagatcgat 1440
ggcgtgcgtt acgccccggt catcccgctg gtgggcggct gccagggctt gcgcgagccg 1500
ttgcccacgt ggccgcgtgg tgcattcgac ctggactcgc tcatgccgct ggtcgagcgc 1560
cgcatgcagc gcctgtattc ggcggctacc gcgacgctcg gtggccgctt cgccacctgg 1620
ctggcgtggc gcttctacct gcgccgcaag ctcctcgacc tggtctcaagccgtatccgt 1680
agcgcattga gggacttcgg cctttggtga 1710
<210>126
<211>569
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>126
Met Ala Asp Asn Glu Leu Pro Leu Ala Arg Pro Arg Glu Thr Pro Pro
1 5 10 15
Cys Arg Pro Gly Thr Phe Glu Leu Gly Leu Ala Leu Ala Gly Ala Val
20 25 30
Ser Gly Gly Ala Tyr Ala Ala Gly Val Leu Asp Phe Phe Tyr Glu Ala
35 40 45
Leu Glu His Trp Tyr Glu Ala Arg Glu Ala Gly Ala Pro Val Pro Asn
50 55 60
His Asp Val Leu Leu Arg Ile Ile Ser Gly Ala Ser Ala Gly Ser Ile
65 70 75 80
Asn Gly Val Leu Ser Gly Ile Ala Leu Pro Tyr Arg Phe Pro His Val
85 90 95
His Ser Gly Pro Ala Pro Glu Gly Ala Thr Gly Asn Pro Phe Tyr Asp
100 105 110
Ala Trp Val Lys Arg Ile Asp Val Arg Glu Leu Leu Gly Asn Glu Asp
115 120 125
Leu Ala Asp Pro Thr Gln Pro Val Ala Ser Leu Leu Asp Ala Thr Cys
130 135 140
Leu Asp Thr Ile Ala Lys Asp Met Leu Gly Phe Ser Ala Ala Pro Ala
145 150 155 160
Thr Arg Pro Tyr Val Ala Asn Pro Leu Lys Cys Val Phe Thr Val Thr
165 170 175
Asn Leu Arg Gly Val Pro Tyr Val Val Gln Phe Lys Gly Asn Pro Glu
180 185 190
Ile Pro Gly His Gly Met Met Ala His Ala Asp Trp Leu Arg Phe Ala
195 200 205
Val Asp Thr Gly Gln Gly Asp Arg Asp Gly Glu Trp Met Phe Pro Asp
210 215 220
Glu Arg Leu Va1 Ser Gly Pro Ser His Ala Arg Thr Pro Ala Trp Gln
225 230 235 240
Gly Phe Met Glu Ala Ala Leu Ala Ser Ser Ala Phe Pro Ala Gly Leu
245 250 255
Arg Phe Arg Glu Val Ala Arg Pro Trp Ser Asp Tyr Asp Gln Arg Val
260 265 270
Val Val Val Pro Asn Gln Ala Gly Ala Ala Val Pro Val Pro Leu Pro
275 280 285
Pro Ala Trp Ala Glu Gly Glu Gly Ser Asp Gly Asp Tyr Arg Phe Val
290 295 300
Ala Val Asp Gly Gly Ala Met Asp Asn Glu Pro Phe Glu Leu Ala Arg
305 310 315 320
Thr Glu Leu Ala Gly Thr Leu Gly Arg Asn Pro Arg Glu Gly Asn Arg
325 330 335
Val Asn Arg Ile Val Ile Met Leu Asp Pro Phe Pro Glu Ala Glu Ala
340 345 350
Pro Gly Pro Ala Glu Ala Ala Ser Thr Asn Leu Val Glu Ala Met Ala
355 360 365
Ser Leu Phe Gly Ala Trp Lys Gln Gln Ala Arg Phe Lys Pro Glu Glu
370 375 380
Val Ala Leu Ala Leu Asp Ser Thr Val Tyr Ser Arg Phe Met Ile Ala
385 390 395 400
Pro Ser Arg Pro Cys Met Glu Gly Gly Pro Arg Trp Ile Gly Gly Arg
405 410 415
Ala Leu Ala Ala Gly Ala Leu Gly Gly Phe Ser Gly Phe Leu Ala Glu
420 425 430
Ala Tyr Arg His His Asp Phe Leu Leu Gly Arg Arg Asn Cys Gln Arg
435 440 445
Phe Leu Ala Glu Arg Leu Leu Ile Pro Ala Asp Asn Pro Ile Phe Ala
450 455 460
Gly Trp Ile Asp Asp Pro Ser Leu Gln Gly Tyr Ile Arg Glu Ile Asp
465 470 475 480
Gly Val Arg Tyr Ala Pro Val Ile Pro Leu Val Gly Gly Cys Gln Gly
485 490 495
Leu Arg Glu Pro Leu Pro Thr Trp Pro Arg Gly Ala Phe Asp Leu Asp
500 505 510
Ser Leu Met Pro Leu Val Glu Arg Arg Met Gln Arg Leu Tyr Ser Ala
515 520 525
Ala Thr Ala Thr Leu Gly Gly Arg Phe Ala Thr Trp Leu Ala Trp Arg
530 535 540
Phe Tyr Leu Arg Arg Lys Leu Leu Asp Leu Val Ser Ser Arg Ile Arg
545 550 555 560
Ser Ala Leu Arg Asp Phe Gly Leu Trp
565
<210>127
<211>1038
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>127
atgacaaccc aatttagaaa cttgatcttt gaaggtggtg gtgtaaaagg agttgcttac 60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga 120
ggttgcagtg ccggtgcgat taacgcgctg atttttgcgc tgggttacac ggttcgtgag 180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt 240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtgg cttctttaat 300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaggat 360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420
gcagaggttt tttctgccga aagacacccc gatatggagc tagcgacagc ggtgcgcatc 480
tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgatcgaca agatgtgtat 540
gtcgatggag gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt 600
gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaataa agaaaacgct 660
cgctttcagc ttgaacggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720
ttgcgactgg atagtcgaga ggagataggg ctttttcgtt atgacgaacc cctcaagggc 780
aaaccgatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgcg 840
caggaaaaca ttcatctaca tggcgatgat tggcagcgca cggtctatat cgacacactg 900
gatgtgagta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa 960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg 1020
aatagagtgg agtcatag 1038
<210>128
<211>345
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(8)...(195)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
<400>128
Met Thr Thr Gln Phe Arg Ash Leu Ile Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
20 25 30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
50 55 60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65 70 75 80
Ile Arg Asp I1e Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
85 90 95
Gly Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
100 105 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
165 170 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
180 185 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
195 200 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
210 215 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
260 265 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly
275 280 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Ser Thr
290 295 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305 310 315 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
325 330 335
Glu Lys Pro Val Asn Arg Val Glu Ser
340 345
<210>129
<211>1434
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>129
atgaaaaaga aaatatgtac attggctctt gtatcagcaa taacttctgg agttgtgacg 60
attccaacgg tagcatctgc ttgcagaata ggcgaagaag taatgaaaca ggagaaacag 120
gataatcaag agcacaaacg tgtgaaaaga tggtctgcgg agcatccgca tcattctaat 180
gaaagcacgc acttatggat tgctcgaaat gcgattcaaa ttatgagtcg taatcaagat 240
aacacggtcc aaaacaatga attacagttc ttaaatattc ctgaatataa ggagttattt 300
gaaagaggac tttatgatgc tgattacctt gatgaattta acgatggcgg tacaggtaca 360
atcggcattg atgggctaat taaaggaggg tggaaatctc atttttatga tccagatacg 420
aaaaagaatt ataaaggaga agaagctcca acagccctta cgcaaggaga taaatatttt 480
aaattagcag gagactattt taagaaagag gatttgaaac aagctttcta ctatttaggt 540
gttgcgactc actatttcac agatgctact cagccaatgc atgctgctaa ttttacagct 600
gtcgacatga gtgcgataaa gtttcatagc gcttttgaaa attatgtaac gacaattcag 660
acgccatttg aagtgaagga tgataaagga acctataatt tggttgattc taatgatccg 720
aagcagtgga tacatgaaac agcgaaactc gcaaaagcgg aaattatgaa tattactaat 780
gatactatta aatctcaata taataaaggg aacaatgatc tttggcaaca aggagttatg 840
ccagctgttc agagaagtct ggaaacagca caaaggaaca cggcaggatt tattcattta 900
tggtttaaaa catatgttgg caaaactgct gctgaagata ttgaaaatac acaagtaaaa 960
gattctaacg gagaagcaat acaagaaaat aaaaaatact acgttgtacc gagtgagttt 1020
ttaaatagag gtttgacctt tgaggtatat gctgcaaatg actacgcact attagctaat 1080
cacgtagatg ataataaagt tcatggtaca cctgttcagt ttgtttttga taaagacaat 1140
aacggaattc ttcatcgggg agaaagtgca ctgatgaaaa tgacgcaatc taactatgct 1200
gattatgtat ttctcaatta ctctaatatg acaaattggg tacatcttgc gaaacgaaaa 1260
acaaatactt cacagtttaa agtgtatcca aatccggata actcatctga atatttctta 1320
tatacagatg gatacccggt aaattatcaa gaaaatggta acggaaagag ctggattgtg 1380
ttaggaaaga aaacggataa accaaaagcg tggaaattta tacaggcgga ataa 1434
<210>130
<211>477
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>信号
<222>(1)...(27)
<220>
<221>结构域
<222>(1)...(307)
<223>锌依赖型磷脂酶C
<400>130
Met Lys Lys Lys Ile Cys Thr Leu Ala Leu Val Ser Ala Ile Thr Ser
1 5 10 15
Gly Val Val Thr Ile Pro Thr Val Ala Ser Ala Cys Arg Ile Gly Glu
20 25 30
Glu Val Met Lys Gln Glu Lys Gln Asp Asn Gln Glu His Lys Arg Val
35 40 45
Lys Arg Trp Ser Ala Glu His Pro His His Ser Asn Glu Ser Thr His
50 55 60
Leu Trp Ile Ala Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp
65 70 75 80
Asn Thr Val Gln Asn Asn Glu Leu Gln Phe Leu Asn Ile Pro Glu Tyr
85 90 95
Lys Glu Leu Phe Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu
100 105 110
Phe Asn Asp Gly Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys
115 120 125
Gly Gly Trp Lys Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr
130 135 140
Lys Gly Glu Glu Ala Pro Thr Ala Leu Thr Gln Gly Asp Lys Tyr Phe
145 150 155 160
Lys Leu Ala Gly Asp Tyr Phe Lys Lys Glu Asp Leu Lys Gln Ala Phe
165 170 175
Tyr Tyr Leu Gly Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro
180 185 190
Met His Ala Ala Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe
195 200 205
His Ser Ala Phe Glu Asn Tyr Val Thr Thr Ile Gln Thr Pro Phe Glu
210 215 220
Val Lys Asp Asp Lys Gly Thr Tyr Asn Leu Val Asp Ser Asn Asp Pro
225 230 235 240
Lys Gln Trp Ile His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met
245 250 255
Asn Ile Thr Asn Asp Thr Ile Lys Ser Gln Tyr Asn Lys Gly Asn Asn
260 265 270
Asp Leu Trp Gln Gln Gly Val Met Pro Ala Val Gln Arg Ser Leu Glu
275 280 285
Thr Ala Gln Arg Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr
290 295 300
Tyr Val Gly Lys Thr Ala Ala Glu Asp Ile Glu Asn Thr Gln Val Lys
305 310 315 320
Asp Ser Asn Gly Glu Ala Ile Gln Glu Asn Lys Lys Tyr Tyr Val Val
325 330 335
Pro Ser Glu Phe Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ala
340 345 350
Asn Asp Tyr Ala Leu Leu Ala Asn His Val Asp Asp Asn Lys Val His
355 360 365
Gly Thr Pro Val Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu
370 375 380
His Arg Gly Glu Ser Ala Leu Met Lys Met Thr Gln Ser Asn Tyr Ala
385 390 395 400
Asp Tyr Val Phe Leu Asn Tyr Ser Asn Met Thr Asn Trp Val His Leu
405 410 415
Ala Lys Arg Lys Thr Asn Thr Ser Gln Phe Lys Val Tyr Pro Asn Pro
420 425 430
Asp Asn Ser Ser Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn
435 440 445
Tyr Gln Glu Asn Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys
450 455 460
Thr Asp Lys Pro Lys Ala Trp Lys Phe Ile Gln Ala Glu
465 470 475
<210>131
<211>927
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>131
atgccgagcc caaaaagtaa tattgatgtt atcagcatcg atggtggtgg aatacgtgga 60
gtattctccg ttacattatt ggatagatta tgtaagacct atcccaatct tcttaagaaa 120
acatatctgt ttgctggaac atctacaggt gggatcattg ccttaggatt agcaaacaac 180
atgacacctc ttgagataag agccttgtac gagaagaacg gttcaaagat atttcataaa 240
tctgtgtggg aaggcgttaa agatttaggt ggaaccatag gtgcaaagta tagtaacaag 300
aatcttaaat ccgttttgaa aaaatacttt ggttcattga agttaaaaga tttatctaaa 360
aaagtactaa tacctacttt tgatttacac tcagacaaag aagaaggcta tccaatgtgg 420
aagcctaagt tctatcacaa ctttgatgga gaaacggaag atatagaaaa gctcgttctt 480
gatgtagcta tgatgacatc agcagcgccc actttcttcc ctacatacaa cgggcatatt 540
gatggcggtg ttgtagccaa caatccatcg atggccgcat tagcccagat tatggatgaa 600
agatatggca tcaatgcctc tgaagttcat attcttaata taggaacagg ttttaaccct 660
gcttatgtta agatgaatcc aggggaagag aaagactggg gtgaacttca gtggataaaa 720
cctttaatca atcttctagt cgatggctct atggatgttt ctacttatta ttgtaagcaa 780
gtcttacgtg ataattttta tagggttaac atgaaattac ctaagaacgt agaaatggat 840
gatcctaatt ctattcctta tttaattgaa cttgcaaact cagttgatct aactgaatgt 900
atcaactggc ttaattcgag gtggtaa 927
<210>132
<211>308
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(11)...(194)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
<400>132
Met Pro Ser Pro Lys Ser Asn Ile Asp Val Ile Ser Ile Asp Gly Gly
1 5 10 15
Gly Ile Arg Gly Val Phe Ser Val Thr Leu Leu Asp Arg Leu Cys Lys
20 25 30
Thr Tyr Pro Asn Leu Leu Lys Lys Thr Tyr Leu Phe Ala Gly Thr Ser
35 40 45
Thr Gly Gly Ile Ile Ala Leu Gly Leu Ala Asn Asn Met Thr Pro Leu
50 55 60
Glu Ile Arg Ala Leu Tyr Glu Lys Asn Gly Ser Lys Ile Phe His Lys
65 70 75 80
Ser Val Trp Glu Gly Val Lys Asp Leu Gly Gly Thr Ile Gly Ala Lys
85 90 95
Tyr Ser Asn Lys Asn Leu Lys Ser Val Leu Lys Lys Tyr Phe Gly Ser
100 105 110
Leu Lys Leu Lys Asp Leu Ser Lys Lys Val Leu Ile Pro Thr Phe Asp
115 120 125
Leu His Ser Asp Lys Glu Glu Gly Tyr Pro Met Trp Lys Pro Lys Phe
130 135 140
Tyr His Asn Phe Asp Gly Glu Thr Glu Asp Ile Glu Lys Leu Val Leu
145 150 155 160
Asp Val Ala Met Met Thr Ser Ala Ala Pro Thr Phe Phe Pro Thr Tyr
165 170 175
Asn Gly His Ile Asp Gly Gly Val Val Ala Asn Asn Pro Ser Met Ala
180 185 190
Ala Leu Ala Gln Ile Met Asp Glu Arg Tyr Gly Ile Asn Ala Ser Glu
195 200 205
Val His Ile Leu Asn Ile Gly Thr Gly Phe Asn Pro Ala Tyr Val Lys
210 215 220
Met Asn Pro Gly Glu Glu Lys Asp Trp Gly Glu Leu Gln Trp Ile Lys
225 230 235 240
Pro Leu IIe Asn Leu Leu Val Asp Gly Ser Met Asp Val Ser Thr Tyr
245 250 255
Tyr Cys Lys Gln Val Leu Arg Asp Asn Phe Tyr Arg Val Asn Met Lys
260 265 270
Leu Pro Lys Asn Val Glu Met Asp Asp Pro Asn Ser Ile Pro Tyr Leu
275 280 285
Ile Glu Leu Ala Asn Ser Val Asp Leu Thr Glu Cys Ile Asn Trp Leu
290 295 300
Asn Ser Arg Trp
305
<210>133
<211>1053
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>133
atgactacac agtttcgcaa tctcgttttc gaaggaggcg gcgtcagggg tatagcctat 60
gtgggggcaa tgcaggttct tgagcaacgg ggaatgctca ggaacataga ccgtgcaggc 120
ggcacgagcg ccggtgcgat taacgcactc atcttttcac tcggctatga cataaggtct 180
cagctcgaaa tactccattc taccgacttt agaaatttta tggatagttc cttcgggata 240
atcagggata tccgccgtct tgcacgggat ttcggatggt acaagggtga tttcttcaca 300
ggctggattg gcaagcttat aaaagacagg ctcggtagcg agaaagcaac tttccgtgac 360
cttgcagaat cagattgtcc cgatctgtat gtgatcggca ccaacctctc aaccggcttc 420
gccgaggtat tctcagccga gagacatccc gatatgcctc ttgcaacggc tgtccgtatc 480
agcatgtcga tccctctatt ttttgctgca atgcgttatg gtccgaggga agacgtattt 540
gtagacggtg gggtagtact caactatcct gtaaagctgt ttgacaggtt gaaatacatt 600
gaaagcgggg agacggagga agccgcacgc tataccgaat attataacag ggagaacgca 660
cggttccttc tcaaaagtcc cgaccgcagt ccctatgttt ataaccgtca gacactgggt 720
ttgcgtctcg atacgcgtga ggagattgca catttccgtt atgacgagcc cctggagggt 780
aaaaaaatca tacgctttac ggattatgca cgggcactcg tttcaacctt gcttcaggtt 840
caggaaaacc agcatctgca cagtgacgac tggcagcgta cagtttacat tgacacactg 900
gatgtgaaga cgactgattt tgatatcacg gataagcaga aggacatcct gataaagcag 960
ggaattaacg gagcggagaa ctatttgggt tggtttgaag acccgtatga aaaacccgcc 1020
aaccgcctgc ccggtggcag caagtctgac tga 1053
<210>134
<211>350
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(8)...(195)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
<400>134
Met Thr Thr Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Arg
1 5 10 15
Gly Ile Ala Tyr Val Gly Ala Met Gln Val Leu Glu Gln Arg Gly Met
20 25 30
Leu Arg Asn Ile Asp Arg Ala Gly Gly Thr Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ser Leu Gly Tyr Asp Ile Arg Ser Gln Leu Glu Ile
50 55 60
Leu His Ser Thr Asp Phe Arg Asn Phe Met Asp Ser Ser Phe Gly Ile
65 70 75 80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Tyr Lys Gly
85 90 95
Asp Phe Phe Thr Gly Trp Ile Gly Lys Leu Ile Lys Asp Arg Leu Gly
100 105 110
Ser Glu Lys Ala Thr Phe Arg Asp Leu Ala Glu Ser Asp Cys Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Pro Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Met Arg Tyr Gly Pro Arg
165 170 175
Glu Asp Val Phe Val Asp Gly Gly Val Val Leu Asn Tyr Pro Val Lys
180 185 190
Leu Phe Asp Arg Leu Lys Tyr Ile Glu Ser Gly Glu Thr Glu Glu Ala
195 200 205
Ala Arg Tyr Thr Glu Tyr Tyr Asn Arg Glu Asn Ala Arg Phe Leu Leu
210 215 220
Lys Ser Pro Asp Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Thr Arg Glu Glu Ile Ala His Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Glu Gly Lys Lys Ile Ile Arg Phe Thr Asp Tyr Ala Arg Ala
260 265 270
Leu Val Ser Thr Leu Leu Gln Val Gln Glu Asn Gln His Leu His Ser
275 280 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Lys Thr
290 295 300
Thr Asp Phe Asp Ile Thr Asp Lys Gln Lys Asp Ile Leu Ile Lys Gln
305 310 315 320
Gly Ile Asn Gly Ala Glu Asn Tyr Leu Gly Trp Phe Glu Asp Pro Tyr
325 330 335
Glu Lys Pro Ala Asn Arg Leu Pro Gly Gly Ser Lys Ser Asp
340 345 350
<210>135
<211>1710
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>135
atggctgaca acgagttacc cctggcccgc cccagggaaa cccctccgtg ccgtcccggc 60
acgttcgagc tggggctggc gctcgccggc gcggtatcgg gcggcgccta cgccgcgggc 120
gtgctggatt tcttctacga ggcgctggag cactggtacg acgcgaaggc gaacggtgcg 180
cccgtgccga gccacgacgt gctgctacgg atcatttcag gcgcctccgc gggcagcatc 240
aacggcgtgc tttccggcat cgcgttgccg taccgcttcc cgcacgtgca cagcggaccc 300
gcgccccggc aggcgacggg aaaccccttc tacgacgcgt gggtgaggcg catcgatgta 360
cgcgagctgc tgggcgaggc cgacctggct aacccggcgc ggccgatcac ctcgctgctt 420
gattccagca gcctggatac gatcgcgaag gacatgctcg gctacgccgg cgtgccggcc 480
gcgcgccctt acatcgcgaa cccgctgaaa tgcgtgttca ccgtgacgaa tcttcgcggc 540
gtgccctacg tggtgcagtt caagggcaac cccgagattc ccggccacgg catgatggcg 600
cacgccgatt ggctgcgctt cgccatcgac tcggggcagg gcgaacgcga tggcgcatgg 660
atgttccccg acgagcgcat cgtcagcggc ccgagccatg cgcgcagccc ggcctggcat 720
gcgctcatgg aggcggccct ggcgtcgtcc gcgttcccgg ccggcctgcg cttccgcgag 780
gtggcccggc cgtggagcga ttacgaccag cgcgtggttg tcgtgcccgg tcaggatggc 840
atggcggtgc cggtaccgct gccaccagcg tggggcgaag gggagggtgg gaagggcgac 900
taccgctttg tcgccgtgga tggtggcgcc atggataacg aaccgttcga gctggcccgc 960
acggagcttg cgggcacgat gggccgcaac ccgcgtgaag gtacccgggt gaatcgtatc 1020
gtgattatgc tcgatccgtt tccggaggcc gaggcgcccg gcccctcgga ggcggcgtcg 1080
acgaacctgg tggaagcgat ggcgtcgctg ttcggtgcat ggaagcagca ggcgcggttc 1140
aagcccgagg aagtggcgct ggccctcgat agcacggtgt acagccgctt catgatcgcg 1200
cctagccgcc cctgcacgga tggcggcccg cggtggatcg gcggccgcgc gctcaccgcg 1260
ggcgcactgg gtggcttctc ggggttcctg gccgaggatt accgccacca cgatttcctc 1320
ctgggccggc gtaactgcca gcggtttctc gccgagcggc tgctcgttcc cgcaacgaac 1380
ccgatcttcg ctggatggat cgacgatccc gcactgcagg gctacgtgcg tgagatcgat 1440
ggtgagcgct ttgcccccgt gattccccta gtgggcggct gccaggccct gcaagagccc 1500
ttgccggcgt ggccgcgtgg ggcgttcgac atggatgcgc tcatgcccct ggtcgagaag 1560
cgcatgcagg ccctgtacac ggcggccacc acgaagctgg gtggccgctt cgccatgtgg 1620
ctcgcgtggc gcttcttcat ccgccgcaaa ctcctcgaca tcgtctcaag ccgtatccgc 1680
aatgcgctga aagacttcgg cctttggtga 1710
<210>136
<211>569
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>136
Met Ala Asp Asn Glu Leu Pro Leu Ala Arg Pro Arg Glu Thr Pro Pro
1 5 10 15
Cys Arg Pro Gly Thr Phe Glu Leu Gly Leu Ala Leu Ala Gly Ala Val
20 25 30
Ser Gly Gly Ala Tyr Ala Ala Gly Val Leu Asp Phe Phe Tyr Glu Ala
35 40 45
Leu Glu His Trp Tyr Asp Ala Lys Ala Asn Gly Ala Pro Val Pro Ser
50 55 60
His Asp Val Leu Leu Arg Ile Ile Ser Gly Ala Ser Ala Gly Ser Ile
65 70 75 80
Asn Gly Val Leu Ser Gly Ile Ala Leu Pro Tyr Arg Phe Pro His Val
85 90 95
His Ser Gly Pro Ala Pro Arg Gln Ala Thr Gly Asn Pro Phe Tyr Asp
100 105 110
Ala Trp Val Arg Arg Ile Asp Val Arg Glu Leu Leu Gly Glu Ala Asp
115 120 125
Leu Ala Asn Pro Ala Arg Pro Ile Thr Ser Leu Leu Asp Ser Ser Ser
130 135 140
Leu Asp Thr Ile Ala Lys Asp Met Leu Gly Tyr Ala Gly Val Pro Ala
145 150 155 160
Ala Arg Pro Tyr Ile Ala Asn Pro Leu Lys Cys Val Phe Thr Val Thr
165 170 175
Asn Leu Arg Gly Val Pro Tyr Val Val Gln Phe Lys Gly Asn Pro Glu
180 185 190
Ile Pro Gly His Gly Met Met Ala His Ala Asp Trp Leu Arg Phe Ala
195 200 205
Ile Asp Ser Gly Gln Gly Glu Arg Asp Gly Ala Trp Met Phe Pro Asp
210 215 220
Glu Arg Ile Val Ser Gly Pro Ser His Ala Arg Ser Pro Ala Trp His
225 230 235 240
Ala Leu Met Glu Ala Ala Leu Ala Ser Ser Ala Phe Pro Ala Gly Leu
245 250 255
Arg Phe Arg Glu Val Ala Arg Pro Trp Ser Asp Tyr Asp Gln Arg Val
260 265 270
Val Val Val Pro Gly Gln Asp Gly Met Ala Val Pro Val Pro Leu Pro
275 280 285
Pro Ala Trp Gly Glu Gly Glu Gly Gly Lys Gly Asp Tyr Arg Phe Val
290 295 300
Ala Val Asp Gly Gly Ala Met Asp Asn Glu Pro Phe Glu Leu Ala Arg
305 310 315 320
Thr Glu Leu Ala Gly Thr Met Gly Arg Asn Pro Arg Glu Gly Thr Arg
325 330 335
Val Asn Arg Ile Val Ile Met Leu Asp Pro Phe Pro Glu Ala Glu Ala
340 345 350
Pro Gly Pro Ser Glu Ala Ala Ser Thr Asn Leu Val Glu Ala Met Ala
355 360 365
Ser Leu Phe Gly Ala Trp Lys Gln Gln Ala Arg Phe Lys Pro Glu Glu
370 375 380
Val Ala Leu Ala Leu Asp Ser Thr Val Tyr Ser Arg Phe Met Ile Ala
385 390 395 400
Pro Ser Arg Pro Cys Thr Asp Gly Gly Pro Arg Trp Ile Gly Gly Arg
405 410 415
Ala Leu Thr Ala Gly Ala Leu Gly Gly Phe Ser Gly Phe Leu Ala Glu
420 425 430
Asp Tyr Arg His His Asp Phe Leu Leu Gly Arg Arg Asn Cys Gln Arg
435 440 445
Phe Leu Ala Glu Arg Leu Leu Val Pro Ala Thr Asn Pro Ile Phe Ala
450 455 460
Gly Trp Ile Asp Asp Pro Ala Leu Gln Gly Tyr Val Arg Glu Ile Asp
465 470 475 480
Gly Glu Arg Phe Ala Pro Val Ile Pro Leu Val Gly Gly Cys Gln Ala
485 490 495
Leu Gln Glu Pro Leu Pro Ala Trp Pro Arg Gly Ala Phe Asp Met Asp
500 505 510
Ala Leu Met Pro Leu Val Glu Lys Arg Met Gln Ala Leu Tyr Thr Ala
515 520 525
Ala Thr Thr Lys Leu Gly Gly Arg Phe Ala Met Trp Leu Ala Trp Arg
530 535 540
Phe Phe Ile Arg Arg Lys Leu Leu Asp Ile Val Ser Ser Arg Ile Arg
545 550 555 560
Asn Ala Leu Lys Asp Phe Gly Leu Trp
565
<210>137
<211>1038
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>137
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac 60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga 120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa 180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt 240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt 300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat 360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt 420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc 480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat 540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt 600
gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct 660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt 720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc 780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca 840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg 900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa 960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg 1020
aatagagtgg agtcatag 1038
<210>138
<211>345
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(8)...(195)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
<400>138
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
1 5 10 15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
20 25 30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
35 40 45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
50 55 60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65 70 75 80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
85 90 95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
100 105 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
115 120 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
130 135 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145 150 155 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
165 170 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
180 185 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
195 200 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
210 215 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225 230 235 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
245 250 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
260 265 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
275 280 285
Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr
290 295 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305 310 315 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
325 330 335
Glu Lys Pro Val Asn Arg Val Glu Ser
340 345
<210>139
<211>1692
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>139
atgaaaataa agccgctcac gttttctttt ggattagcag tcactagctc ggtgcaagcc 60
ttcactcaat ttggcggaca aggcgttatg ccgatgggtc acgaatggtt aacgcgcacc 120
gctgctctcg aggtacttaa tgcagagcat atcatcgaag cggatccgaa tgacccaaga 180
tatacttggc aggacggact tgctaaaaac cttgaactta ataccgccca atctgaaatc 240
acgcgcttac aatctcattt aaataataac ccgctctatg agccgagata cgacggtata 300
aactcagcca tcgttggtga acgctgggtc gatattgcag ggtttaacgt cacaacagcc 360
agcgcagacc cgactggccc taattgcttt agcgcagttt cacaagagcc cgcagatatt 420
cagcaagacc actttatgcg ccgctatgat gatattggag gtcaaggtgg agttgatgct 480
gcttatcgcg cacagcaacg atttgtgcaa cactttgtgg atgcggccat ggccgaaaaa 540
aaacgactaa aagtatggga cggtggtggc cattctgcgt tagcagaggt agatcataat 600
tactttttat ttggtcgtgc ggttcaccta tttcaagact catttagtcc agaacacacg 660
gtacggctcc ctcaagataa ctacgaaaaa gtttggcagg ttaaggcata tctttgctca 720
gagggggctg agcaacattc acacgatacc aaagacgtgc tcaactttgc cagtggcgat 780
gttatttggc aacctcaaac ccgactagaa gcaggctggc aatcttacca gatcagcagt 840
atgaagcccg ttgctattgt ggcccttgaa gccagtaaag atctttgggc tgcgtttatt 900
cgcaccatgg cgaccccaaa agcacagaga cgtaacgtgg caacgcaaga agcccaacaa 960
cttgtacaaa actggttgtc ttttgatgag gcccagatgc tgacttggta tcaagatgag 1020
aataagcgtg accatactta tgtgcttgcc cccaatgaaa cgggaaaagg aaaatctctg 1080
gaagcctgta tgacagagct aaaggtaggc actagcagtc aagcagaacg ggttgcgcaa 1140
ctggaagccg agcgtaatca atgcctatac aacattgagg cggaacctgg ctttgcagac 1200
ttaaacgatc cacacctcga tattccatat aactggcgct ggaagtctct gacttggcaa 1260
acgcctccta gtggctggac atacccacaa ctaaatgcag ataccggcga gcaagtcgcc 1320
attaaatcgc cgataaataa tcagtattta tctgcacaaa ctctaagtaa cgacaccccg 1380
atcactctga gtcaagcaca tccaatttcc ttgatccaag tgacgaatgc acagggccag 1440
cactatttta ggagcgctca agccccttca ctatttctgg gttatagcaa caaaattgca 1500
ggctacctca agcttgtaga ttcacccaag caagccctat atacgttgat ttatcaaggt 1560
ggtctttgga atatccaaaa tgaattttgg caacagtata tctggttaaa tcaagacaaa 1620
gagcggccgg aattaaatcg ccatggtgag cctagccaat taaacgctca gtggatggtc 1680
gaacacttat aa 1692
<210>140
<211>563
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(20)
<223>从环境样品中获得
<400>140
Met Lys Ile Lys Pro Leu Thr Phe Ser Phe Gly Leu Ala Val Thr Ser
1 5 10 15
Ser Val Gln Ala Phe Thr Gln Phe Gly Gly Gln Gly Val Met Pro Met
20 25 30
Gly His Glu Trp Leu Thr Arg Thr Ala Ala Leu Glu Val Leu Asn Ala
35 40 45
Glu His Ile Ile Glu Ala Asp Pro Asn Asp Pro Arg Tyr Thr Trp Gln
50 55 60
Asp Gly Leu Ala Lys Asn Leu Glu Leu Asn Thr Ala Gln Ser Glu Ile
65 70 75 80
Thr Arg Leu Gln Ser His Leu Asn Asn Asn Pro Leu Tyr Glu Pro Arg
85 90 95
Tyr Asp Gly Ile Asn Ser Ala Ile Val Gly Glu Arg Trp Val Asp Ile
100 105 110
Ala Gly Phe Asn Val Thr Thr Ala Ser Ala Asp Pro Thr Gly Pro Asn
115 120 125
Cys Phe Ser Ala Val Ser Gln Glu Pro Ala Asp Ile Gln Gln Asp His
130 135 140
Phe Met Arg Arg Tyr Asp Asp Ile Gly Gly Gln Gly Gly Val Asp Ala
145 150 155 160
Ala Tyr Arg Ala Gln Gln Arg Phe Val Gln His Phe Val Asp Ala Ala
165 170 175
Met Ala Glu Lys Lys Arg Leu Lys Val Trp Asp Gly Gly Gly His Ser
180 185 190
Ala Leu Ala Glu Val Asp His Asn Tyr Phe Leu Phe Gly Arg Ala Val
195 200 205
His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu Pro
210 215 220
Gln Asp Asn Tyr Glu Lys Val Trp Gln Val Lys Ala Tyr Leu Cys Ser
225 230 235 240
Glu Gly Ala Glu Gln His Ser His Asp Thr Lys Asp Val Leu Asn Phe
245 250 255
Ala Ser Gly Asp Val Ile Trp Gln Pro Gln Thr Arg Leu Glu Ala Gly
260 265 270
Trp Gln Ser Tyr Gln Ile Ser Ser Met Lys Pro Val Ala Ile Val Ala
275 280 285
Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met Ala
290 295 300
Thr Pro Lys Ala Gln Arg Arg Asn Val Ala Thr Gln Glu Ala Gln Gln
305 310 315 320
Leu Val Gln Asn Trp Leu Ser Phe Asp Glu Ala Gln Met Leu Thr Trp
325 330 335
Tyr Gln Asp Glu Asn Lys Arg Asp His Thr Tyr Val Leu Ala Pro Asn
340 345 350
Glu Thr Gly Lys Gly Lys Ser Leu Glu Ala Cys Met Thr Glu Leu Lys
355 360 365
Val Gly Thr Ser Ser Gln Ala Glu Arg Val Ala Gln Leu Glu Ala Glu
370 375 380
Arg Asn Gln Cys Leu Tyr Asn Ile Glu Ala Glu Pro Gly Phe Ala Asp
385 390 395 400
Leu Asn Asp Pro His Leu Asp Ile Pro Tyr Asn Trp Arg Trp Lys Ser
405 410 415
Leu Thr Trp Gln Thr Pro Pro Ser Gly Trp Thr Tyr Pro Gln Leu Asn
420 425 430
Ala Asp Thr Gly Glu Gln Val Ala Ile Lys Ser Pro Ile Asn Asn Gln
435 440 445
Tyr Leu Ser Ala Gln Thr Leu Ser Asn Asp Thr Pro Ile Thr Leu Ser
450 455 460
Gln Ala His Pro Ile Ser Leu Ile Gln Val Thr Asn Ala Gln Gly Gln
465 470 475 480
His Tyr Phe Arg Ser Ala Gln Ala Pro Ser Leu Phe Leu Gly Tyr Ser
485 490 495
Asn Lys Ile Ala Gly Tyr Leu Lys Leu Val Asp Ser Pro Lys Gln Ala
500 505 510
Leu Tyr Thr Leu Ile Tyr Gln Gly Gly Leu Trp Asn Ile Gln Asn Glu
515 520 525
Phe Trp Gln Gln Tyr Ile Trp Leu Asn Gln Asp Lys Glu Arg Pro Glu
530 535 540
Leu Asn Arg His Gly Glu Pro Ser Gln Leu Asn Ala Gln Trp Met Val
545 550 555 560
Glu His Leu
<210>141
<211>471
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>141
atgcaaaaaa aaaccagtac atgtgaagac gagggeccgt accgggcagt cttgtttgat 60
ttggacggca ccctgttgga tacggagcgg attggggcgg cctcctggga ccatgcggga 120
gacgaattgg gtctgcgggt gccggaggcg gtaaagcggc agatggtggg tcggacgctg 180
ccggatattc atgcaattgt acgggaaggc atgccggacg tggacgcgga tcgtctgctg 240
gagcgggcca atcatcatta tcaccgtttg gtgaccgaag tgccaccgcc ggtgaaggcc 300
ggggcgcggg aactgctgga atggctgaag ggtgctgggg tgcccatggc ggtggcgact 360
tccagccgcc gggttcaggc cgaagacaaa ttaagccgta ccggcctgcg gcattttttt 420
gatgtgattg tggccggcga tgaaatcgcg cggggcaagc cggatccaaa g 471
<210>142
<211>157
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(14)...(157)
<223>haloacid dehalogenase-like hydrolase
<400>142
Met Gln Lys Lys Thr Ser Thr Cys Glu Asp Glu Gly Pro Tyr Arg Ala
1 5 10 15
Val Leu Phe Asp Leu Asp Gly Thr Leu Leu Asp Thr Glu Arg Ile Gly
20 25 30
Ala Ala Ser Trp Asp His Ala Gly Asp Glu Leu Gly Leu Arg Val Pro
35 40 45
Glu Ala Val Lys Arg Gln Met Val Gly Arg Thr Leu Pro Asp Ile His
50 55 60
Ala Ile Val Arg Glu Gly Met Pro Asp Val Asp Ala Asp Arg Leu Leu
65 70 75 80
Glu Arg Ala Asn His His Tyr His Arg Leu Val Thr Glu Val Pro Pro
85 90 95
Pro Val Lys Ala Gly Ala Arg Glu Leu Leu Glu Trp Leu Lys Gly Ala
100 105 110
Gly Val Pro Met Ala Val Ala Thr Ser Ser Arg Arg Val Gln Ala Glu
115 120 125
Asp Lys Leu Ser Arg Thr Gly Leu Arg His Phe Phe Asp Val Ile Val
130 135 140
Ala Gly Asp Glu Ile Ala Arg Gly Lys Pro Asp Pro Lys
145 150 155
<210>143
<211>603
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>143
atgaataaca agagcttcat cacaatccat ggcattcgta agtttggctc ttctcccact 60
cacatgcgcc ctataaacga atcactcctc tctagtaatc tgaggacaat cccagtcaat 120
tatggctaca ccctgctccc aatcacgaac agaaagagtg tttctagggc aattcctgtg 180
ctagaaaacg agctaaagcg agggagggac atcaccctta tcgggtattc taacggcgct 240
tggacagctc tacagcttgc ggaaatggct tatccaatcc aacgtctagt gctcatctct 300
cctgctcttc actctgctca cgccttccct caaatccctt ctcttgagcg tgtagacgtg 360
ttctattgcc ctacagataa tgttggtgat cttgccaaga cttggagggg agttactaga 420
atcatgcctt ggagatggtt ctctccacac ccttacggaa gaatgatgaa aactggattt 480
attggagagg atgaacgtgt ctttaaccac aggcttggcg atcatgtagg ccatgctttc 540
tacaaccatg ctgatgctgt ttcacacatt atagaggtga ttaaatatga aactccttat 600
tag 603
<210>144
<211>200
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>144
Met Asn Asn Lys Ser Phe Ile Thr Ile His Gly Ile Arg Lys Phe Gly
1 5 10 15
Ser Ser Pro Thr His Met Arg Pro Ile Asn Glu Ser Leu Leu Ser Ser
20 25 30
Asn Leu Arg Thr Ile Pro Val Asn Tyr Gly Tyr Thr Leu Leu Pro Ile
35 40 45
Thr Asn Arg Lys Ser Val Ser Arg Ala Ile Pro Val Leu Glu Asn Glu
50 55 60
Leu Lys Arg Gly Arg Asp Ile Thr Leu Ile Gly Tyr Ser Asn Gly Ala
65 70 75 80
Trp Thr Ala Leu Gln Leu Ala Glu Met Ala Tyr Pro Ile Gln Arg Leu
85 90 95
Val Leu Ile Ser Pro Ala Leu His Ser Ala His Ala Phe Pro Gln Ile
100 105 110
Pro Ser Leu Glu Arg Val Asp Val Phe Tyr Cys Pro Thr Asp Asn Val
115 120 125
Gly Asp Leu Ala Lys Thr Trp Arg Gly Val Thr Arg Ile Met Pro Trp
130 135 140
Arg Trp Phe Ser Pro His Pro Tyr Gly Arg Met Met Lys Thr Gly Phe
145 150 155 160
Ile Gly Glu Asp Glu Arg Val Phe Asn His Arg Leu Gly Asp His Val
165 170 175
Gly His Ala Phe Tyr Asn His Ala Asp Ala Val Ser His Ile Ile Glu
180 185 190
Val Ile Lys Tyr Glu Thr Pro Tyr
195 200
<210>145
<211>1197
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>145
atgaacgcaa cctccgcaac gatcgccgcc accgacaccc agcagcgcgg tggcttcgcc 60
ggcaccgatc cgcaaccggt cgatcgggtg ctggccgcac tgatccagga caactacgac 120
cgcgtcgacc agcgtcgcgg cgacccgccg atcgaccgcc cgctgccgca gggctgggcg 180
cgcatgggcg acgacgaagt gcgcgccgcg ggcatcgatc ctgcgatgca gcacgatgcc 240
aagagcggct tcgacgcctc gttctaccgc gacgaccagg gccgggtggc cctggtctat 300
gccggcagcg acgagggcca ggactggaag cacaacttcg gccagggcct gggtttccag 360
gacgcgcagt acgaccaggc gatcgcgctg gcgcgcgagg cgaaatcggc cttcggcgac 420
cagctcgtgc tgtcgggcca gtcgctcggc ggcggcctgg ccgcggcagc gtccatggtc 480
aacgaggtgc ccgcggtgac cttcaacgcc gccggcgtgc acgaccacac ggtcgagcgc 540
tacggcctgg acgcggacgc ggtcaagcgc caggcggacc agggcctggt ccggcactac 600
gtggtcgaga acgacatcct gacccacctg caggagaacg cgttcccgct caatgcggcg 660
atgccggatg cgcccggcgc gcgcatcgac ctgcccgatc cggatccgct gaccacgttc 720
gagaagctgc tgccctggaa gacctggccg caccgcgtgc ataaccacta catcgaggcg 780
gtgatcgagt ccatggacaa ggccggctac acgctcgaag gcgcggcggc gacgcgggat 840
gcgtcgcagg acaccgccaa ccggctgctc gacgattcgg tgcgcgggct cgcgccgcag 900
cgcgaacgcc tcgggctgca ggacgacgac cgcttcttca acgcggccgc cggcatggcc 960
gcctcggccg gacgcgatgg cctgcgcagc atccagcacg tggtcgccac gcccgacggc 1020
cacggcgtgt tcgcggtcga aggcgacctg cgcgacgccg gccaccgccg cagcctggtc 1080
gacgtggaac gcggcgccgc gacgccggtc gaggacagcg tggccagcct gcgcgagcac 1140
gcctcgcgtt ccccggagca ggagccgcag cgggagcgcc acctggcgat ggcctga 1197
<210>146
<211>398
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>146
Met Asn Ala Thr Ser Ala Thr Ile Ala Ala Thr Asp Thr Gln Gln Arg
1 5 10 15
Gly Gly Phe Ala Gly Thr Asp Pro Gln Pro Val Asp Arg Val Leu Ala
20 25 30
Ala Leu Ile Gln Asp Asn Tyr Asp Arg Val Asp Gln Arg Arg Gly Asp
35 40 45
Pro Pro Ile Asp Arg Pro Leu Pro Gln Gly Trp Ala Arg Met Gly Asp
50 55 60
Asp Glu Val Arg Ala Ala Gly Ile Asp Pro Ala Met Gln His Asp Ala
65 70 75 80
Lys Ser Gly Phe Asp Ala Ser Phe Tyr Arg Asp Asp Gln Gly Arg Val
85 90 95
Ala Leu Val Tyr Ala Gly Ser Asp Glu Gly Gln Asp Trp Lys His Asn
100 105 110
Phe Gly Gln Gly Leu Gly Phe Gln Asp Ala Gln Tyr Asp Gln Ala Ile
115 120 125
Ala Leu Ala Arg Glu Ala Lys Ser Ala Phe Gly Asp Gln Leu Val Leu
130 135 140
Ser Gly Gln Ser Leu Gly Gly Gly Leu Ala Ala Ala Ala Ser Met Val
145 150 155 160
Asn Glu Val Pro Ala Val Thr Phe Asn Ala Ala Gly Val His Asp His
165 170 175
Thr Val Glu Arg Tyr Gly Leu Asp Ala Asp Ala Val Lys Arg Gln Ala
180 185 190
Asp Gln Gly Leu Val Arg His Tyr Val Val Glu Asn Asp Ile Leu Thr
195 200 205
His Leu Gln Glu Asn Ala Phe Pro Leu Asn Ala Ala Met Pro Asp Ala
210 215 220
Pro Gly Ala Arg Ile Asp Leu Pro Asp Pro Asp Pro Leu Thr Thr Phe
225 230 235 240
Glu Lys Leu Leu Pro Trp Lys Thr Trp Pro His Arg Val His Asn His
245 250 255
Tyr Ile Glu Ala Val Ile Glu Ser Met Asp Lys Ala Gly Tyr Thr Leu
260 265 270
Glu Gly Ala Ala Ala Thr Arg Asp Ala Ser Gln Asp Thr Ala Asn Arg
275 280 285
Leu Leu Asp Asp Ser Val Arg Gly Leu Ala Pro Gln Arg Glu Arg Leu
290 295 300
Gly Leu Gln Asp Asp Asp Arg Phe Phe Asn Ala Ala Ala Gly Met Ala
305 310 315 320
Ala Ser Ala Gly Arg Asp Gly Leu Arg Ser Ile Gln His Val Val Ala
325 330 335
Thr Pro Asp Gly His Gly Val Phe Ala Val Glu Gly Asp Leu Arg Asp
340 345 350
Ala Gly His Arg Arg Ser Leu Val Asp Val Glu Arg Gly Ala Ala Thr
355 360 365
Pro Val Glu Asp Ser Val Ala Ser Leu Arg Glu His Ala Ser Arg Ser
370 375 380
Pro Glu Gln Glu Pro Gln Arg Glu Arg His Leu Ala Met Ala
385 390 395
<210>147
<211>1104
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>147
atgcaagtca gtggtgcaat ggaagcaata aatcctgcgc agatgaatgc agcggaagtc 60
acttcatcgc aggtatctga ccagatcatc ggcggcgtta gccaggtgcc ggaagcaggt 120
ttagctagtg aagtcggagc aatggcgatg gcacctgctg ctgaagatgc ggcccttgcc 180
gccatggttg ccggccctgc caatcaagcc agttacggca atttgcccag tgactggacg 240
gaagccgact ataatcatgc tctcgacatg gccaagctgt cttcccaagc ttatagccgg 300
ttcaacgata tcaccgtcga tcttctgttg gctccatttg gtggtattgg tgacataaaa 360
gcgcaggatt ttaccaccga taactggcgc ctaatggaca ccagtggcaa gagtgacttt 420
ttcttacccg tacagagcgg gctggacttc actgtttttg aggcggtagc cgatgacccg 480
gcagctaatg tgaaggaagg ggatattgtg ctcgcatttc gcggcagtga gcctacctcc 540
gcaccggatt ggatcaataa tgtaaaacag gcggcgggta attcctctca gtatgctcag 600
gcggtagaag tcgcgaagga gctgcaaggg caggtagacc agtacaatgc agacaataac 660
ctgaccggca atgatgccag aagcctccat tttaccggcc atagcctggg cgggggattg 720
gcaacagcgg ccgcgctggc cacaggcagt agcgctaccg ccttcaatgc agcgggcctt 780
ggggattcca ccctaaagaa ccttgggctc aatgaagggc tggcggcagg cttccacaat 840
aacgttacca atattaatgt ggaaggcgat ctgttgagcg atgccaaccg ccaaaaggat 900
gtctatacca cgggttcagg catcctcgat gaaaccaggc agtatgggga acaggtttgg 960
ctgcagggcg tcgatgataa ggccagattg ggcggaccgc ttaatcccct gataccggga 1020
gtggctgatg acctggcaat ccaggcactc aaccatgcct ggcatgtgta tacctaccag 1080
ttggaaaatc gcaacttcgc ctaa 1104
<210>148
<211>367
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>148
Met Gln Val Ser Gly Ala Met Glu Ala Ile Asn Pro Ala Gln Met Asn
1 5 10 15
Ala Ala Glu Val Thr Ser Ser Gln Val Ser Asp Gln Ile Ile Gly Gly
20 25 30
Val Ser Gln Val Pro Glu Ala Gly Leu Ala Ser Glu Val Gly Ala Met
35 40 45
Ala Met Ala Pro Ala Ala Glu Asp Ala Ala Leu Ala Ala Met Val Ala
50 55 60
Gly Pro Ala Asn Gln Ala Ser Tyr Gly Asn Leu Pro Ser Asp Trp Thr
65 70 75 80
Glu Ala Asp Tyr Asn His Ala Leu Asp Met Ala Lys Leu Ser Ser Gln
85 90 95
Ala Tyr Ser Arg Phe Asn Asp Ile Thr Val Asp Leu Leu Leu Ala Pro
100 105 110
Phe Gly Gly Ile Gly Asp Ile Lys Ala Gln Asp Phe Thr Thr Asp Asn
115 120 125
Trp Arg Leu Met Asp Thr Ser Gly Lys Ser Asp Phe Phe Leu Pro Val
130 135 140
Gln Ser Gly Leu Asp Phe Thr Val Phe Glu Ala Val Ala Asp Asp Pro
145 150 155 160
Ala Ala Asn Val Lys Glu Gly Asp Ile Val Leu Ala Phe Arg Gly Ser
165 170 175
Glu Pro Thr Ser Ala Pro Asp Trp Ile Asn Asn Val Lys Gln Ala Ala
180 185 190
Gly Asn Ser Ser Gln Tyr Ala Gln Ala Val Glu Val Ala Lys Glu Leu
195 200 205
Gln Gly Gln Val Asp Gln Tyr Asn Ala Asp Asn Asn Leu Thr Gly Asn
210 215 220
Asp Ala Arg Ser Leu His Phe Thr Gly His Ser Leu Gly Gly Gly Leu
225 230 235 240
Ala Thr Ala Ala Ala Leu Ala Thr Gly Ser Ser Ala Thr Ala Phe Asn
245 250 255
Ala Ala Gly Leu Gly Asp Ser Thr Leu Lys Asn Leu Gly Leu Asn Glu
260 265 270
Gly Leu Ala Ala Gly Phe His Asn Asn Val Thr Asn Ile Asn Val Glu
275 280 285
Gly Asp Leu Leu Ser Asp Ala Asn Arg Gln Lys Asp Val Tyr Thr Thr
290 295 300
Gly Ser Gly Ile Leu Asp Glu Thr Arg Gln Tyr Gly Glu Gln Val Trp
305 310 315 320
Leu Gln Gly Val Asp Asp Lys Ala Arg Leu Gly Gly Pro Leu Asn Pro
325 330 335
Leu Ile Pro Gly Val Ala Asp Asp Leu Ala Ile Gln Ala Leu Asn His
340 345 350
Ala Trp His Val Tyr Thr Tyr Gln Leu Glu Asn Arg Asn Phe Ala
355 360 365
<210>149
<211>975
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>149
atgagcgtcc aactgcaacc gagccagctc cagccgactt ggcagaaacc gctggaaccc 60
ctggccccgc cgatccaggc ggcaccgccg ctgccgcaag gctcgtacgc cctggacccc 120
agctaccacc cgcagctggc cgcggtcacc gcgaagcagg cgccggccgc caacgccgcg 180
ccggacccga cctcgttcga ccagcaactg cgcggcaagg attcgcaggc catcgacctg 240
gagatggcgc agctctcgca ggcggtctac aaccccgaca ccaagaccgt cggcaactgg 300
acccgtctcg acgacgccca gctgacccag gccggaatcg atcccaagtc gctggagaac 360
agcgacaccg gcttccgcgc cggcatctac accgacggca acggcaagta cgtggtcgcc 420
tacgccggtt ccaacgacgt gcaggactgg atcaccaacg cgcgccaggg catcggctgg 480
gattccaagc agtacgacca ggccgtgcag ctggcccagg acgcgcagca ggccttcggc 540
gagaacatgg tcatcaccgg ccattcgctc ggcggcggcc tggccgcgac cgcggcgctg 600
gccaccgaca ccgccgcagt gaccttcaac gcctccggcg tgcacgacga caccctgcgc 660
ggactgggcc tggacccggg taccgccaag agcgacgccg ccgacggcca gatccgccgc 720
tacaacatcg gcggcgaaat cctgactgcg gcgcaggaag acgtgccgct gctcaacggc 780
attcccgacg cgcccggcca cgagatcaac ctcaacgacc cggacccgcc gaaggccccg 840
gatttcacct ggaacccgat cgagatggcc aagcgcaccg ccgaatacgt ggccgccaag 900
gcgatccgtc cgggcgagct gcacgccatc ggcccggtga tcgaggcgct gcagcagcag 960
acgccctggc aatga 975
<210>150
<211>324
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>150
Met Ser Val Gln Leu Gln Pro Ser Gln Leu Gln Pro Thr Trp Gln Lys
1 5 10 15
Pro Leu Glu Pro Leu Ala Pro Pro Ile Gln Ala Ala Pro Pro Leu Pro
20 25 30
Gln Gly Ser Tyr Ala Leu Asp Pro Ser Tyr His Pro Gln Leu Ala Ala
35 40 45
Val Thr Ala Lys Gln Ala Pro Ala Ala Asn Ala Ala Pro Asp Pro Thr
50 55 60
Ser Phe Asp Gln Gln Leu Arg Gly Lys Asp Ser Gln Ala Ile Asp Leu
65 70 75 80
Glu Met Ala Gln Leu Ser Gln Ala Val Tyr Asn Pro Asp Thr Lys Thr
85 90 95
Val Gly Asn Trp Thr Arg Leu Asp Asp Ala Gln Leu Thr Gln Ala Gly
100 105 110
Ile Asp Pro Lys Ser Leu Glu Asn Ser Asp Thr Gly Phe Arg Ala Gly
115 120 125
Ile Tyr Thr Asp Gly Asn Gly Lys Tyr Val Val Ala Tyr Ala Gly Ser
130 135 140
Asn Asp Val Gln Asp Trp Ile Thr Asn Ala Arg Gln Gly Ile Gly Trp
145 150 155 160
Asp Ser Lys Gln Tyr Asp Gln Ala Val Gln Leu Ala Gln Asp Ala Gln
165 170 175
Gln Ala Phe Gly Glu Asn Met Val Ile Thr Gly His Ser Leu Gly Gly
180 185 190
Gly Leu Ala Ala Thr Ala Ala Leu Ala Thr Asp Thr Ala Ala Val Thr
195 200 205
Phe Asn Ala Ser Gly Val His Asp Asp Thr Leu Arg Gly Leu Gly Leu
210 215 220
Asp Pro Gly Thr Ala Lys Ser Asp Ala Ala Asp Gly Gln Ile Arg Arg
225 230 235 240
Tyr Asn Ile Gly Gly Glu Ile Leu Thr Ala Ala Gln Glu Asp Val Pro
245 250 255
Leu Leu Asn Gly Ile Pro Asp Ala Pro Gly His Glu Ile Asn Leu Asn
260 265 270
Asp Pro Asp Pro Pro Lys Ala Pro Asp Phe Thr Trp Asn Pro Ile Glu
275 280 285
Met Ala Lys Arg Thr Ala Glu Tyr Val Ala Ala Lys Ala Ile Arg Pro
290 295 300
Gly Glu Leu His Ala Ile Gly Pro Val Ile Glu Ala Leu Gln Gln Gln
305 310 315 320
Thr Pro Trp Gln
<210>151
<211>1341
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>151
atgggcggag aacggcaccc cgatggcgtg agcacgatac cggcaacggc ctcggacctg 60
gcgagctttg accgcgccag tggacagctg gcgacattcg ccgcgcctgt cctccacgac 120
agtggcaaac cagacgatcg tctgttcgtc gcggcgttcg acggcaccgg caacagcatg 180
gtcaaggacg cgccggagaa tcacacgaac gttgcgcgca tcgccaggca gatcgagtcc 240
ctgggcgatc ccgccatcgc gcaaggctat gtggaaggcc cgggcacgca gggcggaatc 300
ggcggaggca tcgacctcat gacagggcag agctacgaag cccgcatgga ggacatgtac 360
ctgcagttcg tgaagcaatc cgccgcgtgg ttgaaggaga acccggatgc ggacatccgc 420
atcgccgcca tcggattcag tcgtggcgcg gaacaggcgg ccggcttcac ccggatggtc 480
gaagaacgcg gcatccggaa tccggaaggc gcgcaggtca cgcgcgacgg cgatggtcgg 540
gtactgcgtg tcgactacat cggtccaccg ctgcgcgaac ccggcaccgt catccaggcg 600
gttggcctgt tcgaccccgt cggcacgggt gagccgcgcg atcacgaccg ccgtctgcca 660
ccgtcggtgg tgtcgggttt ccagatcacc gccgacgatg agcggcgcaa cctgttccag 720
tccacccgcg tgatggatcc tggcgtgacc gatggcgggc gcttcctcaa cgtcaccgtc 780
gccggtgcgc acagcgacat cggcggtggc tatacgcagg atggcatcgc gatccgcagc 840
ggcaacctga tgatcgacta cctcaacggt ctgagcgacc ggccattcct ggacaagcgt 900
gaagaaccgt tcgatcccgc tcgcaacgtg atccatcgct ccgaggaaca ccggttcttc 960
taccgcacct cgatctacga caaggcggga acgcgcggga tgcaggagga actcgcgccg 1020
tcgcacctgt gcaggatcga ctgcctcgat gcacagcccc gcaatgaaac gctcgcgcgc 1080
gagctggcct ggcgacccgt cgagatcgga ccggtcccgg tcggcgcgga ggtgtcgcgt 1140
tcgggcggca tggtcgagcg tctgttgcag gcggccaaac acggcgacgg tggcgccgtc 1200
gagcgcatct cgcgggagta tctgcacgga gacgccgggc aggcgtggct gcaggcaggc 1260
cagcagcggc tcgacgccgc ctccatcacg caggcaccac cggtggaacg ccagcaggag 1320
ccggccgcgc tcgcgcgctg a 1341
<210>152
<211>446
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>152
Met Gly Gly Glu Arg His Pro Asp Gly Val Ser Thr Ile Pro Ala Thr
1 5 10 15
Ala Ser Asp Leu Ala Ser Phe Asp Arg Ala Ser Gly Gln Leu Ala Thr
20 25 30
Phe Ala Ala Pro Val Leu His Asp Ser Gly Lys Pro Asp Asp Arg Leu
35 40 45
Phe Val Ala Ala Phe Asp Gly Thr Gly Asn Ser Met Val Lys Asp Ala
50 55 60
Pro Glu Asn His Thr Asn Val AIa Arg Ile Ala Arg Gln Ile Glu Ser
65 70 75 80
Leu Gly Asp Pro Ala Ile Ala Gln Gly Tyr Val Glu Gly Pro Gly Thr
85 90 95
Gln Gly Gly Ile Gly Gly Gly Ile Asp Leu Met Thr Gly Gln Ser Tyr
100 105 110
Glu Ala Arg Met Glu Asp Met Tyr Leu Gln Phe Val Lys Gln Ser Ala
115 120 125
Ala Trp Leu Lys Glu Asn Pro Asp Ala Asp Ile Arg Ile Ala Ala Ile
130 135 140
Gly Phe Ser Arg Gly Ala Glu Gln Ala Ala Gly Phe Thr Arg Met Val
145 150 155 160
Glu Glu Arg Gly Ile Arg Asn Pro Glu Gly Ala Gln Val Thr Arg Asp
165 170 175
Gly Asp Gly Arg Val Leu Arg Val Asp Tyr Ile Gly Pro Pro Leu Arg
180 185 190
Glu Pro Gly Thr Val Ile Gln Ala Val Gly Leu Phe Asp Pro Val Gly
195 200 205
Thr Gly Glu Pro Arg Asp His Asp Arg Arg Leu Pro Pro Ser Val Val
210 215 220
Ser Gly Phe Gln Ile Thr Ala Asp Asp Glu Arg Arg Asn Leu Phe Gln
225 230 235 240
Ser Thr Arg Val Met Asp Pro Gly Val Thr Asp Gly Gly Arg Phe Leu
245 250 255
Asn Val Thr Val Ala Gly Ala His Ser Asp Ile Gly Gly Gly Tyr Thr
260 265 270
Gln Asp Gly Ile Ala Ile Arg Ser Gly Asn Leu Met Ile Asp Tyr Leu
275 280 285
Asn Gly Leu Ser Asp Arg Pro Phe Leu Asp Lys Arg Glu Glu Pro Phe
290 295 300
Asp Pro Ala Arg Asn Val Ile His Arg Ser Glu Glu His Arg Phe Phe
305 310 315 320
Tyr Arg Thr Ser Ile Tyr Asp Lys Ala Gly Thr Arg Gly Met Gln Glu
325 330 335
Glu Leu Ala Pro Ser His Leu Cys Arg Ile Asp Cys Leu Asp Ala Gln
340 345 350
Pro Arg Asn Glu Thr Leu Ala Arg Glu Leu Ala Trp Arg Pro Val Glu
355 360 365
Ile Gly Pro Val Pro Val Gly Ala Glu Val Ser Arg Ser Gly Gly Met
370 375 380
Val Glu Arg Leu Leu Gln Ala Ala Lys His Gly Asp Gly Gly Ala Val
385 390 395 400
Glu Arg Ile Ser Arg Glu Tyr Leu His Gly Asp Ala Gly Gln Ala Trp
405 410 415
Leu Gln Ala Gly Gln Gln Arg Leu Asp Ala Ala Ser Ile Thr Gln Ala
420 425 430
Pro Pro Val Glu Arg Gln Gln Glu Pro Ala Ala Leu Ala Arg
435 440 445
<210>153
<211>384
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>153
atgtctttac tttatgcacc agaagagttt tggctagcag atgtagaaac tttagaaagt 60
gtatgtaatg gctgtggtac tgaaggctgg aaaggtaaac taattcctaa cagcatgtat 120
ggtctagata tacgcattgc ttgtgatatc catgactgga tgtatcactt tggtaagtca 180
gaaaaagata aagaaaaagc agataaagct tttttaaata atcttattcg ccttatcaat 240
gatgaaggtg gcttcttagc ttggcctaga cgttataggg ctatgactta ttataacgca 300
gtcaaagatt ttggtgggcc tgcattttgg gcaaataaaa accctaaggg tactatgaaa 360
gaacctaagg gtactcctgc ttaa 384
<210>154
<211>127
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>154
Met Ser Leu Leu Tyr Ala Pro Glu Glu Phe Trp Leu Ala Asp Val Glu
1 5 10 15
Thr Leu Glu Ser Val Cys Asn Gly Cys Gly Thr Glu Gly Trp Lys Gly
20 25 30
Lys Leu Ile Pro Asn Ser Met Tyr Gly Leu Asp Ile Arg Ile Ala Cys
35 40 45
Asp Ile His Asp Trp Met Tyr His Phe Gly Lys Ser Glu Lys Asp Lys
50 55 60
Glu Lys Ala Asp Lys Ala Phe Leu Asn Asn Leu Ile Arg Leu Ile Asn
65 70 75 80
Asp Glu Gly Gly Phe Leu Ala Trp Pro Arg Arg Tyr Arg Ala Met Thr
85 90 95
Tyr Tyr Asn Ala Val Lys Asp Phe Gly Gly Pro Ala Phe Trp Ala Asn
100 105 110
Lys Asn Pro Lys Gly Thr Met Lys Glu Pro Lys Gly Thr Pro Ala
115 120 125
<210>155
<211>1263
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>155
atgcggacga caactacaaa ttggagacaa atcgtgaaaa gcctgaagct cttcctgatg 60
ggcctttgcc tgttcatttc cgcttcattc gcatcatctg cctatgcact gggcagttac 120
acctacacgt acctgcgctg tttctatcgc gtcgatacat ccccgctgaa gcccaagacc 180
acctacgtct ggggcatcga tccgggcagc ggcggctact accgcatcta tggccgctgg 240
tggaaagacg gcttgctgag ctgggaaaac atgttctaca gcgacgtgtc gcaagatacg 300
ctgaaatcgg tttgccagag cacgctcgcc ggctacggca tcaaccgcag cgtcgcactc 360
tcggcggcgg ccgatacgtc gctctcgctc aattacacgg tgtggaccaa cgacagcgca 420
tcgcagggct cacgcatcaa caaaatcgtc gcattcggcg acagcctgtc ggacaaccag 480
aatctgtaca acgcgaccca atggcaactg ccgaaccgca acagttggtt tctcggccgc 540
ttctcgaatg acaggaactg gatcgaatac ctgtcgagca acgtgaatct gccgatgtac 600
aactgggcag tggcgggcgc ggcggcggat cagtactacg tcatcccggg tgtgtcgcaa 660
caggtcgact cgtggatcac ctacatgcag agcgcgccga attaccaggc cgcgaatacg 720
ctgttcaccg tgcttgtcgg cggcaacgat ctggtgaact acggccggtc tgtcgactcg 780
atcatctccg cggagcagca ggcgctggtg aagatgatca atgccggcgc tcgcaacatc 840
ctgttgctga atctgcccga cgtatcgcgc gcaccggtat tccagtatcg cagcgacgcc 900
gccaccatcg ccgcgcaagt ccgcgacttc aaccagaagc tggcgcaact gcgcgacaat 960
cttcaggcga cgtacggccc gtcgctcgtc attcgcatgt tcgataccta caccttgttc 1020
aacgatctgc tgaacaatcc gaccaactat ggcgtgacga acacctggca gtcctgcctc 1080
gacatcaact cggattccgg gtcgaactat ctttatacct ggccgacgcg cgccgaatgc 1140
accaacgccg acagcttcgt gttctgggac acgctgcacc cgaccacgca tacgcacaag 1200
ctgctgggcg acaatgcggc gaatttcgta cgcgccggtt tccccgcatt gtctgcgcct 1260
tga 1263
<210>156
<211>420
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>信号
<222>(1)...(36)
<220>
<221>结构域
<222>(149)...(406)
<223>GDSL-样脂酶/酰基水解酶
<400>156
Met Arg Thr Thr Thr Thr Asn Trp Arg Gln Ile Val Lys Ser Leu Lys
1 5 10 15
Leu Phe Leu Met Gly Leu Cys Leu Phe Ile Ser Ala Ser Phe Ala Ser
20 25 30
Ser Ala Tyr Ala Leu Gly Ser Tyr Thr Tyr Thr Tyr Leu Arg Cys Phe
35 40 45
Tyr Arg Val Asp Thr Ser Pro Leu Lys Pro Lys Thr Thr Tyr Val Trp
50 55 60
Gly Ile Asp Pro Gly Ser Gly Gly Tyr Tyr Arg Ile Tyr Gly Arg Trp
65 70 75 80
Trp Lys Asp Gly Leu Leu Ser Trp Glu Asn Met Phe Tyr Ser Asp Val
85 90 95
Ser Gln Asp Thr Leu Lys Ser Val Cys Gln Ser Thr Leu Ala Gly Tyr
100 105 110
Gly Ile Asn Arg Ser Val Ala Leu Ser Ala Ala Ala Asp Thr Ser Leu
115 120 125
Ser Leu Asn Tyr Thr Val Trp Thr Asn Asp Ser Ala Ser Gln Gly Ser
130 135 140
Arg Ile Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Asn Gln
145 150 155 160
Asn Leu Tyr Asn Ala Thr Gln Trp Gln Leu Pro Asn Arg Asn Ser Trp
165 170 175
Phe Leu Gly Arg Phe Ser Asn Asp Arg Asn Trp Ile Glu Tyr Leu Ser
180 185 190
Ser Asn Val Asn Leu Pro Met Tyr Asn Trp Ala Val Ala Gly Ala Ala
195 200 205
Ala Asp Gln Tyr Tyr Val Ile Pro Gly Val Ser Gln Gln Val Asp Ser
210 215 220
Trp Ile Thr Tyr Met Gln Ser Ala Pro Asn Tyr Gln Ala Ala Asn Thr
225 230 235 240
Leu Phe Thr Val Leu Val Gly Gly Asn Asp Leu Val Asn Tyr Gly Arg
245 250 255
Ser Val Asp Ser Ile Ile Ser Ala Glu Gln Gln Ala Leu Val Lys Met
260 265 270
Ile Asn Ala Gly Ala Arg Asn Ile Leu Leu Leu Asn Leu Pro Asp Val
275 280 285
Ser Arg Ala Pro Val Phe Gln Tyr Arg Ser Asp Ala Ala Thr Ile Ala
290 295 300
Ala Gln Val Arg Asp Phe Asn Gln Lys Leu Ala Gln Leu Arg Asp Asn
305 310 315 320
Leu Gln Ala Thr Tyr Gly Pro Ser Leu Val Ile Arg Met Phe Asp Thr
325 330 335
Tyr Thr Leu Phe Asn Asp Leu Leu Asn Asn Pro Thr Asn Tyr Gly Val
340 345 350
Thr Asn Thr Trp Gln Ser Cys Leu Asp Ile Asn Ser Asp Ser Gly Ser
355 360 365
Asn Tyr Leu Tyr Thr Trp Pro Thr Arg Ala Glu Cys Thr Asn Ala Asp
370 375 380
Ser Phe Val Phe Trp Asp Thr Leu His Pro Thr Thr His Thr His Lys
385 390 395 400
Leu Leu Gly Asp Asn Ala Ala Asn Phe Val Arg Ala Gly Phe Pro Ala
405 410 415
Leu Ser Ala Pro
420
<210>157
<211>1329
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>157
atgagcctca acagccaaga ctacgctgcg ctatccgaag atgcatacaa ggattatgcg 60
gtcggtcgtc gagcgcctgg tcaagaagaa atcgttccga tcaacgggca caagtacaag 120
atcctcgagc acgttgacaa tcggctgaac ggttatcagg gaacgatcta ccagcgagtc 180
gacaccaatg aaattgtcgt cgcacatcgc ggaaccgaac aaatcgcacg cgatgcgatt 240
ctgaccgatg gtggcatggt cgttgcccgt accaatgtgc aggcgccaga cgcaatcgcg 300
ctgacccaac gcgccctggc ttacgccaag aaggaggggc aggatctcgg ccaacgtccg 360
cctgaggtca ccgtcaccgg ccactccctc ggcggcgctc tggcccagat cacctcgcac 420
cacttcaacg tcaagggcga gaccttcaac gcctatggcg cggtcagcct cagctaccgc 480
atcccggaag gtggcaacac catgatcaac catgtcatgg cctccgatcc ggtcagcgcg 540
gcgtcgccac atttcggcca ggtgcggatc tacgccaggc cgaatgaaat cagcacgctc 600
gccgcgaacg gtttcagcaa tcactcgttg cgcgccctta tccccgaccg gccgatcatc 660
gccgcaggca gctcgttcgg cgcgcacaag ctgggcaact tcctcggtga cggctcggtg 720
ctgcagcacc cggaaacgca gaagctggca aaagacaacg ccaggatgat cgaggaatac 780
cgcgacgacg ttgaattact gcgccgtggt gtcacccgcg cggcgcgggg cattccgggc 840
ggcgccgtcg acctgtacga ccacatccgc ggcccgctgc agcccggtga gccggcacgc 900
cgcgaagcgg agaagaacgg ccatcacacc agcatgctgc gaatggacga tgccaaccat 960
gtgggcaacc cactgttcaa cgacgcgatc cgtggcgtgc acgcgcagga tgtccgcgtc 1020
ggccgggtac cagacgtgat gagcacgcaa ctggcaggca gtctggccgc cgaaatgcac 1080
gcagcaggcg gcaagcgcat cgacgaagtg gtcatgaatg ccgatgcctc gcgcagcttc 1140
gccgtgcagg gccagggcgg tgaccccgcc caccttcgtg tgtcggtgga tacggcagtg 1200
gcgatgaaca ccccgctgga acagagcagc cagcgcatcg accagcaggc cgccgaccag 1260
cgcgttgcgc tggagcgcga ccagcagctg gaacagcagc ggaaccagac ccgcagcctg 1320
caggcctga 1329
<210>158
<211>442
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>158
Met Ser Leu Asn Ser Gln Asp Tyr Ala Ala Leu Ser Glu Asp Ala Tyr
1 5 10 15
Lys Asp Tyr Ala Val Gly Arg Arg Ala Pro Gly Gln Glu Glu Ile Val
20 25 30
Pro Ile Asn Gly His Lys Tyr Lys Ile Leu Glu His Val Asp Asn Arg
35 40 45
Leu Asn Gly Tyr Gln Gly Thr Ile Tyr Gln Arg Val Asp Thr Asn Glu
50 55 60
Ile Val Val Ala His Arg Gly Thr Glu Gln Ile Ala Arg Asp Ala Ile
65 70 75 80
Leu Thr Asp Gly Gly Met Val Val Ala Arg Thr Asn Val Gln Ala Pro
85 90 95
Asp Ala Ile Ala Leu Thr Gln Arg Ala Leu Ala Tyr Ala Lys Lys Glu
100 105 110
Gly Gln Asp Leu Gly Gln Arg Pro Pro Glu Val Thr Val Thr Gly His
115 120 125
Ser Leu Gly Gly Ala Leu Ala Gln Ile Thr Ser His His Phe Asn Val
130 135 140
Lys Gly Glu Thr Phe Asn Ala Tyr Gly Ala Val Ser Leu Ser Tyr Arg
145 150 155 160
Ile Pro Glu Gly Gly Asn Thr Met Ile Asn His Val Met Ala Ser Asp
165 170 175
Pro Val Ser Ala Ala Ser Pro His Phe Gly Gln Val Arg Ile Tyr Ala
180 185 190
Arg Pro Asn Glu Ile Ser Thr Leu Ala Ala Asn Gly Phe Ser Asn His
195 200 205
Ser Leu Arg Ala Leu Ile Pro Asp Arg Pro Ile Ile Ala Ala Gly Ser
210 215 220
Ser Phe Gly Ala His Lys Leu Gly Asn Phe Leu Gly Asp Gly Ser Val
225 230 235 240
Leu Gln His Pro Glu Thr Gln Lys Leu Ala Lys Asp Asn Ala Arg Met
245 250 255
Ile Glu Glu Tyr Arg Asp Asp Val Glu Leu Leu Arg Arg Gly Val Thr
260 265 270
Arg Ala Ala Arg Gly Ile Pro Gly Gly Ala Val Asp Leu Tyr Asp His
275 280 285
Ile Arg Gly Pro Leu Gln Pro Gly Glu Pro Ala Arg Arg Glu Ala Glu
290 295 300
Lys Asn Gly His His Thr Ser Met Leu Arg Met Asp Asp Ala Asn His
305 310 315 320
Val Gly Asn Pro Leu Phe Asn Asp Ala Ile Arg Gly Val His Ala Gln
325 330 335
Asp Val Arg Val Gly Arg Val Pro Asp Val Met Ser Thr Gln Leu Ala
340 345 350
Gly Ser Leu Ala Ala Glu Met His Ala Ala Gly Gly Lys Arg Ile Asp
355 360 365
Glu Val Val Met Asn Ala Asp Ala Ser Arg Ser Phe Ala Val Gln Gly
370 375 380
Gln Gly Gly Asp Pro Ala His Leu Arg Val Ser Val Asp Thr Ala Val
385 390 395 400
Ala Met Asn Thr Pro Leu Glu Gln Ser Ser Gln Arg Ile Asp Gln Gln
405 410 415
Ala Ala Asp Gln Arg ValAla Leu Glu Arg Asp Gln Gln Leu Glu Gln
420 425 430
Gln Arg Asn Gln Thr Arg Ser Leu Gln Ala
435 440
<210>159
<211>1428
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>159
atgtcgatca cgctggtatt cgtgcacggc tggagtgtca caagcaagga cacctacggg 60
aagcttcccg aggccatctc tcaagccgct gcggccgcgg gcatcgatgt agagctgaag 120
gacatctacc tcggccgcta catcagcttt cacgacgagg ttacggtcga cgacatcgcg 180
accgcgatga atcacgcggt ggcgaacgac ttgaaagggg tgaaggagtt ctcgtgcatc 240
acgcactcca cgggcggccc ggtcgtgcgt cgctgggtag atatgttcta cggcgcgaag 300
gacctcgaca actgtccgct gcgtcatctc atcatgctgg cgcctgcaaa ccatggttcc 360
gcgttggccg tcttggggaa gggccgcgtc ggtcgaatcc aggcgtggtg gggtggggtc 420
gagcccggtc agggcgtgct cgactggctt tgcctcggca gctcggaagc gtgggagctc 480
caggacagct tcacggatta ctcgctggac gacgcgaagt tcttcccgtt cgtgctgagc 540
ggcgagacga ttgataagca cttctacgac ttcctcaaca gctatctgga tgaagtgggc 600
tcggatggcg tggttcgtct ggcgggggcc aatctgaact acacgtttat tcggctcgac 660
caaactgaaa agcgttacga cgacggcgag gaaacgggct acatactgac tgttcggccg 720
cggacaaagc cgcgcccacc cgtaacggcg ttcggagtca taccgagcgc gagtcactcg 780
ggtaacgaca tcggcatcat gcgcagcgtc acgccggcga actccgattc gaagcctgtc 840
gtggcgcaaa tcgtgaaatg cctcggcgtg gagacacaag cggattacaa agcgcgtgtc 900
accgagctgg ccgcgttcac cgccgaaacg cagaaagcca acgccgtgca gtacggcggc 960
aaagagcgcc atttcgtgat gttcatcttc cgcatccgcg acgacagagg gcgcacgata 1020
agcgactacg acctgttgct gctcggcgac ggtttccacc cggacaagct gcccaaggga 1080
ttcttcgttg accgtcaacg caatcccaag tcccaggcgc tggtctacta cctcgactac 1140
gacgcgctga cggctgacga cgacaccgac ttaggtattc gagtgaacgc gcgaccgctc 1200
tatagcgcgc ccggagcagc agagccagac gcattcgcgg gctatcgagc cgccgagtat 1260
cgattcacgg gcaaagtact gaagcaattc gtgcgcccga acgaaactgt gtacgtcgac 1320
atcgtgctga atcgcatggt ggacgttgaa acgctccggc tggagcctct ggaaggatcg 1380
ccgcgtgggt cgttcaagaa aactctgccc aaagggccgg tgagttag 1428
<210>160
<211>475
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>160
Met Ser Ile Thr Leu Val Phe Val His Gly Trp Ser Val Thr Ser Lys
1 5 10 15
Asp Thr Tyr Gly Lys Leu Pro Glu Ala Ile Ser Gln Ala Ala Ala Ala
20 25 30
Ala Gly Ile Asp Val Glu Leu Lys Asp Ile Tyr Leu Gly Arg Tyr Ile
35 40 45
Ser Phe His Asp Glu Val Thr Val Asp Asp Ile Ala Thr Ala Met Asn
50 55 60
His Ala Val Ala Asn Asp Leu Lys Gly Val Lys Glu Phe Ser Cys Ile
65 70 75 80
Thr His Ser Thr Gly Gly Pro Val Val Arg Arg Trp Val Asp Met Phe
85 90 95
Tyr Gly Ala Lys Asp Leu Asp Asn Cys Pro Leu Arg His Leu Ile Met
100 105 110
Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Val Leu Gly Lys Gly
115 120 125
Arg Val Gly Arg Ile Gln Ala Trp Trp Gly Gly Val Glu Pro Gly Gln
130 135 140
Gly Val Leu Asp Trp Leu Cys Leu Gly Ser Ser Glu Ala Trp Glu Leu
145 150 155 160
Gln Asp Ser Phe Thr Asp Tyr Ser Leu Asp Asp Ala Lys Phe Phe Pro
165 170 175
Phe Val Leu Ser Gly Glu Thr Ile Asp Lys His Phe Tyr Asp Phe Leu
180 185 190
Asn Ser Tyr Leu Asp Glu Val Gly Ser Asp Gly Val Val Arg Leu Ala
195 200 205
Gly Ala Asn Leu Asn Tyr Thr Phe Ile Arg Leu Asp Gln Thr Glu Lys
210 215 220
Arg Tyr Asp Asp Gly Glu Glu Thr Gly Tyr Ile Leu Thr Val Arg Pro
225 230 235 240
Arg Thr Lys Pro Arg Pro Pro Val Thr Ala Phe Gly Val Ile Pro Ser
245 250 255
Ala Ser His Ser Gly Asn Asp Ile Gly Ile Met Arg Ser Val Thr Pro
260 265 270
Ala Asn Ser Asp Ser Lys Pro Val Val Ala Gln Ile Val Lys Cys Leu
275 280 285
Gly Val Glu Thr Gln Ala Asp Tyr Lys Ala Arg Val Thr Glu Leu Ala
290 295 300
Ala Phe Thr Ala Glu Thr Gln Lys Ala Asn Ala Val Gln Tyr Gly Gly
305 310 315 320
Lys Glu Arg His Phe Val Met Phe Ile Phe Arg Ile Arg Asp Asp Arg
325 330 335
Gly Arg Thr Ile Ser Asp Tyr Asp Leu Leu Leu Leu Gly Asp Gly Phe
340 345 350
His Pro Asp Lys Leu Pro Lys Gly Phe Phe Val Asp Arg Gln Arg Asn
355 360 365
Pro Lys Ser Gln Ala Leu Val Tyr Tyr Leu Asp Tyr Asp Ala Leu Thr
370 375 380
Ala Asp Asp Asp Thr Asp Leu Gly Ile Arg Val Asn Ala Arg Pro Leu
385 390 395 400
Tyr Ser Ala Pro Gly Ala Ala Glu Pro Asp Ala Phe Ala Gly Tyr Arg
405 410 415
Ala Ala Glu Tyr Arg Phe Thr Gly Lys Val Leu Lys Gln Phe Val Arg
420 425 430
Pro Asn Glu Thr Val Tyr Val Asp Ile Val Leu Asn Arg Met Val Asp
435 440 445
Val Glu Thr Leu Arg Leu Glu Pro Leu Glu Gly Ser Pro Arg Gly Ser
450 455 460
Phe Lys Lys Thr Leu Pro Lys Gly Pro Val Ser
465 470 475
<210>161
<21l>1740
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>161
atgaacagaa aattattatc gttatgcttg ggagcaacgt cctgtattgc actatcactt 60
cctgtgcatg catttacgca aaagggtgcg ggtacggaaa tttctaatgg gatacctatg 120
gggcacgaat gggttacgcg tttgtctgca ttggaattgc ttggtggcga tcctattatg 180
ccgccagatc caaatgaccc acgtaaaaac tggactaaag ggaaagccaa aaacctcgat 240
ctttccagcc caggtgcgcg tgcagaagtt gcgcggatta tgagtgttga ttatcacgat 300
aaaatattcc agtcgacgta caaagttgtt ttcgacgcta ttattggcga gcgctgggta 360
gatttggcgg gatataacgt gacgaccagc atgttgggaa aaataaactg ttttgatgct 420
gtagcccaag agccagtaga aatccagtac gatcatttta tgcgtcgtta cgacgagcgc 480
ggtggaaaag gtggagcgac tgctgcgacc aattcacgcg agcgttttgt gcaatatttt 540
gttgcagcgg caatggctcc ccaaacaact atgaaagtat gggatggcgg tgttgttagt 600
gatttggtta ccgtagatag gaattacttt ttatttggca gggctgcgca tttattcgaa 660
gactcattta gttcagaaca tacagtgcgg gtgagtgatg ataattttga actggtgcgc 720
caagtaaaaa gctacatgtg tgctgcaggt tctgaacagc atacgcattc aaatgaaaaa 780
atatttaatt acaccagtgg cgatgttatt tggaaaccgg gtactggttt ggatccaagt 840
tggtccgcat ataaaccaag caacatgaaa accgtcgcat tggtggcgac cgaagcaact 900
aaagatttat gggcagcgtt tattcgctcc atgggcacgc ctatagcgca gcgtgagcag 960
tgggcgcgta aagaggctaa taaactggcc gataattggt tggcttttga taaatacaaa 1020
ctccccgatt ggtatgacat tgaagctcat cgggatgata cctatgtatt ggctgatggg 1080
cagacaggga aaggccaaac tgttgccgct tgtatgcaaa agttgggggt tgcatcaggc 1140
aagcaggagg ataaggttcg ccaattggaa gcagatcaaa aaacctgttt atacaatgtc 1200
gtggctgaag agggatacgc cgatttattt gatcccgcat ttcacatgcc attcaattgg 1260
cgttggaaaa caggccggtt tggtgattgg ttacaaccac cagcaggatg gaaaattcca 1320
actcgtccag cggatacagg cacacgcgtg aatattctca gtgcgacaaa caatctccct 1380
atggtggcag ctgatggtgt aagccataac cagtgggttt atgttaaagc aggttttcct 1440
gcgctgggtt ttatcaaagt gccggatgaa aataatactg acaaaaagaa tagtattttt 1500
tatcgcgtaa ttaatgatcc cgatttattt ttaagttaca acgccactac tggcgcagta 1560
aaactctggg ccagtccgaa ccaggctaat tatgcaactg aaccaaaatc agggaatatt 1620
gcaatcaaga gtttgtattg ggatcaatat atgtggcttt caaacgaatc cccttatatt 1680
acccgtaccg ggaatcccaa aaatttggat gcccaatgga aagaagtagc cgctaagtaa 1740
<210>162
<211>579
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>信号
<222>(1)...(24)
<400>162
Met Asn Arg Lys Leu Leu Ser Leu Cys Leu Gly Ala Thr Ser Cys Ile
1 5 10 15
Ala Leu Ser Leu Pro Val His Ala Phe Thr Gln Lys Gly Ala Gly Thr
20 25 30
Glu Ile Ser Asn Gly Ile Pro Met Gly His Glu Trp Val Thr Arg Leu
35 40 45
Ser Ala Leu Glu Leu Leu Gly Gly Asp Pro Ile Met Pro Pro Asp Pro
50 55 60
Asn Asp Pro Arg Lys Asn Trp Thr Lys Gly Lys Ala Lys Asn Leu Asp
65 70 75 80
Leu Ser Ser Pro Gly Ala Arg Ala Glu Val Ala Arg Ile Met Ser Val
85 90 95
Asp Tyr His Asp Lys Ile Phe Gln Ser Thr Tyr Lys Val Val Phe Asp
100 105 110
Ala Ile Ile Gly Glu Arg Trp Val Asp Leu Ala Gly Tyr Asn Val Thr
115 120 125
Thr Ser Met Leu Gly Lys Ile Asn Cys Phe Asp Ala Val Ala Gln Glu
130 135 140
Pro Val Glu Ile Gln Tyr Asp His Phe Met Arg Arg Tyr Asp Glu Arg
l45 150 155 160
Gly Gly Lys Gly Gly Ala Thr Ala Ala Thr Asn Ser Arg Glu Arg Phe
165 170 175
Val Gln Tyr Phe Val Ala Ala Ala Met Ala Pro Gln Thr Thr Met Lys
180 185 190
Val Trp Asp Gly Gly Val Val Ser Asp Leu Val Thr Val Asp Arg Asn
195 200 205
Tyr Phe Leu Phe Gly Arg Ala Ala His Leu Phe Glu Asp Ser Phe Ser
210 215 220
Ser Glu His Thr Val Arg Val Ser Asp Asp Asn Phe Glu Leu Val Arg
225 230 235 240
Gln Val Lys Ser Tyr Met Cys Ala Ala Gly Ser Glu Gln His Thr His
245 250 255
Ser Asn Glu Lys Ile Phe Asn Tyr Thr Ser Gly Asp Val Ile Trp Lys
260 265 270
Pro Gly Thr Gly Leu Asp Pro Ser Trp Ser Ala Tyr Lys Pro Ser Asn
275 280 285
Met Lys Thr Val Ala Leu Val Ala Thr Glu Ala Thr Lys Asp Leu Trp
290 295 300
Ala Ala Phe Ile Arg Ser Met Gly Thr Pro Ile Ala Gln Arg Glu Gln
305 310 315 320
Trp Ala Arg Lys Glu Ala Asn Lys Leu Ala Asp Asn Trp Leu Ala Phe
325 330 335
Asp Lys Tyr Lys Leu Pro Asp Trp Tyr Asp Ile Glu Ala His Arg Asp
340 345 350
Asp Thr Tyr Val Leu Ala Asp Gly Gln Thr Gly Lys Gly Gln Thr Val
355 360 365
Ala Ala Cys Met Gln Lys Leu Gly Val Ala Ser Gly Lys Gln Glu Asp
370 375 380
Lys Val Arg Gln Leu Glu Ala Asp Gln Lys Thr Cys Leu Tyr Asn Val
385 390 395 400
Val Ala Glu Glu Gly Tyr Ala Asp Leu Phe Asp Pro Ala Phe His Met
405 410 415
Pro Phe Asn Trp Arg Trp Lys Thr Gly Arg Phe Gly Asp Trp Leu Gln
420 425 430
Pro Pro Ala Gly Trp Lys Ile Pro Thr Arg Pro Ala Asp Thr Gly Thr
435 440 445
Arg Val Asn Ile Leu Ser Ala Thr Asn Asn Leu Pro Met Val Ala Ala
450 455 460
Asp Gly Val Ser His Asn Gln Trp Val Tyr Val Lys Ala Gly Phe Pro
465 470 475 480
Ala Leu Gly Phe Ile Lys Val Pro Asp Glu Asn Asn Thr Asp Lys Lys
485 490 495
Asn Ser Ile Phe Tyr Arg Val Ile Asn Asp Pro Asp Leu Phe Leu Ser
500 505 510
Tyr Asn Ala Thr Thr Gly Ala Val Lys Leu Trp Ala Ser Pro Asn Gln
515 520 525
Ala Asn Tyr Ala Thr Glu Pro Lys Ser Gly Asn Ile Ala Ile Lys Ser
530 535 540
Leu Tyr Trp Asp Gln Tyr Met Trp Leu Ser Asn Glu Ser Pro Tyr Ile
545 550 555 560
Thr Arg Thr Gly Asn Pro Lys Asn Leu Asp Ala Gln Trp Lys Glu Val
565 570 575
Ala Ala Lys
<210>163
<211>1104
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>163
atgcaagtca atggtgcaat tgcagttact gatccggcgt tgagcaatgc agtggaagca 60
acctcttacc agacatctga acagattgtg ggtggagtaa gcgaagcggc ggaagcaggg 120
ttggcggcag aagtgggcgc ggcggagacg ttcgctgcag ctgacgatgt tgccctttca 180
tccatggtcg ccggcccggc taatgatgcc tcttacggca acctgcccgc agggtgggat 240
gaggcccggt ttgatcatgc cctggatatg gccaagttgt cctctcaggc ctacagcagt 300
ttcaatgaca gaactgtaga tcttctactg gcgccgttta gcggtatcaa tgacataaaa 360
aatcaagatt tctccaccga taattatctc cctataaatt ccggtggcaa atctgacttc 420
ctgttgcccc tgcagaatgg gctggactat acggtcttcc agcaagtcac cgatcctaat 480
ggtgtcgatc atgccgccaa gactgccggc ggcgatatcg ttctttcctt ccggggcagt 540
gaacccacat ccgccccgga ttgggtgaac aatgtgaagc aggccgctgg ccattctccc 600
caatatgggg ccgcggtaaa tgtggcgagg gatttgcagc agcaagtgga tgcctataat 660
gagaagcatg ggcttgaagg cgacgctgcc atgaagctcc acttcaccgg ccacagcctg 720
ggtggcggat tggccactgc cgctgccctg gctaccggta gcgaagcgac agtctttaat 780
gctgccggtc tctcagacca taccattaac aaccttggcc tggacgcaag ccatgccgac 840
aaggtgacca atattaacgt ggaaggcgat ctgctgagcg atggcaaccg gcagaaggat 900
gctcacacca cgggctctgg tgtctttggc gataccaagc aatatggtga gcaggtctgg 960
ctgcagggtg tagatgaccg cgcaagattt ggcggccctc tcaacttcct ggtgccgggc 1020
tttgtcaacg acctggccat tcaggggctt aatcacgcct ggcatgtgta tacctaccaa 1080
ttggaaaacc gcaactttgc ctga 1104
<210>164
<211>367
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(174)...(296)
<223>脂酶(类3)
<400>164
Met Gln Val Asn Gly Ala Ile Ala Val Thr Asp Pro Ala Leu Ser Asn
1 5 10 15
Ala Val Glu Ala Thr Ser Tyr Gln Thr Ser Glu Gln Ile Val Gly Gly
20 25 30
Val Ser Glu Ala Ala Glu Ala Gly Leu Ala Ala Glu Val Gly Ala Ala
35 40 45
Glu Thr Phe Ala Ala Ala Asp Asp Val Ala Leu Ser Ser Met Val Ala
50 55 60
Gly Pro Ala Asn Asp Ala Ser Tyr Gly Asn Leu Pro Ala Gly Trp Asp
65 70 75 80
Glu Ala Arg Phe Asp His Ala Leu Asp Met Ala Lys Leu Ser Ser Gln
85 90 95
Ala Tyr Ser Ser Phe Asn Asp Arg Thr Val Asp Leu Leu Leu Ala Pro
100 105 110
Phe Ser Gly Ile Asn Asp Ile Lys Asn Gln Asp Phe Ser Thr Asp Asn
115 120 125
Tyr Leu Pro Ile Asn Ser Gly Gly Lys Ser Asp Phe Leu Leu Pro Leu
130 135 140
Gln Asn Gly Leu Asp Tyr Thr Val Phe Gln Gln Val Thr Asp Pro Asn
145 150 155 160
Gly Val Asp His Ala Ala Lys Thr Ala Gly Gly Asp Ile Val Leu Ser
165 170 175
Phe Arg Gly Ser Glu Pro Thr Ser Ala Pro Asp Trp Val Asn Asn Val
180 185 190
Lys Gln Ala Ala Gly His Ser Pro Gln Tyr Gly Ala Ala Val Asn Val
195 200 205
Ala Arg Asp Leu Gln Gln Gln Val Asp Ala TyrAsn Glu Lys His Gly
210 215 220
Leu Glu Gly Asp Ala Ala Met Lys Leu His Phe Thr Gly His Ser Leu
225 230 235 240
Gly Gly Gly Leu Ala Thr Ala Ala Ala Leu Ala Thr Gly Ser Glu Ala
245 250 255
Thr Val Phe Asn Ala Ala Gly Leu Ser Asp His Thr Ile Asn Asn Leu
260 265 270
Gly Leu Asp Ala Ser His Ala Asp Lys Val Thr Asn Ile Asn Val Glu
275 280 285
Gly Asp Leu Leu Ser Asp Gly Asn Arg Gln Lys Asp Ala His Thr Thr
290 295 300
Gly Ser Gly Val Phe Gly Asp Thr Lys Gln Tyr Gly Glu Gln Val Trp
305 310 315 320
Leu Gln Gly Val Asp Asp Arg Ala Arg Phe Gly Gly Pro Leu Asn Phe
325 330 335
Leu Val Pro Gly Phe Val Asn Asp Leu Ala Ile Gln Gly Leu Asn His
340 345 350
Ala Trp His Val Tyr Thr Tyr Gln Leu Glu Asn Arg Asn Phe Ala
355 360 365
<210>165
<21l>927
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>165
atgcccaaat acagaattct tagtttggac ggcggcggaa tccgggggct gctcagcgcg 60
attctgctcg agcggttgga agcggaggca cccaattggc tgagccaggt ggacctgatc 120
gccggcacat ccaccggcgg gatcatcgcc ctgggtctcg ccaaaggcct cagcccaacc 180
caactgcgca atctctatca actgcgcggg gcggcgatat tcgatgattc atggtgggac 240
gacgtgctcg atattgggaa gatttcgggc gcggattatg ataacaagca actcaccaaa 300
gagttgaaga cgattctcgg caacacgaaa ctgcgcgagt tgtcgaagcg ggttttgatt 360
tcgagtttcg atctggacag tgaagagcgc gatcccacca aacgaagttg gacgccgaag 420
ttcttccaca acttcccggg catcgacagc gacggcgagc aactggccta caaggtggcg 480
ctgtacacca gtgccgcgcc gacgtatttt ccgaccgtgg acgggtacat cgatggcggt 540
gtggtggcca acaaccccag catggcagcc ctcgcgcaaa cgcaggacac ccgcgcgctg 600
aaaacaccgc cgcgcttctc cgaaatccgg ctgctctcga tcggcacggg caaatccctc 660
tatcgcatcg aagggcagaa cctggactgg ggctacgccc agtgggccaa gccgctcatc 720
aacatcatga tggacggcgt gatgggtgtg gcagattacc agtgccggca ggtcctggac 780
gacaattatt gccggatttc gcccaccttc ccgcccggcg cggtgtttcc cttggacggt 840
gtcaaacaga ttcccgacct ggtgaccttt gccacttccg tggacctcac gcgcgccgtt 900
cagtggatca agagcaagtg ggcttag 927
<210>166
<211>308
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(7)...(191)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
<400>166
Met Pro Lys Tyr Arg Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly
1 5 10 15
Leu Leu Ser Ala Ile Leu Leu Glu Arg Leu Glu Ala Glu Ala Pro Asn
20 25 30
Trp Leu Ser Gln Val Asp Leu Ile Ala Gly Thr Ser Thr Gly Gly Ile
35 40 45
Ile Ala Leu Gly Leu Ala Lys Gly Leu Ser Pro Thr Gln Leu Arg Asn
50 55 60
Leu Tyr Gln Leu Arg Gly Ala Ala Ile Phe Asp Asp Ser Trp Trp Asp
65 70 75 80
Asp Val Leu Asp Ile Gly Lys Ile Ser Gly Ala Asp Tyr Asp Asn Lys
85 90 95
Gln Leu Thr Lys Glu Leu Lys Thr Ile Leu Gly Asn Thr Lys Leu Arg
100 105 110
Glu Leu Ser Lys Arg Val Leu Ile Ser Ser Phe Asp Leu Asp Ser Glu
115 120 125
Glu Arg Asp Pro Thr Lys Arg Ser Trp Thr Pro Lys Phe Phe His Asn
130 135 140
Phe Pro Gly Ile Asp Ser Asp Gly Glu Gln Leu Ala Tyr Lys Val Ala
145 150 155 160
Leu Tyr Thr Ser Ala Ala Pro Thr Tyr Phe Pro Thr Val Asp Gly Tyr
165 170 175
Ile Asp Gly Gly Val Val Ala Asn Asn Pro Ser Met Ala Ala Leu Ala
180 185 190
Gln Thr Gln Asp Thr Arg Ala Leu Lys Thr Pro Pro Arg Phe Ser Glu
195 200 205
Ile Arg Leu Leu Ser Ile Gly Thr Gly Lys Ser Leu Tyr Arg Ile Glu
210 215 220
Gly Gln Asn Leu Asp Trp Gly Tyr Ala Gln Trp Ala Lys Pro Leu Ile
225 230 235 240
Asn Ile Met Met Asp Gly Val Met Gly Val Ala Asp Tyr Gln Cys Arg
245 250 255
Gln Val Leu Asp Asp Asn Tyr Cys Arg Ile Ser Pro Thr Phe Pro Pro
260 265 270
Gly Ala Val Phe Pro Leu Asp Gly Val Lys Gln Ile Pro Asp Leu Val
275 280 285
Thr Phe Ala Thr Ser Val Asp Leu Thr Arg Ala Val Gln Trp Ile Lys
290 295 300
Ser Lys Trp Ala
305
<210>167
<211>522
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>167
atggcgagga gctggaagtg gaggccgctt cttagctctt tcttattggt atccttggcg 60
cccttctcga cgtccgtgcc ttgcttcaag ctacccggcc ttgagagcgt ggccttctgg 120
ataagcacta ctatgaactt cttcccgttc ctcctctaca cggctatact agcctacgtt 180
aggaaagact acaaaatagt gctagagggg ctcgccctga acgcgttcgt gctcgtcctc 240
aagtactcgt tccacacccc caggccggag ggctctggcc acctaacccc gggctacccc 300
tccggccaca cggcgagggc cttctggctg gcgctcgagc tcgaaggggt ctggaggtac 360
cctatgttaa cctacgcggc tctggtcgcg tggtcgcgcg ttcagctctg cgcgcactac 420
ccgctggacg tagtgggagg agcgttgagc gctttggcct tccgcgactt atgggaggtt 480
ctgctggaga gggtaggagc cttgaggggg cagcgcgctt ag 522
<210>168
<211>173
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>信号
<222>(1)...(30)
<220>
<221>结构域
<222>(48)...(167)
<223>PAP2超家族
<400>168
Met Ala Arg Ser Trp Lys Trp Arg Pro Leu Leu Ser Ser Phe Leu Leu
1 5 10 15
Val Ser Leu Ala Pro Phe Ser Thr Ser Val Pro Cys Phe Lys Leu Pro
20 25 30
Gly Leu Glu Ser Val Ala Phe Trp Ile Ser Thr Thr Met Asn Phe Phe
35 40 45
Pro Phe Leu Leu Tyr Thr Ala Ile Leu Ala Tyr Val Arg Lys Asp Tyr
50 55 60
Lys Ile Val Leu Glu Gly Leu Ala Leu Asn Ala Phe Val Leu Val Leu
65 70 75 80
Lys Tyr Ser Phe His Thr Pro Arg Pro Glu Gly Ser Gly His Leu Thr
85 90 95
Pro Gly Tyr Pro Ser Gly His Thr Ala Arg Ala Phe Trp Leu Ala Leu
100 105 110
Glu Leu Glu Gly Val Trp Arg Tyr Pro Met Leu Thr Tyr Ala Ala Leu
115 120 125
Val Ala Trp Ser Arg Val Gln Leu Cys Ala His Tyr Pro Leu Asp Val
130 135 140
Val Gly Gly Ala Leu Ser Ala Leu Ala Phe Arg Asp Leu Trp Glu Val
145 150 155 160
Leu Leu Glu Arg Val Gly Ala Leu Arg Gly Gln Arg Ala
165 170
<210>169
<211>579
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>169
atgagcattc gcgcagtctt cttcgacctt ggcggagtca tcgtccgcac tgaatatcaa 60
tcaccgcgcc agcagctggc agaccggctt ggcctggact acgatgactt gagcaggatc 120
gtctttgata gcgagacggg catcaaggcg acggttggca cgatcacatc ccagcagcat 180
tgggaagcgg tgatgaaacg cctgaaacgc cctcatgagg aaattaccgc catccgcgat 240
gaattctttg caggcgacat cattgaccgt gagatcatca gtttcctccg ttcactgcgc 300
ggcacctgca aaaccggatt gatctcgaac gcctggagcg acttgcgcga ctttatgaca 360
cgcgaaaaaa taatcgacgc cttcgaccat atcatcatct cgtcggaggt aggtgtggcc 420
aagccggaag cgaagatctt ccagattgcc ctggagcagg ccggggtgag tccgaacgag 480
gcggtgtttg tcgatgattt ttacgtcaat atcgaaggct gtgaaaaagt cggaatgaag 540
ggcattcatt ttaaggaccc cgaatccgct ttggctcaa 579
<210>170
<211>193
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(3)...(187)
<223>卤酸(haloacid)脱卤素酶-样水解酶
<400>170
Met Ser Ile Arg Ala Val Phe Phe Asp Leu Gly Gly Val Ile Val Ara
1 5 10 15
Thr Glu Tyr Gln Ser Pro Arg Gln Gln Leu Ala Asp Arg Leu Gly Leu
20 25 30
Asp Tyr Asp Asp Leu Ser Arg Ile Val Phe Asp Ser Glu Thr Gly Ile
35 40 45
Lys Ala Thr Val Gly Thr Ile Thr Ser Gln Gln His Trp Glu Ala Val
50 55 60
Met Lys Arg Leu Lys Arg Pro His Glu Glu Ile Thr Ala Ile Arg Asp
65 70 75 80
Glu Phe Phe Ala Gly Asp Ile Ile Asp Arg Glu Ile Ile Ser Phe Leu
85 90 95
Arg Ser Leu Arg Gly Thr Cys Lys Thr Gly Leu Ile Ser Asn Ala Trp
100 105 110
Ser Asp Leu Arg Asp Phe Met Thr Arg Glu Lys Ile Ile Asp Ala Phe
115 120 125
Asp His Ile Ile Ile Ser Ser Glu Val Gly Val Ala Lys Pro Glu Ala
130 135 140
Lys Ile Phe Gln Ile Ala Leu Glu Gln Ala Gly Val Ser Pro Asn Glu
145 150 155 160
Ala Val Phe Val Asp Asp Phe Tyr Val Asn Ile Glu Gly Cys Glu Lys
165 170 175
Val Gly Met Lys Gly Ile His Phe Lys Asp Pro Glu Ser Ala Leu Ala
180 185 190
Gln
<210>171
<211>834
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>171
atgggcaaag cgatgttctt cacggcagat gacggggcgc ggctggccta ttctgaccag 60
ggtaaggggc tgccggtcct gtgcctggcc gggctgacgc ggaacatggg cgatttcaat 120
tacgtcgctc cgcatctgtc gggcgtgcgg ctgatccgga tggactatcg cggacgcggg 180
cagtccgacc gcaccggcgc cgccacctat accgtcccgc aggaaggcaa ggatgcgctg 240
gcgctgctgg atcacctggg ggtggacagg gccgcgatcc tgggcacgtc tcgcggcggg 300
ctgatcggga tgctgctggc cgccgtggcg catgaccggc tgctggggct gtgcctgaac 360
gatgtcggcc cggtgatcga gcgcgcgggg ctggagcgga tcttcgacta tgtcgggcgc 420
aacccggcgg cgcggacgca tgaggcgctg gcggaacgac tgcctgcggc catgcccggc 480
ttcacaaatg tccccgatgg ccgttggctg gcggatgcgc agaagcatta cgacgaaacg 540
ccggaggggc tgcggatcaa atatgaccct gccctgcgcg aggcgttcct ggcagccttc 600
gagggcgctg cgccggatct gtggccgctg tgggatgcga ctgcgggact gcccgtcgcg 660
ctgatccggg gggccagttc cgacctgctg tctgctacgg ttgccgccga gatgctgcgc 720
cgccgccccg acacgatctt tgccgaggtt ccgggccgcg cccatgtgcc ttggctggac 780
gagccggaat cgctggatgc gatcaatgcc tggctggatc gctgcgggcg ctag 834
<210>172
<211>277
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<400>172
Met Gly Lys Ala Met Phe Phe Thr Ala Asp Asp Gly Ala Arg Leu Ala
1 5 10 15
Tyr Ser Asp Gln Gly Lys Gly Leu Pro Val Leu Cys Leu Ala Gly Leu
20 25 30
Thr Arg Asn Met Gly Asp Phe Asn Tyr Val Ala Pro His Leu Ser Gly
35 40 45
Val Arg Leu Ile Arg Met Asp Tyr Arg Gly Arg Gly Gln Ser Asp Arg
50 55 60
Thr Gly Ala Ala Thr Tyr Thr Val Pro Gln Glu Gly Lys Asp Ala Leu
65 70 75 80
Ala Leu Leu Asp His Leu Gly Val Asp Arg Ala Ala Ile Leu Gly Thr
85 90 95
Ser Arg Gly Gly Leu Ile Gly Met Leu Leu Ala Ala Val Ala His Asp
100 105 110
Arg Leu Leu Gly Leu Cys Leu Asn Asp Val Gly Pro Val Ile Glu Arg
115 120 125
Ala Gly Leu Glu Arg Ile Phe Asp Tyr Val Gly Arg Asn Pro Ala Ala
130 135 140
Arg Thr His Glu Ala Leu Ala Glu Arg Leu Pro Ala Ala Met Pro Gly
145 150 155 160
Phe Thr Asn Val Pro Asp Gly Arg Trp Leu Ala Asp Ala Gln Lys His
165 170 175
Tyr Asp Glu Thr Pro Glu Gly Leu Arg Ile Lys Tyr Asp Pro Ala Leu
180 185 190
Arg Glu Ala Phe Leu Ala Ala Phe Glu Gly Ala Ala Pro Asp Leu Trp
195 200 205
Pro Leu Trp Asp Ala Thr Ala Gly Leu Pro Val Ala Leu Ile Arg Gly
210 215 220
Ala Ser Ser Asp Leu Leu Ser Ala Thr Val Ala Ala Glu Met Leu Arg
225 230 235 240
Arg Arg Pro Asp Thr Ile Phe Ala Glu Val Pro Gly Arg Ala His Val
245 250 255
Pro Trp Leu Asp Glu Pro Glu Ser Leu Asp Ala Ile Asn Ala Trp Leu
260 265 270
Asp Arg Cys Gly Arg
275
<210>173
<211>642
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
<400>173
gtgagcgggc tggccggggt gctcttcgac atgggtggcg tggtcatgga ctcgccgctg 60
cacgccatcg cgcggtacga gcgggagcgc gggctgccgc cgcactcgat caaccgcgcg 120
atcgcgaccg ccggcgagac gggggcgtgg gcccgactcg agcgcggcga gctgaccgtg 180
gcgacgttct gcgcaccgtt cgaagcggac tgtcgcgccc gcggcgtcga ggtggatggg 240
gcggcggtca tggccgcgat cgccgcggcc ggcgtggcgc gccccgccat gctggaggcg 300
attcgcagac tccgcgcgca cgggctccgc gtcggcgcgc tcaccaacaa ctggcggcga 360
gaaggacccg acgacgacgt gatcccgcac cgtctgcgct cccacttcga cgccttcgtg 420
gaatcacgcg cggtcggcct gcgcaagccc gacccgcgaa tctacgtgct ggcctgccac 480
gagctgggcg tggagccgtc gcggacggcg ttcctcgacg acatcggcgg caacctcaag 540
ccggcgcgcg cgctcgggat ggcgacgatc aaggtggacg acccggagcg ggcgctggtg 600
gagctcggtg tgctcgtgga gatggacctg ctcggcccgt ga 642
<210>174
<211>213
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(4)...(195)
<223>卤酸脱卤素酶样水解酶
<400>174
Met Ser Gly Leu Ala Gly Val Leu Phe Asp Met Gly Gly Val Val Met
1 5 10 15
Asp Ser Pro Leu His Ala Ile Ala Arg Tyr Glu Arg Glu Arg Gly Leu
20 25 30
Pro Pro His Ser Ile Asn Arg Ala Ile Ala Thr Ala Gly Glu Thr Gly
35 40 45
Ala Trp Ala Arg Leu Glu Arg Gly Glu Leu Thr Val Ala Thr Phe Cys
50 55 60
Ala Pro Phe Glu Ala Asp Cys Arg Ala Arg Gly Val Glu Val Asp Gly
65 70 75 80
Ala Ala Val Met Ala Ala Ile Ala Ala Ala Gly Val Ala Arg Pro Ala
85 90 95
Met Leu Glu Ala Ile Arg Arg Leu Arg Ala His Gly Leu Arg Val Gly
100 105 110
Ala Leu Thr Asn Asn Trp Arg Arg Glu Gly Pro Asp Asp Asp Val Ile
115 120 125
Pro His Arg Leu Arg Ser His Phe Asp Ala Phe Val Glu Ser Arg Ala
130 135 140
Val Gly Leu Arg Lys Pro Asp Pro Arg Ile Tyr Val Leu Ala Cys His
145 150 155 160
Glu Leu Gly Val Glu Pro Ser Arg Thr Ala Phe Leu Asp Asp Ile Gly
165 170 175
Gly Asn Leu Lys Pro Ala Arg Ala Leu Gly Met Ala Thr Ile Lys Val
180 185 190
Asp Asp Pro Glu Arg Ala Leu Val Glu Leu Gly Val Leu Val Glu Met
195 200 205
Asp Leu Leu Gly Pro
210
<210>175
<211>245
<212>PRT
<213>未知
<220>
<223>合成的
<400>175
Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile Asn Ser His Leu Trp
1 5 10 15
Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg Asn Thr Thr Ile Val
20 25 30
Asn Pro Asn Glu Thr Ala Leu Leu Ash Glu Trp Arg Ala Asp Leu Glu
35 40 45
Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro Tyr Tyr Asp Asp Ser
50 55 60
Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr Gly Thr Thr Tyr Ile
65 70 75 80
Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala Lys Tyr Phe Asn Leu
85 90 95
Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln Gln Ala Phe Phe Tyr
100 105 110
Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro Met His
115 120 125
Ala Ala Ser Phe Thr Asp Leu Ser Tyr Pro Met Gly Phe His Ser Lys
130 135 140
Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn Tyr Ile Val Ser Asp
145 150 155 160
Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn Pro Glu Asp Trp Ile
165 170 175
Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr Pro Gly Val Val Asn
180 185 190
Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala Val Ser Gln Glu Tyr
195 200 205
Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys Arg Leu
210 215 220
Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile His Leu Trp Phe Asp
225 230 235 240
Thr Tyr Val Asn Arg
245
<210>176
<211>282
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(24)
<223>合成的
<400>176
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
1 5 10 15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
20 25 30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile
35 40 45
Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
50 55 60
Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65 70 75 80
Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
85 90 95
Tyr Tyr Asp Asp Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
100 105 110
Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala
115 120 125
Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln
130 135 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145 150 155 160
Asn Gln Pro Met His Ala Ala Ser Phe Thr Asp Leu Ser Tyr Pro Met
165 170 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
180 185 190
Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn
195 200 205
Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
210 215 220
Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225 230 235 240
Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
245 250 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
260 265 270
His Leu Trp Phe Asp Thr Tyr Val Asn Arg
275 280