CN101426918B - 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法 - Google Patents

磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法 Download PDF

Info

Publication number
CN101426918B
CN101426918B CN2005800146676A CN200580014667A CN101426918B CN 101426918 B CN101426918 B CN 101426918B CN 2005800146676 A CN2005800146676 A CN 2005800146676A CN 200580014667 A CN200580014667 A CN 200580014667A CN 101426918 B CN101426918 B CN 101426918B
Authority
CN
China
Prior art keywords
seq
polypeptide
sequence
nucleic acid
oil
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005800146676A
Other languages
English (en)
Other versions
CN101426918A (zh
Inventor
S·格拉马蒂科瓦
G·黑兹尔伍德
D·拉姆
N·R·巴顿
B·G·斯特吉斯
D·E·罗伯逊
J·李
J·A·克雷泼斯
R·菲尔丁
R·C·布朗
A·瓦萨瓦达
X·谭
A·巴迪洛
W·P·范赫克
G·詹森
C·艾萨克
M·J·伯克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dsm Food Professional Co ltd
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN101426918A publication Critical patent/CN101426918A/zh
Application granted granted Critical
Publication of CN101426918B publication Critical patent/CN101426918B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/06Antihyperlipidemics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • C12N9/20Triglyceride splitting, e.g. by means of lipase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6418Fatty acids by hydrolysis of fatty acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • C12P7/6458Glycerides by transesterification, e.g. interesterification, ester interchange, alcoholysis or acidolysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • C12P7/6481Phosphoglycerides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Nutrition Science (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Hematology (AREA)
  • Diabetes (AREA)
  • Obesity (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Detergent Compositions (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了具有磷脂酶活性的新型多肽,编码它们的核酸和与它们结合的抗体,所述磷脂酶活性包括,例如,磷脂酶A、B、C和D活性,马铃薯块茎蛋白活性,磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)活性。也提供包括应用这些磷脂酶的工业方法,如,油脱胶,以及包括应用这些磷脂酶的产品。

Description

磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
发明领域
总体上说,本发明涉及磷脂酶,编码磷脂酶的多核苷酸,制备以及使用这些多核苷酸和多肽的方法。特别地,本发明提供了具有磷脂酶活性的新颖多肽,编码它们的核酸以及与它们结合的抗体。也提供了包括应用这些磷脂酶的工业方法和产品。 
背景技术
磷脂酶是水解磷脂中的酯键的酶。与它们在磷脂代谢中的重要性相对应的是,这些酶广泛存在于真核和原核细胞中。磷脂酶影响生物膜的代谢、形成和再组织,并且磷脂酶也参与信号的级联作用。已经知道了几种类型的磷脂酶,按照磷脂分子中受到攻击的键的位置,它们在特异性上有所不同。磷脂酶A1(PLA1)除去1-位的脂肪酸,产生游离的脂肪酸和1-溶血-2-酰基磷脂(1-lyso-2-acylphospholipid)。磷脂酶A2(PLA2)去除2-位的脂肪酸,产生游离的脂肪酸和1-酰基-2-溶血磷脂(1-acyl-2-lysophospholipid)。PLA1和PLA2酶可以是胞内酶或胞外酶,是膜结合的酶或者可溶性酶。发现胞内的PLA2存在于几乎所有的哺乳动物细胞中。磷脂酶C(PLC)去除磷酸部分,产生1,2二酰基甘油和磷酸酯。磷脂酶D(PLD)产生1,2-二酰基甘油磷酸和碱性基团(base group)。PLC和PLD对于细胞功能和信号传导是重要的。PLD是生物催化中主要的磷脂酶(参见,如,Godfrey,T.and West S.(1996)Industrial enzymology,299-300,Stockton Press,New York)。马铃薯块茎储藏蛋白(Patatins)是另一类磷脂酶,据认为其作用如同PLA(参见例如,HirschbergHJ,etal.,(2001),Eur J Biochem 268(19):5037-44)。 
常见的含油种子,如大豆、油菜籽、向日葵籽、米糠油、芝麻和花生被用作油的来源和原料。在榨油过程中,种子用机械和热处理。用溶剂从粗粉(meal)中分离和分开油。然后应用蒸馏法,从油中分离出溶剂并回收。油经过“脱胶(degummed)”并且进行精炼。粗粉中的溶剂组分可以通过“脱溶剂烤炉(desolventizer toaster)”的热处理而蒸发掉,随后,粗粉干燥和冷却。当溶剂通过蒸馏分离掉以后,产生的粗油经过特殊的脱胶程序和物理精炼的方法加工成为食用油。它也可以作为原料用于产生脂肪酸和甲基酯。粗粉可以用做动物饲料(animal rations)。 
脱胶是植物油精炼的第一步,脱胶的目的是去除与油一起被抽提、但干扰随后的油加工工艺的污染磷脂。这些磷脂仅仅溶于无水形式的植物油中,如果通过简单的水合作用,磷脂可以沉淀并去除。水合作用一般通过少量的水与充分干燥的 油连续混合来完成。典型地,水的量是磷脂含量的75%,磷脂的量典型地是1到1.5%。虽然在50℃到80℃的范围内,油的粘度会降低,水合胶的分离效果更好,但是温度条件并不非常严格。 
很多油脱胶(oil degumming)的方法目前都在使用。油脱胶的过程可以通过使用磷脂酶协助进行。磷脂酶A1和A2已经应用于各种商业过程中的油脱胶作用上,如“ENZYMAXTM脱胶”(Lurgi Life Science Technologies GmbH,Germany)。也已经考虑将磷脂酶C(PLC)应用于油的脱胶作用,因为磷脂酶C在磷脂上作用产生的磷酸盐部分是极易溶于水的,并且容易去除,而且甘油二酯与油在一起,降低了损失;参见,如Godfrey,T.and West S.(1996)Industrial Enzymology pp.299-300,Stockton Press,New York;Dahlke(1998)“An enzymatic process for the physicalrefining of seed oils,”Chem.Eng.Technol.21:278-281;Clausen(2001)“Enzymatic oildegumming by a novel microbial phospholipase,”Eur.J.Lipid Sci.Technol.103:333-340。 
高磷脂油(high phosphatide oils),例如黄豆、油菜和向日葵油的处理方法不同于别的油如棕榈的处理方法。不像低磷脂油的蒸或“物理精炼”处理,这些高磷油需要特别的化学和机械处理,以去除含磷的磷脂。这些油一般通过化学的方式精炼,在化学精炼过程必需中和游离脂肪酸,以形成皂和不溶性的胶成分。中和过程对于去除游离脂肪酸和磷脂非常有效,但是该过程也导致产率和质量显著降低。在一些情况下,高磷脂的粗制油在碱中和之前的步骤中进行脱胶。用于卵磷脂的大豆油就是这种情况,其中的油首先用水或者酸来脱胶。 
植物固醇(phytosterols)(植物甾醇(plant sterols))是天然产物三萜家族的成员,其包括100种以上不同的植物固醇和4000种以上其它种类的三萜。一般而言,据认为,植物甾醇是由于增加甾醇/磷脂配给导致膜硬化,从而稳定植物膜。在化学角度上,植物甾醇在结构上非常类似于胆固醇,并被认为调节植物膜的膜流动性,如胆固醇在动物膜所做的那样。主要的植物甾醇是β-谷甾醇、菜油甾醇和豆甾醇。其它的植物甾醇包括豆甾烯醇(二氢β-谷甾醇)、二氢谷甾醇、24-脱氢胆固醇、二氢菜油甾醇、chalinasterol、多孔甾醇、γ-谷甾醇和菜籽甾醇。 
植物甾醇是健康和营养行业中的重要的农产品。它们是用于制造化妆品的有用乳化剂并且为激素药物的生产提供大多数甾体中间体和前体。植物甾醇的饱和类似物以及它们的酯已经被认为是益于心血管健康的有效的降低胆固醇的试剂。植物甾醇通过在肠腔中抑制胆固醇的吸收来降低血清中的胆固醇水平,并且植物甾醇在极低的浓度时便具有免疫调节特性,包括T淋巴细胞的增强的细胞应答和抗癌症细胞系的天然杀伤细胞的细胞毒性能力。此外,它们的治疗效应在治疗肺结核、风湿性关节炎、控制HIV感染的病人和抑制马拉松选手的免疫压力的临床研究中已经得到证明。 
植物甾醇的酯类,也指植物甾醇酯,由美国食品药品管理局(FDA)批准为GRAS(一般认为安全,Generally Recognized As Safe),用于人造黄油,并在1999年得到推广。2000年9月,FDA也提出一个试行规定,该规定准许了含有植物甾醇酯类的食品使用健康声明标记(health-claiming labeling)。因此,用植物甾醇酯类强化的食品非常有望受到消费者的青睐。 
大豆油被广泛使用,是重要的粮食,占来自种子和水果的油产量的约30%。大豆仅含有20%的油,在商业规模上通常通过使用溶剂诸如己烷来提取。其油公认的质量和粗粉蛋白的营养价值使得大豆成为首要的含油种子。在提取之前,大豆必需清洗,破碎并去皮,这是因为对油来说有效的溶剂提取需要破碎每一个油细胞以提高物质转移水平。细胞壁主要由纤维素——其与半纤维素相关、果胶物质和木质素组成,细胞壁也可以用酶破碎,以显著提高提取产量和速度。 
二酰甘油(DAG)油是食用油,相对天然脂肪酸含有80%或更多的DAG。已经显示,在人中,消化DAG油乳剂之后,相比具有类似的脂肪酸组成的TAG油,餐后乳糜微粒中的甘油三脂的升高水平明显较低。在以日本男子和美国男子和女子为对象的研究中,长期食用DAG油促进体重减轻和身体脂肪减少。一项研究显示用DAG油取代普通的烹饪油降低肥胖和其他危险因素的发生率。 
发明概述 
本发明提供包括与本发明的示例性序列例如SEQ ID NO:1、SEQ ID NO:3、SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ IDNO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ IDNO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ IDNO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ IDNO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ IDNO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ IDNO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ IDNO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ IDNO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ IDNO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ IDNO:199、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、 SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2200、2250、2300、2350、2400、2450、2500或者更多个的残基范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶(PL)活性的至少一个多肽,所述磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。在一个方面,所述序列同一性用序列比较算法分析或者目测检查来确定。 
发明提供包括与SEQ ID NO:1在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或更多连续的残基范围内具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶活性(PL)的至少一种多肽,所述磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性-作为多功能活性。在一个方面,所述序列同一性用序列比较算法分析或者通过目测检查来确定。 
发明提供包括与SEQ ID NO:3在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或更多个的残基范围内具有至少78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶活性(PL)的至少一种多肽,所述磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性-作为多功能活性。在一个方面,所述序列同一性用序列比较算法分析或者通过目测检查来确定。 
发明提供包括与SEQ ID NO:5在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或更多个的残基范围内具有至少78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶活性 
(PL)的至少一种多肽,所述磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性-作为多功能活性。在一个方面,所述序列同一性用序列比较算法分析或者通过目测检查来确定。 
发明提供包括与SEQ ID NO:7在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或更多个的残基范围内具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶活性(PL)的至少一种多肽,所述磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性-作为多功能活性。在一个方面,所述序列同一性用序列比较算法分析或者通过目测检查来确定。 
在可选择的方面,分离的或者重组的核酸编码包含在SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ IDNO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ IDNO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138;SEQ ID NO:140;SEQID NO:142;SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ IDNO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ IDNO:170、SEQ ID NO:172或SEQ ID NO:174中阐明序列的多肽。在一个方面,这 些多肽具有磷脂酶,例如磷脂酶A、B、C或D的活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性-作为多功能活性。 
在一方面,序列比较算法是BLAST算法,如BLAST 2.2.2版算法。一方面,筛选设置(filtering setting)设为blastall-p,blastp-d“nr pataa”-F F,所有其它可选项(options)设为默认值。 
在一个方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽(oilseed)的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性;或马铃薯块茎蛋白(patatin)活性,或其组合。磷脂酶活性可以包括水解糖蛋白,例如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。在一个方面,本发明的磷脂酶可以具有多功能的活性,例如本文中描述的一种或多种酶活性的组合,例如本发明的磷脂酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB和patatin活性;PLC和patatin活性;PLD和PLA;PLD、PLA、PLB和PLC活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或其任意组合。 
例如,在一个方面,本发明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影响中性油(甘油三酯)部分的任何酶活性。在特定的工艺中使用这种多肽可能是有利的,例如在脱胶工艺中,中性油部分不受损(减少,例如水解)是重要的。因此,在一个方面,本发明提供了脱胶工艺,该工艺包括使用本发明的具有磷脂酶活性但不具有脂酶活性的多肽。 
在一个方面,分离的或重组的核酸编码具有磷脂酶活性的多肽,其是热稳定性的。该多肽在一定的条件下,能够保持磷脂酶活性,这些条件包括20℃至约30℃之间、约25℃至约40C℃之间、约37℃至约95℃之间、约55℃至约85C℃之间、约70℃至约95℃之间或约90℃至约95℃之间。在另一方面,分离的或重组的核酸编码具有磷脂酶活性的多肽,其是耐热性的。在暴露于37℃以上至约95℃范围内的温度、或55℃以上至约85℃范围内的任何温度后,该多肽能够保持磷脂酶活性。在一个方面,在pH 4.5,暴露于90℃以上至约95℃范围内的温度后,该多肽保持磷脂酶活性。 
多肽在包括大约pH 8、pH 7.5、pH 7、pH 6.5、pH 6.0、pH 5.5、pH 5或者pH4.5的条件下可以保持磷脂酶的活性。多肽可以在包括温度范围为大约40℃至大约70℃的条件下保持磷脂酶活性。 
一方面,分离的或者重组的核酸包含在严格条件下与在SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ IDNO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ IDNO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ IDNO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ IDNO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173中阐明的序列杂交的序列,其中该核酸编码具有磷脂酶活性的多肽。如此处所述,核酸在长度上可以是基因或者转录物的至少大约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850个或更多残基或者是基因或者转录物的全长,具有或者不具有信号序列。如此处所述,严格条件可以是高度严格,中度严格或者低严格性。严格条件可以包括洗涤步骤,如,包括在0.2×SSC,大约65℃条件下洗涤大约15分钟的洗涤步骤。[24]发明提供用于鉴定编码具有磷脂酶,例如磷脂酶活性的多肽的核酸的核酸探针,其中该探针包括本发明的序列,例如在SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、或者SEQ ID NO:7中阐明的序列的至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850个或者更多的连续碱基,该探针通过结合或者杂交鉴定该核酸。该探针可以包括在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5和/或SEQ ID NO:7中阐明的序列的至少大约10到50、大约20到60、大约30到70、大约40到80或者大约60到100个连续碱基的寡核苷酸。 
本发明提供了用于鉴定编码具有磷脂酶,如磷脂酶活性多肽的核酸的核酸探针,其中该探针包括本发明的核酸,例如在至少大约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或者更多连续残基的范围内,与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、和/或SEQ ID NO:7或者它们的子序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)的序列同一性的核酸,并且在一个方面,序列同一性通过序列比较算法分析或者目测检查确定。 
本发明提供用于扩增编码具有磷脂酶活性多肽的核酸的扩增引物序列对,其中该引物对能够扩增包括本发明的序列或者片段或者其子序列的核酸序列。扩增引物序列对的一个成员或每一个成员可以包括含有至少大约10到50个该序列连续碱基,或者大约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或者25个该序列连续碱基的寡聚核苷酸。 
本发明提供扩增引物对,其中该引物对包括第一成员和第二成员,其中第一成员具有本发明核酸的大约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24、或者25个残基所阐明的序列,第二成员具有第一成员互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基所阐明的序列。 
本发明提供了通过扩增产生的磷脂酶,例如使用本发明的扩增引物对的,聚合酶链式反应(PCR)。本发明提供了通过扩增制备磷脂酶的方法,例如应用发明的扩增引物对的聚合酶链式反应(PCR)。一方面,扩增引物对扩增来自文库的核酸,例如基因文库,如环境文库。 
本发明提供了扩增编码具有磷脂酶活性多肽的核酸的方法,包括用能够扩增本发明核酸序列或者片段或者其子序列的扩增引物序列对来扩增模板核酸序列。该扩增引物对可以是本发明的扩增引物对。 
本发明提供包括本发明的核酸或者其子序列的表达盒(expression cassettes)。一方面,表达盒可以包括可操作性地连接于启动子的核酸。启动子可以是病毒的,细菌的,哺乳动物的或者植物启动子。一方面,植物启动子可以是马铃薯,水稻,玉米,小麦,烟草或者大麦启动子。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面,启动子可以是诱导型启动子。一方面,启动子可以是组织特异性启动子或者环境调控或者发育调控启动子。因此,启动子可以是,例如种子特异性,叶特异性,根特异性,茎特异性或者脱落诱导启动子。一方面,表达盒可以进一步包括植物表达载体或者植物病毒表达载体。 
本发明提供包括本发明的表达盒(如载体)或者本发明的核酸的克隆载体。克隆载体可以是病毒载体、质粒、噬菌体、噬菌粒(phagemid)、粘粒、F粘粒(fosmid)、细菌噬菌体或者人工染色体。病毒载体可以包括腺病毒载体,逆转录病毒载体或者腺相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)、或者哺乳动物人工染色体(MAC)。 
本发明提供含有本发明核酸或者本发明表达盒(如,载体)或者本发明克隆载体的转化细胞。一方面,转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或者植物细胞。一方面,植物细胞可以是马铃薯、小麦、水稻、玉米、烟草或者大麦细胞。 
本发明提供包括本发明的核酸或者本发明的表达盒(如,载体)的转基因非-人类动物。在一方面,动物是小鼠、大鼠、牛、羊或其它哺乳动物。 
本发明提供包括本发明的核酸或者本发明的表达盒(如,载体)的转基因植物。转基因植物可以是玉米植物、马铃薯植物、番茄植物、小麦植物、油籽植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。本发明提供包括本发明的核酸或本发明的表达盒(例如,载体)的转基因种子。转基因种子可以是玉米种子、小麦种子、油籽、油菜籽(油菜植物)、大豆种子、棕榈仁、向日葵种子、芝麻种子、花生、水稻或烟草植物种子。 
本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。 
本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。反义寡聚核苷酸的长度可以是大约10到50、大约20到60、大约30到70、大约40到80、大约60到100、大约70到110或者大约80到120个碱基。 
本发明提供抑制磷脂酶如细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供包括本发明序列的子序列的双链抑制性RNA(RNAi)分子。在一方面,RNAi长度是大约15,16,17,18,19,20,21,22,23,24,25或者更多的双链核苷酸。本发明提供抑制磷脂酶如细胞内磷脂酶表达的方法,该方法包括向细胞施用或者在细胞中表达双链抑制性RNA(RNAi),其中该抑制性RNA包括本发明序列的子序列。 
本发明提供了分离的或重组的多肽,该多肽包含与本发明示例性的多肽或肽(例如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO.68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO.88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ IDNO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120或SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ IDNO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQ IDNO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172或SEQ ID NO:174)在多肽的至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、175、200、225、250、275、300、325、350、400、450、500、550或600或更多残基,或多肽的全长范围内,具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,或更大,或完全(100%)的序列同一性的氨基酸序列;并且,在一个方面,序列同一性通过序列比较算法分析或者通过目测观察来确定。 
在一个方面,本发明提供包括与SEQ ID NO:2具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。在一个方面,本发明提供包括与SEQ ID NO:4具有至少78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。在一个方面,本发明提供包括与SEQ ID NO:6具有至少78%、79%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。在一个方面,发明提供包括与SEQ IDNO:8具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。 
本发明提供由本发明的核酸编码的分离的或者重组的多肽。在可选择的方面,多肽可以具有如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ IDNO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ IDNO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ IDNO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ IDNO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ IDNO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ IDNO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ IDNO:100、SEQ ID NO:102、SEQ IDNO:104、SEQ IDNO:106、SEQ IDNO:108、SEQID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ IDNO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ IDNO:164、SEQ IDNO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172或SEQ ID NO:174中阐明的序列。多肽可以具有磷脂酶活性,如磷脂酶A,B,C或者D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性—作为多功能活性。例如,在一个方面,本发明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影响中性油(甘油三酯)部分的任何酶活性。在一个方面,本发明提供了脱胶工艺,该工艺包括使用具有磷脂酶活性但不具有脂酶活性的本发明的多肽,这样在脱胶工艺中,任何中性油部分不受损害(减少、改变、降解,例如水解)。 
本发明提供了含有缺乏信号序列的本发明的多肽的分离的或者重组的多肽,在一个方面,缺乏信号肽的多肽具有与SEQ ID NO:2的残基30到287有至少81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多序列同一性;与SEQ ID NO:4的残基25到283有至少78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多序列同一性的氨基酸序列;与SEQ ID NO:6的残基26到280有至少78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多序列同一性的氨基酸序列;或与SEQ ID NO:8的残基40到330有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多的序列同一性的氨基酸序列。序列同一性通过序列比较算法分析或者通过目测观察确定。 
本发明的另一方面提供分离的或者重组的多肽或者肽,该分离的或者重组的多肽或者肽包括本发明的多肽或肽序列、与之基本相同的序列,和与之互补的序列的至少10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95或者100或者更多的连续碱基。该肽可以是,例如,免疫源性的片段、基序(如,结合位点)或者活性位点。 
在一个方面,本发明分离的或重组的多肽(有或无信号序列)具有磷脂酶活性。在一个方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性,或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性;或patatin活性,或其组合。例如,在一个方面,磷脂酶活性包括本文中描述的一种或多种酶活性的组合,例如磷脂酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB和patatin活性;PLC和patatin活性;PLD和PLA;PLD、PLA、PLB和PLC活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或其任意组合。 
磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。 
在一个方面,磷脂酶活性是热稳定性的。多肽可以在包括温度范围在大约20℃到大约30℃之间、大约25℃到大约40℃之间、大约37℃到大约95℃之间、大约55℃到大约85℃之间、大约70℃到大约95℃之间、或者大约90℃到大约95℃之间的条件下保持磷脂酶活性。在一个方面,磷脂酶活性可以是耐热的。多肽可以在暴露于温度范围37℃以上到大约95℃、或者在55℃以上到大约85℃后仍保持磷脂酶活性。在一个方面,多肽可以在pH4.5下,暴露于温度范围在90℃以上到大约95℃后仍保持磷脂酶活性。 
在一个方面,多肽可以在包括大约pH 6.5,pH 6,pH 5.5,pH 5,pH 4.5或者pH 4或pH更小(酸性更大)的条件下保持磷脂酶活性。在一个方面,多肽可以在包括大约pH 7,pH 7.5,pH 8.0,pH 8.5,pH 9,pH9.5,pH 10,pH 10.5,或pH11pH更大(碱性更大)的条件下保持磷脂酶活性。 
在一个方面,分离的或者重组的多肽可以包括本发明的多肽,其缺乏信号序列。在一个方面,分离的或者重组的多肽可以包括含有异源信号序列,如异源磷脂酶或者非-磷脂酶信号序列的本发明多肽。 
本发明提供分离的或者重组的肽,该肽含有与SEQ ID NO:2的1到29残基有至少95%、96%、97%、98%、99%、或者更多序列同一性的,与SEQ ID NO:4的1到24残基有至少95%、96%、97%、98%、99%、或者更多序列同一性的,与SEQ ID NO:6的1到25残基有至少95%、96%、97%、98%、99%、或者更多序列同一性的,或与SEQ ID NO:8的1到39残基,以及SEQ ID表中阐明的其他信号序列有至少95%、96%、97%、98%、99%、或者更多序列同一性的氨基酸序列,其中序列同一性通过序列比较算法分析或者通过目测观察来确定。这些肽可以作为内源性磷脂酶或者其它磷脂酶,或者异源蛋白(非磷脂酶或者其它蛋白)的信号肽序列。在一个方面,本发明提供包括第一结构域和至少第二结构域的嵌合蛋白,第一结构域包括本发明的信号序列。该蛋白可以是融合蛋白。第二结构域可以包括酶。酶可以是磷脂酶。 
本发明提供包括至少第一结构域和至少第二结构域的嵌合多肽,第一结构域包括发明的信号肽(SP)或本发明磷脂酶的催化结构域(CD),或活性位点,第二结构域包括异源多肽或肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。在一个方面,异源多肽或者肽不是磷脂酶。异源多肽或者肽可以在信号肽(SP)或者催化结构域(CD)的氨基末端,羧基末端或者羧基和氨基末端。 
本发明提供编码嵌合多肽的分离的或者重组的核酸,其中嵌合多肽包括至少第一结构域和至少第二结构域,第一结构域含有本发明多肽的信号肽(SP)或者催化结构域(CD)或者活性位点,第二结构域包括异源多肽或者肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。 
在一个方面,磷脂酶活性包括在大约37℃下,每毫克蛋白大约10到大约100单位范围的比活性。在另一方面,磷脂酶活性包括每毫克蛋白大约100到大约1000单位,大约500到大约750单位范围的比活性。可选择地,磷脂酶活性包括在37℃下每毫克蛋白大约100到大约500单位的比活性。在一方面,磷脂酶活性包括在37℃下每毫克蛋白大约500到大约1200单位的比活性。在另一方面,磷脂酶活性包括在37℃下每毫克蛋白大约750到大约1000单位的比活性。在另一方面,耐热性包含在加热至升高的温度以后,保持在37℃下的磷脂酶至少一半的比活性。可选择的,耐热性包含在加热至升高的温度以后,保持在37℃下每毫克蛋白大约500到大约1200单位的比活性。 
本发明提供本发明分离的或者重组的多肽,其中多肽包括至少一个糖基化位点。一方面,糖基化可以是N-连接糖基化。一方面,多肽可以是在巴斯德毕赤酵母(P.pastoris)或者粟酒裂殖酵母(S.pombe)中表达后进行糖基化。 
本发明提供了磷脂酶和编码它们的核酸,该磷脂酶具有本发明任何示例性磷脂酶的序列,其中一个或多个或所有糖基化位点被改变,如上所述。因此,本发明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方法,其中该方法包括修饰本发明的磷脂酶编码序列,这样,一个、若干个或所有N-连接的糖基化位点编码基序被修改为非糖基化基序。本发明也提供了由该方法制得的磷脂酶编码序列,和它们编码的酶。 
本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有增加的耐受性的磷脂酶,该方法包括将等同于SEQ ID NO:2的位置131上的氨基酸修改成一个、若干个或所有下述残基:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);蛋氨酸(M);亮氨酸(L),包括具有这些示例性修改的SEQ ID NO:2的变体(和编码它们的核酸)。本发明也提供由该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。 
本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有减少的耐受性的磷脂酶,该方法包括将等同于SEQ ID NO:2的位置131上的氨基酸修改成一个、若干个或所有下述残基:色氨酸(W);谷氨酸(E);酪氨酸(Y),包括具有这些示例性修改的SEQ ID NO:2的变体(和编码它们的核酸)。本发明也提供由该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。 
本发明提供包括本发明多肽的蛋白制备物,其中蛋白制备物包括液体,固体或者凝胶制备物。 
本发明提供包括本发明多肽和第二种蛋白或者结构域的异源二聚物。异源二聚物的第二个成员可以是不同的磷脂酶,不同的酶或者另一种蛋白。在一方面,第二个结构域可以是多肽,且异源二聚物可以是融合蛋白。在一方面,第二个结构 域可以是表位(抗原决定簇)或者标记。在一方面,本发明提供包括本发明多肽的同源二聚物。 
本发明提供具有磷脂酶活性的固定化多肽,其中多肽包含本发明的多肽,本发明核酸编码的多肽,或者包括本发明多肽和第二个结构域的多肽(例如融合蛋白)。在一方面,本发明多肽是固定在细胞、细胞小泡、脂质体、膜(film)、膜(membrane)、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、晶体、片剂、丸、胶囊、粉末、附聚物、表面、多孔结构、阵列或者毛细管上。在一个方面,本发明的多肽固定在物质诸如谷物、果壳、树皮、皮、毛、釉质、骨、壳和由它们衍生而成的物质,或动物饲料,或其组合上。 
本发明的多肽(例如磷脂酶)也可以单独存在或以磷脂酶混合物或磷脂酶与其他水解酶混合物的形式存在,其他水解酶诸如纤维素酶、木聚糖酶、蛋白酶、脂酶、淀粉酶、或氧化还原酶如漆酶、过氧化物酶、过氧化氢酶、氧化酶或还原酶。它们可以配制成固体形式如粉末、冻干制剂、颗粒、片剂、条、晶体、胶囊、丸、小球,或液体形式如水溶液、气溶胶、凝胶、糊、浆、水/油乳状液、乳剂、及胶囊、小泡或胶束的悬浮液。在一个方面,本发明的这些制剂可以包括任何下述组分或它们的组合:多元醇如聚乙二醇、聚乙烯醇、丙三醇,糖类如蔗糖、山梨醇、海藻糖、葡萄糖、果糖、麦芽糖;胶凝剂如瓜尔树胶、鹿角菜胶、藻酸盐、葡聚糖、纤维素衍生物、果胶;盐如氯化钠、硫酸钠、硫酸铵、氯化钙、氯化镁、氯化锌、硫酸锌、脂肪酸及其衍生物的盐;金属螯合剂如EDTA、EGTA、柠檬酸钠;抗微生物剂如脂肪酸、其衍生物、对羟基苯甲酸酯、山梨酸酯、甲苯酸盐;阻碍蛋白酶作用的其它化合物如大体积蛋白质(bulk protein),诸如BSA、小麦水解产物、硼酸盐化合物;乳化剂如非离子型和离子型洗涤剂可以单独或组合使用;植物甾醇;维生素;氨基酸;可以包括还原剂如半胱氨酸或抗氧化化合物如抗坏血酸以及分散剂。 
在一个方面,交联和蛋白质修饰作用如聚乙二醇化、脂肪酸修饰和糖基化被用于提高本发明多肽的稳定性(例如酶稳定性)。在一个方面,多元醇和/或糖构成制剂的约5%至约60%,或更多,制剂的约10%至约50%、制剂的约20%至约40%、或制剂的约5%至约20%。在另一方面,胶凝剂构成制剂的约0.5%至约10%、制剂的约1%至约8%、制剂的约2%至约5%、或制剂的约0.5%至约3%。在另一方面,盐如氯化钠、硫酸钠、硫酸铵、氯化钙和/或氯化镁构成制剂的约1%至约30%、制剂的约2%至约20%、制剂的约5%至约15%、或制剂的约1%至约10%。在另一方面,氯化锌以约0.1mM至约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂中。又在另一个方面,硫酸锌以约0.1mM至约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂中。在另一个方面,脂肪酸和/或其衍生物的盐构成制剂的约5%至约40%、制剂的约10%至约30%、制剂的约15%至约25%、 或制剂的约5%至约20%。在另一方面,金属螯合剂如EDTA、EGTA和/或柠檬酸钠以约0.1mM至约10mM、约0.5mM至约8mM、约1mM至约5mM或约0.1mM至约1mM的浓度存在于制剂中。在另一方面,抗微生物剂如对羟基苯甲酸酯类、山梨酸酯和/或甲苯酸盐构成制剂的约0.01%至约10%、制剂的约0.05%至约5%、制剂的约0.1%至约1%、或制剂的约0.05%至约0.5%。又在另一个方面,大量蛋白质如BSA和/或小麦水解产物构成制剂的约1%至约20%、制剂的约5%至约15%、制剂的约2.5%至约7.5%、或制剂的约1%至约5%。在另一方面,乳化剂如非离子型和/或离子型洗涤剂以一定浓度存在于制剂中,该浓度包括约1×临界胶束浓度(CMC)至约10×CMC,约2.5×CMC至约7.5×CMC,约1×CMC至约5×CMC,或约3×至约6×CMC。在另一个方面,维生素、氨基酸、还原剂和/或抗氧化化合物构成制剂的约0.1%至约5%、制剂的约0.5%至约4%、制剂的约1%至约2.5%、制剂的约0.1%至约1%。 
本发明提供包含固定化多肽的阵列,其中多肽是本发明的磷脂酶或者本发明核酸编码的多肽。本发明提供含有本发明的固定化核酸的阵列。本发明提供含有本发明的固定化抗体的阵列。 
本发明提供特异性地结合于本发明多肽或者本发明的核酸编码的多肽的分离的或者重组的抗体。抗体可以是单克隆抗体或者多克隆抗体。本发明提供含有本发明抗体的杂交瘤。 
本发明提供分离和鉴定具有磷脂酶活性的多肽的方法,包括以下步骤:(a)提供本发明的抗体;(b)提供含有多肽的样品;以及(c)在抗体能够特异性地结合于该多肽的条件下,将步骤(b)的样品与步骤(a)的抗体接触,从而分离和鉴定磷脂酶。本发明提供制备抗-磷脂酶抗体的方法,包括向非人类动物施用足以产生体液免疫应答的量的本发明核酸或者本发明多肽,从而制备抗磷脂酶抗体。 
本发明提供生产重组多肽的方法,包含以下的步骤:(a)提供可操作地连接于启动子的本发明的核酸,以及(b)在允许多肽表达的条件下表达步骤(a)的核酸,从而生产重组多肽。该核酸可以包括与SEQ ID NO:1序列在至少大约100个残基的范围内,具有至少85%的序列同一性的序列,与SEQ ID NO:3的序列在至少大约100个残基的范围内,具有至少80%的序列同一性的序列,与SEQ IDNO:5序列在至少大约100个残基的范围内,具有至少80%的序列同一性的序列,或者与SEQ ID NO:7序列在至少大约100个残基的范围内,具有至少70%的序列同一性的序列,其中序列同一性通过序列比较算法分析或者目测观察来确定。核酸可以包括在严格的条件下与SEQ ID NO:1所阐述的核酸或者其子序列,与SEQID NO:3所阐述的核酸或者其子序列,与SEQ ID NO:5所阐述的核酸或者其子序列,与SEQ ID NO:7所阐述的核酸或者其子序列杂交的核酸。该方法可以进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的核酸,从而在转化细 胞中生产重组多肽。该方法可以进一步包括把步骤(a)的核酸插入到非人类动物宿主中,随后表达步骤(a)的核酸,从而在非人动物宿主中生产重组多肽。 
本发明提供鉴定具有磷脂酶活性的多肽的方法,包括以下的步骤:(a)提供本发明的多肽或由本发明核酸编码的多肽,或其片段或变异体,(b)提供磷脂酶底物;和(c)将步骤(a)的多肽或其片段或变异体与步骤(b)的底物接触,并检测底物量的增加或者产物量的减少,其中底物量的减少或者产物量的增加说明检测到了具有磷脂酶活性的多肽。在可选择的方面,核酸包括与SEQ ID NO:1在至少大约100个残基的范围内具有至少85%的序列同一性的序列,与SEQ ID NO:3在至少大约100个残基的范围内具有至少80%的序列同一性的序列,与SEQ IDNO:5在至少大约100个残基的范围内具有至少80%的序列同一性的序列,或者与SEQ ID NO:7在至少大约100个残基的范围内具有至少70%的序列同一性的序列,其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选择的方面,核酸可以在严格的条件下与SEQ ID NO:1所阐述的核酸或者其子序列,与SEQ IDNO:3所阐述的核酸或者其子序列,与SEQ ID NO:5所阐述的核酸或者其子序列,与SEQ ID NO:7所阐述的核酸或者其子序列杂交。 
本发明提供确定磷脂酶底物的方法,包括以下步骤:(a)提供本发明的多肽或者本发明核酸编码的多肽;(b)提供测试底物;以及(c)将步骤(a)的多肽与步骤(b)的测试底物接触,检测底物量的增加或者产物量的减少,其中底物量的减少或者产物量的增加确定测试底物为磷脂酶底物。在可选择的方面,核酸可以与SEQ ID NO:1在至少大约100个残基的范围内具有至少85%的序列同一性,与SEQ ID NO:3在至少大约100个残基的范围内具有至少80%的序列同一性,与SEQID NO:5在至少大约100个残基的范围内具有至少80%的序列同一性,或者与SEQID NO:7在至少大约100个残基的范围内具有至少70%的序列同一性,其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选择的方面,核酸在严格的条件下与SEQ ID NO:1所阐述的核酸或者其子序列,SEQ ID NO:3所阐述的核酸或者其子序列,SEQ ID NO:5所阐述的核酸或者其子序列,SEQ ID NO:7所阐述的核酸或者其子序列杂交。 
本发明提供确定化合物是否特异性地结合于磷脂酶的方法,包括以下步骤:(a)在允许核酸翻译成多肽的条件下,表达核酸或者包含该核酸的载体,其中该核酸和载体包括本发明的核酸或者载体;或者,提供本发明的多肽,(b)使多肽与测试化合物接触;和(c)确定测试化合物是否特异性地结合于多肽,从而确定该化合物是否特异地结合于磷脂酶。在可选择的方面,核酸序列与SEQ ID NO:1在至少大约100个残基的范围内,具有至少85%的序列同一性,与SEQ ID NO:3在至少大约100个残基的范围内,具有至少80%的序列同一性,与SEQ ID NO:5在至少大约100个残基的范围内,具有至少80%的序列同一性,或者与SEQ IDNO:7在至少大约100个残基的范围内,具有至少70%的序列同一性,其中序列同 一性通过序列比较算法分析或者目测观察来确定。在可选择的方面,核酸在严格的条件下与SEQ ID NO:1所阐述核酸或其子序列,与SEQ ID NO:3所阐述核酸或其子序列,与SEQ ID NO:5所阐述核酸或其子序列,与SEQ ID NO:7所阐述核酸或其子序列杂交。 
本发明提供鉴定磷脂酶活性的调节物的方法,包括以下步骤:(a)提供本发明的多肽或者本发明核酸编码的多肽;(b)提供测试化合物;以及(c)将步骤(a)的多肽与步骤(b)的测试化合物接触;并测定磷脂酶的活性,其中在测试化合物存在的条件下测得的磷脂酶活性与在无测试化合物存在的条件下测得的磷脂酶活性相比得到的变化证明测试化合物调节了磷脂酶的活性。在可选择的方面,核酸可以与SEQ ID NO:1在至少大约100个残基的范围内,具有至少85%的序列同一性,与SEQ ID NO:3在至少大约100个残基的范围内,具有至少80%的序列同一性,与SEQ ID NO:5在至少大约100个残基的范围内,具有至少80%的序列同一性,或者与SEQ ID NO:7在至少大约100个残基的范围内,具有至少70%的序列同一性,其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选择的方面,核酸可以在严格的条件下与选自SEQ ID NO:1所阐述核酸或其子序列;SEQ ID NO:3所阐述核酸或其子序列;SEQ ID NO:5所阐述核酸或其子序列;和SEQ ID NO:7所阐述核酸或其子序列的核酸序列杂交。 
在一个方面,磷脂酶活性通过提供磷脂酶底物并且检测底物量的增加或者产物量的减少来测定。与不存在测试化合物的条件下底物或者产物的量相比,在存在测试化合物的条件下,底物量的减少或者产物量的增加证明测试化合物是磷脂酶活性的激活剂。与不存在测试化合物的条件下底物或者产物的量相比,在存在测试化合物的条件下,底物量的增加或者产物量的减少证明测试化合物是磷脂酶活性的抑制剂。 
发明提供包含处理器和数据存储设备的计算机系统,其中所述的数据存储设备上已存储了本发明的多肽序列或者本发明的核酸序列。 
一方面,计算机系统可以进一步包括序列比较算法,和其上已经存储了至少一个参照序列的数据存储设备。序列比较算法可以包括表明多态性的计算机程序。计算机系统可以进一步包括鉴定所述序列的一个或者多个特征的标识符(identifier)。 
本发明提供已存储了包括本发明多肽序列或本发明核酸序列的序列的计算机可读存储介质。 
本发明提供了鉴定序列中的特征的方法,包括以下步骤:(a)应用鉴定序列的一个或者多个特征的计算机程序来读取序列,其中该序列包括本发明的多肽序列或者本发明的核酸序列;和(b)用计算机程序鉴定序列中的一个或者多个特征。[74]本发明提供比较第一序列和第二序列的方法,该方法包括以下步骤:(a)应用比较序列的计算机程序读取第一序列和第二序列,其中第一序列包括本发明的 多肽序列或者本发明的核酸序列;并且(b)用计算机程序确定第一序列和第二序列间的差异。在一个方面,确定第一序列和第二序列间差异的步骤进一步包括鉴定多态性的步骤。在一个方面,该方法进一步包括鉴定序列中一个或者多个特征的标识符(以及标识符的应用)。在一个方面,该方法包括用计算机程序读取第一序列,并鉴定该序列中的一个或者多个特征。 
本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤:(a)提供扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对能够扩增本发明的核酸(如SEQ ID NO:1或其子序列,SEQID NO:3或其子序列,SEQ ID NO:5核酸或其子序列,SEQ ID NO:7核酸或其子序列,等等);(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与扩增引物对杂交;和(c)将步骤(b)的核酸和步骤(a)的扩增引物对结合,并且从环境样品中扩增核酸,从而从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在一方面,扩增引物序列对的每一个成员包括含有本发明的核酸序列的至少大约10到50个连续碱基的寡核苷酸。在一方面,扩增引物序列对是本发明的扩增对。 
本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤:(a)提供包含本发明的核酸序列或其子序列的多核苷酸探针;(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与步骤(a)的多核苷酸探针杂交;(c)将步骤(b)的分离的核酸或者经处理的环境样品与步骤(a)的多核苷酸探针结合;和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸,因此从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在可选择的方面,环境样品包括水样品、液体样品、土壤样品、空气样品或者生物样品。在可选择的方面,生物样品来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞、藻类细胞、地衣细胞或者哺乳动物细胞。 
本发明提供产生编码磷脂酶的核酸的变异体的方法,包括以下步骤(a)提供包括本发明核酸的模板核酸;(b)在模板序列中修饰,缺失或者添加一个或者多个核苷酸,或其组合从而产生模板核酸的变异体。 
在一方面,该方法进一步包括表达变异核酸,产生变体磷脂酶多肽。在可选择的方面,修饰、添加或者缺失由易错PCR(error-prone PCR)、重排(shuffling)、寡聚核苷酸定向诱变(oligonucleotide-directed mutagenesis)、装配PCR(assembly PCR)、有性PCR诱变(sexual PCR mutagenesis)、体内诱变(in vivo mutagenesis)、盒式诱变(cassette mutagenesis)、回归整体诱变(recursive ensemble mutagenesis)、指数整体诱变(exponential ensemble mutagenesis)、位点专一性诱变(site-specific mutagenesis)、基因重装配(gene reassembly)、基因位点饱和诱变TM(Gene Site SaturationMutagenesis,GSSMTM)、合成连接重装配(synthetic ligation reassembly,SLR)和/或 其组合的方法来引入。在可选择的方面,修饰、添加或者缺失通过选自下述方法引入:重组、回归序列重组(recursive sequence recombination)、硫代磷酸酯-修饰的DNA诱变(phosphothioate-modified DNA mutagenesis)、含尿嘧啶的模板诱变(uracil-containing template mutagenesis)、缺口二重诱变(gapped duplex mutagenesis)、点错配修复诱变(point mismatch repair mutagenesis)、修复-缺陷型宿主株诱变(repair-deficient host strain mutagenesis)、化学诱变、放射诱变、缺失诱变、限制-选择诱变(restriction-selection mutagenesis)、限制-纯化诱变(restriction-purificationmutagenesis)、人工基因合成(artificial gene synthesis)、整体诱变(ensemblemutagenesis)、嵌合核酸多聚体生成(chimeric nucleic acid multimer creation)和/或其组合。 
在一方面,该方法被反复重复,直到产生与模板核酸编码的磷脂酶相比,具有改变的或不同的活性或者改变的或不同的稳定性的磷脂酶。在一方面,改变的或不同的活性是在酸性条件下的磷脂酶活性,其中模板核酸编码的磷脂酶在酸性条件下没有活性。一方面,改变的或不同的活性是在高温下的磷脂酶活性,其中模板核酸编码的磷脂酶在高温的条件下没有活性。一方面,该方法反复重复,直到产生与模板核酸的密码子选择相比具有改变的密码子选择的磷脂酶编码序列。该方法反复重复,直到产生与模板核酸的信息表达或者信息稳定性相比具有更高或更低水平的信息表达或者信息稳定性的磷脂酶基因。 
本发明提供修饰编码磷脂酶的核酸中密码子以增强其在宿主细胞中表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;(b)鉴定步骤(a)的核酸中的非偏爱(non-preferrd)或者不太偏爱(less preferred)的密码子,并且用编码相同氨基酸的偏爱的或者中立使用(neutrally used)的密码子作为替代密码子替换之,其中偏爱密码子是在宿主细胞基因的编码序列中出现频率较多的密码子,而非偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中出现频率较低的密码子,由此修饰该核酸以增加其在宿主细胞中的表达。 
本发明提供修饰编码磷脂酶的核酸中的密码子的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;并且(b)确定步骤(a)的核酸中的密码子,并用编码相同氨基酸的不同的密码子作为替代密码子来替换之,从而修饰编码磷脂酶的核酸中的密码子。 
本发明提供修饰编码磷脂酶的核酸中的密码子以增强其在宿主细胞中的表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸,和(b)鉴定步骤(a)的核酸中的非偏爱的或者不太偏爱的密码子,并用编码相同氨基酸的偏爱的或者中立使用的密码子作为替代密码子来替换之,其中偏爱密码子是在宿主细胞基因的编码序列中出现频率较多的密码子,非-偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中出现频率较少的密码子,由此修饰该核酸以增加其在宿主细胞中的表达。 
本发明提供修饰编码磷脂酶的核酸中的密码子以降低其在宿主细胞的表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;和(b)鉴别步骤(a)的核酸中的至少一个偏爱的密码子,并用编码相同氨基酸的非偏爱的或者不太偏爱的密码子作为替代密码子替换之,其中偏爱密码子是在宿主细胞基因的编码序列中出现频率较高的密码子,非偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中出现频率较低的密码子,由此修饰该核酸以减少其在宿主细胞中的表达。在可选择的方面,宿主细胞是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞、藻类细胞、地衣细胞或哺乳动物细胞。 
本发明提供产生编码多个经修饰的磷脂酶活性位点或底物结合位点的核酸文库的方法,其中经修饰的活性位点或者底物结合位点来源于包括编码第一活性位点或者第一底物结合位点的序列的第一核酸,该方法包括:(a)提供编码第一个活性位点或者第一个底物结合位点的第一核酸,其中第一核酸序列包括本发明的核酸,(b)提供一套在第一核酸的多个靶密码子处编码天然产生的氨基酸变体的诱变寡核苷酸;和(c)应用该套诱变的寡核苷酸产生一套编码活性位点或者编码底物结合位点的变体核酸,在每一个被诱变的氨基酸密码子处,变体核酸编码一定范围的氨基酸变异,从而产生编码多个修饰的磷脂酶活性位点或者底物结合位点的核酸文库。在可选择的方面,本方法包括通过下列的方法诱变步骤(a)的第一核酸,所述方法包括优化的定向进化系统(optimized directed evolution system)、基因位点饱和诱变TM(Gene Site-Saturation MutagenesisTM)(GSSMTM)、合成连接重装配(SLR)。该方法可以进一步包括通过下列方法诱变诱变步骤(a)的第一核酸或变体,所述包括易错PCR、重排、寡核苷酸定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、回归整体诱变、指数整体诱变、位点专一性诱变、基因重装配、基因位点饱和诱变TM(GSSMTM)、合成连接重装配(SLR)及其组合。本方法可以进一步包括通过以下的方法诱变步骤(a)的第一核酸或变异体,所述方法包括重组、回归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶的模板诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。 
本发明提供制备小分子的方法,包括以下步骤(a):提供可以合成或者修饰小分子的多个生物合成酶,其中之一包括由本发明核酸编码的磷脂酶;(b)提供用于步骤(a)的至少一种酶的底物,并且(c)在利于许多生物催化反应进行的条件下,将步骤(b)的底物和酶反应,通过一系列生物催化反应产生小分子。 
本发明提供修饰小分子的方法,包括以下步骤:(a)提供由本发明核酸编码的磷脂酶;(b)提供小分子;和(c)在利于磷脂酶催化的酶反应进行的条件下,将步骤(a)的酶与步骤(b)的小分子反应,从而通过磷脂酶酶促反应修饰小分子。一方面,该方法包括为步骤(a)的酶提供多种的小分子底物,从而产生了经 修饰的小分子文库,该小分子文库由磷脂酶催化的至少一种酶促反应产生。一方面,该方法进一步包括多种额外酶,在有利于进行由该酶催化的多种生物催化反应的条件下,通过多种酶促反应形成经修饰的小分子文库。在一方面,该方法进一步包括检测文库以确定在文库中是否存在表现出期望活性的特定修饰小分子的步骤。检测文库的步骤可以进一步包括系统地去除文库中用来产生部分多个修饰小分子的除一种反应之外的所有生物催化反应,通过检测一部分修饰小分子中是否存在具有所需活性的特定的修饰小分子,鉴定产生具有所需活性的特定修饰小分子的至少一种特定的生物催化反应。 
本发明提供用于确定磷脂酶的功能性片段方法,包括以下步骤:(a)提供包括本发明氨基酸序列的磷脂酶;和(b)缺失步骤(a)序列中的多个氨基酸残基,并且测定剩余序列的磷脂酶活性,从而确定磷脂酶的功能性片段。一方面,磷脂酶活性通过提供磷脂酶底物,检测底物量的增加或者反应产物量的减少来测定。一方面,与不存在测试化合物条件下确定的底物或者反应产物的量相比较,在测试化合物存在的条件下,酶底物量的减少或者反应产物量的增加表明测试化合物是磷脂酶活性的激活剂。 
本发明提供切割甘油磷酸酯键的方法,包括以下步骤:(a)提供具有磷脂酶活性的多肽,其中该多肽包括本发明的氨基酸序列,或者该多肽由本发明的核酸序列编码;(b)提供包含甘油磷酸酯键的组合物;和(c)在该多肽切割甘油磷酸酯键的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。一方面,该条件包括大约pH5到大约8.5之间,或者大约pH4.5(或酸性更大,即pH<4.5)到大约9.0(或碱性更大,即pH>9)之间。一方面,该条件包括大约40℃到大约70℃之间的温度。一方面,该组合物包括植物油。一方面,该组合物包括油籽磷脂。一方面,切割反应可以产生水可抽提的磷酸化的碱和甘油二酯。 
本发明提供了水解、分解或破裂含磷脂组合物的方法,该方法包括提供具有磷脂酶活性的至少一种本发明的多肽,或由本发明的至少一种核酸编码的具有磷脂酶活性的多肽;提供包含磷脂的组合物;以及在磷脂酶水解、分解或破裂含磷脂组合物的条件下将所述多肽与所述组合物接触。在一个方面,该方法包括使用高剪切力混合该组合物,然后以无剪切力或低剪切力与至少一种具有磷脂酶活性的本发明的多肽混合,以使磷脂底物与磷脂酶充分“接触”。具有磷脂酶活性的至少一种多肽也可以存在于高剪切力混合步骤中。该方法可以以任何规模实施,例如以包括约1克(g)至约500、1000、2000、2500、5000g或更多,或该范围内的任何数量。 
本发明提供油的脱胶(oil degumming)方法,包括以下步骤:(a)提供具有磷脂酶活性的至少一种多肽,其中多肽包括本发明的氨基酸序列,或者多肽由本发明的核酸序列编码;(b)提供包括植物油的组合物;和(c)在多肽可以切割植物油中酯键的条件下,将步骤(a)的多肽与步骤(b)的植物油接触,从而进 行油的脱胶。在一方面,植物油包括油籽。植物油可以包括米糠油(rice bran oils)、棕榈油,油菜籽油,玉米油,大豆油,油菜油(canola oil),芝麻油,花生油,或者葵花子油。在一方面,该方法进一步包括加入发明的磷脂酶,其它磷脂酶或其组合。在一个方面,将一种以上具有磷脂酶活性的多肽加入到该方法中,其中至少一种多肽是本发明的酶。在一个方面,酶以特定顺序加入,例如,具有不同特性的PLC以特定顺序加入,例如具有PC和PE活性的酶被首先加入(或者两种酶同时加入,一种具有PC活性,另一种具有PE活性),然后加入具有PI PLC活性的酶,或其任意组合。 
在油的脱胶方法的一个方面,含油组合物包括植物油、动物油、藻类油或鱼油或脂肪。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、来自棕榈果仁的油、油菜油、向日葵油、芝麻油或花生油。多肽可以水解含油组合物中来自水合和/或非水合磷脂的磷脂。在一个方面,多肽在甘油磷酯键水解磷脂从而产生甘油二酯和水溶性磷酸盐化合物。在一个方面,多肽具有磷脂酶C的活性。在一个方面,多肽是磷脂酶D,且也可以加入磷酸酶。 
在油的脱胶方法的一个方面,接触步骤包括水解油中的水合磷脂。水解条件可以包括碱性条件,例如在一个方面,该条件包括在碱性pH条件下约20℃至40℃的温度。碱性条件可以包括约pH 8至pH 10,或更大的pH。在该方法的任何时刻,水解条件都可以被变为碱性,例如在一个方面,在该条件变成碱性之前,加入磷脂酶诸如PLC(例如,含酸油诸如磷脂酸的“碱性中合”)。 
在油的脱胶方法的一个方面,在PLC的作用下,碱将使1,2-DAG异构成1,3-DAG,1,3-DAG的营养健康价值超过1,2-DAG,例如1,3-DAG作为能源被燃烧掉,而不是作为脂肪储存起来(如1,2-DAG)。因此,本发明提供了碱性油精炼工艺,其中磷脂酶例如本发明的酶包括PLC,“在前期(atthe front end)”加入,即在加入任何酸和碱之前加入,例如,如图13的示范性方法中所示。在本发明的碱性精炼工艺的前端加入PLC(参见下面进一步的论述)以及随后加入酸和碱的结果之一就是产生了提高水平的1,3-DAG(不是1,2-DAG)。这可能是酸或碱催化的酰基转移的结果。从营养角度讲,1,3-D AG胜于1,2-DAG。因此,本发明包括使用本发明的PLC进行的油脱胶工艺,因而最终的脱胶油产物含有不少于约0.5%、1.0%、2.0%、3.0%、4.0%或5.0%的1,3-DAG。 
在油的脱胶方法的一个方面,水解条件可以包括反应时间约3至10分钟或更多时间。水解条件可以包括在约50℃至60℃的温度下,在约pH 5至pH 6.5,或约pH 5至pH 7.5,或约pH 5至pH 8.0,水解油中的水合或非水合的磷脂,反应时间是约30至60分钟。 
在油的脱胶方法的一个方面,多肽被结合到过滤器上,并使含磷脂的脂肪或油通过过滤器。该多肽可以被加入到包括含磷脂脂肪或油的溶液中,然后使该溶液通过过滤器。 
在油的脱胶方法的一个方面,该方法还包括通过物理的方法除去脱胶工艺产生的胶,这是通过加入硬化物质例如云母或等同物进行的。在一个方面,这增加了油产量。 
本发明还提供转化非水合的磷脂成水合形式的磷脂的方法,包括以下步骤:(a)提供具有磷脂酶活性的多肽,其中多肽包括本发明的氨基酸序列,或者多肽由本发明的核酸编码;(b)提供包括非水合磷脂的组合物;和(c)在多肽能够切割非水合磷脂中的酯键的条件下,将步骤(a)的多肽与步骤(b)的非水合磷脂接触,从而将非水合磷脂转化为水合形式。 
本发明提供使油脱胶的方法,包括以下步骤:(a)提供包括具有磷脂酶活性的本发明的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包括含有磷脂的脂肪或者油的组合物;(c)在多肽能够对含磷脂的组合物进行脱胶的条件下(在本发明的多肽能够催化磷脂水解的条件下),将步骤(a)的多肽与步骤(b)的组合物接触。在一方面,含油的组合物包括植物、动物、藻或者鱼的油。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、棕榈仁的油、油菜油、葵花子油、芝麻油或者花生油。多肽可以水解含油组合物中水合和/或非水合磷脂中的磷脂。多肽可以在甘油磷脂键水解磷脂,产生甘油二酯和水溶性的磷酸盐化合物。多肽可以具有磷脂酶C,B,A或者D的活性。在一方面,加入了磷脂酶D活性和磷酸酶活性。接触可以包括油中的水合磷脂的水解。水解条件可以包括在碱性pH下,温度为大约20℃到40℃。碱性条件可以包括大约pH 8到pH 10的pH。水解条件可以包括反应时间为3到10分钟。水解条件可以包括在温度为大约50℃到60℃,pH大约为pH 5到pH 6.5,反应时间为大约30到60分钟,水解油中水合的或者非水合的磷脂。多肽可以结合于过滤器,并使含有磷脂的脂肪或者油通过过滤器。多肽可以加入到包含含磷脂的脂肪或者油的溶液中,然后使溶液通过过滤器。 
本发明提供将非水合的磷脂转化为水合形式的方法,包括以下的步骤:(a)提供包括具有本发明磷脂酶活性的多肽,或者由本发明的核酸序列编码的多肽的组合物;(b)提供包括非水合的磷脂的组合物;和(c)在多肽将非水合磷脂转化为水合形式的条件下,将步骤(a)的多肽与步骤(b)组合物接触。多肽可以具有磷脂酶C的活性。多肽可以具有磷脂酶D的活性,并且也加入磷酸酶。 
发明提供碱法精炼含磷脂的组合物的方法,包括以下步骤:(a)提供包含磷脂酶,其可以是本发明的具有磷脂酶活性的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包含磷脂的组合物;和(c)在碱法精炼之前,碱法精炼期间或者之后,将步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶活性,例如PLC、PLB、PLD和/或PLA活性。多肽可以在碱性精炼之前即在该方法的“前期(front end)”,在加入酸或碱之前加入,如图13所示。 
多肽(其可以是本发明的酶,例如PLC)可以在碱性精炼期间加入,并根据磷水平和游离脂肪酸的水平,可以加入变化水平的酸或碱。多肽(其可以是本发明的酶)可以在碱性精炼之前或之后加入:分离以前,在强混合器(intense mixer)或阻滞混合器(retention mixer)中;加热步骤之后;在离心机中;在皂脚中;在洗涤水中;和/或在漂白或除臭步骤中。该方法可以包括使用浓的碱溶液,例如浓度比11%的工业标准更高,以降低胶的质量(mass of gum)。在可选择的方面,浓的碱溶液是在约12%至50%之间,例如约20%、30%、40%、50%或60%或更浓。 
含磷脂的组合物可以包括植物。多肽可以通过转基因的方式在该植物中表达。具有磷脂酶活性的多肽可以在破碎种子或植物其他部分期间加入,或者具有磷脂酶活性的多肽在破碎之后或精炼之前加入。 
还提供了使用本发明的多肽水解油(例如植物油)中的磷脂,以产生甘油二酯(DAG)和水溶性磷酸酯的碱法精炼工艺。在一个方面,本发明的酶必须在碱法精炼工艺中,包括可选地低含量水和/或在约55℃至约70℃的温度范围内操作。在该温度范围内,以低水条件使用碱法精炼工艺,将通过增加DAG和减少气体夹带油(entrained oil)而使产量最大化。在一个方面,在本发明的碱法精炼工艺中使用的酶对磷脂酰胆碱(PC)和磷脂酰乙醇胺(PE)具有非常好的活性,在约pH 6至pH 9具有活性,在高达75℃下具有活性,在低含量水例如约2%至5%水的具有活性,例如SEQ ID NO:2的序列编码的酶,SEQ ID NO:1的序列编码的酶。 
在本发明用于水解油中磷脂的碱法精炼工艺的另一方面,使用了两种酶:PI-特异性PLC(水解PI)和水解PC、PE及PA的PC-PLC。该实施方案产生适合于化学或物理精炼的油,并使DAG的产量增加最大化,并减少气体夹带的油。 
发明提供纯化植物甾醇或者三萜的方法,包括以下的步骤:(a)提供包括本发明的具有磷脂酶活性的多肽或者由本发明核酸编码的多肽的组合物;(b)提供含有植物甾醇或者三萜的组合物;和(c)在多肽可以催化组合物中磷脂的水解的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。植物甾醇或者三萜可以包括植物甾醇(plant sterol)。该植物甾醇可以来源于植物油。植物油可以包括米糠油(a rice bran oil)、椰子油、油菜油(canolaoil)、可可黄油、玉米油、棉籽油、亚麻油、橄榄油、棕榈油、花生油、来自米糠的油、红花油、芝麻油、大豆油、或者葵花子油。该方法可以包括应用非极性溶剂来定量地提取游离的植物甾醇和甾醇脂肪酸酯。植物甾醇或者三萜可以包括β-谷甾醇、菜油甾醇、豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、链甾醇(desmosterol)、海绵甾醇、多孔甾醇、穿贝海绵甾醇或者菜籽甾醇。 
本发明提供精炼粗制油的方法,包括以下步骤:(a)提供包括本发明的具有磷脂酶活性的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包括含磷脂的油的组合物;和(c)在多肽催化组合物中的磷脂水解的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。多肽 可以在水溶液加入到组合物的情况下具有磷脂酶活性。水的水平可以是在0.5到5%之间。处理时间可以大约2小时以下,大约60分钟以下,大约30分钟以下,大约15分钟以下,或者5分钟以下。水解条件可以包括温度范围在大约25℃到70℃之间。水解条件可以包括使用苛性碱。可以使用碱的浓溶液,例如比11%的工业标准更浓的浓度,以减少胶的质量。在可选择的方面,碱的浓溶液是在约12%至50%之间,例如约20%、30%、40%、50%或60%或更浓的浓度。 
水解条件可以包括pH范围在大约pH 3到pH 10之间、在大约pH 4到pH9之间、或者在大约pH 5到pH 8之间。水解条件可以包括在接触步骤(c)后加入乳化剂和/或进行混合。该方法可以包括加入乳化剂破乳剂(emulsifiers-breaker)和/或加热或冷却(例如在约4℃至约-20℃之间,或更低温度),来促进水相的分离。该方法可以包括在接触步骤前进行脱胶,通过离心收集卵磷脂,然后再加入PLC,PLC和/或PLA以去除非水合的磷脂。对于食用油,该方法可以包括对粗油进行水脱胶到少于10ppm的磷,对于生物柴油,然后通过物理精炼到少于大约50ppm的磷。该方法可以包括加入酸来增强非水合磷脂的水合作用。在一个方面,加入酸来促进钙和镁金属含量的降低。 
本发明提供了改善或防止脂多糖(LPS)-介导的毒性的方法,该方法包括给予患者包含本发明多肽的药物组合物。本发明提供了内毒素的解毒方法,包括使内毒素与本发明的多肽接触。本发明提供了从类脂A上脱去2′或3′脂肪酸链的脱酰基方法,包括将类脂A与本发明的多肽接触。 
本发明提供了精炼润滑剂的方法,包括以下步骤:(a)提供包括本发明的酶的组合物;(b)提供润滑剂;和(c)在酶可以选择性地水解润滑剂中的油的条件下,用酶处理润滑剂,从而精炼该润滑剂。该润滑剂可以是液压油。 
本发明提供了处理织物的方法,包括下述步骤:(a)提供包括本发明的酶的组合物;(b)提供织物;和(c)用该酶处理织物。织物的处理可以包括最终织物的手感和褶皱的改善、染色、获得阻燃性、获得防水性、获得光学亮度或者获得树脂整理。该织物可以包括棉、粘胶纤维、人造纤维、lyocell、亚麻(flax)、亚麻(linen)、苎麻、其所有的混合物,或者它们与聚酯、羊毛、聚酰胺、丙烯酸类或聚丙烯酸类的混合物。本发明提供了包含本发明的酶的织物、纱线或纤维。该酶可以被吸附,吸附或固定在织物、纱或纤维的表面。 
本发明提供了表达磷脂酶C方法,该方法包括提供具有Mut+表型的毕赤酵母菌株;将异源的磷脂酶C-编码核酸插入毕赤酵母菌株;并将毕赤酵母菌株培养在表达磷脂酶C的条件下。该方法还可以包括用锌补充培养条件。本发明也提供了用于表达磷脂酶C的细胞体系,分离的细胞和细胞系,包括Mut+表型毕赤酵母菌株,其含有可操作性地连接于毕赤酵母菌株中可以操作的启动子的异源的磷脂酶C-编码核酸。 
本发明提供了用于表达异源蛋白的耐zeocin的酵母细胞体系(例如酵母细胞、细胞系、单个细胞),包括步骤:提供含有能够表达异源蛋白的异源核酸的毕赤酵母某种(Pichia sp.)(例如巴斯德毕赤酵母(P.pastoris))细胞;在含某一初始浓度zeocin的条件下培养该细胞;挑选对初始浓度的zeocin有抗性的细胞,并在含有较高浓度zeocin的条件下再培养;并挑选出步骤(C)中培养的耐较高浓度zeocin的细胞。在一个方面,异源蛋白是酶,或任选地是磷脂酶,或任选地是磷脂酶C(PLC),例如本发明的任何酶。 
本发明的一个或者多个实施方案的细节在附图和以下的说明书中进行阐明。本发明的其它特征,目标,以及优势将通过阅读说明书和附图以及权利要求得变得显而易见。 
出于各种目的,本文所引用的所有出版物、专利、专利申请、GenBank序列以及美国模式菌种保藏中心(ATCC)保藏物,特意并入本文作为参考。 
附图简述 
下图是本发明的实施方案的例示性说明,并不为了限制权利要求所包含的发明范围。 
图1是计算机系统的框图,具体的细节说明参见下文。 
图2是过程200的一个方面的流程图,为了确定新序列和数据库中的序列之间的同源性水平,把新的核苷酸或蛋白质序列与数据库中的序列相比较,具体的细节说明参见下文。 
图3是举例说明在计算机中确定两个序列是否是同源的过程的实施方案的流程图,具体细节说明参见下文。 
图4是举例说明标识符过程的一个方面的流程图,该标识符过程用于检测序列中特征的存在与否,具体的细节说明参见下文。 
图5A、5B和5C用图表说明用于模拟PLC-介导的脱胶的典型两相系统,具体的细节说明参见下文。 
图6用图表说明了应用本发明的磷脂酶的典型的植物油精炼过程。 
图7用图表说明用于物理精炼油的发明的典型脱胶过程,具体的细节说明参见下文。 
图8用图表说明用本发明的磷脂酶C进行的磷脂水解,具体的细节说明参见下文。 
图9用图表说明了本发明的示例性碱法精炼工艺,说明了用本发明的磷脂酶C作为“碱法精炼辅助剂”(长混合碱法精炼)的一个可选择的实施方案,具体的细节说明参见下文。 
图10用图表说明了用本发明的磷脂酶C作为脱胶辅助剂,具体的细节说明参见下文。 
图11用图表描述了本发明的示例性核酸和多肽的选择的特征,如在下面进一步详细描述地。 
图12图示了来自本发明的两个酶系统的数据,如在下面实施例3中所述。 
图13图示了本发明的示例性碱炼工艺,并示出了一个可选的实施方案,包括应用本发明的酶C作为“碱炼助剂”(长混合碱炼(Long Mix Caustic Refining)),如下面详细描述地。 
图14示出了本发明方法的另一种示例性变化,其中在工艺中使用了两个离心步骤,如下面详细描述地。 
图15示出了本发明方法的另一种示例性变化,其中在工艺中使用了三个离心步骤,如下面详细描述地。 
图16示出了本发明方法的另一种示例性变化,其使用酸处理并在脱胶步骤之前具有离心步骤,如下面详细描述地。 
图17示出了体外消化试验的结果,其中本发明的磷脂酶C变体,如下面实施例4中详细描述地。 
图18示出了使用本发明的示例性酶进行的分批发酵罐培养的结果,如下面实施例5中详细描述地。 
图19示出了本发明的巴斯德毕赤酵母MutS菌株的氧吸收速率(″OUR″)比较结果,如下面实施例5中详细描述地。 
图20示出了本发明的巴斯德毕赤酵母MutS菌株的甲醇消耗图结果,如下面实施例5中详细描述地。 
图21示出了本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物的“OUR”图,如下面实施例5中详细描述地。 
图22示出了SDS-PAGE的结果,显示了在培养物中产生的PLC蛋白的质量,和与之相应的、本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物的“OUR”图,如下面实施例5中详细描述地。 
图23示出了SDS-PAGE的结果,显示了活性PLC的数量,该活性PLC位于本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物的胞内,如下面实施例5中详细描述地。 
图24示出了与活性PLC相关的酵母细胞形态学变化的可视化图——本发明SEQ ID NO:2的示例性PLC酶的重组形式,如下面实施例5中详细描述地。 
图25用概述了数据,显示了在95h TFT(总发酵时间),在毕赤酵母中,使用本发明SEQ ID NO:2的示例性PLC酶进行的PLC生产性能的状态,如下面实施例5中详细描述地。 
图26是表,概述了数据,这些数据来自对本发明的示例性zeocin-适应的细胞菌落的表达筛选,如下面实施例5中详细描述地。 
图27示出了数据,这些数据显示,在含有本发明的示例性zeocin-适应的细胞菌落的培养物中,PLC蛋白水平是较高的,如下面实施例5中详细描述地。 
图28示出了数据,这些数据显示了本发明的zeocin-适应的细胞菌落与对照的生长比较,如下面实施例5中详细描述地。 
图29示出了加热试验的结果,显示了本发明SEQ ID NO:2的示例性酶的热稳定性,图中指出了条件,如下面实施例5中详细描述地。 
图30示出了总结加热试验的NMR数据,证明了本发明SEQ ID NO:2的示例性酶的热稳定性,如下面实施例6中详细描述地。 
图31、32和33示出了数据,这些数据证明了SEQ ID NO:2的热稳定性,使用p-NPPC,条件为图中显示的条件,如下面实施例6中详细描述地。 
图34示出了数据,这些数据证明了SEQ ID NO:2的热稳定性,使用DSC分析,如下面实施例6中详细描述地。 
不同图中的类似参考符号表明类似的元素。 
发明详述 
本发明提供了磷脂酶,例如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷脂酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽,编码它们的多核苷酸,以及制备和应用它们的方法。本发明提供了有效地切割油诸如植物油中的甘油磷酸酯键,例如油籽磷脂,从而产生水可提取的磷酸化的碱和甘油二酯的酶。一方面,本发明的磷脂酶具有脂酰水解酶(LAH)的活性。在可选择的方面,本发明的磷脂酶可以切割磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸和/或鞘磷脂或它们的组合中的甘油磷酸酯键(glycerophosphate esterlinkage)。例如,在一个方面,本发明的磷脂酶对一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE和PS;PS和PE;PS和PI;PI和PE;PS、PI和PC;PE、PI和PC;或PE、PS、PI和PC具有特异性作用。 
本发明的磷脂酶(如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷脂酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽)可以用于植物油的酶法脱胶,这是因为磷酸部分可溶于水,并且容易去除。甘油二酯产物将仍存留在油中,从而降低损失。本发明的PLCs可以用作在商业上的油脱胶诸如ENZYMAX 
Figure G05814667620061109D000291
工艺中的PLA1s和PLA2s的补充或者替代,在所述ENZYMAX 
Figure G05814667620061109D000292
工艺中磷脂是由PLA1和PLA2水解的。 
在一方面,本发明的磷脂酶在高温和/或低温下,或者在较宽的温度范围内,具有活性,例如,它们可以在20℃到90℃,30℃到80℃,或者在40℃到70℃的温度范围具有活性。本发明也提供在碱性pH或者酸性pH,例如低的水酸度具有活性的本发明的磷脂酶。在可选择的方面,本发明的磷脂酶可以在酸性pH低至pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0和pH3.5或更加酸性(即pH<3.5) 的条件下仍具有活性。在可选择的方面,本发明的磷脂酶可以在碱性pH高至pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、pH10或碱性更大(即pH>10)的条件下具有活性。一方面,本发明的磷脂酶在低水活度(低的水含量)条件下,在约40℃到约70℃、75℃或80℃或更高温度之间的温度下具有活性。 
本发明也提供了用于进一步修饰本发明的示范性磷脂酶以产生具有期望特性的酶的方法。例如,由本发明方法产生的磷脂酶可以具有改变了的底物特异性、底物结合特异性、底物切割型式、热稳定性、pH/活性曲线、pH/稳定性曲线(如在较低pH值,例如pH<6或者pH<5,或者较高的pH值,如pH>9的情况下稳定性提高)、对于氧化作用的稳定性、Ca2+依赖性、比活性和类似特性。本发明提供对于任何感兴趣特性的改变。例如,这些改变可以产生与母本磷脂酶相比具有改变的pH和温度活性曲线的变异体。 
在一方面,本发明的磷脂酶被用于各种植物油处理步骤中,如植物油提取中,特别地,用在称为“油脱胶”的过程中去除“磷脂胶(phospholipid gums)”,如本文所述。本发明提供了组合物(例如包含本发明的酶)和由各种来源生产植物油的工艺,所述各种来源如米糠、大豆、油菜、花生、芝麻、向日葵和玉米。本发明的磷脂酶可以在任何植物油加工步骤中被用于替代PLA,例如磷脂酶A2。 
定义
术语“磷脂酶”包括具有任何磷脂酶活性的酶,例如,切割油中,如植物油中的甘油磷酸酯键(催化水解甘油磷酸酯键)。本发明的磷脂酶活性可以产生可水提取的磷酸化的碱以及甘油二酯。本发明的磷脂酶活性也包括在高温、低温、碱性pH和酸性pH条件下水解甘油磷酸酯键。术语“磷脂酶活性”也包括切割甘油磷酸酯以产生可水提取的磷酸化的碱以及甘油二酯。术语“磷脂酶活性”也包括切割磷脂中甘油和磷酸的酯键。术语“磷脂酶活性”也包括其它的活性,如结合并水解底物的能力,底物如油,例如植物油,底物也包括植物和动物磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶B(PLB)活性,如磷脂酶B1或者磷脂酶B2活性,包括溶血磷脂酶(LPL)活性和/或溶血磷脂酶-转酰基酶(LPTA)活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;和/或patatin活性或它们的任何组合。磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中或者任何茄属植物(Solanum)如马铃薯(Solanum tuberosum.)中的糖蛋白。磷脂酶活性可以包括patatin酶活性,如patatin酯酶活性(见,例如,Jimenez(2002)Biotechnol.Prog.18:635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。磷脂酶活性可以包括对一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE和PS;PS和PE;PS和PI;PI和PE;PS、PI和PC;PE、PI和PC;或PE、PS、PI和PC,或它们的任何组合具有特异性作用。 
在一个方面,本发明的磷脂酶可以具有多功能活性,例如一种或多种本文中描述的酶活性的组合。例如,在一个方面,本发明的多肽具有酶活性,但是缺少脂酶活性,或缺少影响中性油(甘油三酯)组分的任何酶活性。在特定的工艺中,例如在脱胶工艺中使用这样的多肽可能是有利的,在脱胶工艺中,中性油组分不受损害(减少、降解例如水解)是重要的。因此,在一个方面,本发明提供了脱胶工艺,该工艺包括使用具有磷脂酶活性但是缺少脂酶活性的本发明多肽。 
在一个方面,本发明的PLC磷脂酶利用(例如催化水解)各种磷脂底物,包括磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)和/或磷脂酸或它们的组合。此外,这些酶对这些磷脂的溶血磷脂形式具有不同程度的活性。在各个方面,本发明的PLC酶可以对磷脂酰胆碱和磷脂酰乙醇胺作为底物显示出偏好性。 
在一个方面,本发明的磷脂酰肌醇PLC磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的磷脂酰肌醇PLC酶可以对磷脂酰肌醇作为底物显示出偏好性。 
在一个方面,本发明的patatin酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的patatin可以基于氨基序列相似性的保守性。在不同的方面,这些酶展示出多组不同的生物化学特性,并可以进行PLA1、PLA2、PLC或PLD酶类的特征性反应。 
在一个方面,本发明的PLD磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在一个方面,这些酶可用于进行转酯反应,以产生具有一定结构的磷脂。 
术语“抗体”包括源自、建模自(modeled after)或者实质上编码自一种或多种免疫球蛋白基因或其片段的肽或者多肽,其能够特异地结合于抗原或者表位,参见,例如Fundamental lmmunology,Third Edition,W.B.Paul,ed.,Raven Press,N.Y.(1993);Wilson(1994)J.Immunol.Methods 175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods 25:85-97。术语抗体包括抗原结合部分,即,“抗原结合位点”(例如,保持了结合抗原能力的片段、子序列、互补决定区(CDRs),包括:(i)Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,包括在铰链区通过二硫键连接两个Fab片段的二价片段;(iii)由VH和CH1结构域组成的Fd片段;(iv)由抗体单臂的VL和VH结构域组成的Fv片段,(v)由VH结构域组成的dAb片段(Ward et al.,(1989)Nature 341:544-546);以及(vi)分离的互补决定区(CDR)。单链抗体也被包括于术语“抗体”中。 
在此应用的术语“阵列(array)”或者“微阵列(microarray)”或者“生物芯片(biochip)”或者“芯片(chip)”是许多靶元素,每一个靶元素包括确定量的一个或者多个多肽(包括抗体)或者固定于底物表面积的确定区域上的核酸,参见下面进一步的具体讨论。 
正如在此所用地,术语“计算机”,“计算机程序”和“处理器”以它们最广的含义使用,并整合所有这样的设备,如以下详细描述的。 
特定的多肽或者蛋白的“编码序列”或者“编码特定的多肽或者蛋白的序列”,是指当置于合适的调控序列的控制下可以转录和翻译成多肽或者蛋白的核酸序列。 
在此使用的术语“表达盒(expression cassette)”是指在宿主细胞中可以影响结构基因表达(即,编码蛋白质,如本发明的磷脂酶的序列)的核苷酸序列,所述宿主细胞与所述核苷酸序列相容。表达盒包括至少一个可以可操作地连接至编码多肽的序列上的启动子;并且,可选择地,连接有其它的序列例如,转录终止信号。也可以应用进行表达所必要的或有帮助的额外的因子,例如,增强子。如在此所应用的“可操作地连接(Operably linked)”是指连接DNA序列上游的启动子,这样该启动子能够介导该DNA序列的转录。因此,表达盒也包括质粒、表达载体、重组病毒、任何形式的重组的“裸露DNA”载体,和类似物。“载体”包括可以感染、转染、瞬间或者永久转导细胞的核酸。将被认识到,载体可以是裸露的核酸,或者与蛋白或者脂类复合的核酸。载体可选择地包括病毒或者细菌的核酸和/或蛋白,和/或膜(如,细胞膜,病毒的脂包膜,等等)。载体包括,但不限于复制子(如,RNA复制子,细菌噬菌体),DNA片段可以连接到其上,并被复制。载体因此包括,但不限于是RNA,自主复制的环状或者线性的DNA或者RNA(如,质粒、病毒以及类似物,参见,如,美国专利No.5,217,879),并且也包括表达载体和非表达质粒。当重组微生物或者细胞培养物被描述容纳“表达载体”时,其包括染色体外的环状和线性DNA,和已经整合进入宿主染色体的DNA。当载体由宿主细胞维持时,该载体可以在细胞有丝分裂期间作为自主结构由细胞稳定地复制,或者整合入宿主基因组中。 
“质粒”的命名为在大写字母和/或数字之前和/或之后加上小写字母“p”。在此使用的起始质粒(starting plasmid)可以通过商业渠道获得,通过公共渠道自由获得,或者按照公开的程序从可利用的质粒构建得到。此外,与那些在此描述的质粒等价的质粒是在本领域是已知的,并且对普通技术人员而言是显而易见的。 
术语“基因”是指参与产生多肽链的DNA片段,包括,在编码区的前面和后面的区域,如头部和尾部,启动子和增强子,以及适当情况下,单个编码片段(外显子)之间的插入序列(内含子),等等。 
如在此应用的短语“核酸”或者“核酸序列”是指寡核苷酸、核苷酸、多核苷酸、或者是指它们中的任何之一的片段,是指基因组或者合成来源的DNA或者 RNA(如,mRNA、rRNA、tRNA、iRNA),其可以是单链的或者双链的,并且可以代表有义链或者无义链,是指肽核酸(PNA),或者是指任何DNA样或者RNA样的物质,天然的或者合成来源的,包括如,iRNA,核糖核蛋白(如双链iRNA,如iRNPs)。该术语包括核酸,即,寡核苷酸,包括天然核苷酸的已知类似物。该术语也包括具有合成骨架的核酸样结构,见,如,Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry 36:8692-8698;Samstag(1996)Antisense Nucleic Acid Drug Dev 6:153-156。 
在此应用的“氨基酸”或者“氨基酸序列”是指寡肽,肽,多肽,或者蛋白序列,或者是指这些序列中的任何序列的片段、部分或亚基,并且是指天然产生的或者合成的分子。 
在此应用的术语“多肽”和“蛋白”是指通过肽键或者修饰的肽键相互连接在一起的氨基酸,即,肽等排体,可以含有除了20个基因编码的氨基酸外的修饰氨基酸。术语“多肽”也指肽或者多肽片段,基序(motif)和类似物。该术语也包括糖基化的多肽。本发明的肽或者多肽也包括所有“模拟”和“肽模拟”形式,如下面进一步描述地。 
如在此所应用的,术语“分离的”是指从起始的环境(如,如果是天然发生的,那么就是天然环境)中移取的物质。例如,存在于活动物中的天然发生的多核苷酸或者多肽不是分离的,但是,如果该同样的多核苷酸或者多肽,与天然系统中的一些或者所有的共存物分离,那么就是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或者多肽可以是一个组合物的一部分,并且仍然是分离,这是因为这样的载体或者组合物不是天然环境的一部分。正如在此使用的,分离的物质或者组合物也可以是“纯化”的组合物,即,它并不需要绝对的纯度;相反,认为其是相对性的定义。从文库中得到的单个核酸可以经过常规纯化为具有电泳均一性。可选择的方面,本发明提供从基因组DNA或者从文库中的其它序列中或者其它的环境中纯化至少一个、两个、三个、四个、五个或者更多数量级的核酸。 
正如在此应用的,术语“重组子”是邻接于“骨架”核酸的核酸,而在天然环境下它们并不邻接。在一方面,核酸代表了核酸“骨架分子”群体中5%或者更多数目的核酸插入物。本发明的“骨架分子”包括核酸,如表达载体、自主复制核酸、病毒、整合性核酸,和用于维持或者操作感兴趣的核酸插入物的其他的载体或者核酸。在一方面,富集的核酸代表了重组骨架分子群体中的15%、20%、30%、40%、50%、60%、70%、80%、90%或者更多数目的核酸插入物。“重组”多肽或者蛋白是指由重组DNA技术产生的多肽或者蛋白,如,从用编码所需多肽或者蛋白的外源DNA构建物转化的细胞产生。“合成的”多肽或者蛋白是那些通过化学合成制备的多肽或者蛋白,如下面进一步描述地。 
如下面进一步讨论地,当在启动子处启动转录的RNA聚合酶将编码序列转录成为mRNA时,启动子序列被“可操作地连接于”编码序列。 
“寡核苷酸”是指单链多脱氧核苷酸或者两个互补的多脱氧核苷酸链,它们可以通过化学合成。这样合成寡核苷酸在5’没有磷酸,因此在激酶存在时,不通过ATP加入磷酸的情况下,不能连接于另一个寡核苷酸。合成的寡核苷酸将连接于没有脱磷酸化的片段。 
在两核酸或者多肽上下文中的短语“实质上相同(substantially identical)”,是指当为了获得最大对应性(correspondence)而比较和比对时,具有至少50%、60%、70%、75%、80%、85%、90%、95%、98%或者99%的核苷酸或者氨基酸残基(序列)同一性的两个或者多个序列,所述最大对应性用任何已知的序列比较算法测量,如以下详细讨论的,或者通过目测的方法测量。在可选择的方面,本发明提供与本发明的示范性序列,如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8等等在核酸或者多肽的至少大约100个残基、150个残基、200个残基、300个残基、400个残基的区域内或者从约50个残基到全长之间的区域内,实质上相同的核酸和多肽序列。本发明的核酸序列可以在多肽编码区域的整个长度上实质上相同。 
另外的,“实质上相同(substantially identical)”的氨基酸序列是与参考序列差异一个或者多个保守性或者非保守性的氨基酸取代、缺失或者插入的序列,特别地,当这样的取代发生在分子的非活性位点的位置上,只要多肽基本上保留了它的功能特性。保守氨基酸的取代,例如,用一个氨基酸取代另一个同类的氨基酸(如,将一个疏水氨基酸,如异亮氨酸、缬氨酸、亮氨酸或者甲硫氨酸置换为另一个疏水氨基酸,或者将极性氨基酸置换为另一个极性氨基酸,如,将赖氨酸置换为精氨酸,将谷氨酸置换为天冬氨酸或者,将谷酰胺置换为天冬酰胺)。可以缺失一个或者多个氨基酸,例如,从磷脂酶多肽中缺失一个或者多个氨基酸,从而对多肽结构进行修饰,而并不显著改变其生物活性。例如,可以去除对于磷脂酶的生物活性并不需要的氨基或者羧基端氨基酸。可以通过很多的方法分析本发明修饰的多肽序列的磷脂酶活性,包括将修饰的多肽序列与磷脂酶底物接触,并且确定是否修饰的多肽减少了分析中的特异底物的量或者增加了功能性磷脂酶与底物的酶促反应的生物产物的量,如下面进一步论述地。 
“杂交”是指通过碱基配对,核酸链与互补链结合的过程。杂交反应可能是敏感的并且具有选择性,这样可以鉴定在样品中以低浓度存在的感兴趣的特定的序列。合适的严格条件可以通过例如,预杂交和杂交溶液中的盐和甲酰胺浓度,或者杂交温度来确定,并且本领域是熟知的。例如,严格性的增加可以通过降低盐浓度,增加甲酰胺的浓度,或者提高杂交温度,改变杂交时间予以实现,如下面所详细描述地。在可选择的方面,本发明的核酸通过它们可以在各种的严格条件下(如,高,中,和低)杂交的能力来确定,如在此所阐明地。 
术语“变异体”是指在一个或者多个碱基对、密码子、内含子、外显子、或者氨基酸残基(分别地)被修饰,但仍保持本发明的磷脂酶的生物活性的本发明的多核苷酸或者多肽。变异体可以通过很多种方法产生,例如,易错PCR、重排、寡核苷酸定向诱变、装配PCR、有性PCR诱变、体外诱变、盒式诱变、递归整体诱变、指数整体诱变、定点诱变、基因重装配,GSSMTM和它们的组合。在此包括了产生在一定的pH或温度下具有活性的磷脂酶,例如,不同与野生型磷脂酶的突变体技术。 
术语“饱和诱变(saturation mutagenesis)”、基因位点饱和诱变TM(GSSMTM)或者“GSSMTM”,包括应用简并的寡核苷酸引物将点突变引入多核苷酸中的方法,如下的详细解释。 
术语“优化的定向进化系统(optimized directed evolution system)”或者“优化的定向进化(optimized directed evolution)”包括对相关核酸序列,例如,相关基因的片段重新进行装配的方法,并在下面进行了详细解释。 
术语“合成连接重装配(synthetic ligation reassembly)”或者“SLR”包括以非随机的方式连接寡核苷酸片段的方法,并在下面进行了详细解释。 
核酸的产生和操作
本发明提供分离的或重组的核酸(例如示范性的SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ IDNO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ IDNO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ IDNO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ IDNO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173),包括编码本发明的多肽和磷脂酶的表达盒,如表达载体。本发明也包括应用本发明的核酸发现新 的磷脂酶序列的方法。也提供用于修饰本发明核酸的方法,例如,合成连接重装配、优化的定向进化系统和/或饱和诱变。 
通过,如,克隆和表达cDNA文库,通过PCR扩增信使或者基因组DNA,和类似方法,发明的核酸可以制备,合成和/或进行操作。在实践本发明的方法中,通过操作模板核酸,可以修饰同源基因,正如在此所述的。本发明可以和本领域已知的其它任何方法或者方案或者装置结合进行实践,这些方法或者方案或者装置在科学和专利的文献中得到充分描述。 
一般技术 
用于实践本发明的核酸,不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或者它们的杂合体,都可以自不同的来源分离,进行遗传工程改造,扩增,和/或表达/重组产生。从这些核酸产生的重组多肽可以单独分离或者克隆,并且检测所需的活性。可以应用任何重组表达系统,包括细菌、哺乳动物、酵母、昆虫或者植物细胞表达系统。 
可选择地,这些核酸可以通过已知的化学合成技术在体外合成,如在如Adams(1983)J.Am.Chem,Soc.105:661;Belousov(1997)Nucleic Acids Res.25:3440-3444;Frenkel(1995)Free Radic.Biol.Med.19:373-380;Blommers(1994)Biochemistry 33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066中描述的。 
用于核酸操作的技术,如,亚克隆,探针标记(如,使用Klenow聚合酶的随机引物标记,切口平移,扩增),测序,杂交等等,这些方法在科学和专利文献中已充分描述,参见,如,Sambrook,ed.,MOLECULAR CLONING:ALABORATORY MANUAL(2ND ED.),Vols.1-3,Cold Spring Harbor Laboratory,(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,New York(1997);LABORATORY TECHNIQUES INBIOCHEMSTRY AND MOLECULAR BIOLOGY:HYBRlDlZATION WITHNUCLEIC ACID PROBES,Part I.Theory and Nucleic Acid Preparation,Tijssen,ed.Elsevier,N.Y.(1993)。 
获得和操作用于实践本发明方法的核酸另一有用方法是从基因组样品中克隆,并且如果需要,筛选和再克隆从例如,基因组克隆或者cDNA克隆中分离或者扩增的插入物。在发明方法中使用的核酸的来源包括包含于如,哺乳动物人工染色体(MACs)中的基因组或者cDNA文库,见如,美国专利5,721,118,6,025,155;人类人工染色体,见,如,Rosenfeld(1997)Nat.Genet.15:333-335,酵母人工染色体(YAC);细菌人工染色体(BAC);P1人工染色体,见,如,Woon(1998)Genomics 50:306-316;P1衍生的载体(PACs),见,如,Kern(1997)Biotechniques 23:120-124,粘粒、重组病毒、噬菌体或者质粒。 
在一方面,编码本发明多肽的核酸在适当的阶段与能够指导翻译的多肽或者片段分泌的前导序列装配在一起。 
本发明提供融合蛋白和编码融合蛋白的核酸。本发明的多肽可以与异源的肽或者多肽融合,如N-末端鉴定肽,其赋予了所需的特征,如增加的稳定性或者简化的纯化方法。本发明的肽和多肽也可以以与一个或者多个连接其上的额外的结构域形成融合蛋白的形式合成并表达,从而,如,产生更具免疫源性的肽,更容易分离重组合成肽,鉴定和分离抗体和表达抗体的B细胞,等等。有利于检测和纯化的结构域包括,如,允许在固定化金属上纯化的金属螯合肽,如,聚组氨酸序列(polyhistidine tracks)和组氨酸-色氨酸模块(histidine-tryptophan modules),允许在固定的免疫球蛋白上纯化的蛋白A结构域,以及在FLAGS延伸/亲和纯化系统(FLAGS extension/affinity purification system,Immunex Corp,Seattle WA)中使用的结构域。在纯化结构域和含有基序的肽或者多肽之间,包含可以切割的连接序列如因子Xa或者肠激酶(lnvitrogen,San Diego CA)的接头序列,以便于纯化。例如,表达载体可能包括连接于六个组氨酸残基的编码表位的核酸序列,然后是硫氧还蛋白和肠激酶切割位点(见,如,Williams(1995)Biochemistry 34:1787-1797,Dobeli(1998)Protein Expr.Purif.12:404-414)。组氨酸残基有利于检测和纯化,而肠激酶切割位点提供从融合蛋白的剩余物中纯化表位的方法。与编码融合蛋白的载体相关的技术以及应用融合蛋白的技术,在科学和专利文献中已充分描述,参见例如例如Kroll(1993)DNA Cell.Biol.,12:441-53。 
转录和翻译控制序列 
本发明提供可操作地与表达(如,转录和翻译)控制序列如,启动子或者增强子连接以指导或者调控RNA的合成/表达的本发明核酸(如,DNA)序列。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp启动子。典型的真核启动子包括CMV即刻早期、HSV胸腺嘧啶激酶、早期和晚期SV40,来自逆转录病毒的LTRs和鼠金属硫蛋白I。 
适于在细菌中表达多肽的启动子包括大肠杆菌lac或者trp启动子,lacI启动子,lacZ启动子,T3启动子,T7启动子,gpt启动子,λPR启动子,λPL启动子,来自编码糖酵解的酶如,3-磷酸甘油激酶(PGK)的操纵子的启动子,和酸性磷酸酶启动子。真核启动子包括CMV即刻早期启动子,HSV胸腺嘧啶激酶启动子,热休克启动子,早期和晚期SV40启动子,来自逆转录病毒的LTRs,和鼠金属硫蛋白I启动子。也可以应用已知的在原核或者真核细胞或者其病毒中控制基因表达的其它启动子。 
表达载体和克隆载体 
本发明提供包括发明的核酸,如,编码发明的磷脂酶的序列的表达载体和克隆载体。本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒、粘粒、fosmids、细菌人工染色体、病毒DNA(如,牛痘、腺病毒、 禽类痘病毒、伪狂犬病病毒和SV40衍生物),以P1为基础的人工染色体、酵母质粒、酵母人工染色体以及对感兴趣的特定宿主(如杆菌属(Bacillus),曲霉属(Aspergillus)和酵母)特异的任何其它载体。本发明的载体可以包括染色体的,非染色体的和合成的DNA序列。很多合适的载体为本领域技术熟练人员所了解,并且可以买到。典型的载体包括:细菌的:pQE载体(Qiagen)、pBluescript质粒、pNH载体、λ-ZAP载体(Stratagene);ptrc99a、pKK223-3、pDR540、pRIT2T(Pharmacia);真核的:PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以应用任何其它的质粒或其他的载体,只要它们可以在宿主中复制并且有活力。低拷贝数或者高拷贝数的载体可以应用于本发明。 
表达载体可以包括启动子,用于翻译起始的核糖体结合位点和转录终止子。载体也包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起始位点,任何必要的核糖体结合位点,多腺苷酸化位点,剪接供体和受体位点,转录终止序列,和5′侧非转录序列。在一些方面,源于SV40的剪接和多聚腺苷酸化位点的DNA序列可以用于提供所需的非-转录遗传元件。 
在一个方面,表达载体含有一个或者多个选择性标记基因,使得可以选择含有该载体的宿主细胞。这些选择标记包括编码二氢叶酸还原酶的基因或对赋予真核细胞培养物对新霉素有抗性的基因,大肠杆菌中赋予抗四环素或者抗氨苄青霉素的基因,以及酿酒酵母(S.cerevisiae)的TRP1基因。启动子区域可以使用氯霉素转移酶(CAT)载体或者具有选择标记的其它载体,从任何所需基因中选择。 
在真核细胞中表达多肽或者其片段的载体也包含增加表达水平的增强子。增强子是DNA的顺式作用元件,一般长度从大约10到大约300bp,其作用于启动子,增强启动子的转录。例子包括在复制起点的旁侧100到270bp的SV40增强子,巨细胞病毒的早期启动子增强子,在复制起点的旁侧的多瘤增强子,和腺病毒增强子。 
DNA序列可以以各种的程序插入到载体中。一般而言,用适合的限制性内切酶消化插入片段和载体之后,将DNA序列连接于载体的期望位置上。各种克隆技术是本领域已知的,例如,如在Ausubel和Sambrook中所描述的技术。这样的程序和其它程序被认为是在本领域的技术人员的知识范围之内。 
载体可以是质粒,病毒颗粒或者噬菌体的形式。其它的载体包括染色体的,非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒,噬菌体DNA,杆状病毒,酵母质粒,源于质粒和噬菌体DNA组合的载体,病毒DNA如牛痘,腺病毒,禽类痘病毒,和伪狂犬病病毒。例如,Sambrook描述了原核和真核宿主中使用的多种克隆和表达载体。 
可以应用的特定细菌载体包括可以从商业渠道获得的质粒,包括下述为人熟知的克隆载体的遗传元件:pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden),GEM1(Promega Biotec,Madison,WI,USA)pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174、pBlueScript II KS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK223-3、pDR540、pRIT5(Pharmacia)、pKK232-8和pCM7。特别的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,也可以应用任何其它的载体,只要它在宿主细胞可以复制和繁殖。 
宿主细胞和转化的细胞 
本发明也提供包括发明核酸序列,如,编码本发明磷脂酶的序列,本发明的载体的转化的细胞。宿主细胞可以是本领域技术熟练人员所熟悉的任何宿主细胞,包括原核细胞,真核细胞,如,细菌细胞,真菌细胞,酵母细胞,哺乳动物细胞,昆虫细胞,或者植物细胞。本发明的酶可以在任何宿主细胞中表达,例如任何细菌细胞、任何酵母细胞,例如巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母(Schizosaccharomyces pombe)。示范性的细菌细胞包括大肠杆菌(E.coli)、乳酸乳球菌(Lactococcus lactis)、链霉菌属(Streptomyces)、枯草芽孢杆菌(Bacillussubtilis)、鼠伤寒沙门菌(Salmonella typhimurium)和杆菌属(Bacillus)、链霉菌属和葡萄球菌属(staphylococcus)中的任何菌株。示例性的昆虫细胞包括果蝇S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9)。示例性的动物细胞包括CHO、COS或者黑色素瘤(Bowes melanoma)或者任何小鼠或者人类细胞系。适当的宿主的选择是在本领域技术人员的能力之内。 
可以应用任何不同的技术将载体引入到宿主细胞,这些技术包括转化、转染、转导、病毒感染、基因枪或者Ti-介导的基因转移。特定的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂质体转染或者电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。 
适当地,工程化的宿主细胞可以在传统营养培养基中培养,该培养基经修改以适于激活启动子,选择转化子或者扩增发明的基因。随后转化适当的宿主株,并且该宿主株生长至适当的细胞密度,通过适当的方法(如,温度变换或者化学诱导)诱导所选择的启动子,细胞可以被额外培养一段时间,以使得它们产生所需的多肽或者其片段。 
细胞通过离心收集,通过物理或者化学的方法破碎,得到的粗提取物保留用于进一步的纯化。用于表达蛋白的微生物细胞可以通过任何方便的方法破碎,包括冷冻-解冻循环、超声波破碎、机械破碎,或者应用细胞裂解剂。这样的方法为本领域技术人员所熟悉。表达的多肽或者片段可以通过下述方法从重组细胞培养物中回收纯化,这些方法包括硫酸铵或者乙醇沉淀、酸法抽提、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟基磷灰石层析和植物凝集素层析。如果必要的话,可以在实现多肽的构象化作用中应用蛋白重新折叠步骤。如果需要,可以应用高效液相色谱(HPLC)进行最终的纯化步骤。 
各种哺乳动物培养系统可以用来表达重组蛋白。哺乳动物表达系统的例子包括猴肾成纤维细胞COS-7细胞系和能够从相容性载体中表达蛋白的其它的细胞系,如C127、3T3、CHO、Hela和BHK细胞系。 
宿主细胞中的构建物可以以传统的方式用来产生重组序列编码的基因产物。取决于在重组产生程序中采用的宿主,含有载体的宿主细胞产生的多肽可以是糖基化的或者是非糖基化的。本发明的多肽可以包括,也可以不包括起始的甲硫氨酸氨基酸残基。 
无细胞的翻译系统可能也用于产生本发明的多肽。无细胞翻译系统可以应用从含有可操作性地连接到编码多肽或其片段的核酸的启动子的DNA构建物转录得到的mRNA。在一些方面,DNA构建物可以,在进行体外转录反应前,先线性化。然后转录的mRNA与合适的无细胞翻译提取物如,兔网织红细胞提取物一起温育,来产生所需的多肽或者其片段。 
表达载体可以含有一个或者多个选择性标记基因,提供用于选择转化的宿主细胞的表型特征,如,二氢叶酸还原酶和用于真核细胞培养物的新霉素抗性,或者如大肠杆菌中的四环素或者氨苄青霉素抗性。 
示范性磷脂酶C酶(具有SEQ ID NO:2中阐明的序列)已在各种宿主系统中以活性形式被过量表达,这些系统包括革兰氏阴性细菌,诸如大肠杆菌,革兰氏阳性细菌,诸如任何杆菌属菌株(例如枯草芽孢杆菌、蜡质芽孢杆菌(Bacilluscereus))、酵母宿主细胞(包括例如巴斯德毕赤酵母、酵母属某种(Saccharomycessp.),诸如酿酒酵母(S.cerevisiae)和粟酒裂殖酵母)和乳酸乳球菌(Lactococcuslactis)或哺乳动物、真菌、植物或昆虫细胞。在每一宿主系统中,由各种构建物表达活性酶。这些核酸表达构建物可以包含编码全长开放阅读框(由信号序列、前序列和成熟蛋白编码序列组成)的核苷酸,或它们可以包含这些遗传元件的亚组,单独或者与异源遗传元件组合,其充当信号序列和/或成熟开放阅读框的前序列。这些系统中的每一个可以充当表达PLC的商用生产性宿主,以用于之前描述的酶法油脱胶工艺。 
核酸的扩增
在实践本发明时,编码本发明多肽的核酸,或者修饰的核酸可以例如通过扩增被复制。本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对。在一方面,引物对能够扩增本发明的核酸序列,如,包括示范性的SEQ IDNO:1,或者其子序列;如SEQ ID NO:3所阐明的序列,或者其子序列;如SEQ IDNO:5所阐明的序列,或者其子序列;如SEQ ID NO:7所阐明的序列,或者其子序列,等等。本领域技术人员可以设计用于这些序列的任何部分或全长的扩增引物序列对。 
本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增包括本发明序列或者其片段或子序列的核酸。扩增引物 序列对的其中一个或每一个成员可以包括含有该序列的至少大约10到50个连续碱基的寡核苷酸,或者包括含有该序列的大约12、13、14、15、16、17、18、19、20、21、22、23、24或者25个连续碱基的寡核苷酸。 
本发明提供扩增引物对,其中引物对包括具有在本发明核酸的大约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第一成员,和具有在第一成员的互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第二成员。本发明提供通过扩增产生的磷脂酶,如应用本发明的扩增引物对进行聚合酶链式反应(PCR)。本发明提供使用本发明的扩增引物对,通过扩增,例如,聚合酶链式反应(PCR)制备磷脂酶的方法。在一方面,扩增引物对从文库,例如,基因文库,如环境文库中扩增核酸。 
扩增反应也可以用于定量样品中的核酸(如在细胞样品中的信息的量),标记核酸(如,用于阵列或者印迹),检测核酸,或者定量样品中特异核酸的量。在发明的一个方面,扩增分离自细胞或者DNA文库的信息。技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增的方法是本领域所熟知的,并且包括,如,聚合酶链式反应,PCR(见,如,PCR PROTOCOLS,A GUIDE TO METHODS ANDAPPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGIES(1995),ed.Innis,Academic Press,Inc.,N.Y.,连接酶链式反应(LCR)(见,如,Wu(1989)Genomics 4:560,Landegren(1988)Science 241:1077;Barringer(1990)Gene 89:117);转录扩增(见,如,Kwoh(1989)Proc.Natl.Acad.Sci.USA 86:1173),和自支持序列复制(见如,Guatelli(1990)Proc.Natl,Asad.Sci.USA 87:1874);Qβ复制酶扩增(见,如,Simth(1997)J.Clin.Microbiol.35:1477-1491);自动的Qβ复制酶扩增分析(见,如,Burg(1996)Mol.Cell.Probes 10:257-271)和其它RNA聚合酶介导的技术(如,NASBA,Cangene,Mississauga,Ontario);也见,例如,Berger(1987)Methods Enzymol.152:307-316;Sambrook;Ausubel;美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology 13:563-564。 
确定序列同一性的程度
本发明提供包括与本发明的示例性核酸(例如SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、 SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ IDNO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ IDNO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ IDNO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ IDNO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173,和编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ IDNO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ IDNO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ IDNO:168、SEQ ID NO:170、SEQ ID NO:172或SEQ ID NO:174的核酸)在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或者更多个残基的范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的序列的分离的或者重组的核酸。序列同一性(同源性)的程度 可以应用任何计算机程序和相关参数来确定,包括那些在本文所描述的,如用默认参数的BLAST 2.2.2.或者FASTA 3.0t78版。在可选择的实施方案中,序列同一性可以是在核酸或者多肽的至少大约5、10、20、30、40、50、100、150、200、250、300、350、400个连续残基,或者全长的范围内。序列同一性(同源性)的程度可以应用任何计算机程序和相关联的参数来确定,包括那些在本文所说明的,如使用默认参数的BLAST 2.2.2.或者FASTA 3.0t78版。 
图11用图表描述了本发明的示例性核酸和多肽的选择的特征,包括示例性序列与公共数据库的序列同一性比较。图11中描述的所有序列已针对两组数据库进行了BLAST搜索(如在下面详细描述的)。第一数据库获自NCBI(美国国家生物技术信息中心)。对这些数据库进行搜索所获得的所有结果参见名称为“NR描述(NR Description)”、“NR登记码(NR Accession Code)”、“NR E值(NR Evalue)”或“NR生物(NR Organism)”的各栏。“NR”指由NCBI维护的非冗余(Non-Redundant)核苷酸数据库。该数据库是GenBank、GenBank更新和EMBL更新的综合。栏“NR描述(NR Description)”中的条目指任何给定的NCBI记录中的描述行(definition line),其包括了对序列的描述,诸如来源生物、基因名称/蛋白质名称,或对序列的一些功能描述。“NR登记码(NR Accession Code)”一栏中的条目指给予序列记录的独特标识符(identifier)。“NR E值(NR Evalue)”一栏中的条目指期望值(E值),其代表了这样的可能性:同在询问序列(query sequence)(本发明的序列)与数据库序列之间发现的比对分值一样良好的比对分值,发现于在随机序列之间相同的数量的比较中的概率,如在当前的BLAST搜索中所进行的。“NR生物(NR Organism)”一栏中的条目指被鉴定为关系最密切的BLAST命中(hit)的序列的来源生物。第二组数据库统称为GeneseqTM数据库,其可从Thomson Derwent(Philadelphia,PA)获得。对该数据库所作搜索的所有结果参见名称为“Geneseq蛋白质描述(Geneseq ProteinDescription)”、“Geneseq蛋白质登记码(Geneseq Protein Accession Code)”、“Geneseq蛋白质E值(Geneseq Protein Evalue)”、“Geneseq DNA描述(Geneseq DNADescription)”、“Geneseq DNA登记码(Geneseq DNA Accession Code)”、“GeneseqDNA E值(Geneseq DNA Evalue)”各栏中。这些栏中发现的信息与上述NR各栏中发现的信息类似,除了它来自对GeneseqTM数据库而不是对NCBI数据库进行的BLAST搜索。此外,该表包括“预测的EC编号(Predicted EC No.)”一栏。EC编号是根据标准化的酶命名法的方案赋予一类酶的编号,该命名法是由国际生物化学和分子生物学联合会(IUBMB)的命名委员会的酶部(Enzyme Commission of theNomenclature Committee of International Union of Biochemistry and MolecularBiology)开发的。在“预测的EC编号”栏中的结果是由对Kegg(Kyoto Encyclopediaof Genes and Genomes)数据库的BLAST搜索结果来确定的。如果最高BLAST匹配(top BLAST match)的E值等于或小于e-6,那么赋予该最高匹配的EC编号进入表中。最高命中(top hit)的EC编号用作向导,用于指出本发明序列的EC编号可能 是什么。“询问DNA长度(Query DNA Length)”和“询问蛋白质长度(Query ProteinLength)”这两栏分别指本发明的序列中核苷酸的数目或氨基酸的数目,本发明的序列被用于对NCBI或Geneseq数据库进行搜索或查询。“Geneseq或NR DNA长度(Geneseq or NR DNA Length)”、“Geneseq或NR蛋白质长度(Geneseq or NR ProteinLength)”这两栏分别指从BLAST搜索获得的最高匹配的序列中的核苷酸的数目或氨基酸的数目。这些栏中给出的结果是来自返回(return)了较低的E值的搜索,它们或者来自NCBI数据库或者来自Geneseq数据库。“Geneseq或NR%ID蛋白质(Geneseq or NR%ID Protein)”和“Geneseq或NR%ID DNA(Geneseq or NR%IDDNA)”指本发明序列与最高BLAST匹配的序列之间的序列同一性百分比。这些栏中给出的结果是来自返回(return)了较低的E值的搜索,它们或者来自NCBI数据库或者来自Geneseq数据库。 
同源性序列也包括RNA序列,其中尿嘧啶替代了在核酸序列中的胸腺嘧啶。同源序列可以应用在此描述的任何程序得到或者可以由校正测序错误得到。应该理解到的是,在此所列的核酸序列可以以传统的单字符格式来表示(见,如,Stryer,Lubert.Biochemistry 3rd Ed.,W.H.Freeman & Co.,New York)或者以记录序列中的核苷酸的身份的任何其他格式来表示。 
在本发明的这一方面,可以使用在此指明的各种序列比较程序。蛋白和/或核酸序列同一性(同源性)可以应用本领域已知的任何序列比较算法和程序评估。这样的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA、和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85(8):2444-2448,1988;Altschul et al.,J.Mol.Biol.215(3):403-410,1990;Thompson et al.,NucleicAcids Res.22(2):4673-4680,1994;Higgins et al.,Methods Enzymol.266:383-402,1996;Altschul et al.,J.Mol.Biol.215(3):403-410,1990;Altschul et al.,NatureGenetics 3:266-272,1993)。 
同源性或者同一性可以应用序列分析软件来测定(如,遗传学计算机组的序列分析软件包,Uinversity of Wisconsin Biotechnology Center,1710 UniversityAvenue,Madison,WI 53705)。这样的软件通过对各种缺失、替换和其它修饰进行同源性水平赋值来匹配相似的序列。在两个或者多个核酸或者多肽序列的情况下,术语“同源性”和“同一性”是指两个或者多个序列或者子序列,当在比较窗口或者指定区域中应用任何数量的序列比较算法或者手动比对和目测来测定,通过比较和比对以便获得最大的一致性时,它们是相同的或者具有特定百分比的相同氨基酸残基或者核苷酸。对于序列比较,一个序列可以作为参照序列(示范性序列SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4,、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7、SEQ ID NO:8,等等)与待测序列进行比较。当应用序列比较算法,待测序列和参照序列被输入到计算机中,指定子序列坐标,如果必 要,指定序列算法程序参数。可以应用默认程序参数,或者指定选择性参数。依据程序参数,序列比较算法计算待测序列和参照序列的序列同一性百分比。 
在此应用的“比较窗口(comparison window)”,包括涉及任一数目的连续残基的片段。例如,在发明可选择的方面,当两个序列优化比对后,将范围从20到本发明的示范性序列的全长的连续残基,与相同数目的连续位置的参照序列进行比较,所述示范性序列例如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8等等。如果参照序列与发明的示范性序列例如SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8等具有必要的序列同一性,如,50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多的序列同一性,那么该序列是属于本发明的范围。在可选择的实施方案中,当两个序列优化地比对后,将范围从大约20到600、大约50到200、和大约100到150的序列,与同样数目的连续位置的参照序列进行比较。用于比较的序列比对方法是本领域所熟知的。用于比较的优化序列比对可以用下述方法实施,例如,Smith & Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法、Needleman & Wunsch,J.Mol.Biol.48:443,1970的同源比对算法、Person & Lipman,Proc,Nat′l.Acad.Sci.USA 85:2444,1988的相似性搜索法、这些算法的计算机化执行(GAP、BESTFIT、FASTA和TFASTA,于WisconsinGenetics Software Package,Genetics Computer Group,575 Science Dr.,Madison,WI),或者通过手动比对和目测完成。用于确定同源性或者同一性的其它算法包括,例如,除了BLAST程序外(在美国国家生物信息中心的基本局部比对搜索工具(Basic Local Alignment Search Tool))、ALIGN、AMAS(多比对的序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋白多序列比对(ProteinMultiple Sequence Alignment))、ASSET(比对片段的统计评估工具(Aligned SegmentStatistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN(生物序列比较分析节点(Biological Sequence Comparative Analysis Node))、BLIMPS(BLocksIMProved Searcher)、FASTA,Intervals & Points,BMB、CLUSTAL V、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸比对工具(Forced NucleotideAlignment Tool))、Framealign、Framesearch、DYNAMIC、FILTER、FSAP(Fristensky序列分析包)、GAP(通用比对程序(Global Alignment Program))、GENAL、GIBBS、GenQuest、ISSC(灵敏性序列比较(Sensitive Sequence Comparison))、LALIGN(局部序列比对(Local Sequence Alignment))、LCP(局部含量程序(Local Content Program))、MACAW(多比对构建和分析工作台(Multiple AlignmentConstruction & Analysis Workbench))、MAP(多比对程序(Multiple AlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多序列比对(Pattern-InducedMulti-sequence Alignment))、SAGA(遗传算法进行的序列比对(Sequence Alignmentby Genetic Algorithm))和WHAT-IF。这样的比对程序也可以用于筛选基因组数据库,鉴定具有实质上相同的序列的多核苷酸序列。目前已经有很多基因组数据库可用,例如,人类基因组的实质部分可以作为人类基因组测序计划(Gibbs,1995)的一部分。几个基因组已经测序完成,如,生殖道支原体(M.genitalium)(Fraseret al.,1995),甲烷球菌(M.jannaschii)(Bult et al.,1996),流感嗜血菌(H.influenzae)(Fleischmann et al.,1995),大肠杆菌(Blattner et al.,1997),和酵母(S.cerevisiae)(Mewes et al.,1997),和果蝇(D.melanogaster)(Adams etal.,2000)。模式生物的基因组测序中已经取得了显著的进展,如小鼠,线虫(C.elegans),和拟南芥(Arabadopsis sp.)。含有具有某些功能性信息注解的基因组信息的数据库由不同的组织保持,并且可以通过因特网进行访问。 
BLAST、BLAST 2.0和BLAST 2.2.2算法也用于实践发明。这些算法在,如,Altschul(1977)Nuc.Acids Res.25:3389-3402;Altschul(1990)J.Mol.Biol.215:403-410中有描述。进行BLAST分析的软件可以通过美国国家生物技术信息中心(the National Center for Biotechnology Information)公开得到。这一算法包括首先通过鉴别待询序列(query sequence)中长度为W的短的字串来确定高分序列对(high scoring sequence pairs,HSPs),所述高分序列对在与数据库序列中同样长度的字串联配时,匹配或者满足某个正值的阈值T。T是指邻近字串(neighborhood word)的分数阈值(Altschul等,如上)。这些初始的邻近字串被用来启动搜索以发现包含有它们的更长的HSPs。所述字串沿着每一个序列向两个方向延伸,只要累积的联配分数在增加。对于核苷酸序列,使用参数M(一对匹配残基的奖励分数;总是大于0)来计算累积分数;对于氨基酸序列,使用记分矩阵来计算累计分数。出现下面情况时,字串在各个方向上的延伸便停止:累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分为负的残基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)默认的是:字串长度(W)为11,期望值(E)为10,M=5,N=-4,对两条链进行比较。对于氨基酸序列,BLASTP程序默认:字串长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)联配(B)为50,期望值(E)为10,M=5,N=-4,对两条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分析(参见,例如,Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallest sum probability,P(N)),其表示两 个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在受测核酸和参考核酸的比较中,如果最小合计概率小于大约0.2,更优选地小于0.01,最优选地小于大约0.001,就认为该核酸与参考序列相似。一方面,应用基本局部对比搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。例如,五个特定的BLAST程序可以用来进行以下的任务:(1)BLASTP和BLAST3把氨基酸待询序列与蛋白质序列数据库进行比较;(2)BLASTN把核苷酸待询序列与核苷酸序列数据库进行比较;(3)BLASTX把待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较;(4)TBLASTN把待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较;(5)TBLASTX把核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。BLAST程序通过确定相似片段来确定同源性序列,所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoringsegment pairs)”,该受测序列优选地从蛋白或者核酸序列数据库得到。高分片段对优选地利用记分矩阵来鉴定(即,联配),很多的记分矩阵在本领域是已知的。优选地,应用的记分矩阵为BLOSUM62矩阵(Gonnet等,Science 256:1443-1445,1992;Henikoff和Henikoff,Proteins 17:49-61,1993)。较少不优选地,也可以应用PAM或者PAM250矩阵(参见如,Schwartz和Dayhoff,eds.,1978,Matrices forDetecting Distance Relationships:Atlas of protein Sequence and Structure,Washingion:National Biomedical Research Foundation)。 
本发明的一方面,为了确定是否核酸具有发明范围内的必需的序列同一性,应用NCBI BLAST 2.2.2程序,默认值的选择是blastp。在BLAST 2.2.2程序中,有大约38个设置选择。在发明的该示范性方面,除了默认的过滤设置外,应用所有的默认值(即除了过滤设置为关闭(OFF)外,所有的参数设定为默认值),在该位置上应用“-FF”设置,其使得不能进行过滤。由于短的序列长度的缘故,默认过滤的使用经常导致与Karlin-Altschul犯规。 
如上所述,用于本发明的该示范性方面并被用来测定图11中值的默认值包括: 
“低复杂性过滤器(Filter for low complexity):开启(ON) 
>字长:3 
>矩阵:Blosum62 
>缺口成本:存在值:11 
>延伸:1” 
其它的默认值设置为:低复杂性过滤器关闭(off),蛋白质字长为3,BLOSUM62矩阵,缺口存在罚值-11,并且缺口延伸罚值-1。 
示范性的NCBI BLAST 2.2.2程序设置在下面的实施例1中阐明。注意,“-W”选项默认值为0。这是指,如果没有设置,对于蛋白,字长默认值为3,对于核苷酸,字长默认值为11。 
计算机系统和计算机程序产品
为了确定和鉴定序列同一性、结构同源性、基序等等,本发明的多肽或核酸序列可以在计算机可以读取和访问的任何介质上储存,记录和操作。相应地,本发明提供计算机,计算机系统,计算机可读介质,计算机程序产品和类似物,在其上记录和储存有本发明的核酸和多肽序列,例如,本发明的示例性序列,如,SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7、SEQ ID NO:8,等。正如在此使用的,词语“记录”和“存储”是指将信息存储到计算机介质中的过程。技术人员很容易地采用任何已知的方法将信息记录到计算机可读介质上,从而产生包括发明的一个或者多个核酸和/或多肽序列的产品。 
本发明的另一方面是其上已记录有发明的至少一个核酸和/或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质、闪存。例如,计算机可读介质可以是硬盘、软盘、磁带、闪存、CD-ROM、数码多功能光盘(DVD)、随机存储器(RAM)、或只读存储器(ROM)或本领域技术人员知道的任何类型的介质。 
本发明的方面包括系统(如,以因特网为基础的系统),特别地计算机系统,其存储和操作在此描述的序列和序列信息。计算机系统100的一个例子描述在图1的方块图中。正如在此所使用的,“计算机系统”是指用于分析本发明的核苷酸和多肽序列的硬件组件、软件组件以及数据存储组件。计算机系统100可以包括用于序列数据处理、访问和操作的处理器。处理器105可以是任何已知类型的中央处理器如,例如,Intel公司的奔腾III处理器或者Sun,Motorola,Compaq、AMD或者International Business Machines(IBM)类似的处理器。计算机系统100是一种通用系统,其包括处理器105和用于存储数据的一个或者多个内部数据存储组件110,和一个或者多个用于检索存储于数据存储装置的数据的数据检索装置。本领域技术人员可以很容易地知道,任何一个目前可得到的计算机系统是合适的。 
在一方面,计算机系统100包括连接于总线(bus)的处理器105,该总线连接于主存储器115(优选地,作为RAW执行)和一个或者更多的内部数据存储装置110,如硬盘驱动器和/或其上存储有数据的其它计算机可读介质。计算机系统100可以进一步包括一个或者多个用于读取存储于内部数据存储装置110上的数据的数据检索装置118。 
数据检索装置118可以为,例如,软盘驱动器、光盘驱动器、磁带驱动器,或者可以(如通过因特网)连接于远端数据存储系统的调制解调器等等。在一些 实施方案中,内部的数据存储装置110是可移动的计算机可读介质,例如含有控制逻辑和/或在其中记录有数据的软盘、光盘、磁带等。有利的是,计算机系统100可以包括或运行适当的软件程序,从插入到数据检索装置中的数据存储部分读取控制逻辑和/或数据。 
计算机系统100包括用于给计算机应用者显示输出的结果的显示器120。应当注意到,计算机系统100可以在网络中或者宽域网中与其它的计算机系统125a-c相联,提供集中化的计算机系统100访问。访问和处理本发明的核苷酸或者氨基酸序列的软件可以在执行过程中驻留在主存储器115中。 
在一些方面,计算机系统100可以进一步包括比较发明的核酸序列的序列比较算法。算法和序列可以储存在计算机可读的介质中。“序列比较算法”是指一个或多个程序,其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数据储存装置中存储的其它的核苷酸序列和/或化合物。例如,序列比较算法可将储存在计算机可读介质上的示范性序列,例如SEQ ID NO:1,SEQ ID NO:2,SEQID NO:3,SEQ ID.NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SBQ ID NO:8等的核苷酸序列与储存在计算机可读介质上的参考序列比较,以鉴定同源性或结构基序。 
以上算法应用的参数可以依据所研究的序列长度和同源性水平而加以调整。在一些方面,在使用者没有给出指令的情况下,算法使用的参数可以应用默认参数。图2是说明过程200的一个方面的流程图,这个处理过程是为了确定新序列和数据库中的序列间的同源性水平,把新的核苷酸或者蛋白序列与数据库中的序列加以比较。含有序列的数据库可以是存储于计算机系统100的私人数据库,或者公共的数据库,如通过因特网可以访问到的GENBANK。过程200开始于起始状态201,然后移至状态202,其中待比较的新序列存储在计算机系统100的存储器上。如上讨论,存储器可以是任何形式的存储器,包括RAM或者内部存储设备。 
过程200然后移至状态204,其中序列数据库被打开以用于分析和比较。然后,过程200移至状态206,其中存储在数据库的第一个序列读取到计算机的存储器中。然后在状态210中进行比较,确定第一序列是否与第二序列相同。重要的是,注意到这一步骤并不限于在所述新序列和数据库中的第一序列间进行准确的比较。本领域技术人员熟知比较两个核苷酸或者蛋白序列的方法,尽管它们并不完全相同。例如,为了提高两个待测序列间的同源性水平,可以在一个序列中引入空位。在比较过程中控制是否往序列中引入空位或者其它特征的参数一般由计算机系统的使用者输入。 
一旦在状态210下进行两个序列的比较,在决定状态210下作出两个序列是否相同的决定。当然,术语“相同”并不限于绝对相同的序列。在过程200中,在使用者输入的同源性参数范围内的序列将标记为“相同”。如果决定了两个序列是相 同的,过程200移至状态214,其中给使用者显示了来自数据库的所述序列的名称。这一状态可以告诉使用者具有被显示的名称的序列满足输入的同源性限制。一旦被存储的序列的名称显示给使用者,过程200移至决定状态218,其中确定在数据库中是否存在更多的序列。如果在数据库中没有更多的序列存在,那么过程200终止于结束状态220。然而,如果在数据库中存在更多的序列,那么过程200移至状态224,其中指示器移至数据库的下一个序列以便可以与所述的新序列比较。以这种方式,所述的新序列与数据库中的每一个序列进行联配和比较。 
应当注意,如果在决定状态212作出了决定,序列没有同源性,那么过程200将立即移至决定状态218,以确定在数据库中是否有任何其它的序列用于比较。同样地,发明的一方面是包括处理器,其上储存有本发明的核酸序列的数据存储装置以及用于进行比较的序列比较器的计算机系统。序列比较器可以指示待比较序列之间的同源性水平或者鉴定结构基序,或者可以确定与这些核酸代码和多肽代码相比较的序列中的结构基序。 
图3是说明在计算机中确定两个序列是否具有同源性的过程250的一个实施方案的流程图。过程250开始于起始状态252,然后移至状态254,其中待比较的第一序列被存储于存储器中。待比较的第二序列然后在状态256被存储于存储器中。过程250然后移至状态260,其中读取第一序列的第一个字符,然后到状态262,其中读取第二序列的第一个字符。应当理解,如果序列是核苷酸序列,那么所述字符一般将是A、T、C、G或者U。如果序列是蛋白质序列,那么它可以是单字母的氨基酸代码,以便第一序列和第二序列可以很容易地进行比较。然后在决定状态264作出是否两个字符是否相同的确定结果。如果它们是相同的,那么过程250移至状态268,其中读取第一序列和第二序列的下一个字符。然后确定所述的下一字符是否相同。如果相同,那么过程250继续这一循环直到两个字符是不同的。如果确定了接下来的两个字符并不相同,过程250移至决定状态274,确定在两个序列中是否有任何更多的字符要读取。如果没有任何更多的字符被读取,那么过程250移至状态276,其中第一序列和第二序列的同源性水平显示给使用者。通过计算序列间相同字符占第一序列中字符总数的比例来确定同源性水平。这样,如果第一个100核苷酸序列的每一个字符都与第二序列的每一个字符联配,那么同源性水平将是100%。 
可选择地,计算机程序可以比较参照序列与本发明的序列,以确定是否序列在一个或者多个位置上不同。程序可以记录本发明序列或参照序列中插入、缺失或者替换的核苷酸或者氨基酸残基的长度和同一性。计算机程序可以是确定是否参照序列与本发明的序列相比,含有单核苷酸多态性(SNP),或者是否本发明的序列含有已知序列的SNP的程序。因此,在一些方面,计算机程序是鉴定SNPs的程序。该方法可以通过以上描述的计算机系统和描述在图3中的方法来完成。 
该方法可以通过应用计算机程序读取本发明序列和参照序列,并且用计算机程序来鉴定差异来进行。 
在其他方面,以计算机为基础的系统包括鉴定本发明的核酸或者多肽中的特征的标识符(identifier)。“标识符”是指鉴定核酸序列中的某些特征的一个或者多个程序。例如,标识符可以包括鉴定核酸序列中的开放阅读框架(ORF)的程序。图4是说明用于检测序列中特征存在与否的标识符过程300的一个方面的流程图。过程300起始于起始状态302,然后移至状态304,其中待检测特征的第一序列存储于计算机系统100的存储器115上。过程300然后移至状态306,在该状态下,打开具有序列特征的数据库。这样数据库将包括一系列每一个特征的属性和特征的名称。例如,特征名称可以是“起始密码子”,特征属性为“ATG”。另一个例子是特征名称为“TAATAA盒”,特征属性为“TAATAA”。这样的数据库的例子是由威斯康辛大学遗传学计算机组(University of Wisconsin Genetics ComputerGroup)制作。可选择地,特征可以是结构多肽基序,如α螺旋、β折叠,或者功能性多肽基序,如酶的活性位点、螺旋-转角-螺旋基序或者本领域技术知道的其他基序。一旦在状态306打开特征数据库,过程300移至状态308,其中第一特征从数据库中读取。然后在状态310中进行第一特征的属性与第一序列的比较。然后在决定状态316下作出决定,是否在第一序列中发现所述特征的属性。如果发现该属性,过程300移至状态318,其中所发现的特征的名称显示给使用者。过程300然后移至决定状态320,在其中作出是否在数据库中存在更多的特征的决定。如果不存在更多的特征,过程300终止于结束状态324。然而,如果数据库中确实存在有更多的特征,那么过程300在状态326读取下一个序列特征,并且循环回到状态310,其中该下一个特征的属性与第一序列进行比较。如果在决定状态316中所述特征的属性没有在所述第一序列中发现,那么为了决定在数据库中是否存在更多特征,过程300直接移至决定状态320。因此,在一方面,本发明提供了鉴定开放阅读框架(ORFs)的计算机程序。 
本发明的核酸序列,或本发明的多肽序列可在各种数据处理程序中以多种格式被储存和进行操作。例如,本发明的核酸序列,或本发明的多肽序列,可以以文本形式储存在字处理文件如Microsoft WORD或WORDPERFECT中,或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程序如DB2、SYBAS或ORACL中。另外,许多计算机程序和数据库都可用作序列比较算法、标识符、或参考核苷酸序列或多肽序列的来源,所述参考核苷酸序列或多肽序列要与本发明的核酸序列进行比较。用于实践本发明的程序和数据库包括,但不限于:MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine(MolecularApplications Group)、Look(Molecular Applications Group)、MacLook(MolecularApplications Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci. USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(Molecular Simulations Inc.)、Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular SimulationsInc.)、Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm(Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.),Homology(Molecular Simulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(MolecularSimulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLab Diversity Explorer(Molecular SimulationsInc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular SimulationsInc.)、MDL可用化学制品目录数据库(Available Chemicals Directory database)、MDL药品数据报告数据库(Drug Data Report data base)、综合医药化学数据库(Comprehensive Medicinal Chemistry database)、德温特世界药物索引数据库(World Drug Index database)、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。其它的程序和数据库对于本公开内容的所述技术领域内的技术人员是显而易见的。 
应用以上的程序可能检测到的基序包括:编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化作用位点、泛素化位点、α螺旋、β折叠、编码引导被编码蛋白的分泌的信号肽的信号序列、涉及转录调控的序列如同源框、酸性伸展(acidicstretches)、酶的活性位点、底物结合位点以及酶切割位点。 
核酸的杂交
本发明提供了可在严格条件下与本发明的示例性序列例如在SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ IDNO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ IDNO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、 SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ IDNO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ IDNO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173中阐明的序列或者编码包括在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ IDNO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ IDNO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ IDNO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ IDNO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ IDNO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ IDNO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ ID NO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ IDNO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ IDNO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ IDNO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172或SEQ ID NO:174中阐明的序列的多肽的核酸杂交的分离的或者重组的核酸。严格条件可以是高度严格条件,中度严格条件,低度严格条件,包括在此描述的高度的和降低的严格条件。在可选择的方面,本发明的核酸根据它们在严格条件下杂交的能力来定义,它们可以在大约5个残基到某分子例如本发明的示范性核酸的全长之间。例如,它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400个或更多个残基。比全长核酸较短的核酸也包括在内。这些核酸可以用作如,杂交探针、标记探针、PCR寡核苷酸探针、iRNA(单链或者双链)、编码抗体结合肽(表位)的序列或反义序列、基序、活性位点、结合结构域、调控结构域以及类似物。 
在一方面,本发明的核酸通过其在高的严格条件下杂交的能力定义,该高严格性包括条件为大约37℃到42℃,大约50%的甲酰胺。在一方面,本发明的核酸通过其在降低的严格条件下杂交的能力定义,该降低的严格性包括条件为大约30℃到35℃,大约35%到25%的甲酰胺。可选择地,本发明的核酸通过其可以在 高严格条件下杂交的能力定义,该高严格性包括条件为42℃,50%的甲酰胺中,5×SSPE,0.3%的SDS,封闭核酸重复序列,如cot-1或者鲑鱼精DNA(例如,200n/ml剪切的和变性的鲑鱼精DNA)。在一方面,本发明的核酸通过其在降低的严格条件下杂交的能力定义,该降低的严格性条件包括降低的温度35℃,35%的甲酰胺。 
杂交以后,滤膜可以在50℃,用6×SSC,0.5%的SDS洗涤。超过25%的甲酰胺,这些条件认为是“中度”条件,低于25%的甲酰胺,这些条件认为是“低度”条件。“中度”杂交条件的一个特定例子是上面的杂交在甲酰胺为30%时进行。“低严格性”杂交条件的特定例子是上面的杂交在甲酰胺为10%时进行。 
与特定水平的严格性相对应的温度范围可以进一步通过计算感兴趣的核酸中嘌呤与嘧啶的比例,并且相应地调节温度来缩小。本发明的核酸也通过其在Ausubel和Sambrook中所述的高度、中度、低度严格条件下杂交的能力来定义。对上面的范围和条件所作的变化可以用于实施本发明,并且是本领域技术人员所熟知的。下面进一步描述了杂交条件。 
寡核苷酸探针和应用方法
本发明也提供了用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探针。一方面,探针包括在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47、SEQ ID NO:49、SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:65、SEQ ID NO:67、SEQ ID NO:69、SEQ ID NO:71、SEQ ID NO:73、SEQ ID NO:75、SEQ ID NO:77、SEQ ID NO:79、SEQ ID NO:81、SEQ ID NO:83、SEQ ID NO:85、SEQ ID NO:87、SEQ ID NO:89、SEQ ID NO:91、SEQ ID NO:93、SEQ ID NO:95、SEQ ID NO:97、SEQ ID NO:99、SEQ ID NO:101、SEQ ID NO:103、SEQ ID NO:105、SEQ ID NO:107、SEQ ID NO:109、SEQ ID NO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ IDNO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ IDNO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ IDNO:153、SEQ ID NO:155、SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ ID NO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171或SEQ ID NO:173中阐述的序列的至少10个连续的碱基。可选择地,本发明的探针可以是本发明的序列中所阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、50、55、 60、65、70、75、80、90、100或150,或更多,或大约10到50、大约20到60、大约30到70个连续碱基。这些探针通过结合或者杂交来鉴定核酸。这些探针可以用于本发明的阵列中,见下面的讨论,包括,例如,毛细管阵列。本发明的探针也可以用于分离其它的核酸或多肽。 
本发明的探针可以用于确定是否生物样品,如土壤样品,含有具有本发明的核酸序列的生物或者可以从其获得该核酸的生物。在这样的程序中,获得潜在地隐藏了可从其分离得到核酸的生物体的生物样品,并且从该样品获得核酸。在允许探针与样品中存在的任何互补序列特异性杂交的条件下,将核酸与探针接触。在必要的情况下,为了确定允许探针特异地与互补序列杂交的条件,可以让探针与来自已知含有互补序列的样品中的互补序列相接触,同时与不含有互补序列的对照序列相接触。杂交条件,如杂交缓冲液中的盐浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度,可以进行被变化以确定允许所述探针特异地与互补的核酸杂交的条件(参见有关特异性杂交条件的论述)。 
如果样品含有可以从其中分离出所述核酸的生物体,那么探针的特异性杂交可以被检测到。杂交可以通过使用可检测试剂标记所述探针来检测,所述的可检测试剂例如放射性同位素、荧光染料或者能够催化形成可检测产物的酶。使用标记探针来检测在样品中存在的互补核酸的很多方法对于本领域技术人员是熟悉的。这些方法包括Southern印迹、Northern印迹、菌落杂交方法以及点印迹。这些程序中的每一个的方案在Ansubel和Sambrook中给出。 
作为选择,可以在一个扩增反应中使用一种以上的探针(其中的至少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含有包括本发明的核酸序列的生物体(如,从中分离出所述核酸的生物体)。在一方面,所述探针包括寡核苷酸。一方面,所述扩增反应可以包括PCR反应。PCR的实验方案见前面Ausubel和Sambrook的如上的所述(参见有关扩增反应的讨论)。在这些程序中,所述样品中的核酸与所述探针相接触,进行所述扩增反应,检测任何得到的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳,并用嵌入剂如溴化乙啶染胶来进行检测。可选择地,一种或者多种探针可以用放射性同位素标记,并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物的存在。 
源自位于本发明序列的3’或者5’末端附近的序列的探针也可以用于染色体移步(chromosome walking)程序中,以鉴定含有另外的序列如基因组序列的克隆。这样的方法允许从宿主生物体中分离出编码其他感兴趣的蛋白的基因。 
在一方面,本发明的核酸被用作探针来鉴定和分离相关的核酸。在一些方面,所述的相关的核酸可以是来自某些生物体的cDNA或者基因组DNA,但是这些生物体不是本发明的核酸起初被分离出来的那些生物体。在这样的程序中,核酸样品与所述探针在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体的核酸的杂交然后采用以上描述的任何方法来检测。 
在核酸杂交反应中,用于达到特定严格水平的条件可以根据待杂交核酸的性质来进行改变。例如,在选择杂交条件时要考虑核酸杂交区域的长度、互补程度、核苷酸序列组成(如,GC对AT含量的比率)、以及核酸类型(如,RNA对DNA)。另外考虑是否其中一个核酸固定于,如滤膜上。杂交可以在低严格性,中度严格性或者高严格性的条件下进行。作为核酸杂交的例子,含有固定化变性核酸的聚合物膜首先在45℃下,在由0.9M NaCl、50mM NaH2PO4,pH 7.0、5.0mMNa2EDTA、0.5%SDS、10×Denhardt′s和0.5mg/ml多核腺苷酸组成的溶液中预杂交30分钟。然后将大约2×107cpm(比活性4-9×108cpm/ug)的32P末端标记的寡核苷酸探针加入到溶液中。在12-16小时的温育以后,膜在室温(RT)下于含有0.5%SDS的1×SET(150mM NaCl、20mM Tris盐酸,pH 7.8、1mM Na2EDTA)中洗涤30分钟,然后在新鲜配制的1×SET,在Tm-10℃下,再洗涤寡核苷酸探针30分钟。然后将膜暴露于自显影膜上来检测杂交信号。 
通过改变用于鉴定核酸,如与可检测探针杂交的cDNA或者基因组DNA的杂交条件的严格性,可以鉴定和分离与探针具有不同同源性水平的核酸。可以通过在低于探针的解链温度下改变温度进行杂交而使严格性变化。解链温度,Tm,是指(在定义的离子强度和pH下)50%的靶序列与精确互补的探针杂交的温度。非常严格的条件被选择为与特定的探针的Tm值相等或比其低大约5℃。探针的解链温度可以通过应用以下的经验公式计算:对于在14到70个核苷酸长度的探针,应用此公式计算解链温度:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中的N是探针的长度。如果杂交在含有甲酰胺的溶液中进行,解链温度可以通过应用以下的公式来计算:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其中的N是探针的长度。预杂交可以在6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg变性的鲑鱼精DNA片段或者6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg变性的鲑鱼精DNA片段、50%甲酰胺中进行。SSC和Denhardt′s和其他溶液的配方列于例如Sambrook中。 
通过在以上所列的预杂交溶液中加入可以检测到的探针来进行杂交。当所述探针包括双链DNA时,它应在加入到杂交缓冲液前被变性。滤膜与杂交缓冲液接触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA或者基因组DNA杂交。对于超过200个核苷酸长度的探针,杂交的过程可以是在低于Tm温度15-25℃进行。对于较短的探针,如寡核苷酸探针,杂交的过程可以是在低于Tm温度5-10℃下进行。在一个方面,在6×SSC溶液中的杂交过程在大约68℃进行。在一个方面,在含有50%甲酰胺的溶液中的杂交在大约42℃进行。考虑所有前述的杂交在高严格条件下进行。 
杂交以后,洗涤滤膜以去除任何非特异结合的可检测探针。洗涤滤膜所用的严格性也可以根据正被杂交的核酸的性质、正被杂交的核酸的长度、互补的程度,核苷酸序列的组成(如,GC对AT的含量),以及核酸类型(如,RNA对 DNA)来进行变化。逐渐增高的严格条件洗涤的例子如下:2×SSC,0.1%SDS,室温下15分钟,(低严格性);0.1×SSC,0.5%SDS,室温下30分钟到1小时(中度严格性);0.1×SSC,0.5%SDS,杂交温度和68℃之间,15到30分钟(高严格性);0.15M NaCl,在72℃下15分钟(极高严格性)。最后的低严格性洗涤可以在0.1×SSC,室温下进行。以上的例子仅仅示出了可以用于实施本发明,例如洗涤滤膜的一组条件。本领域技术人员将知道,对于不同严格性洗涤有无数方案,所有这些方案都可以用于实施本发明。 
已经与探针杂交的核酸可以通过放射自显影或者其它传统的技术来确定。可以改变以上的程序来鉴定具有与探针序列具有降低水平的同源性的核酸。例如为了获得与可检测探针具有降低水平的同源性的核酸,可以应用不太严格的条件。例如,在含有Na+浓度为大约1M的杂交缓冲液中,杂交温度可以以5℃的幅度从68℃降低到42℃。杂交后,滤膜用2×SSC,0.5%SDS,在杂交温度下洗膜。超过50℃,这些条件认为是“中度”条件,低于50℃,这些条件认为是“低度”条件。“中度”杂交条件的例子是上面的杂交在55℃进行。“低严格性”杂交条件的特定例子是上面的杂交在45℃进行。 
可选择地,杂交在缓冲液,如含有甲酰胺的6×SSC中,在42℃下进行。在这种情况下,杂交缓冲液中甲酰胺的浓度可以以5%的幅度从50%降低到0%,以鉴定与探针具有降低的同源性水平的克隆。杂交后,滤膜可以用6×SSC,0.5%SDS在50℃下洗涤。认为当甲酰胺浓度大于25%时为“中度”条件,而低于25%时为“低度”条件。“中度”杂交条件的特定例子是当以上的杂交在30%的甲酰胺中进行时。“低严格性”杂交条件的特定例子是当以上的杂交在10%的甲酰胺中进行时。 
本发明的这些探针和方法可以用于分离具有与本发明的核酸序列有至少大约99%、至少98%、至少97%、至少96%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或者至少50%同源性的序列的核酸,所述本发明的核酸序列包括它们的至少大约10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或者500个连续的碱基,和与之互补的序列。同源性可以应用在此所述的比对算法测定。例如,同源的多核苷酸可以具有在此描述的其中一个编码序列的天然发生的等位基因突变体的编码序列。当与本发明的核酸比较时,这样的等位基因突变体可以具有一个或者多个核苷酸的取代、缺失或者添加。 
此外,本发明的探针和方法可以用于分离编码与本发明多肽具有至少大约99%,至少95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少55%或者至少50%序列同一性(同源性)的多肽的核酸,正如应用序列比对算法(如,使用默认参数的FASTA版本3.0t78的算法,或者具有在此阐明的示范性设置的BLAST 2.2.2程序)确定的,所述本发明多肽包括 它们的至少5、10、15、20、25、30、35、40、50、75、100或者150个连续的氨基酸。 
抑制磷脂酶的表达
本发明进一步提供与本发明的核酸序列如磷脂酶编码核酸互补的核酸(如,本发明的核酸序列的反义序列)。反义序列可以抑制磷脂酶编码基因的转运,剪接或者转录。抑制可以通过靶向基因组DNA或者信使RNA而起作用。例如,通过杂交和/或切割,可以抑制被靶向的核酸的转录或者功能。本发明提供的特别有效的一套抑制物包括能够结合磷脂酶基因或者信息的寡核苷酸,在每一种情况下,都可阻止或者抑制磷脂酶的产生或者发挥功能。结合是通过序列特异性的杂交实现的。另一类有用的抑制物包括引起磷脂酶信息失活或者切割的寡核苷酸。该寡核苷酸可以具有引起此种切割的酶活性,如核酶。该寡核苷酸可以进行化学修饰,或者偶联到能够切割互补核酸的酶或组分上。人们可以筛选具有许多不同的此类寡核苷酸的文库,以获得那些具有期望的活性的寡核苷酸。 
磷脂酶表达的抑制可以具有多种不同的工业用途。例如,抑制磷脂酶的表达可以减慢或者阻止酸败。当脂类或多肽,如,结构脂类或者多肽,被酶促降解时,可能发生酸败。这可以导致水果和蔬菜的变质或者腐败。一方面,应用可以抑制磷脂酶的表达和/或活性的本发明组合物,例如,抗体、反义寡核苷酸、核酶和RNAi,可以用于减缓或者阻止酸败。因此,在一方面,本发明提供方法和组合物,包括将本发明的抗体、反义寡核苷酸、核酶和RNAi应用于植物或者植物产品(如,水果、种籽、根、叶等),以阻止或者延缓酸败。这些组分也可以由植物(如,转基因植物)或者其它生物(如,用本发明的磷脂酶基因转化的细菌或者其它微生物)表达。 
用于抑制磷脂酶表达的本发明的组分(如反义物、iRNA、核酶、抗体)可以用作药物组分。 
反义寡核苷酸 
本发明提供能够结合磷脂酶信息的反义寡核苷酸,该反义寡核苷酸可以通过靶向mRNA来抑制磷脂酶活性。设计反义寡核苷酸的策略在科学和专利文献中已经充分说明,并且技术人员可以应用本发明的新的试剂来设计这样的磷脂酶寡核苷酸。例如,用于筛选有效的反义寡核苷酸的基因步行/RNA作图试验方案是本领域所熟知的,参见,如,Ho(2000)Methods Enzymol.314:168-183,该文献描述了RNA作图分析方法,该作图分析方法以标准的分子技术为基础,为有效的反义序列选择提供了简单而可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。 
也可以应用天然存在的核酸作为反义寡核苷酸。反义寡核苷酸可以是任何长度;例如,在可选择的方面,反义寡核苷酸在大约5到100、大约10到80、大约15到60、大约18到40之间。最佳长度可以通过常规的筛选方法来确定。反义 寡核苷酸可以以任何浓度存在。最佳浓度可以通过常规的筛选方法来确定。已经知道有许多能够解决该潜在的问题的合成的,非天然存在的核苷和核酸类似物。例如,可以应用含有非离子性骨架,如N-(2-氨基乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有硫代磷酸连接的反义寡核苷酸,如,WO 97/03211;WO 96/39154;Mata(1997)Toxicol Appl Pharmacol 144:189-197;AntisenseTherapeutics,ed.Agrawal(Humana Press,Totowa,N.J.,1996)所述。本发明提供的具有合成的DNA骨架类似物的反义寡核苷酸也可以包括磷-二硫代、甲基磷酸盐、磷阿米酮、烷基磷三酯、氨基磺酸盐、3’-硫代乙缩醛、甲叉(甲基亚胺)、3′-N-氨基甲酸酯剂和吗啉代氨基甲酸酯核酸,如以上所述。 
可以应用组合化学的方法产生大量的寡核苷酸,可以对这些寡核苷酸快速筛选,以获得对任何靶,如本发明的有义和反义磷脂酶序列,具有适当的结合亲和性和特异性的特定的寡核苷酸(见,如,Gold(1995)J.of Biol.Chem.270:13581-13584)。 
抑制性核酶 
本发明提供可以结合磷脂酶信息的核酶,其可以通过靶向mRNA来抑制磷脂酶的酶活性。设计核酶和选择用于靶向作用的对磷脂酶具特异性的反义序列在科学和专利文献中已经充分说明,并且技术人员可以应用本发明的新型试剂来设计这样的核酶。核酶通过核酶的靶RNA结合部分结合靶RNA起作用,该核酶的靶RNA结合部分与切割靶RNA的RNA的酶活部分非常接近。因此,核酶通过互补的碱基配对作用识别并且结合靶RNA,并且一旦结合于正确的位点,将酶法切割靶RNA并且使靶RNA失活。如果切割发生在编码序列中,以这种方式进行的靶RNA的切割将破坏其指导编码蛋白合成的能力。当核酶结合并且切割其靶RNA后,一般情况下,将从RNA上释放,因此能够反复地结合和切割新的靶标。 
在一些情况下,核酶的酶本质决定了其比其它技术如反义技术(其中核酸分子简单地结合于核酸靶来阻止其转录、翻译或者与其它分子的缔合)更优越,这是因为导致有效治疗作用所必需的有效的核酶浓度低于反义寡核苷酸的浓度。这一潜在的优点反映了核酶可以以酶的方式起作用的能力。由此,单个核酶分子可以切割靶RNA的很多分子。此外,核酶是典型的高度特异性的抑制剂,其抑制的特异性不仅仅依赖于结合的碱基配对机制,也依赖于分子抑制其结合的RNA表达的机制。即,抑制是通过切割RNA靶来引起的,因此特异性是通过靶向的RNA的切割速率与非-靶向的RNA的切割速率之比来定义。该切割机制取决于参与碱基配对的因素以外的因素。因此,核酶的特异性作用高于结合于同一个RNA位点的反义寡核苷酸的作用。 
具有酶活的核酶RNA分子可以以锤头基序(hammerhead motif)形成,但也可以以发夹、肝炎δ病毒、I类内含子或者RNaseP样RNA(与RNA的引导序列有关)基序形成。Rossi(1992)Aids Research and Human Retroviruses 8:183描 述了此类锤头基序的例子;Hampel(1989)Biochemistry 28:4929,和Hampel(1990)Nuc.Acids Res.18:299中描述了发夹基序;Perrotta(1992)Biochemistry 31:16中描述了肝炎δ病毒基序;Guerrier-Takada(1983)Cell 35:849中描述了RNaseP基序;Cech美国专利4,987,071中描述了I类内含子。描述这些特异基序的目的不是限制性的;本领域技术人员将认识到,本发明的酶RNA分子具有与一个或者多个靶基因RNA区域互补的特异性底物结合位点,并且具有在底物结合位点内或者周围赋予该分子以RNA切割活性的核苷酸序列。 
RNA干涉(RNAi) 
在一方面,本发明提供包括本发明的磷脂酶序列的RNA抑制分子,即所谓的“RNAi”分子。RNAi分子包括双链RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表达。一方面,RNAi是长度为大约15、16、17、18、19、20、21、22、23、24、25或者更长的双螺旋核苷酸。虽然发明并不受限于任何特别的作用机理,但是RNAi可以进入细胞,并且引起相似或相同序列的单链RNA(ssRNA),包括内源性mRNA的降解。当细胞暴露于双链RNA(dsANA)时,来自同源基因的mRNA被称为RNA干涉(RNAi)的过程选择性地降解。RNAi背后的可能的基本机理是,将与特定的基因序列匹配的双链RNA(dsANA)断裂形成称之为短干扰RNA的短片段,该短片段可以触发与其序列匹配的mRNA的降解。在一方面,本发明的RNAi在基因沉默治疗中使用,参见,例如Shuey(2002)Drug Discov.Today7:1040-1046。在一方面,本发明提供使用本发明的RNAi选择性降解RNA的方法。该方法可以在体外、离体或在体内进行。一方面,本发明的RNAi分子可以用于在细胞,器官或动物内产生功能丧失的突变。产生RNAi分子和使用RNAi分子选择性降解RNA的方法在本领域是众所周知的,参见,例如美国专利6,506,559;6,511,824;6,515,109;6,489,127。 
核酸修饰
本发明提供产生本发明的核酸例如那些编码磷脂酶的核酸的变体的方法。在可选择的实施方案中,本发明提供了修饰本发明的酶的方法,例如通过随意或随机方法,或非随机方法或定向进化方法,诸如基因位点饱和诱变TM(GSSMTM)对其编码序列进行突变,以改变酶的活性pH范围或最佳活性pH范围,活性温度范围或最佳活性温度范围、特异性、活性(动力学);酶对糖基化、磷酸化或金属(例如Ca、Mg、Zn、Fe、Na)的应用,例如以影响pH/温度稳定性。本发明提供了修饰本发明的酶的方法,例如通过GSSMTM对其编码序列进行突变,以增加它对蛋白酶活性的抗性。本发明提供了修饰本发明的酶的方法,例如通过GSSMTM对其编码序列进行突变,以改变酶对Ca、Mg、Na具有特异性但不会螯合Zn的金属螯合剂的应用。本发明提供了修饰本发明的酶的方法,例如通过GSSMTM对其编码序列进行突变,其将具有期望的活性组合,例如PI、PA和PC/PE特异性PLCs。 
这些方法可以重复或者在不同的组合中使用,产生与模板核酸编码的磷脂酶相比具有改变的或不同的活性或者改变的或不同的稳定性的磷脂酶。这些方法也可以重复或者在不同的组合中使用,例如,产生基因/信息表达、信息翻译或者信息稳定性上的变化。另一方面,细胞的遗传组分可以通过,例如离体的同源基因修饰,然后再插入细胞中而加以改变。 
本发明的核酸可以通过任何方法改变。例如,无规或随机方法,或者,非随机方法,或者“定向进化”方法。 
基因的随机突变的方法在本领域是众所周知的,见,例如,美国专利5,830,696。例如,诱变剂可以用于随机突变基因。诱变剂包括,例如,紫外光或者γ-辐射,或者化学诱变剂,例如,丝裂霉素、亚硝酸、光致活性补骨脂素,它们单独使用或组合使用,以诱导可以通过重组进行修复的DNA断裂。其他化学诱变剂包括,例如,重亚硫酸钠、亚硝酸、羟胺、肼或者甲酸。其他诱变剂是核苷酸前体的类似物,例如,亚硝基胍,5-溴尿嘧啶,2-氨基嘌呤,或者吖啶。这些试剂可以代替核苷酸前体加入到PCR反应中,从而使序列突变。也可以使用嵌入试剂例如原黄素、吖啶黄、阿的平和类似物。 
可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如,Rice(1992)Proc.Natl.Acad.Sci.USA 89:5467-5471;或者组合式多重盒式诱变,参见如,Crameri(1995)Biotechinques 18:194-196。可选择地,核酸,如基因,可以在无规或“随机”片段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793.。在可选择的方面,修饰、增加或者删除可以通过易错PCR、重排、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因重装配、基因位点饱和诱变TM(GSSMTM)、合成连接重装配(SLR)、重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成、和/或者这些方法和其它方法的组合产生。 
以下的出版物描述了各种递归重组程序和/或可以整入到本发明的方法中的方法:Stemmer(1999)“Molecular breeding of viruses for targeting and other clinicalproperties”Tumor Targeting 4:1-4;Ness(1999)Nature Biotechnology 17:893-896;Chang(1999)“Evolution of a cytokine using DNA family shuffling”NatureBiotechnology 17:793-797;Minshull(1999)“Protein evolution by molecularbreeding”Current Opinion in Chemical Biology 3:284-290;Christians(1999)“Directedevolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17:259-264;Crameri(1998)“DNA shuffling of a family of genesfrom diverse species accelerates directed evolution”Nature 391:288-291;Crameri (1997)“Molecular evolution of an arsenate detoxification pathway by DNAshuffling”Nature Biotechnology 15:436-438;Zhang(1997)“Directed-evolution of aneffective fucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94:4504-4509;Patten等(1997)“Applications of DNA Shuffling toPharmaceuticals and Vaccines”Current Opinion in Biotechnology 8:724-733;Crameri等(1996)“Construction and evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2:100-103;Crameri等(1996)“Improved green fluorescent proteinby molecular evolution using DNA shuffling”Nature Biotechnology 14:315-319;Gates等(1996)“Affinity selective isolation of ligands from peptide libraries through displayon a lac repressor ′headpiece dimer′”Journal of Molecular Biology 255:373-386;Stemmer(1996)“Sexual PCR and Assembly PCR”In:The Encyclopedia of MolecularBiology.VCH Publishers,New York.447-457页;Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations of mutant andwildtype cassettes”BioTechniques 18:194-195;Stemmer等(1995)“Single-stepassembly of a gene and entire plasmid form large numbers ofoligodeoxyribonucleotides”Gene,164:49-53;Stemmer(1995)“The Evolution ofMolecular Computation”Science 270:1510;Stemmer(1995)“Searching SequenceSpace”Bio/Technology 13:549-553;Stemmer(1994)“Rapid evolution of a protein invitro by DNA shuffling”Nature 370:389-391;和Stemmer(1994)“DNA shuffling byrandom fragmentation and reassembly:In vitro recombination for molecularevolution”Proc.Natl.Acad.Sci.USA 91:10747-10751。 
产生多样性的突变方法包括,例如,定点诱变(Ling等.(1997)“Approachesto DNA mutagenesis:an overview”Anal Biochem.254(2):157-178;Dale等(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57:369-374;Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19:423-462;Botstein & Shortle(1985)“Strategies and applications of in vitromutagenesis”Science 229:1193-1201;Carter(1986)“Site-directed mutagenesis”Biochem.J.237:1-7;Kunkel(1987)“The efficiency of oligonucleotide directedmutagenesis”在Nucleic Acids & Molecular Biology(Eckstein,F.和Lilley,D.M.J.eds.,Springer Verlag,Berlin));使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等(1987)“Rapid and efficient site-specificmutagenesis without phenotypic selection”Methods in Enzymol.154,367-382;和Bass等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242:240-245);寡核苷酸诱导的定点诱变(Methods in Enzymol.100:468-500(1983);Methods in Enzymol.154:329-350(1987);Zoller & Smith(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient and general procedure for the production of point mutations in any DNA fragment”NucleicAcids Res.10:6487-6500;Zoller & Smith(1983)“Oligonucleotide-directedmutagenesis of DNA fragments cloned into M13 vectors”Methods in Enzymol.100:468-500和Zoller & Smith(1987)Oligonucleotide-directed mutagenesis:a simplemethod using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等(1985)“The use of phosphorothioate-modified DNA in restriction enzyme reactions to preparenicked DNA”Nucl.Acids Res.13:8749-8764;Taylor等(1985)“The rapid generationof oligonucleotide-directed mutations at high frequency usingphosphorothioate-modified DNA”Nucl.Acids Res.13:8765-8787(1985);Nakamaye(1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioategroups and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.14:9679-9698;Sayers等(1988)“Y-T Exonucleases in phosphorothioate-basedoligonucleotide-directed mutagenesis”Nucl.Asids Res.16:791-802;和Sayers等(1988)“Strand specific cleavage of phosphorothioate-containing DNA by reactionwith restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16:803-814);使用缺口双重DNA的诱变(Kramer等(1984)“The gapped duplexDNA approach to oligonucleotide-directed mutation construetion”Nucl.Acids Res.12:9441-9456;Kramer & Fritz(1987)Methods in Enzymol.“Oligonucleotide-directedconstruction of mutations via gapped duplex DNA”154:350-367;Kramer等(1988)“Improved enzymatic in vitro reactions in the gapped duplex DNA approach tooligonucleotide-directed construction of mutations”Nucl.Acids Res.16:7207;和Fritz等(1988)“Oligonucleotide-directed construction of mutations:a gapped duplex DNAprocedure without enzymatic reactions in vitro”Nucl.Acids Res.16:6987-6999)。 
可以用于实践本发明方法的另外的实验方案包括点错配修复(Kramer(1984)“Point Mismatch Repair”Cell 38:879-887),应用修复缺陷型宿主株的诱变(Carter等(1985)“Improved oligonucleotide site-directed mutagenesis using M13vectors”Nucl.Acids Res.13:4431-4443;和Carter(1987)“Improvedoligonucleotide-directed mutagenesis using M13 vectors”Methods in Enzymol.154:382-403),缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate largedeletions”Nucl.Acids Res.14:5115),限制-选择和限制-纯化(Wells等(1986)“Importance  of hydrogen-bond formation in stabilizing the transition state ofsubtilisin”Phil.Trans.R.Soc.Lond.A 317:415-423),通过全基因合成的诱变(Nambiar等(1984)“Total synthesis and cloning of a gene coding for the ribonucleaseS protein”Science 223:1299-1301;Sakamar和Khorana(1988)“Total synthesis andexpression of a gene for the a-subunit of bovine rod outer segment guaninenucleotide-binding protein(trahsducin)”Nucl.Acids Res.14:6361-6372;Wells等 (1985)“Cassette mutagenesis:an efficient method for generation of multiplemutations at defined sites”Gene 34:315-323;和Grundstrom等(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene synthesis”Nucl.Acids Res.13:3305-3316),双链断裂修复(Mandecki(1986),Arnold(1993)“Proteinengineering for unusual environments”Current Opinion in Biotechnology 4:450-455.“Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli:amethod for site-speciflc mutagenesis”Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的细节在Methods in Enzymology的154卷中有说明,其中也描述了用于解决各种诱变方法遇到的问题的有用的控制。 
也参见Stemmer的美国专利5,605,793(1997年2月25日),“Methods forIn Vitro Recombination;”Stemmer等人的美国专利5,811,238(1998年9月22日)“Methods for Generating Polynucleotides having Desired Characteristics by IterativeSelection and Recombination;”Stemmer等人的美国专利5,830,721(1998年11月3日),“DNA Mutagenesis by Random Fragmentation and Reassembly;”Stemmer等人的美国专利5,834,252(1998年11月10日)“End-Complementary PolymeraseReaction;”Minshull等人的美国专利5,837,458(1998年11月17日),“Methods andCompositions for Cellular and Metabolic Engineering;”WO 95/22625,Stemmer和Cramen,“Mutagenesis by Random Fragmentation and Reassembly;”Stemmer和Lipschutz的WO 96/33207“End Complementary Polymerase Chain Reaction;”Stemmer和Crameri的WO 97/20078“Methods for Generating Polynucleotideshaving Desired Characteristics by Iterative Selection and Recombination;”Minshull和Stemmer的WO 97/35966,“Methods and Compositions for Cellular and MetabolicEngineering;”Punnonen等人的WO 99/41402“Targeting of Genetic VaccineVectors;”Punnonen等人的WO 99/41383“Antigen Library Immunization;”Punnonen等人的WO 99/41369“Genetic Vaccine Vector Engineering;”Punnonen等人的WO99/41368“Optimization of Immunomodulatory Properties of Genetic Vaccines;”Stemmet和Crameri的EP 752008“DNA Mutagenesis by Random Fragmentation andReassembly;”Stemmer的EP 0932670“Evolving Cellular DNA Uptake by RecursiveSequence Recombination;”Stemmer等人的WO 99/23107,“Modification of VirusTropism and Host Range by Viral Genome Shuffling;”Apt等人的WO 99/21979,“Human Papillomavirus Vectors;”del Cardayre等人的WO 98/31837“Evolution ofWhole Cells and Organisms by Recursive Sequence Recombination;”Patten和Stemmer的WO 98/27230“Methods and Compositions for Polypeptide Engineering,”Stemmet等人的WO 98/27230,“Methods for Optimization of Gene Therapy byRecursive Sequence Shuffling and Selection,”WO 00/00632,“Methods for GeneratingHighly Diverse Libraries,”WO 00/09679,“Methods for Obtaining in VitroRecombined Polynucleotide Sequence Banks and Resulting Sequences,”Arnold等人 的WO 98/42832,“Recombination of Polynucleotide Sequences Using Random orDefined Primers,”Arnold等人的WO 99/29902,“Method for Creating Polynucleotideand Polypeptide Sequences,”Vind的WO 98/41 653,“An in Vitro Method forConstruction of a DNA Library,”Borchert等人的WO 98/41622,“Method forconstructing a Library Using DNA Shuffling,”和Pati和Zarling的WO 98/42727,“Sequence Alterations using Homologous Recombination.”。 
某些美国申请提供了关于产生不同多样性的方法的细节,包括Patten等人的“SHUFFLING OF CODON ALTEAED GENES”,1999年9月28日提交,(美国系列号09/407,800);del Cardayre等人的“EVOLUTION OF WHOLE CELLS ANDORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”,提交于1998年7月15日(美国系列号09/166,188)和1999年7月15日(美国系列号09/354,922);Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACIDRECOMBINATION”,提交于1999年9月28日(美国系列号09/408,392)和Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,提交于2000年1月18日(PCT/US00/01203);Welch等人的“USE OFCODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETICSHUFFLING”,提交于1999年9月28日(美国系列号09/408,393);Selifonov等人的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDS& POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,提交于2000年1月18日(PCT/US00/01202)和,例如,Selifonov等人的“METHODS FOR MAKINGCHARACTER STRINGS,POLYNUCLEOTIDS & POLYPEPTIDES HAVINGDESIRED CHARACTERISTICS”,提交于2000年7月18日(美国系列号09/618,579),Selifonov和Stemmer的“METHODS OF POPULATING DATASTRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”,提交于2000年1月18日(PCT/US00/01138);和Affholter的“SINGLE-STRANDED NUCLEICACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACIDFRAGMENT ISOLATION”,提交于2000年9月6日(美国系列号09/656,549)。 
非随机的或者“定向进化”的方法包括例如,饱和诱变(例如GSSMTM)、合成的连接重装配(SLR),或者它们的组合,它们被用来修饰本发明的核酸,以产生具有新的或者改变的性质(例如,在高的酸性或碱性条件,高温和类似条件下具有活性)的磷脂酶。由修饰了的核酸编码的多肽可以在测定磷脂酶或者其它活性之前对活性进行筛选。可以应用任何测试形式或者方案,如,用毛细管阵列平台。参见,如,美国专利6,280,926;5,939,250。 
饱和诱变,或GSSMTM
在本发明的一个方面中,非随机的基因修饰,“定向进化过程”,被用于产生具有新的或者改变的特性的磷脂酶。本方法的各种变化已经被称为“基因位点诱 变”、“位点饱和诱变”、“基因位点饱和诱变TM”或者简单地称为“GSSMTM”。饱和诱变可以与别的诱变过程相结合。见,例如,美国专利6,171,820;6,238,884。一方面,GSSMTM包括提供模板多核苷酸和众多的寡核苷酸,其中每种寡核苷酸包括与模板多核苷酸同源的序列,因此靶向模板多核苷酸中的特异序列,以及为同源基因的变异体的序列;通过使用寡核苷酸复制模板多核苷酸,产生包括非随机序列变异的子代多核苷酸,从而产生包括同源基因序列变异体的多核苷酸。 
在一方面,将含有简并N,N,G/T序列的密码子引物用于往多核苷酸中引入点突变,以便产生一组子代多肽,其中在每个氨基酸位置都是全范围的单氨基酸取代,例如被靶向待修饰的酶活性位点或者配体结合位点中的氨基酸残基。这些寡核苷酸可以包括连续的第一同源序列,简并N,N,G/T序列,和任选地,第二同源序列。从使用这些寡核苷酸得到的下游的子代翻译产物包括多肽上的每个氨基酸位点的所有可能的氨基酸变异,这是因为N,N,G/T序列的简并性包括所有20种氨基酸的密码子。在一方面,一个这样的简并寡核苷酸(包括,例如,一个简并N,N,G/T盒)用于使亲代多核苷酸模板中的每个最初密码子进行全范围的密码子取代。在另一方面,使用至少两个简并盒——或者在相同的寡核苷酸中,或者在不相同的寡核苷酸中,以使亲代多核苷酸模板中的至少两个最初密码子进行全范围的密码子取代。例如,一个寡核苷酸中可以含有一个以上的N,N,G/T序列,以在一个以上的位点上引入氨基酸突变。大量的这些N,N,G/T序列可以直接相邻,或者被一个或多个另外的核苷酸序列隔开。在另一方面,适用于引入添加或者缺失的寡核苷酸可以单独使用或者与含有N,N,G/T序列的密码子联合使用,以引入氨基酸添加、缺失和/或取代的任何组合或者排列组合。 
在一方面,应用含有邻接的N,N,G/T三联体,即简并的(N,N,G/T)n序列的寡核苷酸,可以在两个或者多个邻近的氨基酸位置同时进行诱变。另一方面,可以应用简并度比N,N,G/T序列小的简并盒。例如,在一些例子中,(如,在一个寡核苷酸中)应用包括仅仅一个N的简并三联体序列是理想的,其中所述的N可以是在三联体的第一、第二或者第三的位置。在剩下的两个位置可以使用包括任何组合和排列的任何其它的碱基。作为选择,在一些例子中,(如,在一个寡核苷酸中)使用简并的N,N,N三联体序列是理想的。 
一方面,应用简并的三联体(如N,N,G/T三联体),可以系统地而容易地在多肽的每一和所有氨基酸位置中产生完整范围的可能的天然氨基酸(对应于所有20个氨基酸)(在可供选择的方面,所述方法也包括在每一个氨基酸残基或者密码子位置产生比所有可能的种类要少的替换)。例如,对于100个氨基酸的多肽,可以产生2000个不同的种类(即,每个位置可能的20种氨基酸×100个氨基酸位置)。通过应用含有简并N,N,G/T三联体的一段寡核苷酸或者一套寡核苷酸,32个不同的序列可以编码所有20种可能的天然氨基酸。因此,在使用至少一种这样的寡核苷酸进行亲本多核苷酸序列饱和诱变的反应容器中,产生了32种不同的 子代寡核苷酸,它们编码20种不同的多肽。相反地,在定点突变中,应用非简并的寡核苷酸导致在每个反应容器中仅仅有一种子代多肽产物。非简并的寡核苷酸可以选择性地与公开的简并引物组合使用;例如,在工作多肽中,可以应用非简并的寡核苷酸来产生特异的点突变。这就提供了一种手段来获得特定的沉默点突变、导致相应的氨基酸变化的点突变、以及引起终止密码子产生和多肽片段相应的表达终止的点突变。 
一方面,每一个饱和诱变反应容器中含有编码至少20种子代多肽(如,磷脂酶)分子的多核苷酸,因此所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中的被诱变的密码子位置的特定氨基酸位置(其它的例子使用了少于20个天然的组合)。产生于每个饱和诱变反应容器的32倍简并的子代多肽可以进行克隆扩增(例如,使用例如表达载体克隆至合适的宿主,如大肠杆菌宿主),然后进行表达的筛选。当通过筛选确定显示出有利的性质变化(例如与亲本多肽比较,在碱性、酸性条件下磷脂酶活性增强)的单个子代多肽时,就可以用测序来确定其中所含有的相应的有利的氨基酸取代。 
一方面,如在此所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变,可以在超过一个的氨基酸位置确定出的有利的氨基酸变化。可以产生含有所有或者部分这些有利的氨基酸替代的组合的一种或者多种新的子代分子。例如,如果在多肽的三个氨基酸位置的每一个位置确定出2个特定的有利的氨基酸变化,这样出现的排列就包括在每一个位置的3种可能性(与原来的氨基酸没有变化,和两个有利变化中的每一个)和3个位置。这样,就有3×3×3或者27种总的可能性,包括先前检查出的7种——6种单点突变(即,在三个位置的每一个有2个)和在任何位置中都没有变化的1种。 
另一方面,为了改变序列,定点饱和诱变可以与任何随机的或非随机方法一起使用,例如,合成的连接重装配(见下文),重排,嵌合,重组和其他诱变过程和诱变剂。本发明提供以重复方式使用任何诱变过程,包括饱和诱变。 
合成的连接重组装(SLR) 
本发明提供称为“合成连接重装配”,或者简单地称为“SLR”的非随机基因修饰系统,这是一种“定向进化方法”,以产生具有新的或者改变的特性的磷脂酶。SLR是非随机地把寡核苷酸片段连接在一起的方法。此方法与随机的寡核苷酸重排不同,因为核酸构件不被随机重排、串联或者随机地嵌合,而是非随机组装。参见,例如,美国专利申请系列号(USSN)09/332,835,题目是”Synthetic LigationReassembty in Directed Evolution”,于1999年6月14日提交(“USSN 09/332,835”)。一方面,SLR包括以下步骤:a)提供模板多核苷酸,其中该模板多核苷酸包括编码同源基因的序列;(b)提供多个构建模块多核苷酸,其中所述的构建模块多核苷酸被设计为可与模板多核苷酸在预定的序列处交叉装配(cross-over reassemble),而且所述的构建模块多核苷酸包括所述同源基因的变异体序列以及在变异序列两 侧与模板多核苷酸同源的序列;(c)将模板多核苷酸与构建模块多核苷酸结合,以便构建模块多核苷酸与模板多核苷酸交叉装配,产生包含同源基因序列变异的多核苷酸。 
SLR并不依赖于在待重新组装的多核苷酸之间存在高水平的同源性。这样,这一方法可以用于非随机地产生包括超过10100个不同嵌合体的子代分子文库。SLR可以用于产生包括超过101000个不同子代嵌合体的文库。这样,本发明的这些方面包括用于产生一套最终的具有按设计选择的整个装配顺序的嵌合核酸分子的非随机方法。这一方法包括按设计产生大量特定的核酸构建模块的步骤,这些核酸构建模块具有可以应用的相互间相容的可以连接的末端,然后装配这些核酸构建模块,这样就完成了按设计的全部装配顺序。 
将被装配的核酸构建模块的相互相容的可连接的末端对于这种类型的顺序装配被认为是“适用的”,如果它们使得构建模块以预先制定的顺序联接的话。因此,核酸构建模块被偶联的总体装配顺序是通过可连接末端的设计来特异化的。如果不止一个装配步骤将要被应用,那么核酸构建模块被偶联的总体装配顺序也通过装配步骤的先后次序来特异化。一方面,退火的构建模块用酶处理,如用连接酶(如,T4 DNA连接酶)处理,以完成构建模块间的共价键结合。 
一方面,寡核苷酸构建模块的设计通过分析一套祖先核酸序列模板而获得,该模板作为产生子代一套最终的嵌合多核苷酸的基础。这些亲本寡核苷酸模板作为序列信息源,辅助待诱变例如待嵌合或者重排的核酸构建模块的设计。 
在这一方法的一个方面,为了选择一个或者多个分界点(demarcationpoints),对多个亲本核酸模板的序列进行联配。所述分界点可以位于同源的区域,并且可以包括一个或者多个核苷酸。这些分界点在一个方面由至少两个祖先模板中共有。所述分界点可以因此用于描绘将要产生的寡核苷酸构建模块的边界,以便重新排列亲本寡核苷酸。在祖先分子中确定和选择的分界点用作装配最终的嵌合子代分子的潜在的嵌合位点。分界点可以是至少两个亲本多核苷酸序列共同的同源区域(包括至少一个同源核苷酸碱基)。可选择地,分界点可以是由至少半数的亲本多核苷酸序列共同拥有的同源区域,或者,是由至少三分之二的亲本多核苷酸序列共同拥有的同源区域。甚至更优选地,可应用的分界点是至少四分之三的亲本多核苷酸序列共同拥有的同源区域,或者,是几乎所有的亲本多核苷酸序列共同拥有的同源区域。一方面,分界点是由所有的亲本多核苷酸序列共同拥有的同源区域。 
一方面,为了产生一个全面的子代嵌合多核苷酸文库,连接重装配过程被尽可能充分地实施。换句话说,核酸构建模块的所有可能顺序的组合存在于一套最终的嵌合核酸分子中。同时,另一方面,每个组合中的装配顺序(即,各个构建模块的装配顺序,按各个最终的嵌合核酸序列的5’到3’的方向)是按照以上所 述设计的(或者是非随机的)。由于本发明的非随机性质,产生不需要的副产物的可能性大大降低。 
在另一方面,系统地实施连接重装配的方法。例如,实施本方法来产生系统区分化的子代分子文库,划分开的文库可以系统地进行筛选,例如逐个的筛选。换句话说,通过选择性的和审慎的应用特定的核酸构建模块,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这就允许进行系统的检查和筛选步骤。因此,这些方法允许对很可能是很大数目的子代分子以较小的组进行系统性检测。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,所以这些方法可以产生包括很大数目的子代分子的文库(或者一套分子)。由于该连接重装配发明的非随机性,产生的子代分子在一个方面包括具有依设计而选择的全部装配序列的最终嵌合核酸分子的文库。饱和诱变和优化的定向进化方法也可以用于产生不同的子代分子种类。可以理解,本发明在分界点的选择、核酸构建模块的大小和数目以及偶联的大小和设计方面提供了选择和控制的自由度。更进一步理解的是,本发明的操作对分子间同源性的要求被大大放松了。实际上,甚至可以在有较少分子间同源性或者没有分子间同源性的区域选择区别点。例如,由于密码子的摆动性,即,密码子的简并,核苷酸的替代可以被引入到核酸构建模块中而并不改变在相应的祖先模板中起初编码的氨基酸。可选择地,密码子可以被改变以至于原先的氨基酸的编码被改变。本发明提供了这样的替换,它们能够被引入到核酸构建模块中,由此增加分子间同源的分界点的发生率,这样就允许在构建模块之间实现更多数目的偶联,这又使得更多数目的子代嵌合分子产生。 
另一方面,构件产生的步骤的合成特性允许设计和引入核苷酸(例如,一个或者多个核苷酸,其可以是,例如密码子或内含子或者调控序列),其以后可以任选地在体外过程(例如,通过诱变)或者体内过程(例如,通过利用宿主微生物的基因剪切能力)中被除去。应该理解的是,在许多情况中,除了产生适用的分界点的潜在好处之外,由于许多别的原因,这些核苷酸的引入也是理想的。 
一方面,核酸构件被用于引入内含子。因此,功能性的内含子被引入进根据在此描述的方法产生的人造基因中。人工引入的内含子可以在宿主细胞中发挥基因剪切的功能,作用方式如同天然产生的内含子发挥基因剪切的功能的方式。 
优化的定向进化系统 
本发明提供了一种非随机的基因修改系统,命名为“优化的定向进化系统”,其可以用来产生具有新的或者改变的特性的磷脂酶。优化的定向进化涉及还原性重配(reductive reassortment)、重组和选择的重复循环应用,其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列, 其中产生的群体显著地富集了具有预定数目遗传交换事件(crossover events)的序列。 
遗传交换事件是在嵌合序列中的一个点,在这里,发生从一个亲本变异体到另一个亲本变异体的序列转换。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。 
此外,这一方法与其他系统相比,提供了一种用于探究巨大数量的可能的蛋白变异体的方便手段。以前,例如,如果在反应中产生了1013个嵌合分子,测试这样大数目的嵌合突变体的特定活性将会非常困难。此外,子代群体的相当部分将具有很高数目的遗传交换事件,其中得到的蛋白不大可能具有增高水平的特定活性。通过应用这些方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以偏向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多核苷酸中的哪一个可能影响到特定的性质时,这时便提供了更加可控制的变量。 
产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡核苷酸。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡核苷酸混合在一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变异体。在USSN 09/332,835中可以发现另外的信息。对应于每一个亲本变异体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如,为了发现具有如在高温下的更高活性的嵌合变异体,可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子,对应于每一个亲本变异体的每一部分可以产生一套50个寡核苷酸序列。因此,在连接重装配过程中,在每一个嵌合序列中有可能有超过50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变异体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔数量存在于连接反应中,有可能在一些位置中来自同一亲本多核苷酸的寡核苷酸将相互一个个连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一个寡核苷酸的浓度保持不变,那么将会有1/3的可能性(假定3个亲本):来自同一个亲本变异体的寡核苷酸将在嵌合序列内连接,而不产生遗传交换。 
相应的,可以确定概率密度函数(PDF),以预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给定了一套确定数目的亲本变异体、对应于每种变体的寡核苷酸、以及在连接反应中的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法,可 以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用,通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点,在这里,发生从一个亲本变异体到另一个亲本变异体的序列转换。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了所选择数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。 
此外,这些方法与其他系统相比,提供了一种用于探究大数量的可能蛋白变异体空间的方便手段。通过应用在这里描述的方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变异体。因此,尽管在反应中可以仍然产生1013个嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界线减少。当计算出来自最初的亲本多核苷酸中的哪一个可能影响到特定的性质时,这时便提供了更加可控制数量的变量。 
一方面,该方法通过产生对应于每一个亲本序列的片段或者部分的寡核苷酸,产生嵌合子代多核苷酸序列。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡核苷酸混合一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变异体。也可参见USSN 09/332,835。 
对应于每一个亲本变异体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的遗传学交换的总的数目具有一定的关系。例如,为了发现具有如在高温下的更高活性的嵌合变异体,可以提供三个亲本核苷酸序列变异体来进行连接反应。作为一个例子,对应于每一个亲本变异体的每一部分可以产生一套50个寡核苷酸序列。因此,在连接重装配过程中,在每一个嵌合序列中有可能有超过50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变异体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔数量存在于连接反应中,有可能在一些位置中来自同一亲本多核苷酸的寡核苷酸将相互一个个连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一个寡核苷酸的浓度保持不变,那么将会有1/3的可能性(假定3个亲本):来自同一个亲本变异体的寡核苷酸将在嵌合序列内连接,而不产生遗传交换。 
因此,可以确定概率密度函数(PDF),以预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给定了一套确定数目的亲本变异体、对应于每种变体的寡核苷酸、以及在连接反应中的每个步骤中的每种变异体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。 
确定遗传交换事件 
本发明的实施方案包括系统和软件,它们接受所需的遗传交换的概率密度函数(PDF)、待重新装配的亲本基因的数目以及重新装配的片段数目作为输入量。该程序输出“片段PDF”,它可以用于确定用于获得重新装配的基因和那些基因的估计的遗传交换PDF的具体方法。于此说明的过程优选地在MATLAB(TheMathworks,Natick,Massachusetts)中进行,MATLAB
Figure G05814667620061109D000722
是一种用于技术计算的程序语言和开发环境。 
迭代过程(iterative process) 
在实践本发明时,这些过程可以迭代反复。例如,对产生改变的磷脂酶表型的核酸(或者,所述核酸)进行鉴定,重新分离,再修饰,再检测活性。此过程可以反复重复,直到得到所需的表型。例如,整个生物化学的合成代谢或者分解代谢途径可以在细胞中设计,包括磷脂酶活性。 
类似地,如果确定了特定的寡核苷酸对于所有所需的性质(如,新的磷脂酶表型)没有影响,那么就可以合成包括这段序列在内的更大的亲本寡核苷酸,从而将作为变量的这段序列去除。由于将这段序列合并到更大的序列中,可以避免任何遗传交换事件,所以在子代多核苷酸中,这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系,以及哪些与所需的性质无关的重复实践,可以更有效地探寻可能提供特定性质或者活性的所有蛋白变异体。 
体内重排 
分子的体内重排用在本发明的提供本发明的多肽如抗体、磷脂酶和类似物的变异体的方法中。体内重排可以利用细胞重组多聚体的天然特性来进行。尽管体内的重组提供了实现分子多样性的主要的天然途径,遗传重组仍然是一种相对复杂的过程,其涉及1)同源性识别;2)链切割,链侵入,和导致产生重组交叉(recombination chiasma)的代谢步骤;和最后3)交叉消除至分离的重组分子。交叉的形成需要同源序列的识别。 
一方面,本发明提供由至少第一个多核苷酸和第二个多核苷酸产生杂合多核苷酸的方法。本发明可以用于通过将共有具部分序列同源性的至少一个区域的至少第一多核苷酸和第二多核苷酸引入到合适的宿主细胞中而产生杂合多核苷 酸。该具部分序列同源性的区域促进导致产生杂合多核苷酸的序列识别的过程。正如在此使用的,术语“杂合多核苷酸”是由本发明的方法产生的任何核苷酸序列,含有从至少两个最初多核苷酸序列得到的序列。这样的杂合多核苷酸可以由促进DNA分子间的序列整合的分子间重组事件产生。另外,这样的杂合多核苷酸可以由利用重复序列以改变DNA分子中的核苷酸序列的分子内还原性重配过程产生。 
产生序列变异体 
本发明也提供使用本发明的核酸和多肽产生本发明的核酸和磷脂酶序列变异体,或者分离磷脂酶例如磷脂酶的序列变异体的方法。一方面,本发明提供本发明的磷脂酶基因的变异体,所述基因可以使用任何方法改变,包括,例如随机方法,或者非随机方法,或者“定向进化”方法,如上描述。 
分离的变异体可以是天然发生的。变异体也可以体外产生。变异体可以使用遗传工程技术,例如定点诱变,随机化学诱变,核酸外切酶III缺失程序和标准克隆技术产生。做为选择,这样的变异体,片段,类似物或衍生物可以使用化学合成或者修饰程序产生。产生变异体的别的方法也为本领域技术人员所熟悉。这些方法包括修饰从天然分离物得到的核酸序列,产生编码具有特性的多肽的核酸的程序,所述特性增加它们在工业或实验室应用中的价值。在这些程序中,产生并且表征大量与从天然分离物得到的序列相比具有一个或多个核苷酸差异的变异体序列。这些核苷酸差异可以导致产生相对于由天然分离物的核酸编码的多肽而言的氨基酸变化。 
例如,变异体可以使用易错PCR产生。在易错PCR中,PCR在DNA聚合酶复制保真度低的情况下进行,这样在PCR产物的全长中获得高比率的点突变。易错PCR在,例如Leung,D.W.,等,Technique,1:11-15,1989)和Caldwell,R.C.&Joyce G.F.,PCR Methods Applic.,2:28-33,1992中有描述。简要而言,在这些程序中,为了在全长的PCR产物中得到高比率的变突变,将待诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶和合适浓度的dNTP混合。例如,反应使用20毫微微摩尔(fmoles)待诱变的核酸,每种PCR引物30皮摩尔,反应缓冲液包括50mM KCl,10mM Tris HCl(PH8.3)和0.01%明胶,7mM MgCl2,0.5mMMnCl2,5单位的Taq聚合酶,0.2mM dGTP,0.2mM dATP,1mM dCTP和1mM dTTP。PCR进行30个循环,每个循环为94℃1分钟,45℃1分钟,72℃1分钟。然而,应该理解地是,这些参数可以适当的改变。将诱变的核酸克隆进入合适的载体中,并评估诱变的核酸编码的多肽的活性。 
变异体也可以使用寡核苷酸定向诱变产生,在感兴趣的任何克隆DNA中产生位点专一的变异。寡核苷酸诱变在,例如,Reidhaar-Olson(1988)Science241:53-57中有描述。简要地,在这些程序中,合成待被引入到克隆的DNA中的许多具有一个或多个突变的双链寡核苷酸,并且插入到待诱变的克隆DNA中。回收含有经诱变的DNA的克隆,并评定经诱变的DNA编码的多肽的活性。 
另一个产生变异体的方法是装配PCR。装配PCR涉及由小的DNA片段的混合物装配出PCR产物。在同一个容器中平行进行很多不同的PCR反应,其中,一个反应的产物用作另外一个反应的引物。装配PCR在例如美国专利5,965,408中有说明。 
还有一个产生变异体的方法是有性PCR诱变。在有性PCR诱变中,由于基于序列同源性的DNA分子的随机片段化,在不同的但是高度相关的DNA序列的DNA分子之间,在体外强行发生同源重组,然后通过PCR反应的引物延伸,遗传交换得到固定。有性PCR诱变在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA 91:10747-10751中描述。简要地说,在这样的程序中,多个待重组的核酸用DNase消化,产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段,重悬于PCR混合物中。在有利于核酸片段重组的条件下进行PCR反应。例如,PCR可以这样进行:将纯化的片段重悬于含有0.2mM的各种dNTP、2.2mM MgCl2、50mM KCl、10mM的Tris-HCl,pH 9.0以及0.1%的Triton X-100的溶液中,其浓度为10-30ng/μl,以100∶1的比例在反应混合物中加入2.5Units的Taq聚合酶,用以下的条件进行PCR:94℃60秒,94℃30秒,50-55℃30秒,72℃30秒(30-45次),然后72℃进行5分钟。然而,这些参数可以进行适当的变化。在一些方面,寡核苷酸可以包括在该PCR反应中。在其它的一些方面,DNA聚合酶I的Klenow片段可以用于第一轮PCR反应,而Taq聚合酶可以用于后续的PCR反应。重组序列经过分离并评估它们编码的多肽的活性。 
变异体也可以通过体内诱变产生。在一些方面,感兴趣的序列中的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生,所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖将最终产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在,例如,PCT公开号WO91/16427中有描述。 
变异体也可以通过应用盒式诱变产生。在盒式诱变中,双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸“盒子”替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。 
递归整体诱变也可以用于产生变异体。递归整体诱变是一种用于蛋白质工程(蛋白突变)的算法,它的开发是为了产生表型相关的突变体组成的多样性群体,其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA 89:7811-7815中有描述。 
在一些方面,用指数整体诱变产生变异体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程,其中一小组的残基被随机化,同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整 体诱变在如,Delegrave(1993)Biotechnology Res.11:1548-1552中有描述。随机和定点诱变在如,Amold(1993)Current Opinion in Biotechnology 4:450-455中有描述。 
在一些方面,变异体利用重排方法产生,其中编码不同的多肽的多个核酸的部分被融合在一起,产生编码嵌合多肽的嵌合核酸序列,其描述于美国专利5,965,408;5,939,250中。 
本发明也提供本发明的多肽变异体,包括其中一个或多个氨基酸残基(例如,本发明的示范性多肽的氨基酸残基)被保守的或不保守的氨基酸残基(例如,保守的氨基酸残基)取代,这样的取代的氨基酸残基可以是或者不是由遗传密码编码的氨基酸残基。保守的取代是多肽中给定的氨基酸被具有相似特征的另一个氨基酸取代。因此,本发明的多肽包括本发明的序列的保守取代,包括但不局限于以下取代:脂肪族氨基酸,例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸被另一个脂肪族氨基酸取代;丝氨酸被苏氨酸取代,或者相反;酸性残基例如天冬氨酸和谷氨酸被另一酸性残基取代;具有酰胺基团的残基,例如天冬酰胺和谷氨酰胺被另一具有酰胺基团的残基取代;碱性残基例如赖氨酸和精氨酸与另一碱性残基互换;芳香族残基例如苯丙氨酸、酪氨酸被另一芳香族残基取代。其他变异体是本发明的多肽的一个或多个氨基酸残基包括取代基团的那些变异体。 
包括在本发明范围中的其他变异体是多肽与另一化合物,例如可以增加多肽半寿期的化合物,例如聚乙二醇缔合的那些变异体。 
在本发明范围内的另外的变异体中,另外的氨基酸融合到多肽上,如前导序列、分泌序列、蛋白原序列(proprotein sequence)或者有利于纯化、富集或者使所述多肽稳定的序列。 
在一些方面,发明的多肽变异体、片段、衍生物和类似物保持与示范性多肽相同的生物功能或活性,例如在此描述的磷脂酶活性。另一些方面,变异体、片段、衍生物或类似物包括原蛋白(proprotein),这样,变异体,片段,衍生物或类似物可以通过切割原蛋白部分产生活性多肽被而活化。 
密码子优化,实现宿主细胞中高水平的蛋白表达 
本发明提供修饰编码磷脂酶的核酸,以便改变密码子使用(codon usage)的方法。一方面,本发明提供修饰编码磷脂酶的核酸中的密码子,以增加或降低其在宿主细胞中的表达的方法。本发明也提供了编码经修饰而增强其在宿主细胞中的表达的磷脂酶的核酸、经过这样的修饰的磷脂酶,和制备经修饰的磷脂酶的方法。该方法包括确定编码磷脂酶的核酸中“非-偏爱的”或者“较不偏爱的”密码子,并且用编码同样氨基酸的“偏爱的密码子”作为替换密码子替换一个或者多个这样的非-偏爱或者较不偏爱的密码子,并且在所述核酸中至少一个非-偏爱或者较不偏爱的密码子被编码相同氨基酸的偏爱密码子替换。偏爱密码子是在宿主细胞基因 的编码序列中被优先使用的密码子,而不偏爱的或者较不偏爱的密码子是指在宿主细胞基因的编码序列中较少使用的密码子。 
用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此,本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸,以及由所述的密码子被改变的核酸编码的多肽。示范性的宿主细胞包括革兰氏阴性细菌,如大肠杆菌;革兰氏阳性细菌,芽孢杆菌属(Bacillus)(蜡状芽孢杆菌(B.cereus))或链霉菌、加氏乳酸杆菌(Lactobacillus gasseri)、乳酸乳球菌(Lactococcus lactis)、乳脂乳球菌(Lactococcus cremoris)、枯草芽孢杆菌。示范性的宿主细胞也包括真核生物体,如,各种酵母,如酵母属的种(Saccharomyces sp.),包括酿酒酵母、粟酒裂殖酵母、巴斯德毕赤酵母和乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)、黑曲霉(Aspergillus niger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此,本发明也包括在这些生物体和生物物种中的表达被优化的核酸和多肽。 
例如,从细菌细胞中分离的编码磷脂酶的核酸密码子被修饰,以便该核酸在不同于获得该磷脂酶的细菌的细菌细胞、酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中优化表达。优化密码子的方法在本领域是已知的,参见如,美国专利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)Protein Expr.Purif.12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect.Immun.69:7250-7253,描述了在鼠系统中优化密码子;Outchkourov(2002)Protein Expr.Purif.24:18-24,描述了在酵母中优化密码子;Feng(2000)Biochemistry39:15399-15409,描述了在大肠杆菌中优化密码子;Humphreys(2000)Protein Expr.Purif 20:252-264,描述了大肠杆菌中导致分泌的优化密码子使用。 
转基因非-人类的动物 
本发明提供了包含本发明的核酸、多肽、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因非人类动物。转基因非人动物可以是,例如,包括本发明的核酸的山羊、兔、绵羊、猪、牛、大鼠和小鼠。这些动物可以作为,例如体内研究磷脂酶活性的模型使用,或者体内筛选磷脂酶活性的调节物的模型使用。欲在转基因非人动物中表达的多肽的编码序列可以设计为组成型的,或者组织特异性、发育特异性或者诱导转录调控因子的控制之下。转基因非人动物可以用本领域已知的任何方法设计和产生;参见,例如美国专利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571,这些专利描述了产生和使用转化的细胞和卵,以及转基因小鼠、大鼠、兔、绵羊、猪和母牛。也参见,例如Pollock(1999)J.Immunol.Methods 231:147-157,描述在转基因 产奶动物的奶中产生重组蛋白;Baguisi(1999)Nat.Biotechnol.17:456-461,描述转基因山羊的产生。美国专利6,211,428,描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人类哺乳动物。美国专利5,387,742,描述了把克隆的重组子或者合成的DNA序列注射至鼠受精卵中,移植注射的卵至假孕的雌鼠中,并且生长成为转基因鼠,它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992,描述了制备和应用转基因鼠,它的基因组具有编码淀粉样蛋白原(APP)的基因的断裂。 
“基因敲除动物(knockout animals)”也可以用于实践本发明的方法。例如,在一方面,本发明的转基因动物或者修饰的动物包括“基因敲除动物”,如“基因敲除鼠”,它被工程改造,不会表达或不能表达磷脂酶。 
转基因植物和种子 
本发明提供了包含本发明的核酸、多肽(例如磷脂酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因植物和种子。本发明也提供了包含本发明的核酸和/或多肽(例如磷脂酶)的植物产物,如油、种子、叶、提取物以及类似物。转基因植物可以是双子叶的(双子叶植物)或者单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如,美国专利6,309,872。 
本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如,核酸或者表达构建物可以导入到所需的植物宿主的基因组中,或者,核酸或者表达构建物可以是附加体。可以导入到所需植物的基因组中,这样宿主的磷脂酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”,其中例如同源重组导致的基因序列的插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已知的,参见,如,Strepp(1998)Proc Natl.Acad.Sci.USA95:4368-4373;Miao(1995)Plant J 7:359-365。参见下面的转基因植物的讨论。 
本发明的核酸可以将所需的性质赋予基本上任何植物,例如,含油籽的植物,如水稻,大豆,油菜籽,向日葵子,芝麻和花生。为了优化或改变宿主磷脂酶的表达,本发明的核酸可以用于控制植物代谢途径。这可以改变植物中磷脂酶的活性。作为选择,本发明的磷脂酶可以用于产生转基因植物,以产生天然情形下不由此植物产生的化合物。这可以降低生产成本或产生新的产品。 
一方面,产生转基因植物的第一步骤涉及制备在植物细胞中表达的表达构建物。这些技术是本领域熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列以及选择适当的基因终止序列。典型的组成型启动子是来自花椰菜花叶病毒的CaMV35S,它一般在植物中导致高水平的表达。其它的 启动子更具特异性,并且对植物的内部或者外部环境中的暗示有反应。典型的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。 
一方面,修饰核酸来实现在植物细胞中更强的表达。例如,本发明的序列很可能具有比在植物中更高的A-T核苷酸对百分率,而一些植物优选G-C核苷酸对。因此,编码序列中的A-T核苷酸可以用G-C核苷酸取代,而不显著改变氨基酸序列,可以增强在植物细胞中基因产物的产生。 
为了鉴定已经成功整合了转移基因的植物细胞或者组织,可以将选择性标记基因加入到基因构建物中。这可能是必要的,因为在植物细胞中完成基因的整合和表达是一个小概率事件,仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白,所述试剂一般对植物有毒性,如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时,只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样,为了有恰当的功能,标记基因也需要启动子和终止序列。 
一方面,转基因植物或种子制备方法包括将发明的序列,和任选地,标记基因整合到目标表达构建物(例如,质粒)中,同时定位启动子和终止子序列。这可以包括将修饰的基因通过合适方法转入植物中。例如,构建物可以应用如电穿孔和微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中,或者构建物可以应用弹道方法(ballistic methods),如,DNA微粒轰击(DNA particlebombardment)的方法直接引入到植物组织中。例如,参见如,Christou(1997)Plant Mol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature 327:70-73;Talcumi(1997)Genes Genet.Syst.72:63-69,讨论了应用微粒轰击引入转基因到小麦中;Adam(1997)如上,应用微粒轰击将YACs引入至植物细胞中。例如,Rinehart(1997)如上,用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明;而且,可以通过商业渠道获得BioRad(Biolistics)PDS-2000微粒加速设备;也参见,John,美国专利5,608,148;和Ellis,美国专利5,681,730,描述了微粒介导的裸子植物的转化。 
一方面,原生质体可以被固定,并用核酸例如表达构建物注射。尽管源自原生质体的植物再生对于谷类并不容易,但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化,其中的DNA被包裹于钨微射弹(tungsten microprojectiles)上,射出物的大小为细胞大小的1/100,它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生,一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。 
核酸,例如表达构建物也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化,如,烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol. Biol.33:989-999),参见Porta(1996)“Use of viral replicons for the expression of genesin plants”,Mol.Biotechnol.5:209-221。 
可选择地,核酸,如表达构建物,可以与合适的T-DNA旁侧区域组合,并导入到传统的根癌农杆菌宿主载体中。根癌农杆菌宿主的毒力功能将在植物细胞受该细菌感染时,引导构建物和邻近的标记插入至植物细胞DNA中。根癌农杆菌介导的转化技术,包括disarming和二元载体的应用,在科学文献中有详细的说明。参见,如,Horsch(1984)Science 233:496-498;Fraley(1983)Proc.Natl.Acad.Sci.USA 80:4803(1983);Gene Transfer to Plants,Potrykus,ed.(Springer-Verlag,Berlin 1995)。根癌农杆菌细胞的DNA被包含在细菌染色体中,也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(~20kb长)和一系列毒力(virulence)基因,T-DNA在感染过程中被转移到植物细胞中,毒力基因则引导所述感染过程。根癌农杆菌可以通过伤口感染植物:当植物的根或者茎受伤,它释放某种化学信号,作为对这种信号的响应,根癌农杆菌的毒力基因被激活,并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA复制或者转录,然后将自身插入到暴露的植物DNA中。为了应用根癌农杆菌作为转基因载体,必须去除T-DNA的肿瘤诱导部分,而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间,从这里转移到植物细胞并且整合到植物的染色体中。 
本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化,参见Hiei(1997)Plant Mol.Biol.35:205-218。也参见如,Horsch,Science(1984)233:496;Fraley(1983)Proc.Natl Acad.Sci USA 80:4803;Thykjaer(1997)如上;Park(1996)Plant Mol.Biol.32:1135-1148,讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin,美国专利5,712,135,描述了包含在谷类或者其它单子叶植物的细胞中的具有功能性的基因的DNA的稳定整合过程。 
一方面,第三步可以包括能够将整合的靶基因传递至下一代的完整植物的选择和再生。这样的再生技术依赖于对组织培养生长培养基中的某些植物激素的操作,典型地,依赖于与所需的核苷酸序列一同引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明,Evans等,Protoplastslsolation and Culture,Handbook of Plant Cell Culture,124-176页,MacMillilanPublishing Company,New York,1983;和Binding,Regeneration of Plants,PlantProtoplasts,21-73页,CRC Press,Boca Raton,1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.ofplant Phys.38:467-486中有概括性的说明。为了从转基因组织如未成熟的胚胎获得整个植物,它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件 下培养,即称为组织培养的过程。一旦整个植物再生并且产生种子,便开始评价子代。 
在表达序列盒稳定地整入到转基因植物之后,其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术,这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化,包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此,本发明的种子可以来自本发明的两个转基因植物的杂交,或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(如,磷脂酶)时,所需的效应(例如,表达本发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。 
本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草,如牧草(蓝草,早熟禾属Poa),饲料草如羊茅属,黑麦草属,温带草,如翦股颖属(Agrostis),和谷类,如,小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(corn)。本发明的双子叶转基因植物的例子是烟草、豆类,如羽扇豆、马铃薯、甜菜、豌豆、蚕豆和大豆,以及十字花科植物(Brassicaceae属),如花椰菜,油菜籽,和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样,本发明的转基因植物和种子包括很宽范围的植物,包括,但不限于,以下属的种:腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、油菜属(Brassica)、柑桔属(Citrus)、Citrullus、辣椒属(Capsicum)、Carthamus、椰子属(Cocos)、咖啡属(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、Daucus、Elaeis、Fragaria、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、Majorana、苜蓿属(Medicago)、烟草属(Nicotiana)、Olea、Oryza、Panieum、Pannisetum、鳄梨属(Persea)、菜豆属(Phaseolus)、Pistachia、Pisum、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、Sinapis、茄属(Solanum)、高粱属(Sorghum)、Theobromus、Trigonella、小麦属(Triticum)、野豌豆属(Vicia)、Vitis、Vigna、和玉蜀黍属(Zea)。 
在可供选择的实施方式中,本发明的核酸在植物(例如,转基因植物),如含油籽植物,例如水稻、大豆、油菜籽、向日葵子、芝麻和花生中表达。本发明的核酸可以在含纤维细胞的植物,包括例如,棉花、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木、winterfat、balsa、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻中表达。在可供选择的实施方式中,本发明的转基因植物可以是棉 属(Gossypium)的成员,包括任何棉(Gossypium)种的成员,如,亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。 
本发明也提供用于大量生产本发明的多肽(例如磷脂酶或抗体)的转基因植物。例如,参见Palingren(1997)Trends Genet.13:348;Chong(1997)TransgenicRes.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′,2′)启动子,应用根癌农杆菌介导的叶片圆盘(leaf disc)转化方法,在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。 
应用已知的程序,技术人员可以通过检测在转基因植物中转基因mRNA或者蛋白的增加或者减少来筛选本发明的植物。检测和定量mRNA或者蛋白的方法是本领域熟知的。 
多肽或肽 
本发明提供了与本发明的示范性序列例如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ IDNO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ IDNO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144、SEQ ID NO:146、SEQ ID NO:148、SEQ IDNO:150、SEQ ID NO:152、SEQ ID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ IDNO:168、SEQ ID NO:170、SEQ ID NO:172,or SEQ ID NO:174具有序列同一性(例如,至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)序列同一性)的分离 的或重组的多肽。如以上讨论的,同一性可以在多肽的全长范围内,或者,同一性可以在其子序列,例如,至少大约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多残基的范围内。本发明的多肽也可以比示例性多肽(例如,SEQ ID NO:2、SEQ ID NO:4、SBQ ID NO:6、SEQ ID NO:8等)的全长要短。在可选择的实施方案中,本发明提供大小在大约5到多肽全长范围的多肽(肽,片段),所述多肽例如酶,如磷脂酶,例如,磷脂酶;示例性大小为大约5、10、15、20、25、30、35,40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400或更多残基,例如,SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8等的示例性磷脂酶的连续残基。本发明的肽可以用作,例如,标记探针、抗原、耐受原、基序、磷脂酶活性位点、结合结构域、调控结构域和类似物。 
一方面,多肽具有磷脂酶活性,例如,切割甘油磷酸酯键,水解磷酸酯键的能力,包括马铃薯块茎蛋白(patatin),脂酰水解酶(LAH),磷脂酶A,B,C和/或磷脂酶D活性,或它们的任意组合。 
在可选择的方面,本发明的示例性多肽具有磷脂酶活性,信号序列位置、最初来源,如在下表1中所阐述。为了帮助阅读此表,例如在第一排,其中SEQ IDNO:143、144指具有在SEQ ID NO:144中阐述的序列的多肽,和由SEQ ID NO:143编码的多肽,它们具有PLA-特异性PLA活性,最初分离自未知来源;另一个例子在SEQ ID NO:167,168行,其中167、168指具有在SEQ ID NO:168中阐述的序列的多肽,和由SEQ ID NO:167编码的多肽,它们具有磷脂酸磷酸酶活性,信号序列在位置1至30(“AA1-30”指氨基酸残基1至30,等等),即MARSWKWRPLLSSFLLVSLAPFSTSVPCFK,最初分离自未知来源。本发明提供也包含信号序列的肽,和嵌合多肽,其中所述肽和嵌合多肽包含表1中所阐述的信号序列,如下面所述。 
表1 
  SEQ ID  NO:   酶类型  信号 序列 位置 (AA= 氨基 酸)   信号(AA)   来  源
  143,  144   PA-特异  性PLA       未  知
  25,26   Patatin       未  知
  77,78   Patatin       未
[0384] 
          知
 35,36   Patatin       未  知
 125, 126   Patatin       未  知
 135, 136   Patatin       未  知
 99,100   Patatin       未  知
 65,66   Patatin       未  知
 87,88   Patatin       未  知
 86,87   Patatin       未  知
 45,46   Patatin       未  知
 59,60   Patatin       未  知
 13,14   Patatin       未  知
 71,72   Patatin       未  知
 55,56   Patatin       未  知
 33,34   Patatin       未  知
 91,92   Patatin       未  知
 103, 104   Patatin       未  知
 11,12   Patatin       未  知
 17,18   Patatin       未  知
[0385] 
  95,96   Patatin       未  知
  43,44   Patatin       未  知
  27,28   Patatin       未  知
  131,  132   Patatin       未  知
  127,  128   Patatin       未  知
  133,  134   Patatin       未  知
  137,  138   Patatin       未  知
  165,  166   Patatin       未  知
  167,  168   磷脂酸磷  酸酶   AA1-30   MARSWKWRPLLSSFLLVSLAPFSTSVPCF  K   未  知
  169,  170   磷脂酸磷  酸酶       未  知
  171,  172   磷脂酸磷  酸酶       未  知
  173,  174   磷脂酸磷  酸酶       未  知
  111,  112   磷脂酰肌  醇PLC   AA1-16   MGAGAILLTGAPTASA   细  菌
  107,  108   磷脂酰肌  醇PLC   AA1-23   MSNKKFILKLFICSTILSTFVFA   未  知
  109,  110   磷脂酰肌  醇PLC   AA1-23   MSNKKFILKLFICSTILSTFVFA   未  知
  113,  114   磷脂酰肌  醇PLC   AA1-23   MSNKKFILKLFICSTILSTFVFA   未  知
  117,  118   磷脂酰肌  醇PLC   AA1-23   MNNKKFILKLFICSMVLSAFVFA   未  知
  119,  120   磷脂酰肌  醇PLC   AA1-23   MNNKKFILKLFICSMVLSAFVFA   未  知
[0386] 
    醇PLC       知
  115,  116   磷脂酰肌  醇PLC   AA1-23   MNNKKFILKLFICSMVLSAFVFA   未  知
  121,  122   磷脂酰肌  醇PLC   AA1-23   MRNKKFILKLLICSTVLSTFVFA   未  知
  141,  142   磷脂酶       未  知
  155,  156   磷脂酶   AA1-36   MRTTTTNWRQIVKSLKLFLMGLCLFISASF  ASSAYA   未  知
  159,  160   磷脂酶       未  知
  145,  146   PLA       未  知
  147,  148   PLA       未  知
  149,  150   PLA       未  知
  151,  152   PLA       未   知
  153,  154   PLA       未  知
  157,  158   PLA       未   知
  163,  164   PLA       未   知
  101,  102   PLC   AA1-39 LSLVASLRRAPGAALALALAAATLAVTAQ GATAAPAAAAA   细  菌
  1,2   PLC   AA1-24   MKKKVLALAAMVALAAPVQSVVFAQ   未  知
  3,4   PLC   AA1-24   MKRKILAIASVIALTAPIQSVAFAH   未  知
  5,6   PLC   AA1-24   MKRKILAIASVIALTAPIQSVAFAH   未  知
  97,98   PLC   AA1-25   MKRKLCTWALVTAIASSTAVIPTAAE   未  知
[0387] 
  7,8   PLC   AA1-29   MITLIKKCLLVLTMTLLLGVFVPLQPSHAT   未  知
  31,32   PLC   AA1-20   MKKKLCTWALVTAISSGWAI   未  知
  81,82   PLC   AA1-25   MKKKLCTMALVTAISSGVVTIPTEAQ   未  知
  93,94   PLC   AA1-29   MITLIKKCLLVLTMTLLSGVFVPLQPSYAT   未  知
  89,90   PLC   AA1-25   MKKKLCTLAFVTAISSIAITIPTEAQ   未  知
  123,  124   PLC   AA1-24   MKKKVLALAAMVALAAPVQSVVFA   未  知
  129,  130   PLC   AA1-27   MKKKICTLALVSAITSGVVTIPTVASA   未  知
  139,  140   PLC   AA1-20   MKIKPLTFSFGLAVTSSVQA   未  知
  105,  106   PLC   AA1-30   MNRCRNSLNLQLRAVTVAALVVVASSAA  LAW   未  知
  9,10   PLC   AA1-20   MKLLRVFVCVFALLSAHSKAD   未  知
  47,48   PLD       未  知
  15,16   PLD       未  知
  41,42   PLD       未  知
  23,24   PLD       未  知
  51,52   PLD       未  知
  53,54   PLD       未  知
  19,20   PLD   AA1-19   MKKTTLVLALLMPFGAASAQ   未  知
  75,76   PLD       未
[0388] 
       
57,58  PLD     未知
63,64  PLD  AA1-18  MKNTLILAGCILAAPAVAD 未知
79,80  PLD  AA1-23  MRNFSKGLTSILLSIATSTSAMAF 未知
37,38  PLD  AA1-23  MRNFSKGLTSILLSIATSTSAMAF 未知
61,62  PLD  AA1-21  MTLKLSLLIASLSAVSPAVLAN 未知
67,68  PLD    无 未知
83,84  PLD  AA1-21  MKKIVIYSFVAGVMTSGGVFAA 未知
49,50  PLD  AA1-23  MNFWSFLLSITLPMGVGVAHAQPD 未知
39,40  PLD     未知
73,74  PLD     未知
29,30  PLD     未知
21,22  PLD  AA1-28  MQQHKLRNFNKGLTGVVLSVLTSTSAMA F 未知
71,72  PLD     未知
161,162  PLD  AA1-24  MNRKLLSLCLGATSCIALSLPVHA 未知
在一个方面,本发明提供了具有SEQ ID NO:107、SEQ ID NO:109、SEQ IDNO:111、SEQ ID NO:113、SEQ ID NO:115、SEQ ID NO:117、SEQ ID NO:119、SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ IDNO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143、SEQ ID NO:145、SEQID NO:147、SEQ ID NO:149、SEQ ID NO:151、SEQ ID NO:153、SEQ ID NO:155、 SEQ ID NO:157、SEQ ID NO:159、SEQ ID NO:161、SEQ ID NO:163、SEQ IDNO:165、SEQ ID NO:167、SEQ ID NO:169、SEQ ID NO:171和/或SEQ ID NO:173中阐明的序列的多肽,和其子序列,例如它们的具有磷脂酶活性,例如磷脂酶C(PLC)活性的活性位点(“催化结构域”)。在一个方面,多肽具有磷脂酶活性,但是缺少中性油(甘油三酯)水解活性。例如,在一个方面,多肽具有磷脂酶活性,但是缺少影响中性油(甘油三酯)组分的任何活性。在一个方面,本发明提供了脱胶工艺,该工艺包括使用具有磷脂酶活性但是缺少脂酶活性的本发明多肽。 
本发明的多肽和肽可以从天然来源分离,可以合成,或者是重组产生的多肽。肽和蛋白质可以体外或体内重组表达。本发明的肽和多肽可以使用本领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本领域熟知的化学方法,全部地或部分地合成,见,例如Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223;Horn(1980)Nucleic Acids Res.Symp.Ser.225-232;Banga,A.K.,Therapeutic Peptides and Proteins,Formulation,Processing and Delivery Systems(1995)Technomic Publishing Co.,Lancaster,PA。例如,肽合成可以使用各种固相技术进行(见,例如,Roberge(1995)Science 269:202,Metrifield(1997)MethodsEnzymol.289:3-13),并且可以例如使用ABI 431A肽合成仪(Perkin Elmer),根据生产商提供的指导自动合成。 
本发明的肽和多肽也可以糖基化。糖基化可以通过化学方法或者利用细胞生物合成机制在翻译后加上,其中后一种方式包括使用已知的糖基化基序,该糖基化基序可以是序列本来所拥有的,或者可以作为肽加上,或者加在编码序列的核酸中。糖基化可以是O-连接的或N-连接的。 
本发明的肽和多肽,如以上描述的,包括所有的“模拟的”和“肽模拟的”形式。术语“模拟的”和“肽模拟的”指的是基本上具有与发明的多肽相同结构和/或功能特征的合成化学化合物。模拟物可以是完全由合成的、非天然的氨基酸类似物组成,或者是部分天然肽氨基酸和部分氨基酸的非天然类似物组成的嵌合分子。模拟物也可以含有任何量的天然氨基酸保守取代,只要这样的取代基本上不改变模拟物的结构和/或活性。如同作为保守变异体的本发明多肽的情况,常规实验可以确定模拟物是否在发明的范围内,即,其结构和/或功能是否基本上没有被改变。因此,一方面,假如模拟物具有磷脂酶活性,那么该模拟物在本发明的范围内。 
本发明的多肽模拟物组合物可以含有非天然结构组分的任何组合。在可选择的方面,本发明的模拟物组合物包括以下三种结构基团的一种或所有:a)不是天然酰胺键(“肽键”)连接的残基连接基团,b)取代天然发生的氨基酸残基的非天然残基,或者c)诱导二级结构模拟,即诱导或稳定二级结构例如β-转角、γ-转角、β-折叠、α-螺旋构象和类似结构的残基。例如,当所有残基或一些残基通过化学方式,而不是天然肽键的方式连接时,本发明的多肽可以表征为模拟物。各个肽模拟物残基可以通过肽键、别的化学键或者偶联方式,例如,戊二醛,N-羟基 琥珀酰亚胺酯、双功能马来酰亚胺、N,N′-二环己基碳二亚胺(DCC)或者N,N′-二异丙基碳二亚胺(DIC)连接。可以作为常规的酰胺键(“肽键”)连接的替代连接基团包括,例如,南五味子酮(例如,-C(=O)-CH2-,针对-C(=O)NH)、氨基亚甲基(CH2-NH)、乙烯、烯烃(CH=CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4-)、噻唑、反向酰胺(retroamide)、硫代酰胺或酯(见,例如,Spatola(1983),Chemistry and Biochemistry of Amino Acids,Peptides and Proteins,VOl.7,pp267-357,“Peptide Backbone Modifications,”Marcell Dekker,NY)。 
本发明的多肽也可以由于含有所有或一些取代天然发生的氨基酸残基的非天然残基,而表征为模拟物。非天然残基在科学文献和专利文献中得到充分地描述;一些用作天然氨基酸残基的模拟物的示例性的非天然组分和指导描述于下。芳香族氨基酸的模拟物可以通过被下述氨基酸取代产生,例如,D-或L-萘丙氨酸(naphylalanine);D-或L-苯基甘氨酸,D-或L-2噻吩丙氨酸(thieneylalanine);D-或L-1、-2、3-或4-芘基丙氨酸;D-或L-3噻吩丙氨酸(thieneylalanine);D-或L-(2-吡啶基)-丙氨酸;D-或L-(3-吡啶基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸;D-或L-(4-异丙基)-苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或L-p-二苯基苯基丙氨酸;K-或L-p-甲氧基二苯基苯基丙氨酸;D-或L-2-吲哚-(烷基)丙氨酸;和D-或L-alkylainines,或非酸性氨基酸,其中烷基可以是取代的或不取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、sec-isotyl、异戊基或非酸性氨基酸。非天然氨基酸的芳香环包括,例如,噻唑基、苯硫基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯和吡啶基芳香环。 
酸性氨基酸的模拟物可以通过用以下的取代来产生,如,保持有负电荷的非羧酸氨基酸;(膦酰基)丙氨酸;硫酸化的苏氨酸。羧基侧链(如,天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰,所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮鎓-4,4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如,(除了赖氨酸和精氨酸外)鸟氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸的取代产生,其中烷基如以上定义。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂在优选为碱性的条件下反应而产生,所述的常规试剂包括如苯乙二醛、2,3-丁二酮、1,2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮化合物或者四硝基甲烷反应而产生。N-acetylimidizol和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺 反应而产生;得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-imidozoyl)丙酸;氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸盐;2-氯汞-4硝基苯酚,或者,氯-7-硝基苯并-氧杂-1,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如methyl picolinimidate、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应,和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括,例如,2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或者对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括,例如,由脯氨酸和赖氨酸的羟基化作用产生的模拟物;由丝氨酰或者苏氨酰的羟基的磷酸化作用产生的模拟物;由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物;由N-末端胺的乙酰化作用而产生的模拟物;由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物;或者,由C-末端羧基的酰胺化而产生的模拟物。 
本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。因此,任何天然发生的L-构型(也可以被称为R或者S,取决于化学实体的结构)的氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代,相反手性的氨基酸称为D-氨基酸,但也可以称R-或者S-型。 
本发明也提供了通过天然过程,如,翻译后加工(如,磷酸化,酰化以及类似作用)或者化学修饰技术修饰本发明的多肽的方法,以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解,相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或者核苷酸衍生物、共价连接脂质或者脂质衍生物、共价连接磷脂酰肌醇、交联的环化作用、形成二硫键、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解过程、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用,和转移RNA介导氨基酸添加到蛋白质中,如精氨酰化。参见,如,Creighton,T.E.,Proteins-Structure and Molecular Properties 2nd Ed.,W.H.Freeman和Company,New York(1993);Posttranslational Covalent Modification ofProteins,B.C.Johnson,Ed.,Academic Press,New York,11-12页(1983)。 
固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,Solid PhasePeptide Synthesis,第二版,Pierce Chemical Co.,Rockford,III,11-12页),并且这些方法已经可以通过商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearch Biochemicals)而被应用。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的方法,它们让肽合成在多个“杆(rods)”或者“钉(pins)”的顶端进行,而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时,一个板的杆或者钉被倒转并插入到另一个板的相应孔或者贮存器中,所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤,即是,反转和插入所述杆和钉的顶端至适当的溶液中,将氨基酸构建成所要的肽。此外,大量的FMOC肽合成系统是可利用的。例如,应用Applied Biosystems,Inc.的Model 431ATM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得,或者通过直接的合成或者通过用其它已知的技术将一系列片段偶联起来的合成。 
磷脂酶 
本发明提供新的磷脂酶,编码磷脂酶的核酸,结合磷脂酶的抗体,代表酶的抗原位点(表位)和活性位点的肽,调控和结合结构域,和产生和使用它们的方法。一方面,本发明的多肽具有磷脂酶活性,或者如以上描述的的磷脂酶活性(例如,切割磷酸甘油酯键,缺少脂酶活性,等等)的任何组合。在可选择的方面,本发明的磷脂酶具有由在此描述的示范性磷脂酶的活性修饰而得的活性。 
本发明包括具有或不具有信号序列的磷脂酶和信号序列本身。本发明包括本发明的酶的片段或子序列,例如包含催化结构域(活性位点)、结合位点、调控结构域、表位、信号序列、前原结构域(prepro domains)和类似物的肽或多肽,或由它们组成的肽或多肽。本发明也包括固定化的磷脂酶、抗磷脂酶抗体和它们的片段。本发明包括杂合物(heterocomplexes),例如,包括本发明的磷脂酶的融合蛋质、异二聚体等。代表酶的抗原位点(表位)、活性位点、结合位点、信号序列和类似物的肽可以用常规的筛选方案测定。 
本发明的这些酶和过程可以用于取得对高磷含量的油,特别是大米、大豆、玉米、油菜和向日葵油更彻底的脱胶。例如,在一个方面,一旦用PI-PLC切割,磷脂酰肌醇被转化为二酰基甘油和磷酸肌醇(phosphoinositol)。在离心期间,二酰基甘油与水相分开(从而提高油产量),磷酸肌醇与水相分开,其中它作为重相的组分被去除。本发明的酶,例如本发明的PI-PLC可以被掺入到化学或物理油精炼过程中。 
在可选的实施方案中,本发明的酶具有磷脂酰肌醇特异性磷脂酶C(PI-PLC)活性、磷脂酰胆碱特异性磷脂酶C活性、磷脂酸磷酸酶活性、磷脂酶A活性和/或patatin-相关磷脂酶活性。这些酶可以单独使用,或者相互之间或与本发明的其他酶或其他酶组合使用。在一个方面,本发明提供了这样的方法,其中这些酶(包括本发明的磷脂酰肌醇特异性磷脂酶C(PIPLC)、磷脂酰胆碱特异性磷脂酶C和/或磷脂酶D(与磷酸酶结合)、磷脂酸磷酸酶、磷脂酶A、patatin-相关磷脂酶)被单独或组合使用,用于使油脱胶,所述油诸如诸如植物油,例如高磷油,诸如,大豆油、玉米油、油菜油、米糠油和向日葵油。本发明的这些酶和过程可以用于取得对高磷含量的油,特别是大豆、玉米、油菜、米糠和向日葵油更彻底的脱胶。一旦用PI-PLC切割,磷脂酰肌醇被转化为二酰基甘油和磷酸肌醇。在离心期间,二酰基甘油与水相分开(提高油产量),磷酸肌醇与水相分开,其中它作为重相的组分被去除。本发明的酶,例如本发明的PI-PLC可以被掺入到化学或物理油精炼过程中。 
在一个方面,本发明提供了组合物,例如溶液,其包括在中性pH的柠檬酸钠,以水合不可水合物。例如,本发明提供了pH范围在约4至9或约5至8或约6至7的柠檬酸钠溶液,其可以用来水合在高磷油中的不可水合的磷脂(包括本发明的酶)。在一个方面,非水合磷脂的水合是通过螯合与磷脂相关的钙和镁进行的,从而使得之前不可溶的磷脂盐更容易地在水相中分开。在一个方面,一旦磷脂向水/油介面移动或进入水相,本发明的磷脂酶(例如本发明的磷脂酶特异性磷酸水解酶)或其他磷脂酶,将会把该磷脂转化为二酰基甘油和磷酸酯。在一个方面,一旦加入酸和碱,钙和镁金属的含量将降低(参见有关碱过程的论述) 
本发明的酶是高度选择性的催化剂。与别的酶一样,它们催化常规的合成化学术所不能比拟的具有精巧的立体选择性、区域选择性和化学选择性的反应。而且,本发明的酶是非常多用的。它们可以经改变而在有机溶剂中具有功能,可在极端pH(例如,高pH和低pH)、极端温度(例如,高温和低温)、极端盐度水平(例如,高盐度和低盐度)下操作,并且催化结构上与它们的天然的、生理学上的底物无关的化合物的反应。本发明的酶可以设计为与大范围的天然和非天然底物具有反应活性,因此,使得能事实上修饰任何有机先导化合物。本发明的酶也可以设计为具有高度的对映选择性和区域选择性。这些酶所展示出的高度的官能基团选择性使得人们能明了产生新的活性化合物的合成顺序中的每一个反应。本发明的酶也可以设计为催化许多与它们的天然生理功能无关的不同的反应。 
本发明开发了酶的独特催化特性。然而,在化学转化中,生物催化剂(即,纯化的酶或粗酶,非活细胞或活细胞)的使用一般要求确定与特异的起始化合物反应的特定生物催化剂。本发明使用经选择的生物催化剂,即,本发明的酶,和对在许多起始化合物中都存在的功能基团具有特异性的反应条件。每种生物催化剂对一种功能基团,或几种相关功能基团特异,可以与含有这种功能基团的多种 起始化合物反应。生物催化反应由单个的起始化合物产生一个衍生物群体。这些衍生物可以经过另一轮生物催化途径,产生第二个群体衍生化合物。生物催化衍生化作用的每次重复都可以产生数千种最初化合物的变异体。 
酶在起始化合物的特异位点反应,不影响该分子的其余部分,这个过程使用常规的化学方法是难以达到的。此高度的生物催化特异性提供了确定文库中单个活性酶的方法。文库是用一系列用于产生该文库的生物催化反应表征,是一个所谓的“生物合成史”。筛选文库的生物学活性以及追踪生物合成史,可确定产生该活性化合物的特异反应顺序。重复反应顺序,测定合成的化合物的结构。这种鉴定方式,与别的合成和筛选方法不同,不要求固定化技术,化合物可以在溶液中合成,并且实际上使用任何类型的筛选分析方法进行任意进行检测。需要注意的是,酶反应对功能基团的高度特异性使得可以“追踪”形成生物催化产生的文库的特异性酶反应。 
本发明也提供使用本发明的核酸、多肽和抗体,来发现新的磷脂酶的方法。一方面,筛选λ-噬菌体文库以基于表达发现磷脂酶。在筛选中使用λ-噬菌体文库可以允许如下事项:检测毒性克隆;改进与底物的接触;降低对工程改造宿主的要求,绕开任何由文库的大量排除所致的潜在偏差;和,在低克隆密度下的快速生长。λ-噬菌体文库的筛选可以在液相或在固相中进行。在液相中筛选赋予分析条件的更大灵活性;额外的底物灵活性;对弱克隆更为灵敏;比固相筛选易于自动化。 
许多程序步骤使用机器自动化进行,每天可以完成几千种生物催化反应和筛选分析,同时确保高度准确和再现性(见以下的阵列讨论)。结果,衍生化合物的文库可以在大概数周内获得。对分子,包括小分子修饰的进一步教导,见PCT/US94/09174。 
磷脂酶信号序列和催化结构域 
本发明提供磷脂酶的信号序列(例如,信号肽(SPs)),例如含有信号序列的肽和/或嵌合多肽,其中所述肽或嵌合多肽具有表1中示出的信号序列,或如下面示出的信号序列。本发明提供了编码这些信号序列(SPs,例如具有含有本发明多肽的氨基末端残基的序列的肽,或具有由本发明多肽的氨基末端残基组成的序列的肽)的核酸。一方面,本发明提供了信号序列,其包括这样的肽,该肽包含本发明多肽的残基1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到29、1到30、1到31、1到32或1到33中所阐述的序列,或该肽由所述序列组成,所述本发明的多肽例如SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、 SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74、SEQ ID NO:76、SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112、SEQ IDNO:114、SEQ ID NO:116、SEQ ID NO:118、SEQ ID NO:120、SEQ ID NO:122、SEQID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138;SEQ ID NO:140;SEQ ID NO:142;SEQ ID NO:144;NO:146、SEQ ID NO:148、SEQ ID NO:150、SEQ ID NO:152、SEQID NO:154、SEQ ID NO:156、SEQ ID NO:158、SEQ ID NO:160、SEQ ID NO:162、SEQ ID NO:164、SEQ ID NO:166、SEQ ID NO:168、SEQ ID NO:170、SEQ ID NO:172或SEQ ID NO:174。这些肽中的任何肽可以是嵌合蛋白例如重组蛋白的一部分。信号序列肽可以与本发明的其他酶(例如本发明的磷脂酶,从中本得不到该信号序列),或与其他磷脂酶,或与任何多肽相配,如下进一步论述。 
示例性的信号序列列于表1和SEQ ID列表中,如,SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6的残基1到24;SEQ ID NO:8的残基1到29;SEQ ID NO:10的残基1到20;SEQ ID NO:20的残基1到19;SEQ ID NO:22的残基1到28;SEQ ID NO:32的残基1到20;SEQ ID NO:38的残基1到23;对于本发明的其它示例性信号序列,参见表1和SEQ ID列表。 
在一些方面,本发明的磷脂酶无信号序列。在一个方面,本发明提供了缺少所有或部分信号序列的磷脂酶。在一个方面,本发明提供了编码来自一种磷脂酶的信号序列的核酸序列,该核酸序列可操作性地连接到不同的磷脂酶的核酸序列上,或者,任选地,来自非磷脂酶蛋白的信号序列也可以是期望的。 
磷脂酶前原结构域(prepro domains)、结合结构域和催化结构域 
如上所述,除了信号序列(例如信号肽(SPs)),本发明提供了前原结构域、结合结构域(例如底物结合结构域)和催化结构域(CDs)。本发明的SP结构域、结合结构域、前原结构域和/或CDs可以是分离的或重组的肽,或可以是融合蛋白的一部分,例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CDs)(例如″活性位点″)、前原结构域、结合结构域和信号序列(SPs,例如具有含有本发明多肽的氨基末端残基的序列的肽,或具有由本发明多肽的氨基末端残基组成的序列的肽)的核酸。 
本发明的磷脂酶的信号序列(SPs)、结合结构域、催化结构域(CDs)和/或前原序列(prepro sequences)可以是分离的肽,或者连接于其他磷脂酶或者非磷脂酶多肽的序列,如,作为融合(嵌合)蛋白。在一方面,包含本发明磷脂酶信号序列SPs和/或前原序列的多肽含有与本发明磷脂酶异源的序列(例如,包含本发明的SP和/或前原序列以及其他磷脂酶或非磷脂酶蛋白的序列的融合蛋白)。在一个方面,本发明提供了具有异源CDs、SPs和/或前原序列,例如具有酵母信号序列的序列的本发明磷脂酶。本发明的磷脂酶可以包括异源的CDs、SPs和/或前原序列,它们在载体中,例如在pPIC系列载体(lnvitrogen,Carlsbad,CA)中。 
一方面,本发明的SPs、CDs和/或前原序列在鉴定了新型的磷脂酶多肽之后来确定。分选蛋白质并且转运蛋白质至它们的细胞内合适位置的途径,一般被称为蛋白质定向转运途径(protein targeting pathways)。在所有这些定向转运系统中的最重要成员之一是在新合成多肽的氨基端的短氨基酸序列,叫做信号序列。信号序列引导蛋白质至细胞的合适位置定位,并且在转运过程中或者当蛋白到达其最终的目的地之后去除。大多数溶酶体蛋白,膜蛋白,或者分泌蛋白具有氨基末端信号序列,该序列标记这些蛋白用于转移到内质网的腔中。信号序列的长度可以在从13到45或更多个氨基酸残基内进行变化。本领域技术人员知道识别信号序列的各种方法。例如,一方面,通过称为SignalP的方法来鉴定新型的水解酶信号肽。SignalP应用识别信号肽和它们的切割位点的组合的神经网络。(Nielsen,et al.,“Identification of prokaryotic and eukaryotic signal peptides and prediction oftheir cleavage sites.”Protein Engineering,vol.10,no.1,p.1~6(1997)。 
在一个方面,本发明的磷脂酶不必具有SPs和/或前原序列,和/或催化结构域(CDs)。在一个方面,本发明提供缺少所有或部分SP、CD和/或前原结构域的磷脂酶。在一个方面,本发明提供了编码来自一种磷脂酶的信号序列(SP)、CD和/或前原序列的核酸序列,其可操作性地连接到不同的磷脂酶的核酸序列上,或任选地,来自非磷脂酶蛋白的信号序列(SP)、CD和/或前原结构域也是可期待的。 
本发明也提供了分离的或者重组的多肽,含有本发明的信号序列(SPs)、前区域和/或催化结构域(CDs),以及异源序列。异源序列是与SP、前区域和/或CD非天然相关(如,对于磷脂酶)的序列。与SP、前区域和/或CD非天然相关的序列可以在SP、前区域和/或CD的氨基末端,羧基末端,和/或在SP和/或CD的末端。一方面,本发明提供了分离的或者重组的多肽,包括(或者由…组成)这样的多肽,该多肽包括本发明的信号序列(SPs)、前区域和/或催化结构域(CDs),条件是其并不与和与其有天然联系的任何序列有联系(如磷脂酶序列)。相似地,一方面,本发明提供了编码这些多肽的分离的或者重组的核酸。所以,在一个方面,本发明的分离或者重组核酸包含有本发明的信号序列(SP)、前区域和/或催化结构域(CD)以及异源序列(即是,与本发明的信号序列(SP)、前区域和/ 或催化结构域(CD)的编码序列并不天然关联的序列)的编码序列。异源序列可以在3’末端、5’末端,和/或在SP、前区域和/或CD编码序列的末端。 
本发明的多肽包括活性形式的或无活性形式的磷脂酶。例如,本发明的多肽包括成熟作用或对前序列加工之前的前蛋白,对前序列加工例如通过前蛋白-加工酶,例如前蛋白转化酶对前蛋白加工产生“有活性的”成熟蛋白。本发明的多肽包括因其他原因而失活的磷脂酶,这些原因例如翻译后加工事件而“激活”之前无活性,例如内-或外肽酶或蛋白酶作用、磷酸化作用事件、酰胺化作用、糖基化作用、去糖基化、硫酸化作用、二聚体化事件和/或类似作用。鉴定“前”区域序列、CDs、结合结构域和信号序列的方法是常规的,并且是本领域熟知的,参见例如Van deVen(1993)Crit.Rev.Oncog.4(2):115-136;用于鉴定蛋白质-蛋白质相互作用的酵母双杂交筛选,由Miller(2004)Methods MoI.Biol.261:247-62;Heyninck(2004)Methods MoI.Biol.282:223-41,USPN 6,617,122;6,190,874描述。例如,为了鉴定前区域,从胞外空间纯化蛋白质,测定N-端蛋白质序列,并与未加工的形式作比较。 
本发明的多肽可以作为蛋白质制剂配制成任何液体、固体、半固体或凝胶形式。例如,本发明的蛋白质制品可以包括这样的制剂,其含有非水液体组合物、铸造固体、粉末、冻干的粉末、粒状形式、颗粒形式、压缩的片剂、小球、丸、凝胶形式、水凝胶、膏、气溶胶、雾剂、洗液或浆状制剂。 
本发明的多肽包括所有的活性形式,包括本发明酶的活性子序列,例如催化结构域(CDs)或活性位点。在一个方面,本发明提供下面阐述的催化结构域或活性位点。在一个方面,本发明提供了肽或多肽或等同物,其包括通过使用数据库诸如Pfam(其收集了大量的多序列比对和覆盖了许多常见的蛋白质家族的隐藏的Markov模型,The Pfam protein families database,A.Bateman,E.Birney,L.Cerruti,R.Durbin,L.Etwiller,S.R.Eddy,S.Griffiths-Jones,K.L.Howe,M.Marshall,and E.L.L.Sonnhammer,Nucleic Acids Research,30(1):276-280,2002)而预测到的活性结构域,或由这些预测到的活性结构域组成。 
本发明提供了本发明酶的N-端或C-端子序列(例如信号序列、前序列)与其他多肽、活性蛋白质或蛋白质片段的融合物。本发明的酶(例如磷脂酶C酶)可以通过将酶作为无活性的融合蛋白表达而产生,该无活性的融合蛋白随后通过蛋白质水解切割事件激活(使用内源性或外源性蛋白酶活性,例如胰蛋白酶),切割导致融合蛋白伴侣和成熟的酶,例如磷脂酶C酶分离。在一个方面,本发明的融合蛋白由杂合核苷酸构建物表达,该构建物编码单个开放阅读框,含有下述元件:融合蛋白的核苷酸序列、接头序列(定义为编码连接两个柔性较小的蛋白区域的柔性氨基酸序列的核苷酸序列)、蛋白酶切割识别位点、和成熟酶(例如本发明的任何酶,例如磷脂酶)序列。在可选的方面,融合蛋白可以包含果胶裂解酶序列、木聚糖酶序列、磷脂酸磷酸酶序列或另一序列,例如之前显示在感兴趣的宿主细胞中过量表达的序列。 
可以使用任何宿主系统(参见上面论述),例如任何细菌,例如革兰氏阳性细菌,诸如杆菌属,或革兰氏阴性细菌,诸如大肠杆菌,或任何酵母,例如巴斯德毕赤酵母。嵌合核苷酸构建物中的核苷酸序列的排列可以基于用每一融合构建物获得的蛋白质表达水平来测定。在一个方面,从核苷酸构建物的5′端至构建物的3′端,核苷酸序列如下装配而成:信号序列/融合蛋白/接头序列/蛋白酶切割识别位点/成熟酶(例如本发明的任何酶,例如磷脂酶)或信号序列/前序列/成熟酶/接头序列/融合蛋白。酶(例如本发明的任何酶,例如磷脂酶)作为无活性融合蛋白表达,可以提高酶序列的总表达水平,可以减少与活性酶过表达相关的任何潜在的毒性,和/或可以增加使用之前的货架期,这是因为在融合蛋白,例如果胶裂解酶与酶,例如磷脂酶蛋白分离之前是无活性的。 
在各个方面,本发明提供了激活作为融合蛋白表达的本发明的磷脂酶的具体的制剂。在一个方面,使用蛋白质水解活性或潜的蛋白质水解活性结合氨基-末端或羧基末端肽酶,来激活最初作为无活性的融合蛋白表达磷脂酶活性。该激活事件可以用各种方法实现,并且是在应用于油脱胶之前的制备/储存过程的各种时间点时进行。本发明的示例性工艺包括:在将融合构建物分泌到发酵介质中后由生产性宿主表达的内源活性进行的切割;在宿主细胞破裂之后,由激活的内源性蛋白酶活性进行的切割,或与胞内表达的融合构建物接触;使粗或纯化的融合构建物通过具有固定化的蛋白酶活性的柱,以在制备酶制剂之前完成切割和酶(例如本发明的磷脂酶,例如磷脂酶C)激活作用。用可溶性的蛋白质水解活性源处理粗的或纯化的融合构建物;在油精炼中,使用可溶性的或不溶性的蛋白质水解活性源,激活磷脂酶(例如本发明的磷脂酶,例如磷脂酶C),之后立即用于各工艺中;和/或在减低的温度(例如在约4℃至20℃之间的任何温度),通过使融合构建物制剂持续循环通过具有固定化的蛋白酶活性的柱,来激活(例如本发明的磷脂酶,例如磷脂酶C)磷脂酶活性。该激活事件可以在传递到使用位置之前完成,或它可以在油精炼中原位发生。 
糖基化 
本发明的肽和多肽(例如水解酶,抗体)也可以进行糖基化,例如在一个方面,含有至少一个糖基化位点,例如N-连接或O-连接的糖基化。在一个方面,多肽可以在巴斯德毕赤酵母或粟酒裂殖酵母中表达后进行糖基化。糖基化可以在翻译后以化学的方式或通过胞内生物合成机制加入,其中后者整合使用已知的糖基化基序,其对于序列来说可以天然的,或可以作为肽加入,或加入到核酸编码序列中。 
在一个方面,本发明提供了含有N-连接的糖基化的SEQ ID NO:2的多肽,如下表中所述。 
Figure G05814667620061109D000981
全长SEQ ID NO:2(在一个方面其由SEQ ID NO:1编码)开放阅读框编码七(7)个潜在的天冬酰胺-连接的(N-连接)糖基化位点。野生型SEQ ID NO:2开放阅读框在能够进行糖基化的宿主(例如,巴斯德毕赤酵母、酿酒酵母、粟酒裂殖酵母或哺乳动物细胞)中的表达,导致产生糖基化的SEQ ID NO:2磷脂酶,其由于存在N-连接的糖基化作用基本上没有活性。用PNGase F或内切糖苷酶H对野生型糖基化的SEQ ID NO:2进行酶促去糖基化作用,导致激活SEQ ID NO:2活性。此外,通过诱变对一个或多个N-连接的糖基化位点进行修饰(以便该位点不再被识别为N-连接的糖基化位点,并且糖基化不再发生在那个位点),导致产生具有不同程度的活性增加的SEQ ID NO:2。 
相比在相同的宿主细胞中表达的野生型开放阅读框,对SEQ ID NO:2糖基化位点4、5和/或6中编码天冬酰胺的核苷酸密码子进行诱变(例如将天冬酰胺转化为天冬氨酸),导致产生具有增加的PLC活性的酶(在巴斯德毕赤酵母中表达的三联突变体具有与在非糖基化宿主如大肠杆菌中表达的野生型序列基本上相同的比活性和功能活性)。在N-连接的糖基化共有序列(NXS/T)中通过诱变丝氨酸或苏氨酸残基来废除N-连接的糖基化位点也是可能的,例如通过在这些位置改变这些核苷酸密码子产生缬氨酸或异亮氨酸,以代替丝氨酸或苏氨酸。使用该策略来除去N-连接的糖基化位点也导致在具有糖基化作用的宿主表达系统中产生活性SEQ ID NO:2磷脂酶。 
磷脂酶活性的分析 
本发明提供了具有磷脂酶活性或磷脂酶活性的任何组合的分离的、合成的或者重组的多肽(例如酶、抗体),以及编码它们的核酸。本领域已知的很多磷脂酶分析方法中的任何方法都可以来用于确定是否多肽具有磷脂酶活性,并且是否是属于本发明的范围。用于确定磷脂酶A、B、D和C,patatin和脂酰水解酶活性或脂酶活性的常规方案是本领域已知的。 
示例性的活性分析包括混浊度分析、羟甲香豆素磷酸胆碱(荧光)分析、Amplex red(荧光)磷脂酶分析、薄层色谱分析(TLC)、细胞裂解分析和p-硝基 苯基磷脂酰胆碱分析。应用这些分析方法,可以很快地筛查出具有磷脂酶活性的多肽、肽或抗体。 
磷脂酶活性可以包括脂酰水解酶(LAH)活性,参见如,Jimenez(2001)Lipids 36:1169-1174,该文献描述了用于确定patatin的脂酰水解酶活性的以十八烷基乙烯乙二醇单十二烷基醚为基础的混合微胶粒分析。Pinsirodom(2000)J.Agric.Food Chem.48:155-160,该文献描述了示例性的脂酰水解酶(LAH)patatin活性。 
在以下文献中说明了用于确定磷脂酶活性的混浊度分析,如,在Kauffmann(2001)“Conversion of Bacillus thermocatenulatus lipase into an efficientphospholipase with increased activity towards long-chain fatty acyl substrates bydirected evolution and rational design”Protein Engineering 14:919-928;Ibrahim(1995)“Evidence implicating phospholipase as a virulence factor of Candida albicans,”Infect.Immun.63:1993-1998。 
用于确定磷脂酶活性的羟甲香豆素(荧光)磷酸胆碱分析方法描述在下述文献中,例如Goode(1997)”Evidence for cell surface and internal phospholipaseactivity in ascidian eggs,”Develop.Growth Differ.39:655-660;Diaz(1999)”Directfluorescence-based lipase activity assay,”BioTechniques 27:696-700。 
用于确定磷脂酶活性的Amplex Red(荧光)磷脂酶分析可以作为试剂盒获得,如,应用来自Molecular Probes Inc.(Eugene,OR)的Amplex Red磷脂酰胆碱特异性磷脂酶分析试剂盒,按照制造商的说明,检测磷脂酰胆碱特异性磷脂酶。在荧光微板读数器中,使用560±10nm的激发光和590±10nm的荧光检测,测量荧光。该分析在极低酶浓度时也灵敏。 
确定磷脂酶活性的薄层色谱分析(TLC)描述在Reynolds(1991)Methodsin Enzymol.197:3-13;Taguchi(1975)“Phospholipase from Clostridium novyi typeA.I,”Biochim.Biophys.Acta 409:75-85中。薄层色谱分析(TLC)是用于检测磷脂酶活性的广泛应用的技术。已经应用了该方法的不同的经改良的方法从液相分析混合物提取磷脂酶。在一些PLC的分析中,通过浆氯仿/甲醇(2∶1)加入到反应混合物中来终止水解。未反应的起始物以及二酰基甘油通过抽提进入有机相,并且可以通过TLC分离,首基(head group)产物仍存在水相中。为了获得对磷脂消化更精确的测定,可以使用放射性标记的底物(参见,如,Reynolds(1991)Methodsin Enzymol.197:3-13)。产物和反应物的比率可以用于计算单位时间内的底物水解的实际摩尔数。如果所有的成分相同提取,提取中的任何损失将相同地影响所有的成分。磷脂消化产物的分离可以通过硅胶TCL来完成,用氯仿/甲醇/水(65∶25∶4)作为溶剂系统(参见,如,Taguchi(1975)Biochim.Biophys.Acta 409:75-85)。[391]确定磷脂酶活性的p-硝基苯磷脂酰胆碱分析描述于例如Korbsrisate(1999)J.Clin.Microbiol.37:3742-3745;Berka(1981)Infect.Immun.34:1071-1074。该 分析方法基于酶法水解底物类似物p-硝基苯磷脂酰胆碱,释放黄色的生色化合物p-硝基苯,可以在405nm检测到。该底物方便用于进行高通量筛选。 
基于红细胞裂解,细胞裂解分析可以检测具有细胞裂解活性的磷脂酶。毒性磷脂酶可以与真核细胞膜作用,并水解磷脂酰胆碱和鞘磷脂,引起细胞裂解,参见,如,Titall(1993)Microbiol.Rev.57:347-366。 
杂合(嵌合)磷脂酶和肽文库 
一方面,本发明提供了杂合磷脂酶和融合蛋白,包括肽文库,其含有本发明的序列。本发明的肽文库可以用于分离靶标如磷脂酶底物、受体、酶的肽调节物(如激活剂或者抑制剂)。本发明的肽文库可以用于鉴定靶的正常结合伴侣,如配基,例如,细胞因子、激素和类似物。一方面,本发明提供了包括本发明的信号序列(SP)和/或催化结构域(CD)以及异源序列的嵌合蛋白(参见以上)。 
本发明也提供了应用本发明核酸和多肽,来产生“改进的”和杂合的磷脂酶的方法。例如,本发明提供了用于产生具有活性的酶的方法,所述活性如,在极端碱性pH值和/或酸性pHs、高和低的温度、渗透压和类似条件下的磷脂酶活性(如,磷脂酶A、B、C或者D活性、patatin酯酶活性、甘油磷酸酯键的切割、植物油中磷脂的酯连接的切割)。本发明提供了用于产生杂合酶(如,杂合磷脂酶)的方法。 
一方面,本发明的方法通过应用细胞内过程产生新的杂合多核苷酸,该过程整合第一多核苷酸的序列,这样所得到的杂合多核苷酸编码表现出源于第一生物活性多肽的活性的多肽。例如,第一多核苷酸可以是编码本发明示例性的磷脂酶(如SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8等)的示例性核酸序列(如SEQ ID NO:1、SEQ ID NO:3、SBQ ID NO:5、SEQ ID NO:7等)。第一核酸可以编码来自一种生物的酶,其在特定的环境条件下,如高盐的条件下有效地发挥作用。它可以与由源于不同生物体的第二多核苷酸所编码的酶“整合”,该酶可以在不同的环境条件下如极端的高温条件下,有效地发挥作用。例如,两个核酸可以通过例如重组和/或还原性重配产生杂合分子。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸可以编码表现出由原始多核苷酸编码的两种酶的特性的酶。因此,由杂合多核苷酸编码的酶可以在第一和第二多核苷酸编码的酶共有的环境条件下,如高盐和极端温度下有效地发挥作用。 
可选择地,由本发明的方法得到的杂合多肽可以表现出原始酶所没有显示出的特异化酶活性。例如,在编码磷脂酶活性的多核苷酸重组和/或还原性重配以后,由杂合多核苷酸编码得到的杂合多肽可以通过被筛查来自每一种起始酶的特异活性,即,磷脂酶对之起作用的键的类型以及磷脂酶发挥作用的温度。这样,例如,可以筛查磷脂酶,来查明那些可以将杂种磷脂酶从起初的磷脂酶分辨出来的化学功能,如:(a)酰胺(肽键),即是,磷脂酶;(b)酯键,即是磷脂酶 和脂酶;(c)乙醛缩,即是糖苷酶,和,例如,杂合多肽起作用时的温度、pH或者盐浓度。 
待与本发明的核酸“整合”的多核苷酸来源可以从下述情形中分离:个体生物(“分离物”),生长于成分确定培养基的生物群(“富集培养物”),或者,未经培养的生物(“环境样品”)。由于其使人们可以接近未开发的具生物多样性的资源,应用培养物依赖性(culture-independent)方法来得到编码来自环境样品的新型生物活性的多核苷酸是最优选的。“环境文库”是从环境样品中产生,并且代表了天然发生生物体的全体基因组,环境文库保存在克隆载体中,载体可以在适合的原核宿主中繁殖扩增。因为克隆DNA起初是从环境样品中直接提取,文库并不限于可以生长于纯培养基中的小部分的原核生物。此外,存在于这些样品中的环境DNA的标准化,可以允许其更加平等地代表在起始样品中存在的所有种的DNA。这就可以显著增加从样品的次要组成中发现感兴趣基因的效率,该样品中的次要组成与优势种相比,可能少了几个数量级。 
例如,从一个或者更多的未培养的微生物产生的基因文库中,筛查感兴趣的活性。编码感兴趣的生物活性分子的潜在途径,首先在原核生物细胞中以基因表达文库的方式被捕获。编码感兴趣活性的多核苷酸分离自这样的文库,并且引入到宿主细胞中。将宿主细胞生长于促进重组和/或还原性重配的环境中,从而产生具有新型的或者增强活性的潜在的生物活性分子。 
可以制备杂合多核苷酸的微生物包括原核微生物如真细菌和古细菌,低等真核微生物如真菌、一些藻和原生动物。多核苷酸可以是分离自环境样品,在这种情况下,核酸被回收而不需培养某一种生物体,或者是从一种或者多种培养的生物中回收。在一方面,这样的微生物可以是适于极端环境的,如,嗜高温的、嗜冷的、冷育的、嗜盐的、嗜压的和嗜酸的。编码从极端微生物中分离出来的磷脂酶的多核苷酸可以用于制备杂合酶。这样的酶可以在地表温泉和深海的热火山口超过100℃的温度有作用,在北极水域低于0℃的温度有作用,在死海的饱和的盐环境下有作用,在pH值在0附近例如煤层沉积物和地热富硫矿泉中起作用,或者在pH值超过11例如污水污泥中有作用。例如,来自极端条件下的生物体的几种被克隆和被表达的磷脂酶在很宽的温度和pH范围内表现出高活性。 
在此描述的选择和分离的多核苷酸,包括至少一种本发明的核酸,被引入到适当的宿主细胞中。适当的宿主细胞是可以促进重组和/或还原性重配的任何细胞。选择的多核苷酸可以在包括合适控制序列的载体中。宿主细胞可以是较高等的真核生物细胞,如哺乳动物细胞,或者较低等的真核生物细胞,如,酵母细胞,或者优选地,宿主细胞可以是原核细胞,如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染,或电穿孔(Davis等人,1986)来实现。 
示范性的适当的宿主包括:细菌细胞,如大肠杆菌、链霉菌、鼠伤寒沙门氏菌;真菌细胞,如酵母;昆虫细胞如果蝇S2和草地夜蛾Sf9;动物细胞如CHO、COS或者黑色素瘤细、胞腺病毒;和植物细胞(也可参见上面的论述)。选择适合的宿主用于重组和/或还原性重配或者仅仅用于表达重组蛋白被认为是在本领域技术人员已知的范围内。可以用于重组和/或还原性重配或者仅仅用于表达重组蛋白的哺乳动物细胞培养系统包括:猴肾纤维原细胞的COS-7细胞系,其在“SV40-transformed simian cells support the replication of early SV40 mutants”(Gluzman,1981)中有说明,C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体可以包括复制起点、合适的启动子和增强子,以及必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列,以及5’旁侧的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于提供所需的非转录的遗传学元件。 
含有感兴趣多核苷酸的宿主细胞(用于重组和/或还原性重配或者仅仅用于表达重组蛋白)可以在传统的营养培养基中培养,对该培养基进行改变以适于激活启动子,选择转化子或者扩增基因。培养的条件,如温度,pH和类似因素是那些之前选择用于表达条件的宿主细胞所使用的,并且对于普通技术人员是显而易见的。经鉴定具有特异酶活性的克隆可以随后进行测序,以鉴定编码具有增强活性的酶的多核苷酸序列。 
另一方面,本发明的核酸和方法可以用于产生用于生物化学途径的新型多核苷酸,所述生物化学途径如,来自一个或者多个操纵子或者基因簇或者其部分的途径。例如,细菌和很多的真核生物具有调控基因的协调机制,其中所述基因的产物参与相关的过程。基因成簇排列在单个染色体上,在结构上称“基因簇”,它们在单个调控序列的控制下一起转录,所述调控序列包括起始整个簇的转录的单个启动子。因此,基因簇是指一组或者相同或者相关的相邻基因,一般是指功能上相关的邻近的基因。 
基因簇DNA可以从不同的生物体中分离出来并且连接到载体中,特别是含有表达调控序列的载体,所述表达控制序列可以控制和调控可检测蛋白或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于引入外源DNA使用具有非常大的容量的载体,特别适合用于这样的基因簇,在这里通过括大肠杆菌的f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒,在接合过程中它能实现自身的高频率转移,f-因子对于获得和稳定扩增大DNA片段,如来自混合的微生物样品的基因簇是理想的。可以使用“Fosmids”、粘粒或者细菌人工染色体(BAC)载体作为克隆载体。它们源于大肠杆菌f因子,可以稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时,这就有可能得到以稳定的“环境DNA文库”形式存在的大的基因组片段。粘粒载体最初是设计用来克隆和扩增基因组DNA的大片段。应用粘粒载体的克隆在Sambrook 等,Molecular Cloning:A Laboratory Mannual,第二版,Cold Spring HarborLaboratory Press(1989)中有详细说明。一旦连接到适当的载体,含有不同的聚酮化合物合成酶基因簇的两个或者多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选,以寻找在起初的基因簇没有发现的增强的活性。 
因此,一方面,本发明涉及使用本发明的核酸序列产生具有生物活性的杂合多肽以及筛选具有活性(例如,增强的活性)的多肽的方法,该方法通过: 
1)以可操作性连接的方式导入至少第一多核苷酸(例如本发明的核酸),和导入至少第二多核苷酸到合适的宿主细胞,所述的至少第一多核苷酸和第二多核苷酸共有具有部分序列同源性的至少一个区域; 
2)在促进序列重新组织的条件下培养宿主细胞,得到可操作性连接的杂合多核苷酸; 
3)表达由所述杂合多核苷酸编码的杂合多肽; 
4)在有利于鉴定期望的生物活性(例如增强的磷脂酶活性)的条件下筛选所述的杂合多肽;和 
5)分离编码该杂合多肽的多核苷酸。 
用于筛选各种酶活性的方法对于本领域技术人员是已知的,关于它的讨论贯穿于本说明书。当要分离本发明的多核苷酸和多肽时,可以应用这些方法。 
体内重配可以集中在“分子间”的过程上,统称为“重组”。在细菌中,它一般被视为是“RecA-依赖”的现象。本发明可以依赖于宿主细胞的重组过程来重组和重配序列,或者依赖于细胞介导还原过程的能力,通过缺失来减少细胞中的准-重复序列的复杂性。该“还原性重配”过程通过分子内的、RecA-依赖过程而发生。因此,在本发明的一方面,应用本发明的核酸,通过还原性重配过程,产生新型的多核苷酸。该方法包括产生含有连续序列(起始的编码序列)的构建物,它们插入到合适的载体中,并且然后将它们引入到合适的宿主细胞。单个分子同一性的重配通过在构建物中具有同源性区域的连续序列间的组合过程,或者准-重复单位间的组合过程而发生。重配过程重组和/或降低重复序列的复杂性和程度,并且导致产生新型的分子种类。 
可以引用各种处理来提高重配效率。这些处理可以包括用紫外光,或者损坏DNA的化学试剂处理,和/或使用表现增高水平的“遗传不稳定性”的宿主细胞系。因此,这样的重配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然特性。 
重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排列出现;以相似序列的连续单元出现。一旦连接,在连续序列之间的连接处变 得本质上无形,并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板内容,在模板上可以发生滑移事件。因此,含有准重复的构建物有效地提供了足够的分子弹性,缺失(和潜在的插入)事件实际上可以在准重复单元内的任何地方发生。当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然,细胞就不能区别各个单元。因此,还原过程可以在整个序列中发生。相反地,当例如,所述单元以头对头存在,而不是头对尾,相邻单元的头尾倒置,这样缺失的形成将有利于不连续单元的失去。因此,在本发明的一个方面,待重配序列是处于相同的方向。准重复序列的随机定向将会导致重配效率的损失,而序列的一致定向将会提供最高的效率。然而,虽然具有较少的相同定向的连续序列会降低效率,但是仍然可以为新型分子的有效回收提供足够的弹性。用定向相同以允许更高效率的准重复序列制备构建物。 
应用各种方法中的任何一种,可以将序列装配成头对尾的定向,包括以下方法:a)可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括poly-A头和poly-T尾的引物将提供定向。这通过具有由RNA制备引物的头几个碱基来完成,而且随后用RNaseH可以很容易去除RNA。b)可以应用包括独特的限制酶切割位点的引物。这需要多个位点、一组独特的序列、和重复的合成和连接步骤。c)引物的内部几个碱基可以被硫醇化,并且用外切酶来产生合适的具有尾巴的分子。 
重配序列的回收依赖于具有下降的重复指数(RI)的克隆载体的确定。被重配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有降低的RI的克隆载体的回收可以这样被完成,即:1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。2)通过物理程序对缩短的载体进行物理回收。在这一情况下,克隆载体将应用标准的质粒分离程序进行回收,或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。3)插入物的大小下降时,对含有可以选择的断裂基因的载体进行回收。4)应用表达载体以及适当的选择,使用定向选择技术。 
相关的生物体的编码序列(例如,基因)可以表现出高度的同源性,并且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明中。然而,这一过程并不限于这种几乎相同的重复。 
以下是本发明的示例性方法。编码性核酸序列(准-重复)来自三个(3)种,包括本发明的核酸。每一序列编码具有一套不同特征的蛋白质,包括本发明的酶。每一个序列在序列的唯一位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共同被扩增并且被连接到随机的组合中,以便所有可能的排列交换和组合可以在连接的分子群体中获得。准-重复单位的数目可以通过装配条件来控制。在构建物中,准-重复单位的平均数目通过重复指数(RI)来定义。一旦形成,构建物可以,或不必按照出版的方法通过琼脂糖凝胶来按大小分离,插入到克隆 载体,并且转染到合适的宿主细胞中。然后细胞进行繁殖,并且进行“还原性重配”。如果需要,还原性重配过程的速率可以通过引入DNA损伤来刺激。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导,还是通过“分子间”的机制由重组类似的事件来介导是不重要的。最终的结果是分子被重配,得到所有可能的组合。在一个方面,本方法包括一个额外的步骤,即对重排的文库成员进行筛选,以确定具有与一种预定的大分子如蛋白质受体、寡聚糖、病毒颗粒或者其它的预定的化合物或者结构结合或者不同方式地相互作用,或者催化一个特定的反应(如,酶的催化结构域)的能力的个别的重排文库成员。从这样的文库所鉴定得到的多肽,如,磷脂酶可以用于各种目的,例如在此说明的工业过程和/或可以进行改组和/或选择的一个或者多个另外的循环。 
在另一方面,可以预见,在重组或重配之前,或者在重组或重配的过程中,通过本发明的方法产生的多核苷酸可以用试剂处理或进行加工,这些处理或加工促进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其编码的多肽的多样性。促进诱变的试剂和过程可以包括,但不限于:(+)-CC-1065,或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley,(1992);能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见,例如,van de Poll等(1992)),或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也见,van de Poll等(1992),751-758页);三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物,如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷酸盐(“Tris-BP”)、1,2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4,5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的尤其优选的方法由紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)组成。特别包含的方法是DNA加合物或者来自多核苷酸或者多核苷酸库的含有DNA加合物的多核苷酸,在进一步的处理前,其可以通过包括加热含有所述多核苷酸的溶液的过程进行释放或者去除。 
筛选方法学和“在线”监视设备 
在实践本发明的方法中,可以应用各种设备和方法学,结合使用本发明的多肽和核酸,例如,来筛选具有磷脂酶活性的多肽,来筛选作为潜在的活性调节物的化合物(如,酶活性的增强或者抑制),以获得结合于本发明多肽的抗体,获得与本发明核酸杂交的核酸和类似物。 
固定化的酶固体支持物 
磷脂酶,其片段以及编码该酶和片段的核酸可以附于固体支持物上。这对于工业过程中磷脂酶的使用常常是经济的且有效的。例如,磷脂酶(或其活性片 段)的联合物或者混合物——其用于特定的化学反应——可以附于固体支持物,并且浸于处理容器中。酶反应因此可以进行。随后,可以将固体支持物从容器中取出,同时取出的是固定在支持物上的酶,用于重复使用。在本发明的一个实施方案中,将分离的本发明核酸附着于固体支持物。在本发明的另一个实施方案中,固体支持物是选自凝胶、树脂、聚合物、陶瓷、玻璃、微电极以及它们的任意组合。 
例如,用于本发明的固体支持物包括凝胶。凝胶的一些例子包括琼脂糖(Sepharose)、明胶、戊二醛、壳聚糖处理的戊二醛、白蛋白-戊二醛、壳聚糖-黄原胶、toyopearl胶(聚合胶)、藻酸盐、藻酸盐-聚赖氨酸、角叉菜胶、琼脂糖、glyoxyl琼脂糖、磁性琼脂糖、葡聚糖-琼脂糖、聚(氨基甲酰磺酸盐)水凝胶、BSA-PEG水凝胶、磷酸化的聚乙烯醇(PVA)、单氨基乙基-N-氨基乙基(MANA)氨基,或者它们的任意组合。 
用于本发明的另一固体支持物是树脂或者聚合物。树脂或者聚合物的一些例子包括纤维素、丙烯酰胺、尼龙、人造纤维、聚酯、阴离子交换树脂、AMBERLITETMXAD-7、AMBERLITETMXAD-8、AMBERLITETMIRA-94、AMBERLITETMIRC-50、聚乙烯、聚丙烯酸、聚甲基丙烯酸酯或者它们的任何组合。 
用于本发明的另一类型固体支持物是陶瓷。一些例子包括非多孔陶瓷、多孔陶瓷、SiO2、Al2O3。用于本发明的另一类固体支持物是玻璃。一些例子包括非多孔玻璃、多孔玻璃、氨基丙基玻璃或者它们的任何组合。可以应用的另一类型固体支持物是微电极。一个例子是聚乙烯亚胺涂层磁铁。石墨颗粒可以用于固体支持物。 
用于实施本发明的其他示例性固体支持物包括硅藻土产品和硅酸盐。一些例子包括CELITE
Figure G05814667620061109D001061
、KENITE
Figure G05814667620061109D001062
、DIACTIV
Figure G05814667620061109D001063
、PRIMISIL、DIAFIL
Figure G05814667620061109D001065
硅藻土和MICRO-CEL
Figure G05814667620061109D001066
、CALFLO
Figure G05814667620061109D001067
、SILASORBTM和CELKATE
Figure G05814667620061109D001068
合成硅酸钙和硅酸镁。固体支持物的其他例子是细胞,诸如血红细胞。 
固定化方法 
有许多本领域技术人员已知的用于将酶或者其片段,或者核酸固定化在固体支持物上的方法。这样的方法的一些例子包括:如,产生静电液滴的方法、电化学方法、通过吸收、共价结合、交联、化学反应或者化学工艺、封装、捕集、通过藻酸钙,或者通过聚(2-羟乙基甲基丙烯酸)进行固定化的方法。类似的方法在下述文献中:Enzymology,Immobilized Enzymes and Cells,Part C.1987.AcademicPress.S.P.Colowick和N.O.Kaplan编辑,Volume 136;和Immobilization ofEnzymes and Cells.1997.Humana Press.Edited,G.F.Bickerstaff编辑.Series:Methods in Biotechnology,由J.M.Walker编辑。 
毛细管阵列 
毛细管阵列,如GIGAMATRIXTM,Diversa Corporation,San Diego,CA,可以用于本发明的方法。本发明的核酸或者多肽可以固定于或者施用于阵列,包括毛细管阵列。阵列可以用于筛选或者监控能够结合或者调节本发明核酸或者多肽活性的组分(如,小分子,抗体,核酸等)文库。毛细管阵列提供了另一个系统用于固定和筛查样品。例如,样品筛选设备可以包括形成由相临的毛细管组成的阵列的许多毛细管,其中每一个毛细管包括至少一个确定的保持样品的腔的壁。该设备也可以进一步包括置于阵列中邻近毛细管之间的空隙物质,以及在空隙物质内形成的一个或者多个参照的标记。用于筛选样品的毛细管,其中毛细管经修改以适合结合在毛细管阵列中,可以包括限定保留样品的腔的第一壁,以及由过滤材料形成的第二壁,用于过滤被提供给腔以激发样品的激发能。 
多肽或者核酸,如,配基,可以引入第一成分到毛细管阵列中的至少一部分毛细管。毛细管阵列中的每一个毛细管可以包括至少一个确定保留第一组分的腔的壁。在第一组分后,引入气泡至毛细管中。可以将第二组分引入到毛细管中,其中第二组分是通过气泡与第一组分分开。令人感兴趣的样品可以作为用可检测的颗粒标记的第一液体引入到毛细管阵列的毛细管中,其中毛细管阵列中的每一个毛细管包括至少一个限定保留第一液体和可检测颗粒的腔的壁,并且其中至少一个壁用将可检测颗粒结合到至少一个壁的结合材料包被。该方法可以进一步包括从毛细管中去除第一液体,其中结合的可检测颗粒仍保留在毛细管中,然后将第二液体引入到毛细管中。 
毛细管阵列可以包括很多的单个的毛细管,包括由至少一个限定腔的外壁。毛细管的外壁可以是一个或者多个融合在一起的壁。相似地,壁限定的腔是圆柱形、正方形、六角形或者任何其它的几何性状,只要壁形成保留液体或者样品的腔即可。毛细管阵列中的毛细管可以非常接近地固定在一起,以形成平面结构。毛细管可以通过融合(如,当毛细管由玻璃制成时)、胶粘、粘合或者通过夹具并列结合在一起。毛细管阵列可以由任何数量的单个毛细管构成,例如,范围从100到4,000,000个毛细管。毛细管阵列可以形成具有大约100,000或者更多单个毛细管结合在一起的微滴定板。 
阵列,或“生物芯片” 
本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测化合物(例如,小分子、抗体、核酸等等)的结合或者调控本发明的核酸或者多肽的活性的能力。例如,在本发明的一方面,一个被监测的参数是磷脂酶基因的转录表达。细胞的一种或者多种或者所有的转录物可以通过阵列或者“生物芯片”上的固定化核酸与包含细胞转录物的样品,或者与代表细胞转录物或和细胞转录物互补的核酸的杂交来测定。通过应用微型芯片上的核酸“阵列”,细胞的一 些或者所有转录物可以同时被量化。可选择地,包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新型的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。 
本发明可以用任何已知的“阵列”进行实践,所述“阵列”也被指作“微阵列”或者“核酸阵列”或者“多肽阵列”或者“抗体阵列”或者“生物芯片”,或者它们的变体。阵列一般是多个“点”或者“靶元素”,每一个靶元素包括确定数量的一种或者多种生物分子,例如,固定于基底表面的确定区域、用于特异结合一种样品分子如mRNA转录物的寡核苷酸。 
在实践本发明的方法时,任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地整入,或者也引入它们的变化,例如在下列文献中说明的:美国专利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,996;6,022,963;6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752;5,434,049;还例如,WO 99/51773;WO 99/09217;WO97/46313;WO 96/17958;还例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques 23:1087-1092;Kern(1997)Biotechniques23:120-124;Solinas-Toldo(1997)Genes,Chromosomes & Cancer 20:399-407;Bowtell(1999)Nature Genetics Supp.21:25-32。也参见出版的美国专利申请20010018642;20010019827;20010016322;20010014449;20010014448;20010012537;20010008765。 
抗体和基于抗体的筛选方法 
本发明提供了可与本发明的磷脂酶特异结合的分离出的或重组的抗体。这些抗体可用来分离、鉴定或定量本发明的磷脂酶或相关的多肽。这些抗体可以用于抑制本发明酶的活性。这些抗体可以用于分离与本发明那些物质相关的多肽,如,相关的磷脂酶。抗体可以用于免疫沉淀,染色(如FACS)、免疫亲和柱等等。如果需要的话,编码特异抗原的核酸序列可以通过免疫方法获得,随后分离出多肽或者核酸,进行扩增或者克隆,将多肽固定在本发明的阵列上。可供选择地,本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构,如,抗体的亲和性可以增加或者降低。而且,制备或者修饰抗体的能力可以是通过本发明的方法改造入细胞的表型。 
免疫、产生或者分离抗体(多克隆的或者单克隆的)的方法是本领域技术人员所了解的,并且在科学和专利文献中有描述,参见,如,Coligan,CURRENTPROTOCOLS IN IMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASICAND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications,Los Altos,CA(“Stites”);Goding,MONOCLONAL ANTIBODIES:PRINCIPLES AND PRACTICE(第2版)Academic Press,New York,NY(1986);Kohler(1975)Nature256:495;Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold SpringHarbor Publications,New York。除了使用动物的传统的体内方法外,抗体也可以在体外产生,例如,应用表达重组抗体结合位点的噬菌体展示文库。参见如,Hoogenboom(1997)Trends Biotechnol.15:62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26:27-45。 
多肽可以用于产生可以特异性结合本发明多肽的抗体。得到的抗体可以用于免疫亲和层析方法中,来分离或者纯化多肽或者确定是否多肽存在于生物样品中。在这样的程序中,将蛋白制备物,如提取物,或者生物样品与能够特异性结合本发明的其中一个多肽的抗体相接触。 
在免疫亲和程序中,将抗体附着于固体支持物,如珠或者其它的柱基质。在抗体特异性结合本发明多肽中的一个多肽的条件下,将蛋白制备物置于与抗体接触。洗涤去除非特异性结合的蛋白后,洗脱特异性结合的多肽。 
在生物样品中的蛋白结合抗体的能力可以通过应用本领域技术人员熟悉的任何不同的方法来测定。例如,结合可以通过用可检测的标记如荧光试剂、酶标或者放射性同位素标记抗体来测定结合。可选择地,抗体与样品的结合可以应用其上具有这样的可检测标记的第二抗体来检测。特定的分析包ELISA分析、夹心法分析、放射免疫分析以及Western印迹。 
产生的针对本发明多肽的多克隆抗体可以通过直接注射该多肽至动物中而得到,或者将该多肽施用动物例如,非人类动物而得到。这样得到的抗体随后结合于该多肽本身。以这样的方式,可以应用仅仅编码多肽片段的序列来产生可以结合整个天然多肽的抗体。这样的抗体随后可以用于从表达多肽的细胞中分离该多肽。 
为了制备单克隆抗体,可使用可通过连续细胞系培养来产生抗体的任何技术。实例包括杂交瘤技术、trioma技术、人B-细胞杂交瘤技术和EBV-杂交瘤技术(参见例如Cole(1985)Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,pp.77-96)。 
可以对产生单链抗体的技术(参见,如,美国专利编号4,946,778)进行调整,用于产生针对本发明多肽的单链抗体。可选择地,可以用转基因鼠来表达针对这些多肽或者其片段的人源化的抗体。 
产生的针对本发明多肽的抗体可以用于从其它的生物体和样品中筛选类似的多肽。在这样的技术中,将来自该生物体的多肽与该抗体接触,检测特异性结合抗体的那些多肽。以上所述的任何程序可以用于检测抗体结合。 
试剂盒 
本发明提供了包括以下成分的试剂盒,如,核酸,表达盒,载体,细胞,多肽(如含有至少一种本发明的磷脂酶的试剂盒)和/或本发明的抗体(如含有至少一种本发明的抗体的试剂盒)。该试剂盒也可以含有指导性材料,来指导本发明的方法学和工业应用,正如在此所述。 
本发明酶的工业和医学应用 
本发明提供了使用本发明的多肽,例如磷脂酶和本发明的其他酶,例如磷脂酶A、B、C和D、patatins的许多工业应用和医学应用,包括转换不可水合的磷脂至水合形式、油脱胶,处理来自植物、鱼、藻类和类似物的油,在此仅仅指出了几种应用。在任何这些可选择的工业应用和医学应用中,酶可以以特定的顺序加入,例如具有不同的特异性的磷脂酶以特定顺序加入,例如首先加入具有PC-和PE-水解活性的酶(或加入两种酶,一种具有PC-水解活性,另一种具有PE-水解活性),然后加入具有PI-水解活性(例如PLC活性)的酶,或其任何组合。 
任何或所有本发明的方法可用于“加工级”,例如在约15,000;25,000;50,000;75,000或100,000lbs精炼油/天至约1、2、3、4、5或6百万或更多lbs精炼油/天级别上进行的油加工或精炼。 
在工业应用中使用磷脂酶的方法是本领域所熟知的。例如,本发明的磷脂酶和方法可以用于处理脂肪和油,如,在日本专利申请公布H6-306386中所述,该申请描述了将存在于油和脂肪的磷脂转化为含有磷酸基团的水溶性物质。 
本发明的磷脂酶可以用于处理植物油和磷脂,如那些来源于或者分离自米糠、大豆、油菜、棕榈、棉籽、玉米、棕榈仁、椰子、花生、芝麻、向日葵的植物油和磷脂。本发明的磷脂酶可以用于处理提炼油,如,那些来自果籽的油,如葡萄籽、杏仁、琉璃苣等。本发明的磷脂酶可以用于处理以不同形式存在的油和磷脂,包括粗制品形式、脱胶的、胶、洗涤水、黏土、硅石、皂脚和类似物。本发明的磷脂酶可以用于处理高磷含量的油、鱼油、动物油、植物油、藻类油和类似物。在本发明的任何方面,任何时候可以应用磷脂酶C,一种选择包括应用本发明的磷脂酶D和磷酸酶(如,应用PLD/磷酸酶的组合来提高高磷含量油如大豆豆油的产量)。 
本发明的磷脂酶可以用于处理和制备食用油、生物柴油,用于药物学和化妆品的脂质体、结构磷脂和结构脂类。本发明的磷脂酶可以用于油提取。本发明的磷脂酶可以用于处理和制备各种肥皂。 
加工食用油:产生1,3-二酰基甘油(1,3DAG) 
本发明提供了使用本发明的酶(或多种酶)来制备1,3-二酰基甘油(1,3DAG)的工艺。在一个方面,磷脂酶C或磷脂酶D加磷酸酶产生1,2-二酰基甘油;这提高了在食用油精炼期间的油产量。当用于包括碱中和步骤的工艺时,例如作为碱 精炼助剂,多达70%的1,2-二酰基甘油(1,2DAG)进行了酰基转移,被转化为1,3-DAG。1,3-DAG具有增加的健康益处,因此使用PLC作为碱炼助剂产生具有增加的营养价值的油。 
本发明提供了使用本发明的酶(或多种酶)制备和加工食用油的工艺,包括产生具有增加数量的1,3-DAG的食用油。二酰基甘油是许多食用油中天然存在的化合物。在本发明方法,例如油脱胶工艺的一个方面,碱(苛性碱)引起PLC产生的1,2-DAG异构化成1,3-DAG,其提供超过1,2-DAG的营养健康价值,例如1,3-DAG作为能量被燃烧掉,而不是作为脂肪被储存起来(1,2-DAG则是这样)。通过在碱炼工艺开始时加入PLC(酸和碱随后),本发明的方法产生提高水平的1,3-DAG(减少1,2-DAG)。从营养角度看,1,3-DAG优于1,2-DAG。在可选择的方面,本发明包括使用本发明的PLC的油脱胶工艺,从而产生含有不少于0.5%、1.0%、2.0%或3.0%或更多1,3-DAG的最终脱胶的油产物。 
因此,本发明提供(通过酯交换作用)制备精炼油(例如二酰基甘油)——包括食用油——的工艺,其含有增加水平的1,3-二酰基甘油(1,3-DAG),如在实施例13中所示,其中磷脂酶,诸如本发明的酶,是“前期加载型的(front-loaded)”,或在加入酸或者碱之前加入。由甘油三酯的酶促水解产生DAG,通过异构化由1,2DAG产生1,3DAG。相比传统的食用油,含有1,3DAG的食用油显示出不同的代谢效应。1,3DAG和1,2DAG或甘油三酯之间代谢途经的差异使得较大部分的来自1,3二酰基甘油的脂肪酸作为能源被燃烧掉,而不是作为脂肪储存起来。临床研究已经显示,经常食用DAG油作为明智膳食(sensible diet)的一部分,能帮助个体控制他们的体重和体内脂肪。此外,1,3DAG的代谢减少血流中循环的餐后甘油三酯。因为肥胖和增高的血脂是与慢性疾病包括心血管疾病和II型糖尿病相关的危险因素,这些与生活方式相关的健康状况可以受到有规律的消耗DAG油这样的有益方式的影响。 
可以通过各种方法食用含DAG的油。因此,在一个方面,本发明提供使用本发明的酶制备食物的工艺,食物例如具有增加水平的1,3-DAG二酰基甘油的焙烤食物,和含有二酰基甘油油的焙烤食物。在一个方面,焙烤食物是饼干、蛋糕和类似的焙烤食物。 
在可选择的实施方案中,可以用于本发明方法,包括食用油加工方法的酶的组合包括(其中在该组合中的一种、若干种或所有酶包含本发明的酶): 
。PLC+PI-PLC+PLA(PLC反应完成后加入PLA); 
。PLD+磷酸酶+PI-PLC,然后加入PLA;或 
。PLC或(PLC+PI-PLC)+PLA,对磷脂酸具有特异性(所有的酶同时或依次加入)。 
油脱胶和植物油的处理 
本发明的酶(例如具有脂酶、磷脂酶、酯酶和/或糖苷酶或等同活性的多肽)可以用于各种植物油加工步骤中,诸如用于植物油提取,特别地,用于在称为“油脱胶”的工艺中除去“磷脂胶”。 
本发明的这些工艺可用于“加工级”,例如在约15,000;25,000;50,000;75,000或100,000lbs精炼的油/天至约1、2、3、4、5或6百万或更多lbs精炼的油/天的级别上。 
在一个方面,本发明提供了油脱胶的方法,该方法包括使用本发明的磷脂酶,例如本发明的PLC。在一个方面,该方法还包括添加另一磷脂酶(其也可以是本发明的磷脂酶),例如本发明的其他PLC、PLA、PLB、PLB或patatin或具有溶血磷脂酶-转酰基酶(LPTA)活性或溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)或它们的组合的酶,和/或patatin样磷脂酶(其也可以是本发明的酶)。在一个方面,所有酶一起加入,或可选择地,酶以特定的顺序加入,例如加入PLC后加入PLA和/或patatin;或者首先加入具有PC和PE活性的酶或许多酶,然后加入PI PLC。 
在一个方面,因磷脂酶(例如,本发明的PLC)处理的结果,该过程使得产量提高。在一个方面,因磷脂酶(例如,本发明的PLA)处理的结果,该过程使得油中的磷含量额外地减少。 
在一个方面,本发明提供了这样的工艺,包括使用本发明的磷脂酶,例如本发明的PLC来减少胶的量并通过减少油被捕获的数量来增加中性油(甘油三酯)产量。在一个方面,本发明提供这样的工艺,包括使用本发明的磷脂酶,例如本发明的PLC来增加中性油和二酰甘油(DAG)的产量,以增加油相。在可选择的方面,本发明的方法(例如脱胶方法)可以包含一种或多种其他的酶,诸如蛋白酶、淀粉酶、角质酶、另一磷脂酶(包括例如本发明的酶)、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳糖酶、木聚糖酶、氧化酶,例如乳糖酶和/或过氧化物酶或具有等同活性的多肽,或其组合。 
本发明的磷脂酶可以用于各种植物油处理步骤,如在植物油的提取中,特别地,用于在上述称为“油脱胶”的过程中去除“磷脂胶”。本发明提供了用于处理不同来源的植物油的方法,所述来源如米糠、大豆、油菜、花生和其它的果实、芝麻、向日葵、棕榈和玉米。该方法可以与基于用如己烷提取的工艺联合,随后将粗提取物精炼成食用油,其中包括使用本发明酶和方法。精炼顺序的第一步骤是所谓的“脱胶”过程,其用于通过加入水来分离磷脂。分离通过脱胶沉淀的物质,并且进一步处理成卵磷脂混合物。商业上应用的卵磷脂,如大豆卵磷脂和向日葵卵磷脂,是半固体的或者是非常粘稠的物质。它们是由极性脂类和油的混合物组成,其中,极性脂类主要是磷脂,油主要是甘油三酯。 
本发明的磷脂酶可以用于任何“脱胶”过程,包括水脱胶、ALCON油脱胶(如,用于大豆)、safinco脱胶、“超脱胶”、UF脱胶、TOP脱胶、单脱胶 (uni-degumming)、干法脱胶和ENZYMAXTM脱胶。参见,美国专利6,355,693;6,162,623;6,103,505;6,001,640;5,558,781;5,264,367。本发明方法整合的各种脱胶过程描述于Bockisch,M.(1998)In Fats and Oils Handbook,The extraction ofVegetable Oils(Chapter 5),345~445,AOCS Press,Champaign,Illinois。本发明的磷脂酶可以用于甘油三酸酯油的酶促脱胶的工业应用,如在EP 513 709中所述。 
在一个方面,本发明的磷脂酶用于处理植物油,例如粗油,诸如米糠、大豆、油菜、花和类似物。在一个方面,这提高脱胶工艺的效率。在一个方面,本发明提供了在低水条件下进行酶脱胶的方法,例如在约0.1%至20%水,或0.5%至10%水的范围内。在一个方面,这提高了在离心期间,重相从油相的分离水平。对这些相提高的分离水平能够导致磷脂更有效地从油中去除,包括可水合的和不可水合的油。在一个方面,这能够产生含有较少捕获的中性油(甘油三酯)的胶组分,从而提高脱胶工艺期间的总油产量。 
在一个方面,本发明的磷脂酶,例如具有PLC活性的多肽用于处理油(例如植物油,例如粗油,诸如米糠、大豆、油菜、花和类似物),例如用于脱胶工艺,以减少胶量和通过减少油捕获而增加中性油含量。在一个方面,本发明的磷脂酶,例如具有PLC活性的多肽,用于生产二酰甘油(DAG)和用于增加油相。 
本发明的磷脂酶可以用于酶促脱胶的工业应用,如,在CA1102795中所述,其描述了通过加入至少50%重量百分比的水从谷物脂类中分离极性脂类的方法。以其应用的原理是加入水到粗油混合物的角度来看,该方法是经过改良的脱胶过程。 
一方面,本发明提供了酶促过程,包括应用本发明磷脂酶(如,PLC),包括水解在油中的水合磷脂,温度为约20℃到40℃,碱性pH,如pH为大约pH8到pH10,反应时间为大约3到10分钟。这可以导致油中的最终磷水平少于10ppm。本发明也提供了酶促过程,包括应用本发明磷脂酶(如,PLC),包括水解油中可水合的和不可水合的磷脂,温度大约50℃到60℃,pH值略低于中性,例如大约pH5到pH6.5,反应时间为大约30到60分钟的条件下。这可以导致油中的最终磷水平少于10ppm。 
在一方面,本发明提供了酶促过程,该过程利用磷脂酶C酶水解甘油磷酸酯键,从而使得能将磷脂中的二酰甘油部分返回到油中,如植物油、鱼油或者藻类的油(“磷脂酶C(PLC)苛性碱精炼助剂”);和,在脱胶步骤中将磷脂含量减少至对于待物理精炼的高磷油足够低的水平(磷脂酶C(PLC)脱胶助剂”)。这两种方法能够产生不同价值并且具有不同的目标应用。 
在本发明各种示例性过程中,很多不同的步骤组成了核心的漂白和脱臭精炼过程之前的脱胶过程。这些步骤包括,加热、混合、维持、分离和干燥。在加热步骤以后,加入水,常常是酸,并且混合,以便使得不溶性的磷脂“胶”凝聚成可以被分离的颗粒。虽然在脱胶过程中水分离很多磷脂,但是部分磷脂是以钙盐或 者镁盐的形式存在的不可水合的磷脂(NHPs)。脱胶过程通过加入酸处理这些NHPs。在磷脂水合以后,油被混合,维持并且通过离心分离。最后,将油干燥并且贮存、运输或者精炼,如图6所示。得到的胶既可以进一步处理以获得卵磷脂产物,也可以加回到食物中。 
在本发明各种示例性工艺中,磷的水平被降到低至对于物理精炼足够低。与苛性碱精炼相比,该分离过程可能导致潜在更高的产量损失。此外,脱胶过程可能产生不能以商业卵磷脂出售的废物,参见,例如图7,图7是物理精炼油的示例性的脱胶过程。因此,这些过程并没有取得显著的市场份额,碱精炼过程继续统治着米糠、大豆、油菜和向日葵工业。然而,注意,用于特殊脱胶过程的磷脂酶C酶将降低胶的形成,并且将磷脂中的甘油二酯部分返回到油中。 
在一个方面,本发明提供了在胶组分中使用本发明的PLC的方法。在该方法的一个方面,将油加入到粗油中,以产生乳状液,这导致磷脂酰胆碱、磷脂酰乙醇胺和磷脂酰肌醇移入水相(水脱胶)。离心之后,这些磷脂是含水胶组分的主要组分。胶组分中的磷脂可以用磷脂酶C或磷脂酶D加磷酸酶(或其他组合,参见下面描述)处理,以产生二酰甘油(DAG)和磷酸酯。在此时,DAG可以从其他胶组分中提取出来,并在适合于对DAG进行转酯作用的条件下用脂酶处理,产生期望的三酰甘油(结构性类脂)。 
在另一方面,利用在PLC反应后例如通过加入碱增加胶的pH,大部分的1,2-DAG可以被转化为1,3-DAG。1,3-DAG然后可以从胶中提取出来,并在合适的条件下与脂酶反应,以在sn2位置对1,3-DAG进行转酯作用,从而产生期望的结构性三酰甘油。 
在可选择的方面,用于转酯反应的脂肪酸,可以来自各种来源,包括粗油中发现的游离脂肪酸。 
在一个方面,来自水脱胶的磷脂与本发明的PLC组合使用,产生结构性类脂。水脱胶的油可以暴露于PLC和/或PLD(其中之一或两者可以是本发明的酶)加磷酸酶或这些组合中的其中一种,然后暴露于PLA(可以是本发明的酶),以将磷减少至适合于碱或物理精炼的水平。 
在可选择的实施方案中,可以用于本发明方法包括这些脱胶工艺的酶的组合包括(其中该组合中的一种、若干种或所有酶包含本发明的酶): 
。PLC+PI-PLC+PLA(PLC反应完成后加入PLA); 
。PLD+磷酸酶+PI-PLC,然后加入PLA;或 
。PLC或(PLC+PI-PLC)+PLA,对磷脂酸具有特异性(所有的酶同时或依次加入)。 
碱法精炼(caustic refining) 
本发明提供了在碱炼中使用磷脂酶(包括本发明的酶)的过程,其中酶被用作碱炼助剂。在可选择的方面,PLC或PLD和/或磷酸酶用于滴加的过程,既可以在碱法中和精炼过程(既可以连续精炼也可以间歇精炼)之前,期间,或者之后。加入的酶量可以根据工艺来变化。用于本工艺的水的水平可以是低水平的,例如约0.5到5%。可选择地,通过多次,将苛性碱加入至该工艺中。此外,该过程可以在不同的温度下(25℃到70℃),不同的酸或碱条件下,并且在变化的pH值(4到12)下进行。可以使用浓的碱溶液,例如比11%的工业标准浓度更大,以减少胶的量。在可选的方面,浓的碱溶液浓度在约12%至50%之间,例如约20%、30%、40%、50%或60%或更浓。 
在一方面,本发明的磷脂酶C在甘油磷酸酯键处水解磷脂,产生甘油二酯和水溶性的磷酸化合物。水解的磷脂进入到水相,而甘油二酯留在油相中,如在图8所说明的。PLC“碱炼助剂”的一个目的是将在中和过程中形成的磷脂胶转化为二酰甘油,二酰甘油将又转移回到油相。相反地,“PLC脱胶助剂”的一个目的是将粗油中的磷脂降低为少于百万分之十(10ppm)的磷当量。 
可以用于碱炼过程的酸,包括但是并不限于,磷酸、柠檬酸、抗坏血酸、磺酸、反丁烯二酸、顺丁烯二酸、盐酸和/或乙酸。酸被用于水合不可水合的磷脂。可以应用的碱包括但不限于,KOH和NaOH。碱被用于中和游离脂肪酸。可选择地,磷脂酶,或者更特别地,PLC或者PLD和磷酸酶,用于从胶/皂脚中纯化植物固醇。 
在碱炼前加入磷脂酶的本发明的可选择的实施方案是在植物中表达磷脂酶。在另一个实施方案中,在压碎植物、种籽或者其它的植物部分期间加入磷脂酶。可选择地,在压碎后,但是在精炼前(即是在容器中)加入磷脂酶。此外,在有酸或无酸的条件下,加入磷脂酶作为精炼预处理。 
已经描述过的本发明的另一个实施方案,是在碱炼过程期间加入磷脂酶。在这一过程,酸和碱的水平依赖于磷的水平和游离脂肪酸的水平而变化。此外,该过程使用宽的温度和pH范围,这依赖于所应用的酶的种类。 
在本发明的另一个实施方案中,磷脂酶在碱炼后加入(图9)。在一个例子中,在分离前,磷脂酶加入到强力混合器(intense mixer)或者滞留混合器(retention mixer)。可选择地,磷脂酶在加热步骤后加入。在另一个实施方案,磷脂酶在离心步骤中加入。在额外的实施方案中,磷脂酶加入到皂脚中。可选择地,磷脂酶加入到洗涤水中。在另一个例子中,磷脂酶在漂白和/或脱臭步骤中加入。 
在一个方面,在漂白和脱臭之前,磷脂酶,例如磷脂酶C,本发明的酶将水解中和过的粗的和脱胶的油中水合和非水合磷脂的磷脂。本发明的示例性的“碱炼”工艺在图9和图13中示出。图9包括静态混合器(static mixer)的示例性时间、温度和pH(30至60分钟、50至60℃,pH 5至6.5)和滞留时间(3至10分钟,20-40℃)。 
目标酶可以作为滴加物(drop-in product)应用于现有的碱法中和工艺中,如在图9中所示。在该方面,如果酶在加入碱之后加入,酶将不必经受极端的pH水平。如图13(酶“前载型”示例性工艺)所示,任何磷脂酶,包括本发明的磷脂酶,诸如PLC、PLB、PLA和/或PLC都可以用于粗油脱胶工艺,如Bailey′s Industrial Oil & FatProducts v.4(ed.Y.H.Hui)中所述。图14和图15示出了本发明方法的变化,其中两个或三个离心步骤分别用于所述工艺中,其可以用于加工任何油,例如植物油,诸如粗的大豆油,如图中所示。图15的示例性方法在碱炼之前具有离心步骤(除了碱炼之后和水洗之前,和水洗之后的离心步骤),而图14的示例性方法在碱炼之前并没有离心步骤。图16示出了该工艺的另一示例性变化,其使用酸处理并在脱胶步骤之前有离心步骤;该示例性工艺用于处理任何油,例如植物油诸如粗的豆油,如图所示。 
一方面,本发明的磷脂酶使得磷除至低到物理精炼可接受的水平。一方面,本发明的PLC将在漂白和脱臭前,水解来自粗油中水合和非水合磷脂的磷脂。在目前的脱胶操作中,靶酶可以作为点滴形式的产品应用,参见例如图10。假如在商业设备中为亚最佳状态的混合,很可能需要酸来引起非水合的磷脂与酶在油/水的界面上接触。因此,一方面,应用本发明的酸稳定性PLC。 
一方面,本发明的PLC脱胶助剂工艺可以减少表2中示出的一个或者所有三个项目的损失。在PLC过程中相关的损失,以质量为基础计算,据估计可以为大约0.8%,相对地,由于磷脂的去除,则为5.2%。 
表2:由PLC产品所致的损失 
    碱炼助剂   脱胶助剂
  1)胶形成和分离中的油损失2.1%   X   X
  2)在加入苛性碱中皂化的油3.1%     X
  3)在漂白中黏土中捕获的油*<1.0%   X   X
  总产量损失~5.2%   ~2.1%   ~5.2%
本发明该过程的另外潜在的益处包括如下: 
◆减少的吸附剂—对较低水平(<5ppm)的磷,需要较少的吸附剂 
◆较低的化学剂用量—与非水合磷脂的水合作用相关的化学剂和工艺成本较少 
◆较低的废物产生—需要较少的水来从油中去除磷 
通过本发明的方法(如“脱胶”)处理的油包括植物油种籽,如,大豆油、油菜籽油、米糠油和向日葵油。一方面,本发明的“PLC碱炼助剂”可以比目前的碱炼工艺节约1.2%。精炼助剂应用用于豆油,该豆油已经针对卵磷脂进行脱胶,并且这些也从值/加载计算中扣除。 
本发明工艺的执行目标可以根据应用而变化,并且更特异地,根据酶加入的点而变化,参见表3。 
表3应用的执行目标 
Figure G05814667620061109D001171
可以应用本发明磷脂酶,如,磷脂酶A1的其它工艺可以将非水合的天然磷脂转化为至水合的形式。一方面,该酶对热敏感。因为对油加热可以破坏酶,这可能是需要的。然而,脱胶反应必须调节为pH 4-5以及60℃来适应该酶。在300个单位/kg的油饱和剂量时,该示例性工艺的成功之处在于将以前的水脱胶油的磷含量降至≤10ppm P。优点可以是减少的H2O含量,而且在应用、处理和废物中所导致的节约。表4列出了本发明酶的示例性的工业应用: 
表4:示例性应用 
    碱炼助剂   脱胶助剂
  豆油/卵磷脂产生   X  
  化学精炼的豆油、向日葵油、油菜油   X   X
  低磷脂油(如,棕榈)     X
[0561] 除了这些不同的“脱胶“工艺,本发明的磷脂酶可以用于任何的植物油处理步骤。例如,在任何植物油的处理步骤中,本发明的磷脂酶可以用于替代PLA,如磷脂酶A2。用本发明的方法“处理”或者“脱胶”的油包括大豆油、油菜籽油、玉米油、来自棕榈仁的油、油菜油、向日葵油、芝麻油、花生油、米糠油和类似油。该工艺的主要产物包括甘油三酯。 
在一种示例性工艺中,当酶加入到粗制油,并且与粗制油反应时,每1kg的粗制油所应用的磷脂酶的量为约10-10,000单位,或者,可选择地,约100-2,000单位。酶处理进行5分钟到10个小时,温度为30℃到90℃,或者,可选择地,约40℃到70℃。条件可以依赖于酶的最适温度而变化。加入用于溶解酶的水的量为,每100重量份的粗制油使用5-1,000重量份的水,或者可选择地,大约每100重量份的粗制油使用大约10到200重量份的水。 
一旦这样的酶处理过程完成后,用合适的方式,如离心分离器分离酶液体,并得到经处理的油。以这样的工艺对胶状物进行酶分解所产生的含磷化合物实际上全部被转移到水相,并且从油相中去除。一旦酶处理完成后,如果需要,处理的油可以另外用水或者有机或者无机酸洗涤,如乙酸、柠檬酸、磷酸、琥珀酸和等同的酸,或用盐溶液洗涤。 
在超滤脱胶的一个示例性过程中,在过滤前,将酶结合于过滤器,或者将酶加入到油中,或定时用酶清洗过滤器。 
在磷脂酶介导的物理精炼助剂的示例性工艺中,将水和酶加入到粗制油中(例如粗植物油)。一方面,本发明的PLC或者PLD以及磷酸酶用于该工艺中。在磷脂酶介导的物理精炼中,水可以是低水平的,即0.5-5%,处理时间应当短(少于2小时,或者少于60分钟,或者少于30分钟,或者少于15分钟,或者少于5分钟)。该工艺可以在不同的pH(如,3-10),不同的温度(25℃到70℃)下,应用不同的酸和/或碱进行。 
在可选择的方面,水脱胶首先进行,通过离心收集卵磷脂,然后加入本发明的PLC或PLC和PLA以去除非水合的磷脂(该工艺应当在低的水浓度下进行)。另一方面,对粗制油进行水脱胶至低于10ppm(食用油),随后进行物理精炼(对于生物柴油低于50ppm)。一方面,加入乳化剂,和/或将粗制油置于强力混合器中促进混合。可选择地,加入破乳剂,和/或对粗制油加热来促进水相的分离。另一方面,加入酸来促进非水合磷脂的水合。另外地,磷脂酶可以用于介导从胶/皂脚中纯化植物固醇。 
在一个方面,本发明提供了用于油脱胶的组合物和方法(其可以包括使用本发明的磷脂酶),包括使用变化数量的酸和碱,而不制备皂脚。使用本发明油脱胶的这一方面,酸(包括磷酸和/或柠檬酸)可以用于水合高磷含量油(包括大豆、油菜和向日葵)中的非水合的磷脂。一旦磷脂被水合,加入碱,可以提高水相的pH:加入的碱的量可以为酶活性产生有利的pH,但不会导致在油中形成显著的皂 脚组分。因为不形成皂脚,油中的游离脂肪酸可以在下游除去,这发生在脱胶步骤之后,漂白和脱臭期间。 
本发明的酶可用于改进油提取和油脱胶效果(例如植物油)。在一个方面,本发明的PLC和至少一种植物细胞壁降解剂(例如纤维素酶、半纤维素酶或类似物,以使细胞壁柔软并增加提取时的产量)被用于本发明的工艺中。在该使用本发明的酶以改进油提取和油脱胶的示例性方法中,本发明的磷脂酶C以及其他水解酶(例如纤维素酶、半纤维素酶、酯酶、蛋白酶和/或磷酸酶)用于与油生产(包括但是不限于大豆、油菜、向日葵、米糠油)相关的破碎步骤期间。通过在溶剂提取之前使用酶,或代替溶剂提取,有可能增加油产量和减少粗油中水合和非水合的磷脂的数量。非水合磷脂的减少可以归因于在与钙或镁络合之前,潜在的非水合磷脂转化为二酰甘油和相应的磷酸酯。粗油中磷脂总的减少量将提高精炼期间的产量,并有可能无需在漂白和脱臭之前独立的脱胶步骤。 
在一个方面,本发明提供了将本发明的磷脂酶(例如本发明的磷脂酶-特异性磷酸水解酶)或另一磷脂酶用于修改的“有机精炼过程”的工艺,其可以包括将酶(例如PLC)加入盛有柠檬酸的桶中。 
本发明的酶可以用于任何油处理方法,如,脱胶或等同的工艺。例如,本发明的酶可以用于美国专利5,558,781;5,264,367;6,001,640所描述的工艺中。USPN5,558,781所描述的工艺应用磷脂酶A1,A2或B,实质上降解了油中的卵磷脂,其作为乳化剂发挥作用。 
通过应用本发明的磷脂酶,如具有磷脂酶A和/或B活性的多肽,本发明的酶和方法可以用于旨在减少包含高含量非水合磷的食用油中的含磷组分的过程中,如在EP专利号:EP 0869167中所述。一方面,食用油是粗制油,所谓的“非-脱胶油”。一方面,该方法处理非脱胶油,包括压榨油或者提取油,或者其混合物,它们来自,例如油菜籽、大豆、芝麻、花生、玉米、米糠或向日葵。在粗制油中,磷脂含量可以从0.5到3%w/w之间变化,对应于磷含量的范围为200到1200ppm,或者在250到1200ppm范围内。除了磷脂,粗制油也可以含有低浓度的碳水化合物、糖化合物,和Ca、Mg和Fe的金属/磷脂酸复合物。一方面,工艺包括用本发明的磷脂酶处理磷脂或者溶血磷脂,以便水解脂肪酰基基团。一方面,磷脂或者溶血磷脂包括卵磷脂或者溶血卵磷脂。本工艺的一方面,食用油具有的磷含量为在大约50到250ppm之间,而且该工艺包括用本发明的磷脂酶处理油,以便水解大部分的磷脂,并且从油中分离含有水解的磷脂的水相。一方面,酶法脱胶过程之前,对油进行水脱胶。一方面,该方法生产动物饲料,所述生产包括将本发明磷脂酶与饲料物质以及至少一种磷脂混合。 
本发明的酶和方法可以用于油脱胶过程,正如在WO 98/18912所描述的。本发明的磷脂酶可以降低食用油中的磷脂含量。该工艺可以包括用本发明的磷脂酶处理油,来水解大部分的磷脂,并且从油中分离含有水解的磷脂的水相。该工 艺可以用于纯化含有磷脂的任何食用油,如,植物油,例如大豆油、米糠油、油菜籽油和向日葵油、鱼油,藻类油和动物油和类似油。在用酶处理以前,植物油优选地进行预处理,例如通过湿法精炼去除粘质(黏液)。在开始用磷脂酶处理之时,该油可能含有约50-250ppm的磷,或约50至约1500ppm的磷,或更多的磷,如磷脂,并且本发明的工艺可以将该值降低到约5-10ppm以下。 
本发明的酶可以用于如1993年4月25日提交的日本申请H5-132283所述的工艺,该日本申请包括纯化油和脂肪的工艺,该工艺包括步骤:将油和脂肪中的磷脂转化为含磷酸基团的水溶性物质,并且作为水溶性物质去除它们。酶的作用是用于转化成水溶性物质。优选使用的酶是具有磷脂酶C活性的酶。 
本发明的酶可以用于如“Organic Refining Process,”(ORP)(IPH,Omaha,NE)所述的工艺,其是精炼种子油的一种方法。ORP可能具有优于传统化学精炼的优点,包括提高的精油产量、增值的副产品、较低的资金成本和更低的环境成本。 
本发明的酶可以用于处理油或脂肪,动物或者植物的,未加工的、半加工的或者精炼的油或脂肪的工艺,包括将本发明的至少一种酶加入到这样的油或者脂肪中,该酶能够水解和/或解聚在油中含有的非甘油酯化合物,例如EP申请号:82870032.8所述。本发明用于水解和/或解聚在油中含有的非甘油酯化合物的示例性方法为: 
1)在油和脂肪中,加入之前溶解于少量合适溶剂(例如,水)中的本发明的酶或者酶复合物,并混合。大量的溶剂是可能的,但是选择对该酶无毒性的和适合的溶剂。这一加入可以在逐次加载的工艺中进行,也可以在连续的工艺中进行。按照该工艺,加入到油和脂肪中所必需的酶量的范围可以依赖于酶以及待处理的产物,范围从约5到400ppm,或约约20到400ppm;例如,对于1000kg的油或者脂肪0.005kg至0.4kg的酶,并且优选地5到100ppm,即,对于1000kg的油从0.005kg到0.1kg的酶,这些值应该理解为对于浓缩的酶而言,即没有稀释剂或者溶剂。 
2)使油或者脂肪通过固体或者半固体支持物上的本发明酶组成的固定的或者不溶性过滤床,支持物优选呈现多孔的或者纤维性结构。在这一技术中,酶被捕获于支持物的多孔或者纤维结构的微孔中。这些由例如,树脂或合成的多聚物,纤维素碳酸盐,凝胶如琼脂糖,具有多孔结构的多聚物或共聚物的丝构成,从而将处于溶液中的酶的小液滴捕获在它们的微孔中。关于酶的浓度,有可能达到支持物的饱和水平。 
3)以微小的液滴形式,将油和脂肪分散在稀释的酶溶液中,在可选择的方面,含有约0.05到4%,或含有约0.2到4%体积的本发明的酶。这一技术描述在例如比利时专利595,219中。具有圆锥形的盖子的几米高的圆柱形柱子充满了稀释的酶溶液。对于这一目的,选择在待处理的油或者脂肪中无毒和不可溶混的溶剂,优 选水。柱子的底部装配了分配系统,在其中,油或者脂肪以极端分割的形式(每m2大约10,000流量)连续注入。这样形成无数的油或者脂肪的液滴,液滴在酶溶液中缓慢地升高并且碰到表面,从而在反应器的圆锥形盖子的顶部被连续排出。 
棕榈油可以在用本发明酶处理前进行预处理。例如,将大约30kg的未处理的棕榈油加热到+50℃。在蒸馏水中制备具有纤维素酶和果胶酶的1%溶液。在强烈搅拌几分钟下,将这些中的每一个以600g加入到油的水相溶液中。然后,在中度搅拌的条件下,将油保持在+50℃,总反应时间是两个小时。然后,将温度升高到+90℃,以使酶失活,并制备用于过滤和进一步处理的混合物。将油在真空中干燥,并使用过滤助剂进行过滤。 
本发明的酶可以用在如EP专利EP 0 513 709 B2所述的工艺中。例如,本发明提供了通过使用本发明的磷脂酶的酶促分解作用,减少动物和植物油中的含磷成分的含量的工艺。在可选择的方面,将磷含量为约50至1500ppm,或约50至250ppm的预先除去粘液的动物和植物油与有机羧酸混合搅拌,并将所得到的混合物的pH值设定为约pH 4至pH 6,将含有本发明的磷脂酶A1、A2或者B的酶溶液被加入到该混合物中,在混合容器中,通过强力搅拌,形成微小的液滴,在其中,形成相对于油的重量百分比为0.5到5%的乳状液,所述的乳化作用的进行通过至少一个后续的反应容器,在涡旋运动下,在反应时间为从0.1到10个小时下,在温度的范围为20℃到80℃下进行,当从含水溶液中分离后,处理的油具有的磷含量在5ppm以下。 
有机精炼工艺可以用于粗制油和脱胶油。该工艺在控制的工艺条件下,应用在线方式加入有机酸,并与传统的离心分离相结合。从植物油磷脂(“VOP”)自然分离的水被再循环,并再次使用。有机精炼工艺的结果为,总的水用量可以大大降低。 
本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利6,162,623中所述。在这一示例性的方法中,本发明提供了两亲性的酶。该酶可以固定化,如,通过制备含有连续疏水相以及含有酶以及酶载剂的分散水相的乳状液,并且从分散相中去除水,直到该相变成固体酶包被的颗粒。该酶可以是脂酶。固定的脂酶可以用于由脂酶催化的反应,如甘油一酯、甘油二酯或者甘油三酯的分子内酯化作用,或者当脂酶是磷脂酶时,从甘油三酯油去除磷脂。水相可以含有发酵液,可食用的甘油三酯油可以是疏水相,载剂包括糖类、淀粉、葡聚糖、水溶性纤维素衍生物和发酵残余物。这一示例性的方法可以用于处理甘油三酯、甘油二酯、甘油单酯、甘油、磷脂、糖脂或脂肪酸,它们可以存在于疏水相中。在一方面,用于去除甘油三酯油中的磷脂的工艺包括,混合含有磷脂的甘油三酯油与含有本发明磷脂酶的制备物;将磷脂水解为溶血磷脂;从油中分离水解的磷脂,其中磷脂酶是固定化的磷脂酶。 
本发明的磷脂酶和方法也可以应用于用酶法处理食用油,如在美国专利号6,127,137中所述。这一示例性方法水解完整磷脂的两个脂酰基团。用于该示例性方法的本发明的磷脂酶没有脂酶活性,并且其在很低的pH下具有活性。这些特征使其非常适于油脱胶,这是因为油的酶法和碱法水解(皂化作用)可能均受到抑制。在一方面,本发明提供水解磷脂或者溶血磷脂中的脂酰基团的工艺,包括用磷脂酶处理磷脂或者溶血磷脂,所述磷脂酶水解磷脂中的两个脂酰基团并且基本上无脂酶活性的。一方面,本发明的磷脂酶的最佳作用温度为约50℃,测定的条件是在pH 3到pH 4下进行10分钟,并且最佳pH为大约pH 3,测定的条件是在40℃下进行10分钟。一方面,磷脂或者溶血磷脂包括卵磷脂,或者溶血卵磷脂。一方面,在大部分的磷脂水解后,从油中分离含有水解的磷脂的水相。一方面,本发明提供了工艺,用于从食用油中去除磷脂,包括用本发明磷脂酶的水溶液的分散体,在pH 1.5至pH 3下处理油,并从油中分离含有水解的磷脂的水相。一方面,在用磷脂酶处理前,处理油以除去粘质。一方面,在用磷脂酶处理前,该油含有磷脂,其量相当于50到250ppm的磷。一方面,在存在0.5到5%的水的条件下,在30℃到45℃,用磷脂酶处理1到12个小时,磷脂酶的剂量为0.1到10mg/l。 
本发明的磷脂酶和方法也可以用于用酶解处理食用油,如在美国专利号6,025,171中所述。在这一示例性的方法中,本发明的酶是固定化的,通过制备含有连续疏水相的乳状液,如甘油三酯油,和含有两亲性酶的分散水相,如本发明的脂酶或者磷脂酶,和在水相中部分溶解和部分不溶解的载剂物质,并且从水相中去除水,一直到该相变为固体酶包被的载剂颗粒。因为水相已经用水溶性物质饱和了,载剂物质的非溶解部分可以是在水和油中不溶的物质,或者一种以未溶解形式存在的水溶性物质。水相可以用含有发酵残留物和生物物质的粗制脂酶发酵液形成,它们可以作为载剂物质。固定的脂酶可以用于油中的酯重排和脱酸化。反应后,固定的酶可以通过加入水再生,用于以后的反应,并且得到载剂的部分溶解,且所形成的含有酶和载剂的水相分散到疏水相中,通过该疏水相蒸发除水,又一次形成酶包被的载剂颗粒。 
本发明的磷脂酶和方法也可以用酶解处理食用油,如在美国专利号6,143,545中所述。该示例性方法应用本发明的磷脂酶来降低在食用油中含磷组分的含量,该食用油中包括高含量的非水合磷。一方面,该方法用于降低食用油中的含磷组分的含量,油中含有非水合磷的含量为至少50ppm,通过预处理食用油,在60℃测定,通过加入含有柠檬酸单水合物的水溶液(加入的水对油为4.8%w/w;在水相中的(柠檬酸)=106mM,在水/油乳剂中的=4.6mM)维持30分钟;转移10ml的在油乳状液中的预处理水至试管中;在沸水浴中加热乳状液30分钟;在5000rpm离心10分钟,转移大约8ml的上层(油)相至新的试管中,并且放置24小时;从上清相中取2克,用于测定在食用油中的非水合磷的含量(ppm)。该方法也可以包括在从大约pH 5到8的pH条件下,让油接触本发明的磷脂酶A 或者B的水溶液(如,PLA1、PLA2或PLB),该溶液在油中进行乳化,直到油的含磷量下降到小于11ppm,然后从处理的油中分离含水相。 
本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利5,532,163中所述。本发明提供精炼油和脂肪的工艺,通过该工艺,待处理的油和脂肪中的磷脂可以被有效地分解和去除。一方面,本发明提供精炼油和脂肪的工艺,包括,在乳状液中,使油和脂肪与本发明的酶反应,例如,与具有分解甘油磷脂中甘油-脂肪酸酯键的活性的酶(如,本发明的PLA2)反应;也提供了另一个工艺,其中用酶处理的油和脂肪用水或者酸性水溶液洗涤。一方面,用于洗涤步骤的酸性水溶液是至少一种酸的溶液,如,柠檬酸、乙酸、磷酸以及它们的盐。一方面,乳化条件为每100重量份数的油和脂肪应用30重量份数或者更多的水。因为油和脂肪可以不用传统的碱法精炼步骤来纯化,所以可以减少洗涤废水和工业废物的产生。此外,由于归因于它们被包括在这些废物中所致的天然油和脂肪的损失并不在本发明的工艺中发生,所以油的回收产量增加。一方面,本发明提供了用于精炼含有大约100到10,000ppm的磷脂的油和脂肪的工艺,包括:在乳化的条件下,将所述的油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸酯键活性的本发明的酶进行反应。一方面,本发明提供了用于精炼含有大约100到10,000ppm的磷脂的油和脂肪的工艺,包括:在乳化的条件下,将所述的油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸酯键活性的本发明的酶反应;并且随后用洗涤水清洗处理的油和脂肪。 
本发明的磷脂酶和方法也可以用于酶法处理食用油,例如,在美国专利号5,264,367中所述。可食用植物油或动物油,如油,例如大豆油——其已经通过湿法精炼去除了粘质——的含磷成分的含量以及铁含量,通过下述方法降低:通过将所述油与本发明的酶,如磷脂酶A1、A2或者B的水溶液接触,进行酶促降解,然后从处理的油中分离水相。一方面,本发明提供了酶促方法,用于降低油中的含磷组分以及含铁组分的含量,该油已经进行了精炼,去除了粘质。已经进行精炼去除了粘质的油,可以用本发明的酶处理,如用磷脂酶C、A1、A2或者B处理。可以实现低于5ppm的磷含量,低于1ppm的铁含量。低的铁含量可以有助于油的稳定性。 
本发明的磷脂酶和方法也可以用于制备酯交换的油,如在美国专利中5,288,619所描述的。本发明提供了酶促酯交换的方法,用于制备具有低的反式酸(tran-acid)和低中间物链脂肪酸(low intermediate chain fatty acid)含量的人造黄油。该方法包括以下步骤:提供含有硬脂酸来源材料和可食用的液体植物油的酯交换反应混合物;应用1-,3-位置特异性脂酶对硬脂酸来源材料和植物油进行酯交换;然后,最后氢化脂肪酸混合物,来提供再循环的硬脂酸来源材料,用于与植物油进行再循环反应。本发明也提供了制备酯交换油的逆流方法(counter-currentmethod)。该方法包括下述步骤:提供含有1-,3-位置特异性脂酶的酯交换反应区域; 将植物油引入酯交换区域;引入硬脂酸来源物质;传输超临界气体或者亚临界液化气体逆流流体;在反应区域中进行甘油三酯流与硬脂酸或者硬脂酸单酯流的酯交换反应;撤掉酯交换的甘油三酯人造黄油流;撤掉逆流流体相;对酯交换的硬脂酸或者硬脂酸单酯进行氢化作用,来提供氢化的再循环硬脂酸来源物质;并将氢化的再循环硬脂酸源物质引入到反应区域。 
一方面,高度不饱和的磷脂化合物可以通过适当地应用本发明的磷脂酶C,以去除sn-3位置的磷酸基团,随后进行1,3脂酶酰基酯的合成,而转变为甘油三酯。2-取代的磷脂可以直接用作功能性食物成分,或者随后可以应用本发明的固定化的磷脂酶C,选择性地在反应器160中进行水解,以便产生1-甘油二酯,随后进行在此描述的酶促酯化反应,来产生具有2-取代的多不饱和脂肪酸组分的甘油三酯产物。 
本发明的磷脂酶和方法也可以用于植物油酶促脱胶过程,如在美国专利6,001,640中所描述的。该发明方法包括,在食用油的生产中的脱胶步骤。来自植物油的可水合磷脂通过之前的水相脱胶过程已经被去除,用本发明的磷脂酶进行酶促处理使植物油不含有非水合磷脂。该工艺可以是温和的、经济的并且对环境无不良影响。仅仅水解溶血卵磷脂而不水解卵磷脂的磷脂酶用于该脱胶过程。 
一方面,为了使得本发明的酶能起作用,两相,含有酶的油相和水相,必须充分混合。仅仅搅拌它们可能是不够的。如果其溶解于少量的水中,如0.5-5%重量百分比(相对于油),并且以这一形式在油中进行乳化,从而形成直径少于10微米的液滴(重均),则有助于酶在油中很好地分散开。液滴可以小于1微米。可以以径向速率超过100cm/秒进行剧烈的搅拌。应用外部旋转泵,油也可以在反应器中循环。含有酶的水相也可以通过超声作用充分分散。可以应用分散仪器。 
酶反应可能发生在油相和水相之间的边界面上。所有这些混合措施的目标在于,为含有酶的水相产生最大可能的表面积。表面活性剂的加入增加了水相的微分散。所以,在一些情况下,将HLB值高于9的表面活性剂,如十二烷基硫酸钠加入到酶溶液中,如在EP-A 0 513 709中所描述的。增加乳化作用的类似有效的方法是加入溶血卵磷脂。加入量的范围相对于油在0.001%到1%之间,相对于油而言。酶处理期间的温度不是至关重要的。可以应用的温度在20℃到80℃之间,但是后者只能应用很短的时间。在该方面,应用具有良好的温度和/或低pH值耐受性的本发明磷脂酶。最佳的应用温度在30℃到50℃之间。处理的时间取决于温度,并且在增高温度时,处理时间可以变短。时间从0.1到10小时,或者从1到5小时一般就足够了。反应发生在脱胶反应器中,其可以划分为几个阶段,如在DE-A 43 39 556中所描述的。因此,可以进行连续操作,也可以进行间歇性操作。反应可以在不同的温度阶段中进行。例如,温育可以在40℃下进行3小时,然后在60℃下进行1小时。如果反应阶段式进行,也可能在各个阶段调节不同的pH值。例如,在第一阶段,溶液pH值可以调节到7,例如,通过加入柠檬酸溶液, 在第二阶段,将pH值调节到2.5。然而,在至少一个阶段,酶溶液的pH值必须低于4或者低于3。如果pH值被后续调节到低于这一水平,可能会损害效果。因此,柠檬酸可以在酶被混合到油中之前被加入至酶溶液中。 
在酶处理完成以后,酶溶液以及包含在酶溶液中的NHP的分解产物,可以例如通过离心的方式,从油相中分批或连续地分离出来。由于酶具有高水平的稳定性,并且包含在溶液中的分解产物的量较少(它们可能沉淀为污泥),同一含水酶相可以重复应用几次。也有可能从污泥中释放出酶,参见,如,DE-A 43 39556,因此基本上没有污泥的酶溶液可以被再次使用。在这一脱胶工艺的一个方面中,得到含有少于15ppm磷的油。一个目标是磷含量少于10ppm;或者少于5ppm。在磷含量低于10ppm的情况下,按照蒸馏脱酸工艺进一步处理油是十分可能的。许多其它的离子,如镁、钙、锌以及铁,可以从油中去除,如低于0.1ppm。这样,该产品为在进一步的处理和储存中具有好的耐氧化性具有理想的前提条件。 
本发明的磷脂酶和方法也可以用于降低植物油和动物油中含磷组分的量,如在EP专利的EP 05 13709中所述。在这一方法中,之前已经经过了脱泥处理的植物和动物油例如大豆油中的含磷组分尤其是磷脂如卵磷脂的含量,以及铁的含量,通过应用本发明的磷脂酶A1、A2或者B的酶促降解作用而被降低。 
本发明的磷脂酶和方法也可以用于精炼脂肪或者油,如在JP 06306386所述。本发明提供了用于精炼脂肪或者油的工艺,该工艺包括将在脂肪或者油中的磷脂转化成水溶性的含磷基团物质的步骤,并且除去该物质的步骤。本发明酶(如,PLC)的作用被用于将磷脂转化成这种物质。因此,有可能在无需进行碱炼步骤的情况下,精炼脂肪或者油,碱炼步骤产生含有碱性废水和大量油的工业废物。由于中性脂肪或者油逃逸到废物中的损失可以降低到零,所以可以实现产量的增加。在一方面,胶状物质被转化成水溶性物质,通过加入本发明的具有磷脂酶C活性的酶,作为水溶性物质而被去除,这在粗制油的脱胶过程和进行酶处理的阶段中进行。一方面,本发明的磷脂酶C具有切割存在于磷脂中的甘油和磷酸的酯键的活性。如果需要,该方法可以包括用水或者酸性水溶液洗涤经过酶处理的油。一方面,加入本发明的酶,并且与粗制油反应。所用的磷脂酶C的量可以是每公斤粗制油,10到10,000单位,或大约100到2,000单位。 
本发明的磷脂酶和方法也可以用于水脱胶过程,如,在Dijstra,Albert J.,et al.,Oleagineux,Corps Gras,Lipides(1998),5(5),367-370中。在该示例性的方法中,水脱胶过程被用于产生卵磷脂,并且用于使用脱胶酸和漂白土的干法脱胶过程。这一方法可能仅仅对于低磷脂含量的油是经济可行的,如,棕榈油、月桂油等。对于具有高NHP含量的种子油,应用酸精炼过程,其中该过程在榨油机中进行,以便允许经由粗粉(meal)的胶清除。一方面,该酸精炼油是在物理精炼之前进行的一个可能的“精炼(polishing)”操作。 
本发明的磷脂酶和方法也可以用于脱胶过程,如在Dijkstra,et al.,Res.Dev.Dep.,N.V.Vandemoortele Coord.Cent.,Izegem,Belg.JAOCS,J.Am.Oil Chem.Soc.(1989),66:1002-1009中所述。在该示例性的方法中,总的脱胶过程包括将酸,如磷酸或者柠檬酸分散至大豆油中,允许接触一定的时间,随后将碱,如苛性钠或者硅酸钠混合到油包酸(acid-in-oil)乳状液中。这可以将中和度低保持在足够低的水平,以避免形成肥皂,这是因为那会导致油损失的增加。随后,油通过离心分离器,在这种情况下,大多数胶状物从油流中去除,产生具有最少油含量的胶相(gumphase)。油流随后通过第二离心分离器中,以去除所有残留的胶,得到稀释的胶相,其进行再循环。洗涤和干燥或者在线碱法精炼完成该工艺。在采用全部的脱胶工艺以后,与经典的碱法精炼工艺相比,实现了总产量增加大约0.5%。完全脱胶的油然后可以进行碱精炼,漂白和脱臭,或者被漂白和物理精炼。 
本发明的磷脂酶和方法也可以用于去除植物油如大豆油中的不可水合磷脂,如在Hvolby,et al.,Sojakagefabr.,Copenhagen,Den.,J.Amer.Oil Chem.Soc.(1971)48:503-509中所描述。在这一示例性的方法中,水脱胶的油,在不同的固定pH值下,与含有和不含有Ca++、Mg/Ca结合试剂的缓冲液,以及表面活性剂混合。不可水合的磷脂可以作为微胶粒或者混合乳化剂组分在未转化的状态下去除。更进一步地,不可水合磷脂可以通过转化为解离形式而去除,例如通过从磷脂中去除Mg和Ca,该过程可以通过酸化或者通过用Mg/Ca络合或者Mg/Ca沉淀试剂处理来完成。不可水合磷脂的去除或者化学转化可能导致乳状液形成减少,和来自乳状液层和皂脚中的脱酸化油的分离有所改善。 
本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Buchold,et al.,Frankfurt/Main,Germany.Fett Wissenschaft Technologie(1993),95(8),300-304中所述。在本发明的用于食用植物油脱胶的这一示例性工艺中,用本发明酶如,磷脂酶A2的水悬浮液,来水解结合在磷脂sn2位上的脂肪酸,得到不溶于油的1-酰基-溶血磷脂,并且因此更适用于物理分离。甚至加入少量的相当于大约700lecitase单位/公斤油,得到的残留磷浓度少于10ppm,这样化学精炼是可以用物理精炼替代的,省略了中和、皂脚破裂和废水处理的必要。 
本发明的磷脂酶和方法也可以用于植物油的脱胶,如EnzyMax.Dahlke,Klaus.Dept.G-PDO,Lurgi O1-Gas,Chemie,GmbH,Frankfurt,Germany.Oleagineux,Corps Gras,Lipides(1997),4(1),55-57中所述。该示例性过程是一个用于物理精炼几乎任何种类油的脱胶过程。通过酶催化的水解,磷脂转化为水溶性的溶血磷脂,其可以通过离心从油中分离得到。在酶法脱胶的油中,残留的磷含量可以低至2ppm P。 
本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Cleenewerck,et al.,N.V.Vamo Mills,Izegem,Belg.Fett Wissenschaft Technologie(1992),94:3 17-22,和Clausen,Kim;Nielsen,Munk.Novozymes A/S,Den.Dansk Kemi(2002)83(2):24-27 所述。本发明的磷脂酶和方法可以整合酸对植物油进行的预精炼工艺,如在下述文献中所述:Nilsson-Johansson,et al.,Fats Oils Div.,Alfa-Laval Food Eng.AB,Tumba,Swed.Fett Wissenschaft Technologie(1988),90(11),447-51;以及,Munch,Ernst W.Cereol Deutschland GmbH,Mannheim,Germany.Editor(s):Wilson,RichardF.Proceedings of the World Conference on Oilseed Processing Utilization,Cancun,Mexico,Nov.12-17,2000(2001),Meeting Date2000,17-20。 
本发明的磷脂酶和方法也可以用于植物油中的脱胶,如在Jerzewska,et al.,Inst.Przemyslu Miesnego i Tluszczowego,Warsaw,Pol.,Tluszcze Jadalne(2001),36(3/4),97-110中所述。在本发明的这一工艺中,通过应用本发明的磷脂酶A2对水合的低-芥酸油菜籽油进行酶法脱胶。该酶可以催化磷脂中甘油部分的中心碳原子连接的脂肪酸酯键的水解。它也可以水解不可水合的磷脂为它们相对应的可水合的溶血化合物。对于非纯化的酶制备物,加入2%的制备物4小时,可以得到更好的结果(87%P去除率)。 
在本发明的油脱胶(或使用本发明酶的油脱胶工艺)的另一示例性工艺中,加入酸性聚合物,例如藻酸盐或果胶。在本发明的该油脱胶工艺中,将酸性聚合物(例如藻酸或果胶或更加可溶性的盐形式)加入到含有少量水(例如在约0.5至5%范围内)的粗油中。在该方面中,通过结合粗油中的钙和/或镁,酸性聚合物可以减少和/或分裂磷脂-金属络合物,从而提高不可水合的磷脂的溶解性。在可选择的方面,这些磷脂将移动到油/水介面或进入水相,并且转化为二酰甘油和相应的侧链,或者完整的磷脂将作为重相的组分被随后的离心除去。在水相中酸性聚合物的存在也可以增加水相的密度,并提高从油(轻)相分离重相的效果。 
本发明的油脱胶(或使用本发明酶的油脱胶工艺)的一个示例性工艺改变脱臭程序,以获得二酰甘油(DAG)组分。在可选择的方面,如果必要或需要,在酶助脱胶之后,可以修改脱臭条件(温度、压力、蒸馏设备的构造),以达到提高游离脂肪酸(FFA)从二酰甘油/三酰甘油组分分离的结果,或进一步修饰以从三酰甘油组分分离出二酰甘油。这些修饰的结果是,使用本发明的方法,有可能获得更好级别的FFA和二酰甘油,如果本发明的酶(例如磷脂酶,或PLC或PLC和磷酸酶的组合)被用于在物理精炼工艺中对食用油脱胶的话。 
在各个方面,实施在此描述的本发明方法(或使用本发明的酶),具有许多优点诸如:减少或消除溶剂和溶剂回收步骤;降低资金成本;减少下游精炼成本;减少化学品使用,设备,工艺时间,能源(热能)和水使用/废水产生;产生更高质量的油;在一些烹饪和煎炒应用中可以使用无需精炼的压榨机压出的油(该压出的油可以具有优异的稳定性,色泽和气味特征和高维生素E含量);产生更高质量的膳食;产生更低脂肪含量的膳食(目前,出自机械压榨的膳食引起反刍动物的消化问题);产生提高的营养特性——降低水平的芥子油苷、鞣酸、芥子碱、植酸(如 在Technology and Solvents for Extracting Oilseeds and Nonpetroleum Oils,AOCS1997中所述)。 
在一个方面,本发明提供了精炼植物油(例如大豆油、玉米油、棉籽油、棕榈油、花生油、油菜籽油、红花油、向日葵油、芝麻籽油、米糠油、椰子油或油菜油)和它们的副产物的工艺,和对卵磷脂脱臭的工艺,例如在美国专利6,172,248或6,172,247中所述,其中的方法包括使用至少一种本发明的酶,例如本发明的磷脂酶C。因此,本发明提供了包含至少一种本发明的酶的卵磷脂和植物油。在示例性有机酸精炼工艺中,将植物油与稀释的含水有机酸溶液组合,并进行高度剪切,以将酸溶液充分分散在油中。将所得的酸和油混合物在低剪切下混合一段足够的时间,以将污染物整合到水合的杂质相中,从而产生纯化的植物油相。在该示例性工艺中,可以使用混合器或循环系统(例如循环水桶)和/或磷脂或卵磷脂储存桶,如在美国专利4,240,972、4,049,686、6,172,247或6,172,248中所述。这些工艺可以作为间歇或连续工艺操作。粗或脱胶的植物油可以由储存桶供应(例如通过泵)并可以加热。待纯化的植物油可以是粗的或“脱胶的”油。 
在一个方面,本发明的磷脂酰肌醇-PLC(PI-PLC)酶用于植物油脱胶。本发明的PI-PLC酶可以单独使用,或与其他的酶(例如,本发明的PLC、PLD、磷酸酶)组合使用,以提高植物油(包括大豆油、油菜油和向日葵油)脱胶期间的油产量。PI-PLC可以优选地将磷脂酰肌醇转化为1,2-二酰甘油(DAG)和磷酸肌醇(phosphoinositol),但是它也可以对其他磷脂表现出活性,包括磷脂酰胆碱、磷脂酰乙醇胺、磷酯酰丝氨酸或磷脂酸或其组合。对植物油进行酶处理导致捕获在较小的胶组分中的油的数量减少,这增加了酶处理的植物油中的DAG的数量并增加了中性油,从而实现产量增加。 
含油种子的酶法加工 
本发明提供了酶法加工含油种子,包括大豆、油菜、椰子、鳄梨和橄榄糊的组合物(例如酶)和方法。在一个方面,本发明的这些工艺可以增加油产量,并提高获得的膳食的营养质量。在一些方面,使用本发明的酶和方法来酶法加工含油种子,将具有经济和环境利益,并为油萃取和加工人类和动物食物提供了可供选择的技术。在可选择的方面,本发明的工艺包括使用本发明的磷脂酶、其他磷脂酶、蛋白酶、磷酸酶、植酸酶、木聚糖酶、淀粉酶(例如α-淀粉酶)、葡聚糖酶(例如β-葡聚糖酶)、聚半乳糖醛酸酶、半乳糖脂酶、纤维素酶、半纤维素酶、果胶酶和其他降解植物细胞壁的酶、以及混合酶制剂和细胞裂解剂。 
在可选择的方面,本发明的工艺可以与其他工艺联合实施,例如酶处理,例如用碳水化合物酶处理,包括纤维素酶、半纤维素酶和其他副降解活性,或与化学工艺联合,例如己烷提取大豆油工艺。当在溶剂萃取之前进行酶法处理时,酶法处理可以增加油萃取率达8-10%。 
在可选择的方面,本发明的工艺可以用水萃取工艺实施。水萃取方法对于油萃取来说可能是环境上更清洁的可选择的技术。水工艺的低萃取产量可以通过使用这样的酶克服,即该酶水解形成含油种子细胞壁的结构多糖,或水解形成细胞和类脂体膜的蛋白质,例如,利用包括纤维素酶、半纤维素酶和/或原果胶酶在内的酶进行消化,用于从大豆细胞提取油。在一个方面,根据Kasai(2003)J.Agric.Food Chem.51:6217-6222的描述,用本发明的酶实施本方法,该文献报道了消化细胞壁最有效的酶是纤维素酶。 
在一个方面,蛋白酶与本发明的方法一起使用。已经评价了蛋白酶和纤维素酶对油和蛋白质提取产量的操作变量和酶活性以及其他工艺参数,诸如酶浓度、水解时间、颗粒大小和固液比的联合效应。在一个方面,根据Rosenthal(2001)Enzyme and Microb.Tech.28:499-509的描述,用本发明的酶实施本方法,该文献报道了使用蛋白酶能比使用热处理面粉时的对照产生明显较高的油和蛋白质产量。 
在一个方面,全蛋白、果胶和半纤维素提取与本发明方法一起使用。植物细胞由一系列的多糖组成,其常常与蛋白质和酚类化合物缔合或被蛋白质和酚类化合物替代。这些碳水化合物中的大部分只是被消化酶部分消化或低效利用。通过加工或降解性酶处理来破裂这些结构,可以提高它们的营养可利用率。在一个方面,根据Ouhida(2002)J.Agric.Food Chem.50:1933-1938的描述,用本发明的酶实施本方法,该文献报道了全蛋白、果胶和半纤维素提取之后大大降解了大豆细胞壁纤维素(高达20%)。 
在一个方面,本发明的方法进一步包括在处理种子例如油菜籽中结合各种酶处理,这些处理包括使用蛋白酶、纤维素酶和半纤维素酶(相互之间和与本发明的一种或多种酶的各种联合)。例如,所述方法可以包括在传统工艺之前,在用酶温育期间,在20至40水份中酶法处理油菜种子,如Sosulski(1990)Proc.Can.Inst.Food Sci.Technol.3:656所述。本发明的方法可以进一步结合蛋白酶、α-淀粉酶、聚半乳糖醛酸酶(相互之间和与本发明的一种或多种酶的各种联合),以水解椰子粉中的细胞物质和释放椰子油,该椰子油可以通过离心回收,如McGlone(1986)J.ofFood Sci.51:695-697所述。本发明的方法可以进一步以不同的组合方式结合果胶酶、α-淀粉酶、蛋白酶、纤维素酶(相互之间和与本发明的一种或多种酶的各种联合),以在酶法提取鳄梨油期间明显提高产量(在最好的情况下~70%),如Buenrostro(1986)Biotech.Letters 8(7):505-506所述。在本发明的橄榄油提取工艺中,用纤维素酶、半纤维素酶、聚半乳糖醛酸酶、果胶-转甲基酶、蛋白酶和它们的组合(相互之间和与本发明的一种或多种酶的组合)处理橄榄糊,如,例如Montedoro(1976)Acta Vitamin.Enzymol.(Milano)30:13所述。 
从植物油中纯化植物固醇 
本发明提供了方法,用于从植物油中纯化植物固醇和三萜,或者植物甾醇。应用本发明的磷脂酶和方法可以纯化的植物固醇,包括β-谷固醇、菜油甾醇(campesterol)、豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、24-脱氢胆甾醇、chalinasterol、多孔甾醇、穿贝海绵甾醇(clionasterol)和菜子甾醇(brassicasterol)。植物固醇是用于健康和营养工业的重要农产品。因此,本发明的磷脂酶和方法可用于制备用于化妆品制造的乳化剂以及用于生产激素药物的甾体中间物和前体。本发明的磷脂酶和方法用于制备(如,纯化)植物固醇和它们的酯的类似物,用作具有心血管健康价值的降低胆固醇的试剂。本发明的磷脂酶和方法用于纯化植物甾醇,植物甾醇通过抑制在消化道中的胆固醇吸收,来降低血清中的胆固醇水平。本发明的磷脂酶和方法用于纯化具有在极低的浓度下具有免疫调节特征的植物甾醇,包括增强的T淋巴细胞的细胞应答和天然杀伤细胞对癌细胞系的细胞毒性活性。本发明的磷脂酶和方法用于纯化植物甾醇,用于治疗肺结核、类风湿性关节炎、HIV感染病人的处理和免疫应力的抑制,例如,在马拉松选手中。 
本发明的磷脂酶和方法用于纯化存在于日用植物油(如,椰子、油菜、可可豆脂油、玉米、棉籽、亚麻、橄榄、棕榈、花生、米糠、红花、芝麻、大豆、向日葵油)的甾醇部分中的甾醇成分,如,谷固醇(40.2-92.3%)、菜油甾醇(2.6-38.6%)、豆甾醇(0-31%)和5-燕麦固醇(1.5-29%)。 
本发明的方法可以结合油籽中植物来源固醇的分离,该分离通过下述方法完成:用氯仿-甲醇、己烷、二氯甲烷或者丙酮进行抽提,然后进行皂化作用和层析法纯化,以获得富集的总甾醇。可选择地,植物样品可以通过应用超临界二氧化碳的超临界流体提取,以得到总脂类提取物,从中可以富集和分离甾醇。对于甾醇化合物的随后表征和定量,粗分离物可以通过很多不同的色谱技术纯化和分离,包括柱层析(CC)、气相色谱、薄层色谱(TLC)、正相高效液相色谱(HPLC)、反相高效液相色谱和毛细管电色谱。在所有的色谱分离和分离技术中,对于样品清理、纯化、定性分析和测试样品中固醇的初步估计而言,CC和TCL程序的应用是最容易进行的,成本上承受得起的并且是适当的。 
在可食用油的精炼过程中,植物油中的植物固醇作为副产物而丧失。本发明的磷脂酶和方法应用从这样的副产物中分离的植物固醇,来制备从这样的副产物中分离得到的富集植物固醇的产物。本发明的植物固醇分离和纯化方法可以合并油处理工艺中的工业副产物,并且可以包括如分子蒸馏、液-液提取和结晶的操作。 
本发明的方法可以结合液体抽提来提取植物固醇的工艺。例如,本发明的方法可以应用非极性溶剂如己烷(一般用于提取大部分种类的植物油),定量地提取游离的植物固醇和植物固酰脂肪酸酯。固醇糖苷和脂肪酰化固醇糖苷仅仅被己烷部分提取,增强的溶剂极性产生更高百分比的抽提率。可以应用的一个程序是Bligh和Dyer的氯仿-甲醇方法,用于提取所有的固醇脂类,包括磷脂。一个定 性分离和定量分析的植物固醇脂类的示例性方法包括将脂类提取物注入HPLC系统。 
本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如在美国专利号6,303,803中所描述的。这是降低含有固醇的脂肪和油中的固醇含量的方法。其是基于胆固醇和其它甾醇对于形成疏水流体双层如磷脂双层的两性分子的亲和性,是一个高效和具有成本效率的过程。磷脂的聚集体与,例如含有甾醇的脂肪或者油在含水环境下接触,随后进行混合。聚集的磷脂混合物的分子结构对胆固醇和其它甾醇具有高亲和性,可以从脂肪和油中选择性地去除这样的分子。水相分离混合物被混合足够长的时间,以便通过分配甾醇到磷脂聚集体部分中,从而选择性地降低脂肪/油产物中的甾醇含量。甾醇含量降低的脂肪或者油被从水相分离混合物中分离。可选择地,相应的富集甾醇的组分也可以被从水相分离混合物中分离。这些步骤可以在环境温度下进行,涉及加热的成本被最小化,同样地,产物因为热而降解的可能性也被最小化。另外,需要最少量的设备,并且因为所有需要的材料都是食品级的,该方法不需要在操作、废物处理或者最终产物的污染方面有特别预防措施。 
本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如,在美国专利号5,880,300所描述。将磷脂聚集体与,如含有甾醇的脂肪或者油在含水环境中接触,然后进行混合。在充分混合后,甾醇含量降低的脂肪或者油从含水分离混合物中分离出来。可选择地,相应的甾醇富集的磷脂也可以从含水分离混合物中分离。植物(如蔬菜)油含有植物甾醇(植物固醇),它们也可以应用本发明的方法去除。该方法可以用于商业处理循环的任何阶段的脂肪/油产品。例如,本发明的工艺可以用于精炼、漂白和脱臭的油(“RBD油”),或者在达到RBD状态之前的加工过程的任何阶段。与RBD之前的油(pre-RBD oil)相比,尽管RBD油可能具有改变的密度,本过程易于改变而适合于RBD也适合于RBD之前的油,或者适于各种其它的脂肪/油产品,这是是通过改变磷脂含量、磷脂组成、磷脂∶水的比例、温度、压力、混合条件和分离条件而进行的,如下所述。 
可选择地,本发明的酶和方法可以用于在油加工的中间步骤中分离植物甾醇或者其它甾醇。例如,已知在植物油的脱臭中植物甾醇丧失。含有甾醇的蒸馏部分——例如来自处理的中间阶段,可以进行以上所述的甾醇抽提程序。这提供了富含甾醇的卵磷脂或者其它磷脂物质,其可以进一步处理以便回收抽提的甾醇。 
去污剂组合物 
本发明提供了包括一种或者多种本发明磷脂酶的去污剂组合物,和制备和使用这些组合物的方法。本发明并入了所有制备和使用去污剂组合物的方法,参见例如美国专利6,413,928;6,399,561;6,365,561;6,380,147。去污剂组合物可以是一个和两个部分的含水组合物、非含水液体组合物、铸塑固体、粒形形式、微 粒形式、压缩片剂、凝胶和/或膏状物以及浆状物形式。本发明也提供能够应用这些去污剂组合物快速去除各种食物污迹、食物残留物膜和其它微小的食物组合物的方法。本发明的磷脂酶可以通过磷脂的催化水解来帮助去除污染。本发明的磷脂酶可以用在洗盘去污剂和纺织品洗涤去污剂中。 
实际的活性酶含量依赖于去污剂组合物的制造方法,并且并不是决定性的,只要去污剂溶液具有所需的酶促活性。一方面,存在于最终溶液中的磷脂酶的量的范围为,在每克去污剂组合物中,大约0.001mg到0.5mg。选择用于本发明的工艺和产品的特定酶,依赖于最终用途的条件,包括产品物理形式、应用pH、应用温度和待降解或者改变的污物类型。对于任何给定的一套应用条件,可以选择酶以提供最佳的活性和稳定性。在一个方面,本发明的多肽在大约4到大约12的pH范围,大约20℃到大约95℃的温度范围内有活性。本发明的去污剂可以包括阳离子、半极性非离子的或者兼性离子表面活性剂;或者其混合物。 
本发明的磷脂酶可以配制成粉末去污剂和液体去污剂,其pH值在4.0到12.0之间,以重量百分比计算,含量水平为约0.01%到大约5%(优选地0.1%到0.5%)。这些去污剂组合物也可以包括其它的酶如已知的蛋白酶、纤维素酶、脂酶或内切糖苷酶,以及助洗剂和稳定剂。本发明磷脂酶的加入到传统的清洗组合物中,并不产生任何特定的应用限制。换句话说,只要pH在以上的范围内,温度低于所述酶的变性温度,适于去污剂的任何温度和pH也适于本组合物。此外,本发明的多肽可以用于不含去污剂的洗涤组合物中,此外,或者可以单独应用,或者可以与助洗剂和稳定剂组合应用。 
本发明提供了包括去污剂的洗涤或消毒组合物,和/或用于洗涤和/或消毒硬表面的消毒组合物,适用于洗涤和/或消毒织品的去污剂组合物,洗盘组合物,口腔清洗组合物,牙齿清洗组合物,和/或隐形眼镜清洗溶液。 
一方面,本发明提供了洗涤对象的方法,该方法包括在足以洗涤的条件下,使该对象与本发明的磷脂酶接触。可以包括本发明的磷脂酶,作为去污剂添加剂。本发明的去污剂组合物可以,例如,配制成包括本发明磷脂酶的手洗或机洗去污剂组合物。适用于对染色织物进行预处理的洗涤添加剂可以包括本发明的磷脂酶。织物柔软剂组合物可以包括本发明的磷脂酶。可选择地,本发明的磷脂酶可以被配制为去污剂组合物,用于一般家用硬表面的清洗操作。在可选择的方面,本发明的去污剂添加剂和去污剂组合物可以包括一种或者多种其它的酶,如蛋白酶、脂酶、角质酶、另一种磷脂酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,如乳糖酶和/或过氧化物酶。选择本发明酶的特性以与选定的去污剂相容(即,最适pH,与其它酶和非酶成分相容等等),并且所述酶以有效量存在。在一方面,本发明的磷脂酶用于从织物中去除恶臭物质。可以用于实践本发明的各种去污剂组合物和用于制备它们的方法描述在下述 专利中,例如美国专利6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。 
废物处理 
本发明的磷脂酶可以用于废物处理。一方面,本发明提供了应用本发明磷脂酶的固体废物消化过程。该方法可以包括减少基本上未处理的固体废物的量和体积。固体废物可以用酶消化过程处理,这是在酶溶液(包括本发明的磷脂酶)存在的条件下,在控制的温度下进行的。固体废物可以转化为液化废物和任何残留固体废物。所得到的液化废物可以与所述的任何残留固体废物分离。参见如美国专利5,709,796。 
解毒 
磷脂酶(例如本发明的PLCs、patatins)可以用于解毒方法,例如对内毒素,如包含脂多糖(LPS)的组合物进行解毒,并且,本发明提供了使用至少一种本发明酶的解毒方法,所述酶例如patatin,具有如SEQ ID NO:12(由SEQ ID NO:11编码)、SEQ ID NO:14(由SEQ ID NO:13编码)、SEQ ID NO:18(由SEQ ID NO:17编码)、SEQ ID NO:26(由SEQ ID NO:25编码)、SEQ ID NO:28(由SEQ ID NO:27编码)、SEQ ID NO:34(由SEQ ID NO:33编码)、SEQ ID NO:36(由SEQ ID NO:35编码)、SEQ ID NO:44(由SEQ ID NO:43编码)、SEQ ID NO:46(由SEQ ID NO:45编码)、SEQ ID NO:56(由SEQ ID NO:55编码)、SEQ ID NO:60(由SEQ ID NO:59编码)、SEQ ID NO:66(由SEQ ID NO:65编码)、SEQ ID NO:72(由SEQ ID NO:71编码)、SEQ ID NO:78(由SEQ ID NO:77编码)、SEQ ID NO:87(由SEQ ID NO:86编码)、SEQ ID NO:88(由SEQ ID NO:87编码)、SEQ ID NO:92(由SEQ ID NO:91编码)、SEQ ID NO:96(由SEQ ID NO:95编码)、SEQ ID NO:100(由SEQ ID NO:99编码)、SEQ ID NO:104(由SEQ ID NO:103编码)、SEQ ID NO:126(由SEQ ID NO:125编码)、SEQ ID NO:128(由SEQ ID NO:127编码)、SEQ ID NO:132(由SEQ ID NO:131编码)、SEQ ID NO:134(由by SEQ ID NO:133编码)、SEQ ID NO:136(由SEQ IDNO:135)或SEQ ID NO:138(由SEQ ID NO:137)阐述的序列。在一个方面,本发明的磷脂酶用于对脂多糖(LPS)解毒。在一个方面,该解毒作用是通过对来自类脂A的2′和/或3′脂肪酸链进行脱酰作用。在一个方面,本发明的磷脂酶(例如PLC、patatin)用于水解来自类脂例如类脂A(例如来自细菌内毒素)的2′-月桂酰和/或3′-肉豆蔻酰链。在一个方面,本发明的方法用于破坏内毒素,例如来自革兰氏阴性细菌,如来自大肠杆菌的毒素。在一个方面,本发明的磷脂酶(例如PLC、patatin)被用于改善毒素中毒(例如来自进行性革兰氏阴性感染)的效应,或预防性地防止感染(例如动物或人的感染)期间的内毒素效应。因此,本发明提供包含本发明的磷脂酶(例 如PLC、patatin)的药物组合物,和使用本发明的水解酶来改善或预防脂多糖(LPS)毒性作用的方法,例如在脓血症期间。 
加工食物 
本发明的磷脂酶可以用于加工食物,例如以改变它们的稳定性、贮存期、风味、质地,提高它们的营养价值和类似情况。例如,在一个方面,本发明的磷脂酶用于产生酸性磷脂,用于控制食物的苦味。 
在一个方面,本发明提供了使用本发明的磷脂酶制备奶酪的工艺(因此,本发明也提供了包含本发明磷脂酶的奶酪)。在一个方面,本发明的酶(例如磷脂酶A、溶血磷脂酶或其组合)被用于加工奶酪,以增强风味、增加产量和/或“稳定”奶酪,例如通过降低“(去油(oil-off))”的趋势来进行,或在一个方面,本发明的酶用于从酪乳加工奶酪。本发明的这些工艺可以结合任何方法或方案,例如在美国专利6,551,635和6,399,121、WO 03/070013、WO 00/054601中所述。例如,在一个方面,本发明的磷脂酶被用于稳定乳或含乳组合物例如奶油中的脂肪乳状物,以及用于稳定乳制组合物,例如用于制备奶油或液体奶油。在一个方面,本发明提供了使用至少一种本发明酶来增强奶酪的风味的工艺,该工艺包括在含水介质中,在产生增强的奶酪风味的条件下(例如减少的苦味),温育蛋白、脂肪和蛋白酶和脂肪酶,如WO 99/66805所述。在一个方面,本发明的磷脂酶用于增强奶酪(例如凝乳)的风味,这通过在升高的温度,例如在约75℃至95℃之间,用水、蛋白酶和脂酶(本发明的酶)混合来进行,如在美国专利4,752,483中所述。在一个方面,本发明的磷脂酶用于通过在将凝结剂加入到牛奶之前将本发明的酶(例如脂酶或磷脂酶)加入到奶酪(例如酪乳)中,或在挤压之前将本发明的酶加入到含盐凝乳中来促进奶酪老化,如美国专利4,707,364中所述。在一个方面,本发明的脂酶用于降解牛奶脂肪中的甘油三酯来释放游离脂肪酸,从而增强风味。蛋白酶也可以用于本发明的这些工艺的任何工艺中,参见例如Brindisi(2001)J.of Food Sci.66:1100-1107。在另一个方面,酯酶、脂酶、磷脂酶和/或蛋白酶的组合可以用于本发明的这些工艺或任何工艺。 
在一个方面,本发明的磷脂酶用于减少食物中例如油诸如具有高含量的不可水合磷组分的植物油中的磷组分含量,如WO 98/26057所述。 
本发明的磷脂酶的其它用途 
本发明的磷脂酶也可以用于研究磷酸肌醇(PI)信号系统;用于诊断、预后和双极性紊乱治疗的开发(参见如,Pandey(2002)Neuropsychopharmacology26:216-228);作为抗氧化剂;作为修饰的磷脂;作为发泡剂和胶凝剂;产生用于血管形成组织的血管生成性类脂;用于鉴定磷脂酶,如PLA、PLB、PLC、PLD和/或patatin调节剂(激动剂或者拮抗剂),如作为抑制剂而用作抗瘤剂、消炎剂 以及作为止痛剂。它们可以用于产生酸性磷脂,用于控制食品和药物中的苦味。它们可以用于脂肪纯化。它们可以用于鉴定用于治疗病毒性、炎症性、过敏性和心血管疾病的肽抑制剂。它们可以用于制备疫苗。它们可以用于制备多不饱和脂肪酸甘油酯和磷脂酰甘油。 
本发明的磷脂酶,例如,PLA和PLC酶,用于产生免疫毒素和各种治疗剂,用于抗癌治疗。 
本发明的磷脂酶可以与其它用于脱色(即,去除叶绿素)的酶和去污剂(参见以上)联合使用,如,与其它的酶(如,脂酶、蛋白酶、酯酶、磷酸酶)联合使用。例如,在应用PLC的任何场合中,都可以组合应用PLD和磷酸酶,以产生与PLC单独使用相同的结果。 
下表概述了本发明的若干示例性工艺和制剂: 
Figure G05814667620061109D001351
Figure G05814667620061109D001361
Figure G05814667620061109D001371
Figure G05814667620061109D001381
通过糖基化作用使酶的活性失活和调节酶的活性
本发明提供这样的方法,包括使用重组技术制备和表达具有生物活性的酶或其他蛋白,例如有害的或有毒的酶,(其中所述酶或其他蛋白正常情况下未糖基化)它们为无活性或活性较低但是可再活化的形式。该方法包括将一个或多个糖基化位点(例如N-连接的或O-连接的糖基化作用)加入到具有生物活性的酶或其他蛋白(例如本发明的酶)中,这是通过下述步骤进行的:对编码序列进行工程化以整合入新的糖基化位点(多个位点);在真核细胞或工程化的等同物中或在能够进行翻译后糖基化的体外系统中表达变体编码序列。例如,3个氨基酸的序列NXS/T是真核细胞中的糖基化位点,而原核细胞不是这样的。因此,本发明包括将至少一个三氨基酸序列NXS/T加入到蛋白中,以便它的活性因翻译后糖基化的缘故而减少或失活。 
糖基化作用可以导致产生加入到N残基的2个N-乙酰葡萄糖胺(NGlucNac)分子。随后的加入可以生物种特异性的。在大部分的种中,甘露糖(Mann)然后被 加入到NGlucNa上,Mann残基的数目从10至100。唾液酸在一些物种中也可以被加入。在毕赤酵母中,在加入NglucNac之后,10至25个Mann残基可以被添加。 
这些方法包括使用任何去糖基化酶或一组酶,它们中的许多酶可能已被鉴定和/或可以通过商业渠道获得。例如,内切糖苷酶H在最后一个NGlucNac处进行切割,留下一个NClucNac依然连接在N残基上。PNGaseF酶切割掉所有的糖,并将N残基的氨基侧链转化成羟基,从而使酶中的N氨基酸变成天冬氨酸(D)氨基酸。因此,所述方法包括体内或体外使用内切糖苷酶H和/或PNGaseF或等价的酶,从而部分或完全地再激活工程化的“临时失活的”蛋白。 
该方法包括将酶或其他多肽靶向至宿主分泌途径,以便所述酶被糖基化。设计新的糖基化位点,这样,糖基化作用使酶失活,或修饰它的活性,例如减少它的活性,或者以另外的方式修饰活性,诸如阻止底物结合位点。因为酶是失活的或是活性较低,这些酶的活性的负面影响不再限制蛋白在宿主细胞中的积聚,所以有害的或有毒的酶可以以更高的水平表达。通过移去糖,例如使用商业上可获得的去糖基化酶,例如通过使用全细胞工程化方法体外除去糖,或体内除去糖,失活的、糖基化的酶可以被重新活化(部分或完全)。 
在一个方面,将真核糖基化靶位点诸如NXS/T加入到任何蛋白,例如本发明的酶。这使本领域技术人员能够将糖基化位点加入到感兴趣的蛋白,并期望当通过将那个蛋白表达在真核宿主细胞中并将该蛋白靶向宿主细胞的分泌途径使得那个蛋白被糖基化时,将那个蛋白转化为临时失活的蛋白。 
因此,本发明提供了产生在正常情况下数量巨大时由于害处或毒性太大而不能被宿主细胞耐受的酶。该效果可以是临时性的,因为它可以重新产生活性酶(通过去糖基化作用,例如通过翻译后修饰/去糖基化作用),以用于需要活性酶的进一步的工作。 
在一个方面,本发明提供了制备和表达具有生物活性的蛋白的方法,该蛋白的活性通过糖基化作用而临时失活,该方法包括:(a)提供编码具有生物活性的蛋白的核酸,其中所述蛋白在天然情况下是非糖基化的;(b)将至少一个糖基化基序编码序列插入到编码蛋白的核酸中,其中糖基化形式的蛋白是无活性的;(c)将靶向序列插入蛋白,这样该蛋白被导向宿主细胞的分泌途径,其中所述宿主细胞能够识别糖基化基序并糖基化该蛋白;和(d)在宿主细胞中表达修饰的核酸。在一个方面,该方法进一步包括对表达的蛋白去糖基化,从而再次激活蛋白例如酶诸如本发明的酶的活性。在一个方面,宿主细胞是真核细胞。在一个方面,通过去糖基化作用,或者化学的方法或者酶促的方法,体外再次激活失活的表达的重组蛋白。 
确定一个或多个糖基化基序的设置以临时性地失活蛋白,仅仅涉及制备变体蛋白编码核酸的常规方法,例如通过GSSMTM,和常规筛选方案,例如活性或结合分析方法。 
由于糖基化作用的缘故,其活性对宿主细胞有害的酶被致失活。因为它是无活性的,所以它可以以高得多的水平积聚在真核宿主细胞中。因为它不再具有活性,所以它不再能够发挥其负面作用。有毒的酶的失活作用是临时性的,这是因为使用EndoH或PNGase F对该酶进行去糖基化作用能完全恢复酶的正常活性。大量糖基化的、失活的酶积聚在培养基中,这表明,宿主细胞完全耐受无活性形式的酶。 
本发明参照以下的实施例来进一步说明;然而,应当理解地是,本发明并不限于这些实施例。 
        实施例1:用于序列同一性作图的BLAST程序 
本实施例描述了示例性的序列同一性程序,用以确定核酸是否在本发明的范围内。应用NCBI BLAST 2.2.2程序,默认选择为blastp。除了默认过滤设置外,应用所有默认值(即,除了过滤设置为OFF(关)外,所有参数设置为默认);在该位置应用“-F F”设置,其使得不能进行过滤。由于序列长度短,应用默认过滤常常导致Karlin-Altschul歪曲(violation)。用于本实施例的默认值为: 
“低复杂度过滤(Filter for low complexity):开 
>字长(Word Size):3 
>矩阵(Matrix):Blosum 62 
>空位成本(Gap Costs):存在(Existence):11 
>延伸(Extension):1” 
其它的默认设置为:低复杂度过滤关闭,对于蛋白字长为3,BLOSUM62矩阵,空位存在罚分-11和空位延伸罚分-1。“-W”选项设定为默认值0。这意味着,如果不设定,字长默认值对于蛋白为3,对于核苷酸为11。设置读入: 
<<README.bls.txt>> 
>------------------------------------------------------------------------------ 
>blastall arguments: 
>-p Program Name[String] 
>-d Database[String] 
>default=nr 
>-i Query File[File In] 
>default=stdin 
>-e Expectation value(E)[Real] 
>default=10.0 
>-m alignment view options: 
>0=pairwise, 
>1=query-anchored showing identities, 
>2=query-anchored no identities, 
>3=flat query-anchored,show identities, 
>4=flat query-anchored,no identities, 
>5=query-anchored no identities and blunt ends, 
>6=flat query-anchored,no identilies and blunt ends, 
>7=XML Blast output, 
>8=tabular, 
>9 tabular with comment lines[Integer] 
>default=0 
>-o BLAST report Outout File[File Out]Optional 
>default=stdout 
>-F Filter query sequence(DUST with blastn,SEG with others)[String] 
>default=T 
>-G Cost to open a gap(zero invokes default behavior)[Integer] 
>default=0 
>-E Cost to extend a gap(zero invokes default behavior)[Integer] 
>default=0 
>-X X dropoff value for gapped alignment(in bits)(zero invokes default 
>behavior)[Integer] 
>default=0 
>-I Show GI′s in deflines[T/F] 
>default=F 
>-q Penalty for a nucleotide mismatch(blastn only)[Integer] 
>default=-3 
>-r Reward for a nucleotide match(blastu only)[Integer] 
>default=1 
>-v Number of database sequences to show one-line descriptions for(V) 
>[Integer] 
>default=500 
>-b Number of database sequence to show alignments for(B)[Integer] 
>default=250 
>-f Threshold for extending hits,default if zero[Integer] 
>default=0 
>-g Perform gapped alignment(not available with tblastx)[T/F] 
>default=T 
>-Q Query Genetic code to use[Integer] 
>default=1 
>-D DB Genetic code(for tblast[nx]only)[Integer] 
>default=1 
>-a Number of processors to use[Integer] 
>default=1 
>-O SeqAlign file[File Out]Optional 
>-J Believe the query defline[T/F] 
>default=F 
>-M Matrix[String] 
>default=BLOSUM62 
>-W Word size,default if zero[Integer] 
>default=0 
>-z Effective length of the database(use zero for the real size) 
>[String] 
>default=0 
>-K Number of best hits from a region to keep(off by default,if used a 
>value of 100 is recommended)[Integer] 
>default=0 
>-P 0 for multiple hits 1-pass,1 for single hit 1-pass,2 for 2-pass 
>[Integer] 
>default=0 
>-Y Effective length of the search space(use zero for the real size) 
>[Real] 
>default=0 
>-S Query strands to search against database(for blast[nx],and 
>tblastx).3is both,1is top,2is bottom[Integer] 
>default=3 
>-T Produce HTML output[T/F] 
>default=F 
>-1 Restrict search of database to list of GI′s[String]Optional 
>-U Use lower case filtering of FASTA sequence[T/F]Optional 
>default=F 
>-y Dropoff(X)for blast extensions in bits(0.0invokes default 
>behavior)[Real] 
>default=0.0 
>-Z X dropoff value for final gapped aligmnent(in bits)[Integer] 
>default=0 
>-R PSI-TBLASTN checkpoint file[File In]Optional 
>n MegaBlast search[T/F] 
>default=F 
>-L Location on query sequence[String]Optional 
>-A Multiple Hits window size(zero for single hit algorithm)[Integer] 
>default=40 
实施例2:PLC介导的脱胶的模拟 
该实施例描述了磷脂酶C(PLC)介导脱胶的模拟。 
由于在水中磷脂酰胆碱(PC)的溶解性差,起初将磷脂酰胆碱溶解于乙醇中(100mg/ml)。对于初步测试,制备了PC的储存溶液,是在pH 6的50mM的3-吗啉基丙磺酸或60mM柠檬酸/NaOH中。,将PC储液(10μl,1μg/μl)加入到Eppendorf管中的500μl精炼的大豆油(含2%的水)中。为了产生乳状液,将管中的内容物通过涡流振荡混合3分钟(参见图5A)。油和水相通过在13,000rpm离心1分钟来分离(图5B)。反应管在所需的温度下(37℃、50℃或60℃)进行预温育,并且加入3μl来自蜡状芽孢杆菌(Bacillus cereus)的PLC(0.9U/μl)至水相(图5C)。通过用氯仿/甲醇/水(65∶25∶4)作为溶剂系统的TLC对PC的消失进行分析(参见如Taguchi(1975),见上文),并且在暴露于碘蒸汽后可以被观察到。 
图5示意性地说明了用于模拟PLC-介导的脱胶的两相系统模型。图5A:通过混合粗制油与2%的水,来水合污染的磷脂(P),产生乳状液。图5B:离心后分离水相和油相,并将PLC加入到水相中,其含有沉淀的磷脂(“胶”)。在水相中发生了PLC的水解。图5C:通过从水相中抽取等分试样并用TLC对它们进行分析,监控反应的时间进程。 
实施例3:磷脂酶的表达 
该实施例描述了构建可以表达多种磷脂酶(包括本发明的酶)的本发明的商业生产菌株。为了产生适合用于对食品级植物油(包括大豆、芥花和向日葵)脱胶的多酶制剂,可以产生在同一表达宿主中表达两种不同磷脂酶序列的重组表达菌株。例如,可以构建该菌株以含有一个或多个拷贝的PLC基因,和一个或多个拷贝的磷脂酰肌醇-PLC基因。这些基因可以存在于一个质粒、多个质粒上,或者这些基因可以通过同源重组被插入到表达宿主的基因组中。当这些基因通过同源重组导入时,它们可以作为DNA表达盒导入宿主基因组中的单个位点中,所述表达盒含有一个或多个拷贝的两个基因。可选择地,每个基因的一个或多个拷贝可以导入宿主染色体中的不同位点。这两个基因序列的表达可以由一种类型的启动子驱动,或者每一基因序列可以由独立的启动子驱动。根据每一基因的拷贝数和 启动子的类型,最终的菌株将表达变化比例的每一活性酶类型。表达菌株可以用任何的杆菌(例如蜡状芽孢杆菌)或链霉菌、大肠杆菌、粟酒裂殖酵母、巴斯德毕赤酵母或者其它革兰氏阴性、革兰氏阳性或酵母表达系统来构建。 
在一个方面,本发明提供了对大豆油进行脱胶的双酶系统,其中至少一种酶是本发明的酶。PLC加上PI-PLC比单独使用其中一种酶产生更多的DAG。然而,两种酶都比无酶对照样品产生更多的DAG。在一个方面,反应条件包括1毫升大豆油、在任何添加之前油中初始水分含量~0.4%、50℃、用2.75M NaOH中和的0.2%柠檬酸、10U PLC、15μL PI-PLC(0.45mg总蛋白),1小时总反应时间。图12所示的表概述了从本发明的该双酶脱胶系统获得的数据。 
在另一方面,本发明的PI-PLC酶可以在与PLC中所述相同的条件下使用。这些条件包括植物油的化学精炼和植物油的水脱胶。 
实施例4:具有提高的表达水平和改变的蛋白酶抗性的磷脂酶 
本发明提供了挑选磷脂酶C变体(突变体)的方法,该磷脂酶C在糖基化宿主中具有提高的表达水平并对其所分泌的蛋白酶具有改变的抗性。 
在糖基化宿主中提高的表达水平
潜在的天冬酰胺-连接的糖基化位点具有氨基酸共有序列—天冬酰胺-任何氨基酸-丝氨酸或苏氨酸(在单字母氨基酸代码中为NXS/T),用诱变方法将其敲除,以便将糖基化识别基序中的天冬酰胺或丝氨酸或苏氨酸改变成不同的氨基酸,因此序列不再编码潜在的糖基化位点。糖基化位点的去除在下述位置实现:本发明的磷脂酶C的氨基酸位置氨基酸63,氨基酸131,和氨基酸134,该磷脂酶C具有如SEQ ID NO:2中所阐述的序列,例如由SEQ ID NO:1来编码。当该蛋白在酵母—巴斯德毕赤酵母中异源表达时,其糖基化位点的消除提高这种变体—活性磷脂酶C(PLC,SEQ ID NO:2)的表达水平。这种减少或消除PLC酶中的潜在糖基化位点的策略可以提高活性PLC在任何糖基化宿主中的表达水平。因此,本发明提供了具有任何本发明的示例性磷脂酶的序列的磷脂酶(和编码它们的核酸),其中一个或多个或所有糖基化位点已被改变,如上所述。因此,本发明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方法,其中该方法包括修饰本发明的磷脂酶编码序列,以便一个、若干个或所有N-连接糖基化位点编码基序被修饰成非糖基化基序。本发明也提供了由该方法制备的磷脂酶编码序列,和它们所编码的酶。 
改变的蛋白酶抗性
本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有增加的抗性的磷脂酶,该方法包括将等同于SEQ ID NO:2的位置131上的氨基酸 修改成下述的一个、若干个或所有残基:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);甲硫氨酸(M);亮氨酸(L),包括具有这些示例性修改的SEQ ID NO:2的变体(和编码它们的核酸)。本发明也提供了由该方法制备的序列所编码的分离的、合成的或重组的磷脂酶。本发明也提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有减少的抗性的磷脂酶,该方法包括将等同于SEQ ID NO:2的位置131上的氨基酸修改成下述的一个、若干个或所有残基:色氨酸(W);谷氨酸(E);酪氨酸(Y),包括具有这些示例性修改的SEQ ID NO:2的变体(和编码它们的核酸)。本发明也提供了由该方法制备的序列所编码的分离的、合成的或重组的磷脂酶。 
将含有天然分泌的巴斯德毕赤酵母蛋白酶的混合物的上清液与野生型和突变型PLC酶制剂混合并温育。终止反应,与无蛋白酶阴性对照相比,通过SDS-PAGE,显现降解结果。通过测量残留PLC活性也可以测定降解结果。通过观察发现了新奇现象,即某些敲除糖基化作用的突变显著改变该表达的磷脂酶在发酵期间对降解的敏感性。该方法的优势是在生产期间直接选择对宿主生物分泌的蛋白酶具有增加的或减少的抗性的突变体。 
本发明的这种方法可以使用定点诱变(例如GSSMTM)来改变本发明的磷脂酶C的氨基酸序列,例如如下所示,SEQ ID NO:1编码的SEQ ID NO:2的子序列。将红色标出的每一氨基酸(下面)由天冬酰胺(单字母代码中为N)改变为天冬氨酸(D)、丝氨酸(S)或另一氨基酸,如下所述。这些氨基酸被命名为下面序列中的氨基酸63、氨基酸131和氨基酸134,其中色氨酸(W)命名为氨基酸1。进行这些突变,以通过减少在巴斯德毕赤酵母表达系统中表达的蛋白的糖基化作用来增加活性磷脂酶C蛋白(SEQ ID NO:176)的表达水平。这些相同的突变可以增加本发明的任何活性磷脂酶C在任何其他表达系统中的表达水平,所述表达系统根据NXS/T系统对天冬酰胺进行糖基化(N-连接的糖基化),其中N是天冬酰胺,X是任何氨基酸,S/T是丝氨酸或苏氨酸。因此,本发明也提供了通过改变位置131处的氨基酸来改变表达的磷脂酶C的敏感性的方法。 
SEQ ID NO:2的氨基酸38-282,包括三个特定修饰,该全长磷脂酶C蛋白序列氨基酸序列为SEQ ID NO:175。注意:为了计算变化的位置,将第一个氨基酸(W)计为位置1。WSAEDKHNEGINSHLWIVNRAIDIMSRNTTIVNPNETALLNEWRADLENGIYSA DYENPYYDDSTYASHFYDPDTGTTYIPFAKHAKETGAKYFNLAGQAYQNQDM QQAFFYLGLSLHYLGDVNQPMHAASFTDLSYPMGFHSKYENFVDTIKNNYIVS DSNGYWNWKGANPEDWIEGAAVAAKQDYPGVVNDTTKDWFVKAAVSQEYA DKWRAEVTPVTGKRLMEAQRVTAGYIHLWFDTYVNR- 如下面所述,将表达的磷脂酶C变体在存在巴斯德毕赤酵母蛋白酶的情况下温育,获得以下结果: 
在SEQ ID NO:2的氨基酸位置131的以下氨基酸增加了表达的磷脂酶C对巴斯德毕赤酵母蛋白酶降解作用的抗性:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);甲硫氨酸(M);亮氨酸(L)。在SEQ ID NO:2的氨基酸位置131的以下氨基酸减少了表达的磷脂酶C对巴斯德毕赤酵母蛋白酶降解作用的抗性:色氨酸(W);谷氨酸(E);酪氨酸(Y)。因此,本发明提供了变体磷脂酶,其具有任何其中之一或若干或所有这些修饰,这取决于是否需要增加或减少表达的磷脂酶C对蛋白酶降解作用的抗性。本发明提供了在等同于SEQ ID NO:2的位置131上具有任何其中之一或若干或所有这些修饰的变体磷脂酶。该残基等同于SEQ ID NO:2的位置131,并且对任何特定氨基酸残基的修饰是否可以增加或减少该酶对蛋白酶降解作用的抗性,可以通过本领域熟知的方案常规地和预测性地确定,例如用于评价磷脂酶C(SEQ ID NO:2,由SEQ ID NO:1编码)的蛋白酶敏感性的示例性分析方法,如下所述: 
缓冲液: 
。1.0M MES,pH 6.2 
。0.7M醋酸钠(“NaAc”),pH 5.2 
测试:
。使用独立的1.5mL微量离心管 
。向25μL PLC酶样品,加入5μL NaAc或7μL MES缓冲液,并混合 
。加入25μL含蛋白酶的巴斯德毕赤酵母上清液,并混合 
。加入2μL 5%叠氮化钠,并混合 
。在加湿温育器中,将管置于盛有水的预热烧杯中的悬浮架上 
。对照包括PLC+缓冲液+dH2O,和毕赤酵母SN+缓冲液+dH2
。温育0-24小时,如果需要,在多个时间点取样。 
检测 
。将样品按1∶2与含5mMEDTA的样品缓冲液混合,100℃加热4分钟,冷却,离心,混合,每泳道加载5μL样品,考马斯(Coomassie)染色,在SDS-PAGE上显现结果。 
。也可以直接采取样品和时间点进行标准PLC活性分析。 
结果:
SDS-PAGE跑胶,结果显示在图17中;其显示了体外消化试验的结果,其中磷脂酶C变体在粗蛋白酶提取物中37℃温育最高达22小时。根据序列“DXD”(氨基酸位置63的天冬氨酸-氨基酸位置131的任何氨基酸-氨基酸位置134的天冬氨 酸)的“X”位置发现的氨基酸,命名每一PLC突变体。这些凝胶显示了用粗蛋白酶温育后,表达的PLC变体蛋白的稳定性或敏感性。稳定的变体在″-″(无蛋白酶反应的对照)和″+″(反应含有蛋白酶)泳道中显示出具有相似染色强度的PLC带。与″-″泳道相比,在″=″泳道中,对蛋白酶更敏感的变体将显示出PLC蛋白带染色强度的减少。 
实施例5:获得稳定的高水平表达PLC的方法 
本发明提供了在酵母培养物例如巴斯德毕赤酵母培养物中获得具有稳定的高水平表达和高比活性的磷脂酶例如PLC的发酵工艺。由该方法生产的酶可以用于例如植物油精炼,诸如大豆、芥花、向日葵或其他油。 
本发明提供了生产工艺,该工艺具有这样的特征,即能够在酵母细胞培养物,例如巴斯德毕赤酵母,如在分批喂料培养物中以g/l水平,生产活性磷脂酶,例如PLC。在微生物培养物中活性PLC蛋白的异源表达仅以mg/l的水平在文献中偶有描述。此外,本发明的工艺是基于这样的发现,在毕赤酵母培养物中PLC蛋白的表达削弱了对MeOH的吸收能力,但是无其它研究过的生理生长特征。与毕赤酵母培养物中常规的异源蛋白表达相反,需要高水平的共-喂料比率(highco-feed rates)(葡萄糖/或甘油)。除提高酶的生产特征外,较高水平的共-喂料比率也消除了普通蛋白酶活性的表达,该蛋白酶活性与PLC降解相关。此外,通过在具有Mut+表型的毕赤酵母菌株中产生PLC而不损害与Mut+表型相关(并且因此,不以工业级使用)的可测量测试,可以克服较差的MeOH利用率特征,从而进一步提高产生特征。因此,相比于通常用于工业规模的毕赤酵母系统的条件,本发明的该工艺将活性PLC的生产率提高>50-倍(从使用常规方法的100U/ml提高至>5000U/ml全肉汤;>5g/l蛋白)。此外,因为PLC是需要结合锌以获得正确的折叠和活性的金属酶,在一个方面,本发明包括补充锌。对本发明的培养物而言,该锌补充策略使得PLC活性如同全肉汤培养物中一样,几乎完全稳定(<5%的活性丧失),例如在4℃下,>5天。这明显有助于回收工艺,因为1)不稳定蛋白活性的产生在回收工艺期间继续恶化,和2)其赋予了更大的工艺灵活性,特别是以大规模水平。 
色氨酰基氨肽酶微量培养板分析 
本发明提供了色氨酰基氨肽酶微量培养板分析方法,其被开发用于测定毕赤酵母发酵各时间点样品中的相对色氨酰基氨肽酶活性。该分析的通量能力足以满足从大量发酵反应中的多个时间点进行取样。 
材料与方法
缓冲液: 
·15mMNaPO4,2mM MnCl2,pH 7.5,aq. 
底物 
·HTrp-AMC(Bachem,I1670) 
底物溶液: 
·将底物溶于10mM甲醇中 
·将100μL 10mM底物加入6mL缓冲液中 
样品: 
·毕赤酵母发酵各时间点的样品 
·离心除去细胞。 
微量培养板制备: 
·就每一份样品复制品、空白和参考,给空96孔板(black 96-well)每孔等分加入90μl的底物溶液, 
·将微量培养板置于荧光微量培养板阅读台上(例如SpectraMax,MolecularDynamics) 
样品的添加和反应动力学: 
·设置荧光微量培养板阅读器: 
。Ex.350nm/Em.460nm;自动切断(455nm);PMT中等;每孔3次阅读;自动校准“开” 
。RT(室温) 
。0-30分钟时程;每30秒阅读一次 
。在第一次阅读之前,初始化设备板的混合功能,混合5秒 
·将样品按96-孔形式等分,并用多通道移液器以每孔10μL转移样品 
·取下盖子,重新将微量培养板放置在微量培养板阅读器中 
·开始读数 
根据未知样品的固有活性,可以改变样品稀释度,分析持续时间和动力学取样,以及可以用常规筛选方法测定的所有变量。 
底物已经显示出在这些条件下非常稳定,阴性对照空白显示出其吸光率没有随时间变化而增加。 
Bodipy BSA蛋白酶微量培养板分析 
本发明提供了Bodipy BSA蛋白酶微量培养板分析方法,以帮助测定毕赤酵母发酵各时间点样品中的总蛋白酶活性。该分析的通量能力足以满足从大量发酵反应中进行多时间点取样。 
材料与方法
底物: 
·DQ BSA green(Molecular Probes,D 12050) 
底物溶液: 
·将一瓶底物(1mg)中的内含物溶于1mL含有0.1%叠氮化钠的水中 
样品: 
·毕赤酵母发酵各时间点的样品 
·离心除去细胞。 
阳性对照: 
·0.2mg/mL枯草杆菌蛋白酶(Sigma,P5380),于50mM NaPO4,pH 7.5中 
·在水中连续稀释 
微量培养板制备: 
·就每一样品复制品、空白和参考,等分地给空96-孔板(black 96-well)的每孔中加入90μl的底物溶液 
样品的添加和反应 
·按96-孔的形式等分样品,并使用多通道移液器以每孔10μL转移样品 
·替换微量培养板的盖子,用箔包裹,在37℃置于加湿温育器中,温育3-4小时或过夜 
荧光测量: 
·设置荧光微量培养板阅读器: 
。Ex.495nm/Em.525nm;自动切断(515nm);PMT低;每孔3次阅读;自动校准“开” 
。RT 
选择Bodipy BSA作为通用蛋白酶底物。缺少对bodipy BSA的水解并不表明不存在蛋白酶,但是已经显示其与PLC酶的水解和PLC活性的丧失相关。已经证明,BSA可以用bodipy卵清蛋白或酪蛋白替代。 
在一个方面,在整个发酵时程内表征蛋白酶活性是有用的,这是因为该活性可以是临时性的和瞬时的。 
底物已经显示出在这些条件下非常稳定,阴性对照空白显示出其吸光率没有随时间变化而增加。 
在全培养肉汤或上清液中PLC活性的测量: 
本发明提供了在全培养肉汤或上清液中进行的PLC活性测量分析方法;该分析方法是对Edward A.Dennis(1973)Kinetic dependence of phospholipase A2 activity on the detergent Triton X-100.J.Lipid Res.14:152-159,USP 24/NF 19,Pancrealipase-Assay for lipase activity.第1256-1257页中描述的方法的修改。本发明的PLC活性测量分析方法包括: 
溶液:
100mM硫酸锌溶液 
100mM氯化钙溶液 
底物溶液(20mM磷脂酰胆碱,40mM Triton X-100,5mM氯化钙) 
稀释缓冲液(0.1%Triton X-100,1mM硫酸锌,1%阿拉伯树胶) 
分析程序:
-用稀释缓冲液(1.0%阿拉伯树胶,1.0%Triton X-100,1mM硫酸锌)制备待分析样品的稀释液。在分析前用冰冷的缓冲液现制备稀释液,并保藏在冰浴中,直到使用。 
-将20mL的底物溶液转移入约50mL容量的带夹套的玻璃管,该玻璃管的外室与恒温控制的水浴相连。覆盖混合物,并用机械搅拌装置持续搅拌。将混合物的温度维持在37±0.1℃,从通过盖子上的孔插入的微量滴定管,用0.01N KOH VS预滴定底物,将pH调节至7.3。加入50μL的酶稀释液,然后自动持续添加0.01NKOH VS6分钟,将pH维持在7。 
此外,对发酵罐培养物进行标准的PAGE凝胶电泳,Western和Northern印迹分析以及以在线/离线获得发酵参数(生物量水平、气体分析等)的标准分析技术。 
产生Mut+表型毕赤酵母菌株 
本发明提供了细胞,细胞系统,和表达磷脂酶C的方法,该方法包括使用具有Mut+表型的毕赤酵母菌株。该方法包括将编码异源PLC的核酸插入毕赤酵母菌株中。然后在表达PLC的条件下培养该细胞。该方法可以进一步为所述培养条件补充锌。 
在一个方面,这些方法,细胞和细胞系统使用SEQ ID NO:2,其是需要锌的金属酶。在一个方面,它以3摩尔(复数)/摩尔的量使用。它的MW近似28kDa,pI近似5.2,并具有宽的底物耐受性:PC>PE>PS>>PI。未加工的酶具有24个氨基酸的信号序列,13个氨基酸的前序列,和245个氨基酸残基的“成熟”酶。 
在一个方面,本发明的Mut+毕赤酵母菌株具有两个拷贝的醇氧化酶(AOX)基因,AOX1和AOX2,在转化期间受到影响(“Mut”代表“甲醇利用率(MethanolUtilization)”),如下所述: 
·Mut+
·单交换事件,AOX1和AOX2基因完整 
·单独依靠甲醇生长和表达。可能共喂料 
·Muts
·双交换事件,破坏AOX1基因 
·共喂料提高生长和表达 
·Mut-
·重组事件破坏AOX1和AOX2基因 
·不能代谢甲醇,需要共喂料 
总之:Mut-<Muts plc<Muts/Mut+ plc<Mut+
在Mut+和Muts之间存在发酵差异,包括: 
·甲醇的最佳诱导浓度 
·氧消耗率 
·由于更快的吸收能力,依靠甲醇,Mut+生长比Muts快 
·诱导之后,容易度过过渡期 
·Mut+不用于大规模表达 
·通风/冷却能力,MeOH敏感性 
巴斯德毕赤酵母的甲醇利用途经是本领域所熟知的。醇氧化酶(AOX)将甲醇催化转变为甲醛;因此,如果AOX被过量表达,导致“腌渍的”酵母细胞。 
在本发明的一个方面,使用巴斯德毕赤酵母的示例性发酵方案,包括: 
·种子培养(瓶或桶)
·在丰富培养基中进行分批发酵,以增加生物量 
·分批发酵罐培养
·分批阶段(甘油) 
·随着初始碳源被消耗,生物量增长 
·葡萄糖或甘油喂料阶段 
·由D.O.含量引发喂料添加,或线性/指数喂料 
·增长至足够的生物量,以进行诱导和表达(无乙醇,C-受限的) 
·甲醇诱导 
·喂料是受调控的(D.O.%,MeOH传感器,RQ),或者预先设置的喂料方案 
·与葡萄糖或甘油共喂料,取决于表型和表达参数 
·Mut+诱导,以1-3g/L MeOH 
·Muts诱导,以4-7g/LMeOH 
图18示出了分批发酵罐培养的结果,如上所述,仅使用甘油。蛋白酶活性来自毕赤酵母中的内源性蛋白酶。分批发酵可以是丰富培养基,以增加生物量。如在图18中所示,在约69小时开始的蛋白酶活性的逐步增加对应于PLC活性的逐步减少。较高的甘油(glyc)共喂料速率提高了活性PLC的表达,减少(消除)了蛋白酶的产生,如下面数据概括表所示: 
  共喂料  速度   (ml/min)   诱导之前  /之后的   碳源   诱导  OD   PLC活性   (U/ml  sup)   消耗的  MeOH(L)   Bodipy蛋  白酶   最终OD
  0.5  1.5  2  2.5  3   Glyc/Glyc  Glyc/Glyc  Glyc/Glyc  Glyc/Glyc  Glyc/Glyc     250-300   100  1100  1550  1550  1715   1  1.7  1.3  1.4  1.4   是  否  否  否  否   450  680  860  900  820
这些研究在30-L BB发酵罐中、以DSD-PLC进行。测量0UR或Vol.氧吸收率(Vol.Oxygen Uptake Rate“OUR”),作为良好表达的‘总培养物健康’指标,或‘生物标记(Boomarker)’。图19示出了该研究的结果,产生DSD-PLC的巴斯德毕赤酵母MutS 30L培养物的OUR曲线比较结果,使用1700U/ml、1100U/ml和100U/ml的PLC,温度为30℃,甘油共喂料,如上所述。 
图20示出了产生DSD-PLC,pH 6.2(1100U/ml和100U/ml PLC),或异源蛋白的巴斯德毕赤酵母MutS 30L培养物的甲醇消耗曲线比较结果,以甘油共喂料,如上所述。这是需求-驱动型(demand-driven)MeOH喂料,残余MeOH水平控制在4g/l。 
此外,Mut+表型提高活性PLC表达水平,并增强MeOH吸收,如该数据表格所概括的: 
  Mut   共喂料  速度   (ml/min)   诱导   OD   PLC活性   (U/mlsup)   消耗的  MeOH   (L)   Bodipy   蛋白酶   最终OD
    S   0.5  1.5  2  2.5  3   250-300   100  1100  1550  1550  1715   1  1.7  1.3  1.4  1.4   是  否  否  否  否   450  680  860  900  820
[0908] 
     +   0.5  0.5  1  1  1  1.5  1.5  1.5  2      250-300   1001  1200  1786  2010  1768  2669  2693  2597  2154   5.6  7  5.9  6.8  7.9  10  7.1  8.1  8.3   是  否  否  否  否  否  否  否  否   871  908  988  930  700  701  818  804  752
PLC似乎不影响该Mut+表型菌株的生理生长特征,该菌株以6×拷贝数表达重组PLC SEQ ID NO:2,数据在图21中示出,OUR图如附图说明中所阐述。只是供应-驱动型(supply-driven)MeOH喂料,在Mut+培养物中无残留的葡萄糖或MeOH。 
此外,产生的PLC蛋白的质量是可变的,具有不可预测性,例如<<或>>50%的总PLC蛋白具有活性,如图22中的SDS-PAGE结果所代表性示出。该OUR图(如上所论述)数据图解概述被插入到SDS-PAGE示图的上面部分。对照命名为JG=0.5μl 1.6mg ml-1。与蛋白酶或氨肽酶活性没有相关性。显著数量的活性PLC位于细胞内,如图23所示(也显示了研究的方案),其中在细胞内检测到>700U/mlPLC(在图23中,PLC(SEQ ID NO:2)+α信号肽(来自酿酒酵母属)+糖基化作用)。形态学变化与活性PLC的浓度相关,如图24中所示。形态学变化的大小依赖于菌株和碳源。 
增加的Zn并没有促进具有2×拷贝数的Mut+SEQ ID NO:2的毕赤酵母的表达,所述Mut+SEQ ID NO:2具有DSD突变,如在下面数据表格中所概述的(超过1×的是通过共喂料来供应)(首先,上面一行是空载体对照)。增加的Zn确实提高了作为全肉汤的保藏稳定性(在4℃,>100h后,具有相类的活性水平),和总工艺的稳健性。 
Figure G05814667620061109D001531
图25用图表概述的数据显示了在95h TFT(total fermentation time(总发酵时间))时,毕赤酵母中PLC生产性能的状态。在图表右边的5条柱显示了从“Zeo菌株”得到的结果,或生产PLC的巴斯德毕赤酵母菌株的Zeocin适应性。该菌株是抗生素-抗性的、无标记菌株,在巴斯德毕赤酵母中表达作为异源基因的本发明PLC(SEQ ID NO:2)。已经证明,通过用抗生素zeocin来使菌株适应,人们可以获得新的稳定菌株,该菌株具有极大提高的感兴趣蛋白的表达水平。 
将原始的抗生素-抗性无标记菌株,菌株#1(含有SEQ ID NO:2)按照一系列稀释步骤进行培养,每一次增加抗生素zeocin的浓度。在每一步骤,将前面步骤的一部分培养物用新鲜培养基稀释至在600nm的光密度(OD600)为1.0,并将增加数量的zeocin加入到新的培养基中,再生长24小时。在最后阶段,使用200ug/ml的zeocin浓度,将最终培养物划线接种到MD/YPD板上,以使单菌落生长。结果发现,来自最终阶段培养物的菌落显示出对zeocin高度耐受性,而亲代菌株则显示出非常低的耐受性。其中一个菌落,菌株#2(含有SEQ ID NO:2)相比起原始PLC菌株,菌株#1,显示出显著提高的(约70%以上)PLC表达水平。同样证明了,在传代40代之后,菌株#2在zeocin耐受性和PLC表达上都是稳定的,这表明新菌株获得“永久性的”高PLC表达和zeocin耐受性的性状。 
通过使用本发明的“Zeo菌株”(Zeocin毕赤酵母适应型)获得高水平的PLC活性:4100u/ml,在小罐(mini-tanks)中。该结果来自包含6×DSD SEQ ID NO:2的毕赤酵母菌株。简而言之,该SEQ ID NO:2表达菌株通过在一系列的步骤中进行培养而“适应”,每一步骤都使用增加的zeocin浓度。明显地,该适应方法迫使菌株/构建物发生一些变化(在分子或遗传水平上),并使PLC活性水平显著提高。 
示例性的结果是: 
·罐1、2和4(每一个代表不同的菌落)的表现都超出原始预适应的SEQ ID NO:2-表达菌株,罐1和4都达到4100u/ml,罐2达到3500u/ml。 
·罐1和4早在75hrs时就达到3000u/ml以上,这表示:比原始预适应的SEQ IDNO:2-表达菌株(其在此时通常远低于2000u/ml)具有更快的活性积聚水平。 
实验设计和结果的详细内容是: 
zeocin适应的基本原理: 
有关PLC表达的早期工作是在毕赤酵母pPICZa载体中完成的,该载体含有zeocin-抗性标记。zeocin因此被用于转化选择。后来,我们转换到AMR-较少形式的构建物(AMR-less version construct)以开发商业候选产品。当进行小罐发酵时,我们观察到使用AMR-less构建物获得PLC活性水平显著下降:在pPICZa-DSD构建物中,上清液活性达到4000u/ml,而在2×DSD中仅获得ca.2000u/ml。使用 AMR-less构建物,也观察到明显的生理差异,例如较低的甲醇消耗率和更多的细胞裂解,特别是当使用同样的发酵方案测试较高拷贝数的(5×、6×)构建物时。 
pPIZa构建物和AMR-less构建物之间的明显差异之一是在转化过程中zeocin的使用,问题是细胞有可能依靠什么来度过zeocin选择。本发明提供了在zeocin存在下培养AMR-less构建物的方法,然后使细胞经受某些有利于PLC表达的变化。 
2×DSD的Zeocin适应实验: 
实验首先用2×DSD(因为此时它是转移分子)进行。该研究以1ug/ml的zeocin浓度(″zeo 1″)开始,使培养物生长~24hrs。从那时起,进行各步骤,将zeocin浓度增加至zeo 5、zeo 10、zeo 15、zeo 20、zeo 40、zeo 60、zeo 80、zeo 100,最后增加至zeo 200(zeo 100通常用于转化选择)。每一步骤都使用新鲜的培养基,并将前一阶段的培养物用于接种下一阶段的培养物,OD值为1.0,生长~24hrs。将每一阶段的培养物划线接种于YPD板,用于保藏以及获得单菌落。 
zeo-适应菌落的小罐发酵结果: 
为了检测zeocin适应的效果,从zeo 200和zeo 100培养物(其被划线接种于YPD板)挑选12个菌落,并用小罐筛选。结果总结在幻灯片(slide)6中。我们能够发现若干菌落的表现明显超出原始构建物(含SEQ ID NO:2的毕赤酵母菌株)。其中,来自zeo 200培养物的菌落#5显示PLC活性水平提高约50%。对筛选的观察如下: 
·zeo-适应的培养物和原始的SEQ ID NO:2-表达菌株之间的生长曲线没有明显的差异。 
·尽管已适应的培养物的稳定性没有被广泛测试,它们还是在无zeocin存在的YPD和/或MD板上被重新划线接种了若干次。所有发酵过程也是在无zeocin存在下进行的。 
·菌落与菌落之间有明显的变化,无论是生长上的还是PLC表达上的。 
·有关发酵的一些技术问题可能部分地是这些变化所致。 
在6×DSD上进行Zeocin适应试验 
受来自zeo-适应2×DSD的结果的鼓舞,我们随后对6×DSD(此时测定得知其优于2×DSD)进行了同样的试验。我们以zeocin浓度5ug/ml(″zeo 5″)开始,并使培养物生长~24小时。从那时起,进行各个步骤,将zeocin浓度增加至zeo 15、zeo 30、zeo 50、zeo 100,最终至zeo 200。与2×DSD相同,每一步骤都使用新鲜的培养基,并将前一阶段的培养物用于接种下一阶段的培养物,OD值为1.0,生长~24hrs。将每一阶段的培养物划线接种于YPD板,用于保藏以及获得单菌落。 
zeo-适应的6×DSD菌落的小罐发酵结果 
挑选来自zeo 200培养物(其被划线接种于MD板)的六个菌落,并与小罐中的原始SEQ ID NO:2-表达菌株一起测试。关键的观察结果如下: 
·所有三个菌落(罐1、2和4)的表现都超出原始SEQ ID NO:2-表达菌株,罐1和4都达到4100u/ml,罐2达到3500u/ml。 
·罐1和4早在75hrs时就达到3000u/ml以上,这表示与SEQ ID NO:2-表达菌株(其在此时通常远低于2000u/ml)相比,具有更快的活性积聚水平。 
·相比起在10-L罐中进行的3000u/ml,在罐1、2和4中的PLC表达水平也似乎是较高(参见幻灯片4)。因此不清楚是否表观比活性在罐1、2和4中较高,即,是否所产生的PLC不同于原始SEQ ID NO:2-表达菌株。 
·对照,罐7和8此时未达到3000u/ml。不清楚是否罐1、2和4能达到更高的水平。应注意,百分比的增加(35%,4100u/ml对3000u/ml)是小于2×适应的培养物。 
·图26给出了对来自6×DSD zeocin-适应的菌落表达筛选的概述。原始菌株最高的活性水平为~3000u/ml(小罐和10-L);zeocin-适应的6×DSD的活性水平为4100u/ml(增加~35%)。图27的数据显示,相比起在10-L罐(和罐条件)中的3000u/ml,罐1、2和4中的PLC蛋白水平较高,如上所述(凝胶载量是1.0ul的5×稀释肉汤,0.2ul的全肉汤)。图28显示了zeo-适应的菌落与对照的生长比较。相比起原始SEQ ID NO:2-表达菌株,Zeocin-适应的6×DSD菌落(6×DSD)具有相似的生长曲线。 
在C-限制的好氧酵母培养物中,分泌蛋白的Qp,在μ=0.10h-1下,一般为0.5-2.5mg/g.h-1。基于400mg/g DW的蛋白含量,“代谢载荷(metabolic burden)”小于总蛋白生产率的10%。在整个发酵期间,PLC mRNA水平保持在高水平上,这与表达并不相关。基于5g/l(150g)PLC蛋白,少于总5mol C/h的0.1mol C/h(总C的~2%被消耗)成为PLC中的碳,~25%成为生物量。在这些生产条件下,PLC活性似乎没有影响一般的生长生理特征(除MeOH利用能力受影响外)。 
总之,本发明提供了zeocin-抗性酵母细胞系统,诸如酵母细胞,细胞系和/或单细胞,用于表达由下述方法制备的异源蛋白(例如酶,诸如PLC),该方法包括下述步骤:提供包含能够表达异源蛋白的异源核酸(例如,包含酶编码序列的载体;可操作性连接到启动子的ORF)的毕赤酵母某种(例如巴斯德毕赤酵母)的细胞;将细胞(许多细胞)培养在包含起始浓度(该浓度足够低以便一些细胞存活,而足够高以选择抗生素抗性细胞)的zeocin的条件下;选择对起始浓度的zeocin具有抗性的细胞,并重新培养在包含较高浓度的zeocin的条件下;选择对较高浓度 的zeocin具有抗性的细胞。本发明也提供了该方法制备的酵母细胞,细胞系和/或单细胞。常规的筛选方法能够确定使用什么起始浓度的抗生素,需要或期望多少轮的选择,和如何快速增加各轮选择之间的抗生素浓度。 
实施例6:热稳定性PLC 
本发明提供了热稳定性磷脂酶。具有SEQ ID NO:2中所阐明的序列的示例性酶的热稳定性得到了证明。使用SEQ ID NO:2证明了本发明可比较的磷脂的热稳定性。在两个不同的系统中测试了SEQ ID NO:2的活性:水中和在油中。在含水系统中,替代底物(p-nppc)用于测量活性;该酶在86℃开始丧失活性。然而,在油分析中,在85℃,水解大豆油中存在的PC和PE底物时,该酶显示出良好的活性。检测相同的酶的Tm,发现它在15mg/mL时为86℃,并且是不可逆的。 
图29示出了使用10U的SEQ ID NO:2时的85℃加热试验的结果,条件如图中所示。图30示出了总结该加热试验的NMR数据。图31、32和33所示出的数据概述了使用p-NPPC时的SEQ ID NO:2的热稳定性,在图中所示的条件下。图34示出了来自DSC分析的数据,显示了SEQ ID NO:2的热稳定性,酶浓度为15mg/mL,Tm为86℃。 
序列表
<110>戴弗萨公司
     GRAMATIKOVA,Svetlana
     HAZLEWOOD,Geoff
     BARTON,Nelson
     LAM,David
 
<120>磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
 
<130>56446-20042.49
 
<150>10/796,907
<151>2004-03-08
 
<160>176
 
<170>FastSEQ for Windows Version 4.0
 
<210>1
<211>849
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>1
atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcgcc agttcaaagt     60
gtagtatttg cacaaacaaa taatagtgaa agtcctgcac cgattttaag atggtcagct    120
gaggataagc ataatgaggg gattaactct catttgtgga ttgtaaatcg tgcaattgac    180
atcatgtctc gtaatacaac gattgtgaat ccgaatgaaa ctgcattatt aaatgagtgg    240
cgtgctgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat    300
agtacatatg cttctcactt ttatgatccg gatactggaa caacatatat tccttttgcg    360
aaacatgcaa aagaaacagg cgcaaaatat tttaaccttg ctggtcaagc ataccaaaat    420
caagatatgc agcaagcatt cttctactta ggattatcgc ttcattattt aggagatgtg    480
aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct    540
aaatacgaaa attttgttga tacaataaaa aataactata ttgtttcaga tagcaatgga    600
tattggaatt ggaaaggagc aaacccagaa gattggattg aaggagcagc ggtagcagct    660
aaacaagatt atcctggcgt tgtgaacgat acgacaaaag attggtttgt aaaagcagcc    720
gtatctcaag aatatgcaga taaatggcgt gcggaagtaa caccggtgac aggaaagcgt    780
ttaatggaag cgcagcgcgt tacagctggt tatattcatt tgtggtttga tacgtatgta    840
aatcgctaa                                                            849
 
<210>2
<211>282
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(24)
 
<223>从环境样品中获得
 
<400>2
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
 1               5                  10                  15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
            20                  25                  30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile
        35                  40                  45
Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
    50                  55                  60
Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
            100                 105                 110
Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala
        115                 120                 125
Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln
    130                 135                 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
            180                 185                 190
Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn
        195                 200                 205
Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
    210                 215                 220
Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn Arg
        275                 280
 
<210>3
<211>852
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>3
atgaaaagaa aaattttagc tatagcttcc gtaattgctt taacagctcc tatccaaagt     60
gtggcgtttg cgcatgaaaa tggtcaccaa gatccaccaa ttgctctaaa gtggtcagca    120
gaatctatac ataatgaagg agtaagttct catttatgga ttgtaaacag agccattgat    180
attatgtccc aaaatacgac tgttgtgaag caaaatgaga cagctctatt aaatgaatgg    240
cgtacggatc tagagaaagg catttactct gcggattatg aaaacccata ctatgataat    300
tccacattcg cttcacactt ctatgatcct gattcaggaa aaacgtatat tccatttgct    360
aaacaagcaa agcaaacagg agcgaaatat tttaaattag ctggtgaagc ttatcaaaat    420
aaagatctga aaaacgcatt cttttattta ggattatcac ttcactattt aggggatgtc    480
aaccaaccaa tgcatgcagc aaactttact aatatttcgc atccatttgg cttccactca    540
aaatatgaaa atttcgttga tacagtgaaa gacaattata gagtaacgga tggaaatggc    600
tattggaatt ggcaaagtgc aaatccagaa gagtgggttc atgcatcagc atcagcagca    660
aaagctgatt ttccatcaat tgttaatgat aagacgaaaa attggttcct aaaagcagct    720
gtatcacaag actctgctga taaatggcgt gcagaagtaa caccgataac aggaaaacgt    780
ttaatggaag cgcagcgtgt tacagctgga tatatccatt tatggtttga tacgtacgtg    840
aataacaaat aa                                                        852
 
<210>4
<211>283
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(24)
<223>从环境样品中获得
 
<400>4
Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala
 1               5                  10                  15
Pro Ile Gln Ser Val Ala Phe Ala His Glu Asn Gly His Gln Asp Pro
            20                  25                  30
Pro Ile Ala Leu Lys Trp Ser Ala Glu Ser Ile His Asn Glu Gly Val
        35                  40                  45
Ser Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln
    50                  55                  60
Asn Thr Thr Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Thr Asp Leu Glu Lys Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser
            100                 105                 110
Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala
        115                 120                 125
Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys
    130                 135                 140
Asn Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn
            180                 185                 190
Tyr Arg Val Thr Asp Gly Asn Gly Tyr Trp Asn Trp Gln Ser Ala Asn
        195                 200                 205
Pro Glu Glu Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe
    210                 215                 220
Pro Ser Ile Val Asn Asp Lys Thr Lys Asn Trp Phe Leu Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Ile
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn Asn Lys
        275                 280
 
<210>5
<211>843
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>5
atgaaaagaa aaattttagc tatagcttct gtaattgctt taacagctcc tattcaaagt     60
gtggcgtttg cgcatgaatc tgatgggcct attgctttaa gatggtcagc ggaatctgta    120
cataatgaag gagtaagttc tcatttatgg attgtaaaca gagcaattga tattatgtcc    180
caaaatacga ctgtggtgaa gcaaaatgag acagctctat taaatgaatg gcgtacgaat    240
ttggaggaag gtatttattc tgcagattat aaaaacccat actatgataa ttccacattc    300
gcttcacact tctatgatcc tgattcagaa aaaacgtata ttccatttgc taaacaagca    360
aagcaaacgg gagcaaagta ttttaaatta gctggtgaag cttatcaaaa taaagatctg    420
aaaaatgcat tcttttattt aggattatca cttcattatt taggggatgt caatcaacca    480
atgcatgcag caaactttac taacatttcg catccatttg gcttccactc aaaatatgaa    540
aacttcgttg atacagtgaa agacaattat agagtaacag atggagatgg ctattggaat    600
tggaaaagtg caaatccaga agagtgggtt catgcatcag catcagcagc aaaagctgat    660
ttcccatcaa ttgttaatga taatacgaaa agttggttcc taaaagcagc ggtatcacaa    720
gactctgctg acaaatggcg tgctgaagta acaccggtaa caggaaaacg tttaatggaa    780
gcacagcgta ttacagctgg atatattcat ttatggtttg atacgtacgt gaataacaaa    840
taa                                                                  843
 
<210>6
<211>280
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(24)
<223>从环境样品中获得
 
<400>6
Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala
 1               5                  10                  15
Pro Ile Gln Ser Val Ala Phe Ala His Glu Ser Asp Gly Pro Ile Ala
            20                  25                  30
Leu Arg Trp Ser Ala Glu Ser Val His Asn Glu Gly Val Ser Ser His
        35                  40                  45
Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln Asn Thr Thr
    50                  55                  60
Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp Arg Thr Asn
65                  70                  75                  80
Leu Glu Glu Gly Ile Tyr Ser Ala Asp Tyr Lys Asn Pro Tyr Tyr Asp
                85                  90                  95
Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser Glu Lys Thr
            100                 105                 110
Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala Lys Tyr Phe
        115                 120                 125
Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys Asn Ala Phe
    130                 135                 140
Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro
145                 150                 155                 160
Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe Gly Phe His
                165                 170                 175
Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn Tyr Arg Val
            180                 185                 190
Thr Asp Gly Asp Gly Tyr Trp Asn Trp Lys Ser Ala Asn Pro Glu Glu
        195                 200                 205
Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe Pro Ser Ile
    210                 215                 220
Val Asn Asp Asn Thr Lys Ser Trp Phe Leu Lys Ala Ala Val Ser Gln
225                 230                 235                 240
Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys
                245                 250                 255
Arg Leu Met Glu Ala Gln Arg Ile Thr Ala Gly Tyr Ile His Leu Trp
            260                 265                 270
Phe Asp Thr Tyr Val Asn Asn Lys
        275                 280
 
<210>7
<211>963
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>7
gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt gttaggggtt     60
ttcgtaccgc tgcagccatc acatgctact gaaaattatc caaatgattt taaactgttg    120
caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca    180
gattatatga gtaatgcaga ttacttcaag ggacatgatg ctctgctctt aaatgagctt    240
tttgacaatg gaaattcgaa catgctgcta atgaacttat ccacggaata tccatatcaa    300
acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat    360
tttgtacccg aagatggcgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata    420
cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat    480
gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa    540
gatactgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc    600
aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac    660
tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc    720
aatgcgccta ccgaatattt agggcatagc tctacttggg acccagaaac gaacagcatt    780
acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa    840
gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg    900
aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa    960
taa                                                                  963
 
<210>8
<211>320
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(29)
<223>从环境样品中获得
 
<400>8
Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu
 1               5                  10                  15
Leu Leu Gly Val Phe Val Pro Leu Gln Pro Ser His Ala Thr Glu Asn
            20                  25                  30
Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro
        35                  40                  45
Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser
    50                  55                  60
Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu
65                  70                  75                  80
Phe Asp Asn Gly Asn Ser Asn Met Leu Leu Met Asn Leu Ser Thr Glu
                85                  90                  95
Tyr Pro Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp
            100                 105                 110
Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val
        115                 120                 125
Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr
    130                 135                 140
Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr
145                 150                 155                 160
Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His
                165                 170                 175
Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile
            180                 185                 190
Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn
        195                 200                 205
Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met
    210                 215                 220
Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val
225                 230                 235                 240
AsnAla Pro Thr Glu Tyr Leu Gly His Ser Ser Thr Trp Asp Pro Glu
                245                 250                 255
Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His
            260                 265                 270
Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp
        275                 280                 285
Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr
    290                 295                 300
Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys
305                 310                 315                 320
 
<210>9
<211>999
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>9
atgaaattac tgcgtgtctt tgtgtgcgtt tttgctttac tcagcgcaca cagcaaagcc     60
gatacactta aagtaatggc ttataatatt atgcaactaa acgtacaaga ttgggatcaa    120
gcaaatcgtg cacagcgctt gccaaacgtc atatctcaat taagtgacag tcctgatgtc    180
attcttatca gcgaagcgtt tagcagccaa tcagaatctg cgttagcgca acttgctcaa    240
ctttaccctt atcaaactcc caatgttggc gaagactgta gtggcgctgg ctggcaaagc    300
ttaacgggta actgctcgaa tagccccttt gtgatccgcg gtggagtggt gattttatct    360
aagtacccca tcattacgca aaaagcccat gtgtttaata acagcctgac tgatagttgg    420
gattatttag caaacaaagg tttcgcttat gttgaaatag aaaaacatgg caaacgttac    480
caccttattg gcacgcattt acaagcaacg catgatggcg acacagaagc tgagcatatt    540
gtgagaatgg gtcaattaca agagatacaa gatttcattc aaagcgagca aattcacact    600
tctgagccgg tcattatcgg cggtgatatg aacgtagagt ggagcaagca atctgaaatt    660
acagatatgc tcgaagtggt tcgcagccgt ctaattttca acacacctga agttggctct    720
ttctctgcaa aacacaactg gtttaccaaa gctaacgcct actatttcga ctacagctta    780
gagtataacg acacgctcga ttatgtactt tggcatgcag accataagca acccaccaat    840
accccagaaa tgttagtacg ttacccaaaa gcagagcgtg acttttactg gcgttactta    900
cgcggaaatt ggaacttacc ttctggccgt tattatcatg atggatacta taacgaactg    960
tctgatcact acccagtgca agttaacttt gaattttaa                           999
 
<210>10
<211>332
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(20)
<223>从环境样品中获得
 
<400>10
Met Lys Leu Leu Arg Val Phe Val Cys Val Phe Ala Leu Leu Ser Ala
 1               5                  10                  15
His Ser Lys Ala Asp Thr Leu Lys Val Met Ala Tyr Asn Ile Met Gln
            20                  25                  30
Leu Asn Val Gln Asp Trp Asp Gln Ala Asn Arg Ala Gln Arg Leu Pro
        35                  40                  45
Asn Val Ile Ser Gln Leu Ser Asp Ser Pro Asp Val Ile Leu Ile Ser
    50                  55                  60
Glu Ala Phe Ser Ser Gln Ser Glu Ser Ala Leu Ala Gln Leu Ala Gln
65                  70                  75                  80
Leu Tyr Pro Tyr Gln Thr Pro Asn Val Gly Glu Asp Cys Ser Gly Ala
                85                  90                  95
Gly Trp Gln Ser Leu Thr Gly Asn Cys Ser Asn Ser Pro Phe Val Ile
            100                 105                 110
Arg Gly Gly Val Val Ile Leu Ser Lys Tyr Pro Ile Ile Thr Gln Lys
        115                 120                 125
Ala His Val Phe Asn Asn Ser Leu Thr Asp Ser Trp Asp Tyr Leu Ala
    130                 135                 140
Asn Lys Gly Phe Ala Tyr Val Glu Ile Glu Lys His Gly Lys Arg Tyr
145                 150                 155                 160
His Leu Ile Gly Thr His Leu Gln Ala Thr His Asp Gly Asp Thr Glu
165                 170                 175
Ala Glu His Ile Val Arg Met Gly Gln Leu Gln Glu Ile Gln Asp Phe
            180                 185                 190
Ile Gln Ser Glu Gln Ile His Thr Ser Glu Pro Val Ile Ile Gly Gly
        195                 200                 205
Asp Met Asn Val Glu Trp Ser Lys Gln Ser Glu Ile Thr Asp Met Leu
    210                 215                 220
Glu Val Val Arg Ser Arg Leu Ile Phe Asn Thr Pro Glu Val Gly Ser
225                 230                 235                 240
Phe Ser Ala Lys His Asn Trp Phe Thr Lys Ala Asn Ala Tyr Tyr Phe
                245                 250                 255
Asp Tyr Ser Leu Glu Tyr Asn Asp Thr Leu Asp Tyr Val Leu Trp His
            260                 265                 270
Ala Asp His Lys Gln Pro Thr Asn Thr Pro Glu Met Leu Val Arg Tyr
        275                 280                 285
Pro Lys Ala Glu Arg Asp Phe Tyr Trp Arg Tyr Leu Arg Gly Asn Trp
    290                 295                 300
Asn Leu Pro Ser Gly Arg Tyr Tyr His Asp Gly Tyr Tyr Asn Glu Leu
305                 310                 315                 320
Ser Asp His Tyr Pro Val Gln Val Asn Phe Glu Phe
                325                 330
 
<210>11
<211>1041
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>11
atggcttcac aattcaggaa tctggttttt gaaggaggcg gtgtaaaggg aatcgcctat     60
atcggcgcca tgcaggtgct ggagcagcgc ggacatttgg agcacgttgt gagggtggga    120
ggaacaagtg caggggctat taacgctctc attttttcgc tgggctttac cattaaagag    180
cagcaggata ttctcaattc caccaacttc agggagttta tggacagctc tttcggattt    240
gtgcgaaact tcagaaggct ctggagtgaa ttcgggtgga accgcggtga tgtgttttcg    300
gagtgggcag gagagctggt gaaagagaaa ctcggcaaga agaacgccac cttcggcgat    360
ctgaaaaaag cgaagcgccc cgatctctac gttatcggaa ccaacctctc caccgggttt    420
tccgagactt tttcgcatga acgccacgcc aacatgccgc tggtggatgc ggtgcggatc    480
agcatgtcga tcccgctctt ttttgcggca cgcagacttg gcaaacgaag cgatgtgtat    540
gtggatggag gtgttatgct caactacccg gtaaagctgt tcgacaggga gaaatacatc    600
gatttggaga aggagaaaga ggcagcccgc tacgtggagt actacaatca agagaatgcc    660
cggtttctgc ttgagcggcc cggccgaagc ccgtacgttt acaaccggca gaccctaggc    720
ctgcggctcg actcgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc    780
aaacagatca accgcttccc cgaatatgcc aaagccctga tcggtgcact gatgcaggtg    840
caggagaaca tccacctgaa aagcgacgac tggcagcgaa cgctctacat caacacgctg    900
gatgtgggta ccacagattt cgacattaat gacgagaaga aaaaagtgct ggtgaatgag    960
ggaatcaagg gagcggaaac ctacttccgc tggtttgagg atcccgaagc taaaccggtg   1020
aacaaggtgg atttggtctg a                                             1041
 
<210>12
<211>346
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>12
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly His
            20                  25                  30
Leu Glu His Val Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile
    50                  55                  60
Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe
65                  70                  75                  80
Val Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly
                85                  90                  95
Asp Val Phe Ser Glu Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly
            100                 105                 110
Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe
    130                 135                 140
Ser His Glu Arg His Ala Asn Met Pro Leu Val Asp Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg
                165                 170                 175
Ser Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys
            180                 185                 190
Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Lys Glu Ala
        195                 200                 205
Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu
    210                 215                 220
Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Lys Ala
            260                 265                 270
Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asp Ile Asn Asp Glu Lys Lys Lys Val Leu Val Asn Glu
305                 310                 315                 320
Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu
                325                 330                 335
Ala Lys Pro Val Asn Lys Val Asp Leu Val
            340                 345
 
<210>13
<211>1038
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>13
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca cagagtcgga    120
gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac ggtccgtgag    180
caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggtat    420
gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgaacgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt    600
gatctggtca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgagcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaca ttcatctaca tggcgatgat tgggcgcgca cggtctatat cgatacattg    900
gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
 
<210>14
<211>345
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>14
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly
                85                  90                  95
Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Glu Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Val Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Ala Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
 
<210>15
<211>1344
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>15
atgctggtca tcattcatgg ctggagcgat gaggcgggct cgttcaagac cctggccaga     60
cgtttggcca aggcgccacc cgagggcctc gggacgcagg tcacggaaat ccatctgggt    120
gattatgtgt ccctggatga ccaggtgacg ttcaatgatc tggtcgatgc catggccaga    180
gcctggagcg atcgtggtct gcccacggcc ccgcgcagcg tcgatgccgt cgtgcacagc    240
accggcggcc tggtgatccg cgactggctc acgcagctgt acacgccgga aacagccccc    300
attcgtcgcc tgctgatgct cgctccggcc aatttcggct cgccgctggc acacaccgga    360
cgcagcatga tcggccgggt caccaagggc tggaagggca cgcggctctt tgaaacgggc    420
aagcacattc tcaaagggct cgaactggcc agcccctacg cctgggcgct ggccgaacgc    480
gatctgttca gcgatcagaa ctattatggc gccgggcgca tcctgtgcac tgtcctggtg    540
ggcaacgccg gttatcgcgg catcagcgcc gtcgccaacc ggcccggcac ggacggcacc    600
gtgcgcgtca gcagcgccaa tctccaagcg gccaggatgc tgctcgattt cagcgccagt    660
ccacaggctg agccggaatt caccctgcac gacagcaccg cggaaattgc cttcggcatc    720
gccgacgagg aagaccacag caccatcgcc gccaaggatc gcggcccgcg caaggcagtc    780
acctgggaac tgattctcaa agccctgcag atcgaggatg caagctttgc tcaatggtgc    840
cggcagatgc aggagcattc cgcggccgtg acggaaacgg cggaaaagcg ccgcaatgtt    900
cactacaaca gcttccagaa taccgtcgtg cgcgtggtgg acaaccacgg tgccgccgtg    960
caggattatc tcatcgagtt ttacatgaat gatgatcgca aactccgcga tcagcgcctc   1020
acccagcgcc tgcaggagca ggtgattacc aacgtgcacg gctacggtga cgacaagtcc   1080
tatcgcagca tgctgatcaa ctgcacggag ctctatgcgc tgatgtccag accgcaggat   1140
cgcctgaaca tcagcatcac cgcctatccg gatctctcca agggactggt ggggtatcgc   1200
acctacacgg acgaggatat cggttccctc tctctggatg cagcgcagat ccgaaagctc   1260
tttaagccgc accgtaccct gttgatgaca ctgtgcctgc aacgctatca gaaagatgat   1320
gtgttccgat tcagggatgt ttga                                          1344
 
<210>16
<211>447
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>16
Met Leu Val Ile Ile His Gly Trp Ser Asp Glu Ala Gly Ser Phe Lys
 1               5                  10                  15
Thr Leu Ala Arg Arg Leu Ala Lys Ala Pro Pro Glu Gly Leu Gly Thr
            20                  25                  30
Gln Val Thr Glu Ile His Leu Gly Asp Tyr Val Ser Leu Asp Asp Gln
        35                  40                  45
Val Thr Phe Asn Asp Leu Val Asp Ala Met Ala Arg Ala Trp Ser Asp
    50                  55                  60
Arg Gly Leu Pro Thr Ala Pro Arg Ser Val Asp Ala Val Val His Ser
65                  70                  75                  80
Thr Gly Gly Leu Val Ile Arg Asp Trp Leu Thr Gln Leu Tyr Thr Pro
                85                  90                  95
Glu Thr Ala Pro Ile Arg Arg Leu Leu Met Leu Ala Pro Ala Asn Phe
            100                 105                 110
Gly Ser Pro Leu Ala His Thr Gly Arg Ser Met Ile Gly Arg Val Thr
        115                 120                 125
Lys Gly Trp Lys Gly Thr Arg Leu Phe Glu Thr Gly Lys His Ile Leu
    130                 135                 140
Lys Gly Leu Glu Leu Ala Ser Pro Tyr Ala Trp Ala Leu Ala Glu Arg
145                 150                 155                 160
Asp Leu Phe Ser Asp Gln Asn Tyr Tyr Gly Ala Gly Arg Ile Leu Cys
                165                 170                 175
Thr Val Leu Val Gly Asn Ala Gly Tyr Arg Gly Ile Ser Ala Val Ala
            180                 185                 190
Asn Arg Pro Gly Thr Asp Gly Thr Val Arg Val Ser Ser Ala Asn Leu
        195                 200                 205
Gln Ala Ala Arg Met Leu Leu Asp Phe Ser Ala Ser Pro Gln Ala Glu
    210                 215                 220
Pro Glu Phe Thr Leu His Asp Ser Thr Ala Glu Ile Ala Phe Gly Ile
225                 230                 235                 240
Ala Asp Glu Glu Asp His Ser Thr Ile Ala Ala Lys Asp Arg Gly Pro
                245                 250                 255
Arg Lys Ala Val Thr Trp Glu Leu Ile Leu Lys Ala Leu Gln Ile Glu
            260                 265                 270
Asp Ala Ser Phe Ala Gln Trp Cys Arg Gln Met Gln Glu His Ser Ala
        275                 280                 285
Ala Val Thr Glu Thr Ala Glu Lys Arg Arg Asn Val His Tyr Asn Ser
    290                 295                 300
Phe Gln Asn Thr Val Val Arg Val Val Asp Asn His Gly Ala Ala Val
305                 310                 315                 320
Gln Asp Tyr Leu Ile Glu Phe Tyr Met Asn Asp Asp Arg Lys Leu Arg
                325                 330                 335
Asp Gln Arg Leu Thr Gln Arg Leu Gln Glu Gln Val Ile Thr Asn Val
            340                 345                 350
His Gly Tyr Gly Asp Asp Lys Ser Tyr Arg Ser Met Leu Ile Asn Cys
        355                 360                 365
Thr Glu Leu Tyr Ala Leu Met Ser Arg Pro Gln Asp Arg Leu Asn Ile
    370                 375                 380
Ser Ile Thr Ala Tyr Pro Asp Leu Ser Lys Gly Leu Val Gly Tyr Arg
385                 390                 395                 400
Thr Tyr Thr Asp Glu Asp Ile Gly Ser Leu Ser Leu Asp Ala Ala Gln
                405                 410                 415
Ile Arg Lys Leu Phe Lys Pro His Arg Thr Leu Leu Met Thr Leu Cys
            420                 425                 430
Leu Gln Arg Tyr Gln Lys Asp Asp Val Phe Arg Phe Arg Asp Val
        435                 440                 445
 
<210>17
<211>1137
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>17
atgaaaaaaa gccttcaaca acatcttgcc gctgacggca gcccaaagaa tattctttct     60
ctcgacgggg gaggaatcag aggggctttg acccttggtt ttctcaaaaa aatagaaagc    120
atcctgcagg aaaaacatgg gaaggactat ctcctttgcg atcactttga tttgatcggt    180
ggaacttcca caggctccat cattgcagca gcattggcta taggcatgac agtggaggaa    240
atcactaaaa tgtatatgga tctgggcgga aaaattttcg gcaagaaaag gagtttctgg    300
agaccctggg aaactgcgaa atacttgaaa gcaggatatg accacaaagc tcttgaaaag    360
agtctgaaag atgctttcca ggattttctt ttaggaagtg accaaattag aacaggtctt    420
tgtatagtag ccaaaagagc agataccaat agtatatggc cattgattaa ccaccccaaa    480
ggaaaattct atgattcaga acaaggcaaa aacaaaaata tccccttatg gcaggcagta    540
agggcgagta ccgctgctcc aacctatttc gctccacaat taatagatgt gggtgatggt    600
caaaaggctg cttttgtgga cggaggggta agcatggcca ataaccccgc attaaccctg    660
ttaaaagtgg ctacacttaa aggttttcct tttcattggc caatgggaga agacaaactg    720
accatagttt cagtaggcac cggatatagt gttttccaaa gacaaaaggg tgaaatcacc    780
aaagcttcct tattaacttg ggccaaaaac gtcccggaaa tgttgatgca ggatgcttct    840
tggcagaatc agaccatact tcagtggatt tctaaatccc ccactgcaca ttccatagat    900
atggaaatgg aagaccttag agatgacttt ctaggcggaa gaccactcat caaatacctc    960
aggtacaact tccccttgac agtaaatgat ctcaatggat tgaagcttgg gaaaagcttt   1020
acccaaaaag aggtcgaaga tttggtggaa atgagcaatg cacataaccg agaggagttg   1080
tataggattg gggagaaggc ggctgaaggg tcggtaaaaa aagaacattt tgaataa      1137
 
<210>18
<211>378
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>18
Met Lys Lys Ser Leu Gln Gln His Leu Ala Ala Asp Gly Ser Pro Lys
 1               5                  10                  15
Asn Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly Ala Leu Thr Leu
            20                  25                  30
Gly Phe Leu Lys Lys Ile Glu Ser Ile Leu Gln Glu Lys His Gly Lys
        35                  40                  45
Asp Tyr Leu Leu Cys Asp His Phe Asp Leu Ile Gly Gly Thr Ser Thr
    50                  55                  60
Gly Ser Ile Ile Ala Ala Ala Leu Ala Ile Gly Met Thr Val Glu Glu
65                  70                  75                  80
Ile Thr Lys Met Tyr Met Asp Leu Gly Gly Lys Ile Phe Gly Lys Lys
                85                  90                  95
Arg Ser Phe Trp Arg Pro Trp Glu Thr Ala Lys Tyr Leu Lys Ala Gly
            100                 105                 110
Tyr Asp His Lys Ala Leu Glu Lys Ser Leu Lys Asp Ala Phe Gln Asp
        115                 120                 125
Phe Leu Leu Gly Ser Asp Gln Ile Arg Thr Gly Leu Cys Ile Val Ala
    130                 135                 140
Lys Arg Ala Asp Thr Asn Ser Ile Trp Pro Leu Ile Asn His Pro Lys
145                 150                 155                 160
Gly Lys Phe Tyr Asp Ser Glu Gln Gly Lys Asn Lys Asn Ile Pro Leu
                165                 170                 175
Trp Gln Ala Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Ala Pro
            180                 185                 190
Gln Leu Ile Asp Val Gly Asp Gly Gln Lys Ala Ala Phe Val Asp Gly
        195                 200                 205
Gly Val Ser Met Ala Asn Asn Pro Ala Leu Thr Leu Leu Lys Val Ala
    210                 215                 220
Thr Leu Lys Gly Phe Pro Phe His Trp Pro Met Gly Glu Asp Lys Leu
225                 230                 235                 240
Thr Ile Val Ser Val Gly Thr Gly Tyr Ser Val Phe Gln Arg Gln Lys
                245                 250                 255
Gly Glu Ile Thr Lys Ala Ser Leu Leu Thr Trp Ala Lys Asn Val Pro
            260                 265                 270
Glu Met Leu Met Gln Asp Ala Ser Trp Gln Asn Gln Thr Ile Leu Gln
        275                 280                 285
Trp Ile Ser Lys Ser Pro Thr Ala His Ser Ile Asp Met Glu Met Glu
    290                 295                 300
Asp Leu Arg Asp Asp Phe Leu Gly Gly Arg Pro Leu Ile Lys Tyr Leu
305                 3l0                 315                 320
Arg Tyr Asn Phe Pro Leu Thr Val Asn Asp Leu Asn Gly Leu Lys Leu
                325                 330                 335
Gly Lys Ser Phe Thr Gln Lys Glu Val Glu Asp Leu Val Glu Met Ser
            340                 345                 350
Asn Ala His Asn Arg Glu Glu Leu Tyr Arg Ile Gly Glu Lys Ala Ala
        355                 360                 365
Glu Gly Ser Val Lys Lys Glu His Phe Glu
    370                 375
 
<210>19
<211>1248
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>19
atgaaaaaga caacgttagt tttggctcta ttgatgccat ttggtgccgc ctccgcacaa     60
gacaatagta tgactccaga agcaatcaca tcagctcaag tcgcacaaac acaatcagcc    120
tccacctata cctacgttag gtgttggtat cgaacagacg caagccatga ttcaccagca    180
accgactggg agtgggctag aaaggaaaac ggagactatt acaccattga cggttactgg    240
tggtcatcga tctcctttaa aaatatgttc tatagcgaga ctcctcaaca agagatcaag    300
cagcgttgtg tagacacctt ggatgttcag cacgacaaag ccgacatcac ctactttgcc    360
gctgacaacc gcttctctta caaccattct atctggacta acgatcacgg ctttcaagcg    420
aaccaaatca accgaatagt cgcttttggc gatagtcttt cagacacggg caacctattt    480
aatgggtcac aatggatttt ccctaaccct aattcttggt tcttgggtca cttctctaac    540
ggcttcgttt ggactgaata cttggctaac gctaagggcg ttccactcta taactgggct    600
gtgggtggcg cagcaggaac caaccaatat gtcgctctaa ctggtgtcta tgatcaggtc    660
acttcgtacc tgacttacat gaagatggcg aaaaattatc gcccagagaa cacactattc    720
acattagagt ttggattgaa tgactttatg aattacggac gtgaagtagc tgatgtaaaa    780
gctgacttta gtagcgcact gattcgcctc accgacgctg gcgcaaaaaa cattctgttg    840
ttcaccctac cagatgcgac caaagcccct cagtttaagt actcaacggc ccaagaaatc    900
gagacagttc gtggcaagat tctggcgttc aaccagttca tcaaagaaca agcagagtac    960
tatcaaagca aaggtgacaa cgtgatccta tttgatgcgc acgctctatt ctctagcatc   1020
accagcgacc cacaaaaaca cgggttcaga aacgcaaaag atgcctgcct agatattaat   1080
cgtagtgcat ctcaagacta cctatacagc catagtctga ccaacgactg tgcaacctat   1140
ggttctgata gctatgtatt ttggggcgta acacacccaa ccacagcaac tcataaatac   1200
atcgcaacgc atatactgat gaattcaatg tcgaccttcg acttttaa                1248
 
<210>20
<211>415
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(19)
<223>从环境样品中获得
 
<400>20
Met Lys Lys Thr Thr Leu Val Leu Ala Leu Leu Met Pro Phe Gly Ala
 1               5                  10                  15
Ala Ser Ala Gln Asp Asn Ser Met Thr Pro Glu Ala Ile Thr Ser Ala
            20                  25                  30
Gln Val Ala Gln Thr Gln Ser Ala Ser Thr Tyr Thr Tyr Val Arg Cys
        35                  40                  45
Trp Tyr Arg Thr Asp Ala Ser His Asp Ser Pro Ala Thr Asp Trp Glu
    50                  55                  60
Trp Ala Arg Lys Glu Asn Gly Asp Tyr Tyr Thr Ile Asp Gly Tyr Trp
65                  70                  75                  80
Trp Ser Ser Ile Ser Phe Lys Asn Met Phe Tyr Ser Glu Thr Pro Gln
                85                  90                  95
Gln Glu Ile Lys Gln Arg Cys Val Asp Thr Leu Asp Val Gln His Asp
            100                 105                 110
Lys Ala Asp Ile Thr Tyr Phe Ala Ala Asp Asn Arg Phe Ser Tyr Asn
        115                 120                 125
His Ser Ile Trp Thr Asn Asp His Gly Phe Gln Ala Asn Gln Ile Asn
    130                 135                 140
Arg Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Phe
145                 150                 155                 160
Asn Gly Ser Gln Trp Ile Phe Pro Asn Pro Asn Ser Trp Phe Leu Gly
                165                 170                 175
His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala Asn Ala Lys
            180                 185                 190
Gly Val Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn
        195                 200                 205
Gln Tyr Val Ala Leu Thr Gly Val Tyr Asp Gln Val Thr Ser Tyr Leu
    210                 215                 220
Thr Tyr Met Lys Met Ala Lys Asn Tyr Arg Pro Glu Asn Thr Leu Phe
225                 230                 235                 240
Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val
                245                 250                 255
Ala Asp Val Lys Ala Asp Phe Ser Ser Ala Leu Ile Arg Leu Thr Asp
            260                 265                 270
Ala Gly Ala Lys Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys
        275                 280                 285
Ala Pro Gln Phe Lys Tyr Ser Thr Ala Gln Glu Ile Glu Thr Val Arg
    290                 295                 300
Gly Lys Ile Leu Ala Phe Asn Gln Phe Ile Lys Glu Gln Ala Glu Tyr
305                 310                 315                 320
Tyr Gln Ser Lys Gly Asp Asn Val Ile Leu Phe Asp Ala His Ala Leu
                325                 330                 335
Phe Ser Ser Ile Thr Ser Asp Pro Gln Lys His Gly Phe Arg Asn Ala
            340                 345                 350
Lys Asp Ala Cys Leu Asp Ile Asn Arg Ser Ala Ser Gln Asp Tyr Leu
        355                 360                 365
Tyr Ser His Ser Leu Thr Asn Asp Cys Ala Thr Tyr Gly Ser Asp Ser
    370                 375                 380
Tyr Val Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr
385                 390                 395                 400
Ile Ala Thr His Ile Leu Met Asn Ser Met Ser Thr Phe Asp Phe
                405                 410                 415
 
<210>21
<211>1716
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>21
atgcagcagc ataaattgag gaatttcaac aagggattga ccggcgtcgt attgagcgta     60
ttgacctcta ccagcgccat ggcttttaca caaatcggtg gcggcggcgc gattccgatg    120
ggccatgaat ggctcacgcg cagatccgca ctggaattat taaatgcaga ccatatcgtc    180
tccaacgacc cgctcgaccc acgcttgggc tggagccagg gcttggccaa aaatttggat    240
ctctccaatg cattgaacga agtgcagcgc atccagagcg ttaccaagac caacgcactt    300
tatgaaccac gctatgatga cgtgttttct gcgattgtcg gcgaacgctg ggtggacacg    360
gccggtttca acgttgcgaa ggctaccgtc ggtaaaatcg attgtttcag cgcggtcgcg    420
caagaacctg ccgatgttca gcaagaccat ttcatgcgtc gttacgatga cgtgggcgga    480
caaggtggcg ttaacgccgc acgccgcggg caacaacgtt tcatcaccca tttcatcaac    540
gccgcgatgg ccgaagaaaa aagcataaaa gcgtgggacg gcggtggata ctccacgctg    600
gaaaaagtca gccacaatta tttcttgttt ggtcgcgctg tgcatttgtt ccaggattct    660
ttcagcccgg aacacaccgt gcgtctgccg caagacaact acgaaaaagt acgtcaggta    720
aaagcctatc tgtgttccga aggcgcagag caacatacgc ataacgcgca ggatgcgatc    780
agcttcacca gcggcgacgt tatctggaag aaaaacaccc gtctggatgc cggctggagc    840
acctacaaac ccagcaatat gaaacccgtt gccttggtgg cgatggaagc ctcgaaggac    900
ttgtgggccg ccttcattcg caccatggcc gcaccgcgca gcgagcgtcg cgccattgct    960
cagcaagagg cacaaacgct ggtaaacaac tggttgtcgt tcgacgaaca ggaaatgctg   1020
agctggtacg acgaagaaac tcatcgcgat cacacttacg tgctcgaacc cggccagaac   1080
ggccccggta tttccatgtt cgattgcatg gtgggtctgg gcgtgacgtc tggcagccag   1140
gctgcgcgtg tggccgaact ggatcaacaa cgtcgccagt gcttgttcaa cgtcaaggcc   1200
accaccggtt acagcgatct gaacgatccg cacatggata tcccgtataa ctggcaatgg   1260
acgtcgacca cgcagtggaa agtgccaagc gcgagctgga cgattccgca gttgccggcc   1320
gacgcaggca agaaagtgac gatcaaaaac gccatcaacg gcaatccgct ggtagcgccg   1380
gctggcgtca aacacaacag cgatatttat tccgcgccgg gtgaagccat cgaattcatt   1440
ttcgtcggtg actacaacaa tgagtcttat ctgcgctcga aaaaagatgc ggatttgttc   1500
ttgagctaca gtgcggtatc cggcaagggc ttgctgtaca acacaccgaa tcaggcaggt   1560
tatcgcgtga aaccggcggg cgtgctgtgg acgatcgaga acacctactg gaatgatttc   1620
ctgtggttca acagttcgaa caaccgcatc tacgtaagcg gcacgggcga tgccaacaag   1680
ttacattcac agtggatcat tgacggtctg aaataa                             1716
 
<210>22
<211>571
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(28)
<223>从环境样品中获得
 
<400>22
Met Gln Gln His Lys Leu Arg Asn Phe Asn Lys Gly Leu Thr Gly Val
 1               5                  10                  15
Val Leu Ser Val Leu Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile
            20                  25                  30
Gly Gly Gly Gly Ala Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg
        35                  40                  45
Ser Ala Leu Glu Leu Leu Asn Ala Asp His Ile Val Ser Asn Asp Pro
    50                  55                  60
Leu Asp Pro Arg Leu Gly Trp Ser Gln Gly Leu Ala Lys Asn Leu Asp
65                  70                  75                  80
Leu Ser Asn Ala Leu Asn Glu Val Gln Arg Ile Gln Ser Val Thr Lys
                85                  90                  95
Thr Asn Ala Leu Tyr Glu Pro Arg Tyr Asp Asp Val Phe Ser Ala Ile
            100                 105                 110
Val Gly Glu Arg Trp Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala
        115                 120                 125
Thr Val Gly Lys Ile Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala
    130                 135                 140
Asp Val Gln Gln Asp His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly
145                 150                 155                 160
Gln Gly Gly Val Asn Ala Ala Arg Arg Gly Gln Gln Arg Phe Ile Thr
                165                 170                 175
His Phe Ile Asn Ala Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp
            180                 185                 190
Asp Gly Gly Gly Tyr Ser Thr Leu Glu Lys Val Ser His Asn Tyr Phe
        195                 200                 205
Leu Phe Gly Arg Ala Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu
    210                 215                 220
His Thr Val Arg Leu Pro Gln Asp Asn Tyr Glu Lys Val Arg Gln Val
225                 230                 235                 240
Lys Ala Tyr Leu Cys Ser Glu Gly Ala Glu Gln His Thr His Asn Ala
                245                 250                 255
Gln Asp Ala Ile Ser Phe Thr Ser Gly Asp Val Ile Trp Lys Lys Asn
            260                 265                 270
Thr Arg Leu Asp Ala Gly Trp Ser Thr Tyr Lys Pro Ser Asn Met Lys
        275                 280                 285
Pro Val Ala Leu Val Ala Met Glu Ala Ser Lys Asp Leu Trp Ala Ala
    290                 295                 300
Phe Ile Arg Thr Met Ala Ala Pro Arg Ser Glu Arg Arg Ala Ile Ala
305                 310                 315                 320
Gln Gln Glu Ala Gln Thr Leu Val Asn Asn Trp Leu Ser Phe Asp Glu
                325                 330                 335
Gln Glu Met Leu Ser Trp Tyr Asp Glu Glu Thr His Arg Asp His Thr
            340                 345                 350
Tyr Val Leu Glu Pro Gly Gln Asn Gly Pro Gly Ile Ser Met Phe Asp
        355                 360                 365
Cys Met Val Gly Leu Gly Val Thr Ser Gly Ser Gln Ala Ala Arg Val
    370                 375                 380
Ala Glu Leu Asp Gln Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala
385                 390                 395                 400
Thr Thr Gly Tyr Ser Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr
                405                 410                 415
Asn Trp Gln Trp Thr Ser Thr Thr Gln Trp Lys Val Pro Ser Ala Ser
            420                 425                 430
Trp Thr Ile Pro Gln Leu Pro Ala Asp Ala Gly Lys Lys Val Thr Ile
        435                 440                 445
Lys Asn Ala Ile Asn Gly Asn Pro Leu Val Ala Pro Ala Gly Val Lys
    450                 455                 460
His Asn Ser Asp Ile Tyr Ser Ala Pro Gly Glu Ala Ile Glu Phe Ile
465                 470                 475                 480
Phe Val Gly Asp Tyr Asn Asn Glu Ser Tyr Leu Arg Ser Lys Lys Asp
                485                 490                 495
Ala Asp Leu Phe Leu Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu
            500                 505                 510
Tyr Asn Thr Pro Asn Gln Ala Gly Tyr Arg Val Lys Pro Ala Gly Val
        515                 520                 525
Leu Trp Thr Ile Glu Asn Thr Tyr Trp Asn Asp Phe Leu Trp Phe Asn
    530                 535                 540
Ser Ser Asn Asn Arg Ile Tyr Val Ser Gly Thr Gly Asp Ala Asn Lys
545                 550                 555                 560
Leu His Ser Gln Trp Ile Ile Asp Gly Leu Lys
                565                 570
 
<210>23
<211>1473
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>23
atgacgatcc gctcgaccga ctacgcgctg ctcgcgcagg agagctacca cgacagccag     60
gtcgatgctg acgtcaagct cgatggcatc tcctacaagg tattcgccac cacggacgac    120
cccctcaccg gcttccaggc caccgcttac cagcgccagg atacgggcga ggtggtcatc    180
gcctaccgcg gcacggaatt cgaccgcgaa cccgtgcgcg atggcggcgt cgacgcaggc    240
atggtgttgc ttggcgtcaa cgcccagtca cctgcatccg aggtattcac ccgcgaagtg    300
atcgaaaagg cgaagcacga agccgagctc aacgatcgcg agccgaagat caccgtcacc    360
gggcattccc tcggcggcac cctcgccgaa atcaatgccg cgaaatacgg cctccacggc    420
gaaaccttca atgcctacgg tgcggccagc ctcaagggca tccccgaggg cggcgacacg    480
gtgatcgacc atgtccgcgc cggcgatctc gtcagcgccg ccagcccgca ctacgggcag    540
gtgcgtgtgt acgcagctca gcaggatatc gataccctgc aacatgccgg ctaccgcgac    600
gacagtggca tcttcagcct gcgcaacccc atcaaggcca cggatttcga cgcccacgcg    660
atcgataact tcgtgcccaa cagcaagctg cttggccaat cgatcatcgc tcctgagaac    720
gaagcccgtt acgaagccca caagggcatg atcgatcgct atcgcgatga cgtggccgat    780
atccggaaag gcatctccgc tccctgggaa atccccaagg ccgtcggcga gctgaaggac    840
aagctcgaac acgaagcctt cgagctggcc ggcaagggca tcctcgccgt cgagcacggt    900
gtagccgagg tcgttcacga ggcgaaggaa gggttcgatc atctcaagga aggcttgcac    960
cacgtcaggg aagagatcag cgagggcatc cacgccgtgg aagagaaggc ttccagcgca   1020
tggcacaccc tcacccaccc gaaggaatgg ttcgagcacg acaaacctca agtgaatctc   1080
gaccatcccc agcatccaga caacgccttg ttcaagcagg cgcagggcgc ggtacacgcc   1140
ctcgatgcca cgcaaggccg cacgccagat aggacgagcg accagatcgc aggttctctg   1200
gtggtcgcgg cgcgacgcga tggtctcgag cgggtggacc gcgccgtgct cagcgatgac   1260
actagccggc tctacggcgt gcagggtgcg acggattcgc ccttgaagca gttcaccgag   1320
gtgaacacga cagtggcggc gcaaacgtca ctgcagcaaa gcagccaggc atggcagcag   1380
caagcagaga tcgcgcgaca gaaccaggca accagccagg ctcagcgcat ggaaccgcag   1440
gtgcccccgc aggcaccggc acatggcatg taa                                1473
 
<210>24
<211>490
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>24
Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ser Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Val Phe
                85                  90                  95
Thr Arg Glu Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Lys Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln AsP Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Phe Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Glu Ala Arg Tyr Glu Ala His Lys Gly Met Ile Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro
            260                 265                 270
Lys Ala Val Gly Glu Leu Lys Asp Lys Leu Glu His Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Val Ala Glu Val
    290                 295                 300
Val His Glu Ala Lys Glu Gly Phe Asp His Leu Lys Glu Gly Leu His
305                 310                 315                 320
His Val Arg Glu Glu Ile Ser Glu Gly Ile His Ala Val Glu Glu Lys
                325                 330                 335
Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu
            340                 345                 350
His Asp Lys Pro Gln Val Asn Leu Asp His Pro Gln His Pro Asp Asn
        355                 360                 365
Ala Leu Phe Lys Gln Ala Gln Gly Ala Val His Ala Leu Asp Ala Thr
    370                 375                 380
Gln Gly Arg Thr Pro Asp Arg Thr Ser Asp Gln Ile Ala Gly Ser Leu
385                 390                 395                 400
Val Val Ala Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val
                405                 410                 415
Leu Ser Asp Asp Thr Ser Arg Leu Tyr Gly Val Gln Gly Ala Thr Asp
            420                 425                 430
Ser Pro Leu Lys Gln Phe Thr Glu Val Asn Thr Thr Val Ala Ala Gln
        435                 440                 445
Thr Ser Leu Gln Gln Ser Ser Gln Ala Trp Gln Gln Gln Ala Glu Ile
    450                 455                 460
Ala Arg Gln Asn Gln Ala Thr Ser Gln Ala Gln Arg Met Glu Pro Gln
465                 470                 475                 480
Val Pro Pro Gln Ala Pro Ala His Gly Met
                485                 490
 
<210>25
<211>1098
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>25
atgtgcgcca aagttaaagt agtcaaaata aagacaaaca caggcagccc aaacaaatac     60
cacttcaaga acctcgtctt cgaaggcggc ggcgtgaaag gcattgccta tgtgggagcc    120
cttaccaagc tcgacgagga aggcatcctt caaaacatta agcgcgtggc cggcacctca    180
gcaggagcaa tggtggccgt cctcgtcgga ttgggcttca ccgctaagga gataagcgac    240
atcctgtggg acatcaaatt ccagaacttt ttagacaact catggggcgt gatacgcaac    300
accaatcgtc tgctgacgga atacggctgg tataagggcg agtttttccg cgacctcatg    360
gctgattaca tcaaaagaaa gacagacgat ggcgagatta ctttcgggga gttggaggcc    420
atgagaaaag agggcaagcc cttcttggaa atccatctgg ttggctccga cctcacgaca    480
gggtattcca gagtgttcaa ctccaaaaac accccaaatg tgaaagtcgc cgatgccgcc    540
cgcatctcca tgtcgatacc gctgtttttc tccgctgtga gaggcgtgca aggcgacgac    600
cacctctatg tggacggtgg gcttttggac aactacgcca tcaagatttt cgaccagtcg    660
aaactcgttt cagacaaaaa caacaaaagg aagaccgagt attacaacag gctcaaccag    720
caagtgaacg cgaaagcaac gaaaagcaag acggaatctg tagagtatgt ctacaacaag    780
gagactttgg gcttccgctt ggatgccaaa gaggacatca acctcttcct caaccacgat    840
gatgcccctc aaaaagaaat caagagtttc ttctcttaca ccaaagcttt ggtttccacg    900
ctcatcgatt tccagaacaa tgtacacctg cacagcgacg actggcagcg tacggtctac    960
atcgacacac tcggtgtcag ctccattgac ttcggtctgt caaacacaac gaaacaagct   1020
cttgtcgatt cgggctacaa ctacaccaca gcctacctcg actggtacaa caacgacgag   1080
gataaagcca acaagtaa                                                 1098
 
<210>26
<211>365
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>26
Met Cys Ala Lys Val Lys Val Val Lys Ile Lys Thr Asn Thr Gly Ser
 1               5                  10                  15
Pro Asn Lys Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val
            20                  25                  30
Lys Gly Ile Ala Tyr Val Gly Ala Leu Thr Lys Leu Asp Glu Glu Gly
        35                  40                  45
Ile Leu Gln Asn Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Met
    50                  55                  60
Val Ala Val Leu Val Gly Leu Gly Phe Thr Ala Lys Glu Ile Ser Asp
65                  70                  75                  80
Ile Leu Trp Asp Ile Lys Phe Gln Asn Phe Leu Asp Asn Ser Trp Gly
                85                  90                  95
Val Ile Arg Asn Thr Asn Arg Leu Leu Thr Glu Tyr Gly Trp Tyr Lys
            100                 105                 110
Gly Glu Phe Phe Arg Asp Leu Met Ala Asp Tyr Ile Lys Arg Lys Thr
        115                 120                 125
Asp Asp Gly Glu Ile Thr Phe Gly Glu Leu Glu Ala Met Arg Lys Glu
    130                 135                 140
Gly Lys Pro Phe Leu Glu Ile His Leu Val Gly Ser Asp Leu Thr Thr
145                 150                 155                 160
Gly Tyr Ser Arg Val Phe Asn Ser Lys Asn Thr Pro Asn Val Lys Val
                165                 170                 175
Ala Asp Ala Ala Arg Ile Ser Met Ser Ile Pro Leu Phe Phe Ser Ala
            180                 185                 190
Val Arg Gly Val Gln Gly Asp Asp His Leu Tyr Val Asp Gly Gly Leu
        195                 200                 205
Leu Asp Asn Tyr Ala Ile Lys Ile Phe Asp Gln Ser Lys Leu Val Ser
    210                 215                 220
Asp Lys Asn Asn Lys Arg Lys Thr Glu Tyr Tyr Asn Arg Leu Asn Gln
225                 230                 235                 240
Gln Val Asn Ala Lys Ala Thr Lys Ser Lys Thr Glu Ser Val Glu Tyr
                245                 250                 255
Val Tyr Asn Lys Glu Thr Leu Gly Phe Arg Leu Asp Ala Lys Glu Asp
            260                 265                 270
Ile Asn Leu Phe Leu Asn His Asp Asp Ala Pro Gln Lys Glu Ile Lys
        275                 280                 285
Ser Phe Phe Ser Tyr Thr Lys Ala Leu Val Ser Thr Leu Ile Asp Phe
    290                 295                 300
Gln Asn Asn Val His Leu His Ser Asp Asp Trp Gln Arg Thr Val Tyr
305                 310                 315                 320
Ile Asp Thr Leu Gly Val Ser Ser Ile Asp Phe Gly Leu Ser Asn Thr
                325                 330                 335
Thr Lys Gln Ala Leu Val Asp Ser Gly Tyr Asn Tyr Thr Thr Ala Tyr
            340                 345                 350
Leu Asp Trp Tyr Asn Asn Asp Glu Asp Lys Ala Asn Lys
        355                 360                 365
 
<210>27
<211>1287
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>27
gtgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg     60
aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg    120
gtcgaggttc tcggcgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca    180
gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg    240
gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc    300
tccgggatta caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac    360
gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc    420
tggatcagag acctgattgc acagcgagtc gaggcggggc gctccgaggt cctgagccga    480
gccgacgccg atggacggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca    540
tttgccgagc ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc    600
ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg    660
gacatgccga tcgacgtcgc ggtacgcatc tccgcatcgt tgccatggtt tttcaaatcc    720
gtgaaatgga acggctccga atacatagat ggcggctgcc tgtcgaactt cccaatgccg    780
atattcgacg tcgatcccta tcgtggcgac gcatcgtcga aaatccggct cggcatcttc    840
ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatt    900
ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg    960
aaagcttctg cagaacactg ggtcgtcggc atcgacgtcg aaggcgccac ccgcgcgtcg   1020
aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat   1080
agcacgttca agttcgatct ttcggacgct gacaaggagc gcatggccga ggccggcgca   1140
aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt   1200
tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat   1260
tcgtttcgag ccttgatcgc ggcctag                                       1287
 
<210>28
<211>428
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>28
Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile
 1               5                  10                  15
Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro
            20                  25                  30
Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly
        35                  40                  45
Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met
    50                  55                  60
Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala
65                  70                  75                  80
Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr
                85                  90                  95
Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys
            100                 105                 110
Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly ThrSer Asp Glu Arg
        115                 120                 125
Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp
    130                 135                 140
Leu Ile Ala Gln Arg Val Glu Ala Gly Arg Ser Glu Val Leu Ser Arg
145                 150                 155                 160
Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys
                165                 170                 175
Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro
            180                 185                 190
Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser
        195                 200                 205
Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile
    210                 215                 220
Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser
225                 230                 235                 240
Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn
                245                 250                 255
Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp AlaSer
            260                 265                 270
Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly
        275                 280                 285
Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser
    290                 295                 300
Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val
305                 310                 315                 320
Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala
                325                 330                 335
Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr
            340                 345                 350
Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser
        355                 360                 365
Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg
    370                 375                 380
Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe
385                 390                 395                 400
Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala
                405                 410                 415
Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala
            420                 425
 
<210>29
<211>753
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>29
atgggaaacg gtgcagcagt tggttcgaat gataatggta gagaagaaag tgtttacgta     60
ctttctgtga tcgcctgtaa tgtttattat ttacaaaagt gtgaaggtgg ggcatcgcgt    120
gatagcgtga ttagagaaat caatagccaa actcaacctt taggatatga gattgtagca    180
gattctattc gtgatggtca tattggctct tttgcctgta agatggctgt ctttagaaat    240
aatggaaacg gcaattgtgt tttagcaatc aaagggactg atatgaataa tatcaatgac    300
ttggtgaatg acctaaccat gatattagga ggtattggtt ctgttgctgc aatccaacca    360
acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tacaggtcac    420
tcccttggag gctacatgac tgagatcatc gccaccaatc gtggacttcc aggtattgca    480
ttttgcgcac caggttcaaa tggtcccatt gtaaaattag gtggacaaga gacacctggc    540
tttcacaatg tgaactttga acatgatcca gcaggtaacg ttatgacggg ggtttatact    600
catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg    660
gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa    720
agtcataata cgggttatta ttacccaaaa taa                                 753
 
<210>30
<211>250
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>30
Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu
 1               5                  10                  15
Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln
            20                  25                  30
Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn
        35                  40                  45
Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg
    50                  55                  60
Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn
65                  70                  75                  80
Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn
                85                  90                  95
Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile
            100                 105                 110
Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu
        115                 120                 125
Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly
    130                 135                 140
Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala
145                 150                 155                 160
Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln
                165                 170                 175
Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly
            180                 185                 190
Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val
        195                 200                 205
Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe
    210                 215                 220
Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu
225                 230                 235                 240
Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys
                245                 250
 
<210>31
<211>1422
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>31
atgaaaaaga aattatgtac atgggctctc gtaacagcga tatcttctgg agttgttgcg     60
attccaaccg tagcatctgc ttgcggaatg ggtgaagtaa tgaaacagga ggatcaagag    120
cacaaacgtg tgaagagatg gtctgcggag catccgcacc atgctaatga aagcacgcac    180
ttatggattg ctcgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa    240
gaaaatgaat tacaattctt aaaaatacct gaatataagg agttatttga aagagggctt    300
tatgatgccg attatcttga tgagtttaac gatggaggta caggtacaat cggtattgat    360
gggctaatta aaggaggctg gaaatctcat ttctatgatc ctgatacgaa aaagaactat    420
aaaggagaag aagaaccaac agccctttcg caaggggata aatattttaa attagcagga    480
gattatttta agaaagaaga ttggaaacaa gctttctatt atttaggtgt tgcgacgcat    540
tacttcacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacatgagt    600
gcaataaagt ttcatagcgc ttttgaaaat tatgtaacga cagttcagac accgtttgaa    660
gtgaaggatg ataagggaac atataatttg gtcaattctg atgatccgaa gcagtggata    720
catgaaacag cgaaactcgc aaaagcagaa attatgaata ttactagtga taatattaaa    780
tctcaatata ataaaggaaa caaagatctt tggcaacaag aagttatgcc agctgtccag    840
aggagtttag agaaagcgca aagaaacacg gcgggattta ttcatttatg gtttaaaaca    900
tatgttggca aaactgcagc tgaagatatt gaaactacac aggtaaaaga ttctaatgga    960
gaagcaatac aagaacaaaa aaaatactac gttgtgccta gtgagttttt aaatagaggt   1020
ttgacctttg aggtatatgc ttcgaatgac tacgcactat tatctaatca cgtagatgat   1080
aataaagttc atggtacacc tgttcagttt gtttttgata aagagaataa cggaattgtt   1140
catcggggag aaagtgtact gctgaaaatg acgcaatcta actatgatga ttatgtattt   1200
cttaattact ctaatatgac aaattggtta catcttgcga aacgaaaaac aaatactgca   1260
cagtttaaag tgtatccaaa tccggataac tcatctgaat atttcctata tacagatgga   1320
tacccggtaa attatcaaga aaatggtaat gggaagagct ggattgagtt aggaaagaaa   1380
acggataaac cgaaagcgtg gaaatttcaa caggcagaat aa                      1422
 
<210>32
<211>473
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(20)
<223>从环境样品中获得
 
<400>32
Met Lys Lys Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Gly Val Val Ala Ile Pro Thr Val Ala Ser Ala Cys Gly Met Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asp Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ala Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Lys Ile Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Val Gln Thr Pro Phe Glu Val Lys Asp Asp
    210                 215                 220
Lys Gly Thr Tyr Asn Leu Val Asn Ser Asp Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met Asn Ile Thr Ser
                245                 250                 255
Asp Asn Ile Lys Ser Gln Tyr Asn Lys Gly Asn Lys Asp Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Lys Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys
    290                 295                 300
Thr Ala Ala Glu Asp Ile Glu Thr Thr Gln Val Lys Asp Ser Asn Gly
305                 310                 315                 320
Glu Ala Ile Gln Glu Gln Lys Lys Tyr Tyr Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ser Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn His Val Asp Asp Asn Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Glu Asn Asn Gly Ile Val His Arg Gly Glu
    370                 375                 380
Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asp Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Met Thr Asn Trp Leu His Leu Ala Lys Arg Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asp Asn Ser Ser
            420                 425                 430
Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Glu Leu Gly Lys Lys Thr Asp Lys Pro
    450                 455                 460
Lys Ala Trp Lys Phe Gln Gln Ala Glu
465                 470
 
<210>33
<211>792
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>33
atgagagcac tcgtgctggc aggcggtgga gccaagggct cgtttcaagt gggcgtgctg     60
cagcggttca cccccgcaga cttcggtctc gtggtgggat gctcggtcgg agctttaaac    120
gccgcggggt ttgcccacct gggtagccat ggcatcaaag acctctggca agggatcagg    180
agtcgagatg acatcctgtc ccgtgtctgg tggccgtttg gctcagacgg gatcttctcg    240
cagaagcctc ttgaaaagct cgtctccaaa gcatgcacgg gtcctgctcg ggtgccggtc    300
cacgtggcga cggtctgcct tgaacgcggc cttgtccact acgggatctc cggggactct    360
gactttgaga agaaagtgct ggcatcggct gcgatcccag gcgtggtgaa gccagttaag    420
atccatggcg accactacgt cgacggtggt gtcagagaga tctgtccgct gcgtcgagcc    480
atcgacctgg gcgccacgga gatcacagtc atcatgtgcg ctccggaata catcccgacc    540
tggtcgcgta gttcctcgct gttcccgttt gtgaacgtga tgatccggtc tctcgacatc    600
ctgaccgatg agatcctggt caacgacatc gccgagtgcg tggcaaagaa caagatgcca    660
ggtaaacgtc acgtaaagct caccatctac cggccgaaga aagagctcat gggcacgctc    720
gactttgacc ccaaagccat cgccgcaggg atcaaggcag gcaccgaagc ccagccaagg    780
ttctgggagt aa                                                        792
 
<210>34
<211>263
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>34
Met Arg Ala Leu Val Leu Ala Gly Gly Gly Ala Lys Gly Ser Phe Gln
 1               5                  10                  15
Val Gly Val Leu Gln Arg Phe Thr Pro Ala Asp Phe Gly Leu Val Val
            20                  25                  30
Gly Cys Ser Val Gly Ala Leu Asn Ala Ala Gly Phe Ala His Leu Gly
        35                  40                  45
Ser His Gly Ile Lys Asp Leu Trp Gln Gly Ile Arg Ser Arg Asp Asp
    50                  55                  60
Ile Leu Ser Arg Val Trp Trp Pro Phe Gly Ser Asp Gly Ile Phe Ser
65                  70                  75                  80
Gln Lys Pro Leu Glu Lys Leu Val Ser Lys Ala Cys Thr Gly Pro Ala
                85                  90                  95
Arg Val Pro Val His Val Ala Thr Val Cys Leu Glu Arg Gly Leu Val
            100                 105                 110
His Tyr Gly Ile Ser Gly Asp Ser Asp Phe Glu Lys Lys Val Leu Ala
        115                 120                 125
Ser Ala Ala Ile Pro Gly Val Val Lys Pro Val Lys Ile His Gly Asp
    130                 135                 140
His Tyr Val Asp Gly Gly Val Arg Glu Ile Cys Pro Leu Arg Arg Ala
145                 150                 155                 160
Ile Asp Leu Gly Ala Thr Glu Ile Thr Val Ile Met Cys Ala Pro Glu
                165                 170                 175
Tyr Ile Pro Thr Trp Ser Arg Ser Ser Ser Leu Phe Pro Phe Val Asn
            180                 185                 190
Val Met Ile Arg Ser Leu Asp Ile Leu Thr Asp Glu Ile Leu Val Asn
        195                 200                 205
Asp Ile Ala Glu Cys Val Ala Lys Asn Lys Met Pro Gly Lys Arg His
    210                 215                 220
Val Lys Leu Thr Ile Tyr Arg Pro Lys Lys Glu Leu Met Gly Thr Leu
225                 230                 235                 240
Asp Phe Asp Pro Lys Ala Ile Ala Ala Gly Ile Lys Ala Gly Thr Glu
                245                 250                 255
Ala Gln Pro Arg Phe Trp Glu
            260
 
<210>35
<211>1389
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>35
atgcccgagc cgcccgccgc atgccgttgc gattgcgcct gcgagcgcga ccagcacctt     60
ttttgcaagg gacccaagcg tatcctcgcg ctcgacggcg gcggcgtgcg cggcgccgtc    120
agcgtcgcat tcctcgaacg gatcgaggcg gtgctcgagg cccggctcgg acgcaaggtg    180
ctgctcggcc actggttcga cctgatcggc ggcacctcga cgggcgccat catcggcggc    240
gcgctggcga tgggattcgc ggccgaggac gtccaaagat tctatcacga gctcgcgccg    300
cgggtgttca ggcatccgct cctgcgcatc ggtctcctgc gcccgttccg cgcgaaattc    360
gacgcccgcc tgctgcgcga ggagatccac cgcatcatcg gcgacagcac gctcggcgac    420
aaagcgctga tgaccgggtt cgcgctcgtc gccaagcgga tggacaccgg cagcacctgg    480
atcctcgcca acaacaagcg cagcaaatac tgggaagggc gggacggcgt cgtcggcaac    540
aaggattatc tcctcggcag cctcattcgc gcgagcacgg cggcgccgct gtatttcgac    600
cccgaggagg tcgtgatcgc ggaggcccgc aaggacatcg agggcatcag gggcctgttc    660
gtcgacggcg gcgtcacgcc gcacaacaat ccttcgctcg cgatgctgct gctggcgctg    720
ctcgacgcct accggctgcg ctgggaaacg ggaccggaca agctcacggt cgtctcgatc    780
ggcactggaa cgcatcgcga ccgcgtcgtt cccgacacgc tcggcatggg caagaacgcg    840
aagatcgcgc tgcgcgccat gagctcgctg atgaacgacg tgcacgagct cgcgctcacg    900
cagatgcagt acctcggtga gacgctcacc ccgtggcgca tcaacgacga gctcggcgac     960
atgcggaccg agcggccgcc gcaaggcaag ctcttccgct tcctccgcta cgacgtccgg    1020
ctggagctcg attggatcaa cgaggacgag gagcgccggc gcaagatcaa gaacaaattc    1080
aagcgcgagc tgaccgagac cgacatgatc cgcctgcgca gcctcgacga tccgacgacc    1140
atcccggacc tctacatgct tgcccaggtc gcggccgagg agcaggtcaa ggcggagcac    1200
tggctcggcg acgtgccgga gtggagcgaa ggcgcgcgcc cgtgtgcgcc gcgccggcac    1260
ctgccgccga cgccgccggg ccgctccgag gattcggcgc gcttccgggc cgagaaggcc    1320
gtcggcgagt ggctcagttt tgcgcgcgcg aacatcacgc gcctcatgtc gcggaagccg    1380
ccgggttga                                                            1389
 
<210>36
<211>462
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>36
Met Pro Glu Pro Pro Ala Ala Cys Arg Cys Asp Cys Ala Cys Glu Arg
 1               5                  10                  15
Asp Gln His Leu Phe Cys Lys Gly Pro Lys Arg Ile Leu Ala Leu Asp
            20                  25                  30
Gly Gly Gly Val Arg Gly Ala Val Ser Val Ala Phe Leu Glu Arg Ile
        35                  40                  45
Glu Ala Val Leu Glu Ala Arg Leu Gly Arg Lys Val Leu Leu Gly His
    50                  55                  60
Trp Phe Asp Leu Ile Gly Gly Thr Ser Thr Gly Ala Ile Ile Gly Gly
65                  70                  75                  80
Ala Leu Ala Met Gly Phe Ala Ala Glu Asp Val Gln Arg Phe Tyr His
                85                  90                  95
Glu Leu Ala Pro Arg Val Phe Arg His Pro Leu Leu Arg Ile Gly Leu
            100                 105                 110
Leu Arg Pro Phe Arg Ala Lys Phe Asp Ala Arg Leu Leu Arg Glu Glu
        115                 120                 125
Ile His Arg Ile Ile Gly Asp Ser Thr Leu Gly Asp Lys Ala Leu Met
    130                 135                 140
Thr Gly Phe Ala Leu Val Ala Lys Arg Met Asp Thr Gly Ser Thr Trp
145                 150                 155                 160
Ile Leu Ala Asn Asn Lys Arg Ser Lys Tyr Trp Glu Gly Arg Asp Gly
                165                 170                 175
Val Val Gly Asn Lys Asp Tyr Leu Leu Gly Ser Leu Ile Arg Ala Ser
            180                 185                 190
Thr Ala Ala Pro Leu Tyr Phe Asp Pro Glu Glu Val Val Ile Ala Glu
        195                 200                 205
Ala Arg Lys Asp Ile Glu Gly Ile Arg Gly Leu Phe Val Asp Gly Gly
    210                 215                 220
Val Thr Pro His Asn Asn Pro Ser Leu Ala Met Leu Leu Leu Ala Leu
225                 230                 235                 240
Leu Asp Ala Tyr Arg Leu Arg Trp Glu Thr Gly Pro Asp Lys Leu Thr
                245                 250                 255
Val Val Ser Ile Gly Thr Gly Thr His Arg Asp Arg Val Val Pro Asp
            260                 265                 270
Thr Leu Gly Met Gly Lys Asn Ala Lys Ile Ala Leu Arg Ala Met Ser
        275                 280                 285
Ser Leu Met Asn Asp Val His Glu Leu Ala Leu Thr Gln Met Gln Tyr
    290                 295                 300
Leu Gly Glu Thr Leu Thr Pro Trp Arg Ile Asn Asp Glu Leu Gly Asp
305                 310                 315                 320
Met Arg Thr Glu Arg Pro Pro Gln Gly Lys Leu Phe Arg Phe Leu Arg
                325                 330                 335
Tyr Asp Val Arg Leu Glu Leu Asp Trp Ile Asn Glu Asp Glu Glu Arg
            340                 345                 350
Arg Arg Lys Ile Lys Asn Lys Phe Lys Arg Glu Leu Thr Glu Thr Asp
        355                 360                 365
Met Ile Arg Leu Arg Ser Leu Asp Asp Pro Thr Thr Ile Pro Asp Leu
    370                 375                 380
Tyr Met Leu Ala Gln Val Ala Ala Glu Glu Gln Val Lys Ala Glu His
385                 390                 395                 400
Trp Leu Gly Asp Val Pro Glu Trp Ser Glu Gly Ala Arg Pro Cys Ala
                405                 410                 415
Pro Arg Arg His Leu Pro Pro Thr Pro Pro Gly Arg Ser Glu Asp Ser
            420                 425                 430
Ala Arg Phe Arg Ala Glu Lys Ala Val Gly Glu Trp Leu Ser Phe Ala
        435                 440                 445
Arg Ala Asn Ile Thr Arg Leu Met Ser Arg Lys Pro Pro Gly
    450                 455                 460
 
<210>37
<211>1329
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>37
atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt     60
gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta    120
acccgccgct cggcgctgga actgctgaat gccgacsatc tggtcggcaa tgacccggcc    180
gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag    240
aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac    300
gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg    360
gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat    420
gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac    480
gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa    540
gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac    600
aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac    660
accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc    720
tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc    780
gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc    840
aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt    900
attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag    960
gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa   1020
gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg   1080
ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg   1140
gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc   1200
gatctgaatg atccacacat ggatattccg tacsactggc aatgggtgtc gtcgacgcaa   1260
tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca   1320
gtcgtcatc                                                           1329
 
<210>38
<211>443
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
 
<400>38
Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala
 1               5                  10                  15
Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala
            20                  25                  30
Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu
        35                  40                  45
Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu
    50                  55                  60
Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln
65                  70                  75                  80
Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr
                85                  90                  95
Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp
            100                 105                 110
Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile
        115                 120                 125
Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp
    130                 135                 140
His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn
145                 150                 155                 160
Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala
                165                 170                 175
Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr
            180                 185                 190
Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala
        195                 200                 205
Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu Hi s Thr Val Arg Leu
    210                 215                 220
Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys
225                 230                 235                 240
Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn
                245                 250                 255
Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala
            260                 265                 270
Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val
        275                 280                 285
Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met
    290                 295                 300
Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln
305                 310                 315                 320
Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn
                325                 330                 335
Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro
            340                 345                 350
Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu
        355                 360                 365
Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln
    370                 375                 380
Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly
385                 390                 395                 400
Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val
                405                 410                 415
Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln
            420                 425                 430
Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile
        435                 440
 
<210>39
<211>1335
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>39
atggccaacc ccatcgtcat catccacggc tggagcgacg acttcggctc gttccgcaag     60
ctgcgcgact tcctctccac caacctcggc gttccggcga agatcctcaa gctcggcgac    120
tggatctcgc tcgacgacga cgtcggctac gccgacatcg cgatggcgct ggaacgcgcg    180
tggaaggcgg agaaactgcc gaccgcgccg cgttcggtcg acgtcgtcgt gcacagcacc    240
ggcgcgctgg tggtgcgcga atggatgacg cgctaccacg cgcccgaaac cgtgccgatc    300
cagcgcttcc tgcacctggc gccggccaac ttcggctcgc acctcgcgca caagggccgc    360
tcgttcatcg gccgcgcggt gaagggctgg aagaccggct tcgaaaccgg cacccgcatc    420
ctgcgcgggc tggaactcgc ctcgccctac tcgcgcgcgc tggccgagcg cgacctgttc    480
gtggcgccgt cgaagcgctg gtacggcgcc ggccgcatcc tcgccaccgt gctggtcggc    540
aacagcggct actccggcat ccaggccatc gccaacgagg acggctccga cggcaccgtg    600
cgcatcggca ccgccaacct gcaggcggcg cttgcgaagg tggtgttccc gcccggcccg    660
gtcgcgccgg tggtgcagtt ccgcaacatc gcgggcgcca ccgcgttcgc catcgtcgac    720
ggcgacaacc attccgacat caccatgaag gacaagccgt cgaagaccgg catccgcgag    780
gaactgatcc tcggcgcgct gaaggtgcgc gacgccgact tccccgagaa cgccgacggc    840
gcgttcccgt ggcaggcgaa gctcgacgcg aaggccggtg cggccaaggt gtcttcgccc    900
gggcgccaga acaccgtggt gcacctcacc gacagcttcg gcgacgacgt cgtcgatttc    960
ttcttcgagt tctggcgcag cgaacgcagc gacaaggtgt tcgagcagcg cttctacaag   1020
gacgtcatcg acgacgtgca cgtgtacgac ggcaacggcg cgtggcgctc gctcaacctc   1080
gacctcgaca agttcgaggc gctgcgcaag gacccgaagc tcggcttcga gaaactgctg   1140
gtcagcgtgt tcgcctcgcc cgcgaagaag ggcgacgcca aggtcggcta cagcaccgcc   1200
accggccgcg acatcggcgc ctggcacgtc gaaggccgtg acttcgccaa ggccttcacg   1260
ccgcaccgca ccctgttcgt cgacatcgag atcccacgca tcgtcgacga cgcggtgttc   1320
cggttccggg aatag                                                    1335
 
<210>40
<211>444
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>40
Met Ala Asn Pro Ile Val Ile Ile His Gly Trp Ser Asp Asp Phe Gly
 1               5                  10                  15
Ser Phe Arg Lys Leu Arg Asp Phe Leu Ser Thr Asn Leu Gly Val Pro
            20                  25                  30
Ala Lys Ile Leu Lys Leu Gly Asp Trp Ile Ser Leu Asp Asp Asp Val
        35                  40                  45
Gly Tyr Ala Asp Ile Ala Met Ala Leu Glu Arg Ala Trp Lys Ala Glu
    50                  55                  60
Lys Leu Pro Thr Ala Pro Arg Ser Val Asp Val Val Val His Ser Thr
65                  70                  75                  80
Gly Ala Leu Val Val Arg Glu Trp Met Thr Arg Tyr His Ala Pro Glu
                85                  90                  95
Thr Val Pro Ile Gln Arg Phe Leu His Leu Ala Pro Ala Asn Phe Gly
            100                 105                 110
Ser His Leu Ala His Lys Gly Arg Ser Phe Ile Gly Arg Ala Val Lys
        115                 120                 125
Gly Trp Lys Thr Gly Phe Glu Thr Gly Thr Arg Ile Leu Arg Gly Leu
    130                 135                 140
Glu Leu Ala Ser Pro Tyr Ser Arg Ala Leu Ala Glu Arg Asp Leu Phe
145                 150                 155                 160
Val Ala Pro Ser Lys Arg Trp Tyr Gly Ala Gly Arg Ile Leu Ala Thr
                165                 170                 175
Val Leu Val Gly Asn Ser Gly Tyr Ser Gly Ile Gln Ala Ile Ala Asn
            180                 185                 190
Glu Asp Gly Ser Asp Gly Thr Val Arg Ile Gly Thr Ala Asn Leu Gln
        195                 200                 205
Ala Ala Leu Ala Lys Val Val Phe Pro Pro Gly Pro Val Ala Pro Val
    210                 215                 220
Val Gln Phe Arg Asn Ile Ala Gly Ala Thr Ala Phe Ala Ile Val Asp
225                 230                 235                 240
Gly Asp Asn His Ser Asp Ile Thr Met Lys Asp Lys Pro Ser Lys Thr
                245                 250                 255
Gly IIe Arg Glu Glu Leu Ile Leu Gly Ala Leu Lys Val Arg Asp Ala
            260                 265                 270
Asp Phe Pro Glu Asn Ala Asp Gly Ala Phe Pro Trp Gln Ala Lys Leu
        275                 280                 285
Asp Ala Lys Ala Gly Ala Ala Lys Val Ser Ser Pro Gly Arg Gln Asn
    290                 295                 300
Thr Val Val His Leu Thr Asp Ser Phe Gly Asp Asp Val Val Asp Phe
305                 310                 315                 320
Phe Phe Glu Phe Trp Arg Ser Glu Arg Ser Asp Lys Val Phe Glu Gln
                325                 330                 335
Arg Phe Tyr Lys Asp Val Ile Asp Asp Val His Val Tyr Asp Gly Asn
            340                 345                 350
Gly Ala Trp Arg Ser Leu Asn Leu Asp Leu Asp Lys Phe Glu Ala Leu
        355                 360                 365
Arg Lys Asp Pro Lys Leu Gly Phe Glu Lys Leu Leu Val Ser Val Phe
    370                 375                 380
Ala Ser Pro Ala Lys Lys Gly Asp Ala Lys Val Gly Tyr Ser Thr Ala
385                 390                 395                 400
Thr Gly Arg Asp Ile Gly Ala Trp His Val Glu Gly Arg Asp Phe Ala
                405                 410                 415
Lys Ala Phe Thr Pro His Arg Thr Leu Phe Val Asp Ile Glu Ile Pro
            420                 425                 430
Arg Ile Val Asp Asp Ala Val Phe Arg Phe Arg Glu
        435                 440
 
<210>41
<211>1419
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>41
atgacgctcc gatcaacgga ctatgcgctg ctggcgcagg agagctacca cgacagccag     60
gtggacgccg acgtcaagct ggatggcgtg gcgtataaag tcttcgccac caccagcgac    120
gggctcaccg gattccaggc cacggcctac cagcgccagg acaccggcga ggtagtgatt    180
gcgtaccgcg gcacggagtt tgatcgcgag cccgtccgcg acggcggcgt cgatgcgggc    240
atggtgctgc tcggtgtcaa cgcacaggca ccagcgtcgg aagtgttcac ccggcaagtg    300
atcgagaagg cgaaacacga agccgagctc aacgaccgcg aaccgcagat caccgtcacc    360
ggccattccc tcggcggcac cctcgccgag atcaacgccg cgaagtacgg cctccatggc    420
gaaaccttca acgcctacgg cgcagccagc ctcaagggta ttccggaggg cggcgatacc    480
gtcatcgacc acgtccgtgc cggcgatctc gtcagcgcgg ccagccccca ctacgggcag    540
gtacgcgtct acgcggcgca gcaggacatc gatacgctgc aacacgccgg ttaccgcgat    600
gacagcggca tcctcagctt gcgcaacccg atcaaggcca cggatttcga tgcccatgcc    660
atcgataact tcgtgcccaa cagcaagctg ctcggtcagt cgatcatcgc gccggaaaac    720
gtggcgcgtt acgatgccca caaaggcatg gtcgaccgtt accgcgatga cgtggccgat    780
atccgcaagg gcatctcggc gccctgggaa atccccaagg ccatcggcga gctgaaggac    840
accctggagc acgaagcctt cgaactcgcc ggcaagggca ttctcgcggt ggagcacggc    900
ttcgaacatc tcaaggagga gatcggcgaa ggcatccacg ccgtggagga gaaagcttcc    960
agcgcgtggc ataccctcac ccatcccaag gaatggttcg agcacgataa acccaaggtg   1020
accctggacc acccggacca ccccgaccat gccctgttca agcaggcgca gggcgcggtg    1080
cacacagtcg atgcctcgca cggccgcacc cctgacaaga ccagcgacca gatcgccggc    1140
tcgctggtgg tatcggcacg ccgtgacggc cttgagcggg tagaccgcgc tgtactcagc    1200
gatgacgcca accgcctgta cggtgtgcag ggtgcggtgg actcgccgct gaagcaggtc    1260
accgaagtga acaccgccac cgccgcgcag acatcgctcc agcagagcag cgtggcctgg    1320
cagcaacagg cagaaatcgc gcgtcagaac caggcggcaa gccaggctca gcgcatggac    1380
cagcaggtgc cgccgcaggc acccgcgcac ggcatgtaa                           1419
 
<210>42
<211>472
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>42
Met Thr Leu Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Val Ala Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Ser Asp Gly Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ala Pro Ala Ser Glu Val Phe
                85                  90                  95
Thr Arg Gln Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Gln Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Val Ala Arg Tyr Asp Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro
            260                 265                 270
Lys Ala Ile Gly Glu Leu Lys Asp Thr Leu Glu His Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Phe Glu His Leu
    290                 295                 300
Lys Glu Glu Ile Gly Glu Gly Ile His Ala Val Glu Glu Lys Ala Ser
305                 310                 315                 320
Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu His Asp
                325                 330                 335
Lys Pro Lys Val Thr Leu Asp His Pro Asp His Pro Asp His Ala Leu
            340                 345                 350
Phe Lys Gln Ala Gln Gly Ala Val His Thr Val Asp Ala Ser His Gly
        355                 360                 365
Arg Thr Pro Asp Lys Thr Ser Asp Gln Ile Ala Gly Ser Leu Val Val
    370                 375                 380
Ser Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val Leu Ser
385                 390                 395                 400
Asp Asp Ala Asn Arg Leu Tyr Gly Val Gln Gly Ala Val Asp Ser Pro
                405                 410                 415
Leu Lys Gln Val Thr Glu Val Asn Thr Ala Thr Ala Ala Gln Thr Ser
            420                 425                 430
Leu Gln Gln Ser Ser Val Ala Trp Gln Gln Gln Ala Glu Ile Ala Arg
        435                 440                 445
Gln Asn Gln Ala Ala Ser Gln Ala Gln Arg Met Asp Gln Gln Val Pro
    450                 455                 460
Pro Gln Ala Pro Ala His Gly Met
465                 470
 
<210>43
<211>1287
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>43
atgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg     60
aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg    120
gtcgaggttc tcggtgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca    180
gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg    240
gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc    300
tccgggatca caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac    360
gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc    420
tggatcagag acctgattgc acagcgagtc gaggcagggc gctcagaggt gctgagccga    480
gccgacgccg acgggcggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca    540
tttgccgaac ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc    600
ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg    660
gacatgccga tcgacgtcgc ggtacgcatc tcggcatcgt tgccatggtt tttcaaatcc    720
gtgaaatgga acggctccga atacatagat ggcggatgcc tgtcgaactt cccaatgccg    780
atattcgacg tcgatcccta tcgtggcgac gcatcgtcga agatccggct cggcatcttc    840
ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatc    900
ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg    960
aaagcctcgg cagaacactg ggtcgtcggc atcgatgtcg agggcgccac ccgcgcgtcg   1020
aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat   1080
agcacgttca agttcgatct ctcagacgcg gacaaggagc gcatggccga ggccggcgca   1140
aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt   1200
tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat   1260
tcgtttcgag ccttgatcgc ggcctag                                       1287
 
<210>44
<211>428
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>44
Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile
 1               5                  10                  15
Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro
            20                  25                  30
Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly
        35                  40                  45
Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met
    50                  55                  60
Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala
65                  70                  75                  80
Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr
                85                  90                  95
Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys
            100                 105                 110
Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly Thr Ser Asp Glu Arg
        115                 120                 125
Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp
    130                 135                 140
Leu Ile Ala Gln Arg Val Glu Ala GIy Arg Ser Glu Val Leu Ser Arg
145                 150                 155                 160
Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys
                165                 170                 175
Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro
            180                 185                 190
Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser
        195                 200                 205
Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile
    210                 215                 220
Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser
225                 230                 235                 240
Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn
                245                 250                 255
Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp Ala Ser
            260                 265                 270
Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly
        275                 280                 285
Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser
    290                 295                 300
Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val
305                 310                 315                 320
Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala
                325                 330                 335
Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr
            340                 345                 350
Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser
        355                 360                 365
Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg
    370                 375                 380
Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe
385                 390                 395                 400
Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala
                405                 410                 415
Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala
            420                 425
 
<210>45
<211>1038
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>45
atgacaaccc aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga    120
gggtgcagtg cgggtgcgat taatgcgctg atttttgcgc tgggttacac ggttcgtgag    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggtgtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaatg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcagcc gtgcgtcacg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt    600
gatctggcca aagatcccgg tgctgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgagcggcc cggtcatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgtcttg atagtcgcga gcagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacattg    900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcccgtg   1020
aatagagtgg agtcatag                                                 1038
 
<210>46
<211>345
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>46
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Asn Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Gln Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
 
<210>47
<211>1476
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>47
atgtcaacaa aagtagtatt tgtacatgga tggagcgtta ccaacctaaa tacatatggc     60
gaacttccgt tgagattaaa ggccgaagca ataagcagga acctgaacat cgaagtaaat    120
gaaattttcc tgggccgtta tatcagcttt aatgataaca ttacattaga tgacgtttcg    180
cgggctttta atacggccat tagcgaacag ttagacaata cagacaggtt tatatgtatt    240
acacattcta ccggagggcc ggttattcgc gaatggttaa ataaatacta ttataatgaa    300
cgtccaccac taagtcattt aataatgctt gcaccggcca attttggttc ggcattggct    360
cgtttaggga aaagtaaatt aagccgtatt aaaagttggt ttgaaggtgt agaaccaggg    420
cagaaaattt tagactggct ggagtgtgga agcaaccaat cgtggttact aaataaagac    480
tggatcgaca atggcaattt tcagattggc gctgataagt atttcccgtt tgttatcatt    540
ggccagtcga ttgatcgtaa actttacgat catcttaact catataccgg cgagcttggg    600
tccgatggtg tagttcgcac ctcaggagct aatcttaatt cgcggtatat taagcttgtt    660
caggacagaa atacaatagc taatggaaat atttccagta cattacgaat tgccgaatat    720
agagaagctt gtgcaacgcc catacgggta gttagaggta aatcgcattc gggcgatgaa    780
atgggtatca tgaaaagtgt taaaaaagaa attactgatg ccggaagcaa ggaaacaata    840
aatgccatat tcgagtgtat tgaagttaca aacaacgaac aatatcaatc cttaattact    900
aaatttgata acgaaacagc acaggtacaa aaggatgagc tgattgaaac ggaaacagaa    960
ttatttttaa tgcaccgtca tttcattcac gaccgctttt cgcaattcat ttttaaagta   1020
actgactcag aagggcaacc tgttacagat tatgatttaa tttttacagc cgggccacaa   1080
aacgatgcga accacttacc ggaaggattt gccattgaca ggcaacaaaa ttcaaataat   1140
aacgaaacca ttacgtatta ttttaattac gatgtattga aaggggctcc cgcaaatgtt   1200
taccgggacg cattaccagg tatttctatg ctggggctaa ccataaaccc aaggccggac   1260
gaaggttttg taagatatat cccatgcagc attaaagcca attccgagtt gatggaaaaa   1320
gcctttaaac caaattctac taccttggtc gatattgtta ttcaacgtgt agttagcaaa   1380
gaagtttttc ggttggaaaa gttaactggt agctcaatgc caacagacaa agatgggaat   1440
tttaaaaata ctgaacctgg taacgaaata atatga                             1476
 
<210>48
<211>491
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>48
Met Ser Thr Lys Val Val Phe Val His Gly Trp Ser Val Thr Asn Leu
 1               5                  10                  15
Asn Thr Tyr Gly Glu Leu Pro Leu Arg Leu Lys Ala Glu Ala Ile Ser
            20                  25                  30
Arg Asn Leu Asn Ile Glu Val Asn Glu Ile Phe Leu Gly Arg Tyr Ile
        35                  40                  45
Ser Phe Asn Asp Asn Ile Thr Leu Asp Asp Val Ser Arg Ala Phe Asn
    50                  55                  60
Thr Ala Ile Ser Glu Gln Leu Asp Asn Thr Asp Arg Phe Ile Cys Ile
65                  70                  75                  80
Thr His Ser Thr Gly Gly Pro Val Ile Arg Glu Trp Leu Asn Lys Tyr
                85                  90                  95
Tyr Tyr Asn Glu Arg Pro Pro Leu Ser His Leu Ile Met Leu Ala Pro
            100                 105                 110
Ala Asn Phe Gly Ser Ala Leu Ala Arg Leu Gly Lys Ser Lys Leu Ser
        115                 120                 125
Arg Ile Lys Ser Trp Phe Glu Gly Val Glu Pro Gly Gln Lys Ile Leu
    130                 135                 140
Asp Trp Leu Glu Cys Gly Ser Asn Gln Ser Trp Leu Leu Asn Lys Asp
145                 150                 155                 160
Trp Ile Asp Asn Gly Asn Phe Gln Ile Gly Ala Asp Lys Tyr Phe Pro
                165                 170                 175
Phe Val Ile Ile Gly Gln Ser Ile Asp Arg Lys Leu Tyr Asp His Leu
            180                 185                 190
Asn Ser Tyr Thr Gly Glu Leu Gly Ser Asp Gly Val Val Arg Thr Ser
        195                 200                 205
Gly Ala Asn Leu Asn Ser Arg Tyr Ile Lys Leu Val Gln Asp Arg Asn
    210                 215                 220
Thr Ile Ala Asn Gly Asn Ile Ser Ser Thr Leu Arg Ile Ala Glu Tyr
225                 230                 235                 240
Arg Glu Ala Cys Ala Thr Pro Ile Arg Val Val Arg Gly Lys Ser His
                245                 250                 255
Ser Gly Asp Glu Met Gly Ile Met Lys Ser Val Lys Lys Glu Ile Thr
            260                 265                 270
Asp Ala Gly Ser Lys Glu Thr Ile Asn Ala Ile Phe Glu Cys Ile Glu
        275                 280                 285
Val Thr Asn Asn Glu Gln Tyr Gln Ser Leu Ile Thr Lys Phe Asp Asn
    290                 295                 300
Glu Thr Ala Gln Val Gln Lys Asp Glu Leu Ile Glu Thr Glu Thr Glu
305                 310                 315                 320
Leu Phe Leu Met His Arg His Phe Ile His Asp Arg Phe Ser Gln Phe
                325                 330                 335
Ile Phe Lys Val Thr Asp Ser Glu Gly Gln Pro Val Thr Asp Tyr Asp
            340                 345                 350
Leu Ile Phe Thr Ala Gly Pro Gln Asn Asp Ala Asn His Leu Pro Glu
        355                 360                 365
Gly Phe Ala Ile Asp Arg Gln Gln Asn Ser Asn Asn Asn Glu Thr Ile
    370                 375                 380
Thr Tyr Tyr Phe Asn Tyr Asp Val Leu Lys Gly Ala Pro Ala Asn Val
385                 390                 395                 400
Tyr Arg Asp Ala Leu Pro Gly Ile Ser Met Leu Gly Leu Thr Ile Asn
                405                 410                 415
Pro Arg Pro Asp Glu Gly Phe Val Arg Tyr Ile Pro Cys Ser Ile Lys
            420                 425                 430
Ala Asn Ser Glu Leu Met Glu Lys Ala Phe Lys Pro Asn Ser Thr Thr
        435                 440                 445
Leu Val Asp Ile Val Ile Gln Arg Val Val Ser Lys Glu Val Phe Arg
    450                 455                 460
Leu Glu Lys Leu Thr Gly Ser Ser Met Pro Thr Asp Lys Asp Gly Asn
465                 470                 475                 480
Phe Lys Asn Thr Glu Pro Gly Asn Glu Ile Ile
                485                 490
 
<210>49
<211>1257
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>49
atgaattttt ggtcctttct tcttagtata accttaccta tgggggtagg cgttgctcat     60
gcacagcccg atacggattt tcaatcggct gagccttatg tctcttctgc gccaatgggg    120
cgacaaactt atacttacgt gcgttgttgg tatcgcacca gccacagtac ggatgatcca    180
gcgacagatt ggcagtgggc gagaaactcc gatggtagct attttacttt gcaaggatac    240
tggtggagct cggtaagact aaaaaatatg ttttacactc aaacctcgca aaatgttatt    300
cgtcagcgct gcgaacacac tttaagcatt aatcatgata atgcggatat tactttttat    360
gcggcggata atcgtttctc attaaaccat acgatttggt cgaatgatcc tgtcatgcag    420
gctaatcaaa tcaacaagat tgtcgcgttt ggtgacagct tgtccgatac cggtaatatt    480
tttaatgccg cgcagtggcg ttttcctaat cccaatagtt ggtttttggg gcatttttct    540
aacggtttgg tatggactga gtacttagct aaacagaaaa acttaccgat atataactgg    600
gcggttggtg gcgctgctgg ggcgaatcaa tatgtggcgt taaccggtgt tacaggccaa    660
gtgaactctt atttacagta catgggtaaa gcgcaaaact atcgtccaca gaataccttg    720
tacactttgg tcttcggttt gaatgatttt atgaattata accgtgaggt tgctgaggtg    780
gcggctgatt ttgaaacggc attacagcgt ttaacgcaag ctggcgcgca aaatatttta    840
atgatgacgc taccggatgt gactaaagca ccacagttta cctactcaac tcaagcggaa    900
atcgacttga ttcaaggtaa aatcaatgcg ttgaacatca agttaaaaca gttgactgcg    960
caatatattt tacaaggcta tgccattcat ctatttgata cttatgagtt atttgattca   1020
atggtcgctg aaccggaaaa gcatggcttt gctaatgcca gtgaaccttg tttgaatctc   1080
acccgttctt cagcggcgga ttatttgtac cgtcatccca ttaccaatac ttgtgctcgt   1140
tatggtgcag acaaatttgt attttgggat gtcacccatc caaccacggc aactcatcgc   1200
tatatttcac aaacgctgtt agcgccgggt aatggattac aatattttaa tttttaa      1257
 
<210>50
<211>418
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
 
<400>50
Met Asn Phe Trp Ser Phe Leu Leu Ser Ile Thr Leu Pro Met Gly Val
 1               5                  10                  15
Gly Val Ala His Ala Gln Pro Asp Thr Asp Phe Gln Ser Ala Glu Pro
            20                  25                  30
Tyr Val Ser Ser Ala Pro Met Gly Arg Gln Thr Tyr Thr Tyr Val Arg
        35                  40                  45
Cys Trp Tyr Arg Thr Ser His Ser Thr Asp Asp Pro Ala Thr Asp Trp
    50                  55                  60
Gln Trp Ala Arg Asn Ser Asp Gly Ser Tyr Phe Thr Leu Gln Gly Tyr
65                  70                  75                  80
Trp Trp Ser Ser Val Arg Leu Lys Asn Met Phe Tyr Thr Gln Thr Ser
                85                  90                  95
Gln Asn Val Ile Arg Gln Arg Cys Glu His Thr Leu Ser Ile Asn His
            100                 105                 110
Asp Asn Ala Asp Ile Thr Phe Tyr Ala Ala Asp Asn Arg Phe Ser Leu
        115                 120                 125
Asn His Thr Ile Trp Ser Asn Asp Pro Val Met Gln Ala Asn Gln Ile
    130                 135                 140
Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Ile
145                 150                 155                 160
Phe Asn Ala Ala Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp Phe Leu
                165                 170                 175
Gly His Phe Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Lys Gln
            180                 185                 190
Lys Asn Leu Pro Ile Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Ala
        195                 200                 205
Asn Gln Tyr Val Ala Leu Thr Gly Val Thr Gly Gln Val Asn Ser Tyr
    210                 215                 220
Leu Gln Tyr Met Gly Lys Ala Gln Asn Tyr Arg Pro Gln Asn Thr Leu
225                 230                 235                 240
Tyr Thr Leu Val Phe Gly Leu Asn Asp Phe Met Asn Tyr Asn Arg Glu
                245                 250                 255
Val Ala Glu Val Ala Ala Asp Phe Glu Thr Ala Leu Gln Arg Leu Thr
            260                 265                 270
Gln Ala Gly Ala Gln Asn Ile Leu Met Met Thr Leu Pro Asp Val Thr
        275                 280                 285
Lys Ala Pro Gln Phe Thr Tyr Ser Thr Gln Ala Glu Ile Asp Leu Ile
    290                 295                 300
Gln Gly Lys Ile Asn Ala Leu Asn Ile Lys Leu Lys Gln Leu Thr Ala
305                 310                 315                 320
Gln Tyr Ile Leu Gln Gly Tyr Ala Ile His Leu Phe Asp Thr Tyr Glu
                325                 330                 335
Leu Phe Asp Ser Met Val Ala Glu Pro Glu Lys His Gly Phe Ala Asn
            340                 345                 350
Ala Ser Glu Pro Cys Leu Asn Leu Thr Arg Ser Ser Ala Ala Asp Tyr
        355                 360                 365
Leu Tyr Arg His Pro Ile Thr Asn Thr Cys Ala Arg Tyr Gly Ala Asp
    370                 375                 380
Lys Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr His Arg
385                 390                 395                 400
Tyr Ile Ser Gln Thr Leu Leu Ala Pro Gly Asn Gly Leu Gln Tyr Phe
           405                 410                 415
Asn Phe
 
<210>51
<211>1482
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>51
atgacaatcc gctcaacgga ctatgcgctg ctcgcgcagg agagctacca cgacagccag     60
gtcgatgccg acgtcaaact cgatggcatc gcctacaagg tcttcgccac caccgatgac    120
ccgctcacgg ggttccaggc caccgcgtac cagcgccagg acaccggcga agtcgtcatc    180
gcctatcgtg gtacggaatt cgaccgcgag cccgttcgcg acggcggcgt cgatgccggc    240
atggtgctgc tgggggtgaa tgcccagtcg cctgcctccg agctatttac ccgcgaagtg    300
atcgagaagg cgacgcacga agccgaactc aatgaccgcg agccccggat caccgtgact    360
ggccactccc tcggcggcac cctcgccgaa atcaacgcgg ccaagtacgg cctgcacggc    420
gaaaccttca acgcatacgg tgcggccagc ctcaagggca tcccggaagg cggcaatacc    480
gtgatcgacc acgtgcgcgc tggcgacctc gtcagcgccg ccagcccgca ttacgggcag    540
gtgcgcgtct acgcggccca gcaggatatc gacaccttgc agcatgccgg ctaccgcgac    600
gacagcggca tccttagcct gcgcaacccg atcaaggcca cggatttcga cgcgcacgcc    660
atcgacaact tcgtgccgaa cagcaaactg cttggccagt cgatcatcgc gccggaaaac    720
gaagcccgtt acgaagccca caagggcatg gtcgaccgct accgcgatga cgtggctgac    780
atccgcatgc tcgtctccgc tcccctgaac atcccgcgca ccatcggcga tatcaaggat    840
gccgtggaac gcgaggcatt tgagctggct ggcaagggca tcctcgccgt tgaacacggc    900
atcgaagagg tcgtgcacga ggcaaaggaa ggcttcgagc acctcaagga aggctttgag    960
cacctgaagg aagaagtcag cgagggcttc catgccttcg aggaaaaggc ctccagcgcg   1020
tggcatacgc tgacccatcc caaggaatgg ttcgagcacg acaagccgca ggtcgccctg   1080
aaccacccac agcacccgga caacgaactg ttcaagaagg tgctcgaagg cgtgcaccag   1140
gttgatgcga agcagggtcg ttcacccgac cagctcagtg agaacctggc cgcatcgctt   1200
accgttgccg cacgcaagga aggcctggac aaggtcaacc acgtgctgct cgacgacccc   1260
ggcattcgca cctacgccgt gcagggtgag ctcaactcgc cgttgaagca ggtctccagt   1320
gtcgataacg cccaggcggt cgccacaccg gtggcccaga gcagcgcgca atggcagcag   1380
gctgccgagg cgcggcaggc acagcacaat gaggcgcttg cgcagcagca ggcgcaacag   1440
cagcagaaca accggcccaa ccatggggtt gccggcccgt ga                      1482
 
<210>52
<211>493
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>52
Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ala Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Leu Phe
                85                  90                  95
Thr Arg Glu Val Ile Glu Lys Ala Thr His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Arg Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asn Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Glu Ala Arg Tyr Glu Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Met Leu Val Ser Ala Pro Leu Asn Ile Pro
            260                 265                 270
Arg Thr Ile Gly Asp Ile Lys Asp Ala Val Glu Arg Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Ile Glu Glu Val
    290                 295                 300
Val His Glu Ala Lys Glu Gly Phe Glu His Leu Lys Glu Gly Phe Glu
305                 310                 315                 320
Hi s Leu Lys Glu Glu Val Ser Glu Gly Phe His Ala Phe Glu Glu Lys
                 325                 330                 335
Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu
            340                 345                 350
His Asp Lys Pro Gln Val Ala Leu Asn Hi s Pro Gln His Pro Asp Asn
        355                 360                 365
Glu Leu Phe Lys Lys Val Leu Glu Gly Val His Gln Val Asp Ala Lys
    370                 375                 380
Gln Gly Arg Ser Pro Asp Gln Leu Ser Glu Asn Leu Ala Ala Ser Leu
385                 390                 395                 400
Thr Val Ala Ala Arg Lys Glu Gly Leu Asp Lys Val Asn His Val Leu
                405                 410                 415
Leu Asp Asp Pro Gly Ile Arg Thr Tyr Ala Val Gln Gly Glu Leu Asn
            420                 425                 430
Ser Pro Leu Lys Gln Val Ser Ser Val Asp Asn Ala Gln Ala Val Ala
        435                 440                 445
Thr Pro Val Ala Gln Ser Ser Ala Gln Trp Gln Gln Ala Ala Glu Ala
    450                 455                 460
Arg Gln Ala Gln His Asn Glu Ala Leu Ala Gln Gln Gln Ala Gln Gln
465                 470                 475                 480
Gln Gln Asn Asn Arg Pro Asn His Gly Val Ala Gly Pro
                485                 490
 
<210>53
<211>1491
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>53
atgcgtcagg ttacattagt atttgttcat ggctacagcg ttacaaacat cgacacttat     60
ggtgaaatgc cactcaggct ccgcaacgaa ggagccacac gtgatataga aataaaaatt    120
gagaacattt tcctggggcg ctacatcagc tttaatgatg atgtgagatt aaatgatgtt    180
tccagagcat tggaaacagc cgtacaacaa cagattgcac cgggaaataa aaacaattcc    240
cgttacgtat tcatcaccca ctctaccggc ggaccggtag tgagaaactg gtgggatctg    300
tactataaaa acagcacgaa acaatgccct atgagccacc tcattatgct ggctcctgcc    360
aattttggct cggcactggc acaactggga aaaagcaaac taagccgcat taaatcctgg    420
ttcgatggtg tggaacccgg acagaatgta ttgaattggc tggaactggg aagcgcggaa    480
gcatggaagc taaacaccga ctggattaag agtgatggaa gtcagatctc ggcacagggt    540
atttttcctt ttgtgatcat aggtcaggac attgaccgca aattatacga tcatttaaac    600
tcctacaccg gtgagctggg ttccgacggc gtggtgcgtt cggccgcagc caatttaaat    660
gctacttatg taaaactcac acaacctaaa cccaccttgg taaatggaaa actggtaaca    720
ggtaatctgg aaataggaga agtaaaacaa gcgccttata cacccatgcg catcgtctca    780
aaaaaatcgc attccaacaa ggatatggga attatgagaa gtgtactgaa atcaacaaat    840
gatgccaaca gcgccgaaac ggtaaacgcc atttttgact gcattaatgt gaaaacctta    900
accgattacc agagcattgc cacacagttt gattcgcaaa caaaagacgt gcaggaaaat    960
tcaattattg aaagggaaaa aacgcccttt ggaactaaaa actatattca cgaccgtttc   1020
tcccaggtca ttttcagagt aacagacagt gaaggttacc cggttaccag ttttgatctg   1080
atcctcaccg gcggcgaaaa aaatgatccc aacgccttgc ctcagggctt ttttgtggac   1140
agacaatgca acagtgtcaa taaatcgacc attacttatt ttttaaatta cgatattatg   1200
aacggcacac cagctatagc aggtataaga ccggcatcca aaggcatgga aaaactgggt   1260
ctgatcatta acccaaggcc tgaagaaggc tttgtgcgtt acattccctg caaaataaac   1320
acatcgcccg atttgtttga cgccgctctg aaacccaacg ccacaacgct tattgatatt   1380
gtattgcaac gcgtggtaag taccgaagta ttccgctttg aaggaacaga cggggtaacg   1440
ccgcctaaaa aagatttctc gaaagtgaaa cccggaacgg atattatttg a            1491
 
<210>54
<211>496
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>54
Met Arg Gln Val Thr Leu Val Phe Val His Gly Tyr Ser Val Thr Asn
 1               5                  10                  15
Ile Asp Thr Tyr Gly Glu Met Pro Leu Arg Leu Arg Asn Glu Gly Ala
            20                  25                  30
Thr Arg Asp Ile Glu Ile Lys Ile Glu Asn Ile Phe Leu Gly Arg Tyr
        35                  40                  45
Ile Ser Phe Asn Asp Asp Val Arg Leu Asn Asp Val Ser Arg Ala Leu
    50                  55                  60
Glu Thr Ala Val Gln Gln Gln Ile Ala Pro Gly Asn Lys Asn Asn Ser
65                  70                  75                  80
Arg Tyr Val Phe Ile Thr His Ser Thr Gly Gly Pro Val Val Arg Asn
                85                  90                  95
Trp Trp Asp Leu Tyr Tyr Lys Asn Ser Thr Lys Gln Cys Pro Met Ser
            100                 105                 110
His Leu Ile Met Leu Ala Pro Ala Asn Phe Gly Ser Ala Leu Ala Gln
        115                 120                 125
Leu Gly Lys Ser Lys Leu Ser Arg Ile Lys Ser Trp Phe Asp Gly Val
    130                 135                 140
Glu Pro Gly Gln Asn Val Leu Asn Trp Leu Glu Leu Gly SerAla Glu
145                 150                 155                 160
Ala Trp Lys Leu Asn Thr Asp Trp Ile Lys Ser Asp Gly Ser Gln Ile
                165                 170                 175
Ser Ala Gln Gly Ile Phe Pro Phe Val Ile Ile Gly Gln Asp Ile Asp
            180                 185                 190
Arg Lys Leu Tyr Asp His Leu Asn Ser Tyr Thr Gly Glu Leu Gly Ser
        195                 200                 205
Asp Gly Val Val Arg Ser Ala Ala Ala Asn Leu Asn Ala Thr Tyr Val
    210                 215                 220
Lys Leu Thr Gln Pro Lys Pro Thr Leu Val Asn Gly Lys Leu Val Thr
225                 230                 235                 240
Gly Asn Leu Glu Ile Gly Glu Val Lys Gln Ala Pro Tyr Thr Pro Met
                245                 250                 255
Arg Ile Val Ser Lys Lys Ser His Ser Asn Lys Asp Met Gly Ile Met
            260                 265                 270
Arg Ser Val Leu Lys Ser Thr Asn Asp Ala Asn Ser Ala Glu Thr Val
        275                 280                 285
Asn Ala Ile Phe Asp Cys Ile Asn Val Lys Thr Leu Thr Asp Tyr Gln
    290                 295                 300
Ser Ile Ala Thr Gln Phe Asp Ser Gln Thr Lys Asp Val Gln Glu Asn
305                 310                 315                 320
Ser Ile Ile Glu Arg Glu Lys Thr Pro Phe Gly Thr Lys Asn Tyr Ile
                325                 330                 335
His Asp Arg Phe Ser Gln Val Ile Phe Arg Val Thr Asp Ser Glu Gly
            340                 345                 350
Tyr Pro Val Thr Ser Phe Asp Leu Ile Leu Thr Gly Gly Glu Lys Asn
        355                 360                 365
Asp Pro Asn Ala Leu Pro Gln Gly Phe Phe Val Asp Arg Gln Cys Asn
    370                 375                 380
Ser Val Asn Lys Ser Thr Ile Thr Tyr Phe Leu Asn Tyr Asp Ile Met
385                 390                 395                 400
Asn Gly Thr Pro Ala Ile Ala Gly Ile Arg Pro Ala Ser Lys Gly Met
                405                 410                 415
Glu Lys Leu Gly Leu Ile Ile Asn Pro Arg Pro Glu Glu Gly Phe Val
            420                 425                 430
Arg Tyr Ile Pro Cys Lys Ile Asn Thr Ser Pro Asp Leu Phe Asp Ala
        435                 440                 445
Ala Leu Lys Pro Asn Ala Thr Thr Leu Ile Asp Ile Val Leu Gln Arg
    450                 455                 460
Val Val Ser Thr Glu Val Phe Arg Phe Glu Gly Thr Asp Gly Val Thr
465                 470                 475                 480
Pro Pro Lys Lys Asp Phe Ser Lys Val Lys Pro Gly Thr Asp Ile Ile
                485                 490                 495
 
<210>55
<211>1041
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>55
atggcttcac aattcagaaa tctggttttt gaaggaggcg gtgtgaaggg catcgcctat    60
atcggcgcea tgcaggtgct ggagcagcgg ggactgctca aggatattgt ccgggtggga    120
ggtaccagtg caggcgccat caacgcgctg atcttttcgc tgggctttac catcaaagag    180
cagcaggata ttctcaactc caccaacttc agggagttta tggacagctc gttcgggttc    240
atccgaaact tccggaggtt atggagcgaa ttcggttgga accgcggcga tgtattttcg    300
gactgggccg gggagctggt gaaagagaag ctcggcaaaa agaacgccac gttcggcgat    360
ctgaaaaagg cgaaacgtcc cgatctgtac gtgatcggca ccaatctctc tacggggttt    420
tccgagacct tttcgcacga acgccacgcc gacatgcctc tggtagatgc ggtgcggata    480
agcatgtcga tcccgctctt ttttgctgca cggaggctgg gaaaacgtaa ggatgtgtat    540
gtggatggcg gggtgatgct caactatccc gtgaagctgt tcgacaggga gaagtatatc    600
gatttggaga aagagaatga ggcggcccgc tatgtggagt actacaatca agagaatgcc    660
cggtttctgc tcgagcggcc cggccgaagc ccttatgtgt ataaccggca gactctcggt    720
ctgcggctcg acacgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc    780
aagcagatca accgtttccc cgaatacgcc agagccctga tcggctcgct gatgcaggta    840
caggagaaca tccacctgaa aagtgacgac tggcagcgaa cgctctacat caacacgctg    900
gatgtgggca ccaccgattt cgacattacc gacgagaaga aaaaagtgct ggtgaatgag    960
gggatcaagg gagcggagac ctatttccgc tggtttgagg atcccgaaga aaaaccggtg   1020
aataaggtga atcttgtctg a                                             1041
 
<210>56
<211>346
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>56
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly Leu
            20                  25                  30
Leu Lys Asp Ile Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile
    50                  55                  60
Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe
65                  70                  75                  80
Ile Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly
                85                  90                  95
Asp Val Phe Ser Asp Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly
            100                 105                 110
Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe
    130                 135                 140
Ser His Glu Arg His Ala Asp Met Pro Leu Val Asp Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg
                165                 170                 175
Lys Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys
            180                 185                 190
Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Asn Glu Ala
        195                 200                 205
Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu
    210                 215                 220
Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Thr Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Arg Ala
            260                 265                 270
Leu Ile Gly Ser Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asp Ile Thr Asp Glu Lys Lys Lys Val Leu Val Asn Glu
305                 310                 315                 320
Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu
                325                 330                 335
Glu Lys Pro Val Asn Lys Val Asn Leu Val
            340                 345
 
<210>57
<211>1413
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
 
<400>57
atgcaattag tgttcgtaca cgggtggagt gttacccata ccaataccta tggtgaatta     60
cccgaaagtt tggcggcagg cgccgcgaca cacggcctgc agatcgatat caggcacgtt    120
tttctcggca agtacatcag ctttcacgat gaggtgactc tggatgatat agcacgtgcc    180
ttcgacaagg cgctgagaga catgtcgggt gatggtgaca cggtctcgcc tttctcctgt    240
atcacgcatt cgaccggcgg ccctgtcgtt cggcactgga ttaacaaatt ctacggcgcg    300
cgagggctat cgaaactgcc gctggagcat ttggttatgc tggcgcctgc caaccacggc    360
tccagcctgg cggtactcgg caagcaacgt cttggtcgca tcaagtcctg gttcgatggc    420
gtggagcccg gacaaaaagt gctcgactgg ctatcgctgg gcagcaatgg gcaatgggcg    480
ctcaacaggg attttttgag ctaccgcccg gccaaacatg gcttcttccc ttttgttctg    540
acgggccagg gtatagacac aaaattctac gattttttga acagctacct tgtggagccc    600
ggcagtgacg gtgtggttcg cgtggcgggt gccaatatgc attttcgcta cctctccctg    660
gtacaatctg agaccgtatt acacaccccg ggcaaggtgc tacagctgga atataacgag    720
cggcgccccg tgaagtcccc acaagcggta ccgatgggcg tcttctccca atttagccac    780
tctggcgaca agatggggat tatggcagtc aagcgcaaga aagacgcgca tcaaatgatc    840
gtaacggaag tgctgaagtg tctctgcgta tcggacagcg atgaatatca gcaaagaggc    900
cttgaacttg cagaactgac cgccagcgaa cagcgcaagc ccatcgaaga ccaggacaag    960
attatcagcc gctatagcat gctggtattt agagtgcgcg accaggcggg caatacgatc   1020
ggagtgcacg atttcgatat cctcttactg gccggagata cctatagccc cgacaaactg   1080
ccagaggggt tcttcatgga taaacaggcc aatagagatg ccggctcact gatctactat   1140
gtggatgccg acaaaatgtc cgagatgaaa gatggctgct acggactgcg ggtggtcgtg   1200
cggccggaga aagggttttc ctattacaca acaggtgagt tcaggtcaga gggtatcccc   1260
gtggaccgtg tatttgcagc aaacgaaacc acctatattg atatcaccat gaaccgaagt   1320
gtcgatcaaa atgtattccg gttttcgcct gcaacagagc cacctgaaag cttcaaaaga   1380
accacgccct caggtaccga tatcccttca tag                                1413
 
<210>58
<211>470
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>58
Met Gln Leu Val Phe Val His Gly Trp Ser Val Thr His Thr Asn Thr
 1               5                  10                  15
Tyr Gly Glu Leu Pro Glu Ser Leu Ala Ala Gly Ala Ala Thr His Gly
            20                  25                  30
Leu Gln Ile Asp Ile Arg His Val Phe Leu Gly Lys Tyr Ile Ser Phe
        35                  40                  45
His Asp Glu Val Thr Leu Asp Asp Ile Ala Arg Ala Phe Asp Lys Ala
    50                  55                  60
Leu Arg Asp Met Ser Gly Asp Gly Asp Thr Val Ser Pro Phe Ser Cys
65                  70                  75                  80
Ile Thr His Ser Thr Gly Gly Pro Val Val Arg His Trp Ile Asn Lys
                85                  90                  95
Phe Tyr Gly Ala Arg Gly Leu Ser Lys Leu Pro Leu Glu His Leu Val
            100                 105                 110
Met Leu Ala Pro Ala Asn His Gly Ser Ser Leu Ala Val Leu Gly Lys
        115                 120                 125
Gln Arg Leu Gly Arg Ile Lys Ser Trp Phe Asp Gly Val Glu Pro Gly
    130                 135                 140
Gln Lys Val Leu Asp Trp Leu Ser Leu Gly Ser Asn Gly Gln Trp Ala
145                 150                 155                 160
Leu Asn Arg Asp Phe Leu Ser Tyr Arg Pro Ala Lys His Gly Phe Phe
                165                 170                 175
Pro Phe Val Leu Thr Gly Gln Gly Ile Asp Thr Lys Phe Tyr Asp Phe
            180                 185                 190
Leu Asn Ser Tyr Leu Val Glu Pro Gly Ser Asp Gly Val Val Arg Val
        195                 200                 205
Ala Gly Ala Asn Met His Phe Arg Tyr Leu Ser Leu Val Gln Ser Glu
    210                 215                 220
Thr Val Leu His Thr Pro Gly Lys Val Leu Gln Leu Glu Tyr Asn Glu
225                 230                 235                 240
Arg Arg Pro Val Lys Ser Pro Gln Ala Val Pro Met Gly Val Phe Ser
                245                 250                 255
Gln Phe Ser His Ser Gly Asp Lys Met Gly Ile Met Ala Val Lys Arg
            260                 265                 270
Lys Lys Asp Ala His Gln Met Ile Val Thr Glu Val Leu Lys Cys Leu
        275                 280                 285
Cys Val Ser Asp Ser Asp Glu Tyr Gln Gln Arg Gly Leu Glu Leu Ala
    290                 295                 300
Glu Leu Thr Ala Ser Glu Gln Arg Lys Pro Ile Glu Asp Gln Asp Lys
305                 310                 315                 320
Ile Ile Ser Arg Tyr Ser Met Leu Val Phe Arg Val Arg Asp Gln Ala
                325                 330                 335
Gly Asn Thr Ile Gly Val His Asp Phe Asp Ile Leu Leu Leu Ala Gly
            340                 345                 350
Asp Thr Tyr Ser Pro Asp Lys Leu Pro Glu Gly Phe Phe Met Asp Lys
        355                 360                 365
Gln Ala Asn Arg Asp Ala Gly Ser Leu Ile Tyr Tyr Val Asp Ala Asp
    370                 375                 380
Lys Met Ser Glu Met Lys Asp Gly Cys Tyr Gly Leu Arg Val Val Val
385                 390                 395                 400
Arg Pro Glu Lys Gly Phe Ser Tyr Tyr Thr Thr Gly Glu Phe Arg Ser
                405                 410                 415
Glu Gly Ile Pro Val Asp Arg Val Phe Ala Ala Asn Glu Thr Thr Tyr
            420                 425                 430
Ile Asp Ile Thr Met Asn Arg Ser Val Asp Gln Asn Val Phe Arg Phe
        435                 440                 445
Ser Pro Ala Thr Glu Pro Pro Glu Ser Phe Lys Arg Thr Thr Pro Ser
    450                 455                 460
Gly Thr Asp Ile Pro Ser
465                 470
 
<210>59
<211>1038
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>59
atgacaacac aatttagaaa cttgatcttt gaaggcggcg gtgtaaaagg cgttgcttac     60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga    120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac ggtccgtgag    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggca gtgcgtcatg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt    600
gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgct gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacactc    900
gatgtgggta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
 
<210>60
<211>345
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>60
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
 
<210>61
<211>1257
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>61
atgacattaa aactctccct gctgatcgcg agcctgagcg ccgtgtctcc agcagtcttg     60
gcaaacgacg tcaatccagc gccactcatg gcgccgtccg aagcggattc cgcgcagacg    120
ctgggcagtc tgacgtacac ctatgttcgc tgctggtatc gtccggctgc gacgcataat    180
gatccttaca ccacctggga gtgggcgaag aacgcggacg gcagtgattt caccattgat    240
ggctattggt ggtcatcggt gagttacaaa aacatgttct ataccgatac tcagcccgat    300
accatcatgc agcgctgtgc agagacgttg gggttaaccc acgataccgc tgacatcacc    360
tatgccgcgg ccgatacccg tttctcctac aaccacacca tctggagcaa cgatgtcgcc    420
aacgcgccga gcaaaatcaa taaggtgatc gcctttggtg acagcctgtc agacacgggc    480
aacattttta acgcctcgca atggcgcttc ccgaacccga actcctggtt tgtcggccac    540
ttctcaaacg ggtttgtctg gaccgagtat ctggcgcaag gtttggggct gcccctctac    600
aactgggccg tgggcggcgc ggcggggcgc aatcaatact gggcgctgac tggcgtgaat    660
gaacaggtca gttcgtacct gacctacatg gagatggcgc cgaattaccg tgcggagaac    720
acgctgttta cactcgaatt cggtctgaat gattttatga actacgaccg ttcactggca    780
gacgtcaaag cagattacag ctcggcgctg attcgtctgg tggaagccgg agcgaaaaat    840
atggtgctgt tgaccctacc ggatgccacg cgcgcgccgc agttccaata ttcaacgcaa    900
gaacacatcg acgaggtgcg cgccaaagtg attggcatga acgcgttcat tcgtgagcag    960
gcacgctact tccagatgca gggcatcaac atttcgctgt ttgacgccta cacgctgttt   1020
gatcagatga tcgccgaccc agccgcgcac ggctttgata atgccagcgc gccatgtctt   1080
gatattcagc gcagctctgc ggcggactat ctctacacgc atgctctggc agccgagtgt   1140
gcctcatccg gttcagaccg ctttgtgttc tgggatgtga ctcacccaac cacggcaacg   1200
catcgctaca tcgccgacca cattctggct accggtgttg cgcagttccc gcgttaa      1257
 
<210>62
<211>418
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(21)
<223>从环境样品中获得
 
<400>62
Met Thr Leu Lys Leu Ser Leu Leu Ile Ala Ser Leu Ser Ala Val Ser
 1               5                  10                  15
Pro Ala Val Leu Ala Asn Asp Val Asn Pro Ala Pro Leu Met Ala Pro
            20                  25                  30
Ser Glu Ala Asp Ser Ala Gln Thr Leu Gly Ser Leu Thr Tyr Thr Tyr
        35                  40                  45
Val Arg Cys Trp Tyr Arg Pro Ala Ala Thr His Asn Asp Pro Tyr Thr
    50                  55                  60
Thr Trp Glu Trp Ala Lys Asn Ala Asp Gly Ser Asp Phe Thr Ile Asp
65                  70                  75                  80
Gly Tyr Trp Trp Ser Ser Val Ser Tyr Lys Asn Met Phe Tyr Thr Asp
                85                  90                  95
Thr Gln Pro Asp Thr Ile Met Gln Arg Cys Ala Glu Thr Leu Gly Leu
            100                 105                 110
Thr His Asp Thr Ala Asp Ile Thr Tyr Ala Ala Ala Asp Thr Arg Phe
        115                 120                 125
Ser Tyr Asn His Thr Ile Trp Ser Asn Asp Val Ala AsnAla Pro Ser
    130                 135                 140
Lys Ile Asn Lys Val Ile Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly
145                 150                 155                 160
Asn Ile Phe Asn Ala Ser Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp
                165                 170                 175
Phe Val Gly His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala
            180                 185                 190
Gln Gly Leu Gly Leu Pro Leu Tyr AsnTrp Ala Val Gly Gly Ala Ala
        195                 200                 205
Gly Arg Asn Gln Tyr Trp Ala Leu Thr Gly Val Asn Glu Gln Val Ser
    210                 215                 220
Ser Tyr Leu Thr Tyr Met Glu Met Ala Pro Asn Tyr Arg Ala Glu Asn
225                 230                 235                 240
Thr Leu Phe Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Asp
                245                 250                 255
Arg Ser Leu Ala Asp Val Lys Ala Asp Tyr Ser Ser Ala Leu Ile Arg
            260                 265                 270
Leu Val Glu Ala Gly Ala Lys Asn Met Val Leu Leu Thr Leu Pro Asp
        275                 280                 285
Ala Thr Arg Ala Pro Gln Phe Gln Tyr Ser Thr Gln Glu His Ile Asp
    290                 295                 300
Glu Val Arg Ala Lys Val Ile Gly Met Asn Ala Phe Ile Arg Glu Gln
305                 310                 315                 320
Ala Arg Tyr Phe Gln Met GlnGly Ile Asn Ile Ser Leu Phe Asp Ala
                325                 330                 335
Tyr Thr Leu Phe Asp Gln Met Ile Ala Asp Pro Ala Ala His Gly Phe
            340                 345                 350
Asp Asn Ala Ser Ala Pro Cys Leu Asp Ile Gln Arg Ser Ser Ala Ala
        355                 360                 365
Asp Tyr Leu Tyr Thr His Ala Leu Ala Ala Glu Cys Ala Ser Ser Gly
    370                 375                 380
Ser Asp Arg Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr
385                 390                 395                 400
His Arg Tyr Ile Ala Asp His Ile Leu Ala Thr Gly Val Ala Gln Phe
                405                 410                 415
Pro Arg
 
<210>63
<211>1242
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>63
atgaaaaata cgttaatttt ggctggctgt atattggcag ctccagccgt cgcagatgac     60
ctaacaatca cccctgaaac tataagtgtg cgctacgcgt ctgaggtgca gaacaaacaa    120
acatacactt atgttcgctg ctggtatcgt ccagcgcaga accatgacga cccttccact    180
gagtgggaat gggctcgtga cgacaatggc gattacttca ctatcgatgg gtactggtgg    240
tcgtctgtct ccttcaaaaa catgttctat accaataccc cgcaaacaga aattgaaaac    300
cgctgtaaag aaacactagg ggttaatcat gatagtgccg atcttcttta ctatgcatca    360
gacaatcgtt tctcctacaa ccatagtatt tggacaaacg acaacgcagt aaacaacaaa    420
atcaatcgta ttgtcgcatt cggtgatagc ctgtctgaca ccggtaatct gtacaatgga    480
tcccaatggg tattccccaa ccgtaattct tggtttctcg gtcacttttc aaacggtttg    540
gtgtggactg aatacttagc gcaaaacaaa aacgtaccac tgtacaactg ggcggtcggt    600
ggcgccgccg gcaccaacca atacgtcgca ttgacaggca tttatgacca agtgacgtct    660
tatcttacgt acatgaagat ggcaaagaac tacaacccaa acaacagttt gatgacgctg    720
gaatttggcc taaatgattt catgaattac ggccgagaag tggcggacgt gaaagctgac    780
ttaagtagcg cattgattcg cttgaccgaa tcaggcgcaa gcaacattct actcttcacg    840
ttaccggacg caacaaaggc accgcagttt aaatattcga ctcaggagga aattgagacc    900
gttcgagcta agattcttga gttcaacact tttattgaag aacaagcgtt actctatcaa    960
gctaaaggac tgaatgtggc cctctacgat gctcatagca tctttgatca gctgacatcc  1020
aatcctaaac aacacggttt tgagaactca acagatgcct gtctgaacat caaccgcagt  1080
tcctctgtcg actaccttta cagtcatgag ctaactaacg attgtgcgta tcatagctct  1140
gataaatatg tgttctgggg agtcactcac ccaaccacag caacacataa atacattgcc  1200
gaccaaatca ttcagaccaa gctagaccag ttcaatttct aa                     1242
 
<210>64
<211>413
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(18)
<223>从环境样品中获得
 
<400>64
Met Lys Asn Thr Leu Ile Leu Ala Gly Cys Ile Leu Ala Ala Pro Ala
 1               5                  10                  15
Val Ala Asp Asp Leu Thr Ile Thr Pro Glu Thr Ile Ser Val Arg Tyr
            20                  25                  30
Ala Ser Glu Val Gln Asn Lys Gln Thr Tyr Thr Tyr Val Arg Cys Trp
        35                  40                  45
Tyr Arg Pro Ala Gln Asn His Asp Asp Pro Ser Thr Glu Trp Glu Trp
    50                  55                  60
Ala Arg Asp Asp Asn Gly Asp Tyr Phe Thr Ile Asp Gly Tyr Trp Trp
65                  70                  75                  80
Ser Ser Val Ser Phe Lys Asn Met Phe Tyr Thr Asn Thr Pro Gln Thr
                85                  90                  95
Glu Ile Glu Asn Arg Cys Lys Glu Thr Leu Gly Val Asn His Asp Ser
            100                 105                 110
Ala Asp Leu Leu Tyr Tyr Ala Ser Asp Asn Arg Phe Ser Tyr Asn His
        115                 120                 125
Ser Ile Trp Thr Asn Asp Asn Ala Val Asn Asn Lys Ile Asn Arg Ile
    130                 135                 140
Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Tyr Asn Gly
145                 150                 155                 160
Ser Gln Trp Val Phe Pro Asn Arg Asn Ser Trp Phe Leu Gly His Phe
                165                 170                 175
Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Gln Asn Lys Asn Val
            180                 185                 190
Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn Gln Tyr
        195                 200                 205
Val Ala Leu Thr Gly Ile Tyr Asp Gln Val Thr Ser Tyr Leu Thr Tyr
    210                 215                 220
Met Lys Met Ala Lys Asn Tyr Asn Pro Asn Asn Ser Leu Met Thr Leu
225                 230                 235                 240
Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val Ala Asp
                245                 250                 255
Val Lys Ala Asp Leu Ser Ser Ala Leu Ile Arg Leu Thr Glu Ser Gly
            260                 265                 270
Ala Ser Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys Ala Pro
        275                 280                 285
Gln Phe Lys Tyr Ser Thr Gln Glu Glu Ile Glu Thr Val Arg Ala Lys
    290                 295                 300
Ile Leu Glu Phe Asn Thr Phe Ile Glu Glu Gln Ala Leu Leu Tyr Gln
305                 310                 315                 320
Ala Lys Gly Leu Asn Val Ala Leu Tyr Asp Ala His Ser Ile Phe Asp
                325                 330                 335
Gln Leu Thr Ser Asn Pro Lys Gln His Gly Phe Glu Asn Ser Thr Asp
            340                 345                 350
Ala Cys Leu Asn Ile Asn Arg Ser Ser Ser Val Asp Tyr Leu Tyr Ser
        355                 360                 365
His Glu Leu Thr Asn Asp Cys Ala Tyr His Ser Ser Asp Lys Tyr Val
    370                 375                 380
Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr Ile Ala
385                 390                 395                 400
Asp Gln Ile Ile Gln Thr Lys Leu Asp Gln Phe Asn Phe
                405                 410
 
<210>65
<211>1164
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>65
atgaaccctt ttcttgaaga taaaattaaa tcctccggtc ccaagaaaat cctcgcctgc     60
gatggcggag gtattttggg tttgatgagc gttgaaatcc tagcaaaaat tgaagcggat    120
ttacgcacta agttaggtaa agaccagaac ttcgtgctcg cggattattt cgattttgtc    180
tgcggcacca gcaccggcgc gattatcgct gcctgtattt ctagtggcat gtcgatggct    240
aaaatacgcc aattctatct cgacagtggg aagcaaatgt tcgataaggc ctccttgctt    300
aagcgcttgc aatacagtta tgacgatgag ccattggcga ggcagttgcg tgcagccttt    360
gatgagcaac tgaaggaaac cgatgccaag ctgggtagtg cgcacctaaa aacgctgttg    420
atgatggtga tgcgtaacca cagcaccgac tcaccttggc cggtttccaa taacccttac    480
gcaaaataca ataatatcgc ccgaaaggat tgcaacctca acctgccttt atggcaattg    540
gtccgtgcca gcaccgccgc tccgacgtat ttcccaccgg aagtcatcac tttcgcagat    600
ggcacacccg aagaatacaa cttcatcttc gtcgacggtg gcgtgaccac ctacaacaac    660
ccagcatatc ttgctttcct aatggccact gccaagcctt atgccctcaa ctggccgaca    720
ggcagcaacc agttattgat cgtttccgta ggcaccggaa gtgccgccaa tgtccgacct    780
aatctggacg tggatgatat gaacctgatc cattttgcca aaaacatccc ttcagccctg    840
atgaatgccg catctgccgg ttgggatatg acctgccggg tattgggtga atgccgccat    900
ggtggcatgt tagatcggga gtttggtgac atggtgatgc ccgcgtcaag agatcttaat    960
tttaccggcc ctaagctttt tacttatatg cgttatgatc ccgatgtttc ctttgagggc   1020
ttgaagacta tcggtatatc agatatcgat ccagccaaaa tgcagcaaat ggattccgtc   1080
aataatattc cagatataca acgggtaggt atcgaatatg ccaaacgcca tgttgataca   1140
gctcattttg aggggtttaa ataa                                          1164
 
<210>66
<211>387
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>66
Met Asn Pro Phe Leu Glu Asp Lys Ile Lys Ser Ser Gly Pro Lys Lys
 1               5                  10                  15
Ile Leu Ala Cys Asp Gly Gly Gly Ile Leu Gly Leu Met Ser Val Glu
            20                  25                  30
Ile Leu Ala Lys Ile Glu Ala Asp Leu Arg Thr Lys Leu Gly Lys Asp
        35                  40                  45
Gln Asn Phe Val Leu Ala Asp Tyr Phe Asp Phe Val Cys Gly Thr Ser
    50                  55                  60
Thr Gly Ala Ile Ile Ala Ala Cys Ile Ser Ser Gly Met Ser Met Ala
65                  70                  75                  80
Lys Ile Arg Gln Phe Tyr Leu Asp Ser Gly Lys Gln Met Phe Asp Lys
                85                  90                  95
Ala Ser Leu Leu Lys Arg Leu Gln Tyr Ser Tyr Asp Asp Glu Pro Leu
            100                 105                 110
Ala Arg Gln Leu Arg Ala Ala Phe Asp Glu Gln Leu Lys Glu Thr Asp
        115                 120                 125
Ala Lys Leu Gly Ser Ala His Leu Lys Thr Leu Leu Met Met Val Met
    130                 135                 140
Arg Asn His Ser Thr Asp Ser Pro Trp Pro Val Ser Asn Asn Pro Tyr
145                 150                 155                 160
Ala Lys Tyr Asn Asn Ile Ala Arg Lys Asp Cys Asn Leu Asn Leu Pro
                165                 170                 175
Leu Trp Gln Leu Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Pro
            180                 185                 190
Pro Glu Val Ile Thr Phe Ala Asp Gly Thr Pro Glu Glu Tyr Asn Phe
        195                 200                 205
Ile Phe Val Asp Gly Gly Val Thr Thr Tyr Asn Asn Pro Ala Tyr Leu
    210                 215                 220
Ala Phe Leu Met Ala Thr Ala Lys Pro Tyr Ala Leu Asn Trp Pro Thr
225                 230                 235                 240
Gly Ser Asn Gln Leu Leu Ile Val Ser Val Gly Thr Gly Ser Ala Ala
                245                 250                 255
Asn Val Arg Pro Asn Leu Asp Val Asp Asp Met Asn Leu Ile His Phe
            260                 265                 270
Ala Lys Asn Ile Pro Ser Ala Leu Met Asn Ala Ala Ser Ala Gly Trp
        275                 280                 285
Asp Met Thr Cys Arg Val Leu Gly Glu Cys Arg His Gly Gly Met Leu
    290                 295                 300
Asp Arg Glu Phe Gly Asp Met Val Met Pro Ala Ser Arg Asp Leu Asn
305                 310                 315                 320
Phe Thr Gly Pro Lys Leu Phe Thr Tyr Met Arg Tyr Asp Pro Asp Val
                325                 330                 335
Ser Phe Glu Gly Leu Lys Thr Ile Gly Ile Ser Asp Ile Asp Pro Ala
            340                 345                 350
Lys Met Gln Gln Met Asp Ser Val Asn Asn Ile Pro Asp Ile Gln Arg
        355                 360                 365
Val Gly Ile Glu Tyr Ala Lys Arg His Val Asp Thr Ala His Phe Glu
    370                 375                 380
Gly Phe Lys
385
 
<210>67
<211>1419
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>67
atggtcattg tcttcgtcca cggatggagc gtgcgcaaca ccaacacgta cgggcagctg     60
cccttgcgtc tcaagaagag cttcaaagcc gccgggaaac agattcaggt cgagaacatc    120
tacctgggcg agtacgtgag ctttgacgac caggtaacag tcgacgacat cgcccgcgca    180
ttcgattgcg cactgcggga aaaactatac gatccggcga cgaagcagtg gacgaagttc    240
gcctgcatca ctcattccac cggcggcccg gtcgcgcgct tgtggatgga tctctactac    300
ggcgccgcca gactggccga gtgcccgatg tcccacctcg tgatgctcgc cccggccaat    360
catggctcgg cccttgccca gctcggcaag agccgcctca gccgcatcaa gagcttcttc    420
gagggtgtcg aaccgggcca gcgcgtcctc gactggctcg aactcggcag tgagctgagt    480
tgggccctca acacgagatg gctcgactac gactgccgcg ccgccgcctg ctgggtcttc    540
accctcaccg gccagcgcat cgaccggagt ttgtacgacc atctcaacag ctataccggt    600
gagcagggat cggatggcgt cgtgcgcgtc gccgcggcca acatgaacac caagctgctg    660
acctttgaac agaaggggcg caagctcgtg ttcacaggcc agaagaagac cgccgacacc    720
ggccttggcg tcgtgccggg ccggtcgcac tccggccgcg acatgggcat catcgccagc    780
gtgcgcggca ccggcgacca tcccaccctg gaatgggtga ctcgttgcct ggccgtcacc    840
gacgtcaaca cgtacgatgc cgtctgtaag gatctggacg ctctcaccgc ccagacccag    900
aaggatgaaa aggtggaaga ggtcaaaggc ctgctgcgga cggtcagata ccagacggac    960
cgctacgtca tgctcgtctt ccgcctgaag aacgaccgcg gcgactacct ctccgattac   1020
gatctcctgc tcaccgccgg acccaactac tcgcccgacg acctgcccga aggcttcttc   1080
gtcgaccgcc aacggaacca gcggaacccg ggcaagctca cttactacct gaactacgac   1140
gccatggcca aattgaaagg taagaccgcc gagggccgtc tgggcttcaa gatcctggcg   1200
cgcccggtga aaggcggcct cgtctactat gaggttgcgg agttccagtc cgacgtgggc   1260
ggcgtcagca gcatgctgca gcccaacgca acagtgatga tcgacatcac cctcaatcgc   1320
aacgtcgacg cgcgcgtctt ccggttcacc gagaatctgc ccacgggtga ccagggcgag   1380
gaaatcagcg gcgtcccgct ggggcagaac gtcccgtag                          1419
 
<210>68
<211>472
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>68
Met Val Ile Val Phe Val His Gly Trp Ser Val Arg Asn Thr Asn Thr
 1               5                  10                  15
Tyr Gly Gln Leu Pro Leu Arg Leu Lys Lys Ser Phe Lys Ala Ala Gly
            20                  25                  30
Lys Gln Ile Gln Val Glu Asn Ile Tyr Leu Gly Glu Tyr Val Ser Phe
        35                  40                  45
Asp Asp Gln Val Thr Val Asp Asp Ile Ala Arg Ala Phe Asp Cys Ala
    50                  55                  60
Leu Arg Glu Lys Leu Tyr Asp Pro Ala Thr Lys Gln Trp Thr Lys Phe
65                  70                  75                  80
Ala Cys Ile Thr His Ser Thr Gly Gly Pro Val Ala Arg Leu Trp Met
                85                  90                  95
Asp Leu Tyr Tyr Gly Ala Ala Arg Leu Ala Glu Cys Pro Met Ser His
            100                 105                 110
Leu Val Met Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Gln Leu
        115                 120                 125
Gly Lys Ser Arg Leu Ser Arg Ile Lys Ser Phe Phe Glu Gly Val Glu
    130                 135                 140
Pro Gly Gln Arg Val Leu Asp Trp Leu Glu Leu Gly Ser Glu Leu Ser
145                 150                 155                 160
Trp Ala Leu Asn Thr Arg Trp Leu Asp Tyr Asp Cys Arg Ala Ala Ala
                165                 170                 175
Cys Trp Val Phe Thr Leu Thr Gly Gln Arg Ile Asp Arg Ser Leu Tyr
            180                 185                 190
Asp His Leu Asn Ser Tyr Thr Gly Glu Gln Gly Ser Asp Gly Val Val
        195                 200                 205
Arg Val Ala Ala Ala Asn Met Asn Thr Lys Leu Leu Thr Phe Glu Gln
    210                 215                 220
Lys Gly Arg Lys Leu Val Phe Thr Gly Gln Lys Lys Thr Ala Asp Thr
225                 230                 235                 240
Gly Leu Gly Val Val Pro Gly Arg Ser His Ser Gly Arg Asp Met Gly
                245                 250                 255
Ile Ile Ala Ser Val Arg Gly Thr Gly Asp His Pro Thr Leu Glu Trp
            260                 265                 270
Val Thr Arg Cys Leu Ala Val Thr Asp Val Asn Thr Tyr Asp Ala Val
        275                 280                 285
Cys Lys Asp Leu Asp Ala Leu Thr Ala Gln Thr Gln Lys Asp Glu Lys
    290                 295                 300
Val Glu Glu Val Lys Gly Leu Leu Arg Thr Val Arg Tyr Gln Thr Asp
305                 310                 315                 320
Arg Tyr Val Met Leu Val Phe Arg Leu Lys Asn Asp Arg Gly Asp Tyr
                325                 330                 335
Leu Ser Asp Tyr Asp Leu Leu Leu Thr Ala Gly Pro Asn Tyr Ser Pro
            340                 345                 350
Asp Asp Leu Pro Glu Gly Phe Phe Val Asp Arg Gln Arg Asn Gln Arg
        355                 360                 365
Asn Pro Gly Lys Leu Thr Tyr Tyr Leu Asn Tyr Asp Ala Met Ala Lys
    370                 375                 380
Leu Lys Gly Lys Thr Ala Glu Gly Arg Leu Gly Phe Lys Ile Leu Ala
385                 390                 395                 400
Arg Pro Val Lys Gly Gly Leu Val Tyr Tyr Glu Val Ala Glu Phe Gln
                405                 410                 415
Ser Asp Val Gly Gly Val Ser Ser Met Leu Gln Pro Asn Ala Thr Val
            420                 425                 430
Met Ile Asp Ile Thr Leu Asn Arg Asn Val Asp Ala Arg Val Phe Arg
        435                 440                 445
Phe Thr Glu Asn Leu Pro Thr Gly Asp Gln Gly Glu Glu Ile Ser Gly
    450                 455                 460
Val Pro Leu Gly Gln Asn Val Pro
465                 470
 
<210>69
<211>1038
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>69
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga    120
gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac tgtccgtgag    180
caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacggggtat    420
gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgaccgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaacttt ttgatcggga gcgttacatt    600
gatctggcca aagatcccgg tgccgttcgg cgaacgggct attacaacaa agaaaacgct    660
cgctttcagc ttgagcggcc gggctatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactag atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcagcgca cggtctatat cgatacattg    900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgaacag    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttgga gaagcctgtt   1020
aatagagtgg agtcatag                                                 1038
 
<210>70
<211>345
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>70
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly
                85                  90                  95
Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly Tyr Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
 
<210>71
<211>3264
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>71
atgtcgctat catcaccgcc cgaaaccccc gaaccccccg aacccccgtc acccggcgcg     60
cgatcgctcc ggggaggatg gagccgccgg gtggccggcc tgctggccct ggtgctgctc    120
accgggctcc tccagatcgt cgtgccgctc gcacggcccg ccgcggcggc cgtacagcag    180
cccgcgatga cgtggaacct gcatggggcc aagaagaccg cggaactggt tcccgatctg    240
atgcgtaacc ataacgtcac cgtcgcggcc ctccaggaag tggccaacgg caacttcctg    300
ggcctcactc ccacagagca cgacgtgccc tacctcaagc cggacggcac gacctcgact    360
ccgccggatc cgcagaaatg gcgggtcgag aagtacaacc tcgccaagga cgatgcaacc    420
gctttcgtga tccggaccgg ctccaacaac cgcgggctcg cgatcgtcac cacccaggac    480
gtcggcgatg tctcgcagaa tgtacacgtc gtcaatgtga ccgaggattg ggaaggcaag    540
atgttccccg ccctgggggt gaagatcgac ggcgcctggt actactccat ccacgcctcc    600
accacgccga agcgcgcgaa caacaacgcc ggcactctgg tcgaggacct ctccaagctg    660
cacgagacgg ccgctttcga aggcgactgg gccgcgatgg gcgactggaa ccggtacccc    720
tccgaggact cgaacgccta cgagaaccaacggaagcatc tcaaaggcgc catgcggaca     780
aactttccgg ataatcaggc ggcgttgcgc gaagtcctgg agttcgagtc cgacgaacgc    840
gtcatctggc agggtgcgag gacccacgac cacggcgccg agctcgacta catggtggcc    900
aagggagccg gtaacgacta caaggccagc cgatcgacgt cgaagcacgg ctccgatcac    960
tacccggtgt tcttcggtat tggggacgat tcggacacct gcatgggcgg cacggcgccg   1020
gtggcggcga acgcgccgcg tgcggccgcc accgagtcct gtcccctgga cgacgatctg   1080
ccggccgtca tcgtctcgat gggggacagc tatatctccg gcgagggagg gcgctggcag   1140
ggcaacgcca acacctcctc cgggggcgac tcctggggca ccgaccgggc cgccgacggc   1200
acggaggtct acgagaagaa ctccgaaggc agcgatgcct gtcaccgctc cgacgtcgcg   1260
gagatcaagc gcgccgacat cgccgacatc ccggcggaac gcaggatcaa catcgcctgc   1320
tcgggcgccg agaccaagca cctgctcacc gagaccttca agggtgaaaa gccccagatc   1380
gagcagctcg ccgacgtcgc cgaaacccac cgggtggaca cgatcgtggt ctccatcggc   1440
ggcaacgacc tcgagttcgc cgacatcgtg agccagtgcg ccacggcctt catgctcggg   1500
gaaggcgcgt gtcacacgga cgtcgacgat acccttgata gccggttggg cgatgtgagc    1560
agatccgtct ccgaggttct ggccgccatc cgcgacacca tgatcgaggc cgggcaggac    1620
gataccagct acaagctcgt tctccagtcc taccctgccc cgttgcccgc gtcggatgag    1680
atgcggtaca cgggcgatca ctacgaccgg tacaccgagg gcggctgccc cttctatgac    1740
gtcgacctgg actggacgcg cgacgtcctc atcaaaaaga tcgaagccac gctgcgcggg    1800
gtggccaaga gtgcggatgc ggccttcctc aacctgacgg acacgttcac ggggcacgag    1860
ctgtgctcga agcacacccg acaggcggag tccggcgaat cgctggcgaa tccaatactg    1920
gaacacgagg ccgagtgggt gcgcttcgta ccaggtctca ccacgccggg tgacacggcc    1980
gaagccatcc atccgaatgc gttcggccag cacgccctca gtagctgcct cagccaggcc    2040
gtccggacga tggacgattc ggaccagagg tacttcgagt gcgacgggcg ggacaccgga    2100
aatccccgcc tcgtgtggcc acgcagttcg cccatcgacg ccgtcgtgga gaccgcggac    2160
ggttggcagg gcgacgactt ccggctcgcc gaccactaca tgttccagcg cggcgtctac    2220
gcccgcttca acccggacgc ggaccggagc ggcgcgatcg atccgggccg aatcaccttc    2280
ggccaaaccg acggatggct cggtgaggtg aaggacactt cgaactggcc gagcctgagt    2340
ggaaccgact tcgtcgacgg catcgacgcc gccgccgagg cacgcaccag caccggtcac    2400
cagctgctgc tgttccacag cggcgttgag gacaaccagt acgtgcgggt cgagatggcg    2460
ccgggcacca ctgacgacca gctcgtcagg ggccccgtgc ccatcacgag gtactggccc    2520
ctcttccagg acaccccttt cgaatggggc gtggatgccg ccgcggggga ccagctgaac    2580
cgggcgatgg tcttcaggca cggctatgtg gggctggtgc aggtctccct cgacgctctc    2640
agcgacgaat ggctcgtgga accgacgttg atcggctcgg cgattccggc gctggagggc    2700
accccgttcg agacaggggt ggacgcggcg atcgtgcggc accagcaacc gacggccatg    2760
tgggtcgacc tgatcagcgg tacgcaggtg gtgacgctgc tggtggactt ggacgatctg    2820
tcgaagagca cgtacatgac gagcatcgtg gagatcacga cgatgtggcc gagcctgcgc    2880
ggcagcatct tcgactggac cggcggagag gcgtggaagc cggagaagat gcagatcaag    2940
accggcgcgg gcgatcccta cgacatggac gccgacgacc ggcaggccaa gcctgcggtg    3000
tcgggctcgc acgagcagtg ccgtccggag ggactagcgc agacccccgg cgtgaacacg    3060
ccgtactgcg aggtgtacga caccgacggc cgcgaatggc tgggcgggaa cgggcacgac    3120
aggcgggtca tcggctactt caccggctgg cgcaccggtg agaacgacca gccgcgctac    3180
ctggtgccga acatcccgtg gtcgaaggtg acccacatca actacgcgtt cgcgaaagtc    3240
gacgacgaca acaagatcca aaga                                           3264
 
<210>72
<211>1088
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>72
Met Ser Leu Ser Ser Pro Pro Glu Thr Pro Glu Pro Pro Glu Pro Pro
 1               5                  10                  15
Ser Pro Gly Ala Arg Ser Leu Arg Gly Gly Trp Ser Arg Arg Val Ala
            20                  25                  30
Gly Leu Leu Ala Leu Val Leu Leu Thr Gly Leu Leu Gln Ile Val Val
        35                  40                  45
Pro Leu Ala Arg Pro Ala Ala Ala Ala Val Gln Gln Pro Ala Met Thr
    50                  55                  60
Trp Asn Leu His Gly Ala Lys Lys Thr Ala Glu Leu Val Pro Asp Leu
65                  70                  75                  80
Met Arg Asn His Asn Val Thr Val Ala Ala Leu Gln Glu Val Ala Asn
                85                  90                  95
Gly Asn Phe Leu Gly Leu Thr Pro Thr Glu His Asp Val Pro Tyr Leu
            100                 105                 110
Lys Pro Asp Gly Thr Thr Ser Thr Pro Pro Asp Pro Gln Lys Trp Arg
        115                 120                 125
Val Glu Lys Tyr Asn Leu Ala Lys Asp Asp Ala Thr Ala Phe Val Ile
    130                 135                 140
Arg Thr Gly Ser Asn Asn Arg Gly Leu Ala Ile Val Thr Thr Gln Asp
145                 150                 155                 160
Val Gly Asp Val Ser Gln Asn Val His Val Val Asn Val Thr Glu Asp
                165                 170                 175
Trp Glu Gly Lys Met Phe Pro Ala Leu Gly Val LysIle Asp Gly Ala
            180                 185                 190
Trp Tyr Tyr Ser Ile His Ala Ser Thr Thr Pro Lys Arg Ala Asn Asn
        195                 200                 205
Asn Ala Gly Thr Leu Val Glu Asp Leu Ser Lys Leu His Glu Thr Ala
    210                 215                 220
Ala Phe Glu Gly Asp Trp Ala Ala Met Gly Asp Trp Asn Arg Tyr Pro
225                 230                 235                 240
Ser Glu Asp Ser Asn Ala Tyr Glu Asn Gln Arg Lys His Leu Lys Gly
                245                 250                 255
Ala Met Arg Thr Asn Phe Pro Asp Asn Gln Ala Ala Leu Arg Glu Val
            260                 265                 270
Leu Glu Phe Glu Ser Asp Glu Arg Val Ile Trp Gln Gly Ala Arg Thr
        275                 280                 285
His Asp His Gly Ala Glu Leu Asp Tyr Met Val Ala Lys Gly Ala Gly
    290                 295                 300
Asn Asp Tyr Lys Ala Ser Arg Ser Thr Ser Lys His Gly Ser Asp His
305                 310                 315                 320
Tyr Pro Val Phe Phe Gly Ile Gly Asp Asp Ser Asp Thr Cys Met Gly
                325                 330                 335
Gly Thr Ala Pro Val Ala Ala Asn Ala Pro Arg Ala Ala Ala Thr Glu
            340                 345                 350
Ser Cys Pro Leu Asp Asp Asp Leu Pro Ala Va1 Ile Val Ser Met Gly
        355                 360                 365
Asp Ser Tyr Ile Ser Gly Glu Gly Gly Arg Trp Gln Gly Asn Ala Asn
    370                 375                 380
Thr Ser Ser Gly Gly Asp Ser Trp Gly Thr Asp Arg Ala Ala Asp Gly
385                 390                 395                 400
Thr Glu Val Tyr Glu Lys Asn Ser Glu Gly Ser Asp Ala Cys His Arg
                405                 410                 415
Ser Asp Val Ala Glu Ile Lys Arg Ala Asp Ile Ala Asp Ile Pro Ala
            420                 425                 430
Glu Arg Arg Ile Asn Ile Ala Cys Ser Gly Ala Glu Thr Lys His Leu
        435                 440                 445
Leu Thr Glu Thr Phe Lys Gly Glu Lys Pro Gln Ile Glu Gln Leu Ala
    450                 455                 460
Asp Val Ala Glu Thr His Arg Val Asp Thr Ile Val Val Ser Ile Gly
465                 470                 475                 480
Gly Asn Asp Leu Glu Phe Ala Asp Ile Val Ser Gln Cys Ala Thr Ala
                485                 490                 495
Phe Met Leu Gly Glu Gly Ala Cys His Thr Asp Val Asp Asp Thr Leu
            500                 505                 510
Asp Ser Arg Leu Gly Asp Val Ser Arg Ser Val Ser Glu Val Leu Ala
        515                 520                 525
Ala Ile Arg Asp Thr Met Ile Glu Ala Gly Gln Asp Asp Thr Ser Tyr
    530                 535                 540
Lys Leu Val Leu Gln Ser Tyr Pro Ala Pro Leu Pro Ala Ser Asp Glu
545                 550                 555                 560
Met Arg Tyr Thr Gly Asp His Tyr Asp Arg Tyr Thr Glu Gly Gly Cys
                565                 570                 575
Pro Phe Tyr Asp Val Asp Leu Asp Trp Thr Arg Asp Val Leu Ile Lys
            580                 585                 590
Lys Ile Glu Ala Thr Leu Arg Gly Val Ala Lys Ser Ala Asp Ala Ala
        595                 600                 605
Phe Leu Asn Leu Thr Asp Thr Phe Thr Gly His Glu Leu Cys Ser Lys
    610                 615                 620
His Thr Arg Gln Ala Glu Ser Gly Glu Ser Leu Ala Asn Pro Ile Leu
625                 630                 635                 640
Glu His Glu Ala Glu Trp Val Arg Phe Val Pro Gly Leu Thr Thr Pro
                645                 650                 655
Gly Asp Thr Ala Glu Ala Ile His Pro Asn Ala Phe Gly Gln His Ala
            660                 665                 670
Leu Ser Ser Cys Leu Ser Gln Ala Val Arg Thr Met Asp Asp Ser Asp
        675                 680                 685
Gln Arg Tyr Phe Glu Cys Asp Gly Arg Asp Thr Gly Asn Pro Arg Leu
    690                 695                 700
Val Trp Pro Arg Ser Ser Pro Ile Asp Ala Val Val Glu Thr Ala Asp
705                 710                 715                 720
Gly Trp Gln Gly Asp Asp Phe Arg Leu Ala Asp His Tyr Met Phe Gln
                725                 730                 735
Arg Gly Val Tyr Ala Arg Phe Asn Pro Asp Ala Asp Arg Ser Gly Ala
            740                 745                 750
Ile Asp Pro Gly Arg Ile Thr Phe Gly Gln Thr Asp Gly Trp Leu Gly
        755                 760                 765
Glu Val Lys Asp Thr Ser Asn Trp Pro Ser Leu Ser Gly Thr Asp Phe
    770                 775                 780
Val Asp Gly Ile Asp Ala Ala Ala Glu Ala Arg Thr Ser Thr Gly His
785                 790                 795                 800
Gln Leu Leu Leu Phe His Ser Gly Val Glu Asp Asn Gln Tyr Val Arg
                805                 810                 815
Val Glu Met Ala Pro Gly Thr Thr Asp Asp Gln Leu Val Arg Gly Pro
            820                 825                 830
Val Pro Ile Thr Arg Tyr Trp Pro Leu Phe Gln Asp Thr Pro Phe Glu
        835                 840                 845
Trp Gly Val Asp Ala Ala Ala Gly Asp Gln Leu Asn Arg Ala Met Val
    850                 855                 860
Phe Arg His Gly Tyr Val Gly Leu Val Gln Val Ser Leu Asp Ala Leu
865                 870                 875                 880
Ser Asp Glu Trp Leu Val Glu Pro Thr Leu Ile Gly Ser Ala Ile Pro
                885                 890                 895
Ala Leu Glu Gly Thr Pro Phe Glu Thr Gly Val Asp Ala Ala Ile Val
            900                 905                 910
Arg His Gln Gln Pro Thr Ala Met Trp Val Asp Leu Ile Ser Gly Thr
        915                 920                 925
Gln Val Val Thr Leu Leu Val Asp Leu Asp Asp Leu Ser Lys Ser Thr
    930                 935                 940
Tyr Met Thr Ser Ile Val Glu Ile Thr Thr Met Trp Pro Ser Leu Arg
945                 950                 955                 960
Gly Ser Ile Phe Asp Trp Thr Gly Gly Glu Ala Trp Lys Pro Glu Lys
                965                 970                 975
Met Gln Ile Lys Thr Gly Ala Gly Asp Pro Tyr Asp Met Asp Ala Asp
            980                 985                 990
Asp Arg Gln Ala Lys Pro Ala Val Ser Gly Ser His Glu Gln Cys Arg
        995                 1000                1005
Pro Glu Gly Leu Ala Gln Thr Pro Gly Val Asn Thr Pro Tyr Cys Glu
    1010                1015                1020
Val Tyr Asp Thr Asp Gly Arg Glu Trp Leu Gly Gly Asn Gly His Asp
1025                1030                1035                1040
Arg Arg Val Ile Gly Tyr Phe Thr Gly Trp Arg Thr Gly Glu Asn Asp
                1045                1050                1055
Gln Pro Arg Tyr Leu Val Pro Asn Ile Pro Trp Ser Lys Val Thr His
            1060                1065                1070
Ile Asn Tyr Ala Phe Ala Lys Val Asp Asp Asp Asn Lys Ile Gln Arg
        1075                1080                1085
 
<210>73
<211>753
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>73
atgggaaacg gtgcagcagt tggttccaat gataatggta gagaagaaag tgtttacgta     60
ctttctgtga tcgcctgtaa tgtttattat ttacagaagt gtgaaggtgg ggcatcgcgt    120
gatagcgtga ttagagaaat taatagccaa actcaacctt taggatatga gattgtagca    180
gattctattc gtgatggtca tattggttct tttgcctgta agatggcagt ctttagaaat    240
aatggtaatg gcaattgtgt tttagcgatc aaagggacag atatgaataa tatcaatgac    300
ttggtgaatg atctaaccat gatattagga ggcattggtt ctgttgctgc aatccaacca    360
acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tactggtcac    420
tcccttggag gctacatgac tgaaatcatc gctaccaatc gtggactacc aggtattgca    480
ttttgcgcac caggttcaaa tggtccaatt gtaaaattag gtggacaaga gacacctggc    540
tttcacaatg ttaactttga acatgatcca gcaggtaacg ttatgactgg ggtttatact    600
catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg    660
gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa    720
agtcataata cgggttatta ttacccaaaa taa                                 753
 
<210>74
<211>250
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>74
Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu
 1               5                  10                  15
Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln
            20                  25                  30
Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn
        35                  40                  45
Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg
    50                  55                  60
Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn
65                  70                  75                  80
Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn
                85                  90                  95
Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile
            100                 105                 110
Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu
        115                 120                 125
Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly
    130                 135                 140
Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala
145                 150                 155                 160
Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln
                165                 170                 175
Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly
            180                 185                 190
Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val
        195                 200                 205
Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe
    210                 215                 220
Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu
225                 230                 235                 240
Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys
                245                 250
 
<210>75
<211>1335
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>75
atgactacta aaatcttttt aattcacgga tggtctgtca agacaacaca aacatatcag     60
gcgctgcacc ttaagttggc agagcaggga tatcagctgg aagatattta cctcgggcgg    120
tatctgtccc ttgaaaatca tatcgaaata cgggatattg caaaagcaat gcaccgtgca    180
ttgctggaga ggattaccga ctggagtcag cctttccatt ttattactca cagtacggga    240
ggtatggtcg ccaaatattg gatattgaat cattataaag gaagtattgc aaaacaaaaa    300
ccactcaaaa atgtagtgtt tctggctgca cctaattttg gttcaaggct ggcacaccat    360
ggacgtacca tgctgggaga aataatggaa ctgggagaaa cagggaagaa gattcttgaa    420
tctctggagt taggaagtgc tttttcgtgg gatgtgaatg agcagttttt taatgcgtcc    480
aattggaaag ataaagaaat aaagttctat aacctgatag gagacagggt caaaacggat    540
ttttttaaat ccaaaatttt tccagctgcg tttgaaagcg ggtcagatat ggtgattcgg    600
gttgcggcag gaaatcagaa ctttgtccgg tacaggtacg atagtcagaa agatagcttt    660
actgttgtca atgagttgaa aggaattgct tttggtgctc tctaccaata tacacattcc    720
aatgatgatt atggaatcct gaacagcatc aaaaaaagtt caacccttga aaaccatcag    780
gcactcagac taattgtaga atgtctgaag gtttcgggag ataaagaata tgaaaatgtt    840
gttgcacagt tggctgcagc gacaaaagaa accagagaaa aacgccaggg atatgcacag    900
ctggatttcc gttttcggga tgatgaaggc tttccaatag atgattatgt tgtagagctg    960
ggagtaatgg taaatggaaa acctaaacca tctaaaacag tagatgacgt gcataagaat   1020
aaaattacac caaaccatct tactgtattc attaacctga aagaactgga acctaatctg   1080
aagtacttta tcaatattaa atcgatatcg gaatcctcca tgtatagtta cgatcctgct   1140
gtcaggacta tagagcttgc ttctaacgag attacaaaaa ttatccgtga ggaccataca   1200
acacagattg atgtgatact ttcccggact cctgctaaaa accttttcat gtttcatcgc   1260
ggagatgatg aagacctaca tgtgacatgg tcgcggtacg gagaaacaaa aagtacaaag   1320
cagggaataa aataa                                                    1335
 
<210>76
<211>444
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>76
Met Thr Thr Lys Ile Phe Leu Ile His Gly Trp Ser Val Lys Thr Thr
 1               5                  10                  15
Gln Thr Tyr Gln Ala Leu His Leu Lys Leu Ala Glu Gln Gly Tyr Gln
            20                  25                  30
Leu Glu Asp Ile Tyr Leu Gly Arg Tyr Leu Ser Leu Glu Asn His Ile
        35                  40                  45
Glu Ile Arg Asp Ile Ala Lys Ala Met His Arg Ala Leu Leu Glu Arg
    50                  55                  60
Ile Thr Asp Trp Ser Gln Pro Phe His Phe Ile Thr His Ser Thr Gly
65                  70                  75                  80
Gly Met Val Ala Lys Tyr Trp Ile Leu Asn His Tyr Lys Gly Ser Ile
                85                  90                  95
Ala Lys Gln Lys Pro Leu Lys Asn Val Val Phe Leu Ala Ala Pro Asn
            100                 105                 110
Phe Gly Ser Arg Leu Ala His His Gly Arg Thr Met Leu Gly Glu Ile
        115                 120                 125
Met Glu Leu Gly Glu Thr Gly Lys Lys Ile Leu Glu Ser Leu Glu Leu
    130                 135                 140
Gly Ser Ala Phe Ser Trp Asp Val Asn Glu Gln Phe Phe Asn Ala Ser
145                 150                 155                 160
Asn Trp Lys Asp Lys Glu Ile Lys Phe Tyr Asn Leu Ile Gly Asp Arg
                165                 170                 175
Val Lys Thr Asp Phe Phe Lys Ser Lys Ile Phe Pro Ala Ala Phe Glu
            180                 185                 190
Ser Gly Ser Asp Met Val Ile Arg Val Ala Ala Gly Asn Gln Asn Phe
        195                 200                 205
Val Arg Tyr Arg Tyr Asp Ser Gln Lys Asp Ser Phe Thr Val Val Asn
    210                 215                 220
Glu Leu Lys Gly Ile Ala Phe Gly Ala Leu Tyr Gln Tyr Thr His Ser
225                 230                 235                 240
Asn Asp Asp Tyr Gly Ile Leu Asn Ser Ile Lys Lys Ser Ser Thr Leu
                245                 250                 255
Glu Asn His Gln Ala Leu Arg Leu Ile Val Glu Cys Leu Lys Val Ser
            260                 265                 270
Gly Asp Lys Glu Tyr Glu Asn Val Val Ala Gln Leu Ala Ala Ala Thr
        275                 280                 285
Lys Glu Thr Arg Glu Lys Arg Gln Gly Tyr Ala Gln Leu Asp Phe Arg
    290                 295                 300
Phe Arg Asp Asp Glu Gly Phe Pro Ile Asp Asp Tyr Val Val Glu Leu
305                 310                 315                 320
Gly Val Met Val Asn Gly Lys Pro Lys Pro Ser Lys Thr Val Asp Asp
                325                 330                 335
Val His Lys Asn Lys Ile Thr Pro Asn His Leu Thr Val Phe Ile Asn
            340                 345                 350
Leu Lys Glu Leu Glu Pro Asn Leu Lys Tyr Phe Ile Asn Ile Lys Ser
        355                 360                 365
Ile Ser Glu Ser Ser Met Tyr Ser Tyr Asp Pro Ala Val Arg Thr Ile
    370                 375                 380
Glu Leu Ala Ser Asn Glu Ile Thr Lys Ile Ile Arg Glu Asp His Thr
385                 390                 395                 400
Thr Gln Ile Asp Val Ile Leu Ser Arg Thr Pro Ala Lys Asn Leu Phe
                405                 410                 415
Met Phe His Arg Gly Asp Asp Glu Asp Leu His Val Thr Trp Ser Arg
            420                 425                 430
Tyr Gly Glu Thr Lys Ser Thr Lys Gln Gly Ile Lys
        435                 440
 
<210>77
<211>1026
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>77
atggcttatc actttaaaaa cttggtcttc gaaggcggtg gcgtgaaagg catcgcctac     60
gtgggtgctc ttgaagtact tgagagagaa ggcattctga aagacatcaa acgcgtggct    120
ggtacttcgg ctggagcgct ggttgccgtc ttaatcagtt tgggctatac cgcccaagaa    180
ttgaaggaca tcctatggaa aatcaatttc caaaactttt tggacagctc gtggggcttg    240
gtgcgcaaca cggcacgttt cattgaggat tacggttggt acaaaggtga gtttttccgc    300
gaattggttg ccggctacat caaggaaaaa acgggcaata gtgaaagcac tttcaaggat    360
ctggccaaat caaaagattt ccgtggcctc agccttattg gtagcgatct gtccacagga    420
tactcaaagg tgttcagcaa cgaattcacc ccaaacgtca aagtagctga tgcagcccgc    480
atctccatgt cgatacccct gtttttcaaa gccgttcgcg gtgtaaacgg tgatggacac    540
atttacgtcg atggtggact gttagacaac tatgccatca aggtgttcga ccgcgtcaat    600
tacgtaaaga ataagaacaa cgtacggtac accgagtatt atgaaaagac caacaagtcg    660
ctgaaaagca aaaacaagct gaccaacgaa tacgtctaca ataaagaaac tttgggcttc    720
cgattggatg ccaaagaaca gattgagatg tttctcgacc atagtataga accaaaggca    780
aaggacattg actcactatt ctcttacacg aaggctttgg tcaccaccct catcgacttt    840
caaaacaatg tacatttgca tagtgacgac tggcaacgca cagtctatat cgactcttta    900
ggtatcagtt ccactgactt cggcatctct gactctaaaa aacagaaact cgtcgattca    960
ggcattttgc atacgcaaaa atacctggat tggtataaca acgacgaaga gaaagccaac   1020
aaatag                                                              1026
 
<210>78
<211>341
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>78
Met Ala Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Val Gly Ala Leu Glu Val Leu Glu Arg Glu Gly Ile
            20                  25                  30
Leu Lys Asp Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Leu Val
        35                  40                  45
Ala Val Leu Ile Ser Leu Gly Tyr Thr Ala Gln Glu Leu Lys Asp Ile
    50                  55                  60
Leu Trp Lys Ile Asn Phe Gln Asn Phe Leu Asp Ser Ser Trp Gly Leu
65                  70                  75                  80
Val Arg Asn Thr Ala Arg Phe Ile Glu Asp Tyr Gly Trp Tyr Lys Gly
                85                  90                  95
Glu Phe Phe Arg Glu Leu Val Ala Gly Tyr Ile Lys Glu Lys Thr Gly
            100                 105                 110
Asn Ser Glu Ser Thr Phe Lys Asp Leu Ala Lys Ser Lys Asp Phe Arg
        115                 120                 125
Gly Leu Ser Leu Ile Gly Ser Asp Leu Ser Thr Gly Tyr Ser Lys Val
    130                 135                 140
Phe Ser Asn Glu Phe Thr Pro Asn Val Lys Val Ala Asp Ala Ala Arg
145                 150                 155                 160
Ile Ser Met Ser Ile Pro Leu Phe Phe Lys Ala Val Arg Gly Val Asn
                165                 170                 175
Gly Asp Gly His Ile Tyr Val Asp Gly Gly Leu Leu Asp Asn Tyr Ala
            180                 185                 190
Ile Lys Val Phe Asp Arg Val Asn Tyr Val Lys Asn Lys Asn Asn Val
        195                 200                 205
Arg Tyr Thr Glu Tyr Tyr Glu Lys Thr Asn Lys Ser Leu Lys Ser Lys
    210                 215                 220
Asn Lys Leu Thr Asn Glu Tyr Val Tyr Asn Lys Glu Thr Leu Gly Phe
225                 230                 235                 240
Arg Leu Asp Ala Lys Glu Gln Ile Glu Met Phe Leu Asp His Ser Ile
                245                 250                 255
Glu Pro Lys Ala Lys Asp Ile Asp Ser Leu Phe Ser Tyr Thr Lys Ala
            260                 265                 270
Leu Val Thr Thr Leu Ile Asp Phe Gln Asn Asn Val His Leu His Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Ser Leu Gly Ile Ser Ser
    290                 295                 300
Thr Asp Phe Gly Ile Ser Asp Ser Lys Lys Gln Lys Leu Val Asp Ser
305                 310                 315                 320
Gly Ile Leu His Thr Gln Lys Tyr Leu Asp Trp Tyr Asn Asn Asp Glu
                325                 330                 335
Glu Lys Ala Asn Lys
            340
 
<210>79
<211>1701
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>79
atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt     60
gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta    120
acccgccgct cggcgctgga actgctgaat gccgacaatc tggtcggcaa tgacccggcc    180
gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag    240
aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac    300
gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg    360
gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat    420
gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac    480
gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa    540
gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac    600
aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac    660
accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc    720
tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc    780
gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc    840
aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt    900
attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag    960
gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa   1020
gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg   1080
ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg   1140
gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc   1200
gatctgaatg atccacacat ggatattccg tacaactggc aatgggtgtc gtcgacgcaa   1260
tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca   1320
gtcgtcatca agaattcgat caatggcgat ccgctggtgg cacctgccgg gctcaagcac   1380
aacaccgatg tttacggtgc accgggtgag gcgattgaat tcattttcgt cggtgatttc   1440
aaccatgagg cgtatttccg caccaaggac aacgcggatc tgttcctgag ttacagcgcg    1500
gtatcgggca agggcttgct gtacaacacg cccaaccagg ccggttatcg tgttcagcct    1560
tatggtgtgc tgtggacgat tgagaatacc tactggaatg atttcctctg gtacaacagc    1620
tcgaacgacc gcatctatgt cagcggcacc ggcgctgcca acaagtcaca ctcccagtgg    1680
attattgacg gcttgcagtg a                                              1701
 
<210>80
<211>566
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
 
<400>80
Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala
 1               5                  10                  15
Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala
            20                  25                  30
Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu
        35                  40                  45
Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu
    50                  55                  60
Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln
65                  70                  75                  80
Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr
                85                  90                  95
Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp
            100                 105                 110
Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile
        115                 120                 125
Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp
    130                 135                 140
His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn
145                 150                 155                 160
Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala
                165                 170                 175
Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr
            180                 185                 190
Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala
        195                  200                  205
Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu
    210                 215                 220
Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys
225                 230                 235                 240
Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn
                245                 250                 255
Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala
            260                 265                 270
Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val
        275                 280                 285
Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met
    290                 295                 300
Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln
305                 310                 315                 320
Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn
                325                 330                 335
Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro
            340                 345                 350
Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu
        355                 360                 365
Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln
    370                 375                 380
Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly
385                 390                 395                 400
Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val
                405                 410                 415
Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln
            420                 425                 430
Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile Lys Asn Ser Ile Asn
        435                 440                 445
Gly Asp Pro Leu Val Ala Pro Ala Gly Leu Lys His Asn Thr Asp Val
    450                 455                 460
Tyr Gly Ala Pro Gly Glu Ala Ile Glu Phe Ile Phe Val Gly Asp Phe
465                 470                 475                 480
Asn His Glu Ala Tyr Phe Arg Thr Lys Asp Asn Ala Asp Leu Phe Leu
                485                 490                 495
Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu Tyr Asn Thr Pro Asn
            500                 505                 510
Gln Ala Gly Tyr Arg Val Gln Pro Tyr Gly Val Leu Trp Thr Ile Glu
        515                 520                 525
Asn Thr Tyr Trp Asn Asp Phe Leu Trp Tyr Asn Ser Ser Asn Asp Arg
    530                 535                 540
Ile Tyr Val Ser Gly Thr Gly Ala Ala Asn Lys Ser His Ser Gln Trp
545                 550                 555                 560
Ile Ile Asp Gly Leu Gln
                565
 
<210>81
<211>1422
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>81
atgaaaaaga aattatgtac aatggctctt gtaacagcaa tatcttctgg tgttgttacg     60
attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag    120
cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcaaatga aagtacacat    180
ttatggattg cacgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa    240
gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt    300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat    360
gggctaatta gaggagggtg gaaatctcat ttttacgatc ccgatacaag aaagaactat    420
aaaggggaag aagaaccaac agctctttca caaggagata aatattttaa attagcaggt    480
gaatacttta agaagggcga ccaaaaacaa gctttttatt atttaggtgt tgcaacgcat    540
tactttacag atgctactca accaatgcat gctgctaatt ttacagccgt cgacacgagt    600
gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa    660
gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc    720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa    780
tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag    840
aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca    900
tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga    960
gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt   1020
ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat   1080
agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt   1140
catcgaggag aaagtgtact gctgaaaatg acgcaatcta actatgataa ttacgtattt   1200
ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca   1260
cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga   1320
tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa   1380
acagatacac caaaagcttg gaaatttata caggctgaat ag                      1422
 
<210>82
<211>473
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(25)
<223>从环境样品中获得
 
<400>82
Met Lys Lys Lys Leu Cys Thr Met Ala Leu Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Gly Val Val Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ser Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Glu Tyr Phe Lys Lys Gly Asp Gln Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly
    210                 215                 220
Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn
    290                 295                 300
Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly
305                 310                 315                 320
Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu
    370                 375                 380
Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser
            420                 425                 430
Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
 
<210>83
<211>1290
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>83
atgaaaaaga tagtgattta ttcatttgta gcaggggtta tgacatcagg cggcgtattt     60
gccgccagtg acaatattgt ggagacgtcg accccaccac agcatcaggc cccaagcaga    120
caggacaggg cattattcgc gggtgataca acaacctata taaaatgtgt ctacaaagtg    180
gatggccagg atgacagcaa tccatcctca tcttggttat gggcgaaagt gggtagcaac    240
tatgcgaagc tgaaggggta ttggtataat tcaatgccgc tggcaaacat gttttacact    300
gaagtaccct atgcagaggt gatggacttg tgtaatagca ccctgaaggc ggtaggtgcc    360
aactccactc ttgttattcc atatgcatcg gattacaccc tgtcctatta ctatgtgatt    420
tggaatcaag gggctaacca gccggttatc aacgttggcg gcagagagct tgaccgtatg    480
gtggtctttg gtgacagctt gagcgatacc gtcaatgtct ataacggctc gtacggtacc    540
gtgccgaata gtacctcctg gttattgggc catttctcta acggaaagct ttggcatgaa    600
tacctttcca cggtattgaa tctgcctagc tatgtgtggg cgactggcaa tgcggagagt    660
ggagagaaac ccttctttaa cggattcagt aagcaggtgg attctttcag ggattatcac    720
gctcgcacta aaggctacga tattagcaag acgttgttta ccgttctgtt tggtggaaat    780
gattttataa cggggggaaa aagcgccgat gaggtcattg agcaatatac ggtgtcattg    840
aactacttgg ctcaactagg ggcgaagcag gttgcaattt tccgcttgcc agatttttca    900
gtgataccca gcgtttcaac gtggacagag gctgataagg acaaactgag agagaatagt    960
gttcagttta atgaccaagc cgagaagctg atcgctaaac taaacgcggc acatccccaa   1020
acgacgtttt atacgctgag gttggatgac gcttttaagc aggtgttgga aaacagcgac   1080
caatacggct ttgttaataa gactgatacc tgcctggata tttcccaagg cggatacaac   1140
tatgccattg gggcccgcgc gaaaacggca tgtaagagca gcaatgcggc gtttgtattc   1200
tgggacaata tgcatccgac caccaaaaca cacggattgt tggccgatct tttaaaagat   1260
gatgtggtac gcggcctcgc tgcgccatga                                    1290
<210>84
<211>429
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(22)
<223>从环境样品中获得
 
<400>84
Met Lys Lys Ile Val Ile Tyr Ser Phe Val Ala Gly Val Met Thr Ser
 1               5                  10                  15
Gly Gly Val Phe Ala Ala Ser Asp Asn Ile Val Glu Thr Ser Thr Pro
            20                  25                  30
Pro Gln His Gln Ala Pro Ser Arg Gln Asp Arg Ala Leu Phe Ala Gly
        35                  40                  45
Asp Thr Thr Thr Tyr Ile Lys Cys Val Tyr Lys Val Asp Gly Gln Asp
    50                  55                  60
Asp Ser Asn Pro Ser Ser Ser Trp Leu Trp Ala Lys Val Gly Ser Asn
65                  70                  75                  80
Tyr Ala Lys Leu Lys Gly Tyr Trp Tyr Asn Ser Met Pro Leu Ala Asn
                85                  90                  95
Met Phe Tyr Thr Glu Val Pro Tyr Ala Glu Val Met Asp Leu Cys Asn
            100                 105                 110
Ser Thr Leu Lys Ala Val Gly Ala Asn Ser Thr Leu Val Ile Pro Tyr
        115                 120                 125
Ala Ser Asp Tyr Thr Leu Ser Tyr Tyr Tyr Val Ile Trp Asn Gln Gly
    130                 135                 140
Ala Asn Gln Pro Val Ile Asn Val Gly Gly Arg Glu Leu Asp Arg Met
145                 150                 155                 160
Val Val Phe Gly Asp Ser Leu Ser Asp Thr Val Asn Val Tyr Asn Gly
                165                 170                 175
Ser Tyr Gly Thr Val Pro Asn Ser Thr Ser Trp Leu Leu Gly His Phe
            180                 185                 190
Ser Asn Gly Lys Leu Trp His Glu Tyr Leu Ser Thr Val Leu Asn Leu
        195                 200                 205
Pro Ser Tyr Val Trp Ala Thr Gly Asn Ala Glu Ser Gly Glu Lys Pro
    210                 215                 220
Phe Phe Asn Gly Phe Ser Lys Gln Val Asp Ser Phe Arg Asp Tyr His
225                 230                 235                 240
Ala Arg Thr Lys Gly Tyr Asp Ile Ser Lys Thr Leu Phe Thr Val Leu
                245                 250                 255
Phe Gly Gly Asn Asp Phe Ile Thr Gly Gly Lys Ser Ala Asp Glu Val
            260                 265                 270
Ile Glu Gln Tyr Thr Val Ser Leu Asn Tyr Leu Ala Gln Leu Gly Ala
        275                 280                 285
Lys Gln Val Ala Ile Phe Arg Leu Pro Asp Phe Ser Val Ile Pro Ser
    290                 295                 300
Val Ser Thr Trp Thr Glu Ala Asp Lys Asp Lys Leu Arg Glu Asn Ser
305                 310                 315                 320
Val Gln Phe Asn Asp Gln Ala Glu Lys Leu Ile Ala Lys Leu Asn Ala
                325                 330                 335
Ala His Pro Gln Thr Thr Phe Tyr Thr Leu Arg Leu Asp Asp Ala Phe
            340                 345                 350
Lys Gln Val Leu Glu Asn Ser Asp Gln Tyr Gly Phe Val Asn Lys Thr
        355                 360                 365
Asp Thr Cys Leu Asp Ile Ser Gln Gly Gly Tyr Asn Tyr Ala Ile Gly
    370                 375                 380
Ala Arg Ala Lys Thr Ala Cys Lys Ser Ser Asn Ala Ala Phe Val Phe
385                 390                 395                 400
Trp Asp Asn Met His Pro Thr Thr Lys Thr His Gly Leu Leu Ala Asp
                405                 410                 415
Leu Leu Lys Asp Asp Val Val Arg Gly Leu Ala Ala Pro
            420                 425
 
<210>85
<211>1038
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>85
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac    60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga    120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt    600
gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg    900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
 
<210>86
<211>345
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>86
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
 
<210>87
<211>870
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
 
<400>87
atgtcaaaga aactcgtaat atcggtagcg ggcggcggag cactcggaat cggaccactc     60
gcattcctgt gcaagattga acagatgctg ggaaagaaga taccccaggt tgcgcaggca    120
tacgccggca cttcaaccgg agcaataatt gcggcaggac tggccgaagg ctactccgcg    180
catgaactgt tcgacctata caaatcaaat ctcagcaaga tattcaccaa atacagctgg    240
tacaaacgcc tgcagccaac gtgtcctaca tatgacaaca gtaacctaaa gaaattactg    300
aaggacaaat tcaagggcaa ggtcggcgac tggaaaactc ccgtatacat cccggcaaca    360
cacatgaacg gccaatccgt agaaaaggtg tgggacttgg gtgacaagaa tgttgacaag    420
tggtttgcca ttctgacaag taccgcggca ccaacctatt tcgactgcat atacgacgac    480
gagaagaact gctacatcga tggtggcatg tggtgcaacg caccaatcga tgtgcttaat    540
gcaggcctga tcaagtccgg ctggtccaac tacaaggtcc tggacctgga gaccggcatg    600
gacacaccga atacggaaag cggaaacaag acacttctcg gatgggggga atacatcata    660
agcaactggg tagcccgttc cagcaagtcc ggcgaatacg aggtaaaggc cataatcggg    720
gaagacaatg tatgtgttgc ccgtccatac gtaagcaaga aaccgaagat ggatgacgtg    780
gacagcaaga cgctggatga agtcgtggat atctgggaaa actacttcta cgccaagcag    840
aaagacatcg catcgtggct gaaaatctag                                     870
 
<210>88
<211>289
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>88
Met Ser Lys Lys Leu Val Ile Ser Val Ala Gly Gly Gly Ala Leu Gly
 1               5                  10                  15
Ile Gly Pro Leu Ala Phe Leu Cys Lys Ile Glu Gln Met Leu Gly Lys
            20                  25                  30
Lys Ile Pro Gln Val Ala Gln Ala Tyr Ala Gly Thr Ser Thr Gly Ala
        35                  40                  45
Ile Ile Ala Ala Gly Leu Ala Glu Gly Tyr Ser Ala His Glu Leu Phe
    50                  55                  60
Asp Leu Tyr Lys Ser Asn Leu Ser Lys Ile Phe Thr Lys Tyr Ser Trp
65                  70                  75                  80
Tyr Lys Arg Leu Gln Pro Thr Cys Pro Thr Tyr Asp Asn Ser Asn Leu
                85                  90                  95
Lys Lys Leu Leu Lys Asp Lys Phe Lys Gly Lys Val Gly Asp Trp Lys
            100                 105                 110
Thr Pro Val Tyr Ile Pro Ala Thr His Met Asn Gly Gln Ser Val Glu
        115                 120                 125
Lys Val Trp Asp Leu Gly Asp Lys Asn Val Asp Lys Trp Phe Ala Ile
    130                 135                 140
Leu Thr Ser Thr Ala Ala Pro Thr Tyr Phe Asp Cys Ile Tyr Asp Asp
145                 150                 155                 160
Glu Lys Asn Cys Tyr Ile Asp Gly Gly Met Trp Cys Asn Ala Pro Ile
                165                 170                 175
Asp Val Leu Asn Ala Gly Leu Ile Lys Ser Gly Trp Ser Asn Tyr Lys
            180                 185                 190
Val Leu Asp Leu Glu Thr Gly Met Asp Thr Pro Asn Thr Glu Ser Gly
        195                 200                 205
Asn Lys Thr Leu Leu Gly Trp Gly Glu Tyr Ile Ile Ser Asn Trp Val
    210                 215                 220
Ala Arg Ser Ser Lys Ser Gly Glu Tyr Glu Val Lys Ala Ile Ile Gly
225                 230                 235                 240
Glu Asp Asn Val Cys Val Ala Arg Pro Tyr Val Ser Lys Lys Pro Lys
                245                 250                 255
Met Asp Asp Val Asp Ser Lys Thr Leu Asp Glu Val Val Asp Ile Trp
            260                 265                 270
Glu Asn Tyr Phe Tyr Ala Lys Gln Lys Asp Ile Ala Ser Trp Leu Lys
        275                 280                 285
Ile
 
<210>89
<211>1422
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
<400>89
atgaaaaaga aattatgtac actggctttt gtaacagcaa tatcttctat cgctatcaca      60
attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag     120
cacaaacgtg tgaagagatg gtctgcggaa catccacatc atcctaatga aagtacgcac     180
ttatggattg cgcgaaatgc aattcaaata atggcccgta atcaagataa gacggttcaa     240
gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt     300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat     360
gggctaatta aaggagggtg gaaatctcat ttttacgatc ccgatacgag aaagaactat     420
aaaggggaag aagaaccaac agctctctct caaggagata aatattttaa attagcaggc     480
gattacttta agaaagagga ttggaaacaa gctttctatt atttaggtgt tgcgacgcac     540
tacttcacag atgctactca gccaatgcat gctgctaatt ttacagccgt cgacacgagt     600
gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa     660
gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc     720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa     780
tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag     840
aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca     900
tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga     960
gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt    1020
ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat    1080
agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt    1140
catcgaggag aaagtatact gctgaaaatg acgcaatcta actatgataa ttacgtattt    1200
ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca    1260
cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga    1320
tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa    1380
acagatacac caaaagcttg gaaatttata caggctgaat ag                       1422
 
<210>90
<211>473
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(25)
<223>从环境样品中获得
 
<400>90
Met Lys Lys Lys Leu Cys Thr Leu Ala Phe Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Ile Ala Ile Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Pro Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ala Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly
    210                 215                 220
Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn
    290                 295                 300
Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly
305                 310                 315                 320
Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu
    370                 375                 380
Ser Ile Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser
            420                 425                 430
Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
 
<210>91
<211>1035
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>91
atgacaaccc aatttagaaa cctgatcttt gagggcggcg gtgtaaaggg cattgcttac     60
gtcggagcaa tgcagattct tgaaaatcgt ggtgtattac aagatattca ccgagtcgga    120
ggttgtagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac agtccgtgag    180
caaaaagaga tcttacaaat taccgatttt aaccagttta tggataactc gtggggtgtt    240
attcgggata ttcgcaggct tgcgagagaa tttggctgga ataagggtaa cttctttaat    300
acctggatag gtgatttgat tcatcgtcgt ttgggtaatc gccgagccac gttcaaagat    360
ctgcaaaagg caaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgtgcagct taactacccg atcaagctgt ttgatcgaac tcgttatatt    600
gacctcgcca aagatccggg tgctgctcgc cacacgggtt attacaataa agagaatgct    660
cgttttcagc ttgagcgacc gggccacagt ccttatgtgt acaatcgcca aacattaggc    720
ttgcgtcttg acagtcgtga agagatagcg ctgtttcgtt acgacgaacc tcttcagggt    780
aaacccatta agtccttcac tgactacgct cgacaacttt ttggtgcgct gaagaatgca    840
caggaaaaca ttcacctaca tggcgatgat tggcagcgca cggtctatat cgatacattg    900
gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgaacag    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgtttga gaagcctgtg   1020
aatagagtgg agtaa                                                    1035
 
<210>92
<211>344
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>92
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Val Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ile Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Glu Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asn Phe Phe Asn Thr Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Thr Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Ala Arg His Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Ala Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Gln Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Lys Asn Ala Gln Glu Asn Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
     290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Phe
            325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu
        340
 
<210>93
<211>963
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>93
gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt atcaggggtt     60
ttcgtaccgc tgcagccatc atatgctact gaaaattatc caaatgattt taaactgttg    120
caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca    180
gattatatga gtaatgcaga ttactttaag ggacatgatg ctctgctctt aaatgagctt    240
tttgacaatg gaaattcgaa cgtgctgcta atgaacttat ccaaggaata tacatatcaa    300
acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat    360
tttgtacccg aagatggtgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata    420
cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat    480
gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa    540
gataccgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc    600
aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac    660
tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc    720
aatgcgccta ccgaatattt agggcataac tctacttggg acccagaaac gaacagcatt    780
acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa    840
gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg    900
aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa    960
taa                                                                  963
 
<210>94
<211>320
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(29)
<223>从环境样品中获得
 
<400>94
Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu
 1               5                  10                  15
Leu Ser Gly Val Phe Val Pro Leu Gln Pro Ser Tyr Ala Thr Glu Asn
            20                  25                  30
Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro
        35                  40                  45
Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser
    50                  55                  60
Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu
65                  70                  75                  80
Phe Asp Asn Gly Asn Ser Asn Val Leu Leu Met Asn Leu Ser Lys G1u
                85                  90                  95
Tyr Thr Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp
            100                 105                 110
Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val
        115                 120                 125
Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr
    130                 135                 140
Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr
145                 150                 155                 160
Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His
                165                 170                 175
Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile
            180                 185                 190
Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn
        195                 200                 205
Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met
    210                 215                 220
Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val
225                 230                 235                 240
Asn Ala Pro Thr Glu Tyr Leu Gly His Asn Ser Thr Trp Asp Pro Glu
                245                 250                 255
Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His
            260                 265                 270
Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp
        275                 280                 285
Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr
    290                 295                 300
Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys
305                 310                 315                 320
 
<210>95
<211>1038
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>95
atggcttcac aattcaggaa tctggtattt gaaggaggtg gtgtaaaagg gattgcgtac     60
ataggtgcga tgcaggtgct ggatcagcgc ggttatttgg gtgataacat caaacgcgtt    120
ggtggaacca gtgcaggtgc cataaatgcg ctgatttatt cgttaggata tgacatccac    180
gaacaacaag agatactgaa ctctacagat tttaaaaagt ttatggataa ctcttttgga    240
tttgtgaggg atttcagaag gctatggaat gaatttggat ggaatagagg agactttttt    300
cttaaatggt caggtgagct gatcaaaaat aaattgggca cctcaaaagc cacctttcag    360
gatttgaagg atgccggtca gccagatttg tatgtaattg gaacaaattt atcgacgggg    420
ttttccgaga ctttttcata tgaacgtcac cccgatatga ctcttgcaga agccgtaaga    480
atcagtatgt cgcttccgct gtttttcagg gctgtgcggt tgggcgacag gaatgatgta    540
tatgtggatg gtggggttca gctcaattac ccggtaaaac tatttgatcg tgaaaaatat    600
attgatatgg ataatgaggc ggctgcagca cgatttactg attattacaa caaagaaaat    660
gccagatttt cgctccagcg gcctggacga agcccctatg tatataatcg tcaaaccctt    720
ggtttgagac tggatacagc cgaagaaatt gcgcttttca ggtacgatga acccattcag    780
gggaaagaga tcaaacggtt tccggaatat gcaaaggctc tgatcggcgc actaatgcag    840
gtgcaggaaa acatacatct ccacagtgac gactggcagc gtacgctgta tatcaatacc    900
ctggatgtaa aaaccacaga ttttgaatta accgatgaga aaaaaaagga actggtagaa    960
cagggaatcc ttggcgcgga aacctatttc aaatggtttg aagacaggga tgaagtagtt   1020
gtaaaccgcc ttgcttag                                                 1038
 
<210>96
<211>345
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>96
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Asp Gln Arg Gly Tyr
            20                  25                  30
Leu Gly Asp Asn Ile Lys Arg Val Gly Gly Thr Ser Ala Gly Ala Ile
        35                  40                  45
Asn Ala Leu Ile Tyr Ser Leu Gly Tyr Asp Ile His Glu Gln Gln Glu
    50                  55                  60
Ile Leu Asn Ser Thr Asp Phe Lys Lys Phe Met Asp Asn Ser Phe Gly
65                  70                  75                  80
Phe Val Arg Asp Phe Arg Arg Leu Trp Asn Glu Phe Gly Trp Asn Arg
                85                  90                  95
Gly Asp Phe Phe Leu Lys Trp Ser Gly Glu Leu Ile Lys Asn Lys Leu
            100                 105                 110
Gly Thr Ser Lys Ala Thr Phe Gln Asp Leu Lys Asp Ala Gly Gln Pro
        115                 120                 125
Asp Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr
    130                 135                 140
Phe Ser Tyr Glu Arg His Pro Asp Met Thr Leu Ala Glu Ala Val Arg
145                 150                 155                 160
Ile Ser Met Ser Leu Pro Leu Phe Phe Arg Ala Val Arg Leu Gly Asp
                165                 170                 175
Arg Asn Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Val
            180                 185                 190
Lys Leu Phe Asp Arg Glu Lys Tyr Ile Asp Met Asp Asn Glu Ala Ala
        195                 200                 205
Ala Ala Arg Phe Thr Asp Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Ser
    210                 215                 220
Leu Gln Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu
225                 230                 235                 240
Gly Leu Arg Leu Asp Thr Ala Glu Glu Ile Ala Leu Phe Arg Tyr Asp
                245                 250                 255
Glu Pro Ile Gln Gly Lys Glu Ile Lys Arg Phe Pro Glu Tyr Ala Lys
            260                 265                 270
Ala Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu His
        275                 280                 285
Ser Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Lys
    290                 295                 300
Thr Thr Asp Phe Glu Leu Thr Asp Glu Lys Lys Lys Glu Leu Val Glu
305                 310                 315                 320
Gln Gly Ile Leu Gly Ala Glu ThrTyr Phe Lys Trp Phe Glu Asp Arg
                325                 330                 335
Asp Glu Val Val Val Asn Arg Leu Ala
            340                 345
 
<210>97
<211>1422
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>97
atgaaaagga aactatgtac atgggctctc gtaacagcaa tagcttctag tactgcggta     60
attccaacag cagcagaagc ttgtggatta ggagaagtaa tcaaacaaga gaatcaagag    120
cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcacatga aagtacccat    180
ttatggattg cacaaaatgc gattcaaatt atgagccgta atcaagataa gacggttcaa    240
gaaaatgaat tacaattttt aaatacccct gaatataagg agttatttga aagaggtctt    300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtataat cggcattgat    360
gggctaattc gaggagggtg gaaatctcat ttctacgatc ccgatacaag aaagaactat    420
aaaggggagg aagaaccaac agctctttct caaggagata aatattttaa attagcaggt    480
gaatacttta agaagaatga ttggaaacag gctttctatt atttaggtgt tgcgacgcac    540
tactttacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacaggagt    600
gctataaagt ttcatagtgc ttttgaagat tatgtgacga caattcagga acagtttaaa    660
gtatcagatg gagagggaaa atataattta gtaaattcta atgatccgaa acagtggatc    720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga tgtgattaaa    780
tctcactata ataaaggaaa caatgctctt tggcagcaag aagttatgcc agctgttcag    840
agaagtttag aacaagccca aagaaatacg gcgggattta ttcatttatg gtttaaaaca    900
tatgttggaa aaacagctgc tgaagatatt gaaaatacta tagtgaaaga ttctagggga    960
gaagcaatac aagagaataa aaaatacttt gtagtaccaa gtgagttttt aaatagaggc   1020
ttaacatttg aagtgtatgc tgcttatgac tatgcgttat tatctaacca tgtggatgat   1080
aataatattc atggtacacc ggttcaaatt gtatttgata aagaaaataa tgggatcctt   1140
catcaaggag aaagtgcatt gttaaagatg acacaatcca actacgataa ttatgtattt   1200
ctaaattatt ctatcataac aaattgggta catcttgcaa aaagagaaaa caatactgca   1260
cagtttaaag tgtatccaaa tccaaataat ccaactgaat atttcatata tacagatggc   1320
tatccagtta attatcaaga aaaaggtaaa gagaaaagct ggattgtttt aggaaagaaa   1380
acggataaac caaaagcatg gaaatttata caggcggaat aa                      1422
 
<210>98
<211>473
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(25)
<223>从环境样品中获得
 
<400>98
Met Lys Arg Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ala Ser
 1               5                  10                  15
Ser Thr Ala Val Ile Pro Thr Ala Ala Glu Ala Cys Gly Leu Gly Glu
            20                  25                  30
Val Ile Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ser His Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Gln Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Ile Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Glu Tyr Phe Lys Lys Asn Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Arg Ser Ala Ile Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asp Tyr Val Thr Thr Ile Gln Glu Gln Phe Lys Val Ser Asp Gly
    210                 215                 220
Glu Gly Lys Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Val Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Gln Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys
    290                 295                 300
Thr Ala Ala Glu Asp Ile Glu Asn Thr Ile Val Lys Asp Ser Arg Gly
305                 310                 315                 320
Glu Ala Ile Gln Glu Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
               325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr AlaA la Tyr Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn His Val Asp Asp Asn Asn Ile His Gly Thr Pro Val
        355                 360                 365
Gln Ile Val Phe Asp Lys Glu Asn Asn Gly Ile Leu His Gln Gly Glu
    370                 375                 380
Ser Ala Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Ile Ile Thr Asn Trp Val His Leu Ala Lys Arg Glu
                405                 410                 415
Asn Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Thr
            420                 425                 430
Glu Tyr Phe Ile Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Lys
        435                 440                 445
Gly Lys Glu Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Lys Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
 
<210>99
<211>1053
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
<400>99
atggcaaagc gttttattct ttcgatcgat ggtggtggca ttcgcgggat catcccggcg     60
gccatcctgg tggagctggc caagcggttg gaggggctgc cgcttcacaa ggcattcgac    120
atgatcgccg ggacatccac cggcggcatc attgcggcgg ggctgacatg cccgcatcct    180
gacgatgagg agacggcggc gtgcacgccg accgatcttc tcaagcttta tgtcgatcac    240
ggcggcaaga tcttcgagaa aaacccgatc ctcggcctca tcaacccatt cggcctcaac    300
gatccgcgct accagccaga tgagctggaa aacaggctga aggcgcagct cggcttgacg    360
gcgacgctcg ataaagggct caccaaggtg ctgatcacgg cctatgatat ccagcagcgg    420
caggcgctgt tcatggcaaa caccgacaac gagaacagca atttccgcta ctgggaggca    480
gcgcgggcga catcggccgc acccacctat tttccgccgg cgctgatcga aagggttggc    540
gagaagaaca aggacaagcg cttcgtgcca ttgatcgacg gcggcgtctt cgccaacgat    600
cctatccttg ccgcctatgt ggaggcgcga aagcagaaat ggggcaatga cgagctcgtt    660
ttcctgtcgc ttggtaccgg ccagcaaaac cgcccgatcg cctatcagga ggccaagggc    720
tggggcattt taggctggat gcagccgtct catgacacgc cgctgatctc gatcctgatg    780
cagggacagg cgagcaccgc ctcctatcag gccaatgcgc tgctcaatcc gcccggcacc    840
aagatcgact attcgaccgt ggtgacgaag gacaacgcgg cttcgctcag ctatttccgt    900
ctcgaccggc agctgagctc gaaggagaac gacgcgctgg acgacgcatc gcccgaaaac    960
atcagggcgc tgaaggcaat cgccgcgcaa atcatcaagg ataacgcgcc ggcgctcgac   1020
gaaatcgcca aacgcatcct ggccaaccaa taa                                1053
 
<210>100
<211>350
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>100
Met Ala Lys Arg Phe Ile Leu Ser Ile Asp Gly Gly Gly Ile Arg Gly
 1               5                  10                  15
Ile Ile Pro Ala Ala Ile Leu Val Glu Leu Ala Lys Arg Leu Glu Gly
            20                  25                  30
Leu Pro Leu His Lys Ala Phe Asp Met Ile Ala Gly Thr Ser Thr Gly
        35                  40                  45
Gly Ile Ile Ala Ala Gly Leu Thr Cys Pro His Pro Asp Asp Glu Glu
    50                  55                  60
Thr Ala Ala Cys Thr Pro Thr Asp Leu Leu Lys Leu Tyr Val Asp His
65                  70                  75                  80
Gly Gly Lys Ile Phe Glu Lys Asn Pro Ile Leu Gly Leu Ile Asn Pro
                85                  90                  95
Phe Gly Leu Asn Asp Pro Arg Tyr Gln Pro Asp Glu Leu Glu Asn Arg
            100                 105                 110
Leu Lys Ala Gln Leu Gly Leu Thr AlaThr Leu Asp Lys Gly Leu Thr
        115                 120                 125
Lys Val Leu Ile Thr Ala Tyr Asp Ile Gln Gln Arg Gln Ala Leu Phe
    130                 135                 140
Met Ala Asn Thr Asp Asn Glu Asn Ser Asn Phe Arg Tyr Trp Glu Ala
145                 150                 155                 160
Ala Arg Ala Thr Ser Ala Ala Pro Thr Tyr Phe Pro Pro Ala Leu Ile
                165                 170                 175
Glu Arg Val Gly Glu Lys Asn Lys Asp Lys Arg Phe Val Pro Leu Ile
            180                 185                 190
Asp Gly Gly Val Phe Ala Asn Asp Pro Ile Leu Ala Ala Tyr Val Glu
        195                 200                 205
Ala Arg Lys Gln Lys Trp Gly Asn Asp Glu Leu Val Phe Leu Ser Leu
    210                 215                 220
Gly Thr Gly Gln Gln Asn Arg Pro Ile Ala Tyr Gln Glu Ala Lys Gly
225                 230                 235                 240
Trp Gly Ile Leu Gly Trp Met Gln Pro Ser His Asp Thr Pro Leu Ile
                245                 250                 255
Ser Ile Leu Met Gln Gly Gln Ala Ser Thr Ala Ser Tyr Gln Ala Asn
            260                 265                 270
Ala Leu Leu Asn Pro Pro Gly Thr Lys Ile Asp Tyr Ser Thr Val Val
        275                 280                 285
Thr Lys Asp Asn Ala Ala Ser Leu Ser Tyr Phe Arg Leu Asp Arg Gln
    290                 295                 300
Leu Ser Ser Lys Glu Asn Asp Ala Leu Asp Asp Ala Ser Pro Glu Asn
305                 310                 315                 320
Ile Arg Ala Leu Lys Ala Ile Ala Ala Gln Ile Ile Lys Asp Asn Ala
                325                 330                 335
Pro Ala Leu Asp Glu Ile Ala Lys Arg Ile Leu Ala Asn Gln
            340                 345                 350
 
<210>101
<211>996
<212>DNA
<213>细菌
 
<400>101
ttgtcgctcg tcgcgtcgct ccgccgcgcc cccggcgccg ccctggccct cgcgcttgcc     60
gccgccaccc tggccgtgac cgcgcagggc gcgaccgccg cccccgccgc ggccgccgcc    120
gaggccccgc ggctcaaggt gctcacgtac aacacgttcc tgttctcgaa gacgctctac    180
ccgaactggg gccaggacca ccgggccaag gcgatcccca ccgccccctt ctaccagggc    240
caggacgtcg tggtcctcca ggaggccttc gacaactccg cgtcggacgc cctcaaggcg    300
aactccgccg gccagtaccc ctaccagacc cccgtcgtgg gccgcggcac cggcggctgg    360
gacgccaccg gcgggtccta ctcctcgacc acccccgagg acggcggcgt gacgatcctc    420
agcaagtggc cgatcgtccg caaggagcag tacgtctaca aggacgcgtg cggcgccgac    480
tggtggtcca acaagggctt cgcctacgtc gtgctcaacg tgaacggcag caaggtgcac    540
gtcctcggca cccacgccca gtccaccgac ccgggctgct cggcgggcga ggcggtgcag    600
atgcggagcc gccagttcaa ggcgatcgac gccttcctcg acgccaagaa catcccggcg    660
ggcgagcagg tgatcgtcgc cggcgacatg aacgtcgact cgcgcacgcc cgagtacggc    720
accatgctcg ccgacgccgg tctggcggcg gccgacgcgc gcaccggcca cccgtactcc    780
ttcgacaccg agctgaactc gatcgcctcc gagcgctacc cggacgaccc gcgcgaggac    840
ctcgattacg tcctctaccg cgccgggaac gcccgccccg ccaactggac caacaacgtg    900
gtcctggaga agagcgcccc gtggaccgtc tccagctggg gcaagagcta cacctacacc    960
aacctctccg accactaccc ggtcaccggc ttctga                              996
 
<210>102
<211>331
<212>PRT
<213>细菌
 
<220>
<221>信号
<222>(1)...(39)
 
<400>102
Leu Ser Leu Val Ala Ser Leu Arg Arg Ala Pro Gly Ala Ala Leu Ala
 1               5                  10                  15
Leu Ala Leu Ala Ala Ala Thr Leu Ala Val Thr Ala Gln Gly Ala Thr
            20                  25                  30
Ala Ala Pro Ala Ala Ala Ala Ala Glu Ala Pro Arg Leu Lys Val Leu
        35                  40                  45
Thr Tyr Asn Thr Phe Leu Phe Ser Lys Thr Leu Tyr Pro Asn Trp Gly
    50                  55                  60
Gln Asp His Arg Ala Lys Ala Ile Pro Thr Ala Pro Phe Tyr Gln Gly
65                  70                  75                  80
Gln Asp Val Val Val Leu Gln Glu Ala Phe Asp Asn Ser Ala Ser Asp
                85                  90                  95
Ala Leu Lys Ala Asn Ser Ala Gly Gln Tyr Pro Tyr Gln Thr Pro Val
            100                 105                 110
Val Gly Arg Gly Thr Gly Gly Trp Asp Ala Thr Gly Gly Ser Tyr Ser
        115                 120                 125
Ser Thr Thr Pro Glu Asp Gly Gly Val Thr Ile Leu Ser Lys Trp Pro
    130                 135                 140
Ile Val Arg Lys Glu Gln Tyr Val Tyr Lys Asp Ala Cys Gly Ala Asp
145                 150                 155                 160
Trp Trp Ser Asn Lys Gly Phe Ala Tyr Val Val Leu Asn Val Asn Gly
                165                 170                 175
Ser Lys Val His Val Leu Gly Thr His Ala Gln Ser Thr Asp Pro Gly
            180                 185                 190
Cys Ser Ala Gly Glu Ala Val Gln Met Arg Ser Arg Gln Phe Lys Ala
        195                 200                 205
Ile Asp Ala Phe Leu Asp Ala Lys Asn Ile Pro Ala Gly Glu Gln Val
    210                 215                 220
Ile Val Ala Gly Asp Met Asn Val Asp Ser Arg Thr Pro Glu Tyr Gly
225                 230                 235                 240
Thr Met Leu Ala Asp Ala Gly Leu Ala Ala Ala Asp Ala Arg Thr Gly
                245                 250                 255
His Pro Tyr Ser Phe Asp Thr Glu Leu Asn Ser Ile Ala Ser Glu Arg
            260                 265                 270
Tyr Pro Asp Asp Pro Arg Glu Asp Leu Asp Tyr Val Leu Tyr Arg Ala
        275                 280                 285
Gly Asn Ala Arg Pro Ala Asn Trp Thr Asn Asn Val Val Leu Glu Lys
    290                 295                 300
Ser Ala Pro Trp Thr Val Ser Ser Trp Gly Lys Ser Tyr Thr Tyr Thr
305                 310                 315                 320
Asn Leu Ser Asp His Tyr Pro Val Thr Gly Phe
                325                 330
 
<210>103
<211>2205
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>103
atgagcgaga agaaggagat tcgcgttgcg ttgatcatgg ggggtggcgt cagcctcggc     60
agtttttcgg gtggtgcgct tctcaagacc atcgagctgc tgcagcacac tgcccgcggt    120
ccggcgaaga tcgatgtcgt gaccggtgcc tcggcgggaa gcatgacgct gggcgtagtc    180
atctaccacc tcatgcgggg atcgtcgacc gatgagattc tccgcgatct gaggcggtcg    240
tgggtggaaa tgatctcgtt cgacggcctc tgtccgccga acctgtcccg tcacgacaag    300
ccgagcctgt tttccgatga gatcgtccgg aagatcgcgg ccaccgtcat cgatatgggg    360
cgcaagctcg aggcggctcc tcatccgctt ttcgccgacg aactcgtagc ctcgttcgca    420
ctgacgaacc tgaacggcat ccccgcccgt acggagggcc agctcatccg gcaggcaaag    480
ggaggcggag ggtccgagaa gggctcgaaa tccgttttcg ccgacgccgt gcagactacc    540
tttcaccacg acgtgatgcg attcgtggtg cggcgcgatc acaacgggca aggcagcctg    600
ttcgacagcc gttaccgggc acgcatactc cctccatgga atgttgggaa gggcggcgat    660
gcatgggaag cctttcgcac ggcggctgtt gcctcggggg cgtttccggc cgcatttcct    720
cccgtcgaga tcagccgcaa ccgcgacgaa ttcaacatct ggcccgatcg catcgaggac    780
cagaaggcat ttacgttcga ttacgtggac ggcggggtac ttcgcaacga acccctccgg    840
gaggcgattc acctggccgc gctgcgcgat gagggagcga cggacatcga gcgtgtgttc    900
atcctcatcg acccgaacat cagcggcacc ggcgaggtct tcccgctctc ctataaccag    960
cagatgcgga tcaagccgaa ctacgattcc aacggcgacg tccgacagta cgatctcgat   1020
gtgccggact acaccggcaa tctgatcggg gcgatcggtc ggctgggttc ggtgatcgtc   1080
gggcaggcga cgttccgcga ctggctcaag gctgccaaag tgaacagcca gatcgagtgg   1140
cgacgggaat tgctgcccat tctccgcgac ctgaacccga accccgggga ggaggcgcgc   1200
aggggcgtga acgggatgat cgacaagatc taccggcaaa agtatcagcg cgccctcgag   1260
tcaaagagcg ttccggtcga ggaggtggaa cggcgcgttg ccgaagacat cgaacgggac   1320
ctggcgcggc gccgttcgga ggccggcgac aacgacttca ttgcccggct cctcctgctc   1380
gtcgacctga tcggcaacct gcgtgagaag cagaagctga acatggtggc gatcaccccc   1440
gcttccgcgc cgcacaacga cgggcgcccc ttgccgctgg ccggcaattt tatgttcagc   1500
ttcggggggt tcttcaggga ggagtacagg caatacgact tctcggtcgg cgaattcgca   1560
gcatggaacg tcctgagcac gccggcctcc gagacgccct ttcttgccga gaccgccccg   1620
aaaccgcccg cccgacctcc ccagccgccg gcaatcaatc ctacctaccg ctcactcggc   1680
ccgcccatcc agcagcggtt cgaggagttc gttcgtgggc acgttcgcgc ctttatcgct   1740
tcggtcgctc cgctgggaac gagagggatc gtcacgggca agattggcgg aaagcttcga   1800
acgatgctga tggcctcgcg caacgggaaa tcagagtact tccggcttcg cctctccggc   1860
gttgacgggc tctacctccg aggctccaag ggccgcaacc tgagggcggt taacggatcg   1920
atcgacacgg tcgtcggcgt ctatatcgac gaggaagatc agcaccgcga tgagtttttc   1980
ggtccccatg tcttcggcgc gaacggctca ggctttacga tggaactatg ggagtcccgc   2040
ggttttttcg ggcgtgatcg tcgcgtcgct gtgatcgagt tggagaacaa ccccggcggg   2100
ttcgcaatcg ccgccggatg caggcggcgg cccggcgtgg tgctggatat ggccaggcgt   2160
aacgggcagc cactgcggac ggtggatgtg atggaatttg cgtga                   2205
 
<210>104
<211>734
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>104
Met Ser Glu Lys Lys Glu Ile Arg Val Ala Leu Ile Met Gly Gly Gly
 1               5                  10                  15
Val Ser Leu Gly Ser Phe Ser Gly Gly Ala Leu Leu Lys Thr Ile Glu
            20                  25                  30
Leu Leu Gln His Thr Ala Arg Gly Pro Ala Lys Ile Asp Val Val Thr
        35                  40                  45
Gly Ala Ser Ala Gly Ser Met Thr Leu Gly Val Val Ile Tyr His Leu
    50                  55                  60
Met Arg Gly Ser Ser Thr Asp Glu Ile Leu Arg Asp Leu Arg Arg Ser
65                  70                  75                  80
Trp Val Glu Met Ile Ser Phe Asp Gly Leu Cys Pro Pro Asn Leu Ser
                85                  90                  95
Arg His Asp Lys Pro Ser Leu Phe Ser Asp Glu Ile Val Arg Lys Ile
            100                 105                 110
Ala Ala Thr Val Ile Asp Met Gly Arg Lys Leu Glu Ala Ala Pro His
        115                 120                 125
Pro Leu Phe Ala Asp Glu Leu Val Ala Ser Phe Ala Leu Thr Asn Leu
    130                 135                 140
Asn Gly Ile Pro Ala Arg Thr Glu Gly Gln Leu Ile Arg Gln Ala Lys
145                 150                 155                 160
Gly Gly Gly Gly Ser Glu Lys Gly Ser Lys Ser Val Phe Ala Asp Ala
                165                 170                 175
Val Gln Thr Thr Phe His His Asp Val Met Arg Phe Val Val Arg Arg
            180                 185                 190
Asp His Asn Gly Gln Gly Ser Leu Phe Asp Ser Arg Tyr Arg Ala Arg
        195                 200                 205
Ile Leu Pro Pro Trp Asn Val Gly Lys Gly Gly Asp Ala Trp Glu Ala
    210                 215                 220
Phe Arg Thr Ala Ala Val Ala Ser Gly Ala Phe Pro Ala Ala Phe Pro
225                 230                 235                 240
Pro Val Glu Ile Ser Arg Asn Arg Asp Glu Phe Asn Ile Trp Pro Asp
                245                 250                 255
Arg Ile Glu Asp Gln Lys Ala Phe Thr Phe Asp Tyr Val Asp Gly Gly
            260                 265                 270
Val Leu Arg Asn Glu Pro Leu Arg Glu Ala Ile His Leu Ala Ala Leu
        275                 280                 285
Arg Asp Glu Gly Ala Thr Asp Ile Glu Arg Val Phe Ile Leu Ile Asp
    290                 295                 300
Pro Asn Ile Ser Gly Thr Gly Glu Val Phe Pro Leu Ser Tyr Asn Gln
305                 310                 315                 320
Gln Met Arg Ile Lys Pro Asn Tyr Asp Ser Asn Gly Asp Val Arg Gln
                325                 330                 335
Tyr Asp Leu Asp Val Pro Asp Tyr Thr Gly Asn Leu Ile Gly Ala Ile
            340                 345                 350
Gly Arg Leu Gly Ser Val Ile Val Gly Gln Ala Thr Phe Arg Asp Trp
        355                 360                 365
Leu Lys Ala Ala Lys Val Asn Ser Gln Ile Glu Trp Arg Arg Glu Leu
    370                 375                 380
Leu Pro Ile Leu Arg Asp Leu Asn Pro Asn Pro Gly Glu Glu Ala Arg
385                 390                 395                 400
Arg Gly Val Asn Gly Met Ile Asp Lys Ile Tyr Arg Gln Lys Tyr Gln
                405                 410                 415
Arg Ala Leu Glu Ser Lys Ser Val Pro Val Glu Glu Val Glu Arg Arg
            420                 425                 430
Val Ala Glu Asp Ile Glu Arg Asp Leu Ala Arg ArgArg Ser Glu Ala
        435                 440                 445
Gly Asp Asn Asp Phe Ile Ala Arg Leu Leu Leu Leu Val Asp Leu Ile
    450                 455                 460
Gly Asn Leu Arg Glu Lys Gln Lys Leu Asn Met Val Ala Ile Thr Pro
465                 470                 475                 480
Ala Ser Ala Pro His Asn Asp Gly Arg Pro Leu Pro Leu Ala Gly Asn
                485                 490                 495
Phe Met Phe Ser Phe Gly Gly Phe Phe Arg Glu Glu Tyr Arg Gln Tyr
            500                 505                 510
Asp Phe Ser Val Gly Glu Phe Ala Ala Trp Asn Val Leu Ser Thr Pro
        515                 520                 525
Ala Ser Glu Thr Pro Phe Leu Ala Glu Thr Ala Pro Lys Pro Pro Ala
    530                 535                 540
Arg Pro Pro Gln Pro Pro Ala Ile Asn Pro Thr Tyr Arg Ser Leu Gly
545                 550                 555                 560
Pro Pro Ile Gln Gln Arg Phe Glu Glu Phe Val Arg Gly His Val Arg
                565                 570                 575
Ala Phe Ile Ala Ser Val Ala Pro Leu Gly Thr Arg Gly Ile Val Thr
            580                 585                 590
Gly Lys Ile Gly Gly Lys Leu Arg Thr Met Leu Met Ala Ser Arg Asn
        595                 600                 605
Gly Lys Ser Glu Tyr Phe Arg Leu Arg Leu Ser Gly Val Asp Gly Leu
    610                 615                 620
Tyr Leu Arg Gly Ser Lys Gly Arg Asn Leu Arg Ala Val Asn Gly Ser
625                 630                 635                 640
Ile Asp Thr Val Val Gly Val Tyr Ile Asp Glu Glu Asp Gln His Arg
                645                 650                 655
Asp Glu Phe Phe Gly Pro His Val Phe Gly Ala Asn Gly Ser Gly Phe
            660                 665                 670
Thr Met Glu Leu Trp Glu SerArg Gly Phe Phe Gly Arg Asp Arg Arg
        675                 680                 685
Val Ala Val Ile Glu Leu Glu Asn Asn Pro Gly Gly Phe Ala Ile Ala
    690                 695                 700
Ala Gly Cys Arg Arg Arg Pro Gly Val Val Leu Asp Met Ala Arg Arg
705                 710                 715                 720
Asn Gly Gln Pro Leu Arg Thr Val Asp Val Met Glu Phe Ala
                725                 730
 
<210>105
<211>756
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
 
<400>105
atgaaccgtt gtcggaactc actcaacctc caacttcgcg cggtgaccgt ggcggcgttg     60
gtagtcgtcg catcctcggc cgcgctggcg tgggacagcg cctcgcgcaa tccgacccat    120
cccacccaca gctacctcac cgaatacgcc atcgatcagc ttggggtggc gcggccggag    180
ctccggcaat accgcaagca gatcatcgag ggcgccaaca ccgagctgca cgaactgcca    240
gtcaagggga cggcctatgg cctcgacctc gacgccaagc ggcgggaaca ccgcggcacc    300
aatgccggga cagacgacat cgccggctgg tgggcggaaa gcctccaagc ctatcgcgcc    360
ggtgccaagg aacgcgccta cttcgtgctg ggggtggtgc tgcacatggt cgaggacatg    420
ggcgtgccgg cgcacgcgaa cggcgtctac caccagggca acctgactga attcgacaat    480
ttcgagttca tgggactgtc gaactggaag ccctctttcg ccgacatcaa ccggaccgat    540
ccgggctacg ccgacccgtc gcgctactac gagttcagcc gagattggac ggcggcagac    600
gcacccggct atcgcgaccg cgacagcttc tcgaagacct gggttctcgc cagcccggcc    660
gaacgtcagc tgcttcagaa ccgccagggc cggaccgcca cggtcgccat gtgggcgtta    720
cggagcgcga cgaaggcgtt cgccgggaaa ccctag                              756
 
<210>106
<211>251
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(30)
<223>从环境样品中获得
 
<400>106
Met Asn Arg Cys Arg Asn Ser Leu Asn Leu Gln Leu Arg Ala Val Thr
 1               5                  10                  15
Val Ala Ala Leu Val Val Val Ala Ser Ser Ala Ala Leu Ala Trp Asp
            20                  25                  30
Ser Ala Ser Arg Asn Pro Thr His Pro Thr His Ser Tyr Leu Thr Glu
        35                  40                  45
Tyr Ala Ile Asp Gln Leu Gly Val Ala Arg Pro Glu Leu Arg Gln Tyr
    50                  55                  60
Arg Lys Gln Ile Ile Glu Gly Ala Asn Thr Glu Leu His Glu Leu Pro
65                  70                  75                  80
Val Lys Gly Thr Ala Tyr Gly Leu Asp Leu Asp Ala Lys Arg Arg Glu
                85                  90                  95
His Arg Gly Thr Asn Ala Gly Thr Asp Asp Ile Ala Gly Trp Trp Ala
            100                 105                 110
Glu Ser Leu Gln Ala Tyr Arg Ala Gly Ala Lys Glu Arg Ala Tyr Phe
        115                 120                 125
Val Leu Gly Val Val Leu His Met Val Glu Asp Met Gly Val Pro Ala
    130                 135                 140
His Ala Asn Gly Val Tyr His Gln Gly Asn Leu Thr Glu Phe Asp Asn
145                 150                 155                 160
Phe Glu Phe Met Gly Leu Ser Asn Trp Lys Pro Ser Phe Ala Asp Ile
                165                 170                 175
Asn Arg Thr Asp Pro Gly Tyr Ala Asp Pro Ser Arg Tyr Tyr Glu Phe
            180                 185                 190
Ser Arg Asp Trp Thr Ala Ala Asp Ala Pro Gly Tyr Arg Asp Arg Asp
        195                 200                 205
Ser Phe Ser Lys Thr Trp Val Leu Ala Ser Pro Ala Glu Arg Gln Leu
    210                 215                 220
Leu Gln Asn Arg Gln Gly Arg Thr Ala Thr Val Ala Met Trp Ala Leu
225                 230                 235                 240
Arg Ser Ala Thr Lys Ala Phe Ala Gly Lys Pro
                245                 250
 
<210>107
<211>990
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>107
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt     60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac    120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg    240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg gaccattata tctttatgta    360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt    480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata    540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa    600
tctggaggat ataataattt ttattggcca gataatgaca cgtttacgac aactgtaaat    660
caaaatgtaa atgtaacagt acaagataaa tataaggtga gttatgatga gaaagtaaca    720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattacgcg    840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctac gagagtgggc    900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata    960
agagcgaata agtcacttgt aaaagagtaa                                     990
 
<210>108
<211>329
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
 
<400>108
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
 1               5                  10                  15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
            20                  25                  30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
        35                  40                  45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Asp Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Thr
225                 230                 235                 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Val Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys Glu
                325
 
<210>109
<211>990
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>109
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt     60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac    120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg    240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta    360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt    480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata    540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa    600
tctggaggat ataataattt ttattggcca gataatgaga cgtttacgac aactgtaaat    660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa    720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg    840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctat gagagtgggc    900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata    960
agagcgaata agtcacttgt aaaagagtaa                                     990
 
<210>110
<211>329
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
 
<220>
<221>结构域
<222>(56)...(195)
 
<223>从环境样品中获得
 
<400>110
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
 1               5                  10                  15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
            20                  25                  30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
        35                  40                  45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225                 230                 235                 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Met Arg Val Gly Trp Val Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys Glu
                325
 
<210>111
<211>828
<212>DNA
<213>细菌
 
<400>111
gtgggtgccg gggcgatcct tctcaccggg gcccccaccg cctcggccgt ggacacgcgc     60
gcgtggatgg ggggacacgg ggacggcacg ccgctccagc ggctcaccat ccccggcacc    120
cacgactccg gcgcccggtt cggcgggccc tggtcggagt gccagaacac caccatcgcc    180
cagcagctgg acagcgggat ccggttcctg gacgtccggt gccgggtcac cggcgggtcc    240
ttcgccatcc accacggggc ctcctaccag aacatgatgt tcggcgacgt cctcgtcgcc    300
tgccgcgact tcctcgccgc gcacccctcc gagaccgtcc tcatgcgggt caagcaggag    360
tactcgaccg actccgacgc caccttccgg gccgtcttcg acgactacct cgacgcgcgc    420
ggctggcgct ccctgttccg catcggcgac ggggtcccgc tgctcggcga ggcccgcggc    480
cgggtcgtgc tcatcgccga caacggcgga ctgccgggcg gtctgcgctg gggcgacggc    540
tcggccctcg ccatccagga cgactggaac gcgctgcccg accccaagta cgccaagatc    600
gaggcgcact tccgtaccgc cgtcgcccag ccgggccggc tgtacgtgaa cttcgtcagc    660
acctccgcct acctgccgcc ccgctggaac tccgacaacc tcaacccgcg cgtgcaccgc    720
tacctcgaca gcgcggccgc cgcgggcgcg aagggcctcg ggatcgtccc catggacttc    780
cccaacaccc gctcgggtct ggtcgaggcg ctgctccggc acaactga                 828
 
<210>112
<211>275
<212>PRT
<213>细菌
 
<220>
<221>信号
<222>(1)...(16)
 
<220>
<221>结构域
<222>(34)...(168)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
 
<400>112
Met Gly Ala Gly Ala Ile Leu Leu Thr Gly Ala Pro Thr Ala Ser Ala
 1               5                  10                  15
Val Asp Thr Arg Ala Trp Met Gly Gly His Gly Asp Gly Thr Pro Leu
            20                  25                  30
Gln Arg Leu Thr Ile Pro Gly Thr His Asp Ser Gly Ala Arg Phe Gly
        35                  40                  45
Gly Pro Trp Ser Glu Cys Gln Asn Thr Thr Ile Ala Gln Gln Leu Asp
    50                  55                  60
Ser Gly Ile Arg Phe Leu Asp Val Arg Cys Arg Val Thr Gly Gly Ser
65                  70                  75                  80
Phe Ala Ile His His Gly Ala Ser Tyr Gln Asn Met Met Phe Gly Asp
                85                  90                  95
Val Leu Val Ala Cys Arg Asp Phe Leu Ala Ala His Pro Ser Glu Thr
            100                 105                 110
Val Leu Met Arg Val Lys Gln Glu Tyr Ser Thr Asp Ser Asp Ala Thr
        115                 120                 125
Phe Arg Ala Val Phe Asp Asp Tyr Leu Asp Ala Arg Gly Trp Arg Ser
    130                 135                 140
Leu Phe Arg Ile Gly Asp Gly Val Pro Leu Leu Gly Glu Ala Arg Gly
145                 150                 155                 160
Arg Val Val Leu Ile Ala Asp Asn Gly Gly Leu Pro Gly Gly Leu Arg
                165                 170                 175
Trp Gly Asp Gly Ser Ala Leu Ala Ile Gln Asp Asp Trp Asn Ala Leu
            180                 185                 190
Pro Asp Pro Lys Tyr Ala Lys Ile Glu Ala His Phe Arg Thr Ala Val
        195                 200                 205
Ala Gln Pro Gly Arg Leu Tyr Val Asn Phe Val Ser Thr Ser Ala Tyr
    210                 215                 220
Leu Pro Pro Arg Trp Asn Ser Asp Asn Leu Asn Pro Arg Val His Arg
225                 230                 235                 240
Tyr Leu Asp Ser Ala Ala Ala Ala Gly Ala Lys Gly Leu Gly Ile Val
                245                 250                 255
Pro Met Asp Phe Pro Asn Thr Arg Ser Gly Leu Val Glu Ala Leu Leu
            260                 265                 270
Arg His Asn
        275
 
<210>113
<211>981
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>113
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt     60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac    120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg    240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta    360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt    480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata    540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa    600
tctggaggat ataataattt ttattggcca gataatgaga cgtttacgac aactgtaaat    660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa    720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg    840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctat gagagtgggc    900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata    960
agagcgaata agtcactgta a                                              981
 
<210>114
<211>326
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
 
<400>114
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
 1               5                  10                  15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
            20                  25                  30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
        35                  40                  45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225                 230                 235                 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Met Arg Val Gly Trp Val Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu
                325
 
<210>115
<211>987
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>115
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt     60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatga gcttgaaaat    120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg    240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta    360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt    480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga agggaatata    540
aagcttggag atgctcgtgg gaaaattata ttactaaaac gatatagtgg tagtaatgaa    600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat    660
caaaatgtaa atgtcacagt acaagataaa tataaagtga gttatgatga gaaagtaaac    720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat    780
attaatttta taagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg    840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc    900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata    960
agagcgaata agtcacttgt aaaatag                                        987
 
<210>116
<211>328
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
 
<400>116
Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val
 1               5                  10                  15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
            20                  25                  30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
        35                  40                  45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Ile Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Asn
225                 230                 235                 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Ile Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys
                325
 
<210>117
<211>987
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>117
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt     60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatga gcttgaaaat    120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg    240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta    360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt    480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga aggaaatata    540
aagcttggag atgctcgtgg gaaaattgta ttactaaaaa gatatagtgg tagtaatgaa    600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat    660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaaataaac    720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg    840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc    900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata    960
agagcgaata agtcacttgt aaaatag                                        987
 
<210>118
<211>328
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
 
<400>118
Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val
 1               5                  10                  15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
            20                  25                  30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
        35                  40                  45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Ile Asn
225                 230                 235                 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys
                325
 
<210>119
<211>987
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>119
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt     60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatgt gcttgaaaat    120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg    240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta    360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt    480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga agggaatata    540
aagcttggag atgctcgtgg gaaaattgta ttactaaaaa gatatagtgg tagtaatgaa    600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat    660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaaataaac    720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg    840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc    900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata    960
agagcgaata agtcacttgt aaaatag                                        987
 
<210>120
<211>328
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
 
<400>120
Met Asn Asn Lys Lys Phe lle Leu Lys Leu Phe Ile Cys Ser Met Val
 1               5                  10                  15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
            20                  25                  30
Ser Ser Ile Asn Val Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
        35                  40                  45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp GIy Met
65                  70                  75                  80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Ile Asn
225                 230                 235                 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys
                325
 
<210>121
<211>990
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>121
atgcgtaata agaagtttat tttgaaatta ttaatatgta gtacggtact tagcaccttt     60
gtatttgctt tcaatgataa gcaaactgtt gcagctagct ctattaatga actcgaaaat    120
tggtctagat ggatgcagcc tatacctgat gacatgccgt tagcaagaat ttcaattcca    180
ggaacacatg atagtggaac gttcaaactg caaaatccga taaagcaagt atggggaatg    240
acgcaagaat atgattttcg ttaccaaatg gatcatgggg ctagaatttt tgatataaga    300
gggcgtttaa cagatgataa tacgatagtc cttcatcatg ggccattata tctttatgta    360
acactgaacg aatttataaa tgaagcgaaa caatttttaa aagataaccc aagtgaaacg    420
attattatgt ctttaaagaa agagtatgag gatatgaaag gggcagaaaa ttcatttagt    480
agtacgtttg aaaaaaaata ttttcttgat cctatctttt taaaaacaga agggaatata    540
aaacttggag atgctcgtgg gaaaattgta ctactaaaaa gatatagtgg tagtaatgaa    600
tctggaggat ataataattt ttattggcca gataacgaga cgtttacgac aactgtaaat    660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa    720
tctattaaag atacgataaa tgaaacgatt aacaatagtg aagattttaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgca    840
tcctacataa atcctgaaat tgcaaaccat atgaagcaaa agaatcctac gagagtgggc    900
tgggtaattc aagattatat aaatgaaaaa tggtcaccaa tactttatca agaagttata    960
agagcgaata agtcacttat aaaagagtag                                     990
<210>122
<211>329
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(23)
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇-特异性磷脂酶C,X结构域
 
<400>122
Met Arg Asn Lys Lys Phe Ile Leu Lys Leu Leu Ile Cys Ser Thr Val
 1               5                  10                  15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Thr Val Ala Ala
            20                  25                  30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Gln Pro Ile
        35                  40                  45
Pro Asp Asp Met Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu Asn Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asn Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Lys Tyr Phe Leu Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225                 230                 235                 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Phe
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn His Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Val Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Gln Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Ile Lys Glu
                325
 
<210>123
<211>849
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>123
atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcacc agttcaaagt     60
gtagtgtttg cgcaaacaaa taatagtgaa agtcctgcac cgatcttaag atggtcagct    120
gaggacaagc ataatgaggg agttagtact catttgtgga ttgtaaatcg tgcaattgac    180
atcatgtctc gtaatacagc gattgtgaag ccaaatgaaa ctgctttatt aaatgagtgg    240
cgtactgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat    300
agtacatatg cttctcattt ttacgatccg gatactggaa aaacatatat tccttttgcg    360
aaacaggcaa aagaaacagg tacaaaatat tttaaacttg ctggtgaagc atacaaaaat    420
caagatatga aacaggcatt cttctattta ggattatcac ttcattattt aggagatgta    480
aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct    540
aaatatgaaa attttgttga tacaataaaa aataactata tagtttcaga tagtagtgga    600
tattggaatt ggaaaggggc aaacccagaa gattggattc aaggagcagc agtagcggct    660
aaacaagatt atcctggtat tgtgaacgat acgacaaaag attggtttgt aaaagcagct    720
gtatctcaag catatgcaga taaatggcgt gcagaagtaa caccggtgac aggaaaacgc    780
ttaatggagg cacagcgcgt tacagctggt tatattcatt tatggtttga tacgtatgta    840
aatcactaa                                                            849
 
<210>124
<211>282
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(24)
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(1)...(281)
<223>锌依赖型磷脂酶C
 
<400>124
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
 1               5                  10                  15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
            20                  25                  30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Val
        35                  40                  45
Ser Thr His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
    50                  55                  60
Asn Thr Ala Ile Val Lys Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Thr Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
            100                 105                 110
Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Glu Thr Gly Thr
        115                 120                 125
Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Lys Asn Gln Asp Met Lys
    130                 135                 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
            180                 185                 190
Tyr Ile Val Ser Asp Ser Ser Gly Tyr Trp Asn Trp Lys Gly Ala Asn
        195                 200                 205
Pro Glu Asp Trp Ile Gln Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
    210                 215                 220
Pro Gly Ile Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Ala Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn His
        275                 280
 
<210>125
<211>1710
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>125
atggctgaca acgagttgcc cctggcgcgg cccagggaga cgccgccgtg ccgccccggc     60
acgttcgagc ttgggctcgc cctggctggc gcggtctctg gcggcgccta cgccgcggga    120
gtcctggatt tcttctacga agccctcgag cattggtacg aggccaggga ggcgggagcg    180
ccggtgccca accacgacgt gctcctccgg atcatctcgg gtgcgtcggc gggcagtatc    240
aatggcgtgc tttcgggcat cgcgctgccg taccgttttc cccacgtgca cagcgggccc    300
gcgcccgagg gtgccacggg caaccccttc tacgacgcct gggtgaagcg catcgacgtg    360
cgcgaactgt tgggcaacga agacctggcc gatcccacgc agccggtggc atccctgctc    420
gacgccacct gcctggatac gatcgcgaag gacatgctcg gcttctcggc ggcgccggcc    480
acccggccgt acgtcgctaa tccgctgaaa tgcgtgttca cggtgaccaa cctgcgtggc    540
gttccttacg tcgtgcagtt caagggaaac ccggagatcc ccggccacgg catgatggcc    600
cacgccgact ggctgcgctt cgccgtcgac accgggcagg gcgaccggga tggggaatgg    660
atgttccccg atgaacggct cgtcagcggg ccgagccatg cgcggactcc ggcctggcaa    720
ggtttcatgg aggcggcgct cgcttcgtcg gcgttcccgg ccggcttgcg tttccgcgaa    780
gtcgcccggc cctggagcga ttacgaccag cgcgtcgtgg tggtgcccaa ccaggcgggg    840
gccgcggtcc cggtcccgct cccgccggcc tgggcggagg gcgagggcag cgatggggac    900
taccggttcg tcgcggtgga tggtggcgcg atggacaacg agccgttcga acttgcccgt    960
accgagctgg cgggcacgct cggccgcaat ccacgcgaag ggaaccgggt caaccgcatc   1020
gtgatcatgc tcgatccgtt tcccgaggcc gaggcgccgg gacccgcgga agccgcgagc   1080
acgaatctcg tcgaggcgat ggcctcgctg tttggtgcgt ggaaacagca ggcacggttc   1140
aagccggagg aagtggcgct cgccctggat tcgaccgtgt acagccgctt catgatcgcg   1200
cccagccggc cgtgcatgga gggcgggcca cggtggatcg gtgggcgagc gctcgccgcg   1260
ggtgcgctgg gtggcttctc ggggttcctg gcggaggcat acaggcacca cgatttcctc   1320
ctgggacgcc gcaactgcca acgcttcctc gccgagcgcc tgttgatccc cgcggacaat   1380
ccgatcttcg ccggctggat cgacgatccc tccctgcagg gctacatccg cgagatcgat   1440
ggcgtgcgtt acgccccggt catcccgctg gtgggcggct gccagggctt gcgcgagccg   1500
ttgcccacgt ggccgcgtgg tgcattcgac ctggactcgc tcatgccgct ggtcgagcgc   1560
cgcatgcagc gcctgtattc ggcggctacc gcgacgctcg gtggccgctt cgccacctgg   1620
ctggcgtggc gcttctacct gcgccgcaag ctcctcgacc tggtctcaagccgtatccgt    1680
agcgcattga gggacttcgg cctttggtga                                    1710
 
<210>126
<211>569
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>126
Met Ala Asp Asn Glu Leu Pro Leu Ala Arg Pro Arg Glu Thr Pro Pro
 1               5                  10                  15
Cys Arg Pro Gly Thr Phe Glu Leu Gly Leu Ala Leu Ala Gly Ala Val
            20                  25                  30
Ser Gly Gly Ala Tyr Ala Ala Gly Val Leu Asp Phe Phe Tyr Glu Ala
        35                  40                  45
Leu Glu His Trp Tyr Glu Ala Arg Glu Ala Gly Ala Pro Val Pro Asn
    50                  55                  60
His Asp Val Leu Leu Arg Ile Ile Ser Gly Ala Ser Ala Gly Ser Ile
65                  70                  75                  80
Asn Gly Val Leu Ser Gly Ile Ala Leu Pro Tyr Arg Phe Pro His Val
                85                  90                  95
His Ser Gly Pro Ala Pro Glu Gly Ala Thr Gly Asn Pro Phe Tyr Asp
            100                 105                 110
Ala Trp Val Lys Arg Ile Asp Val Arg Glu Leu Leu Gly Asn Glu Asp
        115                 120                 125
Leu Ala Asp Pro Thr Gln Pro Val Ala Ser Leu Leu Asp Ala Thr Cys
    130                 135                 140
Leu Asp Thr Ile Ala Lys Asp Met Leu Gly Phe Ser Ala Ala Pro Ala
145                 150                 155                 160
Thr Arg Pro Tyr Val Ala Asn Pro Leu Lys Cys Val Phe Thr Val Thr
                165                 170                 175
Asn Leu Arg Gly Val Pro Tyr Val Val Gln Phe Lys Gly Asn Pro Glu
            180                 185                 190
Ile Pro Gly His Gly Met Met Ala His Ala Asp Trp Leu Arg Phe Ala
        195                 200                 205
Val Asp Thr Gly Gln Gly Asp Arg Asp Gly Glu Trp Met Phe Pro Asp
    210                 215                 220
Glu Arg Leu Va1 Ser Gly Pro Ser His Ala Arg Thr Pro Ala Trp Gln
225                 230                 235                 240
Gly Phe Met Glu Ala Ala Leu Ala Ser Ser Ala Phe Pro Ala Gly Leu
                245                 250                 255
Arg Phe Arg Glu Val Ala Arg Pro Trp Ser Asp Tyr Asp Gln Arg Val
            260                 265                 270
Val Val Val Pro Asn Gln Ala Gly Ala Ala Val Pro Val Pro Leu Pro
        275                 280                 285
Pro Ala Trp Ala Glu Gly Glu Gly Ser Asp Gly Asp Tyr Arg Phe Val
    290                 295                 300
Ala Val Asp Gly Gly Ala Met Asp Asn Glu Pro Phe Glu Leu Ala Arg
305                 310                 315                 320
Thr Glu Leu Ala Gly Thr Leu Gly Arg Asn Pro Arg Glu Gly Asn Arg
                325                 330                 335
Val Asn Arg Ile Val Ile Met Leu Asp Pro Phe Pro Glu Ala Glu Ala
            340                 345                 350
Pro Gly Pro Ala Glu Ala Ala Ser Thr Asn Leu Val Glu Ala Met Ala
        355                 360                 365
Ser Leu Phe Gly Ala Trp Lys Gln Gln Ala Arg Phe Lys Pro Glu Glu
    370                 375                 380
Val Ala Leu Ala Leu Asp Ser Thr Val Tyr Ser Arg Phe Met Ile Ala
385                 390                 395                 400
Pro Ser Arg Pro Cys Met Glu Gly Gly Pro Arg Trp Ile Gly Gly Arg
                405                 410                 415
Ala Leu Ala Ala Gly Ala Leu Gly Gly Phe Ser Gly Phe Leu Ala Glu
            420                 425                 430
Ala Tyr Arg His His Asp Phe Leu Leu Gly Arg Arg Asn Cys Gln Arg
        435                 440                 445
Phe Leu Ala Glu Arg Leu Leu Ile Pro Ala Asp Asn Pro Ile Phe Ala
    450                 455                 460
Gly Trp Ile Asp Asp Pro Ser Leu Gln Gly Tyr Ile Arg Glu Ile Asp
465                 470                 475                 480
Gly Val Arg Tyr Ala Pro Val Ile Pro Leu Val Gly Gly Cys Gln Gly
                485                 490                 495
Leu Arg Glu Pro Leu Pro Thr Trp Pro Arg Gly Ala Phe Asp Leu Asp
            500                 505                 510
Ser Leu Met Pro Leu Val Glu Arg Arg Met Gln Arg Leu Tyr Ser Ala
        515                 520                 525
Ala Thr Ala Thr Leu Gly Gly Arg Phe Ala Thr Trp Leu Ala Trp Arg
    530                 535                 540
Phe Tyr Leu Arg Arg Lys Leu Leu Asp Leu Val Ser Ser Arg Ile Arg
545                 550                 555                 560
Ser Ala Leu Arg Asp Phe Gly Leu Trp
                565
 
<210>127
<211>1038
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>127
atgacaaccc aatttagaaa cttgatcttt gaaggtggtg gtgtaaaagg agttgcttac     60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga    120
ggttgcagtg ccggtgcgat taacgcgctg atttttgcgc tgggttacac ggttcgtgag    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtgg cttctttaat    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaggat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggttt tttctgccga aagacacccc gatatggagc tagcgacagc ggtgcgcatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgatcgaca agatgtgtat    540
gtcgatggag gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt    600
gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaataa agaaaacgct    660
cgctttcagc ttgaacggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgaga ggagataggg ctttttcgtt atgacgaacc cctcaagggc    780
aaaccgatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgcg    840
caggaaaaca ttcatctaca tggcgatgat tggcagcgca cggtctatat cgacacactg    900
gatgtgagta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
 
<210>128
<211>345
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(8)...(195)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
 
<400>128
Met Thr Thr Gln Phe Arg Ash Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp I1e Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Gly Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Ser Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
 
<210>129
<211>1434
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>129
atgaaaaaga aaatatgtac attggctctt gtatcagcaa taacttctgg agttgtgacg     60
attccaacgg tagcatctgc ttgcagaata ggcgaagaag taatgaaaca ggagaaacag    120
gataatcaag agcacaaacg tgtgaaaaga tggtctgcgg agcatccgca tcattctaat    180
gaaagcacgc acttatggat tgctcgaaat gcgattcaaa ttatgagtcg taatcaagat    240
aacacggtcc aaaacaatga attacagttc ttaaatattc ctgaatataa ggagttattt    300
gaaagaggac tttatgatgc tgattacctt gatgaattta acgatggcgg tacaggtaca    360
atcggcattg atgggctaat taaaggaggg tggaaatctc atttttatga tccagatacg    420
aaaaagaatt ataaaggaga agaagctcca acagccctta cgcaaggaga taaatatttt    480
aaattagcag gagactattt taagaaagag gatttgaaac aagctttcta ctatttaggt    540
gttgcgactc actatttcac agatgctact cagccaatgc atgctgctaa ttttacagct    600
gtcgacatga gtgcgataaa gtttcatagc gcttttgaaa attatgtaac gacaattcag    660
acgccatttg aagtgaagga tgataaagga acctataatt tggttgattc taatgatccg    720
aagcagtgga tacatgaaac agcgaaactc gcaaaagcgg aaattatgaa tattactaat    780
gatactatta aatctcaata taataaaggg aacaatgatc tttggcaaca aggagttatg    840
ccagctgttc agagaagtct ggaaacagca caaaggaaca cggcaggatt tattcattta    900
tggtttaaaa catatgttgg caaaactgct gctgaagata ttgaaaatac acaagtaaaa    960
gattctaacg gagaagcaat acaagaaaat aaaaaatact acgttgtacc gagtgagttt   1020
ttaaatagag gtttgacctt tgaggtatat gctgcaaatg actacgcact attagctaat   1080
cacgtagatg ataataaagt tcatggtaca cctgttcagt ttgtttttga taaagacaat   1140
aacggaattc ttcatcgggg agaaagtgca ctgatgaaaa tgacgcaatc taactatgct   1200
gattatgtat ttctcaatta ctctaatatg acaaattggg tacatcttgc gaaacgaaaa   1260
acaaatactt cacagtttaa agtgtatcca aatccggata actcatctga atatttctta   1320
tatacagatg gatacccggt aaattatcaa gaaaatggta acggaaagag ctggattgtg   1380
ttaggaaaga aaacggataa accaaaagcg tggaaattta tacaggcgga ataa         1434
<210>130
<211>477
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>信号
<222>(1)...(27)
 
<220>
<221>结构域
<222>(1)...(307)
<223>锌依赖型磷脂酶C
 
<400>130
Met Lys Lys Lys Ile Cys Thr Leu Ala Leu Val Ser Ala Ile Thr Ser
 1               5                  10                  15
Gly Val Val Thr Ile Pro Thr Val Ala Ser Ala Cys Arg Ile Gly Glu
            20                  25                  30
Glu Val Met Lys Gln Glu Lys Gln Asp Asn Gln Glu His Lys Arg Val
        35                  40                  45
Lys Arg Trp Ser Ala Glu His Pro His His Ser Asn Glu Ser Thr His
    50                  55                  60
Leu Trp Ile Ala Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp
65                  70                  75                  80
Asn Thr Val Gln Asn Asn Glu Leu Gln Phe Leu Asn Ile Pro Glu Tyr
                85                  90                  95
Lys Glu Leu Phe Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu
            100                 105                 110
Phe Asn Asp Gly Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys
        115                 120                 125
Gly Gly Trp Lys Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr
    130                 135                 140
Lys Gly Glu Glu Ala Pro Thr Ala Leu Thr Gln Gly Asp Lys Tyr Phe
145                 150                 155                 160
Lys Leu Ala Gly Asp Tyr Phe Lys Lys Glu Asp Leu Lys Gln Ala Phe
                165                 170                 175
Tyr Tyr Leu Gly Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro
            180                 185                 190
Met His Ala Ala Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe
        195                 200                 205
His Ser Ala Phe Glu Asn Tyr Val Thr Thr Ile Gln Thr Pro Phe Glu
    210                 215                 220
Val Lys Asp Asp Lys Gly Thr Tyr Asn Leu Val Asp Ser Asn Asp Pro
225                 230                 235                 240
Lys Gln Trp Ile His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met
                245                 250                 255
Asn Ile Thr Asn Asp Thr Ile Lys Ser Gln Tyr Asn Lys Gly Asn Asn
            260                 265                 270
Asp Leu Trp Gln Gln Gly Val Met Pro Ala Val Gln Arg Ser Leu Glu
        275                 280                 285
Thr Ala Gln Arg Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr
    290                 295                 300
Tyr Val Gly Lys Thr Ala Ala Glu Asp Ile Glu Asn Thr Gln Val Lys
305                 310                 315                 320
Asp Ser Asn Gly Glu Ala Ile Gln Glu Asn Lys Lys Tyr Tyr Val Val
                325                 330                 335
Pro Ser Glu Phe Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ala
            340                 345                 350
Asn Asp Tyr Ala Leu Leu Ala Asn His Val Asp Asp Asn Lys Val His
        355                 360                 365
Gly Thr Pro Val Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu
    370                 375                 380
His Arg Gly Glu Ser Ala Leu Met Lys Met Thr Gln Ser Asn Tyr Ala
385                 390                 395                 400
Asp Tyr Val Phe Leu Asn Tyr Ser Asn Met Thr Asn Trp Val His Leu
                405                 410                 415
Ala Lys Arg Lys Thr Asn Thr Ser Gln Phe Lys Val Tyr Pro Asn Pro
            420                 425                 430
Asp Asn Ser Ser Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn
        435                 440                 445
Tyr Gln Glu Asn Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys
    450                 455                 460
Thr Asp Lys Pro Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470                 475
 
<210>131
<211>927
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>131
atgccgagcc caaaaagtaa tattgatgtt atcagcatcg atggtggtgg aatacgtgga     60
gtattctccg ttacattatt ggatagatta tgtaagacct atcccaatct tcttaagaaa    120
acatatctgt ttgctggaac atctacaggt gggatcattg ccttaggatt agcaaacaac    180
atgacacctc ttgagataag agccttgtac gagaagaacg gttcaaagat atttcataaa    240
tctgtgtggg aaggcgttaa agatttaggt ggaaccatag gtgcaaagta tagtaacaag    300
aatcttaaat ccgttttgaa aaaatacttt ggttcattga agttaaaaga tttatctaaa    360
aaagtactaa tacctacttt tgatttacac tcagacaaag aagaaggcta tccaatgtgg    420
aagcctaagt tctatcacaa ctttgatgga gaaacggaag atatagaaaa gctcgttctt    480
gatgtagcta tgatgacatc agcagcgccc actttcttcc ctacatacaa cgggcatatt    540
gatggcggtg ttgtagccaa caatccatcg atggccgcat tagcccagat tatggatgaa    600
agatatggca tcaatgcctc tgaagttcat attcttaata taggaacagg ttttaaccct    660
gcttatgtta agatgaatcc aggggaagag aaagactggg gtgaacttca gtggataaaa    720
cctttaatca atcttctagt cgatggctct atggatgttt ctacttatta ttgtaagcaa    780
gtcttacgtg ataattttta tagggttaac atgaaattac ctaagaacgt agaaatggat    840
gatcctaatt ctattcctta tttaattgaa cttgcaaact cagttgatct aactgaatgt    900
atcaactggc ttaattcgag gtggtaa                                        927
 
<210>132
<211>308
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(11)...(194)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
 
<400>132
Met Pro Ser Pro Lys Ser Asn Ile Asp Val Ile Ser Ile Asp Gly Gly
 1               5                  10                  15
Gly Ile Arg Gly Val Phe Ser Val Thr Leu Leu Asp Arg Leu Cys Lys
            20                  25                  30
Thr Tyr Pro Asn Leu Leu Lys Lys Thr Tyr Leu Phe Ala Gly Thr Ser
        35                  40                  45
Thr Gly Gly Ile Ile Ala Leu Gly Leu Ala Asn Asn Met Thr Pro Leu
    50                  55                  60
Glu Ile Arg Ala Leu Tyr Glu Lys Asn Gly Ser Lys Ile Phe His Lys
65                  70                  75                  80
Ser Val Trp Glu Gly Val Lys Asp Leu Gly Gly Thr Ile Gly Ala Lys
                85                  90                  95
Tyr Ser Asn Lys Asn Leu Lys Ser Val Leu Lys Lys Tyr Phe Gly Ser
            100                 105                 110
Leu Lys Leu Lys Asp Leu Ser Lys Lys Val Leu Ile Pro Thr Phe Asp
        115                 120                 125
Leu His Ser Asp Lys Glu Glu Gly Tyr Pro Met Trp Lys Pro Lys Phe
    130                 135                 140
Tyr His Asn Phe Asp Gly Glu Thr Glu Asp Ile Glu Lys Leu Val Leu
145                 150                 155                 160
Asp Val Ala Met Met Thr Ser Ala Ala Pro Thr Phe Phe Pro Thr Tyr
                165                 170                 175
Asn Gly His Ile Asp Gly Gly Val Val Ala Asn Asn Pro Ser Met Ala
            180                 185                 190
Ala Leu Ala Gln Ile Met Asp Glu Arg Tyr Gly Ile Asn Ala Ser Glu
        195                 200                 205
Val His Ile Leu Asn Ile Gly Thr Gly Phe Asn Pro Ala Tyr Val Lys
    210                 215                 220
Met Asn Pro Gly Glu Glu Lys Asp Trp Gly Glu Leu Gln Trp Ile Lys
225                 230                 235                 240
Pro Leu IIe Asn Leu Leu Val Asp Gly Ser Met Asp Val Ser Thr Tyr
                245                 250                 255
Tyr Cys Lys Gln Val Leu Arg Asp Asn Phe Tyr Arg Val Asn Met Lys
            260                 265                 270
Leu Pro Lys Asn Val Glu Met Asp Asp Pro Asn Ser Ile Pro Tyr Leu
        275                 280                 285
Ile Glu Leu Ala Asn Ser Val Asp Leu Thr Glu Cys Ile Asn Trp Leu
    290                 295                 300
Asn Ser Arg Trp
305
 
<210>133
<211>1053
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>133
atgactacac agtttcgcaa tctcgttttc gaaggaggcg gcgtcagggg tatagcctat     60
gtgggggcaa tgcaggttct tgagcaacgg ggaatgctca ggaacataga ccgtgcaggc    120
ggcacgagcg ccggtgcgat taacgcactc atcttttcac tcggctatga cataaggtct    180
cagctcgaaa tactccattc taccgacttt agaaatttta tggatagttc cttcgggata    240
atcagggata tccgccgtct tgcacgggat ttcggatggt acaagggtga tttcttcaca    300
ggctggattg gcaagcttat aaaagacagg ctcggtagcg agaaagcaac tttccgtgac    360
cttgcagaat cagattgtcc cgatctgtat gtgatcggca ccaacctctc aaccggcttc    420
gccgaggtat tctcagccga gagacatccc gatatgcctc ttgcaacggc tgtccgtatc    480
agcatgtcga tccctctatt ttttgctgca atgcgttatg gtccgaggga agacgtattt    540
gtagacggtg gggtagtact caactatcct gtaaagctgt ttgacaggtt gaaatacatt    600
gaaagcgggg agacggagga agccgcacgc tataccgaat attataacag ggagaacgca    660
cggttccttc tcaaaagtcc cgaccgcagt ccctatgttt ataaccgtca gacactgggt    720
ttgcgtctcg atacgcgtga ggagattgca catttccgtt atgacgagcc cctggagggt    780
aaaaaaatca tacgctttac ggattatgca cgggcactcg tttcaacctt gcttcaggtt    840
caggaaaacc agcatctgca cagtgacgac tggcagcgta cagtttacat tgacacactg    900
gatgtgaaga cgactgattt tgatatcacg gataagcaga aggacatcct gataaagcag    960
ggaattaacg gagcggagaa ctatttgggt tggtttgaag acccgtatga aaaacccgcc   1020
aaccgcctgc ccggtggcag caagtctgac tga                                1053
 
<210>134
<211>350
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(8)...(195)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
 
<400>134
Met Thr Thr Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Arg
 1               5                  10                  15
Gly Ile Ala Tyr Val Gly Ala Met Gln Val Leu Glu Gln Arg Gly Met
            20                  25                  30
Leu Arg Asn Ile Asp Arg Ala Gly Gly Thr Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ser Leu Gly Tyr Asp Ile Arg Ser Gln Leu Glu Ile
    50                  55                  60
Leu His Ser Thr Asp Phe Arg Asn Phe Met Asp Ser Ser Phe Gly Ile
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Tyr Lys Gly
                85                  90                  95
Asp Phe Phe Thr Gly Trp Ile Gly Lys Leu Ile Lys Asp Arg Leu Gly
            100                 105                 110
Ser Glu Lys Ala Thr Phe Arg Asp Leu Ala Glu Ser Asp Cys Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Pro Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Met Arg Tyr Gly Pro Arg
                165                 170                 175
Glu Asp Val Phe Val Asp Gly Gly Val Val Leu Asn Tyr Pro Val Lys
            180                 185                 190
Leu Phe Asp Arg Leu Lys Tyr Ile Glu Ser Gly Glu Thr Glu Glu Ala
        195                 200                 205
Ala Arg Tyr Thr Glu Tyr Tyr Asn Arg Glu Asn Ala Arg Phe Leu Leu
    210                 215                 220
Lys Ser Pro Asp Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Thr Arg Glu Glu Ile Ala His Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Glu Gly Lys Lys Ile Ile Arg Phe Thr Asp Tyr Ala Arg Ala
            260                 265                 270
Leu Val Ser Thr Leu Leu Gln Val Gln Glu Asn Gln His Leu His Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Lys Thr
    290                 295                 300
Thr Asp Phe Asp Ile Thr Asp Lys Gln Lys Asp Ile Leu Ile Lys Gln
305                 310                 315                 320
Gly Ile Asn Gly Ala Glu Asn Tyr Leu Gly Trp Phe Glu Asp Pro Tyr
                325                 330                 335
Glu Lys Pro Ala Asn Arg Leu Pro Gly Gly Ser Lys Ser Asp
            340                 345                 350
 
<210>135
<211>1710
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>135
atggctgaca acgagttacc cctggcccgc cccagggaaa cccctccgtg ccgtcccggc     60
acgttcgagc tggggctggc gctcgccggc gcggtatcgg gcggcgccta cgccgcgggc    120
gtgctggatt tcttctacga ggcgctggag cactggtacg acgcgaaggc gaacggtgcg    180
cccgtgccga gccacgacgt gctgctacgg atcatttcag gcgcctccgc gggcagcatc    240
aacggcgtgc tttccggcat cgcgttgccg taccgcttcc cgcacgtgca cagcggaccc    300
gcgccccggc aggcgacggg aaaccccttc tacgacgcgt gggtgaggcg catcgatgta    360
cgcgagctgc tgggcgaggc cgacctggct aacccggcgc ggccgatcac ctcgctgctt    420
gattccagca gcctggatac gatcgcgaag gacatgctcg gctacgccgg cgtgccggcc    480
gcgcgccctt acatcgcgaa cccgctgaaa tgcgtgttca ccgtgacgaa tcttcgcggc    540
gtgccctacg tggtgcagtt caagggcaac cccgagattc ccggccacgg catgatggcg    600
cacgccgatt ggctgcgctt cgccatcgac tcggggcagg gcgaacgcga tggcgcatgg    660
atgttccccg acgagcgcat cgtcagcggc ccgagccatg cgcgcagccc ggcctggcat    720
gcgctcatgg aggcggccct ggcgtcgtcc gcgttcccgg ccggcctgcg cttccgcgag    780
gtggcccggc cgtggagcga ttacgaccag cgcgtggttg tcgtgcccgg tcaggatggc    840
atggcggtgc cggtaccgct gccaccagcg tggggcgaag gggagggtgg gaagggcgac    900
taccgctttg tcgccgtgga tggtggcgcc atggataacg aaccgttcga gctggcccgc    960
acggagcttg cgggcacgat gggccgcaac ccgcgtgaag gtacccgggt gaatcgtatc   1020
gtgattatgc tcgatccgtt tccggaggcc gaggcgcccg gcccctcgga ggcggcgtcg   1080
acgaacctgg tggaagcgat ggcgtcgctg ttcggtgcat ggaagcagca ggcgcggttc   1140
aagcccgagg aagtggcgct ggccctcgat agcacggtgt acagccgctt catgatcgcg   1200
cctagccgcc cctgcacgga tggcggcccg cggtggatcg gcggccgcgc gctcaccgcg   1260
ggcgcactgg gtggcttctc ggggttcctg gccgaggatt accgccacca cgatttcctc   1320
ctgggccggc gtaactgcca gcggtttctc gccgagcggc tgctcgttcc cgcaacgaac   1380
ccgatcttcg ctggatggat cgacgatccc gcactgcagg gctacgtgcg tgagatcgat   1440
ggtgagcgct ttgcccccgt gattccccta gtgggcggct gccaggccct gcaagagccc   1500
ttgccggcgt ggccgcgtgg ggcgttcgac atggatgcgc tcatgcccct ggtcgagaag   1560
cgcatgcagg ccctgtacac ggcggccacc acgaagctgg gtggccgctt cgccatgtgg   1620
ctcgcgtggc gcttcttcat ccgccgcaaa ctcctcgaca tcgtctcaag ccgtatccgc   1680
aatgcgctga aagacttcgg cctttggtga                                    1710
 
<210>136
<211>569
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>136
Met Ala Asp Asn Glu Leu Pro Leu Ala Arg Pro Arg Glu Thr Pro Pro
 1               5                  10                  15
Cys Arg Pro Gly Thr Phe Glu Leu Gly Leu Ala Leu Ala Gly Ala Val
            20                  25                  30
Ser Gly Gly Ala Tyr Ala Ala Gly Val Leu Asp Phe Phe Tyr Glu Ala
        35                  40                  45
Leu Glu His Trp Tyr Asp Ala Lys Ala Asn Gly Ala Pro Val Pro Ser
    50                  55                  60
His Asp Val Leu Leu Arg Ile Ile Ser Gly Ala Ser Ala Gly Ser Ile
65                  70                  75                  80
Asn Gly Val Leu Ser Gly Ile Ala Leu Pro Tyr Arg Phe Pro His Val
                85                  90                  95
His Ser Gly Pro Ala Pro Arg Gln Ala Thr Gly Asn Pro Phe Tyr Asp
            100                 105                 110
Ala Trp Val Arg Arg Ile Asp Val Arg Glu Leu Leu Gly Glu Ala Asp
        115                 120                 125
Leu Ala Asn Pro Ala Arg Pro Ile Thr Ser Leu Leu Asp Ser Ser Ser
    130                 135                 140
Leu Asp Thr Ile Ala Lys Asp Met Leu Gly Tyr Ala Gly Val Pro Ala
145                 150                 155                 160
Ala Arg Pro Tyr Ile Ala Asn Pro Leu Lys Cys Val Phe Thr Val Thr
                165                 170                 175
Asn Leu Arg Gly Val Pro Tyr Val Val Gln Phe Lys Gly Asn Pro Glu
            180                 185                 190
Ile Pro Gly His Gly Met Met Ala His Ala Asp Trp Leu Arg Phe Ala
        195                 200                 205
Ile Asp Ser Gly Gln Gly Glu Arg Asp Gly Ala Trp Met Phe Pro Asp
    210                 215                 220
Glu Arg Ile Val Ser Gly Pro Ser His Ala Arg Ser Pro Ala Trp His
225                 230                 235                 240
Ala Leu Met Glu Ala Ala Leu Ala Ser Ser Ala Phe Pro Ala Gly Leu
                245                 250                 255
Arg Phe Arg Glu Val Ala Arg Pro Trp Ser Asp Tyr Asp Gln Arg Val
            260                 265                 270
Val Val Val Pro Gly Gln Asp Gly Met Ala Val Pro Val Pro Leu Pro
        275                 280                 285
Pro Ala Trp Gly Glu Gly Glu Gly Gly Lys Gly Asp Tyr Arg Phe Val
    290                 295                 300
Ala Val Asp Gly Gly Ala Met Asp Asn Glu Pro Phe Glu Leu Ala Arg
305                 310                 315                 320
Thr Glu Leu Ala Gly Thr Met Gly Arg Asn Pro Arg Glu Gly Thr Arg
                325                 330                 335
Val Asn Arg Ile Val Ile Met Leu Asp Pro Phe Pro Glu Ala Glu Ala
            340                 345                 350
Pro Gly Pro Ser Glu Ala Ala Ser Thr Asn Leu Val Glu Ala Met Ala
        355                 360                 365
Ser Leu Phe Gly Ala Trp Lys Gln Gln Ala Arg Phe Lys Pro Glu Glu
    370                 375                 380
Val Ala Leu Ala Leu Asp Ser Thr Val Tyr Ser Arg Phe Met Ile Ala
385                 390                 395                 400
Pro Ser Arg Pro Cys Thr Asp Gly Gly Pro Arg Trp Ile Gly Gly Arg
                405                 410                 415
Ala Leu Thr Ala Gly Ala Leu Gly Gly Phe Ser Gly Phe Leu Ala Glu
            420                 425                 430
Asp Tyr Arg His His Asp Phe Leu Leu Gly Arg Arg Asn Cys Gln Arg
        435                 440                 445
Phe Leu Ala Glu Arg Leu Leu Val Pro Ala Thr Asn Pro Ile Phe Ala
    450                 455                 460
Gly Trp Ile Asp Asp Pro Ala Leu Gln Gly Tyr Val Arg Glu Ile Asp
465                 470                 475                 480
Gly Glu Arg Phe Ala Pro Val Ile Pro Leu Val Gly Gly Cys Gln Ala
                485                 490                 495
Leu Gln Glu Pro Leu Pro Ala Trp Pro Arg Gly Ala Phe Asp Met Asp
            500                 505                 510
Ala Leu Met Pro Leu Val Glu Lys Arg Met Gln Ala Leu Tyr Thr Ala
        515                 520                 525
Ala Thr Thr Lys Leu Gly Gly Arg Phe Ala Met Trp Leu Ala Trp Arg
    530                 535                 540
Phe Phe Ile Arg Arg Lys Leu Leu Asp Ile Val Ser Ser Arg Ile Arg
545                 550                 555                 560
Asn Ala Leu Lys Asp Phe Gly Leu Trp
                565
 
<210>137
<211>1038
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>137
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga    120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt    600
gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg    900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
 
<210>138
<211>345
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(8)...(195)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
 
<400>138
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>139
<211>1692
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>139
atgaaaataa agccgctcac gttttctttt ggattagcag tcactagctc ggtgcaagcc     60
ttcactcaat ttggcggaca aggcgttatg ccgatgggtc acgaatggtt aacgcgcacc    120
gctgctctcg aggtacttaa tgcagagcat atcatcgaag cggatccgaa tgacccaaga    180
tatacttggc aggacggact tgctaaaaac cttgaactta ataccgccca atctgaaatc    240
acgcgcttac aatctcattt aaataataac ccgctctatg agccgagata cgacggtata    300
aactcagcca tcgttggtga acgctgggtc gatattgcag ggtttaacgt cacaacagcc    360
agcgcagacc cgactggccc taattgcttt agcgcagttt cacaagagcc cgcagatatt    420
cagcaagacc actttatgcg ccgctatgat gatattggag gtcaaggtgg agttgatgct    480
gcttatcgcg cacagcaacg atttgtgcaa cactttgtgg atgcggccat ggccgaaaaa    540
aaacgactaa aagtatggga cggtggtggc cattctgcgt tagcagaggt agatcataat    600
tactttttat ttggtcgtgc ggttcaccta tttcaagact catttagtcc agaacacacg    660
gtacggctcc ctcaagataa ctacgaaaaa gtttggcagg ttaaggcata tctttgctca    720
gagggggctg agcaacattc acacgatacc aaagacgtgc tcaactttgc cagtggcgat    780
gttatttggc aacctcaaac ccgactagaa gcaggctggc aatcttacca gatcagcagt    840
atgaagcccg ttgctattgt ggcccttgaa gccagtaaag atctttgggc tgcgtttatt    900
cgcaccatgg cgaccccaaa agcacagaga cgtaacgtgg caacgcaaga agcccaacaa    960
cttgtacaaa actggttgtc ttttgatgag gcccagatgc tgacttggta tcaagatgag   1020
aataagcgtg accatactta tgtgcttgcc cccaatgaaa cgggaaaagg aaaatctctg   1080
gaagcctgta tgacagagct aaaggtaggc actagcagtc aagcagaacg ggttgcgcaa   1140
ctggaagccg agcgtaatca atgcctatac aacattgagg cggaacctgg ctttgcagac   1200
ttaaacgatc cacacctcga tattccatat aactggcgct ggaagtctct gacttggcaa   1260
acgcctccta gtggctggac atacccacaa ctaaatgcag ataccggcga gcaagtcgcc   1320
attaaatcgc cgataaataa tcagtattta tctgcacaaa ctctaagtaa cgacaccccg   1380
atcactctga gtcaagcaca tccaatttcc ttgatccaag tgacgaatgc acagggccag   1440
cactatttta ggagcgctca agccccttca ctatttctgg gttatagcaa caaaattgca   1500
ggctacctca agcttgtaga ttcacccaag caagccctat atacgttgat ttatcaaggt   1560
ggtctttgga atatccaaaa tgaattttgg caacagtata tctggttaaa tcaagacaaa   1620
gagcggccgg aattaaatcg ccatggtgag cctagccaat taaacgctca gtggatggtc   1680
gaacacttat aa                                                       1692
 
<210>140
<211>563
<212>PRT
<213>未知
 
<220>
<221>信号
<222>(1)...(20)
<223>从环境样品中获得
 
<400>140
Met Lys Ile Lys Pro Leu Thr Phe Ser Phe Gly Leu Ala Val Thr Ser
 1               5                  10                  15
Ser Val Gln Ala Phe Thr Gln Phe Gly Gly Gln Gly Val Met Pro Met
            20                  25                  30
Gly His Glu Trp Leu Thr Arg Thr Ala Ala Leu Glu Val Leu Asn Ala
        35                  40                  45
Glu His Ile Ile Glu Ala Asp Pro Asn Asp Pro Arg Tyr Thr Trp Gln
    50                  55                  60
Asp Gly Leu Ala Lys Asn Leu Glu Leu Asn Thr Ala Gln Ser Glu Ile
65                  70                  75                  80
Thr Arg Leu Gln Ser His Leu Asn Asn Asn Pro Leu Tyr Glu Pro Arg
                85                  90                  95
Tyr Asp Gly Ile Asn Ser Ala Ile Val Gly Glu Arg Trp Val Asp Ile
            100                 105                 110
Ala Gly Phe Asn Val Thr Thr Ala Ser Ala Asp Pro Thr Gly Pro Asn
        115                 120                 125
Cys Phe Ser Ala Val Ser Gln Glu Pro Ala Asp Ile Gln Gln Asp His
    130                 135                 140
Phe Met Arg Arg Tyr Asp Asp Ile Gly Gly Gln Gly Gly Val Asp Ala
145                 150                 155                 160
Ala Tyr Arg Ala Gln Gln Arg Phe Val Gln His Phe Val Asp Ala Ala
                165                 170                 175
Met Ala Glu Lys Lys Arg Leu Lys Val Trp Asp Gly Gly Gly His Ser
            180                 185                 190
Ala Leu Ala Glu Val Asp His Asn Tyr Phe Leu Phe Gly Arg Ala Val
        195                 200                 205
His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu Pro
    210                 215                 220
Gln Asp Asn Tyr Glu Lys Val Trp Gln Val Lys Ala Tyr Leu Cys Ser
225                 230                 235                 240
Glu Gly Ala Glu Gln His Ser His Asp Thr Lys Asp Val Leu Asn Phe
                245                 250                 255
Ala Ser Gly Asp Val Ile Trp Gln Pro Gln Thr Arg Leu Glu Ala Gly
            260                 265                 270
Trp Gln Ser Tyr Gln Ile Ser Ser Met Lys Pro Val Ala Ile Val Ala
        275                 280                 285
Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met Ala
    290                 295                 300
Thr Pro Lys Ala Gln Arg Arg Asn Val Ala Thr Gln Glu Ala Gln Gln
305                 310                 315                 320
Leu Val Gln Asn Trp Leu Ser Phe Asp Glu Ala Gln Met Leu Thr Trp
                325                 330                 335
Tyr Gln Asp Glu Asn Lys Arg Asp His Thr Tyr Val Leu Ala Pro Asn
            340                 345                 350
Glu Thr Gly Lys Gly Lys Ser Leu Glu Ala Cys Met Thr Glu Leu Lys
        355                 360                 365
Val Gly Thr Ser Ser Gln Ala Glu Arg Val Ala Gln Leu Glu Ala Glu
    370                 375                 380
Arg Asn Gln Cys Leu Tyr Asn Ile Glu Ala Glu Pro Gly Phe Ala Asp
385                 390                 395                 400
Leu Asn Asp Pro His Leu Asp Ile Pro Tyr Asn Trp Arg Trp Lys Ser
                405                 410                 415
Leu Thr Trp Gln Thr Pro Pro Ser Gly Trp Thr Tyr Pro Gln Leu Asn
            420                 425                 430
Ala Asp Thr Gly Glu Gln Val Ala Ile Lys Ser Pro Ile Asn Asn Gln
        435                 440                 445
Tyr Leu Ser Ala Gln Thr Leu Ser Asn Asp Thr Pro Ile Thr Leu Ser
    450                 455                 460
Gln Ala His Pro Ile Ser Leu Ile Gln Val Thr Asn Ala Gln Gly Gln
465                 470                 475                 480
His Tyr Phe Arg Ser Ala Gln Ala Pro Ser Leu Phe Leu Gly Tyr Ser
                485                 490                 495
Asn Lys Ile Ala Gly Tyr Leu Lys Leu Val Asp Ser Pro Lys Gln Ala
            500                 505                 510
Leu Tyr Thr Leu Ile Tyr Gln Gly Gly Leu Trp Asn Ile Gln Asn Glu
        515                 520                 525
Phe Trp Gln Gln Tyr Ile Trp Leu Asn Gln Asp Lys Glu Arg Pro Glu
    530                 535                 540
Leu Asn Arg His Gly Glu Pro Ser Gln Leu Asn Ala Gln Trp Met Val
545                 550                 555                 560
Glu His Leu
 
<210>141
<211>471
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>141
atgcaaaaaa aaaccagtac atgtgaagac gagggeccgt accgggcagt cttgtttgat     60
ttggacggca ccctgttgga tacggagcgg attggggcgg cctcctggga ccatgcggga    120
gacgaattgg gtctgcgggt gccggaggcg gtaaagcggc agatggtggg tcggacgctg    180
ccggatattc atgcaattgt acgggaaggc atgccggacg tggacgcgga tcgtctgctg    240
gagcgggcca atcatcatta tcaccgtttg gtgaccgaag tgccaccgcc ggtgaaggcc    300
ggggcgcggg aactgctgga atggctgaag ggtgctgggg tgcccatggc ggtggcgact    360
tccagccgcc gggttcaggc cgaagacaaa ttaagccgta ccggcctgcg gcattttttt    420
gatgtgattg tggccggcga tgaaatcgcg cggggcaagc cggatccaaa g             471
 
<210>142
<211>157
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(14)...(157)
<223>haloacid dehalogenase-like hydrolase
 
<400>142
Met Gln Lys Lys Thr Ser Thr Cys Glu Asp Glu Gly Pro Tyr Arg Ala
1               5                   10                  15
Val Leu Phe Asp Leu Asp Gly Thr Leu Leu Asp Thr Glu Arg Ile Gly
            20                  25                  30
Ala Ala Ser Trp Asp His Ala Gly Asp Glu Leu Gly Leu Arg Val Pro
        35                  40                  45
Glu Ala Val Lys Arg Gln Met Val Gly Arg Thr Leu Pro Asp Ile His
    50                  55                  60
Ala Ile Val Arg Glu Gly Met Pro Asp Val Asp Ala Asp Arg Leu Leu
65                  70                  75                  80
Glu Arg Ala Asn His His Tyr His Arg Leu Val Thr Glu Val Pro Pro
                85                  90                  95
Pro Val Lys Ala Gly Ala Arg Glu Leu Leu Glu Trp Leu Lys Gly Ala
            100                 105                 110
Gly Val Pro Met Ala Val Ala Thr Ser Ser Arg Arg Val Gln Ala Glu
        115                 120                 125
Asp Lys Leu Ser Arg Thr Gly Leu Arg His Phe Phe Asp Val Ile Val
    130                 135                 140
Ala Gly Asp Glu Ile Ala Arg Gly Lys Pro Asp Pro Lys
145                 150                 155
 
<210>143
<211>603
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>143
atgaataaca agagcttcat cacaatccat ggcattcgta agtttggctc ttctcccact     60
cacatgcgcc ctataaacga atcactcctc tctagtaatc tgaggacaat cccagtcaat    120
tatggctaca ccctgctccc aatcacgaac agaaagagtg tttctagggc aattcctgtg    180
ctagaaaacg agctaaagcg agggagggac atcaccctta tcgggtattc taacggcgct    240
tggacagctc tacagcttgc ggaaatggct tatccaatcc aacgtctagt gctcatctct    300
cctgctcttc actctgctca cgccttccct caaatccctt ctcttgagcg tgtagacgtg    360
ttctattgcc ctacagataa tgttggtgat cttgccaaga cttggagggg agttactaga    420
atcatgcctt ggagatggtt ctctccacac ccttacggaa gaatgatgaa aactggattt    480
attggagagg atgaacgtgt ctttaaccac aggcttggcg atcatgtagg ccatgctttc    540
tacaaccatg ctgatgctgt ttcacacatt atagaggtga ttaaatatga aactccttat    600
tag                                                                  603
 
<210>144
<211>200
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>144
Met Asn Asn Lys Ser Phe Ile Thr Ile His Gly Ile Arg Lys Phe Gly
1               5                   10                  15
Ser Ser Pro Thr His Met Arg Pro Ile Asn Glu Ser Leu Leu Ser Ser
            20                  25                  30
Asn Leu Arg Thr Ile Pro Val Asn Tyr Gly Tyr Thr Leu Leu Pro Ile
        35                  40                  45
Thr Asn Arg Lys Ser Val Ser Arg Ala Ile Pro Val Leu Glu Asn Glu
    50                  55                  60
Leu Lys Arg Gly Arg Asp Ile Thr Leu Ile Gly Tyr Ser Asn Gly Ala
65                  70                  75                  80
Trp Thr Ala Leu Gln Leu Ala Glu Met Ala Tyr Pro Ile Gln Arg Leu
                85                  90                  95
Val Leu Ile Ser Pro Ala Leu His Ser Ala His Ala Phe Pro Gln Ile
            100                 105                 110
Pro Ser Leu Glu Arg Val Asp Val Phe Tyr Cys Pro Thr Asp Asn Val
        115                 120                 125
Gly Asp Leu Ala Lys Thr Trp Arg Gly Val Thr Arg Ile Met Pro Trp
    130                 135                 140
Arg Trp Phe Ser Pro His Pro Tyr Gly Arg Met Met Lys Thr Gly Phe
145                 150                 155                 160
Ile Gly Glu Asp Glu Arg Val Phe Asn His Arg Leu Gly Asp His Val
                165                 170                 175
Gly His Ala Phe Tyr Asn His Ala Asp Ala Val Ser His Ile Ile Glu
            180                 185                 190
Val Ile Lys Tyr Glu Thr Pro Tyr
        195                 200
 
<210>145
<211>1197
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>145
atgaacgcaa cctccgcaac gatcgccgcc accgacaccc agcagcgcgg tggcttcgcc    60
ggcaccgatc cgcaaccggt cgatcgggtg ctggccgcac tgatccagga caactacgac   120
cgcgtcgacc agcgtcgcgg cgacccgccg atcgaccgcc cgctgccgca gggctgggcg   180
cgcatgggcg acgacgaagt gcgcgccgcg ggcatcgatc ctgcgatgca gcacgatgcc   240
aagagcggct tcgacgcctc gttctaccgc gacgaccagg gccgggtggc cctggtctat   300
gccggcagcg acgagggcca ggactggaag cacaacttcg gccagggcct gggtttccag   360
gacgcgcagt acgaccaggc gatcgcgctg gcgcgcgagg cgaaatcggc cttcggcgac   420
cagctcgtgc tgtcgggcca gtcgctcggc ggcggcctgg ccgcggcagc gtccatggtc   480
aacgaggtgc ccgcggtgac cttcaacgcc gccggcgtgc acgaccacac ggtcgagcgc   540
tacggcctgg acgcggacgc ggtcaagcgc caggcggacc agggcctggt ccggcactac   600
gtggtcgaga acgacatcct gacccacctg caggagaacg cgttcccgct caatgcggcg   660
atgccggatg cgcccggcgc gcgcatcgac ctgcccgatc cggatccgct gaccacgttc   720
gagaagctgc tgccctggaa gacctggccg caccgcgtgc ataaccacta catcgaggcg   780
gtgatcgagt ccatggacaa ggccggctac acgctcgaag gcgcggcggc gacgcgggat   840
gcgtcgcagg acaccgccaa ccggctgctc gacgattcgg tgcgcgggct cgcgccgcag   900
cgcgaacgcc tcgggctgca ggacgacgac cgcttcttca acgcggccgc cggcatggcc   960
gcctcggccg gacgcgatgg cctgcgcagc atccagcacg tggtcgccac gcccgacggc  1020
cacggcgtgt tcgcggtcga aggcgacctg cgcgacgccg gccaccgccg cagcctggtc  1080
gacgtggaac gcggcgccgc gacgccggtc gaggacagcg tggccagcct gcgcgagcac  1140
gcctcgcgtt ccccggagca ggagccgcag cgggagcgcc acctggcgat ggcctga     1197
 
<210>146
<211>398
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>146
Met Asn Ala Thr Ser Ala Thr Ile Ala Ala Thr Asp Thr Gln Gln Arg
1               5                   10                  15
Gly Gly Phe Ala Gly Thr Asp Pro Gln Pro Val Asp Arg Val Leu Ala
            20                  25                  30
Ala Leu Ile Gln Asp Asn Tyr Asp Arg Val Asp Gln Arg Arg Gly Asp
        35                  40                  45
Pro Pro Ile Asp Arg Pro Leu Pro Gln Gly Trp Ala Arg Met Gly Asp
    50                  55                  60
Asp Glu Val Arg Ala Ala Gly Ile Asp Pro Ala Met Gln His Asp Ala
65                  70                  75                  80
Lys Ser Gly Phe Asp Ala Ser Phe Tyr Arg Asp Asp Gln Gly Arg Val
                85                  90                  95
Ala Leu Val Tyr Ala Gly Ser Asp Glu Gly Gln Asp Trp Lys His Asn
            100                 105                 110
Phe Gly Gln Gly Leu Gly Phe Gln Asp Ala Gln Tyr Asp Gln Ala Ile
        115                 120                 125
Ala Leu Ala Arg Glu Ala Lys Ser Ala Phe Gly Asp Gln Leu Val Leu
    130                 135                 140
Ser Gly Gln Ser Leu Gly Gly Gly Leu Ala Ala Ala Ala Ser Met Val
145                 150                 155                 160
Asn Glu Val Pro Ala Val Thr Phe Asn Ala Ala Gly Val His Asp His
                165                 170                 175
Thr Val Glu Arg Tyr Gly Leu Asp Ala Asp Ala Val Lys Arg Gln Ala
            180                 185                 190
Asp Gln Gly Leu Val Arg His Tyr Val Val Glu Asn Asp Ile Leu Thr
        195                 200                 205
His Leu Gln Glu Asn Ala Phe Pro Leu Asn Ala Ala Met Pro Asp Ala
    210                 215                 220
Pro Gly Ala Arg Ile Asp Leu Pro Asp Pro Asp Pro Leu Thr Thr Phe
225                 230                 235                 240
Glu Lys Leu Leu Pro Trp Lys Thr Trp Pro His Arg Val His Asn His
                245                 250                 255
Tyr Ile Glu Ala Val Ile Glu Ser Met Asp Lys Ala Gly Tyr Thr Leu
            260                 265                 270
Glu Gly Ala Ala Ala Thr Arg Asp Ala Ser Gln Asp Thr Ala Asn Arg
        275                 280                 285
Leu Leu Asp Asp Ser Val Arg Gly Leu Ala Pro Gln Arg Glu Arg Leu
    290                 295                 300
Gly Leu Gln Asp Asp Asp Arg Phe Phe Asn Ala Ala Ala Gly Met Ala
305                 310                 315                 320
Ala Ser Ala Gly Arg Asp Gly Leu Arg Ser Ile Gln His Val Val Ala
                325                 330                 335
Thr Pro Asp Gly His Gly Val Phe Ala Val Glu Gly Asp Leu Arg Asp
            340                 345                 350
Ala Gly His Arg Arg Ser Leu Val Asp Val Glu Arg Gly Ala Ala Thr
        355                  360                  365
Pro Val Glu Asp Ser Val Ala Ser Leu Arg Glu His Ala Ser Arg Ser
    370                 375                 380
Pro Glu Gln Glu Pro Gln Arg Glu Arg His Leu Ala Met Ala
385                 390                 395
 
<210>147
<211>1104
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
 
<400>147
atgcaagtca gtggtgcaat ggaagcaata aatcctgcgc agatgaatgc agcggaagtc     60
acttcatcgc aggtatctga ccagatcatc ggcggcgtta gccaggtgcc ggaagcaggt    120
ttagctagtg aagtcggagc aatggcgatg gcacctgctg ctgaagatgc ggcccttgcc    180
gccatggttg ccggccctgc caatcaagcc agttacggca atttgcccag tgactggacg    240
gaagccgact ataatcatgc tctcgacatg gccaagctgt cttcccaagc ttatagccgg    300
ttcaacgata tcaccgtcga tcttctgttg gctccatttg gtggtattgg tgacataaaa    360
gcgcaggatt ttaccaccga taactggcgc ctaatggaca ccagtggcaa gagtgacttt    420
ttcttacccg tacagagcgg gctggacttc actgtttttg aggcggtagc cgatgacccg    480
gcagctaatg tgaaggaagg ggatattgtg ctcgcatttc gcggcagtga gcctacctcc    540
gcaccggatt ggatcaataa tgtaaaacag gcggcgggta attcctctca gtatgctcag    600
gcggtagaag tcgcgaagga gctgcaaggg caggtagacc agtacaatgc agacaataac    660
ctgaccggca atgatgccag aagcctccat tttaccggcc atagcctggg cgggggattg    720
gcaacagcgg ccgcgctggc cacaggcagt agcgctaccg ccttcaatgc agcgggcctt    780
ggggattcca ccctaaagaa ccttgggctc aatgaagggc tggcggcagg cttccacaat    840
aacgttacca atattaatgt ggaaggcgat ctgttgagcg atgccaaccg ccaaaaggat    900
gtctatacca cgggttcagg catcctcgat gaaaccaggc agtatgggga acaggtttgg    960
ctgcagggcg tcgatgataa ggccagattg ggcggaccgc ttaatcccct gataccggga   1020
gtggctgatg acctggcaat ccaggcactc aaccatgcct ggcatgtgta tacctaccag   1080
ttggaaaatc gcaacttcgc ctaa                                          1104
 
<210>148
<211>367
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>148
Met Gln Val Ser Gly Ala Met Glu Ala Ile Asn Pro Ala Gln Met Asn
1               5                   10                  15
Ala Ala Glu Val Thr Ser Ser Gln Val Ser Asp Gln Ile Ile Gly Gly
            20                  25                  30
Val Ser Gln Val Pro Glu Ala Gly Leu Ala Ser Glu Val Gly Ala Met
        35                  40                  45
Ala Met Ala Pro Ala Ala Glu Asp Ala Ala Leu Ala Ala Met Val Ala
    50                  55                  60
Gly Pro Ala Asn Gln Ala Ser Tyr Gly Asn Leu Pro Ser Asp Trp Thr
65                  70                  75                  80
Glu Ala Asp Tyr Asn His Ala Leu Asp Met Ala Lys Leu Ser Ser Gln
                85                  90                  95
Ala Tyr Ser Arg Phe Asn Asp Ile Thr Val Asp Leu Leu Leu Ala Pro
            100                 105                 110
Phe Gly Gly Ile Gly Asp Ile Lys Ala Gln Asp Phe Thr Thr Asp Asn
        115                 120                 125
Trp Arg Leu Met Asp Thr Ser Gly Lys Ser Asp Phe Phe Leu Pro Val
    130                 135                 140
Gln Ser Gly Leu Asp Phe Thr Val Phe Glu Ala Val Ala Asp Asp Pro
145                 150                 155                 160
Ala Ala Asn Val Lys Glu Gly Asp Ile Val Leu Ala Phe Arg Gly Ser
                165                 170                 175
Glu Pro Thr Ser Ala Pro Asp Trp Ile Asn Asn Val Lys Gln Ala Ala
            180                 185                 190
Gly Asn Ser Ser Gln Tyr Ala Gln Ala Val Glu Val Ala Lys Glu Leu
        195                 200                 205
Gln Gly Gln Val Asp Gln Tyr Asn Ala Asp Asn Asn Leu Thr Gly Asn
    210                 215                 220
Asp Ala Arg Ser Leu His Phe Thr Gly His Ser Leu Gly Gly Gly Leu
225                 230                 235                 240
Ala Thr Ala Ala Ala Leu Ala Thr Gly Ser Ser Ala Thr Ala Phe Asn
                245                 250                 255
Ala Ala Gly Leu Gly Asp Ser Thr Leu Lys Asn Leu Gly Leu Asn Glu
            260                 265                 270
Gly Leu Ala Ala Gly Phe His Asn Asn Val Thr Asn Ile Asn Val Glu
        275                 280                 285
Gly Asp Leu Leu Ser Asp Ala Asn Arg Gln Lys Asp Val Tyr Thr Thr
    290                 295                 300
Gly Ser Gly Ile Leu Asp Glu Thr Arg Gln Tyr Gly Glu Gln Val Trp
305                 310                 315                 320
Leu Gln Gly Val Asp Asp Lys Ala Arg Leu Gly Gly Pro Leu Asn Pro
                325                 330                 335
Leu Ile Pro Gly Val Ala Asp Asp Leu Ala Ile Gln Ala Leu Asn His
            340                 345                 350
Ala Trp His Val Tyr Thr Tyr Gln Leu Glu Asn Arg Asn Phe Ala
        355                 360                 365
 
<210>149
<211>975
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>149
atgagcgtcc aactgcaacc gagccagctc cagccgactt ggcagaaacc gctggaaccc     60
ctggccccgc cgatccaggc ggcaccgccg ctgccgcaag gctcgtacgc cctggacccc    120
agctaccacc cgcagctggc cgcggtcacc gcgaagcagg cgccggccgc caacgccgcg    180
ccggacccga cctcgttcga ccagcaactg cgcggcaagg attcgcaggc catcgacctg    240
gagatggcgc agctctcgca ggcggtctac aaccccgaca ccaagaccgt cggcaactgg    300
acccgtctcg acgacgccca gctgacccag gccggaatcg atcccaagtc gctggagaac    360
agcgacaccg gcttccgcgc cggcatctac accgacggca acggcaagta cgtggtcgcc    420
tacgccggtt ccaacgacgt gcaggactgg atcaccaacg cgcgccaggg catcggctgg    480
gattccaagc agtacgacca ggccgtgcag ctggcccagg acgcgcagca ggccttcggc    540
gagaacatgg tcatcaccgg ccattcgctc ggcggcggcc tggccgcgac cgcggcgctg    600
gccaccgaca ccgccgcagt gaccttcaac gcctccggcg tgcacgacga caccctgcgc    660
ggactgggcc tggacccggg taccgccaag agcgacgccg ccgacggcca gatccgccgc    720
tacaacatcg gcggcgaaat cctgactgcg gcgcaggaag acgtgccgct gctcaacggc    780
attcccgacg cgcccggcca cgagatcaac ctcaacgacc cggacccgcc gaaggccccg    840
gatttcacct ggaacccgat cgagatggcc aagcgcaccg ccgaatacgt ggccgccaag    900
gcgatccgtc cgggcgagct gcacgccatc ggcccggtga tcgaggcgct gcagcagcag    960
acgccctggc aatga                                                     975
 
<210>150
<211>324
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
<400>150
Met Ser Val Gln Leu Gln Pro Ser Gln Leu Gln Pro Thr Trp Gln Lys
1               5                  10                  15
Pro Leu Glu Pro Leu Ala Pro Pro Ile Gln Ala Ala Pro Pro Leu Pro
            20                  25                  30
Gln Gly Ser Tyr Ala Leu Asp Pro Ser Tyr His Pro Gln Leu Ala Ala
        35                  40                  45
Val Thr Ala Lys Gln Ala Pro Ala Ala Asn Ala Ala Pro Asp Pro Thr
    50                  55                  60
Ser Phe Asp Gln Gln Leu Arg Gly Lys Asp Ser Gln Ala Ile Asp Leu
65                  70                  75                  80
Glu Met Ala Gln Leu Ser Gln Ala Val Tyr Asn Pro Asp Thr Lys Thr
                85                  90                  95
Val Gly Asn Trp Thr Arg Leu Asp Asp Ala Gln Leu Thr Gln Ala Gly
            100                 105                 110
Ile Asp Pro Lys Ser Leu Glu Asn Ser Asp Thr Gly Phe Arg Ala Gly
        115                 120                 125
Ile Tyr Thr Asp Gly Asn Gly Lys Tyr Val Val Ala Tyr Ala Gly Ser
    130                 135                 140
Asn Asp Val Gln Asp Trp Ile Thr Asn Ala Arg Gln Gly Ile Gly Trp
145                 150                 155                 160
Asp Ser Lys Gln Tyr Asp Gln Ala Val Gln Leu Ala Gln Asp Ala Gln
                165                 170                 175
Gln Ala Phe Gly Glu Asn Met Val Ile Thr Gly His Ser Leu Gly Gly
            180                 185                 190
Gly Leu Ala Ala Thr Ala Ala Leu Ala Thr Asp Thr Ala Ala Val Thr
        195                 200                 205
Phe Asn Ala Ser Gly Val His Asp Asp Thr Leu Arg Gly Leu Gly Leu
    210                 215                 220
Asp Pro Gly Thr Ala Lys Ser Asp Ala Ala Asp Gly Gln Ile Arg Arg
225                 230                 235                 240
Tyr Asn Ile Gly Gly Glu Ile Leu Thr Ala Ala Gln Glu Asp Val Pro
                245                 250                 255
Leu Leu Asn Gly Ile Pro Asp Ala Pro Gly His Glu Ile Asn Leu Asn
            260                 265                 270
Asp Pro Asp Pro Pro Lys Ala Pro Asp Phe Thr Trp Asn Pro Ile Glu
        275                 280                 285
Met Ala Lys Arg Thr Ala Glu Tyr Val Ala Ala Lys Ala Ile Arg Pro
    290                 295                 300
Gly Glu Leu His Ala Ile Gly Pro Val Ile Glu Ala Leu Gln Gln Gln
305                 310                 315                 320
Thr Pro Trp Gln
 
<210>151
<211>1341
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>151
atgggcggag aacggcaccc cgatggcgtg agcacgatac cggcaacggc ctcggacctg     60
gcgagctttg accgcgccag tggacagctg gcgacattcg ccgcgcctgt cctccacgac    120
agtggcaaac cagacgatcg tctgttcgtc gcggcgttcg acggcaccgg caacagcatg    180
gtcaaggacg cgccggagaa tcacacgaac gttgcgcgca tcgccaggca gatcgagtcc    240
ctgggcgatc ccgccatcgc gcaaggctat gtggaaggcc cgggcacgca gggcggaatc    300
ggcggaggca tcgacctcat gacagggcag agctacgaag cccgcatgga ggacatgtac    360
ctgcagttcg tgaagcaatc cgccgcgtgg ttgaaggaga acccggatgc ggacatccgc    420
atcgccgcca tcggattcag tcgtggcgcg gaacaggcgg ccggcttcac ccggatggtc    480
gaagaacgcg gcatccggaa tccggaaggc gcgcaggtca cgcgcgacgg cgatggtcgg    540
gtactgcgtg tcgactacat cggtccaccg ctgcgcgaac ccggcaccgt catccaggcg    600
gttggcctgt tcgaccccgt cggcacgggt gagccgcgcg atcacgaccg ccgtctgcca    660
ccgtcggtgg tgtcgggttt ccagatcacc gccgacgatg agcggcgcaa cctgttccag    720
tccacccgcg tgatggatcc tggcgtgacc gatggcgggc gcttcctcaa cgtcaccgtc    780
gccggtgcgc acagcgacat cggcggtggc tatacgcagg atggcatcgc gatccgcagc    840
ggcaacctga tgatcgacta cctcaacggt ctgagcgacc ggccattcct ggacaagcgt    900
gaagaaccgt tcgatcccgc tcgcaacgtg atccatcgct ccgaggaaca ccggttcttc    960
taccgcacct cgatctacga caaggcggga acgcgcggga tgcaggagga actcgcgccg   1020
tcgcacctgt gcaggatcga ctgcctcgat gcacagcccc gcaatgaaac gctcgcgcgc   1080
gagctggcct ggcgacccgt cgagatcgga ccggtcccgg tcggcgcgga ggtgtcgcgt   1140
tcgggcggca tggtcgagcg tctgttgcag gcggccaaac acggcgacgg tggcgccgtc   1200
gagcgcatct cgcgggagta tctgcacgga gacgccgggc aggcgtggct gcaggcaggc   1260
cagcagcggc tcgacgccgc ctccatcacg caggcaccac cggtggaacg ccagcaggag   1320
ccggccgcgc tcgcgcgctg a                                             1341
 
<210>152
<211>446
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>152
Met Gly Gly Glu Arg His Pro Asp Gly Val Ser Thr Ile Pro Ala Thr
1               5                   10                  15
Ala Ser Asp Leu Ala Ser Phe Asp Arg Ala Ser Gly Gln Leu Ala Thr
            20                  25                  30
Phe Ala Ala Pro Val Leu His Asp Ser Gly Lys Pro Asp Asp Arg Leu
        35                  40                  45
Phe Val Ala Ala Phe Asp Gly Thr Gly Asn Ser Met Val Lys Asp Ala
    50                  55                  60
Pro Glu Asn His Thr Asn Val AIa Arg Ile Ala Arg Gln Ile Glu Ser
65                  70                  75                  80
Leu Gly Asp Pro Ala Ile Ala Gln Gly Tyr Val Glu Gly Pro Gly Thr
                85                  90                  95
Gln Gly Gly Ile Gly Gly Gly Ile Asp Leu Met Thr Gly Gln Ser Tyr
            100                 105                 110
Glu Ala Arg Met Glu Asp Met Tyr Leu Gln Phe Val Lys Gln Ser Ala
        115                 120                 125
Ala Trp Leu Lys Glu Asn Pro Asp Ala Asp Ile Arg Ile Ala Ala Ile
    130                 135                 140
Gly Phe Ser Arg Gly Ala Glu Gln Ala Ala Gly Phe Thr Arg Met Val
145                 150                 155                 160
Glu Glu Arg Gly Ile Arg Asn Pro Glu Gly Ala Gln Val Thr Arg Asp
                165                 170                 175
Gly Asp Gly Arg Val Leu Arg Val Asp Tyr Ile Gly Pro Pro Leu Arg
            180                 185                 190
Glu Pro Gly Thr Val Ile Gln Ala Val Gly Leu Phe Asp Pro Val Gly
        195                 200                 205
Thr Gly Glu Pro Arg Asp His Asp Arg Arg Leu Pro Pro Ser Val Val
    210                 215                 220
Ser Gly Phe Gln Ile Thr Ala Asp Asp Glu Arg Arg Asn Leu Phe Gln
225                 230                 235                 240
Ser Thr Arg Val Met Asp Pro Gly Val Thr Asp Gly Gly Arg Phe Leu
                245                 250                 255
Asn Val Thr Val Ala Gly Ala His Ser Asp Ile Gly Gly Gly Tyr Thr
            260                 265                 270
Gln Asp Gly Ile Ala Ile Arg Ser Gly Asn Leu Met Ile Asp Tyr Leu
        275                 280                 285
Asn Gly Leu Ser Asp Arg Pro Phe Leu Asp Lys Arg Glu Glu Pro Phe
    290                 295                 300
Asp Pro Ala Arg Asn Val Ile His Arg Ser Glu Glu His Arg Phe Phe
305                 310                 315                 320
Tyr Arg Thr Ser Ile Tyr Asp Lys Ala Gly Thr Arg Gly Met Gln Glu
                325                 330                 335
Glu Leu Ala Pro Ser His Leu Cys Arg Ile Asp Cys Leu Asp Ala Gln
            340                 345                 350
Pro Arg Asn Glu Thr Leu Ala Arg Glu Leu Ala Trp Arg Pro Val Glu
        355                 360                 365
Ile Gly Pro Val Pro Val Gly Ala Glu Val Ser Arg Ser Gly Gly Met
    370                 375                 380
Val Glu Arg Leu Leu Gln Ala Ala Lys His Gly Asp Gly Gly Ala Val
385                 390                 395                 400
Glu Arg Ile Ser Arg Glu Tyr Leu His Gly Asp Ala Gly Gln Ala Trp
                405                  410                  415
Leu Gln Ala Gly Gln Gln Arg Leu Asp Ala Ala Ser Ile Thr Gln Ala
            420                 425                 430
Pro Pro Val Glu Arg Gln Gln Glu Pro Ala Ala Leu Ala Arg
        435                 440                 445
 
<210>153
<211>384
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>153
atgtctttac tttatgcacc agaagagttt tggctagcag atgtagaaac tttagaaagt     60
gtatgtaatg gctgtggtac tgaaggctgg aaaggtaaac taattcctaa cagcatgtat    120
ggtctagata tacgcattgc ttgtgatatc catgactgga tgtatcactt tggtaagtca    180
gaaaaagata aagaaaaagc agataaagct tttttaaata atcttattcg ccttatcaat    240
gatgaaggtg gcttcttagc ttggcctaga cgttataggg ctatgactta ttataacgca    300
gtcaaagatt ttggtgggcc tgcattttgg gcaaataaaa accctaaggg tactatgaaa    360
gaacctaagg gtactcctgc ttaa                                           384
 
<210>154
<211>127
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>154
Met Ser Leu Leu Tyr Ala Pro Glu Glu Phe Trp Leu Ala Asp Val Glu
1               5                   10                  15
Thr Leu Glu Ser Val Cys Asn Gly Cys Gly Thr Glu Gly Trp Lys Gly
            20                  25                  30
Lys Leu Ile Pro Asn Ser Met Tyr Gly Leu Asp Ile Arg Ile Ala Cys
        35                  40                  45
Asp Ile His Asp Trp Met Tyr His Phe Gly Lys Ser Glu Lys Asp Lys
    50                  55                  60
Glu Lys Ala Asp Lys Ala Phe Leu Asn Asn Leu Ile Arg Leu Ile Asn
65                  70                  75                  80
Asp Glu Gly Gly Phe Leu Ala Trp Pro Arg Arg Tyr Arg Ala Met Thr
                85                  90                  95
Tyr Tyr Asn Ala Val Lys Asp Phe Gly Gly Pro Ala Phe Trp Ala Asn
            100                 105                 110
Lys Asn Pro Lys Gly Thr Met Lys Glu Pro Lys Gly Thr Pro Ala
        115                 120                 125
 
<210>155
<211>1263
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>155
atgcggacga caactacaaa ttggagacaa atcgtgaaaa gcctgaagct cttcctgatg     60
ggcctttgcc tgttcatttc cgcttcattc gcatcatctg cctatgcact gggcagttac    120
acctacacgt acctgcgctg tttctatcgc gtcgatacat ccccgctgaa gcccaagacc    180
acctacgtct ggggcatcga tccgggcagc ggcggctact accgcatcta tggccgctgg    240
tggaaagacg gcttgctgag ctgggaaaac atgttctaca gcgacgtgtc gcaagatacg    300
ctgaaatcgg tttgccagag cacgctcgcc ggctacggca tcaaccgcag cgtcgcactc    360
tcggcggcgg ccgatacgtc gctctcgctc aattacacgg tgtggaccaa cgacagcgca    420
tcgcagggct cacgcatcaa caaaatcgtc gcattcggcg acagcctgtc ggacaaccag    480
aatctgtaca acgcgaccca atggcaactg ccgaaccgca acagttggtt tctcggccgc    540
ttctcgaatg acaggaactg gatcgaatac ctgtcgagca acgtgaatct gccgatgtac    600
aactgggcag tggcgggcgc ggcggcggat cagtactacg tcatcccggg tgtgtcgcaa    660
caggtcgact cgtggatcac ctacatgcag agcgcgccga attaccaggc cgcgaatacg    720
ctgttcaccg tgcttgtcgg cggcaacgat ctggtgaact acggccggtc tgtcgactcg    780
atcatctccg cggagcagca ggcgctggtg aagatgatca atgccggcgc tcgcaacatc    840
ctgttgctga atctgcccga cgtatcgcgc gcaccggtat tccagtatcg cagcgacgcc    900
gccaccatcg ccgcgcaagt ccgcgacttc aaccagaagc tggcgcaact gcgcgacaat    960
cttcaggcga cgtacggccc gtcgctcgtc attcgcatgt tcgataccta caccttgttc   1020
aacgatctgc tgaacaatcc gaccaactat ggcgtgacga acacctggca gtcctgcctc   1080
gacatcaact cggattccgg gtcgaactat ctttatacct ggccgacgcg cgccgaatgc   1140
accaacgccg acagcttcgt gttctgggac acgctgcacc cgaccacgca tacgcacaag   1200
ctgctgggcg acaatgcggc gaatttcgta cgcgccggtt tccccgcatt gtctgcgcct   1260
tga                                                                 1263
 
<210>156
<211>420
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>信号
<222>(1)...(36)
 
<220>
<221>结构域
<222>(149)...(406)
<223>GDSL-样脂酶/酰基水解酶
 
<400>156
Met Arg Thr Thr Thr Thr Asn Trp Arg Gln Ile Val Lys Ser Leu Lys
1               5                   10                  15
Leu Phe Leu Met Gly Leu Cys Leu Phe Ile Ser Ala Ser Phe Ala Ser
            20                  25                  30
Ser Ala Tyr Ala Leu Gly Ser Tyr Thr Tyr Thr Tyr Leu Arg Cys Phe
        35                  40                  45
Tyr Arg Val Asp Thr Ser Pro Leu Lys Pro Lys Thr Thr Tyr Val Trp
    50                  55                  60
Gly Ile Asp Pro Gly Ser Gly Gly Tyr Tyr Arg Ile Tyr Gly Arg Trp
65                  70                  75                  80
Trp Lys Asp Gly Leu Leu Ser Trp Glu Asn Met Phe Tyr Ser Asp Val
                85                  90                  95
Ser Gln Asp Thr Leu Lys Ser Val Cys Gln Ser Thr Leu Ala Gly Tyr
            100                 105                 110
Gly Ile Asn Arg Ser Val Ala Leu Ser Ala Ala Ala Asp Thr Ser Leu
        115                 120                 125
Ser Leu Asn Tyr Thr Val Trp Thr Asn Asp Ser Ala Ser Gln Gly Ser
    130                 135                 140
Arg Ile Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Asn Gln
145                 150                 155                 160
Asn Leu Tyr Asn Ala Thr Gln Trp Gln Leu Pro Asn Arg Asn Ser Trp
                165                 170                 175
Phe Leu Gly Arg Phe Ser Asn Asp Arg Asn Trp Ile Glu Tyr Leu Ser
            180                 185                 190
Ser Asn Val Asn Leu Pro Met Tyr Asn Trp Ala Val Ala Gly Ala Ala
        195                 200                 205
Ala Asp Gln Tyr Tyr Val Ile Pro Gly Val Ser Gln Gln Val Asp Ser
    210                 215                 220
Trp Ile Thr Tyr Met Gln Ser Ala Pro Asn Tyr Gln Ala Ala Asn Thr
225                 230                 235                 240
Leu Phe Thr Val Leu Val Gly Gly Asn Asp Leu Val Asn Tyr Gly Arg
                245                 250                 255
Ser Val Asp Ser Ile Ile Ser Ala Glu Gln Gln Ala Leu Val Lys Met
            260                 265                 270
Ile Asn Ala Gly Ala Arg Asn Ile Leu Leu Leu Asn Leu Pro Asp Val
        275                 280                 285
Ser Arg Ala Pro Val Phe Gln Tyr Arg Ser Asp Ala Ala Thr Ile Ala
    290                 295                 300
Ala Gln Val Arg Asp Phe Asn Gln Lys Leu Ala Gln Leu Arg Asp Asn
305                 310                 315                 320
Leu Gln Ala Thr Tyr Gly Pro Ser Leu Val Ile Arg Met Phe Asp Thr
                325                 330                 335
Tyr Thr Leu Phe Asn Asp Leu Leu Asn Asn Pro Thr Asn Tyr Gly Val
            340                 345                 350
Thr Asn Thr Trp Gln Ser Cys Leu Asp Ile Asn Ser Asp Ser Gly Ser
        355                 360                 365
Asn Tyr Leu Tyr Thr Trp Pro Thr Arg Ala Glu Cys Thr Asn Ala Asp
    370                 375                 380
Ser Phe Val Phe Trp Asp Thr Leu His Pro Thr Thr His Thr His Lys
385                 390                 395                 400
Leu Leu Gly Asp Asn Ala Ala Asn Phe Val Arg Ala Gly Phe Pro Ala
                405                 410                 415
Leu Ser Ala Pro
            420
 
<210>157
<211>1329
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>157
atgagcctca acagccaaga ctacgctgcg ctatccgaag atgcatacaa ggattatgcg     60
gtcggtcgtc gagcgcctgg tcaagaagaa atcgttccga tcaacgggca caagtacaag    120
atcctcgagc acgttgacaa tcggctgaac ggttatcagg gaacgatcta ccagcgagtc    180
gacaccaatg aaattgtcgt cgcacatcgc ggaaccgaac aaatcgcacg cgatgcgatt    240
ctgaccgatg gtggcatggt cgttgcccgt accaatgtgc aggcgccaga cgcaatcgcg    300
ctgacccaac gcgccctggc ttacgccaag aaggaggggc aggatctcgg ccaacgtccg    360
cctgaggtca ccgtcaccgg ccactccctc ggcggcgctc tggcccagat cacctcgcac    420
cacttcaacg tcaagggcga gaccttcaac gcctatggcg cggtcagcct cagctaccgc    480
atcccggaag gtggcaacac catgatcaac catgtcatgg cctccgatcc ggtcagcgcg    540
gcgtcgccac atttcggcca ggtgcggatc tacgccaggc cgaatgaaat cagcacgctc    600
gccgcgaacg gtttcagcaa tcactcgttg cgcgccctta tccccgaccg gccgatcatc   660
gccgcaggca gctcgttcgg cgcgcacaag ctgggcaact tcctcggtga cggctcggtg   720
ctgcagcacc cggaaacgca gaagctggca aaagacaacg ccaggatgat cgaggaatac   780
cgcgacgacg ttgaattact gcgccgtggt gtcacccgcg cggcgcgggg cattccgggc   840
ggcgccgtcg acctgtacga ccacatccgc ggcccgctgc agcccggtga gccggcacgc   900
cgcgaagcgg agaagaacgg ccatcacacc agcatgctgc gaatggacga tgccaaccat   960
gtgggcaacc cactgttcaa cgacgcgatc cgtggcgtgc acgcgcagga tgtccgcgtc  1020
ggccgggtac cagacgtgat gagcacgcaa ctggcaggca gtctggccgc cgaaatgcac  1080
gcagcaggcg gcaagcgcat cgacgaagtg gtcatgaatg ccgatgcctc gcgcagcttc  1140
gccgtgcagg gccagggcgg tgaccccgcc caccttcgtg tgtcggtgga tacggcagtg  1200
gcgatgaaca ccccgctgga acagagcagc cagcgcatcg accagcaggc cgccgaccag  1260
cgcgttgcgc tggagcgcga ccagcagctg gaacagcagc ggaaccagac ccgcagcctg  1320
caggcctga                                                          1329
 
<210>158
<211>442
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>158
Met Ser Leu Asn Ser Gln Asp Tyr Ala Ala Leu Ser Glu Asp Ala Tyr
1               5                   10                  15
Lys Asp Tyr Ala Val Gly Arg Arg Ala Pro Gly Gln Glu Glu Ile Val
            20                  25                  30
Pro Ile Asn Gly His Lys Tyr Lys Ile Leu Glu His Val Asp Asn Arg
        35                  40                  45
Leu Asn Gly Tyr Gln Gly Thr Ile Tyr Gln Arg Val Asp Thr Asn Glu
    50                  55                  60
Ile Val Val Ala His Arg Gly Thr Glu Gln Ile Ala Arg Asp Ala Ile
65                  70                  75                  80
Leu Thr Asp Gly Gly Met Val Val Ala Arg Thr Asn Val Gln Ala Pro
                85                  90                  95
Asp Ala Ile Ala Leu Thr Gln Arg Ala Leu Ala Tyr Ala Lys Lys Glu
            100                 105                 110
Gly Gln Asp Leu Gly Gln Arg Pro Pro Glu Val Thr Val Thr Gly His
        115                 120                 125
Ser Leu Gly Gly Ala Leu Ala Gln Ile Thr Ser His His Phe Asn Val
    130                 135                 140
Lys Gly Glu Thr Phe Asn Ala Tyr Gly Ala Val Ser Leu Ser Tyr Arg
145                 150                 155                 160
Ile Pro Glu Gly Gly Asn Thr Met Ile Asn His Val Met Ala Ser Asp
                165                 170                 175
Pro Val Ser Ala Ala Ser Pro His Phe Gly Gln Val Arg Ile Tyr Ala
            180                 185                 190
Arg Pro Asn Glu Ile Ser Thr Leu Ala Ala Asn Gly Phe Ser Asn His
        195                 200                 205
Ser Leu Arg Ala Leu Ile Pro Asp Arg Pro Ile Ile Ala Ala Gly Ser
    210                 215                 220
Ser Phe Gly Ala His Lys Leu Gly Asn Phe Leu Gly Asp Gly Ser Val
225                 230                 235                 240
Leu Gln His Pro Glu Thr Gln Lys Leu Ala Lys Asp Asn Ala Arg Met
                245                 250                 255
Ile Glu Glu Tyr Arg Asp Asp Val Glu Leu Leu Arg Arg Gly Val Thr
            260                 265                 270
Arg Ala Ala Arg Gly Ile Pro Gly Gly Ala Val Asp Leu Tyr Asp His
        275                 280                 285
Ile Arg Gly Pro Leu Gln Pro Gly Glu Pro Ala Arg Arg Glu Ala Glu
    290                 295                 300
Lys Asn Gly His His Thr Ser Met Leu Arg Met Asp Asp Ala Asn His
305                 310                 315                 320
Val Gly Asn Pro Leu Phe Asn Asp Ala Ile Arg Gly Val His Ala Gln
                325                 330                 335
Asp Val Arg Val Gly Arg Val Pro Asp Val Met Ser Thr Gln Leu Ala
            340                 345                 350
Gly Ser Leu Ala Ala Glu Met His Ala Ala Gly Gly Lys Arg Ile Asp
        355                 360                 365
Glu Val Val Met Asn Ala Asp Ala Ser Arg Ser Phe Ala Val Gln Gly
    370                 375                 380
Gln Gly Gly Asp Pro Ala His Leu Arg Val Ser Val Asp Thr Ala Val
385                 390                 395                 400
Ala Met Asn Thr Pro Leu Glu Gln Ser Ser Gln Arg Ile Asp Gln Gln
                405                 410                 415
Ala Ala Asp Gln Arg ValAla Leu Glu Arg Asp Gln Gln Leu Glu Gln
            420                 425                 430
Gln Arg Asn Gln Thr Arg Ser Leu Gln Ala
        435                 440
 
<210>159
<211>1428
<212>DNA
<213>未知
<220>
<223>从环境样品中获得
 
<400>159
atgtcgatca cgctggtatt cgtgcacggc tggagtgtca caagcaagga cacctacggg    60
aagcttcccg aggccatctc tcaagccgct gcggccgcgg gcatcgatgt agagctgaag   120
gacatctacc tcggccgcta catcagcttt cacgacgagg ttacggtcga cgacatcgcg   180
accgcgatga atcacgcggt ggcgaacgac ttgaaagggg tgaaggagtt ctcgtgcatc   240
acgcactcca cgggcggccc ggtcgtgcgt cgctgggtag atatgttcta cggcgcgaag   300
gacctcgaca actgtccgct gcgtcatctc atcatgctgg cgcctgcaaa ccatggttcc   360
gcgttggccg tcttggggaa gggccgcgtc ggtcgaatcc aggcgtggtg gggtggggtc   420
gagcccggtc agggcgtgct cgactggctt tgcctcggca gctcggaagc gtgggagctc   480
caggacagct tcacggatta ctcgctggac gacgcgaagt tcttcccgtt cgtgctgagc   540
ggcgagacga ttgataagca cttctacgac ttcctcaaca gctatctgga tgaagtgggc   600
tcggatggcg tggttcgtct ggcgggggcc aatctgaact acacgtttat tcggctcgac   660
caaactgaaa agcgttacga cgacggcgag gaaacgggct acatactgac tgttcggccg   720
cggacaaagc cgcgcccacc cgtaacggcg ttcggagtca taccgagcgc gagtcactcg   780
ggtaacgaca tcggcatcat gcgcagcgtc acgccggcga actccgattc gaagcctgtc   840
gtggcgcaaa tcgtgaaatg cctcggcgtg gagacacaag cggattacaa agcgcgtgtc   900
accgagctgg ccgcgttcac cgccgaaacg cagaaagcca acgccgtgca gtacggcggc   960
aaagagcgcc atttcgtgat gttcatcttc cgcatccgcg acgacagagg gcgcacgata  1020
agcgactacg acctgttgct gctcggcgac ggtttccacc cggacaagct gcccaaggga  1080
ttcttcgttg accgtcaacg caatcccaag tcccaggcgc tggtctacta cctcgactac  1140
gacgcgctga cggctgacga cgacaccgac ttaggtattc gagtgaacgc gcgaccgctc  1200
tatagcgcgc ccggagcagc agagccagac gcattcgcgg gctatcgagc cgccgagtat  1260
cgattcacgg gcaaagtact gaagcaattc gtgcgcccga acgaaactgt gtacgtcgac  1320
atcgtgctga atcgcatggt ggacgttgaa acgctccggc tggagcctct ggaaggatcg  1380
ccgcgtgggt cgttcaagaa aactctgccc aaagggccgg tgagttag               1428
 
<210>160
<211>475
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>160
Met Ser Ile Thr Leu Val Phe Val His Gly Trp Ser Val Thr Ser Lys
1               5                   10                  15
Asp Thr Tyr Gly Lys Leu Pro Glu Ala Ile Ser Gln Ala Ala Ala Ala
            20                  25                  30
Ala Gly Ile Asp Val Glu Leu Lys Asp Ile Tyr Leu Gly Arg Tyr Ile
        35                  40                  45
Ser Phe His Asp Glu Val Thr Val Asp Asp Ile Ala Thr Ala Met Asn
    50                  55                  60
His Ala Val Ala Asn Asp Leu Lys Gly Val Lys Glu Phe Ser Cys Ile
65                  70                  75                  80
Thr His Ser Thr Gly Gly Pro Val Val Arg Arg Trp Val Asp Met Phe
                85                  90                  95
Tyr Gly Ala Lys Asp Leu Asp Asn Cys Pro Leu Arg His Leu Ile Met
            100                 105                 110
Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Val Leu Gly Lys Gly
        115                 120                 125
Arg Val Gly Arg Ile Gln Ala Trp Trp Gly Gly Val Glu Pro Gly Gln
    130                 135                 140
Gly Val Leu Asp Trp Leu Cys Leu Gly Ser Ser Glu Ala Trp Glu Leu
145                 150                 155                 160
Gln Asp Ser Phe Thr Asp Tyr Ser Leu Asp Asp Ala Lys Phe Phe Pro
                165                 170                 175
Phe Val Leu Ser Gly Glu Thr Ile Asp Lys His Phe Tyr Asp Phe Leu
            180                 185                 190
Asn Ser Tyr Leu Asp Glu Val Gly Ser Asp Gly Val Val Arg Leu Ala
        195                 200                 205
Gly Ala Asn Leu Asn Tyr Thr Phe Ile Arg Leu Asp Gln Thr Glu Lys
    210                 215                 220
Arg Tyr Asp Asp Gly Glu Glu Thr Gly Tyr Ile Leu Thr Val Arg Pro
225                 230                 235                 240
Arg Thr Lys Pro Arg Pro Pro Val Thr Ala Phe Gly Val Ile Pro Ser
                245                 250                 255
Ala Ser His Ser Gly Asn Asp Ile Gly Ile Met Arg Ser Val Thr Pro
            260                 265                 270
Ala Asn Ser Asp Ser Lys Pro Val Val Ala Gln Ile Val Lys Cys Leu
        275                 280                 285
Gly Val Glu Thr Gln Ala Asp Tyr Lys Ala Arg Val Thr Glu Leu Ala
    290                 295                 300
Ala Phe Thr Ala Glu Thr Gln Lys Ala Asn Ala Val Gln Tyr Gly Gly
305                 310                 315                 320
Lys Glu Arg His Phe Val Met Phe Ile Phe Arg Ile Arg Asp Asp Arg
                325                 330                 335
Gly Arg Thr Ile Ser Asp Tyr Asp Leu Leu Leu Leu Gly Asp Gly Phe
            340                 345                 350
His Pro Asp Lys Leu Pro Lys Gly Phe Phe Val Asp Arg Gln Arg Asn
        355                 360                 365
Pro Lys Ser Gln Ala Leu Val Tyr Tyr Leu Asp Tyr Asp Ala Leu Thr
    370                 375                 380
Ala Asp Asp Asp Thr Asp Leu Gly Ile Arg Val Asn Ala Arg Pro Leu
385                 390                 395                 400
Tyr Ser Ala Pro Gly Ala Ala Glu Pro Asp Ala Phe Ala Gly Tyr Arg
                405                 410                 415
Ala Ala Glu Tyr Arg Phe Thr Gly Lys Val Leu Lys Gln Phe Val Arg
            420                 425                 430
Pro Asn Glu Thr Val Tyr Val Asp Ile Val Leu Asn Arg Met Val Asp
        435                 440                 445
Val Glu Thr Leu Arg Leu Glu Pro Leu Glu Gly Ser Pro Arg Gly Ser
    450                 455                 460
Phe Lys Lys Thr Leu Pro Lys Gly Pro Val Ser
465                 470                 475
 
<210>161
<21l>1740
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>161
atgaacagaa aattattatc gttatgcttg ggagcaacgt cctgtattgc actatcactt     60
cctgtgcatg catttacgca aaagggtgcg ggtacggaaa tttctaatgg gatacctatg    120
gggcacgaat gggttacgcg tttgtctgca ttggaattgc ttggtggcga tcctattatg    180
ccgccagatc caaatgaccc acgtaaaaac tggactaaag ggaaagccaa aaacctcgat    240
ctttccagcc caggtgcgcg tgcagaagtt gcgcggatta tgagtgttga ttatcacgat    300
aaaatattcc agtcgacgta caaagttgtt ttcgacgcta ttattggcga gcgctgggta    360
gatttggcgg gatataacgt gacgaccagc atgttgggaa aaataaactg ttttgatgct    420
gtagcccaag agccagtaga aatccagtac gatcatttta tgcgtcgtta cgacgagcgc    480
ggtggaaaag gtggagcgac tgctgcgacc aattcacgcg agcgttttgt gcaatatttt    540
gttgcagcgg caatggctcc ccaaacaact atgaaagtat gggatggcgg tgttgttagt    600
gatttggtta ccgtagatag gaattacttt ttatttggca gggctgcgca tttattcgaa    660
gactcattta gttcagaaca tacagtgcgg gtgagtgatg ataattttga actggtgcgc    720
caagtaaaaa gctacatgtg tgctgcaggt tctgaacagc atacgcattc aaatgaaaaa    780
atatttaatt acaccagtgg cgatgttatt tggaaaccgg gtactggttt ggatccaagt    840
tggtccgcat ataaaccaag caacatgaaa accgtcgcat tggtggcgac cgaagcaact    900
aaagatttat gggcagcgtt tattcgctcc atgggcacgc ctatagcgca gcgtgagcag    960
tgggcgcgta aagaggctaa taaactggcc gataattggt tggcttttga taaatacaaa   1020
ctccccgatt ggtatgacat tgaagctcat cgggatgata cctatgtatt ggctgatggg   1080
cagacaggga aaggccaaac tgttgccgct tgtatgcaaa agttgggggt tgcatcaggc   1140
aagcaggagg ataaggttcg ccaattggaa gcagatcaaa aaacctgttt atacaatgtc    1200
gtggctgaag agggatacgc cgatttattt gatcccgcat ttcacatgcc attcaattgg    1260
cgttggaaaa caggccggtt tggtgattgg ttacaaccac cagcaggatg gaaaattcca    1320
actcgtccag cggatacagg cacacgcgtg aatattctca gtgcgacaaa caatctccct    1380
atggtggcag ctgatggtgt aagccataac cagtgggttt atgttaaagc aggttttcct    1440
gcgctgggtt ttatcaaagt gccggatgaa aataatactg acaaaaagaa tagtattttt    1500
tatcgcgtaa ttaatgatcc cgatttattt ttaagttaca acgccactac tggcgcagta    1560
aaactctggg ccagtccgaa ccaggctaat tatgcaactg aaccaaaatc agggaatatt    1620
gcaatcaaga gtttgtattg ggatcaatat atgtggcttt caaacgaatc cccttatatt    1680
acccgtaccg ggaatcccaa aaatttggat gcccaatgga aagaagtagc cgctaagtaa    1740
 
<210>162
<211>579
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>信号
<222>(1)...(24)
 
<400>162
Met Asn Arg Lys Leu Leu Ser Leu Cys Leu Gly Ala Thr Ser Cys Ile
1               5                   10                  15
Ala Leu Ser Leu Pro Val His Ala Phe Thr Gln Lys Gly Ala Gly Thr
            20                  25                  30
Glu Ile Ser Asn Gly Ile Pro Met Gly His Glu Trp Val Thr Arg Leu
        35                  40                  45
Ser Ala Leu Glu Leu Leu Gly Gly Asp Pro Ile Met Pro Pro Asp Pro
    50                  55                  60
Asn Asp Pro Arg Lys Asn Trp Thr Lys Gly Lys Ala Lys Asn Leu Asp
65                  70                  75                  80
Leu Ser Ser Pro Gly Ala Arg Ala Glu Val Ala Arg Ile Met Ser Val
                85                  90                  95
Asp Tyr His Asp Lys Ile Phe Gln Ser Thr Tyr Lys Val Val Phe Asp
            100                 105                 110
Ala Ile Ile Gly Glu Arg Trp Val Asp Leu Ala Gly Tyr Asn Val Thr
        115                 120                 125
Thr Ser Met Leu Gly Lys Ile Asn Cys Phe Asp Ala Val Ala Gln Glu
    130                 135                 140
Pro Val Glu Ile Gln Tyr Asp His Phe Met Arg Arg Tyr Asp Glu Arg
l45                 150                 155                 160
Gly Gly Lys Gly Gly Ala Thr Ala Ala Thr Asn Ser Arg Glu Arg Phe
                165                 170                 175
Val Gln Tyr Phe Val Ala Ala Ala Met Ala Pro Gln Thr Thr Met Lys
            180                 185                 190
Val Trp Asp Gly Gly Val Val Ser Asp Leu Val Thr Val Asp Arg Asn
        195                 200                 205
Tyr Phe Leu Phe Gly Arg Ala Ala His Leu Phe Glu Asp Ser Phe Ser
    210                 215                 220
Ser Glu His Thr Val Arg Val Ser Asp Asp Asn Phe Glu Leu Val Arg
225                 230                 235                 240
Gln Val Lys Ser Tyr Met Cys Ala Ala Gly Ser Glu Gln His Thr His
                245                 250                 255
Ser Asn Glu Lys Ile Phe Asn Tyr Thr Ser Gly Asp Val Ile Trp Lys
            260                 265                 270
Pro Gly Thr Gly Leu Asp Pro Ser Trp Ser Ala Tyr Lys Pro Ser Asn
        275                 280                 285
Met Lys Thr Val Ala Leu Val Ala Thr Glu Ala Thr Lys Asp Leu Trp
    290                 295                 300
Ala Ala Phe Ile Arg Ser Met Gly Thr Pro Ile Ala Gln Arg Glu Gln
305                 310                 315                 320
Trp Ala Arg Lys Glu Ala Asn Lys Leu Ala Asp Asn Trp Leu Ala Phe
                325                 330                 335
Asp Lys Tyr Lys Leu Pro Asp Trp Tyr Asp Ile Glu Ala His Arg Asp
            340                 345                 350
Asp Thr Tyr Val Leu Ala Asp Gly Gln Thr Gly Lys Gly Gln Thr Val
        355                 360                 365
Ala Ala Cys Met Gln Lys Leu Gly Val Ala Ser Gly Lys Gln Glu Asp
    370                 375                 380
Lys Val Arg Gln Leu Glu Ala Asp Gln Lys Thr Cys Leu Tyr Asn Val
385                 390                 395                 400
Val Ala Glu Glu Gly Tyr Ala Asp Leu Phe Asp Pro Ala Phe His Met
                405                 410                 415
Pro Phe Asn Trp Arg Trp Lys Thr Gly Arg Phe Gly Asp Trp Leu Gln
            420                 425                 430
Pro Pro Ala Gly Trp Lys Ile Pro Thr Arg Pro Ala Asp Thr Gly Thr
        435                 440                 445
Arg Val Asn Ile Leu Ser Ala Thr Asn Asn Leu Pro Met Val Ala Ala
    450                 455                 460
Asp Gly Val Ser His Asn Gln Trp Val Tyr Val Lys Ala Gly Phe Pro
465                 470                 475                 480
Ala Leu Gly Phe Ile Lys Val Pro Asp Glu Asn Asn Thr Asp Lys Lys
                485                 490                 495
Asn Ser Ile Phe Tyr Arg Val Ile Asn Asp Pro Asp Leu Phe Leu Ser
            500                 505                 510
Tyr Asn Ala Thr Thr Gly Ala Val Lys Leu Trp Ala Ser Pro Asn Gln
        515                 520                 525
Ala Asn Tyr Ala Thr Glu Pro Lys Ser Gly Asn Ile Ala Ile Lys Ser
    530                 535                 540
Leu Tyr Trp Asp Gln Tyr Met Trp Leu Ser Asn Glu Ser Pro Tyr Ile
545                 550                 555                 560
Thr Arg Thr Gly Asn Pro Lys Asn Leu Asp Ala Gln Trp Lys Glu Val
                565                 570                 575
Ala Ala Lys
 
<210>163
<211>1104
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>163
atgcaagtca atggtgcaat tgcagttact gatccggcgt tgagcaatgc agtggaagca     60
acctcttacc agacatctga acagattgtg ggtggagtaa gcgaagcggc ggaagcaggg    120
ttggcggcag aagtgggcgc ggcggagacg ttcgctgcag ctgacgatgt tgccctttca    180
tccatggtcg ccggcccggc taatgatgcc tcttacggca acctgcccgc agggtgggat    240
gaggcccggt ttgatcatgc cctggatatg gccaagttgt cctctcaggc ctacagcagt    300
ttcaatgaca gaactgtaga tcttctactg gcgccgttta gcggtatcaa tgacataaaa    360
aatcaagatt tctccaccga taattatctc cctataaatt ccggtggcaa atctgacttc    420
ctgttgcccc tgcagaatgg gctggactat acggtcttcc agcaagtcac cgatcctaat    480
ggtgtcgatc atgccgccaa gactgccggc ggcgatatcg ttctttcctt ccggggcagt    540
gaacccacat ccgccccgga ttgggtgaac aatgtgaagc aggccgctgg ccattctccc    600
caatatgggg ccgcggtaaa tgtggcgagg gatttgcagc agcaagtgga tgcctataat    660
gagaagcatg ggcttgaagg cgacgctgcc atgaagctcc acttcaccgg ccacagcctg    720
ggtggcggat tggccactgc cgctgccctg gctaccggta gcgaagcgac agtctttaat    780
gctgccggtc tctcagacca taccattaac aaccttggcc tggacgcaag ccatgccgac    840
aaggtgacca atattaacgt ggaaggcgat ctgctgagcg atggcaaccg gcagaaggat    900
gctcacacca cgggctctgg tgtctttggc gataccaagc aatatggtga gcaggtctgg    960
ctgcagggtg tagatgaccg cgcaagattt ggcggccctc tcaacttcct ggtgccgggc   1020
tttgtcaacg acctggccat tcaggggctt aatcacgcct ggcatgtgta tacctaccaa   1080
ttggaaaacc gcaactttgc ctga                                          1104
<210>164
<211>367
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(174)...(296)
<223>脂酶(类3)
 
<400>164
Met Gln Val Asn Gly Ala Ile Ala Val Thr Asp Pro Ala Leu Ser Asn
1               5                   10                  15
Ala Val Glu Ala Thr Ser Tyr Gln Thr Ser Glu Gln Ile Val Gly Gly
            20                  25                  30
Val Ser Glu Ala Ala Glu Ala Gly Leu Ala Ala Glu Val Gly Ala Ala
        35                  40                  45
Glu Thr Phe Ala Ala Ala Asp Asp Val Ala Leu Ser Ser Met Val Ala
    50                  55                  60
Gly Pro Ala Asn Asp Ala Ser Tyr Gly Asn Leu Pro Ala Gly Trp Asp
65                  70                  75                  80
Glu Ala Arg Phe Asp His Ala Leu Asp Met Ala Lys Leu Ser Ser Gln
                85                  90                  95
Ala Tyr Ser Ser Phe Asn Asp Arg Thr Val Asp Leu Leu Leu Ala Pro
            100                 105                 110
Phe Ser Gly Ile Asn Asp Ile Lys Asn Gln Asp Phe Ser Thr Asp Asn
        115                 120                 125
Tyr Leu Pro Ile Asn Ser Gly Gly Lys Ser Asp Phe Leu Leu Pro Leu
    130                 135                 140
Gln Asn Gly Leu Asp Tyr Thr Val Phe Gln Gln Val Thr Asp Pro Asn
145                 150                 155                 160
Gly Val Asp His Ala Ala Lys Thr Ala Gly Gly Asp Ile Val Leu Ser
                165                 170                 175
Phe Arg Gly Ser Glu Pro Thr Ser Ala Pro Asp Trp Val Asn Asn Val
            180                 185                 190
Lys Gln Ala Ala Gly His Ser Pro Gln Tyr Gly Ala Ala Val Asn Val
        195                 200                 205
Ala Arg Asp Leu Gln Gln Gln Val Asp Ala TyrAsn Glu Lys His Gly
    210                 215                 220
Leu Glu Gly Asp Ala Ala Met Lys Leu His Phe Thr Gly His Ser Leu
225                 230                 235                 240
Gly Gly Gly Leu Ala Thr Ala Ala Ala Leu Ala Thr Gly Ser Glu Ala
                245                 250                 255
Thr Val Phe Asn Ala Ala Gly Leu Ser Asp His Thr Ile Asn Asn Leu
            260                 265                 270
Gly Leu Asp Ala Ser His Ala Asp Lys Val Thr Asn Ile Asn Val Glu
        275                 280                 285
Gly Asp Leu Leu Ser Asp Gly Asn Arg Gln Lys Asp Ala His Thr Thr
    290                 295                 300
Gly Ser Gly Val Phe Gly Asp Thr Lys Gln Tyr Gly Glu Gln Val Trp
305                 310                 315                 320
Leu Gln Gly Val Asp Asp Arg Ala Arg Phe Gly Gly Pro Leu Asn Phe
                325                 330                 335
Leu Val Pro Gly Phe Val Asn Asp Leu Ala Ile Gln Gly Leu Asn His
            340                 345                 350
Ala Trp His Val Tyr Thr Tyr Gln Leu Glu Asn Arg Asn Phe Ala
        355                 360                 365
 
<210>165
<21l>927
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>165
atgcccaaat acagaattct tagtttggac ggcggcggaa tccgggggct gctcagcgcg     60
attctgctcg agcggttgga agcggaggca cccaattggc tgagccaggt ggacctgatc    120
gccggcacat ccaccggcgg gatcatcgcc ctgggtctcg ccaaaggcct cagcccaacc    180
caactgcgca atctctatca actgcgcggg gcggcgatat tcgatgattc atggtgggac    240
gacgtgctcg atattgggaa gatttcgggc gcggattatg ataacaagca actcaccaaa    300
gagttgaaga cgattctcgg caacacgaaa ctgcgcgagt tgtcgaagcg ggttttgatt    360
tcgagtttcg atctggacag tgaagagcgc gatcccacca aacgaagttg gacgccgaag    420
ttcttccaca acttcccggg catcgacagc gacggcgagc aactggccta caaggtggcg    480
ctgtacacca gtgccgcgcc gacgtatttt ccgaccgtgg acgggtacat cgatggcggt    540
gtggtggcca acaaccccag catggcagcc ctcgcgcaaa cgcaggacac ccgcgcgctg    600
aaaacaccgc cgcgcttctc cgaaatccgg ctgctctcga tcggcacggg caaatccctc    660
tatcgcatcg aagggcagaa cctggactgg ggctacgccc agtgggccaa gccgctcatc    720
aacatcatga tggacggcgt gatgggtgtg gcagattacc agtgccggca ggtcctggac    780
gacaattatt gccggatttc gcccaccttc ccgcccggcg cggtgtttcc cttggacggt    840
gtcaaacaga ttcccgacct ggtgaccttt gccacttccg tggacctcac gcgcgccgtt    900
cagtggatca agagcaagtg ggcttag                                        927
 
<210>166
<211>308
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
 
<220>
<221>结构域
 
<222>(7)...(191)
<223>马铃薯块茎储藏蛋白(Patatins)-样磷脂酶
 
<400>166
Met Pro Lys Tyr Arg Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly
1               5                   10                  15
Leu Leu Ser Ala Ile Leu Leu Glu Arg Leu Glu Ala Glu Ala Pro Asn
            20                  25                  30
Trp Leu Ser Gln Val Asp Leu Ile Ala Gly Thr Ser Thr Gly Gly Ile
        35                  40                  45
Ile Ala Leu Gly Leu Ala Lys Gly Leu Ser Pro Thr Gln Leu Arg Asn
    50                  55                  60
Leu Tyr Gln Leu Arg Gly Ala Ala Ile Phe Asp Asp Ser Trp Trp Asp
65                  70                  75                  80
Asp Val Leu Asp Ile Gly Lys Ile Ser Gly Ala Asp Tyr Asp Asn Lys
                85                  90                  95
Gln Leu Thr Lys Glu Leu Lys Thr Ile Leu Gly Asn Thr Lys Leu Arg
            100                 105                 110
Glu Leu Ser Lys Arg Val Leu Ile Ser Ser Phe Asp Leu Asp Ser Glu
        115                 120                 125
Glu Arg Asp Pro Thr Lys Arg Ser Trp Thr Pro Lys Phe Phe His Asn
    130                 135                 140
Phe Pro Gly Ile Asp Ser Asp Gly Glu Gln Leu Ala Tyr Lys Val Ala
145                 150                 155                 160
Leu Tyr Thr Ser Ala Ala Pro Thr Tyr Phe Pro Thr Val Asp Gly Tyr
                165                 170                 175
Ile Asp Gly Gly Val Val Ala Asn Asn Pro Ser Met Ala Ala Leu Ala
            180                 185                 190
Gln Thr Gln Asp Thr Arg Ala Leu Lys Thr Pro Pro Arg Phe Ser Glu
        195                 200                 205
Ile Arg Leu Leu Ser Ile Gly Thr Gly Lys Ser Leu Tyr Arg Ile Glu
    210                 215                 220
Gly Gln Asn Leu Asp Trp Gly Tyr Ala Gln Trp Ala Lys Pro Leu Ile
225                 230                 235                 240
Asn Ile Met Met Asp Gly Val Met Gly Val Ala Asp Tyr Gln Cys Arg
                245                 250                 255
Gln Val Leu Asp Asp Asn Tyr Cys Arg Ile Ser Pro Thr Phe Pro Pro
            260                 265                 270
Gly Ala Val Phe Pro Leu Asp Gly Val Lys Gln Ile Pro Asp Leu Val
        275                 280                 285
Thr Phe Ala Thr Ser Val Asp Leu Thr Arg Ala Val Gln Trp Ile Lys
    290                 295                 300
Ser Lys Trp Ala
305
 
<210>167
<211>522
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>167
atggcgagga gctggaagtg gaggccgctt cttagctctt tcttattggt atccttggcg    60
cccttctcga cgtccgtgcc ttgcttcaag ctacccggcc ttgagagcgt ggccttctgg   120
ataagcacta ctatgaactt cttcccgttc ctcctctaca cggctatact agcctacgtt   180
aggaaagact acaaaatagt gctagagggg ctcgccctga acgcgttcgt gctcgtcctc   240
aagtactcgt tccacacccc caggccggag ggctctggcc acctaacccc gggctacccc   300
tccggccaca cggcgagggc cttctggctg gcgctcgagc tcgaaggggt ctggaggtac   360
cctatgttaa cctacgcggc tctggtcgcg tggtcgcgcg ttcagctctg cgcgcactac   420
ccgctggacg tagtgggagg agcgttgagc gctttggcct tccgcgactt atgggaggtt   480
ctgctggaga gggtaggagc cttgaggggg cagcgcgctt ag                      522
 
<210>168
<211>173
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>信号
<222>(1)...(30)
 
<220>
<221>结构域
<222>(48)...(167)
<223>PAP2超家族
 
<400>168
Met Ala Arg Ser Trp Lys Trp Arg Pro Leu Leu Ser Ser Phe Leu Leu
1               5                   10                  15
Val Ser Leu Ala Pro Phe Ser Thr Ser Val Pro Cys Phe Lys Leu Pro
            20                  25                  30
Gly Leu Glu Ser Val Ala Phe Trp Ile Ser Thr Thr Met Asn Phe Phe
        35                  40                  45
Pro Phe Leu Leu Tyr Thr Ala Ile Leu Ala Tyr Val Arg Lys Asp Tyr
    50                  55                  60
Lys Ile Val Leu Glu Gly Leu Ala Leu Asn Ala Phe Val Leu Val Leu
65                  70                  75                  80
Lys Tyr Ser Phe His Thr Pro Arg Pro Glu Gly Ser Gly His Leu Thr
                85                  90                  95
Pro Gly Tyr Pro Ser Gly His Thr Ala Arg Ala Phe Trp Leu Ala Leu
            100                 105                 110
Glu Leu Glu Gly Val Trp Arg Tyr Pro Met Leu Thr Tyr Ala Ala Leu
        115                 120                 125
Val Ala Trp Ser Arg Val Gln Leu Cys Ala His Tyr Pro Leu Asp Val
    130                 135                 140
Val Gly Gly Ala Leu Ser Ala Leu Ala Phe Arg Asp Leu Trp Glu Val
145                 150                 155                 160
Leu Leu Glu Arg Val Gly Ala Leu Arg Gly Gln Arg Ala
                165                 170
 
<210>169
<211>579
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>169
atgagcattc gcgcagtctt cttcgacctt ggcggagtca tcgtccgcac tgaatatcaa     60
tcaccgcgcc agcagctggc agaccggctt ggcctggact acgatgactt gagcaggatc    120
gtctttgata gcgagacggg catcaaggcg acggttggca cgatcacatc ccagcagcat    180
tgggaagcgg tgatgaaacg cctgaaacgc cctcatgagg aaattaccgc catccgcgat    240
gaattctttg caggcgacat cattgaccgt gagatcatca gtttcctccg ttcactgcgc    300
ggcacctgca aaaccggatt gatctcgaac gcctggagcg acttgcgcga ctttatgaca    360
cgcgaaaaaa taatcgacgc cttcgaccat atcatcatct cgtcggaggt aggtgtggcc    420
aagccggaag cgaagatctt ccagattgcc ctggagcagg ccggggtgag tccgaacgag    480
gcggtgtttg tcgatgattt ttacgtcaat atcgaaggct gtgaaaaagt cggaatgaag    540
ggcattcatt ttaaggaccc cgaatccgct ttggctcaa                           579
 
<210>170
<211>193
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<220>
<221>结构域
<222>(3)...(187)
<223>卤酸(haloacid)脱卤素酶-样水解酶
 
<400>170
Met Ser Ile Arg Ala Val Phe Phe Asp Leu Gly Gly Val Ile Val Ara
1               5                   10                  15
Thr Glu Tyr Gln Ser Pro Arg Gln Gln Leu Ala Asp Arg Leu Gly Leu
            20                  25                  30
Asp Tyr Asp Asp Leu Ser Arg Ile Val Phe Asp Ser Glu Thr Gly Ile
        35                  40                  45
Lys Ala Thr Val Gly Thr Ile Thr Ser Gln Gln His Trp Glu Ala Val
    50                  55                  60
Met Lys Arg Leu Lys Arg Pro His Glu Glu Ile Thr Ala Ile Arg Asp
65                  70                  75                  80
Glu Phe Phe Ala Gly Asp Ile Ile Asp Arg Glu Ile Ile Ser Phe Leu
                85                  90                  95
Arg Ser Leu Arg Gly Thr Cys Lys Thr Gly Leu Ile Ser Asn Ala Trp
            100                 105                 110
Ser Asp Leu Arg Asp Phe Met Thr Arg Glu Lys Ile Ile Asp Ala Phe
        115                 120                 125
Asp His Ile Ile Ile Ser Ser Glu Val Gly Val Ala Lys Pro Glu Ala
    130                 135                 140
Lys Ile Phe Gln Ile Ala Leu Glu Gln Ala Gly Val Ser Pro Asn Glu
145                 150                 155                 160
Ala Val Phe Val Asp Asp Phe Tyr Val Asn Ile Glu Gly Cys Glu Lys
                165                 170                 175
Val Gly Met Lys Gly Ile His Phe Lys Asp Pro Glu Ser Ala Leu Ala
            180                 185                 190
Gln
 
<210>171
<211>834
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>171
atgggcaaag cgatgttctt cacggcagat gacggggcgc ggctggccta ttctgaccag     60
ggtaaggggc tgccggtcct gtgcctggcc gggctgacgc ggaacatggg cgatttcaat    120
tacgtcgctc cgcatctgtc gggcgtgcgg ctgatccgga tggactatcg cggacgcggg    180
cagtccgacc gcaccggcgc cgccacctat accgtcccgc aggaaggcaa ggatgcgctg    240
gcgctgctgg atcacctggg ggtggacagg gccgcgatcc tgggcacgtc tcgcggcggg    300
ctgatcggga tgctgctggc cgccgtggcg catgaccggc tgctggggct gtgcctgaac    360
gatgtcggcc cggtgatcga gcgcgcgggg ctggagcgga tcttcgacta tgtcgggcgc    420
aacccggcgg cgcggacgca tgaggcgctg gcggaacgac tgcctgcggc catgcccggc    480
ttcacaaatg tccccgatgg ccgttggctg gcggatgcgc agaagcatta cgacgaaacg    540
ccggaggggc tgcggatcaa atatgaccct gccctgcgcg aggcgttcct ggcagccttc    600
gagggcgctg cgccggatct gtggccgctg tgggatgcga ctgcgggact gcccgtcgcg    660
ctgatccggg gggccagttc cgacctgctg tctgctacgg ttgccgccga gatgctgcgc    720
cgccgccccg acacgatctt tgccgaggtt ccgggccgcg cccatgtgcc ttggctggac    780
gagccggaat cgctggatgc gatcaatgcc tggctggatc gctgcgggcg ctag          834
 
<210>172
<211>277
<212>PRT
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>172
Met Gly Lys Ala Met Phe Phe Thr Ala Asp Asp Gly Ala Arg Leu Ala
1               5                   10                  15
Tyr Ser Asp Gln Gly Lys Gly Leu Pro Val Leu Cys Leu Ala Gly Leu
            20                  25                  30
Thr Arg Asn Met Gly Asp Phe Asn Tyr Val Ala Pro His Leu Ser Gly
        35                  40                  45
Val Arg Leu Ile Arg Met Asp Tyr Arg Gly Arg Gly Gln Ser Asp Arg
    50                  55                  60
Thr Gly Ala Ala Thr Tyr Thr Val Pro Gln Glu Gly Lys Asp Ala Leu
65                  70                  75                  80
Ala Leu Leu Asp His Leu Gly Val Asp Arg Ala Ala Ile Leu Gly Thr
                85                  90                  95
Ser Arg Gly Gly Leu Ile Gly Met Leu Leu Ala Ala Val Ala His Asp
            100                 105                 110
Arg Leu Leu Gly Leu Cys Leu Asn Asp Val Gly Pro Val Ile Glu Arg
        115                 120                 125
Ala Gly Leu Glu Arg Ile Phe Asp Tyr Val Gly Arg Asn Pro Ala Ala
    130                 135                 140
Arg Thr His Glu Ala Leu Ala Glu Arg Leu Pro Ala Ala Met Pro Gly
145                 150                 155                 160
Phe Thr Asn Val Pro Asp Gly Arg Trp Leu Ala Asp Ala Gln Lys His
                165                 170                 175
Tyr Asp Glu Thr Pro Glu Gly Leu Arg Ile Lys Tyr Asp Pro Ala Leu
            180                 185                 190
Arg Glu Ala Phe Leu Ala Ala Phe Glu Gly Ala Ala Pro Asp Leu Trp
        195                 200                 205
Pro Leu Trp Asp Ala Thr Ala Gly Leu Pro Val Ala Leu Ile Arg Gly
    210                 215                 220
Ala Ser Ser Asp Leu Leu Ser Ala Thr Val Ala Ala Glu Met Leu Arg
225                 230                 235                 240
Arg Arg Pro Asp Thr Ile Phe Ala Glu Val Pro Gly Arg Ala His Val
                245                 250                 255
Pro Trp Leu Asp Glu Pro Glu Ser Leu Asp Ala Ile Asn Ala Trp Leu
            260                 265                 270
Asp Arg Cys Gly Arg
        275
 
<210>173
<211>642
<212>DNA
<213>未知
 
<220>
<223>从环境样品中获得
 
<400>173
gtgagcgggc tggccggggt gctcttcgac atgggtggcg tggtcatgga ctcgccgctg     60
cacgccatcg cgcggtacga gcgggagcgc gggctgccgc cgcactcgat caaccgcgcg    120
atcgcgaccg ccggcgagac gggggcgtgg gcccgactcg agcgcggcga gctgaccgtg    180
gcgacgttct gcgcaccgtt cgaagcggac tgtcgcgccc gcggcgtcga ggtggatggg    240
gcggcggtca tggccgcgat cgccgcggcc ggcgtggcgc gccccgccat gctggaggcg    300
attcgcagac tccgcgcgca cgggctccgc gtcggcgcgc tcaccaacaa ctggcggcga    360
gaaggacccg acgacgacgt gatcccgcac cgtctgcgct cccacttcga cgccttcgtg    420
gaatcacgcg cggtcggcct gcgcaagccc gacccgcgaa tctacgtgct ggcctgccac  480
gagctgggcg tggagccgtc gcggacggcg ttcctcgacg acatcggcgg caacctcaag  540
ccggcgcgcg cgctcgggat ggcgacgatc aaggtggacg acccggagcg ggcgctggtg  600
gagctcggtg tgctcgtgga gatggacctg ctcggcccgt ga                     642
<210>174
<211>213
<212>PRT
<213>未知
<220>
<223>从环境样品中获得
<220>
<221>结构域
<222>(4)...(195)
<223>卤酸脱卤素酶样水解酶
<400>174
Met Ser Gly Leu Ala Gly Val Leu Phe Asp Met Gly Gly Val Val Met
1               5                   10                  15
Asp Ser Pro Leu His Ala Ile Ala Arg Tyr Glu Arg Glu Arg Gly Leu
            20                  25                  30
Pro Pro His Ser Ile Asn Arg Ala Ile Ala Thr Ala Gly Glu Thr Gly
        35                  40                  45
Ala Trp Ala Arg Leu Glu Arg Gly Glu Leu Thr Val Ala Thr Phe Cys
    50                  55                  60
Ala Pro Phe Glu Ala Asp Cys Arg Ala Arg Gly Val Glu Val Asp Gly
65                  70                  75                  80
Ala Ala Val Met Ala Ala Ile Ala Ala Ala Gly Val Ala Arg Pro Ala
                85                  90                  95
Met Leu Glu Ala Ile Arg Arg Leu Arg Ala His Gly Leu Arg Val Gly
            100                 105                 110
Ala Leu Thr Asn Asn Trp Arg Arg Glu Gly Pro Asp Asp Asp Val Ile
        115                 120                 125
Pro His Arg Leu Arg Ser His Phe Asp Ala Phe Val Glu Ser Arg Ala
    130                 135                 140
Val Gly Leu Arg Lys Pro Asp Pro Arg Ile Tyr Val Leu Ala Cys His
145                 150                 155                 160
Glu Leu Gly Val Glu Pro Ser Arg Thr Ala Phe Leu Asp Asp Ile Gly
                165                 170                 175
Gly Asn Leu Lys Pro Ala Arg Ala Leu Gly Met Ala Thr Ile Lys Val
            180                 185                 190
Asp Asp Pro Glu Arg Ala Leu Val Glu Leu Gly Val Leu Val Glu Met
        195                 200                 205
Asp Leu Leu Gly Pro
    210
<210>175
<211>245
<212>PRT
<213>未知
<220>
<223>合成的
<400>175
Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile Asn Ser His Leu Trp
1               5                   10                  15
Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg Asn Thr Thr Ile Val
            20                  25                  30
Asn Pro Asn Glu Thr Ala Leu Leu Ash Glu Trp Arg Ala Asp Leu Glu
        35                  40                  45
Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro Tyr Tyr Asp Asp Ser
    50                  55                  60
Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr Gly Thr Thr Tyr Ile
65                  70                  75                  80
Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala Lys Tyr Phe Asn Leu
                85                  90                  95
Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln Gln Ala Phe Phe Tyr
            100                 105                 110
Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro Met His
        115                 120                 125
Ala Ala Ser Phe Thr Asp Leu Ser Tyr Pro Met Gly Phe His Ser Lys
    130                 135                 140
Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn Tyr Ile Val Ser Asp
145                 150                 155                 160
Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn Pro Glu Asp Trp Ile
                165                 170                 175
Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr Pro Gly Val Val Asn
            180                 185                 190
Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala Val Ser Gln Glu Tyr
        195                 200                 205
Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys Arg Leu
    210                 215                 220
Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile His Leu Trp Phe Asp
225                 230                 235                 240
Thr Tyr Val Asn Arg
                245
<210>176
<211>282
<212>PRT
<213>未知
<220>
<221>信号
<222>(1)...(24)
<223>合成的
<400>176
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
1               5                   10                  15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
            20                  25                  30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile
        35                  40                  45
Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
    50                  55                  60
Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asp Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
            100                 105                 110
Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala
        115                 120                 125
Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln
    130                 135                 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Ser Phe Thr Asp Leu Ser Tyr Pro Met
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
            180                 185                 190
Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn
        195                 200                 205
Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
    210                 215                 220
Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn Arg
        275                 280
 

Claims (71)

1.分离的、合成的或重组的核酸,其是编码具有磷脂酶C活性的多肽的核酸,其中所述核酸序列是:
(a)SEQ ID NO:1;
(b)编码SEQ ID NO:2中所阐明的多肽的核酸;或
(c)编码多肽的核酸,所述多肽如SEQ ID NO:2的38至282位氨基酸所示且具有N63D、N131S和N134D的氨基酸修饰。
2.权利要求1所述的核酸,其中所述核酸序列是在SEQ ID NO:1中阐明的所述序列。
3.权利要求1所述的核酸,其中所述核酸序列编码多肽,所述多肽是在SEQID NO:2中所阐明的序列。
4.权利要求1所述的核酸,其中所述磷脂酶活性催化甘油磷酸酯键的水解。
5.表达盒,其具有在权利要求1中所阐述的核酸序列。
6.载体,其具有在权利要求1中所阐述的核酸序列。
7.克隆载体,其具有在权利要求1中所阐述的核酸序列。
8.权利要求7所述的克隆载体,其中所述病毒载体是腺病毒载体、逆转录病毒载体或者腺相关病毒载体。
9.权利要求7所述的克隆载体,其为细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)或者哺乳动物人工染色体(MAC)。
10.转化的细胞,其具有在权利要求1中所阐述的核酸序列。
11.转化的细胞,其具有在权利要求5中所阐述的表达盒。
12.权利要求11所述的转化的细胞,其中所述细胞是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或者植物细胞。
13.分离的、合成的或重组的多肽,其具有磷脂酶C活性,其中所述多肽是:
(i)SEQ ID NO:2中所阐明的氨基酸序列;(ii)由SEQ ID NO:1中所阐明的核酸序列编码;或(iii)(i)或(ii)如SEQ ID NO:2的38至282位氨基酸所示且具有N63D、N131S和N134D的氨基酸修饰的多肽。
14.权利要求13所述的多肽,其中该多肽是在SEQ ID NO:2中所阐明的序列。
15.权利要求13所述的多肽,其中所述磷脂酶C活性催化甘油磷酸酯键的水解。
16.权利要求13所述的多肽,其中所述多肽具有至少一个糖基化位点。
17.权利要求16所述的多肽,其中所述糖基化是N-连接糖基化。
18.权利要求17所述的多肽,其中所述多肽是在巴斯德毕赤酵母(P.pastoris)或者粟酒裂殖酵母(S.pombe.)中表达之后被糖基化。
19.蛋白制剂,其具有在权利要求13中阐明的多肽,其中所述蛋白制剂包括液体、固体或凝胶。
20.固定化多肽,其中所述多肽是权利要求13中所阐明的序列。
21.权利要求20所述的固定化多肽,其中所述多肽固定于细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、阵列或者毛细管。
22.水解、分解或破坏磷脂组合物的方法:
(a)提供权利要求13中所阐明的多肽;
(b)提供具有磷脂的组合物;和
(c)在所述磷脂酶水解、分解或破坏磷脂组合物的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。
23.权利要求22所述的方法,其中所述组合物是含有磷脂的脂双层或膜。
24.权利要求22所述的方法,其中所述组合物是植物细胞、细菌细胞、酵母细胞或动物细胞。
25.去污剂组合物,具有权利要求13中阐明的多肽。
26.权利要求25所述的去污剂组合物,其中所述磷脂酶配制成非含水液体组合物、铸造固体、冻干粉末、粒状形式、微粒形式、压缩片剂、小丸、凝胶形式、膏、气溶胶或浆体形式。
27.油脱胶的方法:
(a)提供权利要求13所阐明的多肽;
(b)提供组合物,该组合物具有含有磷脂的脂肪或油;和
(c)在所述多肽可以催化所述组合物中的磷脂水解的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。
28.权利要求27所述的方法,其中所述含油的组合物是植物油、藻油、鱼油或者脂肪。
29.权利要求28所述的方法,其中所述植物油是米糠油、大豆油、菜籽油、玉米油、来自棕榈仁的油、芥花油、葵花籽油、芝麻油或花生油。
30.权利要求27所述的方法,其中所述多肽水解来自含油组合物中的可水合的和/或不可水合的磷脂(phospholipid)中的磷脂(phosphatide)。
31.权利要求27所述的方法,其中所述多肽在甘油磷酸酯键处水解磷脂,产生甘油二酯和水溶性磷酸化合物。
32.权利要求27所述的方法,其中所述接触是水解油中的水合磷脂。
33.权利要求27所述的方法,其中步骤(c)的水解条件是在碱性pH下,温度从20℃到40℃。
34.权利要求33所述的方法,其中所述碱性条件是pH从pH8到pH10。
35.权利要求27所述的方法,其中步骤(c)的水解条件是反应时间从3分钟到10分钟。
36.权利要求27所述的方法,其中所述多肽结合到过滤器上,使所述含有磷脂的脂肪或油通过所述过滤器。
37.权利要求27所述的方法,其中所述多肽加入到含有磷脂的脂肪或油的溶液中,然后使所述溶液通过过滤器。
38.将不可水合磷脂转化为可水合形式的方法:
(a)提供权利要求13中阐明的多肽;
(c)提供不可水合磷脂;和
(d)在所述多肽将所述不可水合磷脂转化为可水合形式的条件下,将步骤(a)的多肽和步骤(b)的组合物接触。
39.对含有磷脂的组合物进行碱炼的方法:
(a)提供权利要求13中阐明的多肽;
(b)提供磷脂;和
(c)在所述碱炼之前、之中或之后,将步骤(a)的多肽和步骤(b)的组合物接触。
40.权利要求39所述的方法,其中所述具有磷脂酶活性的多肽在加入酸或碱之前加入。
41.权利要求39所述的方法,其中所述具有磷脂酶活性的多肽是在碱炼过程中被加入的,依据磷的水平和游离脂肪酸的水平加入变化水平的酸和碱。
42.权利要求39所述的方法,其中所述具有磷脂酶活性的多肽在碱炼之后被加入:分离以前,在强混合器或阻滞混合器中;加热步骤之后;在离心机中;在皂脚中;在洗涤水中;或在漂白或除臭步骤中。
43.精炼粗油的方法:
(a)提供权利要求13中阐明的多肽;
(b)提供含有磷脂的油;和
(c)在所述多肽能够催化所述油中的磷脂水解的条件下,将步骤(a)的多肽和步骤(b)的油接触。
44.权利要求43所述的方法,其中所述处理时间为小于2小时。
45.权利要求44所述的方法,其中所述处理时间为小于60分钟。
46.权利要求45所述的方法,其中所述处理时间小于30分钟。
47.权利要求43所述的方法,其中所述水解条件是温度在25℃-70℃之间。
48.权利要求43所述的方法,其中所述水解条件是使用苛性碱。
49.权利要求43所述的方法,其中所述水解条件是pH在pH3到pH10之间。
50.权利要求43所述的方法,其中所述水解条件包括添加乳化剂和混合所述油。
51.权利要求43所述的方法,添加破乳剂或加热或冷却,从而促进含水相的分离。
52.权利要求43所述的方法,其中在接触步骤前进行脱胶,以通过离心收集卵磷脂,然后加入PLC、PLA,从而除去不可水合的磷脂。
53.权利要求43所述的方法,其中对于食用油,对粗油进行水脱胶到少于10ppm的磷。
54.权利要求43所述方法,其中添加酸以促进非水合磷脂的水合。
55.对油或脂肪进行脱胶的方法:
(a)提供权利要求13中阐明的多肽;
(b)提供含有磷脂的脂肪或油;和
(c)在所述多肽可以催化所述脂肪或油中磷脂水解条件下,将步骤(a)的多肽和步骤(b)的脂肪或油接触。
56.权利要求1所述的核酸,其中所述多肽催化水解磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)或磷脂酸中的甘油磷酸酯键或其组合。
57.权利要求13所述的多肽,其中所述多肽催化水解磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、或磷脂酸中的甘油磷酸酯键或其组合。
58.权利要求27的方法,其中所述具有磷脂酶活性的多肽具有PLC活性,所述方法增加中性油。
59.权利要求27的方法,其中所述具有磷脂酶活性的多肽具有PLC活性,所述方法增加二酰甘油(DAG)产量,从而增加油相。
60.权利要求27的方法,其中所述水解条件包括碱性pH。
61.权利要求27的方法,其中所述碱性条件足以将由PLC产生的1,2-DAG异构化成1,3-DAG。
62.权利要求27的方法,进一步包括:通过加入硬化物质,以物理方式将由脱胶方法产生的胶除去。
63.权利要求62的方法,其中所述硬化物质包括云母。
64.权利要求27的方法,其中最终脱胶的油产物富集有1,3-DAG。
65.权利要求64的方法,其中最终脱胶的油产物包含不少于1.0%的1,3-DAG。
66.减少胶量并通过减少油被捕获的数量来增加中性油产量的方法:
(a)提供权利要求13中所阐明的多肽;
(b)提供含有磷脂的脂肪或油;和
(c)将步骤(a)的多肽与步骤(b)的组合物在其中所述多肽能够催化水解所述组合物中的磷脂的条件下接触足够的时间,以减少胶量并增加中性油。
67.表达权利要求13的多肽的方法:
(a)提供具有Mut+表型的毕赤酵母菌株;
(b)将权利要求1的异源磷脂酶C编码核酸插入所述毕赤酵母菌株中;和
(c)在所述磷脂酶被表达的条件下,培养所述毕赤酵母菌株。
68.权利要求67的方法,其中为所述培养条件补充锌。
69.表达磷脂酶C的细胞系统,包括Mut+表型毕赤酵母菌株,该菌株含有可操作性地连接到启动子的异源磷脂酶C编码核酸,所述启动子在所述毕赤酵母菌株中是可操作性的,其中所述磷脂酶C编码核酸是权利要求1的核酸。
70.表达异源蛋白的细胞系统,包括对zeocin具有抗性的毕赤酵母菌株细胞,其中所述异源蛋白由权利要求1的核酸编码。
71.生产zeocin-抗性酵母细胞系统的方法,所述酵母细胞系统用于表达异源蛋白,所述方法包括如下步骤:
(a)提供毕赤酵母某种(Pichia sp.)的细胞和能够表达异源蛋白的异源核酸,其中所述异源蛋白编码核酸是权利要求1的核酸;
(b)将所述细胞培养在包含起始浓度的zeocin的条件下;
(c)选择对所述起始浓度的zeocin具有抗性的细胞,并重新培养在包含更高浓度的zeocin的条件下;和
(d)选择在步骤(c)中培养的、对所述更高浓度的zeocin具有抗性的细胞。
CN2005800146676A 2004-03-08 2005-03-08 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法 Active CN101426918B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/796,907 US7226771B2 (en) 2002-04-19 2004-03-08 Phospholipases, nucleic acids encoding them and methods for making and using them
US10/796,907 2004-03-08
PCT/US2005/007908 WO2005086900A2 (en) 2004-03-08 2005-03-08 Phospholipases, nucleic acids encoding them and methods for making and using them

Publications (2)

Publication Number Publication Date
CN101426918A CN101426918A (zh) 2009-05-06
CN101426918B true CN101426918B (zh) 2013-03-27

Family

ID=34976224

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800146676A Active CN101426918B (zh) 2004-03-08 2005-03-08 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法

Country Status (12)

Country Link
US (2) US7226771B2 (zh)
EP (2) EP3190182A1 (zh)
JP (2) JP2007531516A (zh)
CN (1) CN101426918B (zh)
AU (1) AU2005221136B2 (zh)
BR (1) BRPI0508559B1 (zh)
CA (1) CA2559060C (zh)
ES (1) ES2601431T3 (zh)
HU (1) HUE030573T2 (zh)
PL (1) PL1748954T3 (zh)
PT (1) PT1748954T (zh)
WO (1) WO2005086900A2 (zh)

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050287250A1 (en) * 1995-06-07 2005-12-29 Danisco A/S Method
DE69604491T3 (de) 1995-06-07 2008-09-25 Danisco A/S Methode zur verbesserung der eigenschaften von mehlteig, sowie zusammensetzung zur teigverbesserung und verbesserte nahrungsmittel
GB0112226D0 (en) * 2001-05-18 2001-07-11 Danisco Method of improving dough and bread quality
US6936289B2 (en) 1995-06-07 2005-08-30 Danisco A/S Method of improving the properties of a flour dough, a flour dough improving composition and improved food products
ES2188190T5 (es) 1998-07-21 2007-11-16 Danisco A/S Producto alimentario.
US6632429B1 (en) * 1999-12-17 2003-10-14 Joan M. Fallon Methods for treating pervasive development disorders
US20070053895A1 (en) 2000-08-14 2007-03-08 Fallon Joan M Method of treating and diagnosing parkinsons disease and related dysautonomic disorders
US8030002B2 (en) 2000-11-16 2011-10-04 Curemark Llc Methods for diagnosing pervasive development disorders, dysautonomia and other neurological conditions
NZ528260A (en) 2001-05-18 2005-09-30 Danisco Method of improving dough and bread quality with the addition of an enzyme that hydrolyses a glycolipid and a phospholipid and incapable of hydrolysing a triglyceride or monoglyceride
US7943360B2 (en) 2002-04-19 2011-05-17 Verenium Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
US7226771B2 (en) * 2002-04-19 2007-06-05 Diversa Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
MXPA05007653A (es) * 2003-01-17 2005-09-30 Danisco Metodo.
US20050196766A1 (en) * 2003-12-24 2005-09-08 Soe Jorn B. Proteins
US7955814B2 (en) * 2003-01-17 2011-06-07 Danisco A/S Method
DK2853593T3 (en) 2003-03-07 2018-01-08 Dsm Ip Assets Bv Hydrolases, nucleic acids encoding them, and processes for their preparation and use
GB0716126D0 (en) * 2007-08-17 2007-09-26 Danisco Process
US7718408B2 (en) 2003-12-24 2010-05-18 Danisco A/S Method
US7906307B2 (en) * 2003-12-24 2011-03-15 Danisco A/S Variant lipid acyltransferases and methods of making
GB0405637D0 (en) 2004-03-12 2004-04-21 Danisco Protein
US20080070291A1 (en) 2004-06-16 2008-03-20 David Lam Compositions and Methods for Enzymatic Decolorization of Chlorophyll
WO2006008508A1 (en) 2004-07-16 2006-01-26 Danisco A/S Enzymatic oil-degumming method
WO2006031699A2 (en) 2004-09-10 2006-03-23 Diversa Corporation Compositions and methods for making and modifying oils
US20080058282A1 (en) 2005-08-30 2008-03-06 Fallon Joan M Use of lactulose in the treatment of autism
EP1788080A1 (en) * 2005-11-22 2007-05-23 Süd-Chemie Ag Use of a thermostable phospholipase in the degumming of an oil or fat, and a method for obtaining a thermostable phopholipase
US20070148311A1 (en) * 2005-12-22 2007-06-28 Bunge Oils, Inc. Phytosterol esterification product and method of make same
US20080215251A1 (en) * 2006-08-31 2008-09-04 Pioneer Hi-Bred International, Inc. Computational method for choosing nucleotide sequences to specifically silence genes
MX2009003034A (es) * 2006-09-21 2009-11-18 Verenium Corp Fosfolipasas, acidos nucleicos que las codifican, y metodos de hacerlas y usarlas.
BRPI0720801A2 (pt) * 2007-01-25 2014-09-16 Dupont Nutrition Biosci Aps Produção de um lipídio aciltranfersase a partir de células transformadas de bacillus licheniformis.
US8956853B2 (en) * 2007-01-30 2015-02-17 Bunge Oils, Inc. Enzymatic degumming utilizing a mixture of PLA and PLC phospholipases
US8460905B2 (en) * 2007-09-11 2013-06-11 Bunge Oils, Inc. Enzymatic degumming utilizing a mixture of PLA and PLC phospholipases with reduced reaction time
EP2118248B1 (en) * 2007-01-30 2014-08-27 Bunge Oils, Inc Enzymatic degumming utilizing a mixture of pla and plc phospholipases
AU2008300002B2 (en) 2007-09-12 2014-04-10 Dsm Ip Assets B.V. Biological oils and production and uses thereof
JP5509094B2 (ja) * 2007-12-21 2014-06-04 デュポン ニュートリション バイオサイエンシーズ エーピーエス 脂質アシルトランスフェラーゼを用いる食用油精製のためのプロセス
US8241876B2 (en) 2008-01-07 2012-08-14 Bunge Oils, Inc. Generation of triacylglycerols from gums
US8658163B2 (en) 2008-03-13 2014-02-25 Curemark Llc Compositions and use thereof for treating symptoms of preeclampsia
US8084025B2 (en) 2008-04-18 2011-12-27 Curemark Llc Method for the treatment of the symptoms of drug and alcohol addiction
US9320780B2 (en) 2008-06-26 2016-04-26 Curemark Llc Methods and compositions for the treatment of symptoms of Williams Syndrome
WO2010002972A1 (en) 2008-07-01 2010-01-07 Curemark, Llc Methods and compositions for the treatment of symptoms of neurological and mental health disorders
US10776453B2 (en) 2008-08-04 2020-09-15 Galenagen, Llc Systems and methods employing remote data gathering and monitoring for diagnosing, staging, and treatment of Parkinsons disease, movement and neurological disorders, and chronic pain
US20100092447A1 (en) 2008-10-03 2010-04-15 Fallon Joan M Methods and compositions for the treatment of symptoms of prion diseases
US20110119587A1 (en) * 2008-12-31 2011-05-19 Microsoft Corporation Data model and player platform for rich interactive narratives
US20110113315A1 (en) * 2008-12-31 2011-05-12 Microsoft Corporation Computer-assisted rich interactive narrative (rin) generation
US9092437B2 (en) * 2008-12-31 2015-07-28 Microsoft Technology Licensing, Llc Experience streams for rich interactive narratives
KR101694931B1 (ko) 2009-01-06 2017-01-10 큐어론 엘엘씨 이. 콜라이에 의한 구강 감염의 치료 또는 예방을 위한 조성물 및 방법
KR20170005192A (ko) 2009-01-06 2017-01-11 큐어론 엘엘씨 스타필로코쿠스 아우레우스 감염의 치료 또는 예방 및 표면 상의 스타필로코쿠스 아우레우스의 박멸 또는 감소를 위한 조성물 및 방법
US8703463B2 (en) 2009-03-10 2014-04-22 Dsm Ip Assets B.V. Pregastric esterase and derivatives thereof
GB0904787D0 (en) * 2009-03-20 2009-05-06 Desmet Ballestra Engineering Sa Improved enzymatic oil recuperation process
US9056050B2 (en) 2009-04-13 2015-06-16 Curemark Llc Enzyme delivery systems and methods of preparation and use
US9315764B1 (en) * 2009-05-01 2016-04-19 Rrip, Llc Method of processing phospholipid based lipid materials
JP2012531197A (ja) * 2009-06-25 2012-12-10 デュポン ニュートリション バイオサイエンシーズ エーピーエス タンパク質
PL3168308T3 (pl) * 2009-10-14 2018-07-31 Xyleco, Inc. Wytwarzanie jadalnych pozostałości po produkcji etanolu
UA109884C2 (uk) * 2009-10-16 2015-10-26 Поліпептид, що має активність ферменту фосфатидилінозитол-специфічної фосфоліпази с, нуклеїнова кислота, що його кодує, та спосіб його виробництва і застосування
UA111708C2 (uk) * 2009-10-16 2016-06-10 Бандж Ойлз, Інк. Спосіб рафінування олії
US9511125B2 (en) 2009-10-21 2016-12-06 Curemark Llc Methods and compositions for the treatment of influenza
EP2519642B1 (en) * 2009-12-28 2017-10-25 DSM IP Assets B.V. Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof
CN107858297A (zh) 2009-12-28 2018-03-30 Dsm Ip资产公司 在蔗糖上生长的重组破囊壶菌和其组合物、制备方法及用途
DE102010025764A1 (de) 2010-07-01 2012-01-05 Süd-Chemie AG Phospholipase-Träger-Komplex
CA2815083A1 (en) * 2010-10-19 2012-04-26 The Curators Of University Of Missouri-St. Louis Method for increasing plant oil production
MX356647B (es) * 2010-11-12 2018-06-07 Novozymes As Polipeptidos que tienen actividad de fosfolipasa c y polinucleotidos que codifican los mismos.
GB201019639D0 (en) * 2010-11-19 2010-12-29 Loders Croklaan Bv Method
CN106310242B (zh) 2011-04-21 2020-02-28 柯尔马克有限责任公司 用于治疗神经精神障碍的化合物
TWI414362B (zh) 2011-05-18 2013-11-11 Ind Tech Res Inst 萃取裝置
US8586387B2 (en) * 2011-08-30 2013-11-19 Supernova Diagnostics, Inc. Methods of triggering activation of encapsulated signal-generating substances and apparatus utilising activated signal-generating substances
WO2013122599A1 (en) * 2012-02-17 2013-08-22 Sunho Biodiesel America Llc Enzymatic production of monoglycerides
IN2014KN01679A (zh) 2012-02-17 2015-10-23 Clariant Produkte Deutschland
US10350278B2 (en) 2012-05-30 2019-07-16 Curemark, Llc Methods of treating Celiac disease
CN104487558B (zh) 2012-06-14 2018-07-17 邦吉全球创新有限责任公司 用于生产低饱和油的方法
BR112014032741B1 (pt) * 2012-07-04 2022-01-25 Cooperatie Avebe U.A. Método para seletivamente preparar um éster de alquila de ácido graxo
DK3594351T3 (da) * 2013-03-08 2022-01-03 Keck Graduate Inst Of Applied Life Sciences Gærpromotorer fra pichia pastoris
ES2856265T3 (es) 2013-03-08 2021-09-27 Biogrammatics Inc Promotores de levadura para la expresión de proteínas
US10294463B2 (en) * 2013-07-03 2019-05-21 Keclon Sa Modified Bacillus cereus phospholipase C protein and method of processing vegetable oil
CN104630174B (zh) * 2013-11-07 2019-09-27 丰益(上海)生物技术研发中心有限公司 磷脂酶c突变体及其用途
CN104630175B (zh) * 2013-11-14 2019-10-25 丰益(上海)生物技术研发中心有限公司 一种磷脂酶c
US20160376576A1 (en) 2013-12-05 2016-12-29 Nagase Chemtex Corporation Flavor-improving enzyme composition, method for suppressing occurrence of unpleasant odor, and method for manufacturing food with reduced unpleasant odor
EP2910129A1 (de) 2014-02-21 2015-08-26 Clariant Produkte (Deutschland) GmbH Zusammensetzung für die enzymatische Ölentschleimung
US9616114B1 (en) 2014-09-18 2017-04-11 David Gordon Bermudes Modified bacteria having improved pharmacokinetics and tumor colonization enhancing antitumor activity
CN104388448B (zh) * 2014-12-18 2018-07-03 山东大学 一种玉米磷脂酶A2基因ZmsPLA2-1及其应用
US20180168175A1 (en) 2015-04-14 2018-06-21 Dsm Ip Assets B.V. Use of phospholipase c
CN105985984B (zh) * 2015-06-17 2018-10-02 深圳益世康宁生物科技有限公司 携带pap抗原基因的重组腺相关病毒载体及构建方法与应用
MX2018000708A (es) * 2015-07-17 2019-07-08 Keclon Sa Composiciones y metodos para desgomar aceite.
CN106884009A (zh) * 2015-12-16 2017-06-23 丰益(上海)生物技术研发中心有限公司 高效的不依赖锌离子的磷脂酶c突变体
SG11201804731XA (en) * 2016-02-03 2018-08-30 Fuji Oil Holdings Inc Cocoa butter
BR112018015528B1 (pt) * 2016-02-03 2022-03-15 Fuji Oil Holdings Inc Método para produzir manteiga de cacau, método para obter resistência a fotodegradação, alimento semelhante a chocolate, e método para produzir o mesmo
EP3419427B1 (en) 2016-02-19 2022-04-20 Basf Se Baking lipases
CN106047732B (zh) * 2016-05-26 2019-09-03 江南大学 一种高分泌型耐热酵母基因工程菌及其应用
CN110129299B (zh) * 2016-06-02 2021-08-03 天津科技大学 磷脂酶d及其应用
US11129906B1 (en) 2016-12-07 2021-09-28 David Gordon Bermudes Chimeric protein toxins for expression by therapeutic bacteria
US11180535B1 (en) 2016-12-07 2021-11-23 David Gordon Bermudes Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria
CN108239667B (zh) * 2016-12-27 2022-08-12 丰益(上海)生物技术研发中心有限公司 一种磷脂酶c活力的检测方法
EP3401383A1 (en) 2017-05-08 2018-11-14 Bunge Oils, Inc. Process for enzymatic degumming
CN110621162B (zh) 2017-05-12 2024-05-24 巴斯夫欧洲公司 脂肪酶
EP3638763A4 (en) 2017-06-16 2021-04-28 BASF Enzymes LLC PROCESS FOR INCREASING THE OIL YIELD IN THE PRODUCTION OF ETHANOL
WO2019063614A1 (en) 2017-09-26 2019-04-04 Bunge Global Innovation, Llc. ENZYMATIC REMOVAL OF CHLOROPHYLLIC SUBSTRATES FROM TRIACYLGLYCEROL OILS
MX2020004318A (es) 2017-10-25 2020-08-13 Basf Se Enzimas beta-amilasa.
CN108120761B (zh) * 2017-11-30 2020-10-16 宁波大学 基于具有电催化活性的多肽模拟物的电化学生物传感器用于乙酰胆碱酯酶检测
CN108384768A (zh) * 2018-02-28 2018-08-10 江苏中酶生物科技有限公司 一种磷脂酶c的突变体及其应用
CN108359654B (zh) * 2018-03-02 2021-11-05 江苏中酶生物科技有限公司 一种具有磷脂酶b活性的多肽或蛋白质及其应用
CN112368375A (zh) 2018-04-26 2021-02-12 巴斯夫欧洲公司 脂肪酶
US20210115422A1 (en) 2018-05-03 2021-04-22 Basf Se Amylase enzymes
UA126992C2 (uk) 2018-05-07 2023-03-01 Дсм Айпі Асетс Б.В. Спосіб ферментативного дегумування олії
CN114127256A (zh) 2019-02-20 2022-03-01 巴斯夫欧洲公司 用确定成分培养基和微量元素补料的芽孢杆菌工业发酵工艺
EP3927837A1 (en) 2019-02-20 2021-12-29 Basf Se Industrial fermentation process for bacillus using defined medium and magnesium feed
US20220186200A1 (en) 2019-03-11 2022-06-16 Basf Se Amylases and methods for making and using them
WO2020193532A1 (en) 2019-03-25 2020-10-01 Basf Se Cleaning composition having amylase enzymes
US20220162576A1 (en) 2019-03-25 2022-05-26 Basf Se Amylase enzymes
EP3947664A2 (en) 2019-03-25 2022-02-09 Basf Se Amylase enzymes
WO2020198212A1 (en) 2019-03-27 2020-10-01 Bunge Global Innovation, Llc Silica adsorbent treatment for removal of chlorophyll derivatives from triacylglycerol-based oils
CN113993878A (zh) 2019-06-13 2022-01-28 巴斯夫欧洲公司 用二价阳离子从发酵液中回收蛋白的方法
MX2022000253A (es) 2019-07-05 2022-02-03 Basf Se Proceso de fermentacion industrial para celulas microbianas mediante el uso de un precultivo de alimentacion por lotes.
MX2022002182A (es) 2019-08-22 2022-03-11 Basf Se Variantes de amilasa.
US11541009B2 (en) 2020-09-10 2023-01-03 Curemark, Llc Methods of prophylaxis of coronavirus infection and treatment of coronaviruses
CN112522233B (zh) * 2020-12-11 2022-05-03 中国农业大学 一种米曲霉磷脂酶c及其编码基因与应用
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
WO2023208768A1 (en) 2022-04-26 2023-11-02 Dsm Ip Assets B.V. Method of producing cannabis distillate
WO2024178230A1 (en) 2023-02-24 2024-08-29 Caravan Ingredients Inc. Egg replacer composition and methods of making and using the same
CN116574394A (zh) * 2023-04-19 2023-08-11 南京溯远基因科技有限公司 一种敏感性荧光染料剂及其制备方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1235636A (zh) * 1996-10-31 1999-11-17 诺沃挪第克公司 新型磷脂酶,及其生产和应用
CN1293706A (zh) * 1998-04-08 2001-05-02 诺维信公司 一种酶促油脱胶的方法
WO2003089620A2 (en) * 2002-04-19 2003-10-30 Diversa Corporation Phospholipases, nucleic acids encoding them and methods for making and using them

Family Cites Families (143)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE318048B (zh) 1959-09-21 1969-12-01 Pellerin Ab Zenith
GB1541017A (en) 1975-03-10 1979-02-21 Unilever Ltd Degumming process for triglyceride oils
SE417441B (sv) 1977-08-19 1981-03-16 Kare Larsson Forfarande for att isolera polera lipider ur en blandning av polera och opolera cerealiclipider genom blandning med vatten och derpa foljande tyngdkraftsseparation
US4240972A (en) 1978-12-19 1980-12-23 Canada Packers Limited Continuous process for contacting of triglyceride oils with _an acid
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
LU83441A1 (fr) 1981-06-19 1983-04-06 Tirtiaux Sa Procede de traitement des huiles et graisses et produits ainsi obtenus
US4707364A (en) * 1984-01-27 1987-11-17 Miles Laboratories, Inc. Composition for accelerating cheese aging
US5087571A (en) 1984-06-22 1992-02-11 President And Fellows Of Harvard College Method for providing a cell culture from a transgenic non-human mammal
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
DE3590766T (zh) 1985-03-30 1987-04-23
US4752483A (en) * 1986-05-30 1988-06-21 Campbell Soup Company Method for producing a highly flavored cheese ingredient
US5030240A (en) 1986-06-09 1991-07-09 The Clorox Company Enzymatic peracid bleaching system
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5573933A (en) 1987-04-14 1996-11-12 Luminis Pty, Ltd. Transgenic pigs
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5288619A (en) * 1989-12-18 1994-02-22 Kraft General Foods, Inc. Enzymatic method for preparing transesterified oils
WO1991016427A1 (en) 1990-04-24 1991-10-31 Stratagene Methods for phenotype creation from multiple gene populations
US5326477A (en) 1990-05-07 1994-07-05 Bio-Sep, Inc. Process for digesting solid waste
WO1991019810A1 (en) 1990-06-15 1991-12-26 California Biotechnology Inc. Transgenic non-human mammal displaying the amyloid-forming pathology of alzheimer's disease
AU8914291A (en) 1990-11-23 1992-06-25 Plant Genetic Systems N.V. Process for transforming monocotyledonous plants
JP3298879B2 (ja) 1990-12-20 2002-07-08 イグジス,インコーポレイテッド 結合タンパク質の最適化
US6110700A (en) 1991-03-11 2000-08-29 The General Hospital Corporation PRAD1 cyclin and its cDNA
DE4115938A1 (de) * 1991-05-16 1992-11-19 Metallgesellschaft Ag Enzymatisches verfahren zur verminderung des gehaltes an phosphorhaltigen bestandteilen in pflanzlichen und tierischen oelen
US5922854A (en) 1991-06-14 1999-07-13 Kumar; Ramesh Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids
CA2075135A1 (en) 1991-08-02 1993-02-03 David E. Ellis Particle-mediated transformation of gymnosperms
US5632957A (en) 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
JPH05236997A (ja) 1992-02-28 1993-09-17 Hitachi Ltd ポリヌクレオチド捕捉用チップ
JPH06306386A (ja) 1993-04-25 1994-11-01 Showa Sangyo Co Ltd 油脂の精製方法
JP2937746B2 (ja) * 1993-04-25 1999-08-23 昭和産業株式会社 油脂の精製方法
EP0670670A4 (en) 1993-09-30 1996-04-24 Agracetus HETEROLOGICAL PEROXIDASE PROCESSING TRANSGENIC COTTON PLANTS.
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US5965452A (en) 1996-07-09 1999-10-12 Nanogen, Inc. Multiplexed active biologic array
US6468742B2 (en) 1993-11-01 2002-10-22 Nanogen, Inc. Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip
DE4339556C1 (de) 1993-11-19 1995-02-02 Metallgesellschaft Ag Verfahren zum Entschleimen von Pflanzenöl mittels Enzymen
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5639940A (en) 1994-03-03 1997-06-17 Pharmaceutical Proteins Ltd. Production of fibrinogen in transgenic animals
EP0750671A1 (en) 1994-03-09 1997-01-02 Abbott Laboratories Transgenic animals producing oligosaccharides and glycoconjugates
NZ279676A (en) 1994-03-09 1998-04-27 Abbott Lab Humanized milk produced by non-human transgenic mammal transformed with a heterologous gene coding for human enzyme producing human oligosaccharides and glycoconjugates
AU2067795A (en) 1994-03-29 1995-10-17 Novo Nordisk A/S Alkaline bacillus amylase
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5959171A (en) 1994-08-17 1999-09-28 Pharming B.V. Method for the production of biologically active polypeptides in a mammal's
WO1996006927A1 (en) 1994-09-01 1996-03-07 Merck & Co., Inc. Transgenic animal expressing a familial form of human amyloid precursor protein
US6111166A (en) 1994-09-19 2000-08-29 Medarex, Incorporated Transgenic mice expressing human Fcα and β receptors
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US5880327A (en) 1994-09-21 1999-03-09 American National Red Cross Transgenic mammals expressing human coagulation factor VIII
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US6187992B1 (en) 1994-12-05 2001-02-13 Merck & Co., Inc. Transgenic mouse having a disrupted amyloid precursor protein gene
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US6093562A (en) 1996-02-05 2000-07-25 Novo Nordisk A/S Amylase variants
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
CA2223103A1 (en) 1995-06-06 1996-12-12 Isis Pharmaceuticals Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
JPH11504974A (ja) 1995-06-07 1999-05-11 オア,ウィリアム,シー. 蒸気相燃焼法および組成物ii
CA2225475A1 (en) 1995-06-27 1997-01-16 Unilever Plc Immobilized enzyme and its use for the processing of triglyceride oils
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
DE19527274A1 (de) * 1995-07-26 1997-01-30 Metallgesellschaft Ag Enzymatisches Verfahren zur Entschleimung von pflanzlichen Ölen mit Aspergillus-Phospholipase
SE504664C2 (sv) 1995-09-22 1997-03-24 Scotia Lipidteknik Ab Sätt att framställa fraktionerad olja, oljan, dess användning samt emulsionskomposition innehållande oljan
US5721118A (en) 1995-10-31 1998-02-24 The Regents Of The University Of California, San Diego Mammalian artificial chromosomes and methods of using same
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US6238884B1 (en) 1995-12-07 2001-05-29 Diversa Corporation End selection in directed evolution
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US6022963A (en) 1995-12-15 2000-02-08 Affymetrix, Inc. Synthesis of oligonucleotide arrays using photocleavable protecting groups
US6013440A (en) 1996-03-11 2000-01-11 Affymetrix, Inc. Nucleic acid affinity columns
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6025155A (en) 1996-04-10 2000-02-15 Chromos Molecular Systems, Inc. Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes
US6197070B1 (en) 1996-05-15 2001-03-06 The Procter & Gamble Company Detergent compositions comprising alpha combination of α-amylases for malodor stripping
US6057100A (en) 1996-06-07 2000-05-02 Eos Biotechnology, Inc. Oligonucleotide arrays
US6326341B1 (en) 1996-09-11 2001-12-04 The Procter & Gamble Company Low foaming automatic dishwashing compositions
US6127137A (en) 1996-10-31 2000-10-03 Novo Nordisk A/S Acidic phospholipase, production and methods using thereof
DE69716711T3 (de) 1996-12-09 2010-06-10 Novozymes A/S Verringerung von phosphorhaltigen Substanzen in Speiseölen mit hohem Anteil an nicht-hydratisierbarem Phosphor unter Verwendung einer Phospholipase, eine Phospholipase aus fädenförmigen Pilz, welche eine Phospholipase A und/oder B-Aktivität aufweist
US6103505A (en) 1996-12-09 2000-08-15 Novo Nordisk A/S Method for reducing phosphorus content of edible oils
BR9713949A (pt) 1996-12-19 2000-03-21 Unilever Nv Processos para a imobilização de uma enzima, para o rearranjo de éster de mono-, di- ou tri-glicerìdeos e para a desacidulacão enzimática de um óleo dima anfifìlica e por uma fosfolipase, e, uso de uma enzima imobilizada.
US6069122A (en) 1997-06-16 2000-05-30 The Procter & Gamble Company Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
DK1717322T3 (da) 1997-01-17 2012-10-22 Codexis Mayflower Holdings Llc Udvikling af hele celler og organismer ved rekursiv sekvensrekombination
DE19703364A1 (de) 1997-01-30 1998-08-06 Henkel Ecolab Gmbh & Co Ohg Pastenförmiges Wasch- und Reinigungsmittel
US6303803B1 (en) 1997-01-31 2001-10-16 Cargill, Incorporated Removal of sterols from fats and oils
US5880300A (en) 1997-01-31 1999-03-09 Cargill, Incorporated Phospholipid-based removal of sterols from fats and oils
ATE418608T1 (de) 1997-03-18 2009-01-15 Novozymes As Methode zur herstellung einer bibliothek mittels dna-shuffling
BR9808368A (pt) 1997-03-18 2000-05-23 Novo Nordisk As Processos para a construção de uma biblioteca de polinucleotideos homólogos recombinados, para a identificação um polipeptìdeo de interesse, e, para a produção de um polipeptìdeo de interesse.
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
WO1999009217A1 (en) 1997-08-15 1999-02-25 Hyseq, Inc. Methods and compositions for detection or quantification of nucleic acid species
ATE319986T1 (de) 1997-09-11 2006-03-15 Bioventures Inc Verfahren zur herstellung von arrays hoher dichte
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
WO1999021979A1 (en) 1997-10-28 1999-05-06 Maxygen, Inc. Human papillomavirus vectors
EP2386568B1 (en) 1997-10-30 2014-08-06 Novozymes A/S Alpha-amylase mutants
EP1030861A4 (en) 1997-10-31 2001-09-05 Maxygen Inc MODIFICATION OF VIRAL TROPISM AND THE DIVERSITY OF HOST SPECIES BY RECOMBINATION OF THE VIRAL GENOME
ATE234913T1 (de) 1997-11-10 2003-04-15 Procter & Gamble Verfahren zur herstellung einer waschmitteltablette
EP0921189B1 (en) 1997-11-14 2005-01-12 Sankyo Company Limited Transgenic animal allergy models and methods for their use
EP1036198B1 (en) 1997-12-08 2012-09-26 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
EP1053343A2 (en) 1998-02-11 2000-11-22 Maxygen, Inc. Targeting of genetic vaccine vectors
EP1054973A1 (en) 1998-02-11 2000-11-29 Maxygen, Inc. Antigen library immunization
ATE340870T1 (de) 1998-04-03 2006-10-15 Compound Therapeutics Inc Adressierbare protein arrays
US6156952A (en) 1998-04-09 2000-12-05 Constituent Institution Of The University Of Maryland System HIV transgenic animals and uses therefor
AU3408199A (en) 1998-05-01 1999-11-23 Novo Nordisk A/S Enhancers such as n-hydroxyacetanilide
US6048695A (en) 1998-05-04 2000-04-11 Baylor College Of Medicine Chemically modified nucleic acids and methods for coupling nucleic acids to solid support
DE19824705A1 (de) 1998-06-03 1999-12-09 Henkel Kgaa Amylase und Protease enthaltende Wasch- und Reinigungsmittel
US6022567A (en) 1998-06-23 2000-02-08 Nestec S.A. Flavor enhancer
CN1308683A (zh) 1998-06-29 2001-08-15 菲洛斯公司 用于产生高多样性文库的方法
JP4335995B2 (ja) 1998-07-22 2009-09-30 昭 神谷 環境保全型粒状洗浄用組成物
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
US6183962B1 (en) 1998-09-09 2001-02-06 Millennium Pharmaceuticals, Inc. Protein kinase molecules and uses therefor
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6642426B1 (en) 1998-10-05 2003-11-04 David L. Johnson Fluid-bed aromatics alkylation with staged injection of alkylating agents
US6172248B1 (en) * 1998-11-20 2001-01-09 Ip Holdings, L.L.C. Methods for refining vegetable oils and byproducts thereof
US6277489B1 (en) 1998-12-04 2001-08-21 The Regents Of The University Of California Support for high performance affinity chromatography and other uses
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
EP1100895B1 (en) 1999-03-15 2007-06-13 University of British Columbia Abc1 polypeptide and methods and reagents for modulating cholesterol levels
ATE289482T1 (de) 1999-03-16 2005-03-15 Novozymes As Verfahren zur herstellung von käse
US6399121B1 (en) 1999-03-16 2002-06-04 Novozymes A/S Process for producing cheese
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
US6309871B1 (en) 1999-03-31 2001-10-30 Novozymes A/S Polypeptides having alkaline α-amylase activity
US6221653B1 (en) 1999-04-27 2001-04-24 Agilent Technologies, Inc. Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
EP1106603A3 (en) 1999-12-06 2003-11-19 Fuji Photo Film Co., Ltd. DNA chip and reactive solid carrier
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
CA2425671A1 (en) 2000-10-12 2002-04-18 Exelixis, Inc. Human ect2 and methods of use
US6309872B1 (en) 2000-11-01 2001-10-30 Novozymes Biotech, Inc Polypeptides having glucoamylase activity and nucleic acids encoding same
US6660491B2 (en) * 2000-11-24 2003-12-09 Ikeda Food Research Co., Ltd. Process for producing dietary sterol fatty acid esters
WO2003070013A1 (en) 2002-02-20 2003-08-28 Novozymes A/S Process for producing cheese
US7226771B2 (en) * 2002-04-19 2007-06-05 Diversa Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
DK2853593T3 (en) 2003-03-07 2018-01-08 Dsm Ip Assets Bv Hydrolases, nucleic acids encoding them, and processes for their preparation and use
WO2006096834A2 (en) 2005-03-08 2006-09-14 Diversa Corporation Hydrolases, nucleic acids encoding them and methods for improving paper strength
AU2014284148B2 (en) 2013-06-21 2017-02-23 Bio-Rad Laboratories, Inc. Microfluidic system with fluid pickups

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1235636A (zh) * 1996-10-31 1999-11-17 诺沃挪第克公司 新型磷脂酶,及其生产和应用
CN1293706A (zh) * 1998-04-08 2001-05-02 诺维信公司 一种酶促油脱胶的方法
WO2003089620A2 (en) * 2002-04-19 2003-10-30 Diversa Corporation Phospholipases, nucleic acids encoding them and methods for making and using them

Also Published As

Publication number Publication date
AU2005221136A1 (en) 2005-09-22
WO2005086900A3 (en) 2009-04-02
HUE030573T2 (en) 2017-05-29
EP1748954A4 (en) 2009-10-28
US20050108789A1 (en) 2005-05-19
CA2559060C (en) 2017-09-05
PT1748954T (pt) 2016-11-21
US20080317731A1 (en) 2008-12-25
US7226771B2 (en) 2007-06-05
JP2011172583A (ja) 2011-09-08
JP2007531516A (ja) 2007-11-08
CN101426918A (zh) 2009-05-06
EP1748954B1 (en) 2016-08-17
EP1748954A2 (en) 2007-02-07
ES2601431T3 (es) 2017-02-15
PL1748954T3 (pl) 2017-02-28
US7977080B2 (en) 2011-07-12
AU2005221136B2 (en) 2011-06-09
WO2005086900A2 (en) 2005-09-22
BRPI0508559B1 (pt) 2019-12-10
EP3190182A1 (en) 2017-07-12
CA2559060A1 (en) 2005-09-22
BRPI0508559A (pt) 2007-08-14

Similar Documents

Publication Publication Date Title
CN101426918B (zh) 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
CN101558154B (zh) 磷脂酶、编码它们的核酸及其制备和应用方法
CN102712671B (zh) 磷脂酶、编码其的核酸以及制备和使用它们的方法
CA2481411C (en) Phospholipases, nucleic acids encoding them and methods for making and using them
US9512382B2 (en) Oil degumming methods
CN102325891B (zh) 水解酶、编码它们的核酸及制备和使用它们的方法
CN103173282A (zh) 对叶绿素进行酶促脱色的组合物和方法
US20120100581A1 (en) Phospholipases, nucleic acids encoding them and methods for making and using them
CN102197043A (zh) 水解酶、编码它们的核酸及其制备和应用方法
AU2011218662B2 (en) Phospholipases, nucleic acids encoding them and methods for making and using them

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: WIRAINIM CO.,LTD.

Free format text: FORMER OWNER: DIVERSA CORP.

Effective date: 20091113

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20091113

Address after: California, USA

Applicant after: VERENIUM Corp.

Address before: California, USA

Applicant before: Diversa Corp.

ASS Succession or assignment of patent right

Owner name: DISIMAN FOOD MAJOR CO., LTD.

Free format text: FORMER OWNER: DIVERSA CORP.

Effective date: 20130216

Owner name: DSM IP ASSETS BV

Free format text: FORMER OWNER: DISIMAN FOOD MAJOR CO., LTD.

Effective date: 20130216

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130216

Address after: Holland Heerlen

Applicant after: DSM food professional Co.,Ltd.

Address before: California, USA

Applicant before: VERENIUM Corp.

Effective date of registration: 20130216

Address after: Holland Heerlen

Applicant after: DSM IP ASSETS B.V.

Address before: Holland Heerlen

Applicant before: DSM food professional Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant