CN101558154B - 磷脂酶、编码它们的核酸及其制备和应用方法 - Google Patents

磷脂酶、编码它们的核酸及其制备和应用方法 Download PDF

Info

Publication number
CN101558154B
CN101558154B CN200780042983.3A CN200780042983A CN101558154B CN 101558154 B CN101558154 B CN 101558154B CN 200780042983 A CN200780042983 A CN 200780042983A CN 101558154 B CN101558154 B CN 101558154B
Authority
CN
China
Prior art keywords
polypeptide
sequence
nucleic acid
oil
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200780042983.3A
Other languages
English (en)
Other versions
CN101558154A (zh
Inventor
E·奥多诺谷
N·R·巴尔顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dsm Food Professional Co ltd
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN101558154A publication Critical patent/CN101558154A/zh
Application granted granted Critical
Publication of CN101558154B publication Critical patent/CN101558154B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • C12N9/20Triglyceride splitting, e.g. by means of lipase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/649Biodiesel, i.e. fatty acid alkyl esters
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6418Fatty acids by hydrolysis of fatty acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • C12P7/6458Glycerides by transesterification, e.g. interesterification, ester interchange, alcoholysis or acidolysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6436Fatty acid esters
    • C12P7/6445Glycerides
    • C12P7/6481Phosphoglycerides
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明提供了具有磷脂酶活性的新型多肽、编码它们的核酸和与它们结合的抗体,所述磷脂酶活性包括,例如,磷脂酶A、B、C和D活性,马铃薯块茎蛋白活性,磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)活性。也提供包括应用这些磷脂酶的工业方法,如,油脱胶,以及包括应用这些磷脂酶的产品。

Description

磷脂酶、编码它们的核酸及其制备和应用方法
参考通过EFS-WEB提交的序列表
本申请通过USPTOEFS-WEB服务器电子提交,如在MPEP§1730II.B.2.(a)(A)所批准并阐明的,并且该电子提交包括电子提交的序列(SEQID)表;该序列表的全部内容通过引用并入本文用于所有目的。序列表根据如下电子提交的.txt文件确定:
文件名 创建日期 大小
564462015940seqlist.txt 2007年9月20日 422,053字节
发明领域
总体上说,本发明涉及磷脂酶、编码磷脂酶的多核苷酸、制备以及使用这些多核苷酸和多肽的方法。特别地,本发明提供了具有磷脂酶活性的新颖多肽、编码它们的核酸以及与它们结合的抗体。也提供了包括应用这些磷脂酶的工业方法和产品。
背景技术
磷脂酶是水解磷脂中的酯键的酶。与它们在磷脂代谢中的重要性相对应,这些酶广泛存在于真核和原核细胞中。磷脂酶影响生物膜的代谢、形成和再组织,并且磷脂酶也参与信号的级联作用。已经知道了几种类型的磷脂酶,按照磷脂分子中受到攻击的键的位置,它们在特异性上有所不同。磷脂酶A1(PLA1)除去1-位的脂肪酸,产生游离的脂肪酸和1-溶血-2-酰基磷脂(1-lyso-2-acylphospholipid)。磷脂酶A2(PLA2)去除2-位的脂肪酸,产生游离的脂肪酸和1-酰基-2-溶血磷脂(1-acyl-2-lysophospholipid)。PLA1和PLA2酶可以是胞内酶或胞外酶,是膜结合的酶或者可溶性酶。发现胞内的PLA2存在于几乎所有的哺乳动物细胞中。磷脂酶C(PLC)去除磷酸部分,产生1,2二酰基甘油和磷酸酯。磷脂酶D(PLD)产生1,2-二酰基甘油磷酸和碱性基团(basegroup)。PLC和PLD对于细胞功能和信号传导是重要的。PLD是生物催化中主要的磷脂酶(参见,如,Godfrey,T.和WestS.(1996)Industrialenzymology,299-300,StocktonPress,NewYork)。马铃薯块茎储藏蛋白(Patatins)是另一类磷脂酶,据认为其作用如同PLA(参见例如,HirschbergHJ,等,(2001),EurJBiochem268(19):5037-44)。
常见的含油种子,如大豆、油菜籽、向日葵籽、米糠油、芝麻和花生被用作油的来源和原料。在榨油过程中,种子被机械和热处理。用溶剂从粗粉(meal)中分离和分开油。然后应用蒸馏法,从油中分离出溶剂并回收。油经过“脱胶(degummed)”并且进行精炼。粗粉中的溶剂组分可以通过“脱溶剂烤炉(desolventizertoaster)”的热处理而蒸发掉,随后,粗粉干燥和冷却。当溶剂通过蒸馏分离掉以后,产生的粗油利用特殊的脱胶程序和物理精炼的方法加工成为食用油。它也可以作为原料用于产生脂肪酸和甲基酯。粗粉可以用做动物饲料(animalrations)。
脱胶是植物油精炼的第一步,脱胶的目的是去除与油一起被抽提、但干扰随后的油加工的污染磷脂。这些磷脂仅仅以无水形式溶于植物油中,如果简单地被水合,磷脂可以被沉淀并去除。水合作用一般通过小比例的水与充分干燥的油连续混合来完成。典型地,水的量是磷脂含量的75%,磷脂的量典型地是1到1.5%。虽然在50℃到80℃的范围内,油的粘度降低,水合胶的分离效果更好,但是温度条件并不非常严格。
很多油脱胶(oildegumming)的方法目前都在使用。油脱胶的过程可以通过使用磷脂酶酶法协助进行。磷脂酶A1和A2已经在各种商业方法中用于油脱胶,如“ENZYMAXTM脱胶”(LurgiLifeScienceTechnologiesGmbH,Germany)。也已经考虑将磷脂酶C(PLC)应用于油的脱胶作用,因为磷脂酶C在磷脂上作用产生的磷酸盐部分是极易溶于水的,并且容易去除,而且甘油二酯会与油在一起,降低了损失;参见,如Godfrey,T.和WestS.(1996)IndustrialEnzymology第299-300页,StocktonPress,NewYork;Dahlke(1998)“Anenzymaticprocessforthephysicalrefiningofseedoils,”Chem.Eng.Technol.21:278-281;Clausen(2001)“Enzymaticoildegummingbyanovelmicrobialphospholipase,”Eur.J.LipidSci.Technol.103:333-340。
高磷脂油,例如黄豆、油菜和向日葵油的处理方法不同于别的油如棕榈的处理方法。不像低磷脂油的蒸气或“物理精炼”处理,这些高磷油需要特别的化学和机械处理,以去除含磷的磷脂。这些油一般在这样的过程中化学精炼,该过程必需中和游离脂肪酸,以形成皂和不溶性的胶成分。中和过程对于去除游离脂肪酸和磷脂非常有效,但是该过程也导致产率和质量显著降低。在一些情况下,高磷脂的粗制油在碱中和之前的步骤中进行脱胶。用于卵磷脂的大豆油就是这种情况,其中的油首先用水或者酸来脱胶。
植物固醇(phytosterols)(植物甾醇(plantsterols))是天然产物三萜家族的成员,其包括100种以上不同的植物固醇和4000种以上其它种类的三萜。一般而言,据认为,植物甾醇是由于甾醇/磷脂配给量增加导致膜硬化,从而稳定植物膜。在化学上,植物甾醇在结构上非常类似于胆固醇,并被认为调节植物膜的膜流动性,如胆固醇在动物膜中所做的那样。主要的植物甾醇是β-谷甾醇、菜油甾醇和豆甾醇。其它的植物甾醇包括豆甾烯醇(二氢β-谷甾醇)、二氢谷甾醇、24-脱氢胆固醇、二氢菜油甾醇、海绵甾醇(chalinasterol)、多孔甾醇、γ-谷甾醇和菜籽甾醇。
植物甾醇是健康和营养行业中的重要的农产品。它们是用于制造化妆品的有用乳化剂并且为激素药物的生产提供大多数甾体中间体和前体。植物甾醇的饱和类似物以及它们的酯已经被认为是益于心血管健康的有效的降低胆固醇的试剂。植物甾醇通过在肠腔中抑制胆固醇的吸收来降低血清胆固醇水平,并且植物甾醇在极低的浓度时便具有免疫调节特性,包括T淋巴细胞的增强的细胞应答和抗癌细胞系的天然杀伤细胞的细胞毒性能力。此外,它们的治疗效应已在治疗肺结核、风湿性关节炎、控制HIV感染的病人和抑制马拉松选手的免疫压力的临床研究中已经得到证明。
植物甾醇的酯类,也指植物甾醇酯,由美国食品药品管理局(FDA)批准为GRAS(一般认为安全,GenerallyRecognizedAsSafe),用于人造黄油,并在1999年得到推广。2000年9月,FDA也提出一个试行规定,该规定准许了含有植物甾醇酯类的食品使用健康声明标记(health-claiminglabeling)。因此,用植物甾醇酯类强化的食品非常有望受到消费者的青睐。
大豆油被广泛使用,是重要的粮食,占来自种子和水果的油产量的约30%。大豆仅含有20%的油,在商业规模上通常通过使用溶剂诸如己烷来提取。其油公认的质量和粗粉蛋白的营养价值使得大豆成为首要的含油种子。在提取之前,大豆必需清洗,破碎并去皮,这是因为对油来说有效的溶剂提取需要破碎每一个油细胞以提高物质转移水平。细胞壁主要由纤维素——其与半纤维素相关、果胶物质和木质素组成,细胞壁也可以用酶破碎,以显著提高提取产量和速度。
二酰甘油(DAG)油是食用油,比天然脂肪酸含有80%或更多的DAG。已经显示,在人中,消化DAG油乳剂之后,相比具有类似的脂肪酸组成的TAG油,餐后乳糜微粒中的甘油三脂的升高水平明显较低。在以日本男子和美国男子和女子为对象的研究中,长期食用DAG油促进体重减轻和身体脂肪减少。一项研究显示,用DAG油取代普通的烹饪油降低肥胖和其它危险因素的发生率。
发明概述
本发明提供包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或者更多个的残基范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的核酸序列的分离的、合成的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶(PL)活性的至少一种多肽,所述磷脂酶活性例如磷脂酶A(PLA)、磷脂酶C(PLC)或磷脂酶D(PLD)活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。一方面,所述序列同一性通过用序列比较算法分析或者通过目测检查来确定。
本发明提供包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850更多个连续残基范围内具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)序列同一性的核酸序列的分离的、合成的或者重组的核酸,在一个方面所述核酸编码具有磷脂酶(PL)活性的至少一种多肽,所述磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。一方面,所述序列同一性通过用序列比较算法分析或者通过目测检查来确定。
在可选的方面,分离的、合成的或者重组的核酸编码这样的多肽,其包括具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中列出的序列。一方面,这些多肽具有磷脂酶,例如磷脂酶A、B、C或D的活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性-作为多功能活性。
在一方面,序列比较算法是BLAST算法,如BLAST2.2.2版算法。一方面,过滤设置(filteringsetting)设为blastall-p,blastp-d“nrpataa”-FF,所有其它选项设为默认值。
在可选的方面,分离的、合成的或者重组的核酸编码这样的多肽,其具有磷脂酶活性,但缺少:信号序列或原蛋白序列(proproteinsequences)、或者同源启动子序列;或者本发明的核酸(多核苷酸)编码具有磷脂酶活性以及进一步包括异源氨基酸序列的多肽,或者本发明的核酸(多核苷酸)包括异源核苷酸序列;或者本发明的核酸(多核苷酸)包括由编码异源(前导)信号序列、或标记或表位的序列,或由编码异源(前导)信号序列、或标记或表位的序列组成,或者异源核苷酸序列包括异源启动子序列;或者本发明的核酸(多核苷酸)包括编码异源(前导)信号序列的异源核苷酸序列,其包括N-末端和/或C-末端延伸或由N-末端和/或C-末端延伸组成,用于靶向至内质网(ER)或内膜、或者靶向至植物内质网(ER)或内膜系统,或者该异源序列编码限制性位点;或者本发明的核酸(多核苷酸)包括异源启动子序列,其包括组成型或诱导型启动子、或者细胞类型特异性启动子、或者植物特异性启动子或者细菌特异性启动子,或由这些启动子组成。
一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽(anoilseed)的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性;或马铃薯块茎蛋白(patatin)活性,或其组合。磷脂酶活性可以包括水解糖蛋白,例如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。一方面,本发明的磷脂酶可以具有多功能的活性,例如本文中描述的一种或多种酶活性的组合,例如本发明的磷脂酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB和patatin活性;PLC和patatin活性;PLD和PLA;PLD、PLA、PLB和PLC活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或其任意组合。
例如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影响中性油(甘油三酯)部分的任何酶活性。在特定的方法中使用这种多肽可能是有利的,例如在脱胶方法中,中性油部分不受损(不减少,例如不水解)是重要的。因此,一方面,本发明提供了脱胶方法,该方法包括使用本发明的具有磷脂酶活性但不具有脂酶活性的多肽。
一方面,分离的、合成的或重组的核酸编码具有磷脂酶活性的多肽,其是热稳定性的。例如本发明的多肽,举例来说——例如本发明的变体或者进化的酶,例如SEQIDNO:2、SEQIDNO:175、SEQIDNO:176、SEQIDNO:177和SEQIDNO:178的具体变异,如表5和实施例4所述——可以是热稳定性的。根据本发明的热稳定性多肽可在包括温度范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约37℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高温度的条件下,保持结合和/或酶活性,例如磷脂酶活性。根据本发明的热稳定性多肽可在范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃的温度、或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高的温度中,保持活性,例如磷脂酶活性。在一些实施方式中,根据本发明的热稳定性多肽在上述温度范围,在约pH3.0、约pH3.5、约pH4.0、约pH4.5、约pH5.0、约pH5.5、约pH6.0、约pH6.5、约pH7.0、约pH7.5、约pH8.0、约pH8.5、约pH9.0、约pH9.5、约pH10.0、约pH10.5、约pH11.0、约pH11.5、约pH12.0或更高pH下,保持活性,例如磷脂酶活性。
在另一个方面,分离的、合成的或重组的核酸编码具有磷脂酶活性的多肽,其是耐热的。例如本发明的多肽,举例来说——例如本发明的变体或者进化的酶,例如SEQIDNO:2、SEQIDNO:175、SEQIDNO:176、SEQIDNO:177和SEQIDNO:178的具体变异,如表5和实施例4和7所述——是耐热的或热活性的。根据本发明的耐热多肽可在暴露于包括温度范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高温度的条件后,保持结合和/或酶活性,例如磷脂酶活性。根据本发明的耐热多肽可在暴露于范围约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃的温度、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高的温度后,保持活性,例如磷脂酶活性。一方面,该多肽在pH4.5下暴露于高于90℃至约95℃范围的温度后,保持磷脂酶或其它活性。
一方面,分离的、合成的或重组的核酸包括在严格条件下,与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所示序列杂交的序列,其中该核酸编码具有磷脂酶活性的多肽。如本文所述,核酸的长度上可以为至少大约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850个或更多残基或者是基因或者转录体的全长,具有或者不具有信号序列。如此处所述,严格条件可以是高度严格、中度严格或者低严格性。严格条件可以包括洗涤步骤,如,包括在0.2×SSC,大约65℃的温度下洗涤大约15分钟的洗涤步骤。
本发明提供用于鉴定编码具有磷脂酶,例如磷脂酶活性的多肽的核酸的核酸探针,其中该探针包括本发明的序列,例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所示序列的至少10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850个或者更多的连续碱基,并且该探针通过结合或者杂交鉴定核酸。该探针可包括寡核苷酸,该寡核苷酸包括根据本发明序列的约10-100个之间的连续碱基,或者是其片段或子序列,例如在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所示序列的10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基或者更多碱基,或任何所期望的长度。
本发明提供了用于鉴定编码具有磷脂酶,如磷脂酶活性多肽的核酸的核酸探针,其中该探针包括本发明的核酸,例如在至少大约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850或者更多连续残基的范围内,与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所示的序列或者它们的子序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全的(100%)的序列同一性的核酸,并且一方面,序列同一性通过序列比较算法分析或者通过目测检查确定。
本发明提供用于扩增编码具有磷脂酶活性多肽的核酸的扩增引物序列对,其中该引物对能够扩增包括本发明的序列或者片段或者其子序列的核酸。一个或每一个扩增引物序列对的成员可以包括含有该序列至少大约10到50个连续碱基,或者该序列大约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、或者25个或更多个连续碱基的寡核苷酸。
本发明提供扩增引物对,其中该引物对包括第一成员和第二成员,其中第一成员具有本发明核酸的大约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24、或者25个或更多个残基所示的序列,第二成员具有第一成员互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个或更多个残基所示的序列。
本发明提供了使用本发明的扩增引物对通过扩增,例如聚合酶链式反应(PCR)产生的磷脂酶。本发明提供了应用发明的扩增引物对通过扩增,例如聚合酶链式反应(PCR)制备磷脂酶的方法。一方面,扩增引物对扩增来自文库的核酸,例如基因文库,如环境文库。
本发明提供了扩增编码具有磷脂酶活性的多肽的核酸的方法,包括用能够扩增本发明核酸序列或者片段或者其子序列的扩增引物序列对来扩增模板核酸序列。该扩增引物对可以是本发明的扩增引物对。
本发明提供包括本发明的核酸或者其子序列的表达盒(expressioncassettes)。一方面,表达盒可以包括可操作性地连接于启动子的核酸。启动子可以是病毒的、细菌的、哺乳动物的或者植物的启动子。一方面,植物启动子可以是马铃薯、水稻、玉米、小麦、烟草或者大麦启动子。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面,启动子可以是诱导型启动子。一方面,启动子可以是组织特异性启动子或者环境调控或者发育调控的启动子。因此,启动子可以是,例如种子特异性、叶特异性、根特异性、茎特异性或者脱落诱导启动子。一方面,表达盒可以进一步包括植物表达载体或者植物病毒表达载体。
本发明提供包括本发明的表达盒(如载体)或者本发明的核酸的克隆载体。克隆载体可以是病毒载体、质粒、噬菌体、噬菌粒(phagemid)、粘粒、F粘粒(fosmid)、细菌噬菌体或者人工染色体。病毒载体可以包括腺病毒载体,逆转录病毒载体或者腺相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1衍生载体(PAC)、酵母人工染色体(YAC)、或者哺乳动物人工染色体(MAC)。
本发明提供含有本发明核酸或者本发明表达盒(如,载体)或者本发明克隆载体的转化细胞。一方面,转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或者植物细胞。一方面,植物细胞可以是马铃薯、小麦、水稻、玉米、烟草或者大麦细胞。
本发明提供包括本发明的核酸或者本发明的表达盒(如,载体)的转基因非-人类动物。在一方面,动物是小鼠、大鼠、兔、羊、猪或奶牛或其它哺乳动物。
本发明提供包括本发明的核酸或者本发明的表达盒(如,载体)的转基因植物。转基因植物可以是玉米植物、马铃薯植物、番茄植物、小麦植物、油籽植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。本发明提供包括本发明的核酸或本发明的表达盒(例如,载体)的转基因种子。转基因种子可以是玉米种子、小麦仁、油籽、油菜籽(油菜植物)、大豆种子、棕榈仁、向日葵种子、芝麻种子、花生、水稻或烟草植物种子。
本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。
本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。反义寡核苷酸的长度可以是大约10到50、大约20到60、大约30到70、大约40到80、大约60到100、大约70到110或者大约80到120个碱基。
本发明提供抑制磷脂酶如细胞内磷脂酶信使翻译的方法,该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的核酸杂交的核酸序列的反义寡核苷酸。本发明提供包括本发明序列的子序列的双链抑制性RNA(RNAi)分子。在一方面,RNAi长度是大约15、16、17、18、19、20、21、22、23、24、25或者更多的双链核苷酸。本发明提供抑制磷脂酶如细胞内磷脂酶表达的方法,该方法包括向细胞施用或者在细胞中表达双链抑制性RNA(RNAi),其中该RNA包括本发明序列的子序列。
本发明提供了分离的、合成的或重组的多肽,该多肽包含与本发明示例性的多肽或肽(例如具有一个或多个E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R突变的SEQIDNO:175或SEQIDNO:176)在多肽的至少大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、125、150、175、200、225、250、275、300、325、350、400、450、500、550或600或更多残基,或多肽的全长范围内,具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,或更大,或完全的(100%)序列同一性的氨基酸序列;并且,一方面,序列同一性通过序列比较算法分析或者通过目测观察来确定。
一方面,本发明提供包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176具有至少大约81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的、合成的或者重组的多肽。
本发明提供由本发明的核酸编码的分离的、合成的或者重组的多肽。在可选的方面,多肽可以具有如在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176中所示的序列。多肽可以具有磷脂酶活性,如磷脂酶A、B、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。例如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影响中性油(甘油三酯)部分的任何酶活性。一方面,本发明提供了脱胶方法,该方法包括使用具有磷脂酶活性但不具有脂酶活性的本发明的多肽,这样在脱胶方法中,任何中性油部分不受损害(减少、改变、降解,例如水解)。
在可选的方面,本发明的多肽具有磷脂酶活性,但缺乏:信号序列或原蛋白序列;或者,具有磷脂酶活性以及进一步包括异源氨基酸序列,或者本发明的核酸(多核苷酸)包括异源核苷酸序列。一方面,异源氨基酸序列包括编码异源(前导)信号序列、或标记或表位的序列、或由之组成,或者异源核苷酸序列包括异源启动子序列;一方面,异源(前导)信号序列包括N-末端和/或C-末端延伸或由之组成,其用于靶向至内质网(ER)或内膜、或者靶向至植物内质网(ER)或内膜系统,或者该异源序列编码限制性位点。
本发明提供了含有缺乏信号序列的本发明多肽的分离的、合成的或者重组的多肽。一方面,缺乏信号肽的多肽与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176的残基30到287具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多序列同一性。序列同一性通过序列比较算法分析或者通过目测观察确定。
本发明的另一方面提供分离的、合成的或者重组的多肽或者肽,该分离的、合成的或者重组的多肽或者肽包括本发明的多肽或肽序列、与之基本相同的序列,和与之互补的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或者100或者更多的连续碱基。该肽可以是,例如,免疫源性的片段、基序(如结合位点)或者活性位点。
一方面,本发明分离的、合成的或重组的多肽(有或无信号序列)具有磷脂酶活性。一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性,或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性;或patatin活性,或其组合。例如,一方面,磷脂酶活性包括本文中描述的一种或多种酶活性的组合,例如磷脂酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB和patatin活性;PLC和patatin活性;PLD和PLA;PLD、PLA、PLB和PLC活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或其任意组合。
磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。
一方面,分离的、合成的或者重组的多肽可以包括缺乏信号序列的本发明的多肽。一方面,分离的、合成的或者重组的多肽可以包括含有异源信号序列,如异源磷脂酶或者非-磷脂酶信号序列的本发明多肽。
一方面,本发明提供包括第一结构域和至少第二结构域的嵌合蛋白,第一结构域包括本发明的信号序列。该蛋白可以是融合蛋白。第二结构域可以包括酶。酶可以是磷脂酶。
本发明提供包括至少第一结构域和至少第二结构域的嵌合多肽,第一结构域包括发明的信号肽(SP)或本发明磷脂酶的催化结构域(CD),或活性位点,第二结构域包括异源多肽或肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。一方面,异源多肽或者肽不是磷脂酶。异源多肽或者肽可以在信号肽(SP)或者催化结构域(CD)的氨基末端,羧基末端或者羧基和氨基末端。
本发明提供编码嵌合多肽的分离的、合成的或者重组的核酸,其中嵌合多肽包括至少第一结构域和至少第二结构域,第一结构域含有本发明多肽的信号肽(SP)或者催化结构域(CD)或者活性位点,第二结构域包括异源多肽或者肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。
一方面,磷脂酶活性包括在大约37℃下,每毫克蛋白大约10到大约100单位范围的比活性。另一方面,磷脂酶活性包括每毫克蛋白大约100到大约1000单位,大约500到大约750单位范围的比活性。可选地,磷脂酶活性包括在37℃下每毫克蛋白大约100到大约500单位的比活性。在一方面,磷脂酶活性包括在37℃下每毫克蛋白大约500到大约1200单位的比活性。另一方面,磷脂酶活性包括在37℃下每毫克蛋白大约750到大约1000单位的比活性。另一方面,耐热性包含经加热至升高的温度以后,在37℃下仍保持磷脂酶至少一半的比活性。可选地,耐热性包含经加热至升高的温度——例如约0℃至约20℃、约20℃至约37℃、约37℃至约50℃、约50℃至约70℃、约70℃至约75℃、约75℃至约80℃、约80℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约110℃或更高的温度以后,在37℃下仍保持每毫克蛋白大约500到大约1200单位的比活性。可选地,耐热性可包括经加热至升高的温度以后,在37℃下仍保持每毫克蛋白大约1至大约1200单位、或每毫克蛋白大约500至大约1000单位的比活性。另一方面,耐热性可包括经加热至如上所述的升高的温度以后,在37℃下仍保持每毫克蛋白大约1至大约500单位的比活性。
本发明提供本发明分离的、合成的或者重组的多肽,其中多肽包括至少一个糖基化位点。一方面,糖基化可以是N-连接糖基化。一方面,多肽可以是在巴斯德毕赤酵母(P.pastoris)或者粟酒裂殖酵母(S.pombe)中表达后进行糖基化。
本发明提供了磷脂酶和编码它们的核酸,该磷脂酶具有本发明任何示例性磷脂酶的序列,其中一个或多个或所有糖基化位点被改变,如上所述。因此,本发明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方法,其中该方法包括修饰本发明的磷脂酶编码序列,这样,一个、多个或所有N-连接的糖基化位点编码基序被修改为非糖基化基序。本发明也提供了由该方法制得的磷脂酶编码序列,和它们编码的酶。
本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有增加的耐受性的磷脂酶,该方法包括将等同于具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176的位置131的氨基酸修改成一个、多个或所有下述残基:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);蛋氨酸(M);亮氨酸(L)。本发明也提供由该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。
本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有减少的耐受性的磷脂酶,该方法包括将等同于具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171、VE41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176的位置131的氨基酸修改成一个、多个或所有下述残基:色氨酸(W);谷氨酸(E);酪氨酸(Y)。本发明也提供由该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。
本发明提供包括本发明多肽的蛋白制备物,其中蛋白制备物包括液体、固体或者凝胶制备物。
本发明提供包括本发明多肽和第二种蛋白或者结构域的异源二聚体。异源二聚体的第二个成员可以是不同的磷脂酶、不同的酶或者另一种蛋白。在一方面,第二个结构域可以是多肽,且异源二聚体可以是融合蛋白。在一方面,第二个结构域可以是表位(抗原决定簇)或者标记。在一方面,本发明提供包括本发明多肽的同源二聚体。
本发明提供具有磷脂酶活性的固定化多肽,其中多肽包含本发明的多肽,本发明核酸编码的多肽,或者包括本发明多肽和第二个结构域的多肽(例如融合蛋白)。在一方面,本发明多肽固定在细胞、细胞小泡、脂质体、薄膜(film)、膜(membrane)、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、晶体、片剂、丸、胶囊、粉末、附聚物、表面、多孔结构、阵列或者毛细管上。一方面,本发明的多肽固定在物质诸如谷物、果壳、树皮、皮、毛发、釉质、骨、壳和由它们衍生的物质,或动物饲料物质,或其组合上。
本发明的多肽(例如磷脂酶)也可以单独存在或以磷脂酶混合物或磷脂酶与其它水解酶混合物的形式存在,其它水解酶诸如纤维素酶、木聚糖酶、蛋白酶、脂酶、淀粉酶、或氧化还原酶如漆酶、过氧化物酶、过氧化氢酶、氧化酶或还原酶。它们可以配制成固体形式如粉末、冻干制剂、颗粒、片剂、条、晶体、胶囊、丸、丸粒,或液体形式如水溶液、气溶胶、凝胶、糊、浆、水/油乳状液、乳剂、胶囊、小泡或胶束悬浮液。一方面,本发明的这些制剂可以包括任何下述组分或它们的组合:多元醇如聚乙二醇、聚乙烯醇、丙三醇,糖类如蔗糖、山梨醇、海藻糖、葡萄糖、果糖、麦芽糖;胶凝剂如瓜尔树胶、鹿角菜胶、藻酸盐、葡聚糖、纤维素衍生物、果胶;盐如氯化钠、硫酸钠、硫酸铵、氯化钙、氯化镁、氯化锌、硫酸锌、脂肪酸及其衍生物的盐;金属螯合剂如EDTA、EGTA、柠檬酸钠;抗微生物剂如脂肪酸、其衍生物、对羟基苯甲酸酯、山梨酸酯、苯甲酸盐;抑制蛋白酶作用的其它化合物如大体积蛋白质(bulkprotein),诸如BSA;小麦水解产物;硼酸盐化合物;乳化剂如非离子型和离子型洗涤剂可以单独或组合使用;植物甾醇;维生素;氨基酸;还原剂如半胱氨酸或抗氧化化合物如抗坏血酸可以包括在内以及分散剂。
一方面,交联和蛋白质修饰作用如聚乙二醇化、脂肪酸修饰和糖基化被用于提高本发明多肽的稳定性(例如酶稳定性)。一方面,多元醇和/或糖占制剂的约5%至约60%,或更多,制剂的约10%至约50%、制剂的约20%至约40%、或制剂的约5%至约20%。另一方面,胶凝剂占制剂的约0.5%至约10%、制剂的约1%至约8%、制剂的约2%至约5%、或制剂的约0.5%至约3%。另一方面,盐如氯化钠、硫酸钠、硫酸铵、氯化钙和/或氯化镁占制剂的约1%至约30%、制剂的约2%至约20%、制剂的约5%至约15%、或制剂的约1%至约10%。另一方面,氯化锌以包括约0.1mM至约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂中。又在另一个方面,硫酸锌以包括约0.1mM至约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂中。在另一个方面,脂肪酸和/或其衍生物的盐占制剂的约5%至约40%、制剂的约10%至约30%、制剂的约15%至约25%、或制剂的约5%至约20%。另一方面,金属螯合剂如EDTA、EGTA和/或柠檬酸钠以包括0.1mM至约10mM、约0.5mM至约8mM、约1mM至约5mM或约0.1mM至约1mM的浓度存在于制剂中。另一方面,抗微生物剂如对羟基苯甲酸酯类、山梨酸酯和/或苯甲酸盐占制剂的约0.01%至约10%、制剂的约0.05%至约5%、制剂的约0.1%至约1%、或制剂的约0.05%至约0.5%。又在另一个方面,大体积蛋白质如BSA和/或小麦水解产物占制剂的约1%至约20%、制剂的约5%至约15%、制剂的约2.5%至约7.5%、或制剂的约1%至约5%。另一方面,乳化剂如非离子型和/或离子型洗涤剂以一定浓度存在于制剂中,该浓度包括约1×临界胶束浓度(CMC)至约10×CMC,约2.5×CMC至约7.5×CMC,约1×CMC至约5×CMC,或约3×至约6×CMC。在另一个方面,维生素、氨基酸、还原剂和/或抗氧化化合物占制剂的约0.1%至约5%、制剂的约0.5%至约4%、制剂的约1%至约2.5%、制剂的约0.1%至约1%。
本发明提供包含固定化多肽的阵列,其中多肽是本发明的磷脂酶或者本发明核酸编码的多肽。本发明提供含有本发明的固定化核酸的阵列。本发明提供含有本发明的固定化抗体的阵列。
本发明提供特异性地结合于本发明多肽或者本发明的核酸编码的多肽的分离的、合成的或者重组的抗体。抗体可以是单克隆抗体或者多克隆抗体。本发明提供含有本发明抗体的杂交瘤。
本发明提供分离和鉴定具有磷脂酶活性的多肽的方法,包括以下步骤:(a)提供本发明的抗体;(b)提供含有多肽的样品;以及(c)在抗体能够特异性地结合于该多肽的条件下,将步骤(b)的样品与步骤(a)的抗体接触,从而分离和鉴定磷脂酶。本发明提供制备抗-磷脂酶抗体的方法,包括向非人类动物施用足以产生体液免疫应答的量的本发明核酸或者本发明多肽,从而制备抗磷脂酶抗体。
本发明提供生产重组多肽的方法,包含以下的步骤:(a)提供可操作地连接于启动子的本发明的核酸,以及(b)在允许多肽表达的条件下表达步骤(a)的核酸,从而生产重组多肽。该核酸可以包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176在至少大约100个残基的区域内具有至少85%的序列同一性的序列,其中序列同一性通过序列比较算法分析或者目测观察来确定。核酸可以包括在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的核酸杂交的核酸。该方法可以进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的核酸,从而在转化细胞中生产重组多肽。该方法可以进一步包括把步骤(a)的核酸插入到非人类动物宿主中,随后表达步骤(a)的核酸,从而在非人动物宿主中生产重组多肽。
本发明提供鉴定具有磷脂酶活性的多肽的方法,包括以下的步骤:(a)提供本发明的多肽或由本发明核酸编码的多肽,或其片段或变体,(b)提供磷脂酶底物;和(c)将步骤(a)的多肽或其片段或变体与步骤(b)的底物接触,并检测底物量的增加或者反应产物量的减少,其中底物量的减少或者反应产物量的增加说明检测到了具有磷脂酶活性的多肽。在可选的方面,核酸包括与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178在至少大约100个残基的范围内具有至少85%的序列同一性的序列,其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选的方面,核酸可以在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的序列杂交。
本发明提供确定磷脂酶底物的方法,包括以下步骤:(a)提供本发明的多肽或者本发明核酸编码的多肽;(b)提供测试底物;以及(c)将步骤(a)的多肽与步骤(b)的测试底物接触,检测底物量的增加或者反应产物量的减少,其中底物量的减少或者反应产物量的增加确定测试底物为磷脂酶底物。在可选的方面,核酸可以与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178具有至少85%的序列同一性,其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选的方面,核酸在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的序列杂交。
本发明提供确定化合物是否特异性地与磷脂酶结合的方法,包括以下步骤:(a)在允许核酸翻译成多肽的条件下,表达核酸或者包含该核酸的载体,其中该核酸和载体包括本发明的核酸或者载体;或者,提供本发明的多肽,(b)使多肽与测试化合物接触;和(c)确定测试化合物是否特异性地与多肽结合,从而确定该化合物是否特异地与磷脂酶结合。在可选的方面,核酸序列与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178具有至少85%的序列同一性,其中序列同一性通过序列比较算法分析或者通过目测观察来确定。在可选的方面,核酸在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的序列或其子序列杂交。
本发明提供鉴定磷脂酶活性的调节物的方法,包括以下步骤:(a)提供本发明的多肽或者本发明核酸编码的多肽;(b)提供测试化合物;以及(c)将步骤(a)的多肽与步骤(b)的测试化合物接触;并测定磷脂酶的活性,其中在测试化合物存在的条件下测得的磷脂酶活性与在无测试化合物存在的条件下测得的磷脂酶活性相比的变化证明测试化合物调节磷脂酶的活性。在可选的方面,核酸可以与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178在至少大约100个残基的范围内,具有至少85%的序列同一性,其中序列同一性通过序列比较算法分析或者通过目测观察来确定。在可选的方面,核酸可以在严格的条件下与选自具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178所示的序列或其子序列的核酸序列杂交。
一方面,磷脂酶活性通过提供磷脂酶底物并且检测底物量的增加或者反应产物量的减少来测定。与不存在测试化合物的条件下底物或者反应产物的量相比,在存在测试化合物的条件下,底物量的减少或者反应产物量的增加证明测试化合物是磷脂酶活性的激活剂。与不存在测试化合物的条件下底物或者反应产物的量相比,在存在测试化合物的条件下,底物量的增加或者反应产物量的减少证明测试化合物是磷脂酶活性的抑制剂。
本发明提供包含处理器和数据存储设备的计算机系统,其中所述的数据存储设备上已存储了本发明的多肽序列或者本发明的核酸序列。
一方面,计算机系统可以进一步包括序列比较算法,和其上已经存储了至少一个参照序列的数据存储设备。序列比较算法可以包括表明多态性的计算机程序。计算机系统可以进一步包括鉴定所述序列的一个或者多个特征的鉴定器(anidentifier)。
本发明提供其上已储存了包括本发明多肽序列或本发明核酸序列的序列的计算机可读介质。
本发明提供了鉴定序列中的特征的方法,包括以下步骤:(a)应用鉴定序列的一个或者多个特征的计算机程序来读取序列,其中该序列包括本发明的多肽序列或者本发明的核酸序列;和(b)用计算机程序鉴定序列中的一个或者多个特征。
本发明提供比较第一序列和第二序列的方法,该方法包括以下步骤:(a)应用比较序列的计算机程序读取第一序列和第二序列,其中第一序列包括本发明的多肽序列或者本发明的核酸序列;并且(b)用计算机程序确定第一序列和第二序列间的差异。一方面,确定第一序列和第二序列间差异的步骤进一步包括鉴定多态性的步骤。一方面,该方法进一步包括鉴定序列中一个或者多个特征的鉴定器(以及鉴定器的应用)。一方面,该方法包括用计算机程序读取第一序列,并鉴定该序列中的一个或者多个特征。
本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤:(a)提供扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对能够扩增本发明的核酸(如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178或其子序列,等等);(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与扩增引物对杂交;和(c)将步骤(b)的核酸和步骤(a)的扩增引物对结合,并且从环境样品中扩增核酸,从而从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在一方面,扩增引物序列对的每一个成员包括含有本发明的核酸序列的至少大约10到50个连续碱基的寡核苷酸。在一方面,扩增引物序列对是本发明的扩增对。
本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤:(a)提供包含本发明的核酸序列或其子序列的多核苷酸探针;(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与步骤(a)的多核苷酸探针杂交;(c)将步骤(b)的分离的核酸或者经处理的环境样品与步骤(a)的多核苷酸探针结合;和(d)分离与步骤(a)的多核苷酸探针特异性杂交的核酸,因此从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在可选的方面,环境样品包括水样品、液体样品、土壤样品、空气样品或者生物样品。在可选的方面,生物样品来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞、藻类细胞、地衣细胞或者哺乳动物细胞。
本发明提供产生编码磷脂酶的核酸的变体的方法,包括以下步骤(a)提供包括本发明核酸的模板核酸;(b)在模板序列中修饰、缺失或者添加一个或者多个核苷酸,或其组合,从而产生模板核酸的变体。
在一方面,该方法进一步包括表达变异核酸,以产生变体磷脂酶多肽。在可选的方面,修饰、添加或者缺失由易错PCR(error-pronePCR)、重排(shuffling)、寡核苷酸定向诱变(oligonucleotide-directedmutagenesis)、装配PCR(assemblyPCR)、有性PCR诱变(sexualPCRmutagenesis)、体内诱变(invivomutagenesis)、盒式诱变(cassettemutagenesis)、回归整体诱变(recursiveensemblemutagenesis)、指数整体诱变(exponentialensemblemutagenesis)、位点特异性诱变(site-specificmutagenesis)、基因重装配(genereassembly)、基因位点饱和诱变(GeneSiteSaturationMutagenesis,GSSM)、合成连接重装配(syntheticligationreassembly,SLR)和/或其组合的方法来引入。在可选的方面,修饰、添加或者缺失通过选自下述的方法引入:重组、回归序列重组(recursivesequencerecombination)、硫代磷酸酯-修饰的DNA诱变(phosphothioate-modifiedDNAmutagenesis)、含尿嘧啶的模板诱变(uracil-containingtemplatemutagenesis)、缺口二重诱变(gappedduplexmutagenesis)、点错配修复诱变(pointmismatchrepairmutagenesis)、修复-缺陷型宿主株诱变(repair-deficienthoststrainmutagenesis)、化学诱变、放射诱变、缺失诱变、限制-选择诱变(restriction-selectionmutagenesis)、限制-纯化诱变(restriction-purificationmutagenesis)、人工基因合成(artificialgenesynthesis)、整体诱变(ensemblemutagenesis)、嵌合核酸多聚体生成(chimericnucleicacidmultimercreation)和/或其组合。
在一方面,该方法被反复重复,直到产生与模板核酸编码的磷脂酶相比,具有改变的或不同的活性或者改变的或不同的稳定性的磷脂酶。在一方面,改变的或不同的活性是在酸性条件下的磷脂酶活性,其中模板核酸编码的磷脂酶在酸性条件下没有活性。一方面,改变的或不同的活性是在高温下的磷脂酶活性,其中模板核酸编码的磷脂酶在高温的条件下没有活性。一方面,该方法反复重复,直到产生与模板核酸的密码子选择相比具有改变的密码子选择的磷脂酶编码序列。该方法反复重复,直到产生与模板核酸的信使表达或者信使稳定性相比具有更高或更低水平的信使表达或者信使稳定性的磷脂酶基因。
本发明提供修饰编码磷脂酶的核酸中密码子以增强其在宿主细胞中表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;(b)鉴定步骤(a)的核酸中的非偏爱(non-preferrd)或者不太偏爱(lesspreferred)的密码子,并且用编码相同氨基酸的偏爱的(或优选的)或者中度使用(neutrallyused)的密码子作为替代密码子替换之,其中偏爱密码子是在宿主细胞基因的编码序列中过度表现(出现频率较多,over-represent)的密码子,而非偏爱(或非优选的)或不太偏爱的密码子是在宿主细胞基因的编码序列中表现不足(出现频率较少,under-represent)的密码子,由此修饰该核酸以增加其在宿主细胞中的表达。
本发明提供修饰编码磷脂酶的核酸中的密码子的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;并且(b)确定步骤(a)的核酸中的密码子,并用编码相同氨基酸的不同的密码子作为替代密码子来替换之,从而修饰编码磷脂酶的核酸中的密码子。
本发明提供修饰编码磷脂酶的核酸中的密码子以增强其在宿主细胞中的表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸,和(b)鉴定步骤(a)的核酸中的非偏爱的或者不太偏爱的密码子,并用编码相同氨基酸的偏爱的或者中度使用的密码子作为替代密码子来替换之,其中偏爱密码子是在宿主细胞基因的编码序列中过度表现的密码子,非-偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中表现不足的密码子,由此修饰该核酸以增加其在宿主细胞中的表达。
本发明提供修饰编码磷脂酶的核酸中的密码子以降低其在宿主细胞的表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;和(b)鉴别步骤(a)的核酸中的至少一个偏爱的密码子,并用编码相同氨基酸的非偏爱的或者不太偏爱的密码子作为替代密码子替换之,其中偏爱密码子是在宿主细胞基因的编码序列中过度表现的密码子,非偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中表现不足的密码子,由此修饰该核酸以减少其在宿主细胞中的表达。在可选的方面,宿主细胞是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞、藻类细胞、地衣细胞或哺乳动物细胞。
本发明提供产生编码多个经修饰的磷脂酶活性位点或底物结合位点的核酸文库的方法,其中经修饰的活性位点或者底物结合位点来源于包括编码第一活性位点或者第一底物结合位点的序列的第一核酸,该方法包括:(a)提供编码第一个活性位点或者第一个底物结合位点的第一核酸,其中第一核酸序列包括本发明的核酸,(b)提供一组在第一核酸的多个靶密码子处编码天然产生的氨基酸变体的诱变寡核苷酸;和(c)应用该组诱变寡核苷酸产生一组编码活性位点或者编码底物结合位点的变体核酸,在每一个被诱变的氨基酸密码子处,变体核酸编码一定范围的氨基酸变异,从而产生编码多个修饰的磷脂酶活性位点或者底物结合位点的核酸文库。在可选的方面,本方法包括通过下列的方法诱变步骤(a)的第一核酸,所述方法包括优化的定向进化系统(optimizeddirectedevolutionsystem)、基因位点饱和诱变(GeneSite-SaturationMutagenesis)(GSSM)、合成连接重装配(SLR)。该方法可以进一步包括通过下列方法诱变步骤(a)的第一核酸或变体,所述方法包括易错PCR、重排、寡核苷酸定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、回归整体诱变、指数整体诱变、位点特异性诱变、基因重装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)及其组合。本方法可以进一步包括通过以下的方法诱变步骤(a)的第一核酸或变体,所述方法包括重组、回归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶的模板诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生成及其组合。
本发明提供制备小分子的方法,包括以下步骤:(a)提供可以合成或者修饰小分子的多种生物合成酶,其中一种酶包括由本发明核酸编码的磷脂酶;(b)提供步骤(a)的至少一种酶的底物,并且(c)在利于许多生物催化反应进行的条件下,将步骤(b)的底物和酶反应,通过一系列生物催化反应产生小分子。
本发明提供修饰小分子的方法,包括以下步骤:(a)提供由本发明核酸编码的磷脂酶;(b)提供小分子;和(c)在利于磷脂酶催化的酶反应进行的条件下,将步骤(a)的酶与步骤(b)的小分子反应,从而通过磷脂酶酶促反应修饰小分子。一方面,该方法包括提供多种用于步骤(a)的酶的小分子底物,从而产生经修饰的小分子文库,该小分子文库由磷脂酶催化的至少一种酶促反应产生。一方面,该方法可以包括多种其它的酶,在有助于这些酶的多个生物催化反应的条件下使用,以形成由多个酶促反应产生的被修饰小分子的文库。另一方面,该方法可以进一步包括测试该文库以确定该文库中是否存在表现出期望活性的特定被修饰小分子的步骤。测试该文库的步骤可以进一步包括系统地去除所有但保留一个用于产生文库中多个被修饰小分子中的一部分的生物催化反应,方法是通过测试被修饰小分子的所述部分中存在或不存在具有期望活性的特定被修饰小分子,并鉴定出产生具有期望活性的特定修饰小分子的至少一个特定生物催化反应。
本发明提供用于确定磷脂酶的功能性片段方法,包括以下步骤:(a)提供包括本发明氨基酸序列的磷脂酶;和(b)删除步骤(a)序列中的多个氨基酸残基,并且测定剩余子序列的磷脂酶活性,从而确定磷脂酶的功能性片段。一方面,磷脂酶活性通过提供磷脂酶底物,并检测底物量的增加或者反应产物量的减少来测定。一方面,与不存在测试化合物条件下确定的底物或者反应产物的量相比较,在测试化合物存在的条件下,酶底物量的减少或者反应产物量的增加表明测试化合物是磷脂酶活性的激活剂。
本发明提供切割甘油磷酸酯键的方法,包括以下步骤:(a)提供具有磷脂酶活性的多肽,其中该多肽包括本发明的氨基酸序列,或者该多肽由本发明的核酸编码;(b)提供包含甘油磷酸酯键的组合物;和(c)在该多肽切割甘油磷酸酯键的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。一方面,该条件包括大约pH5到大约8.5之间,或者大约pH4.5(或酸性更大,即pH<4.5)到大约9.0(或碱性更大,即pH>9)之间。一方面,该条件包括大约40℃到大约70℃之间的温度。一方面,该组合物包括植物油。一方面,该组合物包括油籽磷脂。一方面,切割反应可以产生水可抽提的磷酸化的碱和甘油二酯。
本发明提供了水解、分解或破坏含磷脂组合物(或组分)的方法,该方法包括提供具有磷脂酶活性的至少一种本发明的多肽,或由本发明的至少一种核酸编码的具有磷脂酶活性的多肽;提供包含磷脂的组合物;以及在磷脂酶水解、分解或破坏含磷脂组合物的条件下将所述多肽与所述组合物接触。一方面,该方法包括使用高剪切,然后不使用低剪切或使用低剪切,将组合物与至少一种具有磷脂酶活性的本发明的多肽混合,以使磷脂底物与磷脂酶充分“接触”。具有磷脂酶活性的至少一种多肽也可以存在于高剪切混合步骤中。该方法可以以任何规模实施,例如以包括约1克(g)至约500、1000、2000、2500、5000g或更多,或该范围内的任何数量的规模实施。
本发明提供油脱胶(oildegumming)方法,包括以下步骤:(a)提供具有磷脂酶活性的至少一种多肽,其中多肽包括本发明的氨基酸序列,或者多肽由本发明的核酸序列编码;(b)提供包括植物油的组合物;和(c)在多肽可以切割植物油中的酯键的条件下,将步骤(a)的多肽与步骤(b)的植物油接触,从而进行油的脱胶。在一方面,植物油包括油籽。植物油可以包括米糠油(ricebranoil)、棕榈油、油菜籽油、玉米油、大豆油、油菜油(canolaoil)、芝麻油、花生油、或者葵花油。在一方面,该方法进一步包括加入本发明的磷脂酶、其它磷脂酶或其组合。一方面,将一种以上具有磷脂酶活性的多肽加入到该方法中,其中至少一种多肽是本发明的酶。一方面,酶以特定顺序加入,例如,具有不同特性的PLC以特定顺序加入,例如具有PC和PE活性的酶被首先加入(或者两种酶同时加入,一种具有PC活性,另一种具有PE活性),然后加入具有PIPLC活性的酶,或其任意组合。
在油脱胶方法的一个方面,含油组合物包括植物、动物、藻类或鱼的油或脂肪。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、来自棕榈仁的油、油菜油、向日葵油、芝麻油或花生油。多肽可以水解含油组合物中来自水合和/或非水合磷脂的磷脂。一方面,多肽在甘油磷酯键处水解磷脂从而产生甘油二酯和水溶性磷酸盐化合物。一方面,多肽具有磷脂酶C的活性。一方面,多肽是磷脂酶D,且也可以加入磷酸酶。
在油脱胶方法的一个方面,接触步骤包括水解油中的水合磷脂。水解条件可以包括碱性条件,例如一方面,该条件包括在碱性pH条件下约20℃至40℃的温度。碱性条件可以包括约pH8至pH10,或更大的pH。在该方法的任何时刻,水解条件都可以被变为碱性,例如一方面,在该条件变成碱性之前,加入磷脂酶诸如PLC(例如,含酸诸如磷脂酸的油的“碱中和”)。
在油脱胶方法的一个方面,在PLC的作用下,碱将使1,2-DAG异构成1,3-DAG,1,3-DAG的营养健康价值超过1,2-DAG,例如1,3-DAG作为能源被燃烧掉,而不是作为脂肪储存起来(如1,2-DAG似的)。因此,本发明提供了碱性油精炼方法,其中磷脂酶例如本发明的酶——包括PLC,“在前端”加入,即在加入任何酸和碱之前加入,例如,如图13的示例性方法中所示。在本发明的碱性精炼方法的前端加入PLC(参见下面进一步的论述)以及随后加入酸和碱的结果之一就是产生了提高水平的1,3-DAG(不是1,2-DAG)。这可能是酸或碱催化的酰基转移的结果。从营养角度讲,1,3-DAG胜于1,2-DAG。因此,本发明包括使用本发明的PLC进行的油脱胶方法,因而最终的脱胶油产物含有不少于约0.5%、1.0%、2.0%、3.0%、4.0%或5.0%的1,3-DAG。
在油脱胶方法的一个方面,水解条件可以包括反应时间约3至10分钟或更多时间。水解条件可以包括在约50℃至60℃的温度下,在约pH5至pH6.5,或约pH5至pH7.5,或约pH5至pH8.0的pH,水解油中的水合或非水合的磷脂,反应时间是约30至60分钟。
在油脱胶方法的一个方面,多肽被结合到过滤器上,并使含磷脂的脂肪或油通过过滤器。该多肽可以被加入到包括含磷脂脂肪或油的溶液中,然后使该溶液通过过滤器。
在油脱胶方法的一个方面,该方法还包括通过物理的方法除去脱胶方法产生的胶,这是通过加入硬化物质例如云母或等同物进行的。一方面,这增加了油产量。
本发明还提供将非水合磷脂转化成水合形式的磷脂的方法,包括以下步骤:(a)提供具有磷脂酶活性的多肽,其中多肽包括本发明的氨基酸序列,或者多肽由本发明的核酸编码;(b)提供包括非水合磷脂的组合物;和(c)在多肽能够切割非水合磷脂中的酯键的条件下,将步骤(a)的多肽与步骤(b)的非水合磷脂接触,从而将非水合磷脂转化为水合形式。
本发明提供使油脱胶的方法,包括以下步骤:(a)提供包括具有磷脂酶活性的本发明的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包括含有磷脂的脂肪或者油的组合物;(c)在多肽能够对含磷脂的组合物进行脱胶的条件下(在本发明的多肽能够催化磷脂水解的条件下),将步骤(a)的多肽与步骤(b)的组合物接触。在一方面,含油的组合物包括植物、动物、藻或者鱼的油。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、棕榈仁的油、油菜油、葵花子油、芝麻油或者花生油。多肽可以水解含油组合物中水合和/或非水合磷脂中的磷脂。多肽可以在甘油磷脂键处水解磷脂,产生甘油二酯和水溶性的磷酸盐化合物。多肽可以具有磷脂酶C,B,A或者D的活性。在一方面,加入了磷脂酶D活性和磷酸酶活性。接触可以包括油中的水合磷脂的水解。水解条件可以包括在碱性pH下,温度为大约20℃到40℃。碱性条件可以包括大约pH8到pH10的pH。水解条件可以包括反应时间为3到10分钟。水解条件可以包括在温度为大约50℃到60℃,pH大约为pH5到pH6.5,反应时间为大约30到60分钟,水解油中水合的或者非水合的磷脂。多肽可以结合于过滤器,并使含有磷脂的脂肪或者油通过过滤器。多肽可以加入到包含含磷脂的脂肪或者油的溶液中,然后使溶液通过过滤器。
本发明提供将非水合的磷脂转化为水合形式的方法,包括以下的步骤:(a)提供包括具有本发明磷脂酶活性的多肽,或者由本发明的核酸序列编码的多肽的组合物;(b)提供包括非水合的磷脂的组合物;和(c)在多肽将非水合磷脂转化为水合形式的条件下,将步骤(a)的多肽与步骤(b)组合物接触。多肽可以具有磷脂酶C的活性。多肽可以具有磷脂酶D的活性,并且也加入磷酸酶。
本发明提供碱法精炼含磷脂的组合物的方法,包括以下步骤:(a)提供包含磷脂酶的组合物,磷脂酶可以是本发明的具有磷脂酶活性的多肽,或者由本发明核酸编码的多肽;(b)提供包含磷脂的组合物;和(c)在碱法精炼之前,碱法精炼期间或者之后,将步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶活性,例如PLC、PLB、PLD和/或PLA活性。多肽可以在碱性精炼之前即在该方法的“前端”,在加入酸或碱之前加入,如图13所示。
多肽(其可以是本发明的酶,例如PLC)可以在碱性精炼期间加入,并根据磷水平和游离脂肪酸的水平,可以加入变化水平的酸或碱。多肽(其可以是本发明的酶)可以在碱性精炼之前或之后加入:分离以前,在强力混合器(intensemixer)或恒定混合器(retentionmixer)中;加热步骤之后;在离心机中;在皂脚中;在洗涤水中;和/或在漂白或除臭步骤中。该方法可以包括使用浓的碱溶液,例如浓度比11%的工业标准更高,以降低胶的质量。在可选的方面,浓的碱溶液浓度在约12%至50%之间,例如约20%、30%、40%、50%或60%或更浓。
含磷脂的组合物可以包括植物。多肽可以通过转基因的方式在该植物中表达。具有磷脂酶活性的多肽可以在破碎种子或植物其它部分期间加入,或者具有磷脂酶活性的多肽在破碎之后或精炼之前加入。
还提供了使用本发明的多肽水解油(例如植物油)中的磷脂,以产生二酰甘油(DAG)和水溶性磷酸酯的碱法精炼方法。一方面,本发明的酶必须在碱法精炼方法中,包括任选地低含量水和/或在约55℃至约70℃的温度范围内操作。在该温度范围内,以低水含量条件使用碱法精炼方法,将通过增加DAG和减少夹带油(entrainedoil)而使产量最大化。一方面,在本发明的碱法精炼方法中使用的酶对磷脂酰胆碱(PC)和磷脂酰乙醇胺(PE)具有非常好的活性,在约pH6至pH9具有活性,在高达75℃下具有活性,在油中的低含量水例如约2%至5%水中具有活性,例如由具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178的序列编码的酶。在本发明用于水解油中磷脂的碱法精炼方法的另一方面,使用了两种酶:PI-特异性PLC(水解PI)和水解PC、PE及PA的PC-PLC。该实施方式产生适合于化学或物理精炼的油,并使DAG的产量增加最大化,并减少夹带的油。
本发明提供纯化植物甾醇或者三萜的方法,包括以下的步骤:(a)提供包括本发明的具有磷脂酶活性的多肽或者由本发明核酸编码的多肽的组合物;(b)提供含有植物甾醇或者三萜的组合物;和(c)在多肽可以催化组合物中磷脂的水解的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。植物甾醇或者三萜可以包括植物甾醇(plantsterol)。该植物甾醇可以来源于植物油。植物油可以包括米糠油、椰子油、油菜油、可可黄油、玉米油、棉籽油、亚麻油、橄榄油、棕榈油、花生油、来自米糠的油、红花油、芝麻油、大豆油或者葵花油。该方法可以包括应用非极性溶剂来定量地提取游离的植物甾醇和甾醇脂肪酸酯。植物甾醇或者三萜可以包括β-谷甾醇、菜油甾醇、豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、链甾醇、海绵甾醇、多孔甾醇、穿贝海绵甾醇或者菜籽甾醇。
本发明提供精炼粗制油的方法,包括以下步骤:(a)提供包括本发明的具有磷脂酶活性的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包括含磷脂的油的组合物;和(c)在多肽催化组合物中的磷脂水解的条件下,将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。多肽可以在加入到组合物的水溶液中具有磷脂酶活性。水的水平可以是在0.5到5%之间。处理时间可以大约2小时以下,大约60分钟以下,大约30分钟以下,大约15分钟以下,或者5分钟以下。水解条件可以包括温度范围在大约25℃到70℃之间。水解条件可以包括使用苛性碱。可以使用碱的浓溶液,例如比11%的工业标准更浓的浓度,以减少胶的质量。在可选的方面,碱的浓溶液是在约12%至50%之间的浓度,例如约20%、30%、40%、50%或60%或更浓的浓度。
水解条件可以包括pH在大约pH3到pH10之间、在大约pH4到pH9之间、或者在大约pH5到pH8之间。水解条件可以包括在接触步骤(c)后加入乳化剂和/或进行混合。该方法可以包括加入乳化剂破乳剂(emulsifiers-breaker)和/或加热或冷却(例如在约4℃至约-20℃之间,或更低温度),来促进水相的分离。该方法可以包括在接触步骤前进行脱胶,通过离心收集卵磷脂,然后再加入PLC,PLC和/或PLA以去除非水合的磷脂。该方法可以包括水脱胶粗制油至少于10ppm的磷以获得食用油,以及接着物理精炼至少于大约50ppm的磷以获得生物柴油。该方法可以包括加入酸来增强非水合磷脂的水合作用。一方面,加入酸来促进钙镁金属含量的降低。
本发明提供了改善、处理或防止脂多糖(LPS)-介导的毒性的方法,该方法包括给予患者包含本发明多肽的药物组合物。本发明提供了内毒素的解毒方法,包括使内毒素与本发明的多肽接触。本发明提供了从类脂A上脱去2’或3’脂肪酸链的脱酰基方法,包括将类脂A与本发明的多肽接触。
本发明提供了使用本发明的多肽来制造药物组合物——例如来制造用于防止、处理或改善脂多糖(LPS)-介导的毒性的药物组合物,或用来解毒内毒素,或者从类脂A上脱去2’或3’脂肪酸链的脱酰基。本发明提供用于内毒素的解毒的方法,包括将内毒素与本发明的多肽接触。
本发明提供了精炼润滑剂的方法,包括以下步骤:(a)提供包括本发明的酶的组合物;(b)提供润滑剂;和(c)在酶可以选择性地水解润滑剂中的油的条件下,用酶处理润滑剂,从而精炼该润滑剂。该润滑剂可以是液压油。
本发明提供了处理织物的方法,包括下述步骤:(a)提供包括本发明的酶的组合物;(b)提供织物;和(c)用该酶处理织物。织物的处理可以包括最终织物的手感与悬垂的改善、染色、获得阻燃性、获得防水性、获得光学亮度或者获得树脂整理。该织物可以包括棉、粘胶纤维、人造纤维、莱塞尔纤维(lyocell)、亚麻(flax)、亚麻(linen)、苎麻、其所有的混合物,或者它们与聚酯、羊毛、聚酰胺丙烯酸或聚丙烯酸的混合物。本发明提供了包含本发明的酶的织物、纱线或纤维。该酶可以被吸附,吸收或固定在织物、纱或纤维的表面。
本发明提供了表达磷脂酶C方法,该方法包括提供具有Mut+表型的毕赤酵母菌株;将异源的磷脂酶C-编码核酸插入毕赤酵母菌株;并将毕赤酵母菌株培养在表达磷脂酶C的条件下。该方法还可以包括用锌补充培养条件。本发明也提供了用于表达磷脂酶C的细胞体系,分离的细胞和细胞系,包括Mut+表型毕赤酵母菌株,其含有可操作性地连接于毕赤酵母菌株中可以操作的启动子的异源的磷脂酶C-编码核酸。
本发明提供了用于表达异源蛋白的耐zeocin的酵母细胞体系(例如酵母细胞、细胞系、单细胞),包括步骤:提供含有能够表达异源蛋白的异源核酸的毕赤酵母某种(Pichiasp.)(例如巴斯德毕赤酵母(P.pastoris))细胞;在含某一初始浓度zeocin的条件下培养该细胞;挑选对初始浓度的zeocin有抗性的细胞,并在含有较高浓度zeocin的条件下再培养;并挑选出步骤(C)中培养的耐较高浓度zeocin的细胞。一方面,异源蛋白是酶,或任选地是磷脂酶,或任选地是磷脂酶C(PLC),例如本发明的任何酶。
本发明提供制造生物燃料的方法,其包括:(A)(a)提供本发明的具有磷脂酶,或者由本发明核酸(多核苷酸)编码的磷脂酶,或者由本发明的方法制造的磷脂酶;(b)提供包括脂或烷基酯的生物质组合物;(c)将(a)的磷脂酶与(b)的生物质组合物接触,以产生生物燃料或对脂或烷基酯进行酯交换;(B)(A)的方法,其中所述生物燃料是或包括生物柴油;(C)(A)或(B)的方法,其中所述包括脂或烷基酯的生物质组合物是或包括植物油和/或动物脂肪;(D)(A)至(C)的任何方法,其中所述包括脂或烷基酯的生物质组合物是或包括藻类、植物油、直链植物油、粗植物油(virginvegetableoil)、废植物油(wastevegetableoil)、动物脂肪、动物脂(grease)、牛脂(tallow)、猪脂(lard)或黄油(yellowgrease);或(E)(A)至(D)的任何方法,其中所述磷脂酶是或包括具有SEQIDNO:1至SEQIDNO:178的任何一个所示的序列的多肽,或其任何组合。
本发明提供生物燃料:(a)其根据权利要求68所述的方法制备;(b)其包括(i)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或根据本发明方法制备的磷脂酶。
本发明提供可溶性干酒糟(distillersdriedsoluble,DDS)、谷物干酒糟(distillersdriedgrain,DDS)、可溶性浓缩酒糟(acondenseddistillerssoluble,CDS)、谷物湿酒糟(adistillerswetgrain,DWG)或含可溶物的谷物干酒糟(distillersdriedgrainwithsolubles,DDGS):其包括(i)具有SEQIDNO:1至SEQIDNO:178任何一个所示序列的所述磷脂酶,或其任何组合,或(ii)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶。
本发明提供生物质,包括:(a)(i)具有SEQIDNO:1至SEQIDNO:178任何一个所示序列的磷脂酶,或其任何组合,或(ii)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶;或(b)(a)的生物质,其中所述生物质是或包括动物、藻类和/或植物生物质,或含脂类的生物质或木质纤维生物质,或者废物材料;(c)(a)的生物质,其中所述生物质是或包括生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇或其任何组合。
本发明提供基于石油的产品,其包括:(a)(i)具有SEQIDNO:1至SEQIDNO:178任何一个所示的序列的磷脂酶,或其任何组合,或(ii)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶;或(b)(a)的基于石油的产品,其包括油、生物柴油或汽油、或生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇;或者生物乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇和/或生物柴油或汽油的混合物。
本发明的一个或者多个实施方式的细节在附图和以下的说明书中进行阐明。本发明的其它特征、目标以及优势将通过阅读说明书和附图以及权利要求得变得显而易见。
出于各种目的,本文所引用的所有出版物、专利、专利申请、GenBank序列以及美国典型培养物保藏中心(ATCC)保藏物,通过引用特意并入本文。
附图简述
下图是本发明的实施方式的示例性说明,并非为了限制权利要求所包含的发明范围。
图1是计算机系统的框图,具体细节如下所述。
图2是图解过程200的一个方面的流程图,为确定新序列与数据库中序列间的同源性水平,将新的核苷酸或蛋白质序列与序列数据库相比较,具体细节如下所述。
图3是图解在计算机中确定两个序列是否是同源的过程的一种实施方式的流程图,具体细节如下所述。
图4是图解鉴定器过程的一个方面的流程图,该鉴定器过程用于检测序列中特征的存在与否,具体细节如下所述。
图5A、5B和5C示意性说明用于模拟PLC-介导的脱胶的典型两相系统,具体细节如下文实施例2中所述。
图6示意性说明了应用本发明磷脂酶的示例性植物油精炼过程。
图7示意性说明了用于物理精炼油的本发明的示例性脱胶过程,具体细节如下所述。
图8示意性说明了用本发明的磷脂酶C进行的磷脂水解,具体细节如下所述。
图9示意性说明了本发明的示例性碱炼方法,并图解了用本发明的磷脂酶C作为“碱炼助剂”(长混合碱炼,LongMixCausticRefining)的一个可选择的实施方式,具体细节如下所述。
图10示意性说明了应用本发明的磷脂酶C作为脱胶助剂,具体细节如下所述。
图11是描述本发明的示例性核酸和多肽的选择特征的表,如在下面所进一步详细描述的。
图12示意性说明了来自本发明的两个酶系统的数据,如在下面实施例3中所述。
图13示意性说明了本发明的示例性碱炼方法,并图解了一个可选的实施方式,包括应用本发明的磷脂酶C作为“碱炼助剂”(长混合碱炼),如下面所详细描述的。
图14图解了本发明方法的另一种变化,其中在方法中使用了两个离心步骤,如下面所详细描述的。
图15说明了本发明方法的另一种变化,其中在方法中使用了三个离心步骤,如下面所详细描述的。
图16示出了本方法的另一种示例性变化,其使用酸处理并在脱胶步骤前有离心步骤,如下面所详细描述的。
图17图解了体外消化实验的结果,其中本发明的磷脂酶C变体,如下面实施例4中所详细描述的。
图18图解了使用本发明的示例性酶进行的分批发酵罐培养的结果,如下面实施例5中所详细描述的。
图19图解了本发明的巴斯德毕赤酵母MutS菌株培养物的氧吸收速率(OxygenUptakeRate,“OUR”)比较结果,如下面实施例5中所详细描述的。
图20图解了本发明的巴斯德毕赤酵母MutS菌株的甲醇消耗图比较,如下面实施例5中所详细描述的。
图21图解了本发明SEQIDNO:2的示例性PLC酶的重组形式的培养物的“OUR”图,如下面实施例5中所详细描述的。
图22图解了SDS-PAGE的结果,显示了在培养物中产生的PLC蛋白的质量,及与之相对应的本发明SEQIDNO:2的示例性PLC酶的重组形式的培养物的“OUR”图,如下面实施例5中所详细描述的。
图23说明了SDS-PAGE的结果,显示了活性PLC的数量,该活性PLC位于本发明SEQIDNO:2的示例性PLC酶的重组形式的培养物的细胞内,如下面实施例5中所详细描述的。
图24说明了与活性PLC——本发明SEQIDNO:2的示例性PLC酶的重组形式相关的酵母细胞形态学变化的可视化图,如下面实施例5中所详细描述的。
图25用图概述了数据,显示了在95hTFT(总发酵时间),在毕赤酵母中使用本发明SEQIDNO:2的示例性PLC酶进行的PLC生产性能的状态,如下面实施例5中所详细描述的。
图26是数据简表,这些数据来自对本发明的示例性zeocin-适应的细胞菌落的表达筛选,如下面实施例5中所详细描述的。
图27说明了数据,这些数据显示:在含有本发明的示例性zeocin-适应的细胞菌落的培养物中,PLC蛋白水平是较高的,如下面实施例5中详细描述地。
图28说明了数据,这些数据显示了本发明的zeocin-适应的菌落与对照的生长比较,如下面实施例5中所详细描述的。
图29说明了加热实验的结果,显示了本发明SEQIDNO:2的示例性酶的热稳定性,图中指出了实验条件,如下面实施例6中所详细描述的。
图30说明了总结加热实验的NMR数据,证明了本发明SEQIDNO:2的示例性酶的热稳定性,如下面实施例6中所详细描述的。
图31、32和33说明了数据,使用p-NPPC,这些数据证明了SEQIDNO:2的热稳定性,实验条件为图中所示的条件,如下面实施例6中所详细描述的。
图34说明了数据,使用DSC分析,这些数据证明了SEQIDNO:2的热稳定性,如下面实施例6中所详细描述的。
图35说明了在用本发明突变体磷脂酶处理后,单独磷脂(PL)种类(PA、PE、PI和PC)相对于剩余的总PL的重量分数。
图36说明了选择包含在基因重装配文库(GeneReassemblyLibrary)中的GSSM高表达突变型(upmutant),其包括本发明示例性的磷脂酶。
图37说明了示例性的醇方法,其可包括本发明酶的使用。
在不同的附图中同样的标记符号表示同样的要素。
发明详述
本发明提供了磷脂酶,如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽,编码它们的核酸,以及制备和应用它们的方法。本发明提供了有效地切割油,如植物油,例如油籽磷脂中的甘油磷酸酯键,产生水可提取的磷酸化的碱和甘油二酯的酶。一方面,本发明的磷脂酶具有脂酰水解酶(LAH)的活性。在可选的方面,本发明的磷脂酶可以切割磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸和/或鞘磷脂或它们的组合中的甘油磷酸酯键。例如,一方面,本发明的磷脂酶对一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE和PS;PS和PE;PS和PI;PI和PE;PS、PI和PC;PE、PI和PC;或PE、PS、PI和PC具有特异性作用。
本发明的磷脂酶(如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷酸酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽)可以用于植物油的酶法脱胶,这是因为磷酸部分可溶于水,并且容易去除。甘油二酯产物将仍存留在油中,从而降低损失。在商业油脱胶中,诸如方法中,本发明的PLC可以用于加入到PLA1和PLA2或者替换PLA1和PLA2,其中磷脂是由PLA1和PLA2水解的。
在一方面,本发明的磷脂酶在高温和/或低温下,或者在较宽的温度范围内,具有活性,例如,它们可以在20℃到90℃,30℃到80℃,或者在40℃到70℃的温度范围内具有活性。本发明也提供在碱性pH或者酸性pH下,例如低的水酸度具有活性的本发明的磷脂酶。可选择的方面,本发明的磷脂酶可以在酸性pH低至pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0、和pH3.5或酸性更大(即pH<3.5)的条件下具有活性。在可选的方面,本发明的磷脂酶可以在碱性pH高至pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、pH10或碱性更大(即pH>10)的条件下具有活性。一方面,本发明的磷脂酶在低水活度(低的水含量)条件下,在约40到约70℃、75℃或80℃或更大温度的温度范围内具有活性。
本发明也提供了进一步修饰本发明的示例性磷脂酶,以便产生具有期望特性的酶的方法。例如,由本发明方法产生的磷脂酶可以具有改变的底物特异性、底物结合特异性、底物切割形式、热稳定性、pH/活性曲线、pH/稳定性曲线(如在低pH值,例如pH<6或者pH<5,或者高的pH值,如pH>9的情况下热稳定性提高)、对于氧化作用的稳定性、Ca2+的依赖性、比活性和类似特性。本发明提供对于任何感兴趣特性的改变。例如,这些改变可以产生与亲本磷脂酶相比,具有改变的pH和温度活性曲线的变体。
在一方面,本发明的磷脂酶被用于各种植物油处理步骤中,如植物油提取中,特别地,用于在称为“油脱胶”的过程中去除“磷脂胶”,如在此所述。本发明提供了组合物(例如包含本发明酶的组合物)和由各种来源生产植物油的方法,所述各种来源如米糠、大豆、油菜、花生、芝麻、向日葵和玉米。本发明的磷脂酶可以在任何植物油加工步骤中用于替代PLA,例如磷脂酶A2。
术语“磷脂酶”包括具有任何磷脂酶活性的酶,例如,切割油中,如植物油中的甘油磷酸酯键(催化水解甘油磷酸酯键)。本发明的磷脂酶活性可以产生水可提取的磷酸化的碱以及甘油二酯。本发明的磷脂酶活性也包括在高温、低温、碱性pH和酸性pH条件下水解甘油磷酸酯键。术语“磷脂酶活性”也包括切割甘油磷酸酯,产生水可提取的磷酸化的碱以及甘油二酯。术语“磷脂酶活性”也包括切割磷脂中甘油和磷酸的酯键。术语“磷脂酶活性”也包括其它的活性,如结合并水解底物,如油,例如植物油的能力,底物也包括植物和动物的卵磷脂、磷脂酰乙醇胺、磷脂酰丝氨酸和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性;磷脂酶A(PLA)的活性,如磷脂酶A1或者磷脂酶A2的活性;磷脂酶B(PLB)活性,如磷脂酶B1或者磷脂酶B2的活性,包括溶血磷脂酶(LPL)活性和/或溶血磷脂酶-转酰基酶(LPTA)活性;磷脂酶D(PLD)的活性,如磷脂酶D1或者磷脂酶D2的活性;和/或patatin活性或它们的任何组合。磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中或者任何茄属(Solanum)植物,如马铃薯(Solanumtuberosum)中的糖蛋白。磷脂酶活性可以包括patatin酶活性,如patatin酯酶活性(见,例如,Jimenez(2002)Biotechnol.Prog.18:635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。磷脂酶活性可以包括对一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE和PS;PS和PE;PS和PI;PI和PE;PS、PI和PC;PE、PI和PC;或PE、PS、PI和PC,或它们的任何组合具有特异性作用。
一方面,本发明的磷脂酶可以具有多功能活性,例如一种或多种本文中描述的酶活性的组合。例如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性,或缺少影响中性油(甘油三脂)部分的任何酶活性。在特定的方法中,例如在脱胶方法中使用这样的多肽可能是有利的,在脱胶方法中,中性油部分不受损害(减少、降解例如水解)是重要的。因此,一方面,本发明提供了脱胶方法,该方法包括使用具有磷脂酶活性但是缺少脂酶活性的本发明的多肽。
一方面,本发明的PLC磷脂酶利用(例如催化水解)各种磷脂底物,包括磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)和/或磷脂酸或它们的组合。此外,这些酶对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的PLC酶可以对磷脂酰胆碱和磷脂酰乙醇胺底物显示出优选性。
一方面,本发明的磷脂酰肌醇PLC磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的磷脂酰肌醇PLC酶可以对磷脂酰肌醇底物显示出优选性。
一方面,本发明的patatin酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的patatin酶可以基于氨基序列相似性的保守性。在不同的方面,这些酶展示出多组不同的生物化学活性,并可以发挥PLA1、PLA2、PLC或PLD酶类的反应特征。
一方面,本发明的PLD磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。一方面,这些酶可用于进行酯交换反应,以产生有结构的磷脂。
如在此所用的,术语“阵列(array)”或者“微阵列(microarray)”或者“生物芯片(biochip)”或者“芯片(chip)”是许多靶元素,每一个靶元素包括确定量的一个或者多个多肽(包括抗体)或者固定于底物表面的确定区域上的核酸,如下面进一步详细讨论的。
如在此所用的,术语“计算机”,“计算机程序”和“处理器”以其最广义的一般语境使用,并整合所有这样的设备,如以下详细描述的。
特定的多肽或者蛋白的“编码序列”或者“编码特定的多肽或者蛋白的序列”,是指当置于合适的调控序列的控制下时可以转录和翻译成多肽或者蛋白的核酸序列。
在此使用的术语“表达盒(expressioncassette)”是指在宿主中可以影响结构基因(即,编码蛋白质,如本发明的磷脂酶的序列)表达的核苷酸序列,所述宿主与所述序列相容。表达盒包括至少一个与编码多肽的序列可操作地连接的启动子;并且,任选地,与其它的序列例如转录终止信号可操作地连接。也可以应用进行表达所必要的或有帮助的额外的因子,例如增强子。如在此所应用的“可操作地连接(operablylinked)”是指连接DNA序列上游的启动子,这样该启动子能够介导该DNA序列的转录。因此,表达盒也包括质粒、表达载体、重组病毒、任何形式的重组的“裸露DNA”载体,和类似物。“载体”包括可以感染、转染、瞬间或者永久转导细胞的核酸。将被认识到,载体可以是裸露的核酸,或者与蛋白或者脂类复合的核酸。载体任选地包括病毒或者细菌的核酸和/或蛋白,和/或膜(如,细胞膜,病毒的脂包膜,等等)。载体包括,但不限于复制子(如,RNA复制子,细菌噬菌体),DNA片段可以与其连接,并被复制。载体因此包括,但不限于是RNA,自主复制的环状或者线性的DNA或者RNA(如质粒、病毒以及类似物,参见,如美国专利第5,217,879号),并且也包括表达质粒和非表达质粒。当重组微生物或者细胞培养物被描述为容纳“表达载体”时,其包括染色体外的环状和线性DNA,和已经整合进入宿主染色体的DNA。当载体由宿主细胞维持时,该载体可以在细胞有丝分裂期间作为自主结构由细胞稳定地复制,或者整合入宿主基因组中。
“质粒”命名为在大写字母和/或数字之前和/或之后加上小写字母“p”。在此使用的起始质粒(startingplasmid)可以通过商业渠道获得,通过公共渠道自由获得,或者按照公开的程序从可利用的质粒构建得到。此外,与那些在此描述的质粒等价的质粒是在本领域是已知的,并且对普通技术人员而言是显而易见的。
术语“基因”是指参与产生多肽链的DNA片段,包括在编码区的前面和后面的区域,如头部和尾部,启动子和增强子,以及适当情况下,单个编码片段(外显子)之间的插入序列(内含子),等等。
如本文所用,短语“核酸”或者“核酸序列”是指寡核苷酸、核苷酸、多核苷酸、或者是指它们中的任何之一的片段,是指基因组或者合成来源的DNA或者RNA(如,mRNA、rRNA、tRNA、iRNA),其可以是单链的或者双链的,并且可以代表有义链或者无义链,是指肽核酸(PNA),或者是指任何DNA样或者RNA样的物质,天然的或者合成来源的,包括如iRNA,核糖核蛋白(如双链iRNA,如iRNPs)。该术语包括核酸,即,寡核苷酸,包括天然核苷酸的已知类似物。该术语也包括具有合成骨架的核酸样结构,参见如Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry36:8692-8698;Samstag(1996)AntisenseNucleicAcidDrugDev6:153-156。
如本文所用,“氨基酸”或者“氨基酸序列”是指寡肽、肽、多肽或者蛋白序列,或者是指这些序列中的任何序列的片段、部分或亚基,并且是指天然产生的或者合成的分子。
如本文所用,术语“多肽”和“蛋白”是指通过肽键或者修饰的肽键相互连接在一起的氨基酸,即,肽等排体(peptideisosteres),可以含有除了20个基因编码的氨基酸外的修饰氨基酸。术语“多肽”也指肽或者多肽片段,基序和类似物。该术语也包括糖基化的多肽。本发明的肽或者多肽也包括所有“模拟”和“肽模拟”形式,正如下面进一步详细描述的。
如本文所用,术语“分离的”是指从原始的环境(例如天然环境,如果该环境是天然存在的话)中移取的物质。例如,存在于活动物中的天然发生的多核苷酸或者多肽不是分离的,但是,如果该同样的多核苷酸或者多肽,与天然系统中的一些或者所有的共存物分离,那么就是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或者多肽可以是组合物的一部分,并且仍然是分离,这是因为这样的载体或者组合物不是其天然环境的一部分。如本文所用,分离的物质或者组合物也可以是“纯化”的组合物,即,它并不需要绝对的纯度;相反,这意味着是一个相对定义。从文库中得到的单个核酸可以经过常规纯化为具有电泳均一性。在可选择的方面,本发明提供从基因组DNA或者从文库中的其它序列中或者其它的环境中以至少一个、两个、三个、四个、五个或者更多数量级纯化得到的核酸。
如本文所用,术语“重组子”是邻接于“骨架”核酸的核酸,而在天然环境下它们并不邻接。在一方面,核酸代表了核酸“骨架分子”群体中5%或者更多数目的核酸插入物。本发明的“骨架分子”包括核酸,如表达载体、自主复制核酸、病毒、整合性核酸,和用于维持或者操作感兴趣的核酸插入物的其它的载体或者核酸。在一方面,富集的核酸代表了重组骨架分子群体中的15%、20%、30%、40%、50%、60%、70%、80%、90%或者更多数目的核酸插入物。“重组”多肽或者蛋白是指由重组DNA技术产生的多肽或者蛋白,如,从用编码所需多肽或者蛋白的外源DNA构建物转化的细胞产生。“合成的”多肽或者蛋白是那些通过化学合成制备的多肽或者蛋白,如下面进一步详细描述地。
如下面进一步讨论地,当在启动子处启动转录的RNA聚合酶将编码序列转录成为mRNA时,启动子序列被“可操作地连接于”编码序列。
“寡核苷酸”是指单链多聚脱氧核苷酸或者可以被化学合成的两个互补的多聚脱氧核苷酸链。这样的合成的寡核苷酸没有5’磷酸,因此如果不在存在激酶的情况下采用ATP添加磷酸,该合成寡核苷酸便不会连接到另一个寡核苷酸上。合成的寡核苷酸可以连接到没有被去磷酸化的片段上。
在两个核酸或者多肽的上下文中,短语“实质上相同(substantiallyidentical)”,是指当比较和比对最大对应性(correspondence)时,具有至少50%、60%、70%、75%、80%、85%、90%、95%、98%或者99%的核苷酸或者氨基酸残基(序列)的同一性的两个或者多个序列,所述最大对应性用一个任何已知的序列比较算法测量,如以下详细讨论的,或者通过目测的方法测量。在可选的方面,本发明提供与本发明的示例性序列,例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176等等,在核酸或者多肽的至少大约100个残基、150个残基、200个残基、300个残基、400个残基或者从约50个残基到全长的区域范围内,具有实质上同一性的核酸和多肽序列。本发明的核酸序列可以在多肽编码区域的整个长度上实质一致。
另外,“实质上相同”的氨基酸序列是与参考序列差异一个或者多个保守性或者非保守性氨基酸置换、缺失或者插入的序列,特别地,当这样的置换发生在分子的非活性位点的位置上,并且前提是多肽基本上保留其功能特性。保守氨基酸置换,例如,用一个氨基酸置换另一个同类的氨基酸(如,将一个疏水性氨基酸,如异亮氨酸、缬氨酸、亮氨酸或者甲硫氨酸置换为另一个疏水性氨基酸,或者将一个极性氨基酸置换为另一个极性氨基酸,诸如用精氨酸置换赖氨酸,用谷氨酸置换天冬氨酸,或者用谷酰胺置换天冬酰胺)。可以缺失一个或者多个氨基酸,例如,从磷脂酶多肽中缺失一个或者多个氨基酸,从而对多肽结构进行修饰,而并不显著改变其生物活性。例如,可以去除对于磷脂酶的生物活性并不需要的氨基或者羧基端氨基酸。可以通过很多方法中的任何方法分析本发明修饰的多肽序列的磷脂酶生物活性,包括将修饰的多肽序列与磷脂酶底物接触,并且确定是否修饰的多肽减少了分析中的特异底物的量或者增加了功能性磷脂酶与底物的酶促反应的生物产物的量,如下面进一步论述地。
“杂交”是指通过碱基配对,核酸链与互补链结合的过程。杂交反应可能是敏感的并且具有选择性,这样可以鉴定在样品中以低浓度存在的感兴趣的特定的序列。合适的严格条件可以通过例如,预杂交和杂交溶液中的盐和甲酰胺浓度,或者杂交温度来确定,并且在本领域是熟知的。例如,严格性可以通过降低盐浓度,增加甲酰胺的浓度,或者提高杂交温度,改变杂交时间而增加,如下面所详细描述地。在可选的方面,本发明的核酸通过它们在各种严格条件下(如,高、中和低严格条件)的杂交能力来定义,如在此所阐明地。
术语“变体”是指在一个或者多个碱基对、密码子、内含子、外显子、或者氨基酸残基(分别地)被修饰,但仍保持本发明的磷脂酶生物活性的本发明的多核苷酸或者多肽。变体可以通过很多种方法中的任何方法产生,例如易错PCR、重排、寡核苷酸定向诱变、装配PCR、有性PCR诱变、体外诱变、盒式诱变、递归整体诱变、指数整体诱变、定点诱变、基因重装配、GSSM和它们的任何组合。在此包括了产生在一定的pH或温度下具有活性的变体磷脂酶,例如不同于野生型磷脂酶的变体磷脂酶的技术。
术语“饱和诱变”、基因位点饱和诱变TM(GSSM)或者“GSSM”,包括应用简并性寡核苷酸引物将点突变引入多核苷酸中的方法,如下详细描述地。
术语“优化的定向进化系统”或者“优化的定向进化”包括对相关核酸序列,例如相关基因的片段重新进行装配的方法,并在下面进行了详细解释。
术语“合成连接重装配”或者“SLR”包括以非随机的方式连接寡核苷酸片段的方法,并在下面进行了详细解释。核酸的产生和操作
本发明提供分离的和重组的核酸(例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的示例性SEQIDNO:177或SEQIDNO:178),包括编码本发明的多肽和磷脂酶的表达盒,如表达载体。本发明也包括应用本发明的核酸发现新的磷脂酶序列的方法。也提供用于修饰本发明核酸的方法,例如通过合成连接重装配、优化的定向进化系统和/或饱和诱变。
通过,例如克隆和表达cDNA文库,通过PCR扩增信使或者基因组DNA,和类似方法,可以制备、合成和/或操作本发明的核酸。在实践本发明的方法中,通过操作模板核酸,可以修饰同源基因,如本文所述的。可以与本领域已知的其它任何方法或者方案或者装置结合来实践本发明,这些方法或者方案或者装置在科学和专利文献中得到充分描述。一般技术
用于实践本发明的核酸,不管是RNA、iRNA、反义核酸、cDNA、基因组DNA、载体、病毒或者它们的杂合体,都可以从不同的来源分离、进行遗传工程改造、扩增和/或表达/重组产生。从这些核酸产生的重组多肽可以单独分离或者克隆,并且检测所需的活性。可以应用任何重组表达系统,包括细菌、哺乳动物、酵母、昆虫或者植物细胞表达系统。
可选地,这些核酸可以通过已知的化学合成技术在体外合成,如在例如Adams(1983)J.Am.Chem,Soc.105:661;Belousov(1997)NucleicAcidsRes.25:3440-3444;Frenkel(1995)FreeRadic.Biol.Med.19:373-380;Blommers(1994)Biochemistry33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066中描述的。
用于操纵核酸的技术,例如亚克隆、标记探针(例如使用Klenow聚合酶的随机引物标记、切口平移、扩增)、测序、杂交以及类似的技术在科学和专利文献中有充分的描述,例如参见Sambrook编著,MOLECULARCLONING:ALABORATORYMANUAL(2NDED.),1-3卷,ColdSpringHarborLaboratory,(1989);CURRENTPROTOCOLSINMOLECULARBIOLOGY,Ausubel编著,JohnWiley&Sons,Inc.,NewYork(1997);LABORATORYTECHNIQUESINBIOCHEMISTRYANDMOLECULARBIOLOGY:HYBRIDIZATIONWITHNUCLEICACIDPROBES,PartI.TheoryandNucleicAcidPreparation,Tijssen,ed.Elsevier,N.Y.(1993)。
获得和操纵用于实践本发明的方法的核酸的另一个有用方法是从基因组样品中克隆,并且如果期望的话,筛选和再克隆插入物,插入物可以分离或扩增自例如基因组克隆或cDNA克隆。用于本发明的方法中的核酸的来源包括基因组或cDNA文库,所述文库可以包含在例如哺乳动物人工染色体(MACs),例如参见美国专利5,721,118;6,025,155;人类人工染色体,例如参见Rosenfeld(1997)Nat.Genet.15:333-335;酵母人工染色体(YAC);细菌人工染色体(BAC);P1人工染色体,例如参见Woon(1998)Genomics50:306-316;P1来源的载体(PACs),例如参见Kern(1997)Biotechniques23:120-124;粘粒、重组病毒、噬菌体或质粒中。
在一方面,编码本发明的多肽的核酸与能指导翻译出的多肽或其片段的分泌的前导序列以适当的位置关系进行装配。
本发明提供了融合蛋白和编码这些融合蛋白的核酸。本发明的多肽可以被融合到异源肽或多肽上,如N-末端鉴定肽,其给予了期望的特性,如增加的稳定性或简化的纯化特性。本发明的肽和多肽也可以作为融合蛋白被合成和表达,其中所述融合蛋白中连接有一个或多个额外的结构域,例如用于产生免疫原性更强的肽、以便更易于分离重组合成的肽、以便鉴定和分离抗体和表达抗体的B细胞,等等。有利于检测和纯化的结构域包括,例如金属螯合肽,如多组氨酸标记和组氨酸-色氨酸模块,其允许在固定的金属上纯化,还包括蛋白A结构域,其允许在固定的免疫球蛋白上纯化,还包括在FLAGS延伸/亲和纯化系统中所使用的结构域(ImmunexCorp,SeattleWA)。在纯化结构域和含有基序的肽或多肽之间包含可切裂的连接子序列有助于纯化,这样的连接子序列例如Xa因子或肠激酶(Invitrogen,SanDiegoCA)。例如,表达载体可以包括编码表位的核酸序列,其连接到六组氨酸残基上,还连接有硫氧还蛋白和肠激酶切割位点(例如参见Williams(1995)Biochemistry34:1787-1797;Dobeli(1998)ProteinExpr.Purif.12:404-414)。组氨酸残基有助于检测和纯化,而肠激酶切割位点提供了从融合蛋白的剩余部分纯化表位的手段。关于编码融合蛋白的载体的技术以及融合蛋白的应用在科学和专利文献中进行了充分的描述,例如参见Kroll(1993)DNACell.Biol.,12:441-53。转录和翻译控制序列
本发明提供了可操作地连接到一个或多个表达(例如转录或翻译)控制序列上的本发明的核酸(例如DNA)序列,所述控制序列例如启动子或增强子,它们指导或调节RNA合成/表达。表达控制序列可以在表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。示例性的真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒的LTR启动子以及鼠金属硫蛋白I启动子。
适合于在细菌中表达多肽的启动子包括大肠杆菌(E.coli)lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子和λPL启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子以及酸性磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs、以及小鼠金属硫蛋白-I启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动子。表达载体和克隆载体
本发明提供包括本发明的核酸,如,编码本发明的磷脂酶的序列的表达载体和克隆载体。本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒、粘粒、fos-质粒(fosmids)、细菌人工染色体、病毒DNA(如,牛痘、腺病毒、禽痘病毒、伪狂犬病病毒和SV40衍生物),以P1为基础的人工染色体、酵母质粒、酵母人工染色体以及对感兴趣的特定宿主(如杆菌属(Bacillus)、曲霉属(Aspergillus)和酵母)特异的任何其它载体。本发明的载体可以包括染色体的,非染色体的和合成的DNA序列。很多合适的载体为本领域技术人员所知的,并且可以商业获得。典型的载体包括:细菌的:pQE载体(Qiagen)、pBluescript质粒、pNH载体、(λ-ZAP载体(Stratagene);ptrc99a、pKK223-3、pDR540、pRIT2T(Pharmacia);真核的:PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,也可以应用任何其它的质粒或其它的载体,只要它们可以在宿主中复制并且可存活。可以在本发明中使用低拷贝数或高拷贝数的载体。
表达载体可以包括启动子、用于起始翻译的核糖体结合位点和转录终止子。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起点、任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、5’侧翼非转录序列。在一些方面,衍生于SV40剪接子和聚腺苷酸化位点的DNA序列可以用于提供所需要的非转录遗传元件。
在一个方面,表达载体含有一个或多个选择性标记基因,使得可以对含有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因或使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或氨苄青霉素抗性的基因和酿酒酵母(S.cerevisiae)TRP1基因。启动子区域可以从任何期望的基因中选择出来,使用氯霉素转移酶(CAT)载体或具有选择标记的其它载体。
用于在真核细胞中表达多肽或其片段的载体也可以含有增强子,以增加表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp,其作用于启动子,增强其转录。例子包括在复制起点下游侧100bp到270bp的SV40增强子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子,和腺病毒增强子。
DNA序列可以通过各种方法插入载体中。一般而言,将插入物和载体用合适的限制性内切酶消化后,DNA序列可以连接到载体中的所希望的位置。可选择地,插入物和载体的平末端可以被连接。多种克隆技术在本领域已知,例如在Ausubel和Sambrook中描述的。这样的方法和其它方法被认为在本领域技术人员的范围内。
载体可以是质粒、病毒颗粒或噬菌体的形式。其它载体包括染色体的、非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达载体被例如Sambrook描述。
可以使用的具体细菌载体包括商业上可获得的质粒,其包括以下熟知的克隆载体的遗传元件:pBR322(ATCC37017)、pKK223-3(PharmaciaFineChemicals,Uppsala,Sweden)、GEM1(PromegaBiotec,Madison,WI,USA)、pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174pBluescriptIIKS、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。具体的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何其它载体,只要它可以在宿主细胞中复制和存活。宿主细胞和转化的细胞
本发明也提供包括发明核酸序列,如编码本发明磷脂酶的序列、本发明的载体的转化的细胞。宿主细胞可以是本领域技术熟练人员所熟悉的任何宿主细胞,包括原核细胞,真核细胞,如细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或者植物细胞。本发明的酶可以在任何宿主细胞中表达,例如任何细菌细胞、任何酵母细胞,例如巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母(Schizosaccharomycespombe)。示例性的细菌细胞包括埃希氏菌属(Escherichia)、杆菌属(Bacillus)、链霉菌属(Streptomyces)、沙门氏菌属(Salmonella)、假单胞菌属(Pseudomonas)和葡萄球菌属(Staphylococcus)内的任何种,包括例如大肠杆菌(E.coli)、乳酸乳球菌(Lactococcuslactis)、枯草芽孢杆菌(Bacillussubtilis)、蜡状芽孢杆菌(Bacilluscereus)、鼠伤寒沙门菌(Salmonellatyphimurium)和荧光假单胞菌(Pseudomonasfluorescens)。示例性真菌细胞包括曲霉菌属(Aspergillus)内的任何种。示例性酵母细胞包括毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或许旺酵母属(Schwanniomyces)的种,包括巴斯德毕赤酵母(Pichiapastoris)、酿酒酵母(Saccharomycescerevisiae)或粟酒裂殖酵母(Schizosaccharomycespombe)。示例性昆虫细胞包括灰翅夜蛾属(Spodoptera)或果蝇属(Drosophila)内的任何种,包括果蝇S2(DrosophilaS2)和草地夜蛾Sf9(SpodopteraSf9)。示例性的动物细胞包括CHO、COS或者Bowesmelanoma或者任何小鼠或者人类细胞系。适当的宿主的选择是在本领域技术人员的能力之内。
载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M.,Battey,I.,BasicMethodsinMolecularBiology,(1986))。
在适当的情况下,工程化宿主细胞可以在传统的营养培养基中培养,所述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度变化或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽或其片段。
细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包括冷冻-融解循环、超声波裂解法、机械破碎法或使用细胞裂解剂。这些方法为本领域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析和凝集素层析在内的方法回收和纯化。假如必要的话,可以应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用高效液相层析(HPLC)。
各种哺乳动物培养系统可以用来表达重组蛋白。哺乳动物表达系统的例子包括猴肾成纤维细胞COS-7细胞系和能够从相容性载体中表达蛋白的其它的细胞系,如C127、3T3、CHO、Hela和BHK细胞系。
宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产物。取缺于重组生产方法中所用的宿主,由含有载体的宿主细胞产生的多肽可以糖基化或者未糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸残基。
也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可以应用由DNA构建物转录得到的mRNA,所述DNA构建物包括与编码所述多肽或其片段的核酸可操作地连接的启动子。在一些方面,该DNA构建物在进行体外转录反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔网状细胞提取物温育,产生所需的多肽或其片段。
表达载体可以含有一个或多个选择性标记基因,为选择转化的宿主细胞提供表型特征,例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性,或者例如大肠杆菌的四环素或氨苄青霉素抗性。
示例性磷脂酶C酶(具有SEQIDNO:2中所示的序列)已在各种宿主系统中以活性形式被过量表达,这些系统包括革兰氏阴性细菌,诸如大肠杆菌,革兰氏阳性细菌,诸如任何杆菌属的种(例如枯草芽孢杆菌、蜡状芽孢杆菌)、酵母宿主细胞(包括例如巴斯德毕赤酵母、酵母属某种(Saccharomycessp.),诸如酿酒酵母和粟酒裂殖酵母)和乳酸乳球菌或哺乳动物、真菌、植物或昆虫细胞。在每一宿主系统中,由各种构建物表达活性酶。这些核酸表达构建物可以包含编码全长开放阅读框(由信号序列、前序列和成熟蛋白编码序列组成)的核苷酸,或它们可以包含这些遗传元件的亚组,单独或者与异源遗传元件组合,异源遗传元件充当信号序列和/或成熟开放阅读框的前序列。这些系统中的每一个可以充当表达PLC的商用生产性宿主,PLC用于之前描述的酶法油脱胶方法中。核酸的扩增
在实践本发明时,编码本发明多肽的核酸,或者修饰的核酸可以如通过扩增复制。本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对。在一方面,引物对能够扩增本发明的核酸序列。本领域技术人员可以设计用于扩增这些序列的任何部分或全长的扩增引物序列对。
本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增包括本发明序列,或者其片段或子序列的核酸。扩增引物序列对的其中一个或每一个成员可以包括含有该序列的至少大约10到50个连续碱基的寡核苷酸,或者包括含有该序列的大约12、13、14、15、16、17、18、19、20、21、22、23、24或者25个连续碱基的寡核苷酸。
本发明提供扩增引物对,其中引物对包括具有在本发明核酸的大约前(5′端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第一成员,和具有在第一成员的互补链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第二成员。本发明提供应用本发明的扩增引物对,通过扩增如聚合酶链式反应(PCR)产生的磷脂酶。本发明提供使用本发明的扩增引物对,通过扩增例如聚合酶链式反应(PCR)制备发明磷脂酶的方法。在一方面,扩增引物对从文库,例如基因文库,如环境文库中扩增核酸。
扩增反应也可以被用于量化样品中核酸的量(如细胞样品中信息的量)、标记核酸(例如将其应用于阵列或印迹)、检测核酸,或量化样品中特异性核酸的量。在本发明的一个方面,扩增从细胞或cDNA文库分离出的信息。技术人员可以选择和设计合适的寡核苷酸扩增引物。扩增方法在本技术领域也是熟知的,包括,例如聚合酶链式反应PCR(例如参见PCRPROTOCOLS,AGUIDETOMETHODSANDAPPLICATIONS,ed.Innis,AcademicPress,N.Y.(1990)和PCRSTRATEGIES(1995),ed.Innis,AcademicPress,Inc.N.Y.,连接酶链式反应(LCR)(例如参见Wu(1989)Genomics4:560;Landegren(1988)Science241:1077;Barringer(1990)Gene89:117);转录扩增(例如参见Kwoh(1989)Proc.Natl.Acad.Sci.USA86:1173);和自主维持序列复制(例如参见Guatelli(1990)Proc.Natl.Acad.Sci.USA87:1874);Qβ复制酶扩增(例如参见Smith(1997)J.Clin.Microbiol.35:1477-1491),自动Q-β复制酶扩增测定法(例如参见Burg(1996)Mol.Cell.Probes10:257-271)和其它的RNA聚合酶介导的技术(例如NASBA,Cangene,Mississauga,Ontario);也参见Berger(1987)MethodsEnzymol.152:307-316;Sambrook;Ausubel;美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology13:563-564。确定序列同一性程度
本发明提供包括与本发明的示例性核酸(例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178,以及编码具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178的核酸),在至少大约50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或者更多的残基范围内,具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)的序列同一性的序列的分离的和重组的核酸。本发明提供包括与本发明的示例性多肽具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100%)的序列同一性的序列的多肽。序列同一性(同源性)的程度可以应用任何计算机程序和相关参数来确定,包括那些在此所描述的,如用默认参数的BLAST2.2.2.或者FASTA3.0t78版。在可选择的实施方式中,序列同一性可以在核酸或者多肽的至少大约5、10、20、30、40、50、100、150、200、250、300、350、400个连续的残基,或者全长的范围内。序列同一性(同源性)的程度可以应用任何计算机程序和相关联的参数来确定,包括那些在此所说明的,如使用默认参数的BLAST2.2.2.或者FASTA3.0t78版。
图11用图表描述了本发明的示例性核酸和多肽的选择的特征,包括示例性序列与公共数据库的序列同一性比较。图11中描述的所有序列对两组数据库进行BLAST搜索(如在下面详细描述地)。第一数据库获自NCBI(美国国家生物技术信息中心)。对这些数据库搜索所获得的所有结果参见名称为“NR描述(NRDescription)”、“NR登录号(NRAccessionCode)”、“NR评价(NREvalue)”或“NR生物(NROrganism)”的各栏。“NR”指由NCBI维护的非-冗余(Non-Redundant)核苷酸数据库。该数据库是GenBank、GenBank更新和EMBL更新的综合。栏“NR描述(NRDescription)”中的条目指任何给定的NCBI记录中的定义行(definitionline),其包括了对序列的描述,诸如来源生物、基因名称/蛋白质名称,或对序列的一些功能描述。“NR登录号(NRAccessionCode)”一栏中的条目指给予序列记录的独特的标识符(identifier)。“NR评价(NREvalue)”一栏中的条目指期望值(评价),其代表了这样的可能性:同询问序列(querysequence)(本发明的序列)与数据库序列之间发现的比对分值一样良好的比对分值,发现在随机序列之间具有相同的数量的比较,如在当前的BLAST搜索中所进行的。“NR生物(NROrganism)”一栏中的条目指被鉴定为关系最密切的BLAST命中(hit)的序列的来源生物。第二组数据库统称为GeneseqTM数据库,其可从ThomsonDerwent(Philadelphia,PA)获得。对该数据库所作搜索的所有结果参见名称为“Geneseq蛋白质描述(GeneseqProteinDescription)”、“Geneseq蛋白质登录号(GeneseqProteinAccessionCode)”、“Geneseq蛋白质评价(GeneseqProteinEvalue)”、“GeneseqDNA描述(GeneseqDNADescription)”、“GeneseqDNA登录号(GeneseqDNAAccessionCode)”、“GeneseqDNA评价(GeneseqDNAEvalue)”各栏中。这些栏中发现的信息与上述NR各栏中发现的信息具有可比性,除了它来自对GeneseqTM数据库而不是对NCBI数据库进行的BLAST搜索。此外,该表包括栏“预测的EC编号(PredictedECNo.)”一栏。EC编号是根据标准化的酶命名法的方案赋予一类酶的编号,该命名法是由国际生物化学和分子生物学联合会(IUBMB)的命名委员会的酶分组(EnzymeCommissionoftheNomenclatureCommitteeofInternationalUnionofBiochemistryandMolecularBiology)开发的。在“预测的EC编号”栏中的结果由对Kegg(KyotoEncyclopediaofGenesandGenomes)数据库的BLAST搜索结果测定。如果最高BLAST匹配(topBLASTmatch)的评价值等于或小于e-6,那么赋予最高匹配的EC编号进入表中。最高命中(tophit)的EC编号用作向导,用于指出本发明序列的EC编号可能是什么。“询问DNA长度(QueryDNALength)”和“询问蛋白质程度(QueryProteinLength)”这两栏分别指本发明的序列中核苷酸的数目或氨基酸的数目,本发明的序列被用于对NCBI或Geneseq数据库进行搜索或查询。“Geneseq或NRDNA长度(GeneseqorNRDNALength)”、“Geneseq或NR蛋白质长度(GeneseqorNRProteinLength)”这两栏分别指从BLAST搜索获得的最高匹配的序列中的核苷酸的数目或氨基酸的数目。这些栏中给出的结果来自搜索,其将较低的评价——或者来自NCBI数据库或者来自Geneseq数据库的较低的评价返回(return)。“Geneseq或NR%ID蛋白质(Geneseq或NR%IDProtein)”和“Geneseq或NR%IDDNA(GeneseqorNR%IDDNA)”指本发明序列与最高BLAST匹配的序列之间的百分序列同一性。这些栏中给出的结果来自搜索,其将较低的评价——或者来自NCBI数据库或者来自Geneseq数据库的较低的评价返回。
同源性序列也包括RNA序列,其中在核酸序列中尿嘧啶替代了胸腺嘧啶。同源序列可以应用在此说明的任何程序得到或者可以由校正测序错误得到。应该理解到的是,在此所示核酸序列可以以传统的单字母形式表示(见,如,Stryer,Lubert.Biochemistry3rdEd.,W.H.Freeman&Co.,NewYork)或者以记录序列中的核苷酸的同一性的任何其它形式来表示。
在本发明的这一方面,可以使用在此指明的各种序列比较程序。蛋白和/或核酸序列同一性(同源性)可以应用本领域已知的任何序列比较算法和程序评估。这样的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA85(8):2444-2448,1988;Altschul等,J.Mol.Biol.215(3):403-410,1990;Thompson等,NucleicAcidsRes.22(2):4673-4680,1994;Higgins等,MethodsEnzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410,1990;Altschul等,NatureGenetics3:266-272,1993)。
同源性或者同一性可以应用序列分析软件来测定(例如,位于1710UniversityAvenue,Madison,WI53705的威斯康星大学生物技术中心遗传学计算机组(GeneticsComputerGroup)的序列分析软件包)。这样的软件通过对各种缺失、置换和其它的修饰指定同源性程度来匹配相似的序列。在两个或者多个核酸或者多肽序列的情况下,术语“同源性”和“同一性”是指两个或者多个序列或者子序列,当在比较窗口或者指定区域中应用任何数量的序列比较算法或者手动比对和目测来测定,通过比较和比对以便获得最大的一致性时,它们是相同的或者具有相同的氨基酸残基或者核苷酸的特异百分比。对于序列比较,一个序列可以作为参照序列与待测序列进行比较。当应用序列比较算法,待测序列和参照序列被输入到计算机中,指定子序列坐标,如果必要,指定序列算法程序参数。可以应用默认程序参数,或者指定选择性参数。依据程序参数,序列比较算法计算待测序列和参照序列同一性的百分比。
如本文所用,“比较窗口(comparisonwindow)”,包括涉及任一数目的连续残基的片段。例如,在本发明可选择的方面,当两个序列优化比对后,将范围从20到本发明的示例性序列的全长的连续残基,与相同数目的连续位置的参照序列进行比较。如果参照序列与本发明的示例性序列具有必要的序列同一性,如50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的序列同一性,那么该序列是属于本发明的范围。在可选择的实施方式中,当两个序列优化地比对后,将范围从大约20到600、大约50到200、和大约100到150的序列,与同样数目的连续位置的参照序列进行比较。用于比较的联配方法在本技术领域是熟知的。可以通过如下方法进行用于比较的序列的最优化联配:例如Smith和Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法,Needleman和Wunsch,J.Mol.Biol.48:443,1970的同源性联配算法,person和Lipman,Proc.Nat′l.Acad.Sci.USA85:2444,1988的查找相似性的方法,这些算法的计算机化实施(WisconsinGeneticsSoftwarePackage中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,WI),或者手工联配和观察检验。除了BLAST程序(国家生物信息中心的基本局域联配搜索工具(BasicLocalAlignmentSearchTool))外,用于确定同源性或者同一性的其它的算法包括,例如,ALIGN、AMAS(多重联配序列分析(AnalysisofMultiplyAlignedSequences))、AMPS(蛋白多重序列联配(ProteinMultipleSequenceAlignment))、ASSET(联配片段统计评估工具(AlignedSegmentStatisticalEvaluationTool))、BANDS、BESTSCOR、BIOSCAN(生物学序列比较分析节点(BiologicalSequenceComparativeAnalysisNode))、BLIMPS(BLocksIMProvedSearcher)、FASTA、Intervals&Points、BMB、CLUSTALV、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、LasVegas算法、FNAT(强迫核苷酸联配工具(ForcedNucleotideAlignmentTool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky序列分析软件包)、GAP(全局联配程序(GlobalAlignmentProgram))、GENAL、GIBBS、GenQuest、ISSC(灵敏性序列比较(SensitiveSequenceComparison))、LALIGN(局部序列联配(LocalSequenceAlignment))、LCP(局部内容程序(LocalContentProgram))、MACAW(多重联配构建和分析工作台(MultipleAlignmentConstruction&AnalysisWorkbench))、MAP(多重联配程序(MultipleAlignmentProgram))、MBLKP、MBLKN、PIMA(模式诱导的多重序列联配(Pattern-InducedMulti-sequenceAlignment))、SAGA(通过遗传算法的序列联配(SequenceAlignmentbyGeneticAlgorithm))和WHAT-IF。这样的联配程序也可以用于筛查基因组数据库,以鉴定具有大体上相同的序列的多核苷酸序列。大量的基因组数据库是可利用的,例如,作为人类基因组测序工程的一部分的人类基因组的实质部分可以被利用(Gibbs,1995)。若干基因组已经被测序,如生殖器支原体(M.genitalium)(Fraser等,1995)、甲烷球菌(M.jannaschii)(Bult等,1996)、流行性感冒杆菌(H.influenzae)(Fleischmann等,1995)、大肠杆菌(E.coli)(Blattner等,1997)和酵母(酿酒酵母(S.cerevisiae))(Mewes等,1997)和黑腹果蝇(D.melanogaster)(Adams等,2000)。在模式生物的基因组序列的测序上已经取得了很大的进展,如小鼠,线虫(C.elegans)和拟南芥(Arabadopsissp.)。含有基因组信息并且注释有一些功能性信息的数据库由不同组织维护,可以通过互联网登录。
BLAST、BLAST2.0和BLAST2.2.2算法也用于实践本发明。这些算法在,如Altschul(1977)Nuc.AcidsRes.25:3389-3402;Altschul(1990)J.Mol.Biol.215:403-410中有描述。用于实施BLAST分析的软件可以通过美国国家生物技术信息中心公开获得。这一算法涉及首先通过鉴别待询序列(querysequence)中长度为W的短的字串来确定高分序列对(highscoringsequencepairs,HSPs),所述高分序列对在与数据库序列中同样长度的字串联配时,匹配或者满足某些正值的阈值T。T是指邻近字串(neighborhoodword)的分数阈值(Altschul(1990),如上)。这些初始的邻近字串作为种子(seed)用来启动搜索以发现包含有它们的更长的HSPs。只要累积的联配分数能够被增加,所述字串一直沿着每一个序列向两个方向延伸。对于核苷酸序列,使用参数M(一对匹配的残基的奖励分数;总是大于0)来计算累积分数。对于氨基酸序列,使用记分矩阵来计算累计分数。出现下面情况时,字串在各个方向上的延伸便停止:累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分为负的残基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核苷酸序列)使用的默认值的是:字串长度(W)为11,期望值(E)为10,M=5,N=-4,对两条链进行比较。对于氨基酸序列,BLASTP程序使用的默认值的是:字串长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989),Proc.Natl.Acad.Sci.USA89:10915)联配(B)为50,期望值(E)为10,M=5,N=-4,对两条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分析(参见,例如,Karlin和Altschul(1993),Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一种相似性量度是最小合计概率(smallestsumprobability,P(N)),其表示两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在测试核酸和参考核酸的比较中,如果最小合计概率小于约0.2,在一方面中更优选的是小于约0.01,在一方面中最优选的是小于约0.001,就认为该核酸与参考序列相似。一方面,应用基本局域联配搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。具体而言,五个特定的BLAST程序可以用来进行以下的任务:(1)BLASTP和BLAST3将氨基酸待询序列与蛋白质序列数据库进行比较;(2)BLASTN将核苷酸待询序列与核苷酸序列数据库进行比较;(3)BLASTX将待询核苷酸序列(两条链)的六个阅读框架的概念上的翻译产物与蛋白序列数据库进行比较;(4)TBLASTN将待询蛋白序列与核苷酸序列数据库的所有六个阅读框架(两条链)的翻译结果进行比较;和(5)TBLASTX将核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结果进行比较。BLAST程序通过确定相似片段来确定同源序列,所述相似片段在此是指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoringsegmentpairs)”,该受测序列优选从蛋白或者核酸序列数据库得到。高分片段对优选利用记分矩阵来鉴定(即,联配),很多的记分矩阵在本领域是已知的。优选地,应用的记分矩阵为BLOSUM62矩阵(Gonnet等,Science256:1443-1445,1992);Henikoff和Henikoff,Proteins17:49-61,1993)。较不优选地,也可以应用PAM或者PAM250矩阵(参见如,Schwartz和Dayhoff,eds.,1978,MatricesforDetectingDistanceRelationships:AtlasofproteinSequenceandStructure,Washingion:NationalBiomedicalResearchFoundation)。
本发明的一方面,为了确定是否核酸具有本发明范围内的必需的序列同一性,应用NCBIBLAST2.2.2程序,默认值的选择是blastp。在BLAST2.2.2程序中,有大约38个设置选择。在本发明的该示例性方面,除了默认的过滤设置外,应用所有的默认值(即除了过滤设置为关闭(OFF)外,所有的参数设定为默认值),在该位置上应用“-FF”设置,其使得不能进行过滤。由于短的序列的长度的缘故,默认过滤的使用经常导致与Karlin-Altschul不同。
如上所述,用于本发明该示例性方面,并用于测定图11中值的默认值包括:“低复杂性过滤器(Filterforlowcomplexity):开启(ON)>字长:3>矩阵:Blosum62>空位成本:存在值:11>延伸:1”其它的默认值设置为:低复杂性过滤器关闭(OFF),蛋白质字长为3,BLOSUM62矩阵,空位存在罚值-11,并且空位延伸罚值-1。
示例性的NCBIBLAST2.2.2程序设置在下面的实施例1中阐明。注意,“-W”选项默认值为0。这是指,如果没有设置,对于蛋白,字长默认值为3,对于核苷酸字长默认值为11。计算机系统和计算机程序产品
为了确定和鉴定序列同一性、结构同源性、基序和在计算机芯片上的类似物,本发明的多肽或核酸序列可以在可被计算机读取和访问的任何介质上存储、记录和操作。因此,本发明提供了计算机、计算机系统、计算机可读取的介质、计算机程序产品以及其上记录或存储了本发明的核酸和多肽序列,例如本发明的示例性序列的类似设备。如本文所用,词语“记录”和“存储”指在计算机介质上存储信息的过程。熟练的技术人员能容易地采用任何已知方法,在计算机可读取的介质上存储信息,以产生包括本发明的一个或多个核酸和/或多肽序列的产品。
本发明的另一方面是其上已记录有本发明的至少一个核酸和/或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质、闪存。例如,计算机可读介质可以是硬盘、软盘、磁带、闪存、CD-ROM、数码多功能光盘(DVD)、随机存储器(RAM)、或只读存储器(ROM)或本领域技术人员知道的任何类型的介质。
本发明的方面包括系统(如,以因特网为基础的系统),特别地计算机系统,其存储和操作在此描述的序列和序列信息。计算机系统100的一个例子描述在图1的方块图中。正如此处所用,“计算机系统”指硬件部分、软件部分以及数据存储部分,它们用于分析本发明的核酸序列的核苷酸序列或本发明的多肽序列。计算机系统100可包括用于处理、访问和操纵序列数据的处理器。处理器105可以是任何熟知类型的中央处理单元,如来自英特尔公司的奔腾III,或来自Sun、Motorola、Compag、AMD或IBM公司的类似处理器。计算机系统100是一个通用的系统,该系统包括处理器105和用于存储数据的一个或多个内部数据存储部件110,以及用于检索数据存储部件上存储的数据的一个或多个数据检索设备。技术人员能容易地意识到,任何一种当前可获得的计算机系统都是合适的。
在一个特定的方面,计算机系统100包括连接到总线上的处理器105,总线连接到主存储器115(优选地,以RAM来实现),和一个或多个内部数据存储设备110,例如其上已经存储了数据的硬盘驱动器和/或其它计算机可读介质。计算机系统100进一步包括一个或多个数据检索设备118,用于读取在内部数据存储设备110上存储的数据。
数据检索设备118可以是,例如软盘驱动器、压缩磁盘驱动器、磁带驱动器或能连接到远程数据存储系统的调制解调器(例如通过因特网)等等。在一些实施方式中,内部数据存储设备110是可移动的计算机可读介质,例如含有控制逻辑和/或其上记录的数据的软盘、压缩磁盘、磁带等等。计算机系统100可以有利地包括适当的软件或用适当的软件编程,用于当数据存储部件被插入到数据检索设备中时从数据存储部件读取控制逻辑和/或数据。
计算机系统100包括用于给计算机应用者显示输出的结果的显示器120。应当注意到,计算机系统100可以在网络中或者宽域网中与其它的计算机系统125a-c相联,以便给计算机100提供集中访问。访问和处理本发明的核苷酸或者氨基酸序列的软件可以在执行过程中驻留在主存储器115中。
在一些方面,计算机系统100可以进一步包括比较发明的本核酸序列的序列比较算法。算法和序列可以储存在计算机可读的介质中。“序列比较算法”是指一个或多个程序,其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数据储存装置中存储的其它的核苷酸序列和/或化合物。例如,序列比较算法可将储存在计算机可读介质上的示例性序列的核苷酸序列与储存在计算机可读介质上的参考序列比较,以鉴定同源性或结构基序。
以上算法应用的参数可以依据所研究的序列长度和同源性水平而加以调整。在一些方面,在使用者没有给出指令的情况下,算法使用的参数可以应用默认参数。图2是说明过程200的一个方面的流程图,这个处理过程是为了确定新序列和数据库中的序列间的同源性水平,把新的核苷酸或者蛋白序列与数据库中的序列加以比较。含有序列的数据库可以是存储于计算机系统100的私人数据库,或者公共的数据库,如通过因特网可以访问到的GENBANK。过程200开始于起始状态201,然后转到状态202,其中待比较的新序列存储在计算机系统100的存储器上。如上讨论,存储器可以是任何形式的存储器,包括RAM或者内部存储设备。
然后过程200转到状态204,其中打开序列数据库以进行分析和比较。然后过程200转到状态206,其中数据库中存储的第一个序列被读取到计算机的存储器中。然后在状态210进行比较,以确定第一个序列是否与第二个序列相同。重要的是应该注意到,该步骤不限于进行新序列和数据库中第一个序列之间的精确比较。用于比较两个核苷酸或蛋白序列的熟知的方法对于本技术领域的普通技术人员是已知的,即使所述两个核苷酸或蛋白序列不相同。例如,可以在一个序列中引入空位,以提高两个测试序列之间的同源性水平。控制空位或其它特征在比较过程中是否被引入到序列中的参数通常由计算机系统的用户输入。
一旦已经在状态210进行两个序列的比较,在决策状态210就要作出两个序列是否相同的判断。当然,术语“相同的”不限于绝对相同的序列。在过程200中,在由用户输入的同源性参数范围内的序列都将被标记为“相同的”。如果作出两个序列相同的判断,过程200转到状态214,其中来自数据库的序列的名称被显示给用户。该状态通知用户,具有显示的名称的序列满足所输入的同源性限制。一旦所存储序列的名称被显示给用户,过程200转到决策状态218,其中作出数据库中是否存在更多序列的判断。如果数据库中不存在更多的序列,那么过程200在结束状态220终止。然而,如果数据库中确实存在更多的序列,那么过程200转到状态224,其中指针被指向数据库中的下一个序列,以便与新序列进行比较。以这种方式,将新序列与数据库中的每一序列联配并进行比较。
应该注意到,如果已经在决策状态212已经作出了序列不同源的判断,那么过程200将立即转到决策状态218,以便确定用于比较的数据库中的任何其它序列是否可利用。因此,发明的一方面是包括处理器,其上储存有本发明的核酸序列的数据存储设备以及用于进行比较的序列比较器的计算机系统。序列比较器可以指示待比较序列之间的同源性水平或者鉴定结构基序,或者可以确定与这些核酸代码和多肽代码相比较的序列中的结构基序。
图3是示意性说明计算机中的过程250的一个实施方式的流程图,该过程用于确定两个序列是否同源。过程250在起始状态252开始,然后转到状态254,其中要被比较的第一个序列被存储到存储器上。然后要被比较的第二个序列在状态256被存储到存储器上。然后过程250转到状态260,其中读取第一个序列中的第一个字符,然后转到状态262,其中读取第二个序列的第一个字符。应该理解到,如果序列是核苷酸序列,那么字符将通常是A、T、C、G或U。如果序列是蛋白序列,那么字符可以是单字母氨基酸代码,以便第一个序列和第二个序列可以被容易地比较。然后在决策状态264作出两个字符是否相同的判断。如果它们相同,那么过程250转到状态268,其中第一个和第二个序列中的下一个字符被读取。然后作出该下一个字符是否相同的判断。如果它们相同,那么过程250继续循环,直到两个字符不相同。如果作出的判断是这两个字母不相符,那么过程250转到决策状态274,以确定是否有更多的字符或者序列可以读取。如果没有可读取的任何更多的字符,那么过程250转到状态276,其中第一个和第二个序列之间的同源性水平被显示给用户。同源性水平通过计算序列之间相同的字符在第一个序列的序列总数中的比例来确定。因此,如果前100个核苷酸序列中的每一个字符都与第二个序列中的每一个字符联配,那么同源性水平将是100%。
可选地,计算机程序可以比较参照序列与本发明的序列,以确定是否序列在一个或者多个位置上不同。程序可以记录本发明序列或参照序列中插入、缺失或者替换的核苷酸或者氨基酸残基的长度和同一性。计算机程序可以是确定是否参照序列与本发明的序列相比,含有单核苷酸多态性(SNP),或者是否本发明的序列含有已知序列的SNP的程序。因此,在一些方面,计算机程序是鉴定SNPs的程序。该方法可以通过以上描述的计算机系统来完成并且该方法描述在图3中。该方法可以通过应用计算机程序读取本发明序列和参照序列,并且用计算机程序来鉴定差异来进行。
在其它方面,以计算机为基础的系统包括鉴定本发明的核酸或者多肽中的特征的鉴定器。“鉴定器”是指鉴定核酸序列中的某些特征的一个或者多个程序。例如,鉴定器可以包括鉴定核酸序列中的开放阅读框架(ORF)的程序。图4是说明用于检测序列中特征存在与否的鉴定器程序300的一个方面的流程图。过程300起始于起始状态302,然后转到状态304,其中待检测特征的第一序列存储于计算机系统100的存储器115上。过程300然后转到状态306,在该状态下,打开具有序列特征的数据库。这样数据库将包括一系列每一个特征的属性和特征的名称。例如,特征名称可以是“起始密码子”,属性为“ATG”。另一个例子是特征名称为“TAATAA盒”,特征属性为“TAATAA”。这样的数据库的例子是由威斯康辛大学遗传学计算机组(UniversityofWisconsinGeneticsComputerGroup)制作。可选地,特征可以是结构多肽基序,如α螺旋、β折叠,或者功能性多肽基序,如酶的活性位点、螺旋-转角-螺旋基序或者本领域技术知道的其它基序。一旦在状态306打开特征数据库,过程300转到状态308,其中第一特征从数据库中读取。然后在状态310中进行第一特征的属性与第一序列的比较。然后在决定状态316下作出决定,确定是否在第一序列发现所述特征的属性。如果发现该属性,过程300转到状态318,其中所发现的特征的名称显示给使用者。过程300然后转到决定状态320,在其中作出是否在数据库中存在更多的特征的决定。如果不存在更多的特征,过程300终止于结束状态324。然而,如果数据库中确实存在有更多的特征,那么过程300在状态326读取下一个序列特征,并且循环回到状态310,其中该下一个特征的属性与第一序列进行比较。如果在决定状态316在第一个序列中没有发现特征属性,那么过程300直接转到决定状态320,以便确定数据库中是否存在更多特征。因此,在一方面,本发明提供了鉴定开放阅读框架(ORFs)的计算机程序。
本发明的多肽或核酸序列可在各种数据处理程序中以多种格式被储存和进行操作。例如,序列可以以文本形式储存在字处理文件如MicrosoftWORD或WORDPERFECT中,或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程序如DB2、SYBAS或ORACL中。另外,许多计算机程序和数据库都可用作序列比较算法、鉴定器、或参考核苷酸序列或多肽序列的来源,所述参考核苷酸序列或多肽序列要与本发明的核酸序列进行比较。用于实践本发明的程序和数据库包括,但不限于:MacPattern(EMBL)、DiscoveryBase(MolecularApplicationsGroup)、GeneMine(MolecularApplicationsGroup)、Look(MolecularApplicationsGroup)、MacLook(MolecularApplicationsGroup)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX(Altschul等,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、Catalyst(MolecularSimulationsInc.)、Catalyst/SHAPE(MolecularSimulationsInc.)、Cerius2.DBAccess(MolecularSimulationsInc.)、HypoGen(MolecularSimulationsInc.)、InsightII(MolecularSimulationsInc.)、Discover(MolecularSimulationsInc.)、CHARMm(MolecularSimulationsInc.)、Felix(MolecularSimulationsInc.)、DelPhi(MolecularSimulationsInc.)、QuanteMM(MolecularSimulationsInc.)、Homology(MolecularSimulationsInc.)、Modeler(MolecularSimulationsInc.)、ISIS(MolecularSimulationsInc.)、Quanta/ProteinDesign(MolecularSimulationsInc.)、WebLab(MolecularSimulationsInc.)、WebLabDiversityExplorer(MolecularSimulationsInc.)、GeneExplorer(MolecularSimulationsInc.)、SeqFold(MolecularSimulationsInc.)、MDL可用化学制品目录数据库(AvailableChemicalsDirectorydatabase)、MDL药品数据报告数据库(DrugDataReportdatabase)、综合医药化学数据库(ComprehensiveMedicinalChemistrydatabase)、德温特世界药物索引数据库(WorldDrugIndexdatabase)、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。其它的程序和数据库对于本公开内容的所述技术领域内的技术人员是显而易见的。
可以用上述程序检测的基序包括:编码亮氨酸拉链的序列、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、α螺旋和β折叠、编码指导被编码的蛋白分泌的信号肽的信号序列、在转录调节中涉及的序列如同源框、酸性伸展物(acidicstretches)、酶活性位点、底物结合位点和酶切割位点。核酸的杂交
本发明提供了可在严格性条件下与本发明的示例性序列,例如在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所提及的序列,或者编码包括在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所提及的序列的多肽的核酸杂交的分离的、合成的或者重组的核酸。严格条件可以是高度严格条件、中度严格条件、低度严格条件,包括在此描述的高度的和降低的严格性条件。在可选的方面,本发明的核酸根据它们在严格条件下杂交的能力来定义,它们可以在大约5个残基到某分子,例如本发明的示例性核酸全长之间。例如,它们的长度可以是至少5、10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400个残基。比全长核酸较短的核酸也包括在内。这些核酸可以用作例如杂交探针、标记探针、PCR寡核苷酸探针、iRNA(单链或者双链)、编码抗体结合肽(表位)的反义序列或序列、基序、活性位点、结合结构域、调控结构域以及类似物。
一方面,本发明的核酸通过它们在高度严格性下杂交的能力定义,高度严格性包括在大约37℃到42℃的温度下大约50%的甲酰胺的条件。一方面,本发明的核酸通过它们在降低的严格性下杂交的能力定义,降低的严格性包括在大约30℃到35℃在大约35%至25%的甲酰胺中的条件。可以选择地,本发明的核酸通过它们在高度严格性下杂交的能力定义,高度严格性包括的条件为:在42℃、在50%甲酰胺、5×SSPE、0.3%SDS中,和封闭核酸的重复序列,如cot-1或鲑精DNA(例如200μg/ml的剪切和变性鲑精DNA)。一方面,本发明的核酸通过它们在降低的严格性条件下杂交的能力定义,降低的严格性条件包括在35℃的降低温度下的35%甲酰胺中。
杂交以后,滤膜可以在50℃,用6×SSC,0.5%的SDS洗涤。超过25%的甲酰胺,这些条件认为是“中度”条件,低于25%的甲酰胺,这些条件认为是“低度”条件。“中度”杂交条件的一个特定例子是当上面的杂交在甲酰胺为30%进行时。“低严格性”杂交条件的特定例子是当上面的杂交在甲酰胺为10%进行时。
与特定水平的严格性相对应的温度范围可以进一步通过计算感兴趣的核酸中嘌呤与嘧啶的比例,并且相应地调节温度来缩小。本发明的核酸也通过其可以在Ausubel和Sambrook中所述的高度、中度、低度严格性条件下杂交的能力来定义。对上面的范围和条件所作的变化可以用于实施本发明,并且是本领域技术人员所熟知的。下面进一步描述了杂交条件。寡核苷酸探针和应用方法
本发明也提供了用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探针。一方面,探针包括在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:177或SEQIDNO:178中所阐明的序列的至少10个连续的碱基。可选地,本发明的探针可以是本发明的序列中所阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、50、55、60、65、70、75、80、90、100或150,或更多,或大约10到50、大约20到60、大约30到70个连续碱基。这些探针通过结合或者杂交来鉴定核酸。这些探针可以用于本发明的阵列中,见下面的讨论,包括例如毛细管阵列。本发明的探针也可以用于分离其它的核酸或多肽。
本发明的探针可以用于确定是否生物样品,如土壤样品,含有具有本发明的核酸序列的生物或者可以从其获得该核酸的生物。在这一程序中,获得了潜在地隐藏了从其分离得到核酸的生物体的生物样品,并且从该生物样品获得核酸。在允许探针与样品中存在的任何互补序列特异性杂交的条件下,将核酸与探针接触。在必要的情况下,为了确定允许探针特异地与互补序列杂交的条件,可以让探针与来自已知含有互补序列的样品中的互补序列相接触,同时与不含有互补序列的对照序列相接触。杂交条件,如杂交缓冲液中的盐浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度,可以进行变化以确定允许所述探针特异地与互补的核酸杂交的条件(参见有关特异性杂交条件的论述)。
如果该样品含有从中可分离出核酸的生物体,那么探针的特异性杂交被检测到。杂交可以通过用可检测的试剂标记探针来检测,所述可检测的试剂如放射性同位素、荧光染料或能催化可检测产物形成的酶。使用标记探针来检测样品中互补核酸的存在的许多方法对于本领域技术人员是熟知的。这些方法包括DNA印迹法、RNA印迹法、集落杂交方法和斑点印迹法。这些方法中的每一种方法的方案在Ansubel和Sambrook中给出。
可选地,可以在一个扩增反应中使用一种以上的探针(其中的至少之一可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含有包括本发明的核酸序列的生物体(如,从中分离出所述核酸的生物体)。在一方面,所述探针包括寡核苷酸。一方面,所述扩增反应可以包括PCR反应。PCR的实验方案见前面Ausubel和Sambrook的如上的所述(参见有关扩增反应的讨论)。在这些程序中,所述样品中的核酸与所述探针相接触,进行所述扩增反应,检测任何得到的扩增产物。扩增产物可以通过对反应产物进行凝胶电泳,并用嵌入剂如溴化乙啶染胶来进行检测。可选地,一种或者多种探针可以用放射性同位素标记,并且在凝胶电泳后通过放射性自显影来检测放射性的扩增产物的存在与否。
源自位于本发明序列的3’或者5’末端附近的序列的探针也可以用于染色体步移(chromosomewalking)程序中,以鉴定含有另外的,如基因组序列的克隆。这样的方法允许从宿主生物体中分离出编码其它感兴趣的蛋白的基因。
在一方面,本发明的核酸被用作探针来鉴定和分离相关的核酸。在一些方面,所述的相关的核酸可以是来自某些生物体的cDNA或者基因组DNA,而不是本发明的核酸起初被分离出来的那些生物体。在这样的程序中,核酸样品与所述探针在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体的核酸的杂交然后采用以上描述的任何方法来检测。
在核酸杂交反应中,用于达到特定严格性水平的条件可以根据待杂交核酸的性质来进行改变。例如,在选择杂交条件时可以考虑核酸杂交区域的长度、互补程度、核苷酸序列组成(如,GC对AT含量的比率)、以及核酸类型(如,RNA对DNA)。另外考虑是否其中一个核酸固定于,如滤膜上。杂交可以在低严格性,中度严格性或者高严格性的条件下进行。作为核酸杂交的例子,含有固定化变性核酸的多聚膜首先在45℃下,在由0.9MNaCl、50mMNaH2PO4,PH7.0、5.0mMNa2EDTA、0.5%SDS、10×Denhardt′s和0.5mg/ml多核腺苷酸组成的溶液中预杂交30分钟。然后将大约2×107cpm(比活性4-9×108cpm/ug)的32P末端标记的寡核苷酸探针加入到溶液中。在12-16小时的温育以后,膜在室温(RT)下于含有0.5%SDS的1×SET(150mMNaCl、20mMTris盐酸,PH7.8、1mMNa2EDTA)中洗涤30分钟,然后在新鲜配制的1×SET,在Tm-10℃下,再洗涤寡核苷酸探针30分钟。然后将膜暴露于自显影膜上来检测杂交信号。
通过改变用于鉴定核酸,如与可检测探针杂交的cDNA或者基因组DNA的杂交条件的严格性,可以鉴定和分离与探针具有不同同源性水平的核酸。可以通过在低于探针的解链温度下的不同温度中进行杂交而使严格性变化。解链温度,Tm,是指(在定义的离子强度和pH下)50%的靶序列与精确互补的探针杂交的温度。非常严格的条件被选择为与特定的探针的Tm值相等或比其低大约5℃。探针的解链温度可以通过应用以下的示例性公式计算。对于在14到70个核苷酸长度的探针,应用此公式计算解链温度:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中的N是探针的长度。如果杂交在含有甲酰胺的溶液中进行,解链温度可以通过应用以下的公式来计算:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其中的N是探针的长度。预杂交可以在6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg/ml变性的鲑鱼精DNA片段或者6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg/ml变性的鲑鱼精DNA片段、50%甲酰胺中进行。SSC和Denhardt′s和其它溶液的配方列于例如Sambrook中。
通过在以上所示预杂交溶液中加入可以检测到的探针来进行杂交。当所述探针包括双链DNA时,它应在加入到杂交缓冲液前被变性。滤膜与杂交缓冲液接触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA或者基因组DNA杂交。对于超过200个核苷酸长度的探针,杂交可以是在低于Tm温度15-25℃进行。对于较短的探针,如寡核苷酸探针,杂交可以是在低于Tm温度5-10℃下进行。一方面,在6×SSC溶液中的杂交在大约68℃进行。一方面,在含有50%甲酰胺的溶液中的杂交在大约42℃进行。考虑所有前述的杂交在高严格性条件下进行。
杂交以后,洗涤滤膜以去除任何非特异结合的可以检测到的探针。洗涤滤膜所用的严格性也可以根据正被杂交的核酸的性质、正被杂交的核酸的长度、互补的程度,核苷酸序列的组成(如,GC对AT的含量),以及核酸类型(如,RNA对DNA)来进行变化。逐渐增高的严格性条件洗涤的例子如下:2×SSC,0.1%SDS,室温下15分钟,(低严格性);0.1×SSC,0.5%SDS,室温下30分钟到1小时(中度严格性);0.1×SSC,0.5%SDS,杂交温度和68℃之间,15到30分钟(高严格性);0.15MNaCl,在72℃下15分钟(极高严格性)。最后低严格性洗涤可以在0.1×SSC,室温下进行。以上的例子仅仅示出了可以用于实施本发明,例如洗涤滤膜的一组条件。本领域技术人员将知道,对于不同严格性洗涤有无数方案,所有这些方案都可以用于实施本发明。
已经与探针杂交的核酸可以通过放射自显影或者其它传统的技术来确定。可以改变以上的程序来鉴定与探针序列具有降低水平的同源性的核酸。例如为了获得与可检测探针具有降低水平的同源性的核酸,可以应用不太严格的条件。例如,在含有Na+浓度为大约1M的杂交缓冲液中,杂交温度可以以5℃的幅度从68℃降低到42℃。杂交后,滤膜用2×SSC,0.5%SDS,在杂交温度下洗膜。超过50℃,这些条件认为是“中度”条件,低于50℃,这些条件认为是“低度”条件。“中度”杂交条件的例子是上面的杂交在55℃进行时。“低严格性”杂交条件的特定例子是上面的杂交在45℃进行时。
可选地,杂交在缓冲液,如含有甲酰胺的6×SSC中,在42℃下进行。在这种情况下,杂交缓冲液中甲酰胺的浓度可以以5%的幅度从50%降低到0%,来确定与探针具有降低的同源性水平的克隆。杂交后,滤膜可以用6×SSC,0.5%SDS在50℃下洗涤。当甲酰胺浓度大于25%时,这些条件认为是“中度”条件,而低于25%时为“低度”条件。“中度”杂交条件的特定例子是当以上的杂交在30%的甲酰胺中进行时。“低严格性”杂交条件的特定例子是当以上的杂交在10%的甲酰胺中进行时。
本发明的这些探针和方法可以用于分离具有与本发明的核酸序列有至少大约99%、至少98%、至少97%、至少96%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%、或者至少50%的同源性的序列的核酸,该本发明的核酸序列包括其的至少大约10、15、20、25、30、35、40、50、75、100、150、200、250、300、350、400或者500个连续的碱基,和与之互补的序列。同源性可以应用在此所述的比对算法测定。例如,同源的多核苷酸可以具有在此说明的其中一个编码序列的天然发生的等位基因突变体的编码序列。当与本发明的核酸比较时,这样的等位基因突变体可以具有置换,缺失或者插入一个或者多个核苷酸。
此外,本发明的探针和方法可以用于分离编码与本发明多肽具有至少大约99%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%、或者至少50%的序列同一性(同源性)的多肽的核酸,如应用序列比对算法(如,使用默认参数的FASTA版本3.0t78的算法,或者具有在此提及的示例性设置的BLAST2.2.2程序)确定的,所述本发明多肽含有其至少5、10、15、20、25、30、35、40、50、75、100或者150个连续的氨基酸。抑制磷脂酶的表达
本发明进一步提供与本发明的核酸序列如磷脂酶编码核酸互补的核酸(如,本发明的核酸序列的反义序列)。反义序列可以抑制磷脂酶编码基因的转运,剪接或者转录。抑制可以通过靶向基因组DNA或者信使RNA而起作用。例如,通过杂交和/或切割,可以抑制被靶向的核酸的转录或者功能。本发明提供的特别有效的一套抑制物包括能够结合磷脂酶基因或者信使的寡核苷酸,在每一种情况下,阻止或者抑制磷脂酶的产生或者发挥功能。结合可以通过序列特异性的杂交实现。另一类有用的抑制物包括引起磷脂酶信使物失活或者切割的寡核苷酸。寡核苷酸可以具有引起此种切割的酶活性,如核酶。寡核苷酸可以进行化学修饰,或者接合到能够切割互补核酸的酶或组合物上。操作人员可以筛选具有许多不同的此类寡核苷酸的文库,以获得那些具有期望的活性的寡核苷酸。
磷脂酶表达的抑制可以具有多种不同的工业用途。例如,抑制磷脂酶的表达可以减慢或者阻止酸败。当脂类或多肽,如,结构脂类或者多肽,被酶降解时,可能发生酸败。这可以导致水果和蔬菜的变质或者腐败。一方面,应用可以抑制磷脂酶的表达和/或活性的本发明的组分,例如,抗体、反义寡核苷酸、核酶和RNAi,可以用于减缓或者阻止酸败。因此,在一方面,本发明提供方法和组分,包括将本发明的抗体、反义寡核苷酸、核酶和RNAi应用于植物或者植物产品(如,水果、种籽、根、叶等),以阻止或者延缓酸败。这些组分也可以由植物(如,转基因植物)或者其它生物(如,用本发明的磷脂酶基因转化的细菌或者其它微生物)表达。
用于抑制磷脂酶表达的本发明的组分(如反义物、iRNA、核酶、抗体)可以用作药物组分。反义寡核苷酸
本发明提供能够结合磷脂酶信使的反义寡核苷酸,该反义寡核苷酸可以通过靶向mRNA来抑制磷脂酶活性。设计反义寡核苷酸的策略在科学和专利文献中已经充分说明,并且技术熟练人员可以应用本发明的新型试剂来设计这样的磷脂酶寡核苷酸。例如,用于筛选有效的反义寡核苷酸的基因步行/RNA作图试验方案是本领域所熟知的参见,如Ho(2000)MethodsEnzymol.314:168-183,该文献描述了RNA作图分析方法,作图分析方法以标准的分子技术为基础,为有效的反义序列选择提供了简单而可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。
也可以应用天然存在的核酸作为反义寡核苷酸。反义寡核苷酸可以是任何长度;例如,在可选的方面,反义寡核苷酸在大约5到100、大约10到80、大约15到60、大约18到40之间。最佳长度可以通过常规的筛选方法来确定。反义寡核苷酸可以以任何浓度存在。最佳浓度可以通过常规的筛选方法来确定。已经知道有许多能够解决该潜在的问题的合成的,非天然存在的核苷酸和核酸类似物。例如,可以应用含有非离子性骨架,如N-(2-氨基乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有硫代磷酸连接的反义寡核苷酸,如WO97/03211;WO96/39154;Mata(1997)ToxicolApplPharmacol144:189-197;AntisenseTherapeutics,ed.Agrawal(HumanaPress,Totowa,N.J.,1996)所述。正如上面所描述的,本发明提供的具有合成DNA骨架类似物的反义寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫代乙缩醛、亚甲基(甲基亚氨)、3′-N-氨基甲酸酯和吗啉代氨基甲酸酯核酸。
可以应用组合化学方法产生大量的寡核苷酸,可以对这些寡核苷酸快速筛选,以获得对任何靶,如本发明的有义和反义的磷脂酶序列,具有适当的结合亲和性和特异性的特定的寡核苷酸(见,如Gold(1995)J.ofBiol.Chem.270:13581-13584)。抑制性核酶
本发明提供能够结合磷脂酶信使的核酶,其可以通过靶向mRNA来抑制磷脂酶的酶活性。设计核酶和选择用于靶向作用的对磷脂酶具特异性的反义序列在科学和专利文献中已经充分说明,并且技术熟练人员可以应用本发明的新型试剂来设计这样的核酶。核酶通过核酶的靶RNA结合部分结合靶RNA而起作用,该核酶的靶RNA结合部分与切割靶RNA的RNA酶活部分非常接近。因此,核酶通过互补的碱基配对作用,识别并且结合靶RNA,并且一旦结合于正确的位点,将酶法切割靶RNA并且使靶RNA失活。如果切割发生在编码序列中,以这种方式进行的靶RNA的切割将破坏其指导编码蛋白合成的能力。当核酶结合并且切割其靶RNA后,一般情况下,将从RNA上释放,因此能够反复地结合和切割新的靶标。
在一些情况下,核酶的酶促性质会优于其它的技术,如反义技术(其中核酸分子仅结合于核酸靶来阻止其转录、翻译或者与其它分子的结合),因为实现治疗效果所必要的核酶有效浓度可能低于反义寡核苷酸的浓度。这一潜在的优点反映出核酶可以以酶促方式进行作用的能力。因此,单个核酶分子可以切割靶RNA的多个分子。另外,核酶典型地是高度特异性的抑制物,其抑制作用的特异性不仅依赖于碱基配对的结合机制,也依赖于该分子抑制与其结合的RNA的表达的机制。即,所述抑制是由切割靶RNA引起的,因此特异性定义为靶RNA的切割率与非靶RNA的切割率的比值。除了涉及碱基配对的那些因素,这种切割机制还依赖于另外的因素。这样,核酶作用的特异性比结合于同样的RNA位点的反义寡核苷酸高。
具有酶活的核酶RNA分子可以以锤头状基序(hammerheadmotif)形成,但也可以以发夹、肝炎δ病毒、I类内含子或者RnaseP样的RNA(与RNA的引导序列有关)基序形成。这样的锤头状基序的例子在如Rossi(1992)AidsResearchandHumanRetroviruses8:183中有描述;发夹基序在Hampel(1989)Biochemistry28:4929和Hampel(1990)Nuc.AcidsRes.18:299中有描述;肝炎δ病毒基序在Perrotta(1992)Biochemistry31:16中有描述;RNaseP基序在Guetrier-Takada(1983)Cell35:849中有描述;I类内含子在Cech美国专利4,987,071中有描述。描述这些特异基序的目的不是限制性的;本领域技术人员将认识到,本发明的酶RNA分子具有与一个或者多个靶基因RNA区域互补的特异性底物结合位点,并且具有在底物结合位点内或者周围赋予该分子以RNA切割活性的核苷酸序列。RNA干涉(RNAi)
一方面,本发明提供包括本发明的磷脂酶序列的RNA抑制分子,所谓的“RNAi”分子。RNAi分子包括双链RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表达。在一个方面,RNAi的长度大约为15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。虽然本发明不限于任何特殊的作用机制,但RNAi可进入细胞中,引起相似或相同序列的单链RNA(ssRNA)的降解,包括内源性mRNA。当细胞暴露于双链RNA(dsRNA)时,来自同源基因的mRNA被称为RNA干扰(RNAi)的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双链RNA(dsRNA)打断成为称为短的干扰RNA的短碎片,它可触发与其序列匹配的mRNA的降解。在一个方面,本发明的RNAi可用于基因沉默(gene-silencing)疗法中,见,例如Shuey(2002)DrugDiscov.Today7:1040-1046。在一个方面,本发明提供了使用本发明的RNAi选择性降解RNA的方法。该过程可在体外、离体或体内实施。在一个方面,本发明的RNAi分子可用来在细胞、器官或动物中产生丧失功能的突变。制备和应用可选择性降解RNA的RNAi分子的方法在本领域中是熟知的,见,例如美国专利6,506,559;6,511,82;6,515,109;6,489,127。核酸修饰
本发明提供产生本发明的核酸,例如那些编码磷脂酶的核酸的变体的方法。在可选择的实施方式中,本发明提供了修饰本发明的酶的方法,例如通过随意或随机方法,或非随机方法或“定向进化”方法,诸如基因位点饱和诱变TM(GSSM)对其编码序列进行突变,以改变酶的活性pH范围或最佳活性pH范围,活性温度范围或最佳活性温度范围、特异性、活性(动力学);酶对糖基化、磷酸化或金属(例如Ca、Mg、Zn、Fe、Na)的应用,例如以影响pH/温度稳定性。本发明提供了修饰本发明的酶的方法,例如通过GSSM对其编码序列进行突变,以增加它对蛋白酶活性的抗性。本发明提供了修饰本发明的酶的方法,例如通过GSSM对其编码序列进行突变,以改变酶对Ca、Mg、Na的特异性金属螯合剂的应用,其不会螯合Zn。本发明提供了修饰本发明的酶的方法,例如通过GSSM对其编码序列进行突变,其将具有期望的活性组合,例如PI、PA和PC/PE特异性PLCs。
这些方法可以重复或者在不同的组合中使用,产生与模板核酸编码的磷脂酶相比具有改变的或不同活性或者改变的或不同稳定性的磷脂酶。这些方法也可以重复或者在不同的组合中使用,例如,产生基因/信息表达,信息翻译或者信息稳定性上的变异。另一方面,细胞的遗传组分可以通过,例如离体的同源基因修饰,然后再插入细胞中而加以改变。
本发明的核酸可以通过任何方法改变。例如,无规则或随机方法,或者,非随机方法,或者“定向进化”方法。
基因的随机突变方法在本领域是已知的,参见如,美国专利5,830,696。例如,可以应用突变剂来对基因进行随机突变。突变剂包括,如,紫外线或者γ辐射,或者化学诱变剂,如,丝裂霉素,亚硝酸,光活化的补骨脂内酯,它们单独使用或者组合使用来诱导DNA的断裂,其可以通过重组被修复。其它的化学诱变剂包括,如,亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物,如,亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换核苷酸前体,从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林和类似物。
可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如,Rice(1992)Proc.Natl.Acad.Sci.USA89:5467-5471;或者组合式多重盒式诱变,参见如,Crameri(1995)Biotechinques18:194-196。可选择地,核酸,如基因,可以在随机片段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514,5,811,238;5,605,793。在可选择的方面,修饰、增加或者删除可以通过易错PCR、改组、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因再装配、基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组(recursivesequencerecombination)、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺口双重诱变(gappedduplexmutagenesis)、点错配修复诱变(pointmismatchrepairmutagenesis)、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择诱变(restriction-selectionmutagenesis)、限制纯化诱变(restriction-purificationmutagenesis)、人工基因合成、整体诱变、嵌合核酸多聚体生成和/或者这些方法和其它方法的组合产生。
以下的出版物描述了各种递归重组程序和/或可以并入到本发明的方法中的方法:Stemmer(1999)“Molecularbreedingofvirusesfortargetingandotherclinicalproperties”TumorTargeting4:1-4;Ness(1999)NatureBiotechnology17:893-896;Chang(1999)“EvolutionofacytokineusingDNAfamilyshuffling”NatureBiotechnology17:793-797;Minshull(1999)“Proteinevolutionbymolecularbreeding”CurrentOpinioninChemicalBiology3:284-290;Christians(1999)“DirectedevolutionofthymidinekinaseforAZTphosphorylationusingDNAfamilyshuffling”NatureBiotechnology17:259-264;Crameri(1998)“DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution”Nature391:288-291;Crameri(1997)“MolecularevolutionofanarsenatedetoxificationpathwaybyDNAshuffling”NatureBiotechnology15:436-438;Zhang(1997)“DirectedevolutionofaneffectivefucosidasefromagalactosidasebyDNAshufflingandscreening”Proc.Natl.Acad.Sci.USA94:4504-4509;Patten等(1997)“ApplicationsofDNAShufflingtoPharmaceuticalsandVaccines”CurrentOpinioninBiotechnology8:724-733;Crameri等(1996)“Constructionandevolutionofantibody-phagelibrariesbyDNAshuffling”NatureMedicine2:100-103;Crameri等(1996)“ImprovedgreenfluorescentproteinbymolecularevolutionusingDNAshuffling”NatureBiotechnology14:315-319;Gates等(1996)“Affinityselectiveisolationofligandsfrompeptidelibrariesthroughdisplayonalacrepressor′headpiecedimer”JournalofMolecularBiology255:373-386;Stemmer(1996)“SexualPCRandAssemblyPCR”In:TheEncyclopediaofMolecularBiology.VCHPublishers,NewYork.447-457页;Crameri和Stemmer(1995)“Combinatorialmultiplecassettemutagenesiscreatesallthepermutationsofmutantandwildtypecassettes”BioTechniques18:194-195;Stemmer等(1995)“Single-stepassemblyofageneandentireplasmidformlargenumbersofoligodeoxyribonucleotides”Gene,164:49-53;Stemmer(1995)“TheEvolutionofMolecularComputation”Science270:1510;Stemmer(1995)“SearehingSequenceSpace”Bio/Technology13:549-553;Stemmer(1994)“RapidevolutionofaproteininvitrobyDNAshuffling”Nature370:389-391;和Stemmer(1994)“DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution”Proc.Natl.Acad.Sci.USA91:10747-10751。
产生多样性的突变方法包括,例如,定点诱变(Ling等(1997)“ApproachestoDNAmutagenesis:anoverview”AnalBiochem.254(2):157-178;Dale等(1996)“Oligonucleotide-directedrandommutagenesisusingthephosphorothioatemethod”MethodsMol.Biol.57:369-374;Smith(1985)“Invitromutagenesis”Ann.Rev.Genet.19:423-462;Botstein&Shortle(1985)“Strategiesandapplicationsofinvitromutagenesis”Science229:1193-1201;Carter(1986)“Site-directedmutagenesis”Biochem.J.237:1-7;Kunkel(1987)“Theefficiencyofoligonucleotidedirectedmutagenesis”在NucleicAcids&MolecularBiology(Eckstein,F.和Lilley,D.M.J.eds.,SpringerVerlag,Berlin));使用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection”Proc.Natl.Acad.Sci.USA82:488-492;Kunkel等(1987)“Rapidandefficientsite-specificmutagenesiswithoutphenotypicselection”MethodsinEnzymol.154,367-382;和Bass等(1988)“MutantTrprepressorswithnewDNA-bindingspecificities”Science242:240-245);寡核苷酸诱导的定点诱变(MethodsinEnzymol.100:468-500(1983);MethodsinEnzymol.154:329-350(1987);Zoller&Smith(1982)“Oligonucleotide-directedmutagenesisusingM13-derivedvectors:anefficientandgeneralprocedurefortheproductionofpointmutationsinanyDNAfragment”NucleicAcidsRes.10:6487-6500;Zoller&Smith(1983)“Oligonucleotide-directedmutagenesisofDNAfragmentsclonedintoM13vectors”MethodsinEnzymol.100:468-500;和Zoller&Smith(1987)″Oligonucleotide-directedmutagenesis:asimplemethodusingtwooligonucleotideprimersandasingle-strandedDNAtemplate”MethodsinEnzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等(1985)“Theuseofphosphorothioate-modifiedDNAinrestrictionenzymereactionstopreparenickedDNA”Nucl.AcidsRes.13:8749-8764;Taylor等(1985)“Therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusingphosphorothioate-modifiedDNA”Nucl.AcidsRes.13:8765-8787(1985);Nakamaye(1986)“InhibitionofrestrictionendonucleaseNciIcleavagebyphosphorothioategroupsanditsapplicationtooligonucleotide-directedmutagenesis”Nucl.AcidsRes.14:9679-9698;Sayers等(1988)“Y-TExonucleasesinphosphorothioate-basedoligonucleotide-directedmutagenesis”Nucl.AsidsRes.16:791-802;和Sayers等(1988)“Strandspecificcleavageofphosphorothioate-containingDNAbyreactionwithrestrictionendonucleasesinthepresenceofethidiumbromide”Nucl.AcidsRes.16:803-814);使用缺口二倍DNA的诱变(Kramer等(1984)“ThegappedduplexDNAapproachtooligonucleotide-directedmutationconstruction”Nucl.AcidsRes.12:9441-9456;Kramer&Fritz(1987)MethodsinEnzymol.“Oligonucleotide-directedconstructionofmutationsviagappedduplexDNA”154:350-367;Kramer等(1988)“ImprovedenzymaticinvitroreactionsinthegappedduplexDNAapproachtooligonucleotide-directedconstructionofmutations”Nucl.AcidsRes.16:7207;和Fritz等(1988)“Oligonucleotide-directedconstructionofmutations:agappedduplexDNAprocedurewithoutenzymaticreactionsinvitro”Nucl.AcidsRes.16:6987-6999)。
可以用于实践本发明方法的另外的实验方案包括点错配修复(Kramer(1984)“PointMismatchRepair”Cell38:879-887),应用修复缺陷型宿主株的诱变(Carter等(1985)“Improvedoligonucleotidesite-directedmutagenesisusingM13vectors”Nucl.AcidsRes.13:4431-4443;和Carter(1987)“Improvedoligonucleotide-directedmutagenesisusingM13vectors”MethodsinEnzymol.154:382-403),缺失诱变(Eghtedarzadeh(1986)“Useofoligonucleotidestogeneratelargedeletions”Nucl.AcidsRes.14:5115),限制-选择和限制-选择和限制-纯化(Wells等(1986)“Importanceofhydrogen-bondformationinstabilizingthetransitionstateofsubtilisin”Phil.Trans.R.Soc.Lond.A317:415-423),通过全基因合成的诱变(Nambiar等(1984)“TotalsynthesisandcloningofagenecodingfortheribonucleaseSprotein”Science223:1299-1301;Sakamar和Khorana(1988)“Totalsynthesisandexpressionofageneforthea-subunitofbovinerodoutersegmentguaninenucleotide-bindingprotein(transducin)”Nucl.AcidsRes.14:6361-6372;Wells等(1985)“Cassettemutagenesis:anefficientmethodforgenerationofmultiplemutationsatdefinedsites”Gene34:315-323;和Grundstrom等(1985)“Oligonucleotide-directedmutagenesisbymicroscale‘shot-gun’genesynthesis”Nucl.AcidsRes.13:3305-3316),双链断裂修复(Mandecki(1986);Arnold(1993)“Proteinengineeringforunusualenvironments”CurrentOpinioninBiotechnology4:450-455。“Oligonucleotide-directeddouble-strandbreakrepairinplasmidsofEscherichiacoli:amethodforsite-speciflcmutagenesis”Proc.Natl.Acad.Sci.USA,83:7177-7181)。很多以上的方法的另外的细节可在MethodsinEnzymology第154卷中发现,其中也描述了用于解决各种诱变方法中所遇到的问题的有用策略。
也参见Stemmer的美国专利5,605,793(1997年2月25日),“MethodsforInVitroRecombination;”Stemmer等人的美国专利5,811,238(1998年9月22日)“MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination;”Stemmer等人的美国专利5,830,721(1998年11月3日),“DNAMutagenesisbyRandomFragmentationandReassembly;”Stemmer等人的美国专利5,834,252(1998年11月10日)“End-ComplementaryPolymeraseReaction;”Minshull等人的美国专利5,837,458(1998年11月17日),“MethodsandCompositionsforCellularandMetabolicEngineering;”WO95/22625,Stemmer和Cramen,“MutagenesisbyRandomFragmentationandReassembly;”Stemmer和Lipschutz的WO96/33207“EndComplementaryPolymeraseChainReaction;”Stemmer和Crameri的WO97/20078“MethodsforGeneratingPolynucleotideshavingDesiredCharacteristicsbyIterativeSelectionandRecombination;”Minshull和Stemmer的WO97/35966,“MethodsandCompositionsforCellularandMetabolicEngineering;”Punnonen等人的WO99/41402“TargetingofGeneticVaccineVectors;”Punnonen等人的WO99/41383“AntigenLibraryImmunization;”Punnonen等人的WO99/41369“GeneticVaccineVectorEngineering;”Punnonen等人的WO99/41368“OptimizationofImmunomodulatoryProperticsofGeneticVaccines;”Stemmer和Crameri的EP752008“DNAMutagenesisbyRandomFragmentationandReassembly;”Stemmer的EP0932670“EvolvingCellularDNAUptakebyRecursiveSequenceRecombination;”Stemmer等人的WO99/23107,“ModificationofVirusTropismandHostRangebyViralGenomeShuffling;”Apt等人的WO99/21979,“HumanPapillomavirusVectors;”delCardayre等人的WO98/31837“EvolutionofWholeCellsandOrganismsbyRecursiveSequenceRecombination;”Patten和Stemmer的WO98/27230“MethodsandCompositionsforPolypeptideEngineering,”Stemmer等人的WO98/27230,“MethodsforOptimizationofGeneTherapybyRecursiveSequenceShufflingandSelection,”WO00/00632,“MethodsforGeneratingHighlyDiverseLibraries,”WO00/09679,“MethodsforObtaininginVitroRecombinedPolynucleotideSequenceBanksandResultingSequences,”Arnold等人的WO98/42832,“RecombinationofPolynucleotideSequencesUsingRandomorDefinedPrimers,”Arnold等人的WO99/29902,“MethodforCreatingPolynucleotideandPolypeptideSequences,”Vind的WO98/41653,“AninVitroMethodforConstructionofaDNALibrary,”Borchert等人的WO98/41622,“MethodforconstructingaLibraryUsingDNAShuffling,”和Pati和Zarling的WO98/42727,“SequenceAlterationsusingHomologousRecombination”。
某些美国申请提供了关于产生不同多样性的方法的额外细节,包括Patten等人于1999年9月28日提交的“SHUFFLINGOFCODONALTEAEDGENES”(美国系列号09/407,800);delCardayre等人于1998年7月15日提交的(美国系列号09/166,188)和于1999年7月15日提交的(美国系列号09/354,922)“EVOLUTIONOFWHOLECELLSANDORGANISMSBYRECURSIVESEQUENCERECOMBINATION”;Crameri等人的于1999年9月28日提交的“OLIGONUCLEOTIDEMEDIATEDNUCLEICACIDRECOMBINATION”(美国系列号09/408,392)和Crameri等人于2000年1月18日提交的“OLIGONUCLEOTIDEMEDIATEDNUCLEICACIDRECOMBINATION”(PCT/US00/01203);Welch等人于1999年9月28日提交的“USEOFCODON-VARIEDOLIGONUCLEOTIDESYNTHESISFORSYNTHETICSHUFFLING”(美国系列号09/408,393);Selifonov等人于2000年1月18日提交的“METHODSFORMAKINGCHARACTERSTRINGS,POLYNUCLEOTIDS&POLYPEPTIDESHAVINGDESIREDCHARACTERISTICS”(PCT/US00/01202)和,例如,Selifonov等人于2000年7月18日提交的“METHODSFORMAKINGCHARACTERSTRINGS,POLYNUCLEOTIDS&POLYPEPTIDESHAVINGDESIREDCHARACTERISTICS”(美国系列号09/618,579);Selifonov和Stemmer于2000年1月18日提交的“METHODSOFPOPULATINGDATASTRUCTURESFORUSEINEVOLUTIONARYSIMULATIONS”(PCT/US00/01138);和Affholter于2000年9月6日提交的“SINGLE-STRANDEDNUCLEICACIDTEMPLATE-MEDIATEDRECOMBINATIONANDNUCLEICACIDFRAGMENTISOLATION”(美国系列号09/656,549)。
非随机或“定向进化”方法包括,例如饱和诱变(例如GSSM)、合成连接重装配(SLR)或其组合,它们被用于修饰本发明的核酸,以产生具有新的或改变的特性(例如在高度酸性或碱性条件下的活性,在高温或低温的活性,等等)的磷脂酶。由修饰的核酸编码的多肽可以在测试磷脂酶或其它活性之前被筛选活性。可以使用任何测试形式或实验方案,例如使用毛细管阵列平台。例如参见美国专利6,361,974;6,280,926;5,939,250。饱和诱变或GSSM
本发明的一个方面,非随机的基因修饰,“定向进化过程”用于产生具有新的或者改变的特性的磷脂酶。本方法的各种变化已经被称为“基因位点诱变”、“位点饱和诱变”、“基因位点饱和诱变”或者简单地称为“GSSM”。饱和诱变可以与别的诱变过程相结合。见,例如,美国专利6,171,820;6,238,884。一方面,GSSM包括提供模板多核苷酸和众多的寡核苷酸,其中每种寡核苷酸包括与模板多核苷酸同源的序列,因此靶向模板多核苷酸中的特异序列,以及为同源基因的变体的序列;通过使用寡核苷酸复制模板多核苷酸,产生包括非随机序列变体的子代多核苷酸,从而产生包括同源基因序列变异的多核苷酸。
一方面,含有简并N,N,G/T序列的密码子引物被用于将点突变引入多核苷酸中,以便产生一组子代多肽,其中在每一氨基酸位置上可表现出全范围的单氨基酸置换,置换发生的位置例如酶活性位点中的氨基酸残基,或将要被修饰的配体结合位点。这些寡核苷酸可以包括相邻的第一同源序列,简并N,N,G/T序列,和任选地第二同源序列。由使用这些寡核苷酸而得到的下游子代翻译产物包含沿着多肽的每一氨基酸位点上的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并性包括了所有20个氨基酸的密码子。一方面,一个这样的简并寡核苷酸(例如包括一个简并N,N,G/T序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子置换。另一方面,使用至少两个简并序列盒,或在相同的寡核苷酸中或不同的寡核苷酸中,用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子置换。例如,一个寡核苷酸中可以包含一个以上N,N,G/T序列,以便在多于一个的位点上引入氨基酸突变。这些多个N,N,G/T序列可以直接相邻,或被一个或多个额外的核苷酸序列分隔开。另一方面,用于引入插入和删除的寡核苷酸可以单独使用,或者与含有N,N,G/T序列的密码子组合使用,以便引入氨基酸插入、删除和/或置换的任何排列组合。
一方面,两个或更多个连续氨基酸位置的同时诱变是使用含有相邻N,N,G/T三联体的寡核苷酸进行的,即简并(N,N,G/T)n序列。另一方面,使用与N,N,G/T序列相比具有较低简并性的简并序列盒。例如,在一些情况下,可能期望(例如,在寡核苷酸中)使用仅包括一个N的简并三联体序列,其中所述的N可以在三联体的第一、第二或第三位置上。在该三联体的剩余两个位置上,可以使用包括任意排列组合的任何其它碱基。可以选择地,在一些情况下可能期望使用(例如在寡聚体中)简并N,N,N三联体序列。
一方面,使用简并三联体(例如N,N,G/T三联体)允许在多肽中的每一和每个氨基酸位置上系统且容易地产生完全范围的可能的天然氨基酸(总共20种氨基酸)(在可以选择的方面,这些方法也包括在每一氨基酸残基或密码子、位置产生少于全部的可能置换)。例如,对于100个氨基酸的多肽,可以产生2000个不同种类(即每个位置上的20种可能氨基酸×100个氨基酸位置)。通过使用含有简并N,N,G/T三联体的寡核苷酸或一组寡核苷酸,32种不同序列可编码所有20种可能的天然氨基酸。因此,在其中使用至少一种这样的寡核苷酸对亲本多核苷酸序列进行饱和诱变的反应容器中,产生了编码20种不同多肽的32种不同的子代多核苷酸。相反,在定点诱变中使用非简并寡核苷酸在每个反应容器中仅仅导致一种子代多肽。非简并寡核苷酸可以任选地与所公开的简并引物组合使用;例如,非简并寡核苷酸可以被用于在工作多核苷酸中产生特异性点突变。这提供了产生特异性沉默点突变、导致相应的氨基酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。
一方面,每一饱和诱变反应容器含有编码至少20种子代多肽(例如磷脂酶)分子的多核苷酸,以便所有的20种天然氨基酸都会出现在对应于亲本多核苷酸中被诱变的密码子位置的特定氨基酸位置(其它方面使用了少于20个天然的组合)。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使用表达载体克隆到合适的宿主中,例如大肠杆菌宿主中),并进行表达筛选。当单个子代多肽通过筛选鉴定,显示出有利的特性变化时(当与亲本多肽相比时,如在碱性或酸性条件下增高的磷脂酶水解活性),可以对其测序以鉴定其中所含的相应的有利氨基酸置换。
一方面,如本文所公开的,应用饱和诱变对亲本多肽的各个和所有的氨基酸位置进行诱变后,可以在超过一个的氨基酸位置确定出有利的氨基酸变化。可以产生一个或多个新的子代分子,其含有所有或部分这些有利的氨基酸置换的组合。例如,如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨基酸变化,那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化的可能性,以及两个有利变化中的每一个的可能性)和3个位置。因此,总共有3×3×3或27种可能性,其中包括了先前被检验的7种可能性,即6个单点突变(即三个位置的每一个位置有2个)和在任何位置上没有变化的点突变。
另一方面,为了改变序列,定点饱和诱变可以与任何随机的或非随机方法一起使用,例如合成的连接重装配(见下文)、重排、嵌合化、重组和其它诱变方法和诱变剂。本发明提供以重复方式使用任何诱变方法,包括饱和诱变。合成连接重装配(SLR)
本发明提供称为“合成连接重装配”,或者简单地称为“SLR”的非随机基因修饰系统,这是一种“定向进化方法”,以产生具有新的或者改变的特性的磷脂酶。SLR是非随机地把寡核苷酸片段连接在一起的方法。此方法与随机的寡核苷酸重排不同,因为核酸构件不是改组的、串联的或者随机地嵌合的,而是非随机组装的。参见,例如,美国专利申请系列号(USSN)09/332,835,题目是“SyntheticLigationReassembtyinDirectedEvolution”,于1999年6月14日提交(“USSN09/332,835”)。一方面,SLR包括下述步骤:(a)提供模板多核苷酸,其中模板多核苷酸包含编码同源基因的序列;(b)提供多个构件多核苷酸,其中这些构件多核苷酸被设计成可在预定的序列处与模板多核苷酸交换重装配(cross-overreassemble),所述构件多核苷酸包含作为同源基因变体的序列和与变体序列两侧的模板多核苷酸同源的序列;(c)将构件多核苷酸与模板多核苷酸组合在一起,以便构件多核苷酸与模板多核苷酸交换重装配,以产生包含同源基因序列变异的多核苷酸。
SLR不依赖于将被重新排列的多核苷酸之间存在高度同源性。因此,该方法可以被用于非随机地产生包括超过10100个不同嵌合体的子代分子的文库(或集合)。SLR可以被用于产生包括超过101000个不同子代嵌合体的文库。因此,本发明的一些方面包括产生一组最终嵌合的核酸分子的非随机方法,所述最终嵌合的核酸分子具有按设计所选择的整个装配次序。该方法包括按设计产生多个特异性核酸构件的步骤,以及装配这些核酸构件的步骤,这样可获得依设计而定的整个装配次序,所述的多个特异性核酸构件具有可被应用的互相相容的可连接末端。
将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有序装配是“有用的”,如果它们能使这些构件以预定次序结合的话。因此,核酸构件可以被偶联的整个装配次序是由可连接末端的设计来确定的。如果使用多于一个的装配步骤,那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。一方面,用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段,以实现结构片段的共价结合。
一方面,寡核苷酸构件的设计通过分析一组祖先核酸序列模板来获得,所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些亲本寡核苷酸模板因此作为序列信息的来源,它们在将被诱变例如被嵌合或改组的核酸构件的设计中有用。
在该方法的一个方面,多个亲本核酸模板的序列被联配,以便选择一个或多个分界点。这些分界点可以位于同源区域,由一个或多个核苷酸构成。这些分界点优选地由至少两个祖先模板共享。从而这些分界点可以被用于描绘将要产生的寡核苷酸构件的边界,以便重排列亲本多核苷酸。在祖先分子中鉴定和选择的分界点作为最终嵌合的子代分子的装配中的潜在嵌合点。分界点可以是由至少两个亲本多核苷酸序列分享的同源区域(包括至少一个同源性核苷酸碱基)。可以选择地,分界点可以是由至少一半的亲本多核苷酸序列分享的同源区域,或者可以是由至少三分之二的亲本多核苷酸序列分享的同源区域。甚至更优选地,在一个方面,有用的分界点是由至少四分之三的亲本多核苷酸序列分享的同源区域,或者可以是由几乎所有的亲本多核苷酸序列分享的同源区域。一方面,分界点是由所有亲本多核苷酸序列共有的同源区域。
一方面,连接再装配过程被彻底地进行,以便产生含有尽量可能多的子代嵌合多核苷酸的文库。换句话说,核酸构件的所有可能的有序组合都呈现在最终嵌合的核酸分子集合中。同时,另一方面,在每一组合中的装配次序(即各个最终嵌合核酸的5’到3序列中每一构件的装配次序)遵循如上所述的设计(或非随机地)。由于本发明的非随机特性,大大地降低了不需要的副产品的可能性。
另一方面,连接再装配方法被系统地进行。例如,实施该方法,以便产生子代分子的系统区分化的文库,该文库分成能被系统地筛选的数个部分,例如可以逐个地筛选。换句话说,通过选择性的和审慎的应用特定的核酸构件,再加上选择性的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的检查和筛选步骤。因此,这些方法允许很可能非常大量的子代分子以更小的组被系统地检查。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其是当祖先分子之间具有低水平的同源性时,这些方法可以产生包含大量子代分子的文库(或集合)。由于本发明的连接再装配的非随机特性,所产生的子代分子一方面包含有最终嵌合核酸分子的文库,这些核酸分子具有按设计而选择的总装配次序。饱和诱变和优化的定向进化方法也可以被用于产生不同的子代分子种类。应该意识到,本发明在分界点的选择、核酸构件的大小和数量以及偶联的大小和设计方面提供了选择的自由度和可控制性。进一步,应该意识到,就本发明的可操作性而言,对分子间同源性的要求大大地放宽了。事实上,甚至可以在有很少的分子间同源性或没有分子间同源性的区域内选择分界点。例如,由于密码子的摆动,即密码子的简并性,可以将核苷酸取代引入核酸构件,同时又不会改变在相应的祖先模板中最初编码的氨基酸。可以选择地,可以改变密码子,从而改变对原始氨基酸的编码。在本发明中,这样的取代可以被引入到核酸构件中,以便增加分子间同源分界点的发生率,从而使得在构件之间可获得的偶联的数量增加,而这又允许产生更多数量的子代嵌合分子。
另一方面,产生构件的步骤的合成属性允许设计和引入核苷酸(例如一个或多个核苷酸,例如可以是密码子或内含子或调控序列),这些核苷酸随后可以在体外过程中(例如通过诱变)或者在体内过程中(例如通过利用宿主生物体的基因剪接能力)被任选地去除。应该意识到,在许多情况下,除了产生有用的分界点的潜在好处之外,还有许多其它原因也使得可能期望引入这些核苷酸。
一方面,核酸构件被用于引入内含子。因此,功能性的内含子被引入进根据在此描述的方法产生的人造基因中。人工引入的内含子可以在宿主细胞中发挥基因剪切的功能,作用方式非常像天然产生的内含子发挥基因剪切功能的方式。优化的定向进化系统
本发明提供了一种非随机的基因修饰系统,命名为“优化的定向进化系统”,其可以用来产生具有新的或者改变的特性的磷脂酶。优化的定向进化涉及还原性重配、重组和选择的重复循环应用,其使得可以通过重组实现核酸的定向分子进化。优化的定向进化允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件(crossoverevents)的序列。
遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变体到另一个亲本变体的序列转换发生。这样的点一般在来自两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
此外,这一方法与其它系统相比,提供了一种用于探究大数量的可能蛋白变体空间的方便手段。以前,例如,如果在反应中产生了1013个嵌合分子,测试这样大数目的嵌合突变体的特定活性将会非常困难。此外,子代群体的相当部分将具有很高数目的遗传交换事件,其中得到的蛋白较不可能具有增高水平的特定活性。通过应用这些方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此,尽管在反应中可以仍然产生1013嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以偏向于具有预定数目的遗传交换事件,所以嵌合分子之间的功能多样性的界限缩小了。当要计算在最初的亲本多核苷酸中的哪一个寡核苷酸可能影响到特定的性质时,这便提供了更加可控数目的变量。
产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的片段或者部分的寡核苷酸。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡核苷酸混合在一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变体。在USSN09/332,835中可以发现另外的信息。对应于每一个亲本变体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的交换的总的数目具有一定的关系。例如,为了发现如在高温下具有更高活性的嵌合变体,可以提供三个亲本核苷酸序列变体来进行连接反应。作为一个例子,对应于每一个亲本变体的每一部分可以产生总共50个寡核苷酸序列。相应地,在连接再装配过程中,在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔量存在于连接反应中,有可能在一些位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一种寡核苷酸的浓度都保持不变,那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变体的寡核苷酸将连接于嵌合序列内而不产生交换。
因此,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给出了一套许多的亲本变体、对应于每种变体的许多寡核苷酸、以及在连接反应的每个步骤中的每种变体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。通过应用这些方法,可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重复循环应用,使得能够通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件的序列。遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变体到另一个亲本变体的序列转换发生。这样的点一般是在两个亲本的寡核苷酸连接在一起形成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合突变体的更多控制。
此外,这些方法与其它系统相比,提供了一种用于探究大数量的可能蛋白变体空间的方便手段。通过应用在这里描述的方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此,尽管在反应中可以仍然产生1013个嵌合分子,但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件,所以造成嵌合分子之间的功能多样性的界限减少。当计算出在最初的亲本多核苷酸中的哪一个可能影响到特定的性质时,便提供了更加可控制的变量。
一方面,该方法通过产生对应于每一个亲本序列的片段或者部分的寡核苷酸,产生嵌合子代多核苷酸序列。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述寡核苷酸混合一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变体。也可参见USSN09/332,835。
对应于每一个亲本变体产生的寡核苷酸数目与在最终产生的嵌合分子中得到的交换的总的数目具有一定的关系。例如,为了发现如在高温下具有更高活性的嵌合变体,可以提供三个亲本核苷酸序列变体来进行连接反应。作为一个例子,对应于每一个亲本变体的每一部分可以产生一组50个寡核苷酸序列。相应地,在连接再装配过程中,在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变体的寡核苷酸的可能性很低。如果每一个寡核苷酸片段以同样的摩尔量存在于连接反应中,有可能在一些位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接,而不导致遗传交换事件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一种寡核苷酸的浓度都保持不变,那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变体的寡核苷酸将连接于嵌合序列内而不产生交换。
因此,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中可能发生的遗传交换事件的总数,其中给出了一套许多的亲本变体、对应于每种变体的许多寡核苷酸、以及在连接反应的每个步骤中的每种变体的浓度。在确定PDF中应用到的统计学和数学在下面被描述。可以计算这样的概率密度函数,而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中心的概率密度函数。确定交换事件
本发明的多个实施方式包括系统和软件,它们接收所需的遗传交换的概率密度函数(PDF)、待再装配的亲本基因的数目以及在再装配中的片段数目作为输入值。该程序输出是“片段PDF”,它可以用于确定用于产生重新装配的基因和那些基因的估计的遗传交换PDF的方案。在此描述的过程优选地在(TheMathworks,Natick,Massachusetts)中进行,是一种用于技术计算的程序语言和开发环境。迭代方法(iterativeprocess)
在实践本发明时,这些过程可以迭代反复。例如,对产生改变的磷脂酶表型的核酸(或者,所述核酸)进行鉴定,重新分离,再修饰,再检测活性。此过程可以反复重复,直到得到所需的表型。例如,整个生物化学的合成代谢或者分解代谢途径可以被工程化到细胞中,包括磷脂酶活性。
类似地,如果确定了某特定寡核苷酸对于所期望的特性(例如新的磷脂酶表型)根本不会造成影响,则可以通过合成包括待除去的序列的更大的亲本寡核苷酸,从而将这段序列作为变量除去。由于将这一序列合并到更大的序列中避免了任何遗传交换事件,所以在子代多核苷酸中,这一序列不再有任何变异。确定哪些寡核苷酸与所需的性质最有关系,以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的可能提供特定性质或者活性的蛋白变体。体内改组
分子的体内改组在本发明的方法中使用,提供本发明的多肽的变体,例如抗体、磷脂酶以及类似物。体内改组可以利用重组多聚体的细胞的天然特性进行。尽管体内重组已经提供了分子多样性的主要天然途径,但遗传重组仍然是一种相对复杂的过程,该过程涉及1)同源性识别;2)链切割,链侵入,和导致产生重组交叉(recombinationchiasma)的代谢步骤;和最后3)交叉消除,得到分离的重组分子。交叉的形成需要同源序列的识别。
一方面,本发明提供由至少第一个多核苷酸和第二个多核苷酸产生杂合多核苷酸的方法。本发明可以用于通过将共有部分序列同源性的至少一个区域的至少第一多核苷酸和第二多核苷酸引入到合适的宿主细胞中而产生杂合多核苷酸。该部分序列同源性的区域促进导致产生杂合多核苷酸的序列识别的过程。如本文所用,术语“杂合多核苷酸”是由本发明的方法产生的任何核苷酸序列,含有从至少两个最初多核苷酸序列得到的序列。这样的杂合多核苷酸可以由促进DNA分子间的序列整合的分子间重组事件产生。另外,这样的杂合多核苷酸可以由利用重复序列以改变DNA分子中的核苷酸序列的分子内还原性重配过程产生。产生序列变体
本发明也提供使用本发明的核酸和多肽产生本发明的核酸和磷脂酶序列的序列变体,或者分离磷脂酶,例如,磷脂酶的序列变体的方法。一方面,本发明提供本发明的磷脂酶基因的变体,该变体可以使用任何方法改变,包括,例如随意或随机方法,或者非随机方法,或者“定向进化”方法,如以上描述。
被分离的变体可以是天然发生的。变体也可以在体外产生。变体也可以应用基因工程技术来产生,如定点诱变、随机的化学诱变、核酸外切酶III缺失方法和标准的克隆技术。可选择地,可以应用化学合成或者修饰方法来产生这样的变体、片段、类似物或者衍生物。本领域技术人员也熟悉制备变体的其它方法。这些方法包括这样的程序,其中,从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽的核酸,所述的特征增加这些多肽在工业或实验室应用中的价值。在这样的程序中,大量的变体序列被获得和表征,这些变体序列与从天然分离物中得到的序列相比,有一个或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离物的核酸编码的多肽的氨基酸变化。
例如,变体可以通过使用易错PCR产生。在易错PCR中,PCR在DNA聚合酶的复制保真性较低的情况下进行,这样便在全长的PCR产物中得到较高的点突变率。易错PCR在例如,Leung,D.W.等,Technique,1:11~15,1989和Caldwell,R.C.和JoyceG.F.,PCRMethodsApplic.,2:28-33,1992中描述。简要地说,在这样的程序中,待诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶以及适当浓度的dNTP混合,从而在全长的PCR产物中得到高的点突变率。例如,反应可以使用20fmol待诱变的核酸进行,每种PCR引物30pmol,反应缓冲液包含50mMKCl、10mMTrisHCl(pH8.3)和0.01%明胶、7mMMgCl2、0.5mMMnCl2、5单位的Taq聚合酶、0.2mMdGTP、0.2mMdATP、1mMdCTP和1mMdTTP。PCR可以进行30个循环,每个循环为94℃1分钟;45℃1分钟;和72℃1分钟。然而,应该意识到,这些参数可以适当地变化。诱变的核酸被克隆到一个适当的载体,并评价由诱变核酸编码的多肽的活性。
变体也可以用寡核苷酸诱导的定向突变产生,在任何感兴趣的克隆DNA中产生位点特异性的突变。寡核苷酸诱变在,例如,Reidhaar-Olson(1988)Science241:53-57中描述。简要地说,在这样的程序中,合成多个具有将要被导入被克隆的DNA中的一个或多个突变的双链寡核苷酸,将这些寡核苷酸插入到待诱变的克隆DNA中。回收含有诱变DNA的克隆,并评估它们编码的多肽的活性。
另一种产生变体的方法是装配PCR。装配PCR涉及由小DNA片段的混合物来装配PCR产物。大量不同的PCR反应在相同的容器中平行地发生,一个反应的产物引发另一个反应的产物。装配PCR已经被描述,例如在美国专利5,965,408中。
还有另一种产生变体的方法是有性PCR诱变。在有性PCR诱变中,由于基于序列同源性的DNA分子随机片段化,在不同的但是高度相关的DNA序列的DNA分子之间,在体外强行发生同源重组,然后通过PCR反应的引物延伸,交换得到固定。有性PCR诱变在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA91:10747-10751中描述。简要地说,在这样的程序中,多个待重组的核酸用DNase消化,产生具有50到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段,并重悬于PCR混合物中。在有利于核酸片段之间发生重组的条件下进行PCR反应。例如,PCR可以这样进行:将纯化的片段以10-30ng/μl的浓度重悬于含有0.2mM的各种dNTP、2.2mMMgCl2、50mMKCl、10mM的Tris-HCl,pH9.0以及0.1%的TritonX-100的溶液中。以100∶1的比例在反应混合物中加入2.5单位的Taq聚合酶,用以下的条件进行PCR:94℃60秒,94℃30秒,50-55℃30秒,72℃30秒(30-45次),然后72℃进行5分钟。然而,可以意识到,这些参数可以进行适当的变化。在一些方面,寡核苷酸可以被包括在该PCR反应中。在其它方面,DNA聚合酶I的Klenow片段可以用于第一组PCR反应,而Taq聚合酶可以用于后续组的PCR反应。重组序列被分离,并评估它们编码的多肽的活性。
变体也可以通过体内诱变产生。在一些实施方式中,感兴趣的序列中的随机突变通过在细菌菌株中扩增该感兴趣的序列而产生,所述细菌菌株例如在一个或者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖将最终产生DNA中的随机突变。适于在体内诱变中应用的突变菌株在,例如,PCT公开号WO91/16427中有描述。
变体也可以通过应用盒式诱变产生。在盒式诱变中,双链DNA分子的一个小的区域被不同于天然序列的合成的寡核苷酸“盒”替代。所述寡核苷酸一般含有完全和/或部分随机的天然序列。
递归整体诱变也可以用于产生变体。递归整体诱变是一种用于蛋白质工程(蛋白突变)的算法,它的开发是为了产生表型相关的突变体组成的多样性群体,其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA89:7811-7815中有描述。
在一些实施方式中,用指数整体诱变产生变体。指数整体诱变是一个用于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程,其中一小组的残基被随机化,同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整体诱变在如,Delegrave(1993)BiotechnologyRes.11:1548-1552中有描述。随机和定点诱变在如,Amold(1993)CurrentOpinioninBiotechnology4:450-455中有描述。
在一些实施方式,变体利用改组方法产生,其中编码不同的多肽的多个核酸的部分被融合在一起,产生编码嵌合多肽的嵌合核酸序列,如美国专利5,965,408;5,939,250中描述。
本发明也提供本发明的多肽变体,包括其中一个或多个氨基酸残基(例如,本发明的示例性多肽的氨基酸残基)被保守的或不保守的氨基酸残基(例如,保守的氨基酸残基)置换,这样的置换的氨基酸残基可以是或者不是由遗传密码编码的氨基酸残基。保守的置换是多肽中给定的氨基酸被具有相似特征的另一个氨基酸置换。因此,本发明的多肽包括具有本发明序列的保守置换的多肽,包括但不局限于以下置换:脂肪族氨基酸,例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸被另一个脂肪族氨基酸替换;丝氨酸被苏氨酸替换,或者相反;酸性残基例如天冬氨酸和谷氨酸被另一酸性残基替换;具有酰胺基团的残基,例如天冬酰胺和谷氨酰胺被另一具有酰胺基团的残基替换;碱性残基例如赖氨酸和精氨酸与另一碱性残基互换;芳香族残基例如苯丙氨酸、酪氨酸被另一芳香族残基替换。其它变体是本发明的多肽的一个或多个氨基酸残基包括取代基团的那些变体。
包括在本发明范围中的其它变体是多肽与另一化合物,例如可以增加多肽半寿期的化合物,例如聚乙二醇缔合的那些变体。
在本发明范围内的另外的变体中,另外的氨基酸融合到多肽上,如前导序列、分泌序列、原蛋白序列或者有利于纯化、富集或者使所述多肽稳定的序列。
在一些方面,本发明的多肽的变体、片段、衍生物和类似物保持与示例性多肽相同的生物功能或活性,例如在此描述的磷脂酶活性。另一些方面,变体、片段、衍生物或类似物包括前蛋白,使得变体、片段、衍生物或类似物可以通过切割前蛋白部分以产生活性多肽而被活化。密码子优化,以实现宿主细胞中高水平的蛋白表达
本发明提供修饰编码磷脂酶的核酸,以便改变密码子使用(codonusage)的方法。一方面,本发明提供修饰编码磷脂酶的核酸中密码子,以增加或降低其在宿主细胞中的表达的方法。本发明也提供了编码经修饰而增强其在宿主细胞中的表达的磷脂酶的核酸、经过这样的修饰的磷脂酶,和制备经修饰的磷脂酶的方法。该方法包括鉴定编码磷脂酶的核酸中的“非优选的”或“较不优选的”密码子,并且用编码相同氨基酸的“优选密码子”作为替换密码子替换一个或者多个这些非优选或者较不优选的密码子,并且在所述核酸中至少一个非优选或较不优选的密码子被编码相同氨基酸的优选密码子替换。优选密码子是在宿主细胞基因的编码序列中被较多使用的密码子,而不优选的或者较不优选的密码子是指在宿主细胞基因的编码序列中较少使用的密码子
用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此,本发明提供了在所有这些细胞中优化密码子使用的方法、密码子被改变的核酸,以及由所述的密码子被改变的核酸编码的多肽。示例性的宿主细胞包括革兰氏阴性细菌,如大肠杆菌;革兰氏阳性细菌,诸如任何芽胞杆菌属(Bacillus)(如蜡状芽孢杆菌)或链霉菌属、加氏乳酸杆菌(Lactobacillusgasseri)、乳酸乳球菌、乳脂乳球菌(Lactococcuscremoris)、枯草芽胞杆菌。示例性的宿主细胞也包括真核生物体,如,各种酵母,如酵母属某种(Saccharomycessp.),包括酿酒酵母、粟酒裂殖酵母、巴斯德毕赤酵母和乳酸克鲁维酵母(Kluyveromyceslactis)、多形汉森酵母(Hansenulapolymorpha)、黑曲霉(Aspergillusniger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此,本发明也包括在这些生物体和生物物种中的表达被优化的核酸和多肽。
例如,从细菌细胞中分离的编码磷脂酶的核酸密码子被修饰,以便该核酸在细菌细胞——其不同于获得磷脂酶的细菌、酵母、真菌、植物细胞、昆虫细胞或者哺乳动物细胞中优化表达。优化密码子的方法在本领域是已知的,参见如,美国专利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)ProteinExpr.Purif.12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect.Immun.69:7250-7253,描述了在鼠系统中优化密码子;Outchkourov(2002)ProteinExpr.Purif.24:18-24,描述了在酵母中优化密码子;Feng(2000)Biochemistry39:15399-15409,描述了在大肠杆菌中优化密码子;Humphreys(2000)ProteinExpr.Purif20:252-264,描述了大肠杆菌中导致分泌的优化的密码子使用。转基因非-人类动物
本发明提供了包含本发明的核酸、多肽、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因非人类动物。转基因非人动物可以是,例如,包括本发明的核酸的山羊、兔、绵羊、猪、母牛、大鼠和小鼠。这些动物可以作为,例如体内研究磷脂酶活性的模型使用,或者体内筛选体内磷脂酶活性的调节物的模型使用。要在转基因非人动物中表达的多肽的编码序列可以设计为组成型的,或者在组织特异性、发育特异性或者可诱导的转录调控因子的控制之下。转基因非人动物可以应用本领域任何已知的方法设计和产生;参见,如,美国专利6,211,428;6,187,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571,它们描述了制造和应用转化的细胞和卵以及转基因小鼠、大鼠、兔、羊、猪和牛。也参见,如,Pollock(1999)J.Immunol.Methods231:147-157,描述了在转基因产奶动物的乳汁中生产重组蛋白;Baguisi(1999)Nat.Biotechnol.17:456-461,描述了转基因山羊的产生。美国专利6,211,428,描述了制备和应用在其脑中表达含有DNA序列的核酸构建物的转基因非人哺乳动物。美国专利5,387,742,描述了把克隆的重组子或者合成的DNA序列注射至小鼠受精卵中,移植注射的卵至假孕的雌鼠中,并生长成为转基因鼠,它的细胞表达与阿尔茨海默氏病的病理相关的蛋白。美国专利6,187,992,描述了制备和应用转基因小鼠,它的基因组包括编码淀粉样前体蛋白(amyloidprecursorprotein,APP)的基因的断裂。
“基因敲除动物(Knockoutanimals)”也可以用于实践本发明的方法。例如,在一方面,本发明的转基因动物或者修饰的动物包括“基因敲除动物”,如“基因敲除鼠”,它被工程改造成不表达或不能表达磷脂酶。转基因植物和种子
本发明提供了包含本发明的核酸、多肽(例如磷脂酶)、表达序列盒或者载体或者被转染的细胞或者被转化的细胞的转基因植物和种子。本发明也提供了包含本发明的核酸和/或多肽(例如磷脂酶)的植物产物,如油、种子、叶、提取物以及类似物。转基因植物可以是双子叶的(双子叶植物)或者单子叶的(单子叶植物)。本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如,美国专利6,309,872。本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如,核酸或者表达构建物可以导入到所需的植物宿主的基因组中,或者,核酸或者表达构建物可以是附加体。导入到所需植物的基因组可以使得宿主的磷脂酶的产生被内源性的转录或者翻译控制元件调控。本发明也提供了“基因敲除植物”,其中例如同源重组导致的基因序列的插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已知的,参见如Strepp(1998)ProcNatl.Acad.Sci.USA95:4368-4373;Miao(1995)PlantJ7:359-365。参见下面关于转基因植物的讨论。
本发明的核酸可以用于将所需的性质赋予基本上任何植物,例如,含油籽的植物,如大豆、油菜籽、向日葵籽、芝麻和花生。为了优化或改变宿主磷脂酶的表达,本发明的核酸可以用于控制植物代谢途径。这可以改变植物中磷脂酶的活性。可选地,本发明的磷脂酶可以用于产生转基因植物,以产生不能由那种植物天然产生的化合物。这可以降低生产成本或产生新的产物。
一方面,产生转基因植物的第一步骤涉及制备在植物细胞中表达的表达构建物。这些技术是本领域熟知的。它们可以包括选择和克隆启动子、便于核糖体有效结合mRNA的编码序列以及选择适当的基因终止序列。一个典型的组成型启动子是来自花椰菜花叶病毒的CaMV35S,它一般在植物中导致高水平的表达。其它的启动子更具特异性,并且对植物的内部或者外部环境中的暗示有反应。典型的光诱导的启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。
一方面,修饰核酸来实现在植物细胞中更强的表达。例如,本发明的序列与在植物中所见的相比可能具有更高百分比的A-T核苷酸对,而一些植物优选G-C核苷酸对。因此,编码序列中的A-T核苷酸可以用G-C核苷酸取代,而不显著改变氨基酸序列,以增强在植物细胞中基因产物的产生。
为了鉴定已经成功整合了转移基因的植物细胞或者组织,可以将选择性标记基因加入到基因构建物中。这可能是必要的,因为在植物细胞中完成基因的整合和表达是一个小概率事件,仅仅在较少百分率的靶组织和细胞中发生。选择性标记基因编码对试剂有抗性的蛋白,所述试剂一般对植物有毒性,如抗生素或者除草剂。当在含有适当的抗生素或者除草剂的培养基上生长时,只有已经整合了选择性标记基因的植物细胞可以成活。与其它的插入基因一样,为了有恰当的功能,标记基因也需要启动子和终止序列。
一方面,转基因植物或种子制备方法包括将本发明的序列,和任选地,标记基因整合到目标表达构建物(例如,质粒)中,同时定位启动子和终止子序列。这可以包括将修饰的基因通过合适方法转入植物中。例如,构建物可以应用如电穿孔和显微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中,或者构建物可以应用弹道方法(ballisticmethods),如DNA微粒轰击(DNAparticlebombardment)的方法直接引入到植物组织中。例如,参见如,Christou(1997)PlantMol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature327:70-73;Talcumi(1997)GenesGenet.Syst.72:63-69,讨论了应用微粒轰击引入转基因到小麦中;Adam(1997)如上,应用微粒轰击将YACs引入至植物细胞中。例如,Rinehart(1997)如上,用微粒轰击来产生转基因棉花植物。用于加速微粒的设备在美国专利5,015,580中有说明;而且,可以通过商业渠道获得BioRad(Biolistics)PDS-2000微粒加速设备;也参见John,美国专利5,608,148;和Ellis,美国专利5,681,730,描述了微粒介导的裸子植物的转化。
一方面,原生质体可以被固定,并注射以核酸例如表达构建物。尽管源自原生质体的植物再生对于谷类并不容易,但是应用体细胞胚胎发生由原生质体来源的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸DNA转化,其中的DNA被包裹于钨微射弹(tungstenmicroprojectiles)上,射出物的大小为细胞大小的1/100,它携带DNA深入到细胞和细胞器中。转化的组织然后被诱导再生,一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个谷类物种中成功应用。
核酸,例如表达构建物也可以应用重组病毒引入到植物细胞中。植物细胞可以用病毒载体转化,如,烟草花叶病毒衍生的载体(Rouwendal(1997)PlantMol.Biol.33:989-999),参见Porta(1996)“Useofviralrepliconsfortheexpressionofgenesinplants”,Mol.Biotechnol.5:209-221。
可选择地,核酸,如表达构建物,可以与合适的T-DNA侧翼区组合,并导入到传统的根瘤农杆菌宿主载体中。根瘤农杆菌宿主的毒力功能将在植物细胞受该细菌感染时,引导构建物和邻近的标记插入至植物细胞DNA中。根瘤农杆菌介导的转化技术,包括解毒(disarming)和应用二元载体,在科学文献中有详细的说明。参见,如,Horsch(1984)Science233:496-498;Fraley(1983)Proc.Natl.Acad.Sci.USA80:4803(1983);GeneTransfertoPlants,Potrykus,ed.(Springer-Verlag,Berlin1995)。根瘤农杆菌细胞的DNA被包含在细菌染色体中,也被包含在称为Ti(肿瘤诱导)质粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(~20kb长)和一系列毒力(毒性)基因,T-DNA在感染过程中被转移到植物细胞中,毒力基因则引导所述感染过程。根瘤农杆菌可以通过伤口感染植物:当一种植物的根或者茎受伤时,它释放某种化学信号,作为对这种信号的响应,根瘤农杆菌的毒力基因被激活,并引发一系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到植物细胞。一个推测是T-DNA一直等到植物DNA被复制或者转录,然后将自身插入到暴露的植物DNA中。为了应用根瘤农杆菌作为转基因载体,必须去除T-DNA的肿瘤诱导部分,而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边界区域之间,从这里转移到植物细胞并且整合到植物的染色体中。
本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶植物的转化,参见Hiei(1997)PlantMol.Biol.35:205-218。也参见如,Horsch,Science(1984)233:496;Fraley(1983)Proc.NatlAcad.SciUSA80:4803;Thykjaer(1997)如上;Park(1996)PlantMol.Biol.32:1135-1148,讨论了将T-DNA整合到基因组DNA中。也参见D′Halluin,美国专利5,712,135,描述了包含在谷类或者其它单子叶植物的细胞中的具有功能的基因的DNA的稳定整合过程。
一方面,第三步可能涉及完整植物的选择和再生,所述植物能够将整合的靶基因传递至下一代。这样的再生技术依赖于在组织培养生长培养基中对某些植物激素的操作,其通常依赖于同所期望的核苷酸序列一起引入的杀虫剂和/或除草剂标记。源自培养的原生质体的植物再生在以下文献中有说明,Evans等,ProtoplastsIsolationandCulture,HandbookofPlantCellCulture,124-176页,MacMillilanPublishingCompany,NewYork,1983;和Binding,RegenerationofPlants,PlantProtoplasts,21-73页,CRCPress,BocaRaton,1985。再生也可以从植物愈伤组织、外植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.ofplantPhys.38:467-486中有概括性的说明。为了从转基因组织如未成熟的胚胎获得整个植物,它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养,即称为组织培养的过程。一旦整个植物再生并且产生种子,便开始评测其子代。
在表达序列盒稳定地整入到转基因植物之后,其可以通过有性杂交(sexualcrossing)引入到其它的植物中。可以应用任何的标准繁殖技术,这依赖于待杂交的物种。因为本发明核酸的转基因表达导致表型变化,包含本发明的重组核酸的植物可以和另一植物有性杂交而得到最终产物。因此,本发明的种子可以来自本发明的两个转基因植物的杂交,或者来自本发明的植物和其它植物的杂交。当两个亲本植物都表达本发明的多肽(如,磷脂酶)时,所需的效应(例如,表达本发明的多肽来产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到以后的植物世代中。
本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子是草,如牧草(蓝草,早熟禾属(Poa)),饲料草如羊茅属,黑麦草属,温带草,如翦股颖属(Agrostis),和谷类,如小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(maize)(玉米(corn))。本发明的双子叶转基因植物的例子是烟草、豆类,如羽扇豆、马铃薯、甜菜、豌豆、蚕豆和大豆,以及十字花科植物(Brassicaceae属),如花椰菜,油菜籽,和紧密相关的模式生物拟南芥(Arabidopsisthaliana)。这样,本发明的转基因植物和种子包括很宽范围的植物,包括,但不限于,以下属的种:腰果属(Anacardium)、落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、油菜属(Brassica)、柑桔属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、红花属(Carthamus)、椰子属(Cocos)、咖啡属(Coffea)、香瓜属(Cucumis)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、油棕属(Elaeis)、草莓属(Fragaria)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、马郁兰属(Majorana)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、稻属(Oryza)、黍属(Panieum)、狼尾草属(Pannisetum)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistachia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、白芥属(Sinapis)、茄属(Solanum)、高粱属(Sorghum)、可可属(Theobromus)、胡卢巴属(Trigonella)、小麦属(Triticum)、野豌豆属(Vicia)、葡萄属(Vitis)、豇豆属(Vigna)、和玉蜀黍属(Zea)。【0343a】在可选择的实施方式中,本发明的核酸在植物(例如,转基因植物),如含油籽植物,例如水稻、大豆、油菜籽、向日葵子、芝麻和花生中表达。本发明的核酸可以在含纤维细胞的植物,包括例如,棉花、丝棉树(木棉、吉贝木棉)、沙漠柳、石炭酸灌木(winterfat)、轻木(balsa)、苎麻、洋麻、大麻、洛神葵、黄麻、马尼拉剑麻和亚麻中表达。在可选择的实施方式中,本发明的转基因植物可以是棉属(Gossypium)的成员,包括任何棉属(Gossypium)种的成员,如,亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。
本发明也提供用于大量生产本发明的多肽(例如磷脂酶或抗体)的转基因植物。例如,参见Palingren(1997)TrendsGenet.13:348;Chong(1997)TransgenicRes.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′,2′)启动子,应用根癌农杆菌介导的叶片圆盘(leafdisc)转化方法,在转基因马铃薯植物中生产人乳汁蛋白β-酪蛋白)。
应用已知的程序,技术人员可以通过检测在转基因植物中转基因mRNA或蛋白的增加或减少来筛选本发明的植物。检测和定量mRNA或蛋白的方法在本领域是熟知的。多肽或肽
本发明提供了与本发明的示例性序列,例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176,具有序列同一性(例如,至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者更多,或者完全(100%)序列同一性)的分离的、合成的或重组的多肽。如以上讨论的,同一性可以在多肽的全长范围内,或者,同一性可以在其子序列,例如,至少大约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多残基的范围内。本发明的多肽也可以比示例性多肽的全长要短。在可选择的实施方式中,本发明提供大小在大约5到全长多肽范围的多肽(肽,片段),例如酶,如磷脂酶,例如,磷脂酶;示例性大小为大约5、10、15、20、25、30、35,40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400或更多残基,例如,示例性磷脂酶的连续残基。本发明的肽可以用作,例如,标记探针、抗原、耐受原、基序、磷脂酶活性位点、结合结构域、调控区域和类似物。
一方面,多肽具有磷脂酶活性,例如,切割甘油磷酸酯键,水解磷酸酯键的能力,包括马铃薯块茎蛋白(patatin),脂酰水解酶(LAH),磷脂酶A,B,C和/或磷脂酶D活性,或它们的任意组合。
在可选的方面,本发明的示例性多肽具有磷脂酶活性、信号序列位置、最初来源,如在下表1中所阐述。为了帮助阅读此表,例如在第一行,其中SEQIDNO:143、144指具有在SEQIDNO:144中阐述的序列的多肽,和由SEQIDNO:143编码的多肽,具有PLA-特异性PLA活性,最初分离自未知来源;另一个例子在SEQIDN0:167,168行,其中167、168指具有在SEQIDN0:168中阐述的序列的多肽,和由SEOIDNO:167编码的多肽,具有磷脂酸磷酸酶活性,残基1至30的信号序列(“AAl-30”指氨基酸残基1至30等),即MARSWKWRPLLSSFLLVSLAPFSTSVPCFK,最初分离自未知来源。本发明也提供包含信号序列的肽,和嵌合多肽,其中肽或嵌合多肽包含表1中所阐述的信号序列,且如下面所述。表1
SEO ID NO: 酶类型 信号序列位置(AA=氨基酸) 信号(AA) 来源
143,144 PA-特异性PLA 未知
25,26 马铃薯块茎蛋白(Patatin) 未知
77,78 Patatin 未知
35,36 Patatin 未知
125,126 Patatin 未知
135,136 Patatin 未知
99,100 Patatin 未知
65,66 Patatin 未知
87,88 Patatin 未知
86,87 Patatin 未知
45,46 Patatin 未知
59,60 Patatin 未知
13,14 Patatin 未知
71,72 Patatin 未知
55,56 Patatin 未知
33,34 Patatin 未知
91,92 Patatin 未知
103,104 Patatin 未知
11,12 Patatin 未知
17,18 Patatin 未知
95,96 Patatin 未知
43,44 Patatin 未知
27,28 Patatin 未知
131,132 Patatin 未知
127,128 Patatin 未知
133,134 Patatin 未知
137,138 Patatin 未知
165,166 Patatin 未知
167,168 磷脂酸磷酸酶 AA1-30 MARSWKWRPLLSSFLLVSLAPFSTSVPCF 未知
169,170 磷脂酸磷酸酶 未知
171,172 磷脂酸磷酸酶 未知
173,174 磷脂酸磷酸酶 未知
111,112 磷脂酰肌醇PLC AA1-16 MGAGAILLTGAPTASA 细菌
107,108 磷脂酰肌醇PLC AA1-23 MSNKKFILKLFICSTILSTFVFA 未知
109,110 磷脂酰肌醇PLC AA1-23 MSNKKFILKLFICSTILSTFVFA 未知
113,114 磷脂酰肌醇PLC AA1-23 MSNKKFILKLFICSTILSTFVFA 未知
117,118 磷脂酰肌醇PLC AA1-23 MNNKKFILKLFICSMVLSAFVFA 未知
119,120 磷脂酰肌醇PLC AA1-23 MNNKKFILKLFICSMVLSAFVFA 未知
115,116 磷脂酰肌醇PLC AA1-23 MNNKKFILKLFICSMVLSAFVFA 未知
121,122 磷脂酰肌醇PLC AA1-23 MRNKKFILKLLICSTVLSTFVFA 未知
141,142 磷脂酶 未知
155,156 磷脂酶 AA1-36 MRTTTTNWRQIVKSLKLFLMGLCLFISASFASSAYA 未知
159,160 磷脂酶 未知
145,146 PLA 未知
147,148 PLA 未知
149,150 PLA 未知
151,152 PLA 未知
153,154 PLA 未知
157,158 PLA 未知
163,164 PLA 未知
101,102 PLC AA1-39 LSLVASLRRAPGAALALALAAATLAVTAQGATAAPAAAAA 细菌
1,2 PLC AA1-24 MKKKVLALAAMVALAAPVQSWFAQ 未知
3,4 PLC AA1-24 MKRKILAIASVIALTAPIQSVAFAH 未知
5,6 PLC AA1-24 MKRKILAIASVIALTAPIQSVAFAH 未知
97,98 PLC AA1-25 MKRKLCTWALVTAIASSTAVIPTAAE 未知
7,8 PLC AA1-29 MITLIKKCLLVLTMTLLLGVFVPLQPSHAT 未知
31,32 PLC AA1-20 MKKKLCTWALVTAISSGWAI 未知
81,82 PLC AA1-25 MKKKLCTMALVTAIS SGVVTIPTEAQ 未知
93,94 PLC AA1-29 MITLIKKCLLVLTMTLLSGVFVPLQPSYAT 未知
89,90 PLC AA1-25 MKKKLCTLAFVTAISSIAITIPTEAQ 未知
123,124 PLC AA1-24 MKKKVLALAAMVALAAPVQSWFA 未知
129,130 PLC AA1-27 MKKKICTLALVSAITSGWTIPTVASA 未知
139,140 PLC AA1-20 MKIKPLTFSFGLAVTSSVQA 未知
105,106 PLC AA1-30 MNRCRNSLNLQLRAVTVAALVWAS SAALAW 未知
9,10 PLC AA1-20 MKLLRVFVCVFALLSAHSKAD 未知
47,48 PLD 未知
15,16 PLD 未知
41,42 PLD 未知
23,24 PLD 未知
51,52 PLD 未知
53,54 PLD 未知
19,20 PLD AA1-19 MKKTTLVLALLMPFGAASAQ 未知
75,76 PLD 未知
57,58 PLD 未知
63,64 PLD AA1-18 MKNTLILAGCILAAPAVAD 未知
79,80 PLD AA1-23 MRNFSKGLTSILLSIATSTSAMAF 未知
37,38 PLD A1-23 AMRNFSKGLTSILLSIATSTSAMAF 未知
61,62 PLD AA1-21 MTLKLSLLIASLSAVSPAVLAN 未知
67,68 PLD 未知
83,84 PLD AA1-21 MKKIVIYSFVAGVMTSGGVFAA 未知
49,50 PLD AA1-23 MNFWSFLLSITLPMGVGVAHAQPD 未知
39,40 PLD 未知
73,74 PLD 未知
29,30 PLD 未知
21,22 PLD AA1-28 MQQHKLRNFNKGLTGWLSVLTSTSAMAF 未知
71,72 PLD 未知
161,162 PLD AA1-24 MNRKLLSLCLGATSCIALSLPVHA 未知
一方面,本发明提供了具有一个或多个E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R突变的SEQIDNO:175或SEQIDNO:176中提及的序列和其子序列的多肽,子序列例如它们具有磷脂酶活性,例如磷脂酶C(PLC)活性的活性位点(催化区域)。一方面,多肽具有磷脂酶活性,但是缺少中性油(甘油三酯)水解活性。例如,一方面,多肽具有磷脂酶酶活性,但是缺少影响中性油(甘油三酯)部分的任何活性。一方面,本发明提供了油脱胶方法,该方法包括使用具有磷脂酶活性,但是缺少脂酶活性的本发明多肽。
本发明的多肽和肽可以分离自天然来源,可以是合成的,或者可以是重组产生的多肽。肽和蛋白可以在体外或体内重组表达。本发明的肽和多肽可以使用本技术领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本技术领域熟知的化学方法全部或部分合成。例如参见Caruthers(1980)NucleicAcidsRes.Symp.Ser.215-223;Horn(1980)NucleicAcidsRes.Symp.Ser.225-232;Banga,A.K.,TherapeuticPeptidesandProteins,Formulation,ProcessingandDeliverySystems(1995)TechnomicPublishingCo.,Lancaster,PA。例如,肽合成可以使用各种固相技术进行(例如参见Roberge(1995)Science269:202;Merrifield(1997)MethodsEnzymol.289:3-13),自动合成可以根据制造商提供的说明书来实施,例如使用ABI431A肽合成仪(PerkinElmer)。
本发明的肽和多肽也可被是糖基化。所述糖基化可以在翻译后通过化学方法或者通过细胞的生物合成机制而加上,其中后者包括应用已知的糖基化作用基序,所述糖基化作用基序可以对于所述序列是天然的,或者是作为肽段而被加入的,或者是在核酸编码序列中加入的。糖基化作用可以是O-联接的或者是N-联接的。
本发明的肽和多肽,如以上所定义的,包括所有的“模拟物(mimetic)”和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物”是指具有与本发明的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由合成的非天然的氨基酸类似物组成,或者是由部分天然的肽氨基酸和部分非天然的氨基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守置换,只要这样的置换本质上不改变该模拟物的结构和/或活性。对于作为保守性变体的本发明多肽,常规实验将可以确定一种模拟物是否在本发明的范围内,即,其结构和/或功能并没有实质上的改变。因此,一方面,如果一种模拟组合物具有磷脂酶活性,那么它在本发明的范围内。
本发明的多肽模拟组合物可以包含非天然结构成分的任何组合。在可选的方面,本发明的模拟组合物包括以下三种结构基团中的一种或全部:a)不是天然酰胺键(“肽键”)连接的残基连接基团;b)置换天然发生的氨基酸残基的非天然残基;或者c)诱导二级结构拟态(mimicry)的残基,即,可以诱导或者稳定二级结构,如β转角、γ转角、β折叠、α螺旋构象,以及类似的结构。例如,当本发明的多肽的所有残基或者一些残基通过非天然肽键的化学方式连接时,该多肽可以表征为模拟物。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接,如,通过戊二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N,N′-二环己基碳二亚胺(DCC)或者N,N′-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键(“肽键”)连接的连接基团包括,如,酮基亚甲基(如,-C(=O)-CH2-代替-C(=O)-NH-)、氨基亚甲基(CH2-NH)、次乙基、烯烃(CH=CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4-)、噻唑、逆酰胺(retroamide)、硫代酰胺或者酯(参见如,Spatola(1983)在ChemistryandBiochemistryofAminoAcids,PeptidesandProteins,第7卷,267-357页,“PeptideBackboneModifications”MarcellDekker,NY)。
本发明的多肽也可以由于含有全部或者部分替代了天然发生的氨基酸残基的非天然氨基酸残基而被表征为模拟物。在科学和专利文献中充分描述了非天然的残基;用作天然氨基酸残基的模拟物的一些典型的非天然组合物及指导在下面有描述。芳香族氨基酸的模拟物可以通过用以下进行取代来产生,如,D-或L-萘基丙氨酸;D-或L-苯基甘氨基,D-或L-2噻吩基丙氨酸(thieneylalanine);D-或L-1,-2,3-或4-芘基丙氨酸;D-或L-3噻吩基丙氨酸;D-或L-(2-吡啶基)-丙氨酸;D-或L-(3-吡啶基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸,D-或L-(4-异丙基)-苯基甘氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或L-p-二苯基苯基丙氨酸;D-或L-p-甲氧基-二苯基苯基丙氨酸;D-或L-2-吲哚(烷基)丙氨酸;和,D-或L-烷基丙氨酸,其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、仲异基(sec-isotyl)、异戊基或者非酸性氨基酸。非天然氨基酸的芳香环包括,如噻唑基、噻吩基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基和吡啶基芳香环。
酸性氨基酸的模拟物可以通过用以下进行取代来产生,如,同时保持负电荷的非羧酸氨基酸;(膦酰基)丙氨酸;硫酸化的苏氨酸。羧基侧链基团(如,天冬氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰,所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮鎓-4,4-二甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如,(除了赖氨酸和精氨酸外)氨基酸鸟氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸取代产生,其中烷基如以上定义。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬酰胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或者谷氨酰基残基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂优选在碱性的条件下反应而产生,所述的常规试剂包括如苯乙二醛、2,3-丁二酮、1,2-环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮鎓化合物或者四硝基甲烷反应而产生。N-乙酰基咪唑基甲烷和四硝基甲烷可以分别用于形成O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生;得到羧甲基或者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三氟丙酮、α-溴-β-(5-咪唑基)丙酸;氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸盐;2-氯汞-4硝基苯酚,或者,氯-7-硝基苯并-氧杂-1,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有α-氨基的残基模拟物也可以通过与亚氨酸酯例如甲基吡啶亚氨酸甲酯(methylpicolinimidate)、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、2,4,戊二酮的反应,和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括,例如,2-哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或对溴苯甲酰甲基溴化物反应而产生。其它的模拟物包括,例如,由脯氨酸和赖氨酸的羟基化作用产生的模拟物;由丝氨酰或者苏氨酰残基的羟基的磷酸化作用产生的模拟物;由赖氨酸、精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物;由N-末端胺的乙酰化作用而产生的模拟物;由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟物;或者,由C-末端羧基的酰胺化而产生的模拟物。
本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模拟物残基)替代。因此,天然发生的L-构型(也可以被称为R或者S,取决于化学实体的结构)的任何氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽模拟物替代,相反手性的氨基酸称为D-氨基酸,但也可以称R-或者S-型。
本发明也提供了通过天然过程,如,翻译后加工(如,磷酸化,酰化以及类似作用)或者通过化学修饰技术来修饰本发明的多肽的方法,以及得到的被修饰的多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和氨基端或者羧基端。可以理解,相同类型的修饰可以在已知的多肽中以相同的或者不同的水平在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组分、共价连接核苷酸或核苷酸衍生物、共价连接脂质或脂质衍生物、共价连接磷脂酰肌醇、交联环化作用、二硫键形成、去甲基作用、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解处理、磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用,和转移RNA介导氨基酸添加到蛋白质中,如精氨酰化。参见,如,Creighton,T.E.,Proteins-StructureandMolecularProperties2ndEd.,W.H.FreemanandCompany,NewYork(1993);PosttranslationalCovalentModificationofProteins,B.C.Johnson,Ed.,AcademicPress,NewYork,11-12页(1983)。
固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,SolidPhasePeptideSynthesis,第二版,PierceChemicalCo.,Rockford,III,11-12页),并且这些方法近来已经可以用于商业上可获得的实验室肽设计和合成试剂盒(CambridgeResearchBiochemicals)。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的教导,它们将肽合成在多个“杆(rods)”或者“钉(pins)”的顶端,而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的系统时,一个板的杆或者钉被倒转并插入到第二个板的相应孔或者贮存器中,所述孔或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重复这样的处理步骤,即是,反转和插入所述杆和钉的顶端至适当的溶液中,将氨基酸构建成所要的肽。此外,大量的可利用的FMOC肽合成系统是可利用的。例如,应用AppliedBiosystems,Inc.的Model431ATM自动肽合成仪可以在固体支持物上装配多肽或者片段。这些设备使得本发明的肽容易获得,或者通过直接的合成或者通过合成用其它已知的技术可以偶联起来的一系列片段。磷脂酶
本发明提供新的磷脂酶,编码磷脂酶的核酸,结合磷脂酶的抗体,代表酶的抗原位点的肽(抗原决定簇或表位)和活性位点的肽,调控和结合结构域,和产生和使用它们的方法。一方面,本发明的多肽具有磷脂酶活性,或如以上描述的磷脂酶活性(例如,甘油磷酸酯键的切割,缺少脂酶活性,等等)的任何组合。在可选的方面,本发明的磷脂酶具有由在此描述的示例性脂酶的活性修饰而得的活性。
本发明也包括具有或不具有信号序列的磷脂酶和信号序列本身。本发明包括本发明酶的片段或子序列,例如包含催化结构域(活性位点)、结合结构域、调控结构域、表位、信号序列、前区域和类似物的肽或多肽,或由它们组成的肽或多肽。本发明也包括固定化的磷脂酶、抗磷脂酶抗体和它们的片段。本发明包括杂合物(heterocomplexes),例如,包括本发明的磷脂酶的融合蛋质、异二聚体等。代表酶的抗原位点(表位)、活性位点、结合位点、信号序列和类似物的肽可以用常规的筛选方案确定。
本发明的这些酶和方法可以用于实现对高磷含量的油,特别是大米、大豆、玉米、油菜和向日葵油更彻底的脱胶。例如,一方面,用PI-PLC切割后,磷脂酰肌醇被转化为二酰甘油和磷酸肌醇。在离心期间,二酰甘油与水相分开(从而提高油产量),并且磷酸肌醇与水相分开,其中它作为重相的组分被去除。本发明的酶,例如本发明的PI-PLC可以被掺入化学或物理油精炼过程。
在可选的实施方式中,本发明的酶具有磷脂酰肌醇-特异性磷脂酶C(PI-PLC)活性、磷脂酰胆碱-特异性磷脂酶C活性、磷脂酸磷酸酶活性、磷脂酶A活性和/或patatin-相关的磷脂酶活性。这些酶可以单独使用,或者相互之间或与本发明的其它酶,或其它酶组合使用。一方面,本发明提供了这样的方法,其中这些酶(包括本发明的磷脂酰肌醇-特异性磷脂酶C(PIPLC)、磷脂酰胆碱-特异性磷脂酶C和/或磷脂酶D(与磷酸酶结合)、磷脂酸磷酸酶、磷脂酶A、patatin-相关的磷脂酶)被单独或组合用于使油脱胶,所述油诸如植物油,例如高磷油,诸如大豆油、玉米油、油菜油、米糠油和向日葵油。本发明的这些酶和方法可以用于实现对高磷含量的油,特别是大豆、玉米、油菜、米糠和向日葵油更彻底的脱胶。一旦用PI-PLC切割,磷脂酰肌醇被转化为二酰甘油和磷酸肌醇。在离心期间,二酰甘油与水相分开(从而提高油产量),且磷酸肌醇与水相分开,其中它作为重相的组分被去除。本发明的酶,例如本发明的PI-PLC可以被掺入化学或物理油精炼过程。
一方面,本发明提供了组合物,例如溶液,包括中性pH的柠檬酸钠,以水合不可水合物。例如,本发明提供了pH范围在约4至9、或约5至8、或约6至7的柠檬酸钠溶液,其可以被用于水合高磷油中的不可水合的磷脂(包括本发明的酶)。一方面,非水合磷脂的水合是通过螯合与磷脂相缔合的钙和镁进行的,从而使得之前不可溶性的磷脂盐更容易地在水相中分开。一方面,一旦磷脂向水/油介面移动或进入水相,本发明的磷脂酶(本发明的磷脂酶-特异性磷酸水解酶)或其它磷脂酶,将把磷脂转化为二酰甘油和磷酸酯。一方面,一旦加入酸和碱,钙和酶金属的含量将降低(参见有关碱方法的论述)
本发明的酶是高度选择性的催化剂。与别的酶一样,它们催化具有常规合成化学中不能比拟的强的立体选择性、区域选择性和化学选择性的反应。而且,本发明的酶是非常多用的。它们可以经改变在有机溶剂中具有功能,可在极端pH(例如,高pH和低pH)、极端温度(例如,高温和低温)、极端盐度水平(例如,高盐度和低盐度)下操作,并且催化结构上与它们的天然的、生理学上的底物无关的化合物的反应。本发明的酶可以设计为与大范围的天然和非天然底物反应,因此,使得能事实上修饰任何有机先导化合物。本发明的酶也可以设计为具有高度的对映选择性和区域选择性。这些酶所展示出的高度的官能团特异性使得人们能明了产生新的活性化合物的合成顺序中的每一个反应。本发明的酶也可以设计为催化许多与它们的天然生理功能无关的不同的反应。
本发明利用了酶的独特催化特性。然而,在化学转化中,生物催化剂(即,纯化的酶或粗酶,非活细胞或活细胞)的使用一般要求确定与特异的起始化合物反应的特定生物催化剂。本发明使用经选择的生物催化剂,即,本发明的酶,和对在许多起始化合物中都存在的官能团具有特异性的反应条件。每种生物催化剂对一种官能团,或几种相关官能团特异,可以与含有这种官能团的多种起始化合物反应。生物催化反应由单个的起始化合物产生一个衍生物群体。这些衍生物可以经过另一轮生物催化途径,产生第二个衍生化合物群体。生物催化衍生化作用的每次重复都可以产生数千种最初化合物的变体。
酶在起始化合物的特异位点反应而不影响该分子的其余部分,这是使用传统的化学方法非常难以达到的过程。这种高度的生物催化特异性提供了鉴定文库内单个活性化合物的方法。所述文库由一系列用于产生该文库的生物催化反应来表征,即所谓的“生物合成历史”。就生物学活性筛选文库和追踪生物合成历史鉴定出产生活性化合物的具体反应顺序。重复该反应序列并且确定所合成的化合物的结构。不像其它的合成和筛选方法,这种鉴定方式不需要固定技术,以及化合物可以被合成并应用实际上任何类型的筛选试验在溶液中被自由测试。重要的是,注意到,酶反应对于官能团的高度特异性允许追踪生成生物催化产生的文库的特异酶促反应。
本发明也提供使用本发明的核酸、多肽和抗体,来发现新的磷脂酶的方法。一方面,筛选λ-噬菌体文库以基于表达发现磷脂酶。在筛选中使用λ-噬菌体文库可以允许如下事项:检测毒性克隆;改进与底物的接触;降低对工程改造宿主的要求,绕开任何由文库的大量切除所致的任何潜在偏差;和,在低克隆密度下的快速生长。λ-噬菌体文库的筛选可以在液相或在固相中进行。在液相中筛选赋予分析条件的更大灵活性;额外的底物灵活性;对弱克隆更为灵敏;比固相筛选易于自动化。
许多程序步骤使用机器自动化进行,这使得每天可以完成几千种生物催化反应和筛选分析,同时确保高度准确和再现性(见以下的阵列讨论)。结果,衍生化合物的文库可以在大概数周内产生。对分子,包括小分子修饰的进一步教导,参见PCT/US94/09174。磷脂酶信号序列
本发明提供磷脂酶的信号序列(例如,信号肽(SPs)),例如含有信号序列的肽和/或嵌合多肽,其中所述肽或嵌合多肽具有表1中示出的信号序列,或如下面示出的信号序列。本发明提供了编码这些信号序列(SPs,例如具有含有本发明多肽的氨基末端残基的序列的肽,或具有由本发明多肽的氨基末端残基组成的序列的肽)的核酸。一方面,本发明提供了信号序列,其包括这样的肽,该肽包含本发明多肽的残基1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1到28、1到29、1到30、1到31、1到32或1到33中所阐述的序列,或该肽由所述序列组成,所述本发明的多肽例如具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176。这些肽中的任何肽可以是嵌合蛋白,例如重组蛋白的一部分。信号序列肽可以与本发明的其它酶(例如本发明的磷脂酶,不是从其衍生得到的),或与其它磷脂酶,或与任何多肽匹配,如下所进一步论述的。
示例性的信号序列列于表1和SEQID列表中,如,SEQIDNO:2、SEQIDNO:4、SEQIDNO:6的残基1到24;SEQIDNO:8的残基1到29;SEQIDNO:10的残基1到20;SEQIDNO:20的残基1到19;SEQIDNO:22的残基1到28;SEQIDNO:32的残基1到20;SEQIDNO:38的残基1到23;对于本发明的其它示例性信号序列,参见表1和SEQID列表。
在一些方面,本发明的磷脂酶无信号序列。一方面,本发明提供了缺少所有或部分信号序列的磷脂酶。一方面,本发明提供了编码来自一个磷脂酶的信号序列的核酸序列,该信号序列可操作性地连接到不同的磷脂酶的核酸序列上,或任选地,来自非磷脂酶蛋白的信号序列也可以是期望的。磷脂酶前原结构域、结合结构域和催化结构域
如上所述,除了信号序列(例如信号肽(SPs)),本发明提供了前原结构域、结合结构域(例如底物结合结构域)和催化结构域(CDs)。本发明的SP结构域、结合结构域、前原结构域和/或CDs可以是分离的、合成的或重组的肽,或可以是融合蛋白的一部分,例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催化结构域(CDs)(例如“活性位点”)、前原结构域、结合结构域和信号序列(SPs,例如具有含有本发明多肽的氨基末端残基的序列的肽,或具有由本发明多肽的氨基末端残基组成的序列的肽)的核酸。
本发明的磷脂酶的信号序列(SPs)、结合结构域、催化结构域(CDs)和/或前原序列可以是分离的肽,或者连接于其它磷脂酶或者非磷脂酶多肽的序列上,如,作为融合(嵌合)蛋白。在一方面,包含本发明磷脂酶信号序列SPs和/或前原的多肽含有与本发明磷脂酶异源的序列(例如,包含本发明的SP和/或前原以及其它磷脂酶或非磷脂酶蛋白的序列的融合蛋白)。一方面,本发明提供了具有异源CDs、SPs和/或前原序列,例如具有酵母信号序列的序列的本发明磷脂酶。本发明的磷脂酶可以包括异源的CDs、SPs和/或前原序列,在载体中,例如在pPIC系列载体(lnvitrogen,Carlsbad,CA)中。
一方面,本发明的SPs、CDs和/或前原序列在鉴定新型的磷脂酶多肽之后来确定。进行分选蛋白质并且转运蛋白质至它们的细胞内合适位置的途径,一般被称为蛋白质定向转运途径(proteintargetingpathways)。在所有这些定向转运系统中的最重要成员之一是在新合成多肽的氨基端的短氨基酸序列,叫做信号序列。信号序列引导蛋白质至细胞的合适位置定位,并且在转运过程中或者当蛋白到达其最终的目的地之后去除。大多数溶酶体蛋白,膜蛋白,或者分泌蛋白具有氨基末端信号序列,该序列标记这些蛋白用于转移到内质网的腔中。信号序列的长度可以在从13到45或更多个氨基酸残基内进行变化。本领域技术人员知道识别信号序列的各种方法。例如,一方面,通过称为SignalP的方法来鉴定新型的水解酶信号肽。SignalP应用识别信号肽和它们的切割位点的组合的神经网络。(Nielsen,等,“Identificationofprokaryoticandeukaryoticsignalpeptidesandpredictionoftheircleavagesites.”ProteinEngineering,vol.10,no.1,p.1~6(1997)。
一方面,本发明的磷脂酶不必具有SPs和/或前序列,和/或催化结构域(CDs)。一方面,本发明提供缺少所有或部分SP、CD和/或前原结构域的磷脂酶。一方面,本发明提供了编码来自一个磷脂酶的信号序列(SP)、CD和/或前序列的核酸序列,其可操作性地连接到不同的磷脂酶的核酸序列上,或任选地,来自非磷脂酶蛋白的信号序列(SP)、CD和/或前原结构域也是可期待的。
本发明也提供了分离的、合成的或者重组的多肽,含有本发明的信号序列(SPs)、前原结构域和/或催化结构域(CDs),以及异源序列。异源序列是与SP、前原结构域和/或CD非天然相关(如,对于磷脂酶)的序列。与SP、前原结构域和/或CD非天然相关的序列可以在SP、前原结构域和/或CD的氨基末端,羧基末端,和/或在SP和/或CD的末端。一方面,本发明提供了分离的、合成的或者重组的多肽,包括(或者由之组成)这样的多肽,该多肽包括本发明的信号序列(SPs)、前原结构域和/或催化结构域(CDs),条件是其并不与和其有天然联系的任何序列有联系(如磷脂酶序列)。相似地,一方面,本发明提供了编码这些多肽的分离的、合成的或者重组的核酸。所以,一方面,本发明的分离、合成或者重组核酸包含有本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)以及异源序列(即是,与本发明的信号序列(SP)、前原结构域和/或催化结构域(CD)的编码序列并不天然关联的序列)的编码序列。异源序列可以在3’末端、5’末端,和/或在SP、前原结构域和/或CD编码序列的末端。
本发明的多肽包括活性形式的或无活性形式的磷脂酶。例如,本发明的多肽包括“成熟”或对前序列加工之前的前蛋白,对前序列加工例如通过前蛋白-加工酶,例如前蛋白转化酶对前蛋白加工以产生“有活性的”成熟蛋白。本发明的多肽包括因其它原因而失活的磷脂酶,例如在翻译后加工事件“激活”之前,例如内-或外肽酶或蛋白酶作用、磷酸化作用事件、酰胺化作用、糖基化作用、去糖基化、硫酸化作用、二聚体化事件和/或类似作用。鉴定“前”区域序列、CDs、结合结构域和信号序列的方法是常规的,并且是本领域熟知的,参见例如VandeVen(1993)Crit.Rev.Oncog.4(2):115-136;用于鉴定蛋白质-蛋白质相互作用的酵母双杂交筛选,由Miller(2004)MethodsMoI.Biol.261:247-62;Heyninck(2004)MethodsMoI.Biol.282:223-41,USPN6,617,122;6,190,874描述。例如,为了鉴定前原序列,从胞外空间纯化蛋白质,测定N-端蛋白质序列,并与未加工的形式作比较。
本发明的多肽可以作为蛋白质制剂配制成任何液体、固体、半固体或凝胶形式。例如,本发明的蛋白质制品可以包括这样的制剂,其含有非水液体组合物、铸造固体、粉末、冻干粉末、粒状形式、颗粒形式、压缩片剂、小球、丸剂、凝胶形式、水凝胶、膏、气溶胶、雾剂、洗液或浆状制剂。
本发明的多肽包括所有的活性形式,包括本发明酶的活性子序列,例如催化结构域(CDs)或活性位点。一方面,本发明提供下面阐述的催化结构域或活性位点。一方面,本发明提供了肽或多肽或等同物,其包括通过使用数据库诸如Pfam(其收集了大量的多序列比对和覆盖了许多常见的蛋白质家族的隐藏的Markov模型,ThePfamproteinfamiliesdatabase,A.Bateman,E.Birney,L.Cerruti,R.Durbin,L.Etwiller,S.R.Eddy,S.Griffiths-Jones,K.L.Howe,M.Marshall和E.L.L.Sonnhammer,NucleicAcidsResearch,30(1):276-280,2002)而预测到的活性结构域,或由这些预测到的活性结构域组成。
本发明提供了本发明酶的N-端或C-端子序列(例如信号序列、前序列)与其它多肽、活性蛋白质或蛋白质片段的融合物。本发明的酶(例如磷脂酶C酶)也可以通过将酶作为无活性的融合蛋白表达而产生,该无活性的融合蛋白随后通过蛋白质水解切割事件激活(使用内源性或外源性蛋白酶活性,例如胰蛋白酶),切割导致融合蛋白伴侣和成熟的酶,例如磷脂酶C酶分离。一方面,本发明的融合蛋白由杂合核苷酸构建物表达,该构建物编码单个开放阅读框,含有下述元件:融合蛋白的核苷酸序列、接头序列(定义为编码连接两个柔性较小的蛋白区域的柔性氨基酸序列的核苷酸序列)、蛋白酶切割识别位点和成熟酶(例如本发明的任何酶,例如磷脂酶)序列。在可选的方面,融合蛋白可以包含果胶裂解酶序列、木聚糖酶序列、磷脂酸磷酸酶序列或另一序列,例如之前显示在感兴趣的宿主细胞中过量表达的序列。
可以使用任何宿主系统(参见上面论述),例如任何细菌,例如革兰氏阳性细菌,诸如杆菌属,或革兰氏阴性细菌,诸如大肠杆菌,或任何酵母,例如巴斯德毕赤酵母。嵌合核苷酸构建物中的核苷酸序列的排列可以基于用每一融合构建物获得的蛋白质表达水平来测定。一方面,从核苷酸构建物的5’端至构建物的3’端,核苷酸序列如下装配而成:信号序列/融合蛋白/接头序列/蛋白酶切割识别位点/成熟酶(例如本发明的任何酶,例如磷脂酶)或信号序列/前序列/成熟酶/接头序列/融合蛋白。酶(例如本发明的任何酶,例如磷脂酶)作为无活性融合蛋白表达,可以提高酶序列的总表达水平,可以减少与活性酶过表达相关的任何潜在的毒性,和/或可以增加使用之前的货架期,这是因为在融合蛋白,例如果胶裂解酶与酶,例如磷脂酶蛋白分离之前是无活性的。
在各个方面,本发明提供了激活作为融合蛋白表达的本发明的磷脂酶的具体的制剂。一方面,使用蛋白质水解活性或潜在的蛋白质水解活性结合氨基-末端或羧基末端肽酶,来激活最初作为无活性的融合蛋白表达磷脂酶活性。该激活事件可以用各种方法实现,并且是在应用于油脱胶之前的制备/储存过程的各种时间点时进行。本发明的示例性方法包括:在将融合构建物分泌到发酵介质中后由生产性宿主表达的内源活性进行的切割;在宿主细胞破坏之后,由激活的内源性蛋白酶活性进行的切割,或与胞内表达的融合构建物接触;使粗或纯化的融合构建物通过具有固定化的蛋白酶活性的柱,以在制备酶制剂之前完成切割和酶(例如本发明的磷脂酶,例如磷脂酶C)激活作用。用可溶性的蛋白质水解活性源处理粗的或纯化的融合构建物;在油精炼中,使用可溶性的或不溶性的蛋白质水解活性源,激活磷脂酶(例如本发明的磷脂酶,例如磷脂酶C),之后立即用于各方法中;和/或在减低的温度(例如在约40℃至200℃之间的任何温度),通过使融合构建物制剂持续循环通过具有固定化的蛋白酶活性的柱,来激活(例如本发明的磷脂酶,例如磷脂酶C)磷脂酶活性。该激活事件可以在传递到使用位置之前完成,或它可以在油精炼中原位发生。糖基化
本发明的肽和多肽(例如水解酶、抗体)也可以进行糖基化,例如一方面,含有至少一个糖基化位点,例如N-连接或O-连接的糖基化。一方面,多肽可以在巴斯德毕赤酵母或粟酒裂殖酵母中表达后进行糖基化。糖基化可以在翻译后以化学的方式或通过胞内生物合成机制加入,其中后者整合使用已知的糖基化基序,其对于序列来说可以是天然的,或可以作为肽加入,或加入到核酸编码序列中。
一方面,本发明提供了含有N-连接的糖基化的SEQIDNO:2的多肽,如下表中所述:全长SEQIDNO:2(在一个方面其由SEQIDNO:1编码)开放阅读框编码七(7)个潜在的天冬酰胺-连接的(N-连接)的糖基化位点。野生型SEQIDNO:2开放阅读框在能够进行糖基化的宿主(例如,巴斯德毕赤酵母、酿酒酵母、粟酒裂殖酵母或哺乳动物细胞)中的表达,导致产生糖基化的SEQIDNO:2磷脂酶,其由于存在N-连接的糖基化作用基本上没有活性。用糖苷酶(PNGase)F或内切糖苷酶H对野生型糖基化的SEQIDNO:2进行酶法去糖基化作用,导致激活SEQIDNO:2活性。此外,通过诱变对一个或多个N-连接的糖基化位点进行修饰(以便该位点不再被识别为N-连接的糖基化位点,并且糖基化不再在那个位点发生),导致产生具有不同的活性增加程度的SEQIDNO:2。
相比起在相同的宿主细胞中表达的野生型开放阅读框,对SEQIDNO:2糖基化位点4、5和/或6中编码天冬酰胺的核苷酸密码子进行诱变(例如将天冬酰胺转化为天冬氨酸),导致产生具有增加的PLC活性的酶(在巴斯德毕赤酵母中表达的三联突变体具有与在非糖基化宿主如大肠杆菌中表达的野生型序列基本上相同的比活性和功能活性)。在N-连接的糖基化共有序列(NXS/T)中通过诱变丝氨酸和苏氨酸来废除N-连接的糖基化位点也是可能的,例如通过在这些位置转化这些核苷酸密码子产生缬氨酸或异亮氨酸,以代替丝氨酸或苏氨酸。使用该策略来除去N-连接的糖基化位点也导致在具有糖基化作用的宿主表达系统中产生活性SEQIDNO:2磷脂酶。磷脂酶活性的分析
本发明提供了具有磷脂酶活性或任何组合的磷脂酶活性的分离的、合成的或者重组的多肽(例如酶、抗体),以及编码它们的核酸。本领域已知的很多磷脂酶分析方法中的任何方法都可以用于确定多肽是否具有磷脂酶活性,并且在本发明的范围内。用于确定磷脂酶A,B,D,和C,patatin和脂酰水解酶活性或脂酶活性的常规方案是本领域已知的。
示例性的活性分析包括混浊度分析、羟甲香豆素磷酸胆碱(荧光)分析、Amplexred(荧光)磷脂酶分析、薄层色谱分析(TLC)、细胞裂解分析和p-硝基苯基磷脂酰胆碱分析。应用这些分析方法,可以很快地筛查出具有磷脂酶活性的多肽、肽或抗体。
磷脂酶活性可以包括脂酰水解酶(LAH)活性,参见如,Jimenez(2001)Lipids36:1169-1174,该文献描述了用于确定patatin的脂酰水解酶活性的以八乙二醇单十二烷基醚(octaethyleneglycolmonododecylether)为基础的混合微胶粒分析。Pinsirodom(2000)J.Agric.FoodChem.48:155-160,该文献描述了示例性的脂酰水解酶(LAH)patatin活性。
在以下文献中说明了用于确定磷脂酶活性的混浊度分析,如Kauffmann(2001)“ConversionofBacillusthermocatenulatuslipaseintoanefficientphospholipasewithincreasedactivitytowardslong-chainfattyacylsubstratesbydirectedevolutionandrationaldesign”ProteinEngineering14:919-928;Ibrahim(1995)“EvidenceimplicatingphospholipaseasavirulencefactorofCandidaalbicans,”Infect.Immun.63:1993-1998。
用于确定磷脂酶活性的羟甲香豆素(荧光)磷酸胆碱分析方法描述在下述文献中,例如Goode(1997)“Evidenceforcellsurfaceandinternalphospholipaseactivityinascidianeggs,”Develop.GrowthDiffer.39:655-660;Diaz(1999)“Directfluorescence-basedlipaseactivityassay,”BioTechniques27:696-700。
用于确定磷脂酶活性的AmplexRed(荧光)磷脂酶分析可以作为试剂盒获得,如,应用来自MolecularProbesInc.(Eugene,OR)的AmplexRed磷脂酰胆碱-特异性磷脂酶分析试剂盒,按照制造商的说明,检测磷脂酰胆碱-特异性磷脂酶。在荧光微板读数器中,使用560±10nm的激发光和590±10nm的荧光检测,测量荧光。该分析在极低酶浓度时也灵敏。
确定磷脂酶活性的薄层色谱分析(TLC)描述在Reynolds(1991)MethodsinEnzymol.197:3-13;Taguchi(1975)“PhospholipasefromClostridiumnovyitypeA.I,”Biochim.Biophys.Acta409:75-85中。薄层色谱分析(TLC)是用于检测磷脂酶活性的广泛应用的技术。已经应用了该方法的不同的经改良的方法从液相分析混合物提取磷脂酶。在一些PLC的分析中,通过将氯仿/甲醇(2∶1)加入到反应混合物中来终止水解。未反应的起始物以及二酰基甘油通过萃取进入有机相,并且可以通过TLC分离,而首基(headgroup)产物仍保留在水相中。为了获得对磷脂消化更精确的测定,可以使用放射性标记的底物(参见,如,Reynolds(1991)MethodsinEnzymol.197:3-13)。产物和反应物的比率可以用于计算单位时间内的底物水解的实际摩尔数。如果所有的成分相同提取,提取中的任何损失将相同地影响所有的成分。磷脂消化产物的分离可以通过硅胶TCL来完成,用氯仿/甲醇/水(65∶25∶4)作为溶剂系统(参见,如,Taguchi(1975)Biochim.Biophys.Acta409:75-85)。
确定磷脂酶活性的P-硝基苯磷脂酰胆碱分析描述于例如Korbsrisate(1999)J.Clin.Microbiol.37:3742-3745;Berka(1981)Infect.Immun.34:1071-1074。该分析方法基于酶法水解底物类似物P-硝基苯磷脂酰胆碱,释放黄色的生色化合物p-硝基苯,可以在405nm检测到。该底物方便用于进行高通量筛选。
基于红细胞裂解,细胞裂解分析可以检测具有细胞裂解活性的磷脂酶。毒性磷脂酶可以与真核细胞膜作用,并水解磷脂酰胆碱和鞘磷脂,引起细胞裂解,参见,如,Titall(1993)Microbiol.Rev.57:347-366。杂合(嵌合)磷脂酶和肽文库
一方面,本发明提供了杂合磷脂酶和融合蛋白,包括肽文库,其含有本发明的序列。本发明的肽文库可以用于分离靶,如磷脂酶底物、受体、酶的肽调节物(如激活剂或者抑制剂)。本发明的肽文库可以用于鉴定与靶的正常结合伴侣,如配体,例如,细胞因子、激素和类似物。一方面,本发明提供了包括本发明的信号序列(SP)和/或催化结构域(CD)以及异源序列的嵌合蛋白(参见上文)。
本发明也提供了应用本发明核酸和多肽,来产生“改进的”和杂合的磷脂酶的方法。例如,本发明提供了用于产生具有活性的酶的方法,所述活性如,在极端碱性pH值和/或酸性pHs、高和低的温度、渗透压和类似条件下的磷脂酶活性(如,磷脂酶A、B、C或者D活性、patatin酯酶活性、甘油磷酸酯键的切割、植物油中磷脂的酯键的切割)。本发明提供了用于产生杂合酶(如,杂合磷脂酶)的方法。
一方面,本发明的方法通过应用细胞内过程产生新的杂合多核苷酸,该过程整合第一多核苷酸的序列,这样所得到的杂合多核苷酸编码表现源于第一生物活性多肽的活性的多肽。例如,第一多核苷酸可以是编码本发明示例性的磷脂酶的示例性核酸序列。第一核酸可以编码来自一种生物的酶,其在特定的环境条件下,如高盐的条件下有效地发挥作用。它可以与由源于不同生物体的第二多核苷酸所编码的酶“整合”,该酶可以在不同的环境条件下如极端的高温条件下,有效地发挥作用。例如,两个核酸可以通过例如重组和/或还原性重配产生杂合分子。含有来自第一和第二原始多核苷酸的序列的杂合多核苷酸可以编码表现出由该原始多核苷酸编码的两种酶的特性的酶。因此,由杂合多核苷酸编码的酶可以在第一和第二多核苷酸编码的酶中的每一个酶共有的环境条件下,如高盐和极端温度下有效地发挥作用。
可选地,由本发明得到的杂合核苷酸可以表现出原始酶所没有显示出的特异化酶活性。例如,在编码磷脂酶活性的多核苷酸重组和/或还原性重配以后,由杂合多核苷酸编码的杂合多肽可以被筛查其得自每一个起始酶的特异活性,即,磷脂酶对之作用的键的类型以及磷脂酶发挥作用的温度。这样,例如,可以筛查磷脂酶,来查明那些可以将杂合磷脂酶从起初的磷脂酶分辨出来的化学官能度,如:(a)酰胺(肽键),即,磷脂酶;(b)酯键,即,淀粉酶和脂肪酶;(c)缩醛,即寡糖酶,和,例如,杂合多肽作用的温度、pH或者盐浓度。
待与本发明的核酸“整合”的多核苷酸来源可以从下述分离:个体生物(“分离物”),生长于确定培养基的生物群(“富集培养物”),或者,未经培养的生物(“环境样品”)。由于其使人们可以接近未开发的生物多样性的资源,应用培养基依赖的(culture-independent)方法来得到编码来自环境样品的新型生物活性的多核苷酸是最优选的。“环境文库”从环境样品中产生,并且代表了天然发生生物体的全体的基因组,环境文库保存在克隆载体中,载体可以在适合的原核宿主中繁殖扩增。因为克隆DNA起初是从环境样品中直接提取,文库并不限于可以生长于纯培养基中的小部分的原核生物。此外,存在于这些样品中的环境DNA的标准化,可以允许其更加平等地代表在起始样品中存在的所有种的DNA。这就可以显著增加从样品中的较少组成中发现感兴趣基因的效率,该样品中的较少组成与优势种相比,可能少了几个数量级的代表性。
例如,从一个或者更多的未培养的微生物产生的基因文库中,筛查感兴趣的活性。编码感兴趣的生物活性分子的潜在途径,首先在原核生物细胞中以基因表达文库的方式被捕获。编码感兴趣活性的多核苷酸分离自这样的文库,并且引入到宿主细胞中。将宿主细胞生长于促进重组和/或还原性重配的环境中,从而产生具有新型的或者增强活性的潜在的生物活性分子。
可以制备杂合多核苷酸的微生物包括原核微生物如真细菌(Eubacteria)和古细菌(Archeabacteria),低等真核微生物如真菌、一些藻类和原生动物。多核苷酸可以分离自环境样品。核酸可以被回收而不需培养某一种生物体,或者是从一种或者多种培养的生物中回收。在一方面,这样的微生物可以是适于极端环境的,如,嗜高温的、嗜冷的、兼性嗜冷菌(psychrotroph)、嗜盐的、嗜压的和嗜酸的。在一方面,编码从极端微生物中分离出来的磷脂酶的多核苷酸可以用于制备杂合酶。这样的酶可以在例如地表温泉和深海的热火山口超过100℃的温度发挥作用,在例如北极水域低于0℃的温度发挥作用,在例如死海的饱和的盐环境下发挥作用,在pH值在0附近例如煤层沉积物和地热富硫矿泉中起作用,或者在pH值超过11例如污水污泥中起作用。例如,来自极端条件下的生物体的几种被克隆和被表达的磷脂酶可以在很宽的温度和pH范围内表现出高活性。
正如在此说明的选择和分离的多核苷酸,包括至少一种本发明的核酸,被引入到适当的宿主细胞中。适当的宿主细胞是可以促进重组和/或还原性重配的任何细胞。选择的多核苷酸可以在包括合适控制序列的载体中。宿主细胞可以是较高等的真核生物细胞,如哺乳动物细胞,或者较低等的真核生物细胞,如,酵母细胞,或者优选地,宿主细胞可以是原核细胞,如细菌细胞。将构建物导入宿主细胞可通过磷酸钙转染、DEAE-葡聚糖介导的转染,或电穿孔(Davis等人,1986)来实现。
示例性的适当的宿主可以是本领域技术人员所熟悉的宿主细胞的任何一种,其包括原核细胞、真核细胞,例如细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。示例性的细菌细胞包括埃希氏菌属、杆菌属、链霉菌属、沙门氏菌属、假单胞菌属和葡萄球菌属的任何种,包括例如大肠杆菌、乳酸乳球菌、枯草芽孢杆菌、蜡状芽孢杆菌、鼠伤寒沙门菌和荧光假单胞菌。示例性真菌细胞包括曲霉菌属的任何种。示例性酵母细胞包括毕赤酵母、酵母菌属、裂殖酵母属或许旺酵母属的任何种,包括巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母。示例性昆虫细胞包括灰翅夜蛾属或果蝇属的任何种,包括果蝇S2和草地夜蛾Sf9。示例性的动物细胞包括CHO、COS或者Bowesmelanoma或者任何小鼠或者人类细胞系。适当的宿主的选择在本领域技术人员的能力之内。选择适合的宿主用于重组和/或还原性重配或者仅仅用于表达重组蛋白被认为是在本领域技术人员已知的范围内。可以用于重组和/或还原性重配或者仅仅用于表达重组蛋白的哺乳动物细胞培养系统包括:猴肾纤维原细胞的COS-7细胞系——其在“SV40-transformedsimiancellssupportthereplicationofearlySV40mutants”(Gluzman,1981)中有说明,C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体可以包括复制起点、合适的启动子和增强子,以及必要的核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列,以及5’旁侧的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于提供所需的非转录的遗传学元件。
含有感兴趣多核苷酸的宿主细胞(用于重组和/或还原性重配或者仅仅用于表达重组蛋白)可以在传统的营养培养基中培养,对该培养基进行改变以适于激活启动子,选择转化子或者扩增基因。培养的条件,如温度,pH和类似因素是那些之前选择用于表达条件的宿主细胞所使用的,并且对于普通技术人员是显而易见的。经鉴定具有特异酶活性的克隆可以随后进行测序,以鉴定编码具有增强活性的酶的多核苷酸序列。
另一方面,本发明的核酸和方法可以用于产生用于生物化学途径的新型多核苷酸,所述生物化学途径如,来自一个或者多个操纵子或者基因簇或者其部分的途径。例如,细菌和很多的真核生物具有调控基因的协调机制,其中所述基因的产物参与相关的过程。基因成簇排列在单个染色体上,在结构上称“基因簇”,它们在单个调控序列的控制下一起转录,所述调控序列包括起始整个簇的转录的单个启动子。因此,基因簇是指一组或者相同或者相关的相邻基因,一般是指功能上相关的邻近的基因。
基因簇DNA可以从不同的生物体中分离出来并且连接到载体中,特别是含有表达调控序列的载体,所述表达控制序列可以控制和调控可检测蛋白或者来自连接在一起的基因簇的蛋白相关系列活性的产生。对于引入外源DNA使用具有非常大的容量的载体,特别适合用于这样的基因簇,在这里通过包括大肠杆菌的f-因子(或者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒,在接合过程中它能实现自身的高频率转移,f-因子对于获得和稳定扩增大DNA片段,如来自混合的微生物样品的基因簇是理想的。可以使用“Fosmids”、粘粒或者细菌人工染色体(BAC)载体作为克隆载体。它们源于大肠杆菌f因子,可以稳定地整合大的基因组DNA片段。当整合来自混合的未经过培养的环境样品的DNA时,这就有可能得到以稳定的“环境DNA文库”形式存在的大的基因组片段。粘粒载体最初是设计用来克隆和扩增基因组DNA的大片段。应用粘粒载体的克隆在Sambrook等,MolecularCloning:ALaboratoryMannual,第二版,ColdSpringHarborLaboratoryPress(1989)中有详细说明。一旦连接到适当的载体,含有不同的聚酮化合物合成酶基因簇的两个或者多个载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛选,以获得在起初的基因簇没有发现的增强的活性。
因此,一方面,本发明涉及使用本发明的核酸序列产生具有生物活性的杂合多肽以及筛选具有活性(增强的活性)的多肽的方法,该方法通过:1)以可操作性连接的方式导入至少第一多核苷酸(例如本发明的核酸)和第二多核苷酸到合适的宿主细胞,所述的至少第一多核苷酸和第二多核苷酸共有具有部分序列同源性的至少一个区域。;2)在促进序列重新组织的条件下培养宿主细胞,得到可操作性连接的杂合多核苷酸;3)表达由所述杂合多核苷酸编码的杂合多肽;4)在有利于鉴定期望的生物活性(例如增强的磷脂酶活性)的条件下筛选所述的杂合多肽;和5)分离编码该杂合多肽的多核苷酸。
用于筛选各种酶活性的方法对于本领域技术人员是已知的,关于它的讨论贯穿于本说明书。当要分离本发明的多核苷酸和多肽时,可以应用这些方法。
体内重配可以集中在“分子间”的过程上,统称为“重组”。在细菌中,它一般被视为是“RecA-依赖”的现象。本发明可以依赖于宿主细胞的重组过程来重组和重配序列,或者依赖于细胞介导还原过程的能力,通过缺失来减少细胞中的准-重复序列的复杂性。该“还原性重配”过程通过“分子内的”、RecA-依赖过程而发生。因此,在本发明的一方面,应用本发明的核酸,通过还原性重配过程,产生新型的多核苷酸。该方法包括产生含有连续序列(起始编码序列)的构建物,它们插入到合适的载体中,并且然后将它们引入到合适的宿主细胞。单个分子同一性的重配通过在构建物中具有同源性区域的连续序列间的组合过程,或者准-重复单位间的组合过程而发生。重配过程重组和/或降低重复序列的复杂性和程度,并且导致产生新型的分子种类。
可以运用各种处理来提高重配效率。这些处理可以包括用紫外光,或者损坏DNA的化学试剂处理,和/或使用表现增高水平的“遗传不稳定性”的宿主细胞系。因此,这样的重配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然特性。
重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。“准重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排列出现;以相似序列的连续单元出现。一旦连接,在连续序列之间的连接处变得基本上不可见,并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有限制的模板库,在模板上可以发生滑移事件。含有准重复的构建物因此有效地提供了足够的分子弹性,缺失(和潜在的插入)事件实际上可以在准重复单元内的实际上任何地方发生。当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然,细胞就不能区别各个单元。因此,还原过程可以在整个序列中发生。相反地,例如,当所述单元以头对头存在,而不是头对尾,倒置勾画了相邻单元的末端,这样缺失的形成将有利于不连续单元的失去。因此,在本发明的一个方面,待重配序列是处于相同的方向。准重复序列的随机定向将会导致重装配效率的损失,而序列的一致定向将提供最高的效率。然而,虽然具有较少的相同方向的连续序列降低效率,但是仍然可以为新型分子的有效回收提供足够的弹性。可以用相同定向以允许更高效率的准重复序列制备构建物。
应用各种方法中的任何一种,序列可以以头对尾的定向进行装配,包括以下方法:a)可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括poly-A头和poly-T尾的引物将提供定向。这通过具有由RNA制备引物的头几个碱基来完成,而且因此用RNaseH容易去除。b)可以应用包括独特的限制酶切割位点的引物。这需要多个位点、一组独特的序列、和重复的合成和连接步骤。c)引物的内部少数碱基可以被硫醇化,并且用外切酶来产生合适的具有尾巴的分子。
重装配序列的回收依赖于具有减低的重复指数(RI)的克隆载体的确定。被重装配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有减低的RI的克隆载体的回收可以通过如下实现:1)应用仅仅当构建物的复杂性下降时才能稳定地维持的载体。2)通过物理方法对缩短的载体进行物理回收。在这一情况下,克隆载体将应用标准的质粒分离程序进行回收,或者在具有低分子量截留的琼脂糖凝胶或者柱子上利用标准程序进行大小分离。3)插入物的大小下降时,对含有可以选择的断裂基因的载体进行回收。4)应用表达载体以及适当的选择,使用定向选择技术。
相关的生物体的编码序列(例如,基因)可以表现出高度的同源性,并且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明中。然而,这一过程并不限于这种几乎相同的重复。
以下是本发明的示例性方法。编码性核酸序列(准-重复)来自三(3)种,包括本发明的核酸。每一序列编码具有一套不同特征的蛋白质,包括本发明的酶。每一个序列在序列的独特位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共同被扩增并且被连接到随机的组合中,以便所有可能的排列交换和组合可以在连接的分子群中获得。准-重复单位的数目可以通过装配条件来控制。在构建物中,准-重复单位的平均数目被定义为重复指数(RI)。一旦形成,构建物可以,或可以不按照已公开的方法在琼脂糖凝胶上按大小分离,插入到克隆载体,并且转染到合适的宿主细胞中。然后细胞进行繁殖,并且进行“还原性重装配”。如果需要,还原性重装配过程的速率可以通过引入DNA损伤来刺激。RI的降低是通过一种“分子内”的机制在重复序列间形成缺失来介导,还是通过“分子间”的机制由类似重组的事件来介导是不重要的。最终的结果是分子被重装配,得到所有可能的组合。一方面,本方法包括一个额外的步骤,即对改组库的文库成员进行筛选,以确定个别的改组文库成员——其具有与一种预定的大分子如蛋白质受体、寡糖、病毒颗粒或者其它的预定的化合物或者结构结合或者另外地相互作用,或者催化特定的反应(如,酶的催化结构域)的能力。从这样的文库所鉴定得到的多肽,如磷脂酶,可以用于各种目的,例如在此说明的工业方法和/或可以进行改组和/或选择的一个或者多个另外的循环。
在另一方面,可以预见,在重组或重装配之前,或者在重组或重装配的过程中,通过本发明的方法产生的多核苷酸可以用试剂或方法处理,这些试剂或方法促进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其编码的多肽的多样性。促进诱变的所述试剂或方法可以包括,但不限于:(+)-CC-1065,或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley,(1992);能够抑制DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见,例如,vandePoll等(1992));或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也见,vandePoll等(1992),751-758页);三价铬、三价铬的盐、可以抑制DNA复制的多环芳香烃(PAH)DNA加合物,如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷酸盐(“Tris-BP”)、1,2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8-二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑并[4,5-f]-喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑并[4,5-f]-吡啶(“N-羟基-PhIP”)。用于减慢或者停止PCR扩增的特别优选的方法由紫外线(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)组成。特别考虑的方法是DNA加合物或者来自多核苷酸或者多核苷酸库的含有DNA加合物的多核苷酸,在进一步的处理前,其可以通过包括加热含有所述多核苷酸的溶液的过程被释放或者去除。筛选方法学和“在线”监控设备
在实践本发明的方法中,可以应用各种设备和方法学,结合使用本发明的多肽和核酸,例如,来筛选具有磷脂酶活性的多肽,来筛选作为潜在的活性调节物的化合物(如,酶活性的增强或者抑制),以获得结合于本发明多肽的抗体,获得与本发明核酸杂交的核酸,等等。固定化的酶固体支持物
磷脂酶、其片段以及编码该酶和片段的核酸可以附于固体支持物上。这对于工业过程中磷脂酶的使用常常是经济的且有效的。例如,磷脂酶(或其活性片段)的聚生体或者混合物——其用于特定的化学反应——可以附于固体支持物,并且浸于处理容器中。酶反应因此可以进行。随后,可以将固体支持物从容器中取出,同时取出的是固定在支持物上的酶,用于重复使用。在本发明的一个实施方式中,将分离的本发明核酸附着于固体支持物。在本发明的另一个实施方式中,固体支持物选自凝胶、树脂、聚合物、陶瓷、玻璃、微电极以及它们的任何组合。
例如,用于本发明的固体支持物包括凝胶。凝胶的一些例子包括琼脂糖(Sepharose)、明胶、戊二醛、壳聚糖-处理的戊二醛、清蛋白-戊二醛、壳聚糖-黄原胶、toyopearl胶(聚合胶)、藻酸盐、藻酸盐-聚赖氨酸、角叉菜胶、琼脂糖、乙二醛琼脂糖(glyoxylagarose)、磁性琼脂糖、葡聚糖-琼脂糖、聚(氨基甲酰磺酸盐)水凝胶、BSA-PEG水凝胶、磷酸化的聚乙烯醇(PVC)、单氨基乙基-N-氨基乙基(MANA)、氨基,或者它们的任何组合。
用于本发明的另一固体支持物是树脂或者聚合物。树脂或者聚合物的一些例子包括纤维素、丙烯酰胺、尼龙、人造纤维、聚酯、阴离子交换树脂、AMBERLITETMXAD-7、AMBERLITETMXAD-8、AMBERLITETMIRA-94、AMBERLITETMIRC-50、聚乙烯、聚丙烯酸、聚甲基丙烯酸酯凝胶或者它们的任何组合。
用于本发明的另一类固体支持物是陶瓷。一些例子包括无孔陶瓷、多孔陶瓷、SiO2、Al2O3。用于本发明的另一类固体支持物是玻璃。一些例子包括无孔玻璃、多孔玻璃、氨丙基玻璃或者它们的任何组合。可以应用的另一类型固体支持物是微电极。例子是聚乙烯亚胺涂层磁铁。石墨颗粒可以用作固体支持物。
用于实施本发明的其它示例性固体支持物包括硅藻土产品和硅酸盐。一些例子包括 硅藻土和 SILASORBTM合成硅酸钙和硅酸镁。固体支持物的其它例子是细胞,诸如血红细胞。固定化方法
有许多本领域技术人员已知的用于将酶或者其片段,或者核酸固定在固体支持物上的方法。这样的方法的一些例子包括:如,产生静电液滴的方法、电化学方法,通过吸收、通过共价结合、通过交联、通过化学反应或者化学方法、通过封装、通过捕集、通过藻酸钙,或者通过聚(2-甲基丙烯酸羟基乙酯)进行固定化的方法。类似的方法在下述文献中描述:Enzymology,ImmobilizedEnzymesandCells,PartC.1987.AcademicPress.S.P.Colowick和N.O.Kaplan编辑,Volume136;和ImmobilizationofEnzymesandCells.1997.HumanaPress.Edited,G.F.Bickerstaff编辑.Series:MethodsinBiotechnology,由J.M.Walker编辑。毛细管阵列
毛细管阵列,如GIGAMATRIXTM,DiversaCorporation,SanDiego,CA,可以用于本发明的方法。本发明的核酸或者多肽可以固定于或者施用于阵列,包括毛细管阵列。阵列可以用于筛选或者监控能够结合或者调节本发明核酸或者多肽活性的组分(如,小分子,抗体,核酸等)文库。毛细管阵列提供了另一个系统用于固定和筛查样品。例如,样品筛选设备可以包括形成由相邻的毛细管组成的阵列的许多毛细管,其中每一个毛细管包括至少一个界定保持样品的腔的壁。该设备也可以进一步包括置于阵列中邻近毛细管之间的空隙物质,以及在空隙物质内形成的一个或者多个参照标记。用于筛选样品的毛细管,其中毛细管经修改以适合结合在毛细管阵列中,可以包括界定保留样品的腔的第一壁,以及由过滤材料形成的第二壁,用于过滤被提供给腔以激发样品的激发能。
多肽或者核酸,如配体,可以引入第一成分到毛细管阵列中的至少一部分毛细管。毛细管阵列中的每一个毛细管可以包括至少一个界定保留第一组分的腔的壁。在第一组分后,引入气泡至毛细管中。可以将第二组分引入到毛细管中,其中第二组分是通过气泡与第一组分分开。令人感兴趣的样品可以作为用可检测的颗粒标记的第一液体引入到毛细管阵列的毛细管中,其中毛细管阵列中的每一个毛细管包括至少一个界定保留第一液体和可检测颗粒的腔的壁,并且其中至少一个壁用将可检测颗粒结合到至少一个壁的结合材料包被。该方法可以进一步包括从毛细管中去除第一液体,其中结合的可检测颗粒仍保留在毛细管中,然后将第二液体引入到毛细管中。
毛细管阵列可以包括许多单个的毛细管,包括由至少一个界定腔的外壁。毛细管的外壁可以是一个或者多个融合在一起的壁。相似地,壁可以界定的腔是圆柱形、正方形、六角形或者任何其它的几何性状,只要壁形成保留液体或者样品的腔即可。毛细管阵列中的毛细管可以非常接近地固定在一起,以形成平面结构。毛细管可以通过融合(如,当毛细管由玻璃制成时)、胶粘、粘合或者通过夹具并列结合在一起。毛细管阵列可以由任何数量的单个毛细管构成,例如,范围从100到4,000,000个毛细管。毛细管阵列可以形成具有大约100,000或者更多单个毛细管结合在一起的微滴定板。阵列或“生物芯片”
本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛选或者监测组合物(例如,小分子、抗体、核酸等等)的文库,所述筛选或者监测是针对它们结合本发明的核酸或多肽或者调控本发明的核酸或多肽的活性的能力。例如,在本发明的一个方面,一个被监测的参数是磷脂酶基因的转录体表达。细胞的一种或多种或所有的转录体可以通过包含细胞转录体、或代表细胞转录体的核酸、或与细胞转录体互补的核酸的样品的杂交,通过与阵列或“生物芯片”上的固定化核酸的杂交来测定。通过在微型芯片上应用核酸“阵列”,细胞的一些或所有的转录体可以同时被定量。可选择地,包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的新的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。
本发明可以用任何已知的“阵列”进行实践,所述“阵列”也被称为“微阵列”或“核酸阵列”或“多肽阵列”或“抗体阵列”或“生物芯片”,或者它们的变型。阵列一般是多个“点”或者“靶元素”,每一个靶元素包括确定数量的一种或多种生物分子,例如,固定于基材表面的确定区域、用于特异结合样品分子如mRNA转录体的寡核苷酸。
在实践本发明的方法时,任何已知的阵列和/或制备和应用阵列的方法都可以被全部或者部分地并入,或者引入它们的变型,例如在下列文献中描述的:美国专利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,996;6,022,963;6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752;5,434,049;还例如,WO99/51773;WO99/09217;WO97/46313;WO96/17958;也参见例如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques23:1087-1092;Kern(1997)Biotechniques23:120-124;Solinas-Toldo(1997)Genes,Chromosomes&Cancer20:399-407;Bowtell(1999)NatureGeneticsSupp.21:25-32。也参见公开的美国专利申请20010018642;20010019827;20010016322;20010014449;20010014448;20010012537;20010008765。抗体和基于抗体的筛选方法
本发明提供了可与本发明的磷脂酶特异结合的分离的、合成的或重组的抗体。这些抗体可用来分离、鉴定或定量本发明的磷脂酶或相关的多肽。这些抗体可以用于抑制本发明酶的活性。这些抗体可以用于分离与本发明的那些物质相关的多肽,如相关的磷脂酶。
本发明的“抗体”可以包括由一个免疫球蛋白基因或多个免疫球蛋白基因衍生(derived)、仿造(modeledafter)或基本上由之编码的肽或多肽或者其片段,它们能特异地结合抗原或表位,见例如,FundamentalImmunology,第三版,W.E.Paul,ed.,RavenPress,N.Y.(1993);Wilson(1994)J.Immunol.Methods175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods25:85-97。术语抗体包括结合抗原的部分,即,保留与抗原结合的能力的“抗原结合位点”(例如,片段、子序列、互补决定区(CDRs)),包括(i)Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,包括在铰链区由二硫键连接的两个Fab片段的二价片段;(iii)由VH和CH1结构域组成的Fd片段;(iv)由抗体单臂的VL和VH结构域组成的Fv片段;(v)由VH结构域组成的dAb片段(Ward等,(1989)Nature341:544-546);和(vi)分离的互补决定区(CDR)。单链抗体也被包括在术语“抗体”中。
抗体可以用于免疫沉淀,染色(如FACS)、免疫亲和柱和类似物。如果需要的话,编码特异抗原的核酸序列可以通过免疫方法获得,随后分离出多肽或者核酸,进行扩增或者克隆,将多肽固定在本发明的阵列上。
可选地,本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构,如,抗体的亲和性可以增加或者降低。而且,制备或者修饰抗体的能力可以是通过本发明的方法工程改造入细胞的表型。
免疫、产生和分离抗体(多克隆抗体和单克隆抗体)的方法是本领域技术人员已知的,并且在科学和专利文献中有描述,参见,如Coligan,CURRENTPROTOCOLSINIMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASICANDCLINICALIMMUNOLOGY(第7版)LangeMedicalPublications,LosAltos,CA(“Stites”);Goding,MONOCLONALANTIBODIES:PRINCIPLESANDPRACTICE(第2版)AcademicPress,NewYork,NY(1986);Kohler(1975)Nature256:495;Harlow(1988)ANTIBODIES,ALABORATORYMANUAL,ColdSpringHarborPublications,NewYork。除了使用动物的传统的体内方法外,抗体也可以在体外产生,例如,应用表达重组抗体结合位点的噬菌体展示文库。参见如,Hoogenboom(1997)TrendsBiotechnol.15:62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26:27-45。
多肽可以用于产生可以特异性结合本发明多肽的抗体。得到的抗体可以用于免疫亲和层析方法中,来分离或者纯化多肽或者确定是否多肽存在于生物样品中。在这样的程序中,将蛋白制备物,如提取物,或者生物样品与能够特异性结合本发明的其中一个多肽的抗体相接触。
在免疫亲和步骤中,抗体被连接到固态支持物,如珠子或其它柱基质。在抗体特异性结合本发明的一种多肽的条件下,蛋白质制备物被置于与抗体接触。经清洗去除非特异性结合的蛋白质之后,特异性结合的多肽被洗脱。
在生物样品中蛋白质结合抗体的能力可以通过使用本领域技术人员所熟悉的各种方法中的任何一种来确定。例如,结合可以通过用可检测标记物,例如荧光试剂、酶标记或放射性同位素标记抗体来确定。可选择地,抗体与样品的结合可以通过应用具有这样的可检测标记的二抗来检测。特定的分析包括ELISA分析、夹心分析、放射免疫分析以及蛋白质印迹法。
产生的针对本发明多肽的多克隆抗体可以通过直接注射该多肽至动物中而得到,或者将该多肽施用于动物例如,非人类动物而得到。这样得到的抗体随后结合于该多肽本身。以这样的方式,甚至可以应用仅仅编码多肽片段的序列来产生可以结合整个天然多肽的抗体。这样的抗体随后可以用于从表达多肽的细胞中分离该多肽。
为了制备单克隆抗体,可使用可通过连续细胞系培养来产生抗体的任何技术。实例包括杂交瘤技术、trioma技术、人B-细胞杂交瘤技术和EBV-杂交瘤技术(参见例如Cole(1985)MonoclonalAntibodiesandCancerTherapy,AlanR.Liss,Inc.,pp.77-96)。
可以对描述用于产生单链抗体的技术(参见如,美国专利编号4,946,778)进行调整,用于产生针对本发明多肽的单链抗体。可选地,可以用转基因鼠来表达针对这些多肽或者其片段的人源化的抗体。
产生的针对本发明多肽的抗体可以用于从其它的生物体和样品中筛选类似的多肽。在这样的技术中,将来自该生物体的多肽与该抗体接触,检测特异性结合抗体的那些多肽。以上所述的任何程序可以用于检测抗体结合。试剂盒
本发明提供了包括以下成分的试剂盒,如,核酸、表达盒、载体、细胞、多肽(如含有至少一种本发明的磷脂酶的试剂盒)和/或本发明的抗体(如含有至少一种本发明的抗体的试剂盒)。该试剂盒可含有用于加工(制造)生物燃料、洗涤剂,或用于处理或加工食品、饲料、生物质、食品或饲料添加剂或营养补充剂和类似物的酶。该试剂盒也可以含有指导性材料,来指导本发明的方法学和工业应用,如本文所述。本发明酶的工业和医学应用
本发明提供了使用本发明的多肽,例如磷脂酶和本发明的其它酶,例如磷脂酶A、B、C和D、patatins的许多工业应用和医学应用,包括转换非-水合的磷脂至水合形式、制造生物燃料和加工生物质、油脱胶,加工来自植物、鱼、藻类和类似物的油,在此仅仅指出了几种应用。在任何这些可选择的工业应用和医学应用中,酶可以以特定的顺序加入,例如具有不同的特异性的磷脂酶以特定顺序加入,例如首先加入具有PC-和PE-水解活性的酶(或加入两种酶,一种具有PC-水解活性,另一种具有PE-水解活性),然后加入具有PI-水解活性(例如PLC活性)的酶,或其任何组合。
任何或所有本发明的方法可以在“加工级”使用,例如在约15,000;25,000;50,000;75,000;或100,000lbs精炼的油/天至约1、2、3、4、5或6百万或更多lbs精炼的油/天的级别(规模)上进行的油加工或精炼。
在工业应用中使用磷脂酶的方法在本领域是熟知的。例如,本发明的磷脂酶和方法可以用于处理脂肪和油,如,在日本专利申请公开H6-306386中所述,该申请描述了将存在于油和脂肪的磷脂转化为含有磷酸基团的水溶性物质。
本发明的磷脂酶可以用于处理植物油和磷脂,如那些来源于或者分离自米糠、大豆、油菜、棕榈、棉籽、玉米、棕榈仁、椰子、花生、芝麻、向日葵的植物油和磷脂。本发明的磷脂酶可以用于处理精炼油,如那些来自果籽的油,如葡萄籽、杏仁、琉璃苣等。本发明的磷脂酶可以用于处理不同形式的油和磷脂,包括粗品形式、脱胶的、胶的、洗涤水、黏土、硅石、皂脚和类似物。本发明的磷脂酶可以用于处理高磷含量的油、鱼油、动物油、植物油、藻类油和类似物。在本发明的任何方面,任何时候可以应用磷脂酶C,一种选择包括应用本发明的磷脂酶D和磷酸酶(如,应用PLD/磷酸酶的组合来提高高磷含量油,如大豆油的产量)。
本发明的磷脂酶可以用于处理和制备食用油、生物柴油、用于药物和化妆品的脂质体、结构磷脂和结构脂类。本发明的磷脂酶可以用于油提取。本发明的磷脂酶可以用于处理和制备各种肥皂。加工食用油:产生1,3-二酰甘油(1,3DAG)
本发明提供了使用本发明的酶(或多种酶)来制备1,3-二酰甘油(1,3DAG)的方法。一方面,在食用油精炼期间,磷脂酶C或磷脂酶D加磷酸酶产生1,2-二酰甘油;这提高了油产量。当用于包括碱中和步骤的方法时,例如作为碱精炼助剂,多达70%的1,2-二酰甘油(1,2DAG)进行酰基转移,并被转化为1,3-DAG。1,3-DAG具有增加的健康益处,因此使用PLC作为碱精炼助剂产生具有增加的营养价值的油。
本发明提供了使用本发明的酶(或多种酶)制备和加工食用油的方法,包括产生具有增加数量的1,3-DAG的食用油。二酰甘油是许多食用油中天然发现的化合物。在本发明方法,例如油脱胶方法的一个方面,碱(苛性碱)引起PLC产生的1,2-DAG发生异构化成1,3-DAG,从而提供超过1,2-DAG的营养健康价值,例如1,3-DAG作为能量被燃烧掉,而不是作为脂肪(如1,2-DAG)被储存起来。通过在碱炼方法开始时加入PLC(酸和碱随后加入),本发明的方法产生提高水平的1,3-DAG(减少1,2-DAG)。从营养角度看,1,3-DAG优于1,2-DAG。在可选的方面,本发明包括使用本发明的PLC的油脱胶方法,从而产生含有不少于0.5%、1.0%、2.0%或3.0%或更多1,3-DAG的最终脱胶的油产物。
因此,本发明提供制备(通过酯交换)精炼的油(例如二酰甘油油),包括食用油的方法,所述的油含有增加水平的1,3-二酰甘油(1,3-DAG),如在实施例13中所示,其中,磷脂酶诸如本发明的酶是“前载型的(front-loaded)”,或在加入酸或碱之前加入。由甘油三酯酶法水解产生DAG通过异构化由1,2DAG产生1,3DAG。相比起传统的食用油,含有1,3DAG的食用油显示出不同的代谢效应。1,3DAG和1,2DAG或甘油三酯之间代谢途经的差异使得较大部分的来自1,3二酰甘油的脂肪酸作为能源被燃烧掉,而不是作为脂肪储存起来。临床研究已经显示,经常食用DAG油作为感观食物(sensiblediet)的一部分,能帮助个体控制它们的体重和体内脂肪。此外,1,3DAG的代谢减少血流中循环的餐后甘油三酯。因为肥胖和增高的血脂与慢性疾病,包括心血管疾病和2型糖尿病的危险因子相关,这些生活方式相关的健康条件,可以受到有规律的食用DAG油这样的有益方式的影响。
可以通过各种方法食用含DAG的油。因此,一方面,本发明提供使用本发明的酶制备食物的方法,食物例如具有增加水平的1,3-DAG二酰甘油的焙烤食物,和含有二酰甘油油的焙烤食物。一方面,焙烤食物是饼干、蛋糕和类似的焙烤食物。
在可选择的实施方式中,可以用于本发明方法,包括食用油加工方法的酶组合包括(其中组合中的一种或多种或所有酶包含本发明的酶):οPLC+PI-PLC+PLA(PLC反应完成后加入PLA);οPLD+磷酸酶+PI-PLC,然后加入PLA;或οPLC或(PLC+PI-PLC)+PLA,对磷脂酸具有特异性(所有的酶同时或依次加入)。油脱胶和植物油加工
本发明的酶(例如具有脂酶、磷脂酶、酯酶和/或糖苷酶或等同活性的多肽)可以用于各种植物油加工步骤中,诸如用于植物油提取,特别地,用于在称为“油脱胶”的方法中除去“磷脂胶”。
本发明的这些方法可在“生产规模(processscale)”使用,例如在约15,000;25,000;50,000;75,000;或100,000lbs精炼油/天至约1、2、3、4、5或6百万或更多百万lbs精炼油/天规模上使用。
一方面,本发明提供了油脱胶的方法,该方法包括使用本发明的磷脂酶,例如本发明的PLC。一方面,该方法还包括添加另一磷脂酶(其也可以是本发明的磷脂酶),例如本发明的其它PLC、PLA、PLB、PLB或patatin,或具有溶血磷脂酶-转酰基酶(LPTA)活性或溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)或它们的组合活性的酶(其也可以是本发明的酶),和/或patatin-样磷脂酶(其也可以是本发明的酶)。一方面,所有酶一起加入,或可选地,酶以特定的顺序加入,例如加入PLC后加入PLA和/或patatin;或者首先加入本发明具有PC和PE活性的酶或许多酶,然后加入PIPLC。
一方面,作为磷脂酶(例如本发明的PLC)处理的结果,该过程使得产量提高。一方面,作为使用磷脂酶(例如本发明的PLA)处理的结果,该过程使得油中磷含量额外地减少。
一方面,本发明提供了这样的方法,其包括使用本发明的磷脂酶,例如本发明的PLC来减少胶质量并通过减少油被捕获的数量来增加中性油(甘油三酯)产量。一方面,本发明提供了这样的方法,其包括使用本发明的磷脂酶,例如本发明的PLC来增加中性油和二酰甘油(DAG)的产量,以增加油相。在可选的方面,本发明的方法(例如脱胶方法)可以包含一种或多种其它的酶,诸如蛋白酶、淀粉酶、脂酶、角质酶、其它磷脂酶(包括例如本发明的酶)、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳糖酶、木聚糖酶、氧化酶,例如乳糖酶和/或过氧化物酶或具有等同活性的多肽,或其组合。
本发明的磷脂酶可以用于各种植物油处理步骤,如用于植物油的提取,特别地,用于在上述称为“油脱胶”的过程中去除“磷脂胶”。本发明提供了用于处理不同来源的植物油的方法,所述来源如米糠、大豆、油菜、花生和其它果实、芝麻、向日葵、棕榈和玉米。该方法可以与基于使用如己烷提取的方法联合,随后将粗提取物精炼成食用油,包括使用本发明酶和方法。精炼过程的第一步骤是所谓的“脱胶”过程,其用于通过加入水来分离磷脂。分离通过脱胶沉淀的物质,并且进一步加工成卵磷脂混合物。商业上的卵磷脂,如大豆卵磷脂和向日葵卵磷脂,是半固体的或者是非常粘稠的物质。它们是由极性脂类和油的混合物组成,其中,极性脂类主要是磷脂,油主要是甘油三酯。
本发明的磷脂酶可以用于任何“脱胶”过程,包括水脱胶、ALCON油脱胶(如,用于大豆)、safinco脱胶、“超脱胶”、UF脱胶、TOP脱胶、单脱胶、干法脱胶和ENZYMAXTM脱胶。参见,美国专利号6,355,693;6,162,623;6,103,505;6,001,640;5,558,781;5,264,367。本发明方法应用的各种脱胶过程描述于Bockisch,M.(1998)FatsandOilsHandbook,TheextractionofVegetableOils(Chapter5),345~445,AOCSPress,Champaign,lllinois。本发明的磷脂酶可以用于甘油三酯油酶法脱胶的工业应用,如在EP513709中所述。
一方面,本发明的磷脂酶用于处理植物油,例如粗油,诸如米糠、大豆、油菜、花和类似物。一方面,这提高脱胶方法的效率。一方面,本发明提供了在低水条件下进行酶脱胶的方法,例如在约0.1%至20%水,或0.5%至10%水的范围内。一方面,这提高了在离心期间,重相从油相的分离水平。对这些相提高的分离水平能够导致磷脂更有效地从油中去除,包括水合的和非水合的油。一方面,这能够产生含有较少捕获的中性油(甘油三酯)的胶部分,从而提高脱胶方法期间的总油产量。
一方面,本发明的磷脂酶,例如具有PLC活性的多肽用于处理油(例如植物油,例如粗油,诸如米糠、大豆、油菜、花和类似物),例如用于脱胶方法,以减少胶质量和通过减少油捕获而增加中性油含量。一方面,本发明的磷脂酶,例如具有PLC活性的多肽,用于生产二酰甘油(DAG)和用于增加油相。
本发明的磷脂酶可以用于酶法脱胶的工业应用,如在CA1102795中所述,其描述了通过加入至少50%重量百分比的水从谷物脂类中分离极性脂类的方法。以其应用的原理是加入水到粗油混合物的角度来看,该方法是经过改良的脱胶方法。
一方面,本发明提供了酶方法,其包括应用本发明的磷脂酶(如PLC),包括水解在油中的水合磷脂,温度为约20℃到40℃,碱性pH下进行,如pH为大约pH8到pH10,反应时间为大约3到10分钟。这可以导致油中的最终磷水平少于10ppm。本发明也提供了酶方法,其包括应用本发明的磷脂酶(如,PLC),包括水解油中水合的和非水合的磷脂,温度为大约50℃到60℃,pH值略低于中性,例如大约pH5到pH6.5,反应时间为大约30到60分钟。这可能导致油中的最终磷水平少于10ppm。
在一方面,本发明提供了酶方法,该方法利用磷脂酶C酶水解甘油磷酸酯键,并且随后使得能将磷脂中的二酰甘油酯部分返回到油中,如植物油、鱼油或者藻类的油(“磷脂酶C(PLC)碱精炼助剂”);和,在脱胶步骤中将磷脂含量减少至对于待物理精炼的高磷油足够低的水平(“磷脂酶C(PLC)脱胶助剂”)。这两种方法能够产生不同的价值并且具有不同的目标应用。
在本发明不同的示例性方法中,很多不同的步骤组成了核心的漂白和除臭精炼过程之前的脱胶过程。这些步骤包括加热、混合、维持、分离和干燥。在加热步骤以后,加入水以及常常加入酸,并且混合,以便使得不溶性的磷脂“胶”凝聚成可以被分离的颗粒。虽然在脱胶过程中水分离很多磷脂,但是磷脂部分是以钙盐或者镁盐的形式存在的非-水合磷脂(NHPs)。脱胶方法通过加入酸处理这些NHPs。在磷脂水合以后,混合油,维持并且通过离心分离。最后,将油干燥并且贮存、运输或者精炼,如图6所示。得到的胶既可以进一步处理以获得卵磷脂产物,也可以加入到食物中。
在本发明的各种示例性方法中,磷的水平被降到低至对于物理精炼足够低的水平。与碱精炼相比,分离步骤可以导致潜在的较高的产量损失。此外,脱胶过程可以产生不能以商业卵磷脂出售的废品,参见,例如图7,图7是物理精炼油的示例性脱胶过程。因此,这些过程并没有取得显著的市场份额,碱精炼过程继续统治着米糠、大豆、油菜和向日葵工业。然而,注意到,用于特异性脱胶过程的磷脂酶C酶将降低胶的形成,并且将磷脂中的二酰甘油酯部分回收到油中。
一方面,本发明提供了在胶部分中使用本发明的PLC的方法。在该方法的一个方面,将油加入到粗油中,以产生乳状液,这导致磷脂酰胆碱、磷脂酰乙醇胺和磷脂酰肌醇移入水相(水脱胶)。离心之后,这些磷脂是含水胶部分的主要组分。胶部分中的磷脂可以用磷脂酶C或磷脂酶D加磷酸酶(或其它组合,下文描述)处理,以产生二酰甘油(DAG)和磷酸酯。此时,DAG可以从其它胶组分提取出来,并在适合于对DAG进行酯交换作用的条下件用脂酶处理,产生期望的甘油三酯(结构性脂类)。
另一方面,利用在PLC反应后例如通过加入碱增加胶的pH,大部分的1,2-DAG可以被转化为1,3-DAG。1,3-DAG然后可以从胶中提取出来,并在合适的条件下与脂酶反应,以在sn2位置对1,3-DAG进行酯交换作用,从而产生期望的结构性甘油三酯。
在可选的方面,用于酯交换反应的脂肪酸,可以来自各种来源,包括粗油中发现的游离脂肪酸。
一方面,来自水脱胶的磷脂与本发明的PLC组合使用,产生结构性脂类。水脱胶的油可以暴露于PLC和/或PLD(其中之一或两者可以是本发明的酶)加磷酸酶或这些组合中的其中一种,然后暴露于PLA(可以是本发明的酶),以将磷减少至适合于碱或物理精炼的水平。
在可选择的实施方式中,可以用于本发明方法,包括这些脱胶方法的酶组合包括(其中,组合中的一种或多种或所有酶包含本发明的酶):οPLC+PI-PLC+PLA(PLC反应完成后加入PLA);οPLD+磷酸酶+PI-PLC,然后加入PLA;或οPLC或(PLC+PI-PLC)+PLA,对磷脂酸具有特异性(所有的酶同时或依次加入)。碱精炼
本发明提供了在碱炼中使用磷脂酶(包括本发明的酶)的方法,其中酶被用作碱炼助剂。在可选的方面,PLC或PLD和/或磷酸酶以滴加的方式用于该方法,可以在碱中和精炼方法(连续精炼或分批精炼)之前、期间或者之后加入。加入的酶量可以根据方法而变化。用于本方法的水的水平可以是低水平的,例如约0.5到5%。可选地,通过多次,将碱加入至该方法中。此外,该方法可以在不同的温度下(25℃到70℃),不同的酸或碱性条件下,并且在变化的pH值(4到12)下进行。可以使用浓的碱溶液,例如比11%的工业标准浓度更大,以减少胶的质量。在可选的方面,浓的碱溶液浓度在约12%至50%之间,例如约20%、30%、40%、50%或60%或更浓。
在一方面,本发明的磷脂酶C在甘油磷酸酯键上水解磷脂产生甘油二酯和水溶性的磷酸化合物。水解的磷脂进入到水相,而甘油二酯留在油相中,如在图8所说明的。PLC“碱炼助剂”的一个目的是将在中和期间形成的磷脂胶转化为二酰甘油酯,二酰甘油酯将迁移回到油相。相反地,“PLC脱胶助剂”的一个目的是将粗油中的磷脂降低为少于百万分之十(10ppm)的磷当量。
可以用于碱炼方法的酸包括,但是并不限于,磷酸、柠檬酸、抗坏血酸、硫酸、反丁烯二酸、顺丁烯二酸、盐酸和/或乙酸。酸被用于水合非水合的磷脂。可以应用的碱包括,但不限于,KOH和NaOH。碱被用于中和游离脂肪酸。可选地,磷脂酶,或者更具体地PLC或者PLD和磷酸酶,用于从胶/皂脚中纯化植物固醇。
在碱炼前加入磷脂酶的本发明的可选择实施方式是在植物中表达磷脂酶。在另一个实施方式中,在破碎植物、种籽或者其它的植物部分期间加入磷脂酶。可选地,在破碎后,但是在精炼前(即是在维持容器中)加入磷脂酶。此外,在有酸或无酸的条件下,加入磷脂酶作为精炼预处理。
已经描述的本发明的另一个实施方式,是在碱精炼方法期间加入磷脂酶。在这一方法中,酸和碱的水平依赖于磷的水平和游离脂肪酸的水平而变化。此外,该方法使用宽的温度和pH范围,这依赖于所应用酶的类型。
在本发明的另一个实施方式中,磷脂酶在碱炼后加入(图9)。在一个例子中,在分离前,磷脂酶加入到强力混合器(intensemixer)或者恒定混合器(retentionmixer)。可选地,磷脂酶在加热步骤后加入。在另一个实施方式,磷脂酶在离心步骤中加入。在额外的实施方式中,磷脂酶加入到皂脚中。可选地,磷脂酶加入到洗涤水中。在另一个例子中,磷脂酶在漂白和/或除臭步骤期间加入。
一方面,在漂白和除臭之前,磷脂酶,例如磷脂酶C,本发明的酶将水解中和过的粗的和脱胶的油中水合和非水合磷脂的磷脂。本发明的示例性的“碱精炼”方法在图9和图13中示出。图9包括静态混合器(staticmixer)的示例性的时间、温度和pH(30至60分钟、50至60℃,pH5至6.5)以及恒定混合器示例性的时间、温度(3至10分钟,20-40℃)。目标酶可以作为滴加产品(drop-inproduct)应用于现有的碱中和方法中,如在图9中所示。在该方面,如果酶在加入碱之后加入,酶将不必经受极端的pH水平。如图13(酶“前载型”示例性方法)所示,任何磷脂酶,包括本发明的磷脂酶,诸如PLC、PLB、PLA和/或PLC都可以用于粗油脱胶方法,如Bailey′sIndustrialOil&FatProductsv.4(ed.Y.H.Hui)中所述。图14和图15示出了本发明方法的变型,其中两个或三个离心步骤分别用于所述方法中,其可以用于加工任何油,例如植物油,诸如粗的大豆油,如图中所示。图15的示例性方法在碱炼之前具有离心步骤(除了碱炼之后和水洗之前,和水洗之后的离心步骤),而图14的示例性方法在碱炼之前没有离心步骤。图16示出了该方法的另一示例性变型,其使用酸处理并在脱胶步骤之前有离心步骤;该示例性方法用于处理任何油,例如植物油诸如粗的豆油,如图所示。
一方面,本发明的磷脂酶使得磷被除至物理精炼可接受的低水平。一方面,本发明的PLC将在漂白和除臭前,水解来自粗油中水合的和非水合磷脂的磷脂。在目前的脱胶操作中,目标酶可以作为滴加产品应用,参见例如图10。假如在商业设备中为亚最佳状态的混合,很可能需要酸来引起非水合的磷脂与酶在油/水界面上接触。因此,一方面,应用本发明的酸稳定性PLC。
一方面,本发明的PLC脱胶助剂方法可以消除表2中示出的一个或者所有三个方面的损失。由于磷脂的去除,与PLC方法相关的损失可以被估计为约0.8%对5.2%,这以质量为基础。表2:由PLC产品所致的损失
碱炼助剂 脱胶助剂
1)胶形成和分离中的油损失2.1% X X
2)在碱加入中的皂化的油3.1% X
3)在漂白中俘获于黏土中的油*<1.0% X X
总产量损失~5.2% ~2.1% ~5.2%
本发明该方法的另外潜在的益处包括如下:·减少的吸附剂-对较低水平(<5ppm)的磷,需要较少的吸附剂·较低的化学品用量-与非水合磷脂的水合作用相关的较少的化学品和处理成本·较低的废物产生-需要较少的水来从油中去除磷
通过本发明的方法处理的(如“脱胶”)油包括植物油种籽,如大豆油、油菜籽油、米糠油和向日葵油。一方面,本发明的“PLC碱炼助剂”可以比目前的碱炼方法节约1.2%。精炼助剂的应用处理已被脱胶获得卵磷脂的豆油,并且这些也从值/负载计算中排出。
本发明方法的性能目标可以根据应用而变化,并且更具体地,根据酶加入的时间点而变化,参见表3。表3:应用的性能目标
可以应用本发明磷脂酶,如,磷脂酶A1的其它方法可以将非水合的天然磷脂转化为至水合的形式。一方面,该酶对热敏感。因为对油加热可以破坏酶,这可能是所需要的。然而,脱胶反应必须调节为pH4-5以及60℃来适应该酶。在300单位/kg的油饱和剂量时,该示例性方法成功地将以前的水-脱胶油的磷含量降至≤10ppmP。优点可以是减少的H2O含量,以及在应用、处理和废物上的节省。表4列出了本发明酶的示例性的工业应用:表4:示例性应用
碱炼助剂 脱胶助剂
豆油/卵磷脂产生 X
化学精炼的豆油、向日葵油、油菜油 X X
低磷脂油(如棕榈) X
除了这些不同的“脱胶”方法,本发明的磷脂酶可以用于任何植物油处理步骤。例如,在任何植物油处理步骤中,本发明的磷脂酶可以用于替代PLA,如磷脂酶A2。在本发明的方法中“处理”或者“脱胶”的油包括大豆油、油菜籽油、玉米油、来自棕榈仁的油、油菜油、向日葵油、芝麻油、花生油、米糠油和类似的油。该方法的主要产物包括甘油三酯。
在一种示例性方法中,当酶加入到粗制油并且与粗制油反应时,每1kg粗制油,应用约10-10,000单位,或者可选地,约100-2,000单位的磷脂酶量。酶处理进行5分钟到10个小时,温度为30℃到90℃,或者可选地,约40℃到70℃。条件可以依赖于酶的最适温度而变化。加入用于溶解酶的水的量为,每100重量份的粗制油使用5-1,000重量份的水,或者可选地,每100重量份的粗制油使用大约10到200重量份的水。
一旦这样的酶处理完成后,用合适的方式,如离心分离器分离酶液体,并得到经处理的油。以这样的方法对胶状物进行酶分解所产生的含磷化合物实际上全部被转移到水相,并且从油相中去除。一旦酶处理完成后,如果需要,处理的油可以用水或者有机或者无机酸另外洗涤,如乙酸、柠檬酸、磷酸、琥珀酸和等同的酸,或用盐溶液洗涤。
在超滤脱胶的一个示例性方法中,在过滤前,将酶结合于过滤器,或者将酶加入到油中,或定时用酶清洗过滤器。
在磷脂酶介导的物理精炼助剂的一个示例性方法中,将水和酶加入到粗制油中(例如粗植物油)。一方面,本发明的PLC或者PLD以及磷酸酶用于该方法中。在磷脂酶介导的物理精炼中,水可以是低水平的,即0.5-5%,处理时间应当短(少于2小时,或者少于60分钟,或者少于30分钟,或者少于15分钟,或者少于5分钟)。该方法可以在不同的pH(如3-10),不同的温度(25℃到70℃)下,应用不同的酸和/或碱进行。
在可选的方面,水脱胶是首先通过离心收集卵磷脂,然后加入本发明的PLC或PLC和PLA以去除非-水合的磷脂(该方法应当在低的水浓度下进行)进行的。另一方面,对粗制油进行水脱胶至少于10ppm(食用油),并且随后进行物理精炼(对于生物柴油少于50ppm)。一方面,加入乳化剂,和/或将粗制油置于到强力混合器中促进混合。可选地,加入破乳剂,和/或对粗制油加热来促进水相的分离。另一方面,加入酸来促进非-水合磷脂的水合。另外地,磷脂酶可以用于调节从胶/皂脚中纯化植物固醇。
一方面,本发明提供了用于油脱胶的组合物和方法(其可以包括使用本发明的磷脂酶),包括使用变化数量的酸和碱,而不制备皂脚。使用本发明油脱胶的这一方面,酸(包括磷酸和/或柠檬酸)可以用于水合高磷含量油(包括大豆、油菜和向日葵)中的非水合的磷脂。一旦磷脂被水合,水相的pH可以加入碱来提高:加入的碱的量可以为酶活性产生有利的pH,但不会导致在油中形成显著的皂脚部分。因为,不形成皂脚,油中的游离脂肪酸可以在下游除去,这发生在脱胶步骤之后、漂白和除臭期间。
本发明的酶可用于改善油提取和油脱胶(例如植物油)。一方面,本发明的PLC和至少一种植物细胞壁降解剂(例如纤维素酶、半纤维素酶或类似物,以使细胞壁软化并增加提取产量)被用于本发明的方法中。在使用本发明的酶以改善油提取和油脱胶的该示例性方法中,在与油生产(包括但是不限于大豆油、油菜油、向日葵油、米糠油)相关的破碎步骤期间,使用本发明的磷脂酶C以及其它水解酶(例如纤维素酶、半纤维素酶、酯酶、蛋白酶和/或磷酸酶)。通过在溶剂提取之前使用酶,或使用酶以代替溶剂提取,有可能增加油产量和减少粗油中水合和非水合的磷脂的数量。非水合磷脂的减少可以归因于在与钙或镁络合之前,潜在的非水合磷脂转化为二酰甘油和相应的磷酸酯。粗油中磷脂的总减少量将提高精炼期间的产量,并有可能无需在漂白和除臭之前独立的脱胶步骤。
一方面,本发明提供了将本发明的磷脂酶(例如本发明的磷脂酶-特异性磷酸水解酶)或另一磷脂酶用于改良的“有机精炼方法”的方法,其可以包括将酶(例如PLC)加入盛有柠檬酸的桶中。
本发明的酶可以用于任何油处理的方法,如,脱胶或等同的方法。例如,本发明的酶可以用于美国专利号5,558,781;5,264,367;6,001,640所描述的方法中。USPN5,558,781所描述的方法应用磷脂酶A1、A2或B,实际上降解了油中的卵磷脂,其作为乳化剂发挥作用。
通过应用本发明的磷脂酶,如具有磷脂酶A和/或B活性的多肽,本发明的酶和方法可以用于旨在减少包含高含量非水合磷的食用油中的含磷组分的方法中,如在EP专利号:EP0869167中所述。一方面,食用油是粗制油,所谓的“非-脱胶油”。一方面,该方法处理非-脱胶油,包括压榨油或者提取油,或者其混合物,来自例如油菜籽、大豆、芝麻、花生、玉米、米糠或向日葵。在粗制油中,磷脂含量可以在从0.5到3%w/w之间变化,这对应于磷含量的范围为200到1200ppm,或者在250到1200ppm范围内。除了磷脂,粗制油也可以含有低浓度的碳水化合物、糖化合物和Ca、Mg和Fe的金属/磷脂酸复合物。一方面,该方法包括用本发明的磷脂酶处理磷脂或者溶血磷脂,以便水解脂肪酰基基团。一方面,磷脂或者溶血磷脂包括卵磷脂或者溶血卵磷脂。在本方法的一方面,食用油具有的磷含量在大约50到250ppm之间,而且该方法包括用本发明的磷脂酶处理油,以便水解大部分的磷脂,并且从油中分离含有水解的磷脂的水相。一方面,酶法脱胶过程之前,对油进行水脱胶。一方面,该方法生产动物饲料,包括将本发明的磷脂酶与饲料物质以及至少一种磷脂混合。
本发明的酶和方法可以用于油脱胶方法,正如在WO98/18912所描述的。本发明的磷脂酶可以降低食用油中的磷脂含量。该方法可以包括用本发明的磷脂酶处理油,来水解大部分的磷脂,并且从油中分离含有水解的磷脂的水相。该方法可以用于纯化含有磷脂的任何食用油,如,植物油,例如大豆油、米糠油、油菜籽油和向日葵油、鱼油,藻类油和动物油和类似油。在用酶处理以前,植物油优选地进行预处理,例如通过湿法精炼去除残渣(胶状物)。在用磷脂酶处理开始之时,该油可能含有约50-250ppm的磷,或50-约1500ppm的磷,或更多的磷,如磷脂,并且本发明的方法可以将该值降低到约5-10ppm以下。
本发明的酶可以用于如1993年4月25日提交的日本申请号H5-132283所述的方法,该日本申请包括纯化油和脂肪的方法,该方法包括步骤:将油和脂肪中的磷脂转化为含磷酸基团的水溶性物质,并且作为水溶性物质去除它们。酶的作用被用于转化成水溶性物质。优选使用的酶是具有磷脂酶C活性的酶。
本发明的酶可以用于被描述为“有机精炼方法”(“OrganicRefiningProcess”,ORP)(IPH,Omaha,NE)的方法,其是精炼种籽油的一种方法。ORP可具有优于传统化学精炼的优点,包括提高的精油产量、增值的副产品、降低的投资成本和更低的环境成本。
本发明的酶可以用于处理油或脂肪,动物或者植物,未加工的、半加工的或者精炼的油或脂肪的方法,包括将本发明的至少一种酶加入到这样的油或者脂肪中,该酶能够水解和/或解聚在油中含有的非-甘油酯化合物,例如EP申请号:82870032.8所述。本发明用于水解和/或解聚在油中含有的非-甘油酯化合物的示例性方法为:1)在油和脂肪中,加入之前溶解于少量合适溶剂(例如,水)中的本发明的酶或者酶复合物,并混合。一定数目的溶剂是可能的,但是选择对该酶无毒性的和适合的溶剂。这种加入可以在逐次加载的方法中进行,也可以在连续的方法中进行。按照该方法,加入到油和脂肪中所必需的酶量的范围可以依赖于酶以及待处理的产物,范围从5到400ppm,或约20到400ppm;例如,对于1000kg的油或者脂肪为0.05kg至0.4kg的酶,并且优选5到100ppm,即,对于1000kg的油从0.05kg到0.1kg的酶,这些值被理解是对于浓酶而言的,即没有稀释剂或者溶剂。2)使油或者脂肪通过固体或者半固体支持物上的本发明酶的固定的或者不溶性滤床,支持物优选呈现多孔的或者纤维性结构。在这一技术中,酶被捕获于支持物的多孔或者纤维结构的微孔中。这些支持物由,例如树脂或合成聚合物、碳酸纤维素、凝胶如琼脂糖、具有多孔结构的聚合物或共聚物的丝构成,从而将处于溶液中的酶的小液滴捕获在它们的微孔中。关于酶的浓度,有可能达到支持物的饱和水平。3)以微小的液滴形式,在稀酶溶液中,分散油和脂肪,在可选的方面,含有约0.05%体积到4%体积,或含有约0.2%体积到4%体积的本发明的酶。这一技术描述在例如比利时专利号595,219中。具有圆锥形盖子的几米高的圆柱形柱子装满稀酶溶液。对于这一目的,选择在待处理的油或者脂肪中无毒或不可溶混的溶剂,优选水。柱子的底部装备了分配系统,在其中,油或者脂肪以极其分散的形式(每m2大约10,000流量)连续注入。这样,形成无数的油或脂肪液滴,其在酶溶液中缓慢地升高并且到达表面,从而在反应器的圆锥形盖子的顶部被连续排出。
棕榈油可以在用本发明酶处理前进行预处理。例如,将大约30kg未处理的棕榈油加热到+50℃。在蒸馏水中制备具有纤维素酶和果胶酶的1%溶液。在强烈搅拌几分钟下,将600g的这些中的每一物质加入到油的水溶液中。然后,在中度搅拌的条件下,将油保持在+50℃,总反应时间是两个小时。然后,将温度升高到+90℃,以使酶失活,并制备用于过滤和进一步处理的混合物。将油在真空下干燥,并使用过滤助剂进行过滤。
本发明的酶可以用在如EP专利EP0513709B2所述的方法中。例如,本发明提供了通过使用本发明的磷脂酶的酶分解作用,减少动物和植物油中的含磷成分的含量的方法。在可选的方面,将具有磷含量约50至1500ppm,或约50至250ppm的预先除去粘液的动物和植物油与有机羧酸混合搅拌,并且将所得到的混合物的pH值设定为约pH4至pH6,将含有本发明的磷脂酶A1、A2或者B的酶溶液加入到该混合物中,在混合容器中,通过强力搅拌,形成微小的液滴,在其中,形成相对于油的重量百分比为0.5到5%的乳状液,所述乳化通过至少一个后续的反应容器,在涡旋运动下,在0.1到10小时的反应时间中,在20℃到80℃的温度范围内进行,并且其中,在水溶液分离后,处理的油具有5ppm以下的磷含量。
有机精炼方法可以用于粗制油和脱胶油。该方法在控制的方法条件下,应用在线方式加入有机酸,并与传统的离心分离相结合。从植物油磷脂(“VOP”)自然分离的水再循环,并再次使用。有机精炼方法的结果为,总的水用量大大降低。
本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利号6,162,623中所述。在这一示例性的方法中,本发明提供了两亲性的酶。该酶可以被固定化,例如,通过制备含有连续疏水相以及含有酶以及酶载体的分散水相的乳状液,并且从分散相中去除水,直到该相变成固体酶包被的颗粒。该酶可以是脂酶。固定化的脂酶可以用于由脂酶催化的反应,如甘油单酯、甘油二酯或甘油三酯的酯交换;甘油三酯油的脱酸作用;或者当脂酶是磷脂酶时,从甘油三酯油去除磷脂。水相可以含有发酵液,可食用的甘油三酯油可以是疏水相,载体包括糖类、淀粉、葡聚糖、水溶性纤维素衍生物和发酵残余物。这一示例性的方法可以用于处理甘油三酯、甘油二酯、甘油单酯、甘油、磷脂或脂肪酸,其可以存在于疏水相中。在一方面,用于去除甘油三酯油中的磷脂的方法包括,将含有磷脂的甘油三酯油与含有本发明磷脂酶的制备物混合;将磷脂水解为溶血磷脂;从油中分离水解的磷脂,其中磷脂酶是固定化的磷脂酶。
本发明的磷脂酶和方法也可以应用于食用油的酶法处理,如在美国专利号6,127,137中所述。这一示例性方法水解完整磷脂的两个脂肪酰基团。用于该方法的本发明的磷脂酶没有脂酶活性,并且其在很低的pH下具有活性。这些特征使其非常适于油脱胶,这是因为油的酶法和碱法水解(皂化作用)可能均受到抑制。在一方面,本发明提供水解磷脂或者溶血磷脂中的脂肪酰基团的方法,包括用磷脂酶处理磷脂或者溶血磷脂,所述磷脂酶水解磷脂中的两个脂肪酰基团并且基本上无脂酶活性。一方面,本发明的磷脂酶具有约50℃的最佳温度,测量的条件是在pH3到pH4下进行10分钟;最佳pH为大约pH3,测量的条件是在40℃下进行10分钟。一方面,磷脂或者溶血磷脂包括卵磷脂或溶血卵磷脂。一方面,在水解大部分的磷脂后,从油中分离含有水解的磷脂的水相。一方面,本发明提供了方法,用于从食用油中去除磷脂,包括用本发明磷脂酶的水溶液的分散液在pH1.5至pH3下处理油,并从油中分离含有水解的磷脂的水相。一方面,在用磷脂酶处理前,处理油以除粘质。一方面,在用磷脂酶处理前,该油含有磷脂,其量相当于50到250ppm的磷。一方面,在0.5到5%的水存在下,在30℃到45℃,用磷脂酶处理1到12个小时,磷脂酶的剂量为0.1到10mg/l。
本发明的磷脂酶和方法也可以用于用酶法处理食用油,如在美国专利号6,025,171中所述。在这一示例性的方法中,本发明的酶通过如下步骤被固定化:制备含有连续疏水相如甘油三酯和分散的水相的乳状液,所述水相含有两亲性酶,如脂酶或者本发明的磷脂酶和在水相中部分溶解和部分不溶解的载体物质;并从水相中去除水,直到该相变为固体酶包被的载体颗粒。因为水相已经用水溶性物质饱和,载体物质的非溶解部分可以是在水中和油中不溶的物质,或者非溶解形式的水溶性物质。水相可以用含有发酵残留物和生物质的粗脂酶发酵液形成,生物质可以作为载体物质。固定化的脂酶可以用于油中的酯重排和脱酸作用。反应后,固定化的酶可以通过如下的方法再生,用于以后的反应:加入水以得到载体的部分溶解,且所得到的含有酶和载体的水相分散到疏水相中,蒸发掉水,再次形成酶包被的载体颗粒。
本发明的磷脂酶和方法也可以用酶法处理食用油,如在美国专利号6,143,545中所述。该示例性方法用于应用本发明的磷脂酶来降低食用油中含磷组分的含量,该食用油包含高含量的非-水合磷。一方面,该方法用于降低食用油中含磷组分的含量,该食用油具有至少50ppm的非-水合磷含量,这如下方法测量:通过加入含有柠檬酸单水合物的水溶液(加入水对油为4.8%w/w;在水相中的(柠檬酸)=106mM,水/油乳液=4.6mM)在60℃预处理食用油30分钟;将10ml预处理的油包水乳状液转移至试管中;在沸水浴中加热乳状液30分钟;在5000rpm离心10分钟,将大约8ml的上层(油)相转移至新的试管中,并且放置24小时;从上清相中取2克,用于测定在食用油中的非-水合磷的含量(ppm)。该方法也可以包括在大约pH5到8的pH下,将油与本发明的磷脂酶A或者B的水溶液(如,PLA1、PLA2或PLB)接触,该溶液在油中进行乳化,直到油的磷含量下降到小于11ppm。然后从处理的油中分离水相。
本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利5,532,163中所述。本发明提供精炼油和脂肪的方法,通过该方法,待处理的油和脂肪中的磷脂可以被有效地分解和去除。一方面,本发明提供精炼油和脂肪的方法,包括在乳状液中使油和脂肪与本发明的酶反应,本发明的酶例如具有分解甘油磷脂中甘油-脂肪酸酯键的活性的酶(如本发明的PLA2);也提供了另一个方法,其中用酶处理的油和脂肪用水或者酸性水溶液洗涤。一方面,用于洗涤步骤的酸性水溶液是至少一种酸的溶液,如柠檬酸、乙酸、磷酸以及它们的盐。一方面,通过每100重量份的油和脂肪应用30重量份或更多的水来形成乳化条件。因为油和脂肪可以不用传统的碱法精炼步骤来纯化,所以可以降低洗涤废水和工业废物的产生。此外,由于包含在这些废物中而导致天然油和脂肪损失的现象不在本发明的方法中发生,所以油的回收产量增加。一方面,本发明提供了用于精炼含有约100到10,000ppm的磷脂的油和脂肪的方法,包括:在乳化的条件中,将所述油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸酯键的活性的本发明酶进行反应。一方面,本发明提供了用于精炼含有约100到10,000ppm的磷脂的油和脂肪的方法,包括:在乳化的条件中,将所述油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸酯键的活性的本发明酶进行反应;并且随后用洗涤水洗涤处理的油和脂肪。
本发明的磷脂酶和方法也可以用于酶法处理食用油,例如在美国专利号5,264,367中所述。可食用植物油或者动物油,如油,例如大豆油——其已经通过湿法精炼去除胶质——的含磷成分的含量以及铁含量通过下述方法降低:通过将所述油与本发明的酶如磷脂酶A1、A2或者B的水溶液接触进行酶分解,然后从处理的油中分离水相。一方面,本发明提供了降低油中的含磷组分和含铁组分的含量的酶方法,所述油已经进行精炼去除胶质。已经进行精炼去除胶质的油可以用本发明的酶处理,如磷脂酶C、A1、A2或B。可以实现磷含量低于5ppm,铁含量低于1ppm。低的铁含量对油的稳定性可能是有利的。
本发明的磷脂酶和方法也可以用于制备酯交换的油,如在美国专利5,288,619所描述的。本发明提供了酶法酯交换的方法,用于制备具有低的反式酸和低的中链脂肪酸含量的人造黄油。该方法包括以下步骤:提供含有硬脂酸源物质和可食用液体植物油的酯交换反应混合物;应用1-,3-位置特异性脂酶对硬脂酸源物质和植物油进行酯交换;然后,最后氢化脂肪酸混合物,来提供再循环的硬脂酸源物质,用于与植物油进行再循环反应。本发明也提供了制备酯交换油的逆流方法(counter-currentmethod)。该方法包括下述步骤:提供含有1-,3-位置特异性脂酶的酯交换反应区域;将植物油引入酯交换区域;引入硬脂酸源物质;传输超临界气体或者亚临界液化气体逆流流体;在反应区域中进行甘油三酯流与硬脂酸或者硬脂酸单酯流的酯交换反应,;抽提酯交换的甘油三酯人造黄油流;抽提逆流流体相;对酯交换的硬脂酸或者硬脂酸单酯进行氢化作用,以提供氢化的再循环硬脂酸源物质;并将氢化的再循环硬脂酸源物质引入反应区域。
一方面,高度不饱和的磷脂化合物可以通过适当地应用本发明的磷脂酶C以去除sn-3位置的磷酸基团,随后进行1,3脂酶酰基酯的合成,而转变为甘油三酯。2-取代的磷脂可以直接用作功能性食物成分,或者随后可以应用本发明的固定化的磷脂酶C在反应器160中选择性地进行水解,以产生1-甘油二酯,随后进行在此描述的酶促酯化反应,来产生具有2-取代的多聚不饱和脂肪酸组分的甘油三酯产物。
本发明的磷脂酶和方法也可以用于植物油的酶法脱胶方法,如在美国专利号6,001,640中所描述的。本发明的该方法包括在食用油生产中的脱胶步骤。通过先前的水脱胶方法已经去除可水合磷脂的植物油,通过用本发明的磷脂酶进行酶法处理,不含有非-水合磷脂。该方法可以是温和的、经济的以及环境友好的。仅仅水解溶血卵磷脂而不水解卵磷脂的磷脂酶用于该脱胶方法。
一方面,为了使本发明的酶能在两相中作用,含有酶的油相和水相,必须充分混合。仅仅搅拌它们可能是不够的。如果其溶解于少量的水中,如0.5-5%重量百分比(相对于油),则有助于酶在油中很好地分散开,并且以这一形式在油中进行乳化,从而形成直径小于10微米的液滴(平均重量)。液滴可以小于1微米。可以以超过100cm/秒的径向速率进行剧烈的搅拌。油也可以应用外部旋转泵在反应器中循环。含有酶的水相也可以利用超声作用充分分散。可以应用分散仪器。
酶反应可能发生在油相和水相之间的界面上。所有这些混合措施的目标是为含有酶的水相产生最大可能的表面。表面活性剂的加入增加了水相的微分散。所以,在一些情况下,将HLB值高于9的表面活性剂,如十二烷基硫酸钠加入到酶溶液中,如在EP-A0513709中所描述的。增加乳化作用的类似有效的方法是加入溶血卵磷脂。相对于油,加入的量可以在0.001%到1%范围内。酶处理期间的温度不是至关重要的。可以应用在20℃到80℃之间的温度,但是后者只能短时间应用。在该方面,应用具有良好的温度和/或低pH值耐受性的本发明的磷脂酶。在30℃到50℃之间的应用温度是最佳的。处理时间取决于温度,并且可以随着温度增加,时间变短。时间从0.1到10小时,或者从1到5小时一般足够了。反应在脱胶反应器中发生,其可以划分为几个阶段,如在DE-A4339556中所描述的。因此,可以进行连续操作,以及间歇性(分批)操作。反应可以在不同的温度阶段中进行。例如,温育可以在40℃下进行3小时,然后在60℃下进行1小时。如果反应在这些阶段中进行,这也可能在各个阶段调节不同的pH值。例如,通过加入柠檬酸溶液,在第一阶段,溶液pH值可以调节到7,例如,在第二阶段,将pH值调节到2.5。然而,在至少一个阶段,酶溶液的pH值必须低于4或者低于3。如果pH值随后调节到低于这一水平,可能会损害效果。因此,柠檬酸可以在后者被混合到油中之前被加入至酶溶液中。
在酶处理完成以后,酶溶液以及包含在酶溶液中的NHP的分解产物,可以例如通过离心的方式,从油相中分批或连续地分离出来。由于酶具有高水平的稳定性,并且包含在溶液中的分解产物的量较少(它们可能沉淀为污泥),存在于水相中的同样的酶可以应用几次。也有可能从污泥中释放出酶,参见如DE-A4339556,这样基本上没有污泥的酶溶液可以被再次使用。在这一脱胶方法的一个方面中,得到含有少于15ppm磷的油。一个目标是磷含量少于10ppm;或者少于5ppm。在磷含量低于10ppm的情况下,按照蒸馏脱酸方法进一步处理油是非常可能的。许多其它的离子,如镁、钙、锌以及铁,可以从油中去除,如低于0.1ppm。这样,该产品为在进一步处理和储存期间具有良好的耐氧化性具有理想的前提条件。
本发明的磷脂酶和方法也可以用于降低植物油和动物油中含磷组分的量,如在EP专利EP0513709中所述。在这一方法中,植物和动物油中含磷组分,尤其是磷脂如卵磷脂的含量以及铁含量,通过应用本发明的磷脂酶A1、A2或者B的酶法降解作用而被降低,所述植物和动物油之前经过了脱泥处理,如大豆油。
本发明的磷脂酶和方法也可以用于精炼脂肪或者油,如在JP06306386中所述。本发明提供了用于精炼脂肪或者油的方法,该方法包括将在脂肪或者油中的磷脂转化成水溶性的含磷基团物质,并除去该物质的步骤。本发明酶(如,PLC)的作用被用于将磷脂转化成这种物质。因此,有可能在无需进行碱精炼步骤的情况下,精炼脂肪或者油,碱精炼步骤产生含有碱性废水和大量油的工业废物。由于中性脂肪或油与废物一起排出所致的损失可以降低到零,可以实现产量的增加。在一方面,通过在粗制油脱胶阶段加入本发明具有磷脂酶C活性的酶,和进行酶处理,胶状物质被转化成水溶性物质,并作为水溶性物质而被去除。一方面,本发明的磷脂酶C具有切割磷脂中的甘油和磷酸的酯键的活性。如果需要,该方法可以包括用水或者酸性水溶液洗涤经过酶处理的油。一方面,加入本发明的酶,并且与粗制油反应。所用的磷脂酶C的量可以是每公斤粗制油10到10,000单位,或大约100到2,000单位。
本发明的磷脂酶和方法也可以用于水脱胶方法,如在Dijkstra,AlbertJ.等,Oleagineux,CorpsGras,Lipides(1998),5(5),367-370中描述。在该示例性的方法中,水脱胶方法被用于产生卵磷脂,并且用于使用脱胶酸和漂白土的干法脱胶方法。这一方法可能仅仅对于低磷脂含量的油是经济可行的,如棕榈油、月桂油等。对于具有高NHP含量的种籽油,应用酸精炼方法,其中该方法在榨油机中进行,以使得胶经粗粉(meal)去除。一方面,该酸精炼的油是在物理精炼之前所进行的一个可能的“磨光(polishing)”操作。
本发明的磷脂酶和方法也可以用于脱胶方法,如在Dijkstra,等,Res.Dev.Dep.,N.V.VandemoorteleCoord.Cent.,Izegem,Belg.JAOCS,J.Am.OilChem.Soc.(1989),66:1002-1009中描述。在该示例性的方法中,全部的脱胶方法包括将酸如磷酸或者柠檬酸分散至大豆油中,允许接触一定的时间,随后将碱如苛性钠或者硅酸钠混合到油包酸(acid-in-oil)乳状液中。这可以将中和度保持在足够低的水平,以避免形成肥皂,这是因为这将导致油损失的增加。随后,油通过离心分离器,在其中,大多数胶从油流中去除,产生具有最少油含量的胶相(gumphase)。油流随后通过第二离心分离器中,以去除所有残留的胶,得到稀胶相,其被循环再利用。洗涤和干燥或者在线碱法精炼完成该方法。在采用全部的脱胶方法以后,与经典的碱法精炼方法比较,实现了总产量增加大约0.5%。完全脱胶的油然后可以进行碱精炼,漂白和除臭,或者被漂白和物理精炼。
本发明的磷脂酶和方法也可以用于去除植物油,如大豆油中的非水合磷脂,如在Hvolby,等,Sojakagefabr.,Copenhagen,Den.,J.Amer.OilChem.Soc.(1971)48:503-509中所描述的。在这一示例性的方法中,水脱胶的油在不同的固定pH值下与含有和不含有Ca++、Mg/Ca结合试剂的缓冲液以及表面活性剂混合。非水合的磷脂可以作为微胶粒或混合乳化剂的组分以未转化的状态被去除。更进一步地,非水合磷脂可以通过转化为解离形式而去除,例如通过从磷脂中去除Mg和Ca,该过程可以通过酸化或者通过用Mg/Ca络合试剂或者Mg/Ca沉淀试剂处理来完成。非水合磷脂的去除或者化学转化可能导致乳状液形成减少,和从乳状液层和皂脚分离的脱酸油增加。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Buchold,等,Frankfurt/Main,Germany.FettWissenschaftTechnologie(1993),95(8),300-304中所述。在本发明的用于食用植物油脱胶的这一示例性方法中,用本发明酶如磷脂酶A2的水悬浮液来水解结合在磷脂sn2位上的脂肪酸,得到不溶于油的1-酰基-溶血磷脂,并且因此更适用于物理分离。甚至加入少量的相当于大约700卵磷脂酶(lecitase)单位/公斤油,得到的残留磷浓度小于10ppm,这样化学精炼是可以用物理精炼替代的,从而消除了中和、皂脚破裂和废水处理的必要性。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如EnzyMax.Dahlke,Klaus.Dept.G-PDO,LurgiO1-Gas,Chemie,GmbH,Frankfurt,Germany.Oleagineux,CorpsGras,Lipides(1997),4(1),55-57中所述。该示例性方法是一个用于物理精炼几乎任何种类油的脱胶方法。通过酶-催化的水解,磷脂转化为水溶性的溶血磷脂,其可以通过离心从油中分离得到。在酶法脱胶的油中,残留的磷含量可以低至2ppmP。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Cleenewerck,等,N.V.VamoMills,Izegem,Belg.FettWissenschaftTechnologie(1992),94:317-22;和Clausen,Kim;Nielsen,Munk.NovozymesA/S,Den.DanskKemi(2002)83(2):24-27中所述。本发明的磷脂酶和方法可以合并用酸对植物油进行的预精炼方法,预精炼方法如在下述文献中所述:Nilsson-Johansson,等,FatsOilsDiv.,Alfa-LavalFoodEng.AB,Tumba,Swed.FettWissenschaftTechnologie(1988),90(11),447-51;以及,Munch,ErnstW.CereolDeutschlandGmbH,Mannheim,Germany.Editor(s):Wilson,RichardF.ProceedingsoftheWorldConferenceonOilseedProcessingUtilization,Cancun,Mexico,Nov.12-17,2000(2001),MeetingDate2000,17-20。
本发明的磷脂酶和方法也可以用于植物油中的脱胶,如在Jerzewska,等,Inst.PrzemysluMiesnegoiTluszczowego,Warsaw,Pol.,TluszczeJadalne(2001),36(3/4),97-110中所述。在本发明的这一方法中,通过应用本发明的磷脂酶A2对水合的低-芥酸油菜籽油进行酶法脱胶。该酶可以催化磷脂中与甘油部分的中心碳原子连接的脂肪酸酯键的水解。它也可以水解非-水合的磷脂成它们相应的水合溶血化合物。使用非纯化的酶制备物,加入2%的制备物4小时,可以得到更好的结果(87%的磷去除)。
在本发明的油脱胶(或使用本发明酶的油脱胶方法)的另一示例性方法中,加入酸性聚合物,例如藻酸盐或果胶。在本发明的该油脱胶方法中,将酸性聚合物(例如藻酸或果胶或更加可溶性的盐形式)加入到含有少量水(例如在约0.5至5%范围内)的粗油中。在该方面中,通过结合粗油中的钙和/或镁,酸性聚合物可以减少和/或分解磷脂-金属络合物,从而提高非水合磷脂的溶解性。在可选的方面,这些磷脂将移动到油/水介面或进入水相,或者转化为二酰甘油和相应的侧链,或者完整的磷脂将作为重相的组分被随后的离心除去。在水相中酸性聚合物的存在也可以增加水相的密度,并提高从油(轻)相分离重相的效果。
本发明的油脱胶(或使用本发明酶的油脱胶方法)的一个示例性方法改变除臭程序,以获得二酰甘油(DAG)部分。在可选的方面,如果必要或需要,在酶助脱胶之后,可以改良除臭条件(温度、压力、蒸馏设备的构造),以达到提高游离脂肪酸(FFA)从二酰甘油/三酰甘油部分分离的结果,或进一步改良以从三酰甘油部分分离二酰甘油。这些改良的结果是,使用本发明的方法有可能获得食品级FFA和二酰甘油,如果本发明的酶(例如磷脂酶,或PLC或PLC和磷酸酶的组合)用于在物理精炼方法中使食用油脱胶的话。
在各个方面,实施在此描述的本发明方法(或使用本发明的酶),具有许多优点,诸如:减少或消除溶剂和溶剂回收步骤;降低资金成本;减少下游精炼成本;减少化学品的利用、设备、处理时间、能源(热能)和水利用/废水产生;产生高质量的油;在一些烹饪和煎炒应用中可以使用未精炼的压榨机压出的油(该压出的油可以具有优异的稳定性、色泽和气味特征和高维生素E含量);产生高质量的膳食;产生低脂肪含量的膳食(目前,出自机械压榨的膳食引起反刍动物的消化问题);产生提高的营养特性——减少水平的芥子油苷、单宁、植酸(如在TechnologyandSolventsforExtractingOilseedsandNonpetroleumOils,AOCS1997中所述)。
一方面,本发明提供了精炼植物油(例如大豆油、玉米油、棉籽油、棕榈油、花生油、油菜油、红花油、向日葵籽油、芝麻籽油、米糠油、椰子油或油菜油)和它们的副产物的方法,和对卵磷脂除臭的方法,例如在美国专利6,172,248或6,172,247中所述,其中该方法包括使用至少一种本发明的酶,例如本发明的磷脂酶C。因此,本发明提供了包含至少一种本发明的酶的卵磷脂和植物油。在示例性有机酸精炼方法中,将植物油与稀的含水有机酸溶液组合,并进行高剪切,以将酸溶液充分分散在油中。将所得的酸-和-油混合物在低剪切下混合一段足够的时间,以将污染物螯合入水合的杂质相中,从而产生纯化的植物油相。在该示例性方法中,可以使用混合器或循环系统(例如循环水桶)和/或磷脂或卵磷脂储存桶,如在美国专利4,240,972、4,049,686、6,172,247或6,172,248中所述。这些方法可以作为分批或连续方法操作。粗或脱胶的植物油可以由储存桶供应(例如通过泵)并可以加热。待纯化的植物油可以是粗的或“脱胶的”油。
一方面,本发明的磷脂酰肌醇-PLC(PI-PLC)酶用于植物油脱胶。本发明的PI-PLC可以单独使用,或与其它的酶(例如,本发明的PLC、PLD、磷酸酶)组合使用,用于提高植物油(包括大豆油、油菜油和向日葵油)脱胶期间的油产量。PI-PLC可以优选将磷脂酰肌醇转化为1,2-二酰甘油(DAG)和磷酸肌醇(phosphoinositol),但是它也可以对其它磷脂表现出活性,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸或磷脂酸或其组合。对植物油进行酶处理导致捕获在较小的胶部分中的油的数量减少,这增加了酶处理的植物油中的DAG量和中性油增加,从而实现产量增加。含油种子的酶法加工
本发明提供了酶法加工含油种子,包括大豆、油菜、椰子、鳄梨和橄榄糊的组分(例如酶)和方法。一方面,本发明的这些方法可以增加油产量,并提高获得的膳食的营养质量。在一些方面,使用本发明的酶和方法来酶法加工含油种子,将具有经济和环境利益,并为油萃取和加工人类和动物食物提供了可供选择的技术。在可选的方面,本发明的方法包括使用本发明的磷脂酶、其它磷脂酶、蛋白酶、磷酸酶、植酸酶、木聚糖酶、淀粉酶(例如α-淀粉酶)、葡聚糖酶(例如β-葡聚糖酶)、聚半乳糖醛酸酶、半乳糖脂酶、纤维素酶、半纤维素酶、果胶酶和其它降解植物细胞壁的酶、以及混合酶制剂和细胞裂解酶。
在可选的方面,本发明的方法可以与其它方法联合实施,例如酶处理,例如用碳水化合物酶处理,包括纤维素酶、半纤维素酶和其它具有副降解活性的酶,或与化学方法联合,例如己烷提取大豆油方法。当在溶剂萃取之前进行酶法处理,酶法处理可以增加油萃取率达8-10%。
在可选的方面,本发明的方法可以用水萃取方法实施。水萃取方法对于油萃取来说可能是可选择的环境清洁器技术。水方法的低萃取产量可以通过使用这样的酶克服,即该酶水解形成含有种子细胞壁的结构多糖,或水解形成细胞和类脂体膜的蛋白质,例如,利用包括纤维素酶、半纤维素酶和/或原果胶酶在内的酶进行消化,以从大豆细胞提取油。一方面,根据Kasai(2003)J.Agric.FoodChem.51:6217-6222的描述,用本发明的酶实施本方法,该文献报道了消化细胞壁最有效的酶是纤维素酶。
一方面,蛋白酶与本发明的方法一起使用。已经评价了蛋白酶和纤维素酶的操作变量和酶活性以及其它方法参数,诸如酶浓度、水解时间、颗粒大小和固液比对油和蛋白质提取产量的联合效应。一方面,根据Rosenthal(2001)EnzymeandMicrob.Tech.28:499-509的描述,用本发明的酶实施本方法,该文献报道了使用蛋白酶能比使用热处理面粉的对照产生明显较高的油和蛋白质产量。
一方面,全蛋白、果胶和半纤维素提取方法与本发明方法一起使用。植物细胞由一系列的多糖组成,其常常与蛋白质和酚类化合物相关或用蛋白质和酚类化合物替代。这些碳水化合物中的大部分只是被消化酶部分消化或低效利用。通过加工酶或降解性酶来裂解这些结构,可以提高它们的营养可利用率。一方面,根据Ouhida(2002)J.Agric.FoodChem.50:1933-1938的描述,用本发明的酶实施本方法,该文献报道了全蛋白、果胶和半纤维素提取之后大大降解了大豆细胞壁纤维素(高达20%)。
一方面,本发明的方法进一步包括在处理种子例如油菜籽中结合各种酶处理,这些处理包括使用蛋白酶、纤维素酶和半纤维素酶(本发明的一种或多种酶相互之间和与本发明的一种或多种酶的各种组合)。例如,该方法可以包括在传统方法之前,在用酶温育期间,在20至40水份中酶法处理油菜种子,如Sosulski(1990)Proc.Can.Inst.FoodSci.Technol.3:656所述。本发明的方法可以进一步结合蛋白酶、α-淀粉酶、聚半乳糖醛酸酶(本发明的一种或多种酶相互之间和与本发明的一种或多种酶的各种组合),以水解椰子膳食中的纤维素物质和释放椰子油,该椰子油可以通过离心回收,如McGlone(1986)J.ofFoodSci.51:695-697所述。本发明的方法可以进一步以不同的组合方式结合果胶酶、α-淀粉酶、蛋白酶、纤维素酶(本发明的一种或多种酶相互之间和与本发明的一种或多种酶的各种组合),以在酶法提取椰子油期间明显提高产量(在最好的情况下~70%),如Buenrostro(1986)Biotech.Letters8(7):505-506所述。在本发明的橄榄油提取方法中,用纤维素酶、半纤维素酶、聚半乳糖醛酸酶(poligalacturonase)、果胶-转甲基酶、蛋白酶和它们的组合(本发明的一种或多种酶相互之间和与本发明的一种或多种酶的组合)处理橄榄糊,如,例如Montedoro(1976)ActaVitamin.Enzymol.(Milano)30:13所述。从植物油中纯化植物固醇
本发明提供了方法,用于从植物油中纯化植物固醇和三萜,或者植物甾醇。应用本发明的磷脂酶和方法可以纯化的植物固醇,包括-谷固醇、菜子甾醇、豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、24-脱氢胆甾醇、海绵甾醇、海棉动物甾醇、γ-谷甾醇和菜子甾醇。植物固醇是用于健康和营养工业的重要农产品。因此,本发明的磷脂酶和方法可用于制备用于化妆品制造的乳化剂以及用于生产激素药物的甾体中间物和前体。本发明的磷脂酶和方法用于制备(如,纯化)植物固醇和它们的酯的类似物,用作具有心血管健康价值的降低胆固醇的试剂。本发明的磷脂酶和方法用于纯化植物甾醇,植物甾醇通过抑制在消化道中的胆固醇吸收,来降低血清中的胆固醇水平。本发明的磷脂酶和方法用于纯化在极低的浓度下具有免疫调节特征的植物甾醇,包括增强的T淋巴细胞的细胞应答和天然杀伤细胞对癌细胞系的细胞毒性活性。本发明的磷脂酶和方法用于纯化植物甾醇,植物甾醇用于治疗肺结核、类风湿性关节炎、HIV-感染病人的处理和免疫应力的抑制,例如,在马拉松选手中。
本发明的磷脂酶和方法用于纯化存在于商品植物油(如,椰子、油菜、可可豆脂油、玉米、棉籽、亚麻、橄榄、棕榈、花生、米糠、红花、芝麻、大豆、向日葵油)的甾醇部分中的甾醇组分,如,谷固醇(40.2-92.3%)、菜油甾醇(2.6-38.6%)、豆甾醇(0-31%)和5-燕麦固醇(1.5-29%)。
本发明的方法可以结合油籽中植物来源固醇的分离,该分离通过下述方法完成:用氯仿-甲醇、己烷、二氯甲烷或者丙酮进行溶剂抽提,然后进行皂化作用和层析法纯化,以获得富集的总甾醇。可选地,植物样品可以通过应用超临界二氧化碳的超临界流体提取法提取,以得到总的脂类提取物,从中可以富集和分离甾醇。对于甾醇化合物的随后表征和定量,粗分离物可以通过很多不同的色谱技术纯化和分离,包括柱层析(CC)、气相色谱、薄层色谱(TLC)、正相高效液相色谱(HPLC)、反相高效液相色谱和毛细管电色谱。在所有的色谱分离和分选技术中,对于样品清理、纯化、定性分析和测试样品中固醇的初步估计而言,CC和TCL程序的应用是最容易进行的,成本上承受得起的并且是适当的。
在可食用油的精炼过程中,植物油中的植物固醇作为副产物而丧失。本发明的磷脂酶和方法应用从这样的副产物中分离的植物固醇,来制备从这样的副产物中分离得到的富集植物固醇的产物。本发明的植物固醇分离和纯化方法可以合并油处理方法中的工业副产物,并且可以包括如分子蒸馏、液-液提取和结晶的操作。
本发明的方法可以结合抽提液体来提取植物固醇的方法。例如,本发明的方法可以应用非极性溶剂如己烷(一般用于提取大部分种类的植物油),定量地提取游离的植物固醇和植物固醇酰基脂肪酸酯。固醇糖苷和脂肪酰化固醇糖苷仅仅用己烷部分提取,并且增强的溶剂极性产生了更高百分比的抽提率。可以应用的一个程序是Bligh和Dyer的氯仿-甲醇方法,用于提取所有的固醇脂类,包括磷脂。一个定性分离和定量分析植物固醇脂类的示例性方法包括将脂类提取物注射入HPLC系统。
本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如在美国专利号6,303,803中所描述的。这是降低含有固醇的脂肪和油中的固醇含量的方法。其基于胆固醇和其它甾醇对于形成疏水流体双层,如磷脂双层的两性分子的亲和性,是一个高效和具有成本效率的过程。磷脂的聚集体与,例如含有甾醇的脂肪或者油在含水环境下接触,随后进行混合。聚集的磷脂混合物的分子结构对胆固醇和其它甾醇具有高亲和性,并可以从脂肪和油中选择性地去除这样的分子。水相分离混合物混合足够长的时间,以便通过分配甾醇到磷脂聚集体部分中,从而选择性地降低脂肪/油产物中的甾醇含量。甾醇含量降低的脂肪或者油被从水相分离混合物中分离。可选地,相应的富集甾醇的部分也可以被从水相分离混合物中分离。这些步骤可以在室温下进行,涉及加热的成本被减到最少,同样地,产物可能因为热而降解也被减少。另外,需要最少量的设备,并且因为所有需要的物质是食品级的,该方法不需要在操作、废物处理、或者最终产物的污染方面有特别预防措施。
本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如,在美国专利号5,880,300所描述的。将磷脂聚集体与,如含有甾醇的脂肪或者油在含水环境中接触,然后进行混合。在充分混合后,甾醇含量降低的脂肪或者油从含水分离混合物中分离出来。可选地,相应的甾醇富集的磷脂也可以从含水分离混合物中分离。植物(如蔬菜)油含有植物甾醇(植物固醇),它们也可以应用本发明的方法去除。该方法可以用于商业处理循环的任何阶段的脂肪/油产品。例如,本发明的方法可以用于精炼、漂白和除臭的油(“RBD油”),或者在达到RBD状态之前的加工过程的任何阶段。与预RBD油相比,尽管RBD油可以具有改变的密度,但本过程易于改变而适合于RBD也适合预RBD油(pre-RBDoil),或者适合于各种非脂肪/油产品,这是通过改变磷脂含量、磷脂组成、磷脂∶水的比例、温度、压力、混合条件和以下所述的分离条件而进行的。
可选地,本发明的酶和方法可以用于在油加工的中间步骤中分离植物甾醇或者其它甾醇。例如,已知在植物油的除臭期间失去植物甾醇。含有甾醇的蒸馏部分——例如来自处理的中间阶段,可以进行以上描述的甾醇抽提程序。这提供了富含甾醇的卵磷脂或者其它的磷脂物质,其可以进一步处理以便回收抽提的甾醇。洗涤剂组合物
本发明提供了包括一种或者多种本发明的磷脂酶的洗涤剂组合物,和制备和使用这些组合物的方法。本发明结合了所有制备和使用洗涤剂组合物的方法,参见例如美国专利号6,413,928;6,399,561;6,365,561;6,380,147。洗涤剂组合物可以是一个和两个部分的含水组合物、非含水液体组合物、铸塑固体、粒形形式、微粒形式、压缩片剂、凝胶和/或膏状物以及浆状物形式。本发明也提供应用这些洗涤剂组合物能够快速去除粗食物污染、食物残留物膜和其它微小的食物组分的方法。本发明的磷脂酶可以通过磷脂的催化水解来帮助去除污染。本发明的磷脂酶可以用在洗盘洗涤剂和纺织品洗涤洗涤剂中。
实际的活性酶含量依赖于洗涤剂组合物的制造方法,并且并不是重要的,只要洗涤剂溶液具有所需的酶促活性。一方面,存在于最终溶液的磷脂酶的量的范围为,在每克洗涤剂组合物中,大约0.001mg到0.5mg。选择用于本发明的方法和产品的特定酶,依赖于最终用途的条件,包括物理产品形式、应用pH、应用温度和待降解或者改变的污物类型。对于任何给定的一套应用条件,可以选择酶以提供最佳的活性和稳定性。一方面,本发明的多肽在大约4到大约12的pH范围,大约20℃到大约95℃的温度范围内有活性。本发明的洗涤剂可以包括阳离子、半极性非离子的或者兼性离子表面活性剂;或者其混合物。
本发明的磷脂酶可以配制成粉末洗涤剂和液体洗涤剂,其pH值在4.0到12.0之间,以重量百分比计算,含量水平为约0.01到大约5%(优选地0.1%到0.5%)。这些洗涤剂组合物也可以包括其它的酶,如已知的蛋白酶、纤维素酶、脂酶或内切糖苷酶,以及助洗剂和稳定剂。本发明磷脂酶的加入到传统的清洗组合物中,并不产生任何特定的应用限制。换句话说,只要pH在以上的范围内,温度低于所述酶的变性温度,适于洗涤剂的任何温度和pH也适于本组合物。此外,本发明的多肽可以用于不含洗涤剂的洗涤组合物中,或者可以单独应用,或者可以与助洗剂和稳定剂组合应用。
本发明提供了包括洗涤剂的洗涤或消毒组合物,和/或用于洗涤和/或消毒硬表面的消毒组合物,适用于洗涤和/或消毒织品的洗涤剂组合物,洗盘组合物,口腔清洗组合物,牙齿清洗组合物,和/或隐形眼镜清洗液。
一方面,本发明提供了洗涤对象的方法,该方法包括在足以洗涤的条件下,使该对象与本发明的磷脂酶接触。可以包括本发明的磷脂酶,作为洗涤剂添加剂。本发明的洗涤剂组合物可以,例如,配制成包括本发明磷脂酶的手洗或机洗洗涤剂组合物。适用于对染色织物前处理的洗涤添加剂可以包括本发明的磷脂酶。织物柔软剂组合物可以包括本发明的磷脂酶。可选地,本发明的磷脂酶可以被配制为洗涤剂组合物,一般用于家用硬表面的洗涤操作。在可选的方面,本发明的洗涤剂添加剂和洗涤剂组合物可以包括一种或者多种其它的酶,如蛋白酶、脂酶、角质酶、另一种磷脂酶、碳水化合物酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯醣酶、半乳聚糖酶、木聚糖酶、氧化酶,如乳糖酶和/或过氧化物酶。选择本发明酶的特征以与选定的洗涤剂相容(即,最适pH,与其它酶和非酶成分相容等等),并且该酶以有效量存在。在一方面,本发明的磷脂酶用于从织物中去除恶臭物质。可以用于实践本发明的各种洗涤剂组合物和用于制备它们的方法描述在下述专利中,例如美国专利号6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。废物处理
本发明的磷脂酶可以用于废物处理。一方面,本发明提供了应用本发明磷脂酶的固体废物消化方法。该方法可以包括降低基本上未处理的固体废物的质量和体积。固体废物可以用酶消化方法处理,是在酶溶液(包括本发明的磷脂酶)存在的条件下,在控制的温度下进行的。固体废物可以转化为液化废物和任何残留固体废物。所得到的液化废物可以与所述的任何残留固体废物分离。参见如美国专利号5,709,796。消毒
磷脂酶(例如本发明的PLCs、patatins)可以用于消毒方法,例如对内毒素,如包含磷脂多糖(LPS)的组分毒,并且,本发明提供了使用至少一种本发明的酶的消毒方法,所述酶例如包括具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQIDNO:175或SEQIDNO:176阐述的序列的patatin。一方面,本发明的磷脂酶用于对脂多糖(LPS)消毒。一方面,该消毒作用对来自类脂A的2′和/或3′脂肪酸链进行脱酰作用。一方面,本发明的磷脂酶(例如PLC、patatin)用于水解来自类脂,例如类脂A(例如来自细菌内毒素)的2′-月桂酰和/或3′-肉豆蔻酰链。一方面,本发明的方法用于破坏内毒素,例如来革兰氏阴性细菌,如来自大肠杆菌的毒素。一方面,本发明的磷脂酶(例如PLC、patatin)被用于改善毒素中毒(例如进行性革兰氏阴性感染)结果,或预防性地防止感染(例如动物或人感染)期间的内毒素作用。因此,本发明提供包含本发明的磷脂酶(例如PLC、patatin)的药物组合物,和使用本发明的水解酶来改善或预防脂多糖(LPS)毒性作用的方法,例如在脓血症期间。加工食物
本发明的磷脂酶可以用于加工食物,例如以改变它们的稳定性、货架期、风味、质地,提高它们的营养价值和类似情况。例如,一方面,本发明的磷脂酶用于产生酸性磷脂,用于控制食物的苦味。
一方面,本发明提供了使用本发明的磷脂酶制备奶酪的方法(因此,本发明也提供了包含本发明磷脂酶的奶酪)。一方面,本发明的酶(例如磷脂酶A、溶血磷脂酶或其组合)被用于加工奶酪,以增强风味、增加产量和/或“稳定”奶酪,例如通过减少“去油(oil-off)”的趋势而进行,或一方面,本发明的酶用于从酪乳加工奶酪。本发明的这些方法可以结合任何方法或方案,例如如在美国专利6,551,635和6,399,121、WO03/070013、WO00/054601中所述。例如,一方面,本发明的磷脂酶被用于稳定乳或含乳组合物,例如奶油中的脂肪乳状液,以及用于稳定乳组合物,例如用于制备奶油或液体奶油。一方面,本发明提供了使用至少一种本发明的酶来增强奶酪的风味的方法,该方法包括在含水介质中,在产生增强的奶酪风味的条件下(例如减少的苦味),温育蛋白、脂肪和蛋白酶和脂酶,如WO99/66805所述。一方面,本发明的磷脂酶用于增强奶酪(例如凝乳)的风味,这通过在升高的温度,例如在约75℃至95℃之间,用水、蛋白酶和脂酶(本发明的)混合进行,如在美国专利4,752,483中所述。一方面,本发明的磷脂酶用于通过在将凝结剂加入到乳之前将本发明的酶(例如脂酶或磷脂酶)加入到奶酪(例如酪乳)中,或在挤压之前将本发明的酶加入到含盐凝乳中来促进奶酪老化,如美国专利4,707,364中所述。一方面,本发明的脂酶用于降解乳中的甘油三酯来释放游离脂肪酸,从而增强风味。蛋白酶也可以用于本发明的这些方法的任何方法中,参见例如Brindisi(2001)J.ofFoodSci.66:1100-1107。在另一个方面,酯酶、脂酶、磷脂酶和/或蛋白酶的组合可以用于本发明的这些方法或任何方法。
一方面,本发明的磷脂酶用于减少食物中,例如油,诸如具有高含量的非水解磷组分的植物油中的磷组分含量,如WO98/26057所述。生物质转化和清洁生物燃料的产生
本发明提供多肽,包括本发明的酶(磷脂酶(PLs)——例如本发明的PLAs、PLCs或PLDs)和抗体,以及用于将生物质或任何木质纤维材料(例如包括纤维素、半纤维素和木质素的任何组分)转化至燃料(例如生物乙醇、生物丙醇、生物丁醇、生物丙醇、生物甲醇、生物柴油)的方法,除了食品、饲料和化学药品。例如,在可选的实施方式中,用于生物质转化和用于生物燃料产生的本发明的酶可具有一种或多种磷脂酶活性,包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,例如磷脂酶A1或磷脂酶A2活性;磷脂酶D(PLD)活性,例如磷脂酶D1或磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶以及溶血磷脂酶-转酰酶(LPTA)活性或磷脂酶以及溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰酶(LPTA)活性;或patatin活性,或其组合。
因此,本发明的组合物和方法提供石油基产品使用的有效、可持续的替代物或附加物,例如作为生物甲醇、生物乙醇、生物丙醇、生物丁醇及类似物的生物燃料的混合物,柴油燃料、汽油、煤油及类似物的替代物或附加物。本发明提供表达本发明的酶的生物,用于参与涉及自然生物质转化的化学循环。一方面,用于转化的酶和方法用于磷脂加工的酶的总体(ensemble)中。本发明提供发现和实施最有效的酶的方法,从而能进行这些重要的新的“生物质转化”以及可选的能量工业方法。
本发明的组合物和方法可用于提供石油基产品使用的有效、可持续的替代物或附加物,例如作为生物乙醇、生物丙醇、生物丁醇、生物丙醇、生物甲醇和/或生物柴油和汽油的混合物。本发明提供表达本发明的酶的生物,用于参与涉及自然生物质转化的化学循环。本发明提供发现和实施最有效的酶的方法,从而能进行这些重要的新的“生物质转化”以及可选的能量工业方法。
本发明提供本发明的方法、酶和酶的混合物或“混合物”(“cocktails”),用于加工材料,例如生物质材料,其包括纤维寡糖、阿糖基木聚糖低聚物、木质素、木质纤维素、木聚糖、葡聚糖、纤维素和/或可发酵的糖,其包括将组合物与本发明的多肽、或由本发明核酸编码的多肽接触,其中任选地,材料衍生自农业作物(例如小麦、大麦、马铃薯、柳枝稷、杨木),其是食品或饲料生产的副产品,其是木质纤维废物产品,或者是植物残余物或者是废纸或者是废纸产品,以及任选地所述植物残余物包括茎、叶、皮、外壳、玉米或玉米芯、玉米秸秆、玉米纤维、干草、麦秆(例如水稻秸秆或小麦秸秆)、甘蔗渣、甜菜渣、柑桔浆和柑桔皮、木材、木屑、木片、木浆、浆废料、木材废料、木材刨花和锯屑、建筑和/或拆除废物和碎片(木材、木材刨花和锯屑),以及任选地,纸废料包括废弃的或用过的影印纸、计算机打印纸、笔记本纸、记事本纸、打字机纸、报纸、杂志、纸板和基于纸的包装材料,以及再生纸材料。另外,城市废物(urbanwastes),例如城市固体废物的纸质部分、城市木材废物,和城市绿色废物,与其它包括糖、淀粉和/或纤维素的材料一起,可被使用。在可选的方面,所述材料——例如生物质材料的加工产生生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇。
可选地,本发明的多肽可表达在生物质植物材料或其给料本身中。
本发明的方法也包括提供加工的或“转化的”(例如通过包括使用本发明酶的方法)生物质或植物材料,例如包括脂类的材料或木质纤维材料(例如由本发明的酶加工的);以及通过将其发酵(例如,由酵母)和/或化学合成方法制成燃料(例如生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)。一方面,所产生的糖被发酵,和/或不可发酵的产品被气化。
本发明的方法也包括使用本发明的酶,转化藻类、植物油、例如粗植物油或废植物油、动物脂肪和动物脂(例如牛脂、猪脂或黄油)或污水;以及通过发酵和/或化学合成方法将其制成燃料(例如生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)。
本发明的酶(包括例如产生并在某些方面分泌本发明的重组酶的生物,例如微生物,例如真菌、酵母或细菌)可用于或包括/并入任何生物质转化方法的任何阶段,例如在任意一步、几步或包括所有的步骤中,或所有下述生物质转化方法或者所有这些生物燃料可选方法:·直接燃烧:通过直接加热来燃烧材料,是最简单的生物质技术;如果生物质来源在附近,可以是非常经济的。·高温分解:在不存在氧气的情况下通过加热进行的生物质热降解。一方面,将生物质加热至温度为约800和1400华氏度之间,但不引入氧气以支持燃烧,导致产生气体、燃料油和木炭。·气化:通过加热或厌氧消化,生物质可用于产生甲烷。合成气,一氧化碳和氢的混合物,可衍生自生物质。·填埋气(LandfillGas):在垃圾填埋中通过掩埋垃圾的腐烂(厌氧消化)来产生。当有机废物分解时,它产生由约50%甲烷组成的气体,其是天然气的主要成分。·厌氧消化:将有机物质转化为甲烷——天然气的主要成分,和一氧化碳的混合物。一方面,生物质例如废水(污水)、肥料或食物加工废物,与水混合,并投料至不含空气的消化池。·发酵·醇发酵:通过将纤维质和/或淀粉转化成糖,将糖发酵成醇,然后通过蒸馏分离醇水混合物来产生燃料醇。原料,例如专用作物(例如小麦、大麦、马铃薯、柳枝稷、杨木),农业残留物和废物(例如水稻秸秆、玉米秸秆、小麦秸秆、甘蔗渣、水稻壳、玉米纤维、甜菜浆、柑桔浆和柑桔皮),林业废物(例如硬木和软木屑、木料操作中的硬木和软木残余物、木材刨花和锯屑),城市废物(例如城市固体废物的纸质部分、城市木材废物,和城市绿色废物),木材废物(例如锯木厂废物、纸浆厂废物、建筑废物、拆除废物、木材刨花和锯屑),以及废纸或其它包括糖、淀粉和/或纤维素的材料,可转化成蔗糖,然后用酵母发酵。可选地,包括蔗糖的材料可通过发酵直接转化为醇。·酯交换:将油转化为生物柴油的示例性反应称为酯交换。酯交换方法将醇(像甲醇)与植物油、动物脂肪或再生油脂中含有的甘油三酯油反应,形成脂肪酸烷基酯(生物柴油)和甘油。该反应要求加热和强碱催化剂,例如氢氧化钠或氢氧化钾。·生物柴油:生物柴油是由植物油、动物脂肪或再生油脂制造的脂肪酸烷基酯混合物。生物柴油可以它的纯的形式用作汽车燃料,但它通常用作石油柴油添加剂,以降低来自柴油动力汽车的微粒、一氧化碳、烃和空气有毒物的水平。·水解:包括水解化合物,例如生物质,例如木质纤维材料,使用本发明的酶催化。·共产生(Congeneration):是使用单一燃料和设备同时产生一种以上形式的能量。在一方面,生物质共产生具有比生物质单独产生更有潜力的生长,因为共产生的方式产生热和电二者。
一方面,本发明的多肽具有水解酶活性,例如磷脂酶、patatin和/或其它相关酶活性,用于从有机材料,例如生物质,例如衍生自植物和动物的组分——包括任何农业作物或其它可再生的原料、农业残留物或动物废料、城市和工业废物的有机成分、或建筑或拆除废物或碎片,或微生物,例如藻类或酵母——来产生燃料(例如生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)。
一方面,本发明的多肽用于将任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类的物质或木质纤维生物质——转化为燃料(例如生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油),或另外用于水解或消化生物材料的方法,以使它们能用作燃料(例如生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油),或用于使它更易于将生物质加工成燃料。
本发明的酶,包括酶的混合物或本发明的“混合物”(“cocktails”),也可用于甘油精炼。甘油副产品含有未反应的催化剂和肥皂,其被用酸中和。去除水和醇以产生50%至80%粗甘油。剩余的杂质包括未反应的脂肪和油,其用本发明的多肽处理。在本发明的大型生物柴油工厂中,甘油可进一步被纯化,例如至99%或更高的纯度,用于制药和化妆品工业。
使用本发明的多肽,例如本发明的酶的混合物或“混合物”(“cocktails”)制造的燃料(包括生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)可与燃料含氧化物一起使用,以改进燃烧特性。添加氧产生更完全的燃烧,其降低一氧化碳的排放。这是用生物燃料(例如,本发明的燃料)代替石油燃料的另一个环境优势。使用本发明的组合物和/或方法制造的生物燃料可与汽油混合以形成E10混合物(约5%至10%乙醇和约90%至95%汽油),但它可以以更高的浓度使用,例如E85或以其纯的形式。用本发明的组合物和/或方法制造的生物燃料可与石油柴油混合以形成B20混合物(20%生物柴油和80%石油柴油),尽管其它混合水平可被使用,直至B100(完全生物柴油)。
本发明也提供从包括任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类的生物质或木质纤维生物质——的组合物制造生物燃料(包括生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)的方法。生物质材料可从农业作物,作为食物或饲料生产的副产品,或作为木质纤维废物产品,例如植物残留物、废纸或建筑和/或拆除废物或碎片来获得。用于使用本发明的多肽处理的适合的植物来源或植物残留物的例子包括海藻、藻类、谷物、种子、茎、叶、皮、外壳、玉米芯、玉米秸秆、麦秆、干草(例如印度草,如印度草(Sorghastrumnutans);或柳枝稷,例如稷(Panicum)种,例如柳枝稷(Panicumvirgatum))及类似物,以及木材、木片、木浆和锯屑。适合于使用本发明的多肽处理的纸质废料的例子包括废弃的影印纸、计算机打印纸、笔记本纸、记事本纸、打字机纸及类似物、以及报纸、杂志、纸板和基于纸的包装材料。建筑和/或拆除废物和碎片的例子包括木材、木材废料、木材刨花和锯屑。
在一个实施方式中,酶——包括本发明的酶的混合物或“混合物”(“cocktails”)——和本发明的方法可与更“传统”的从生物质制造乙醇、甲醇、丙醇、丁醇、丙醇和/或柴油的方法结合,例如包括通过在反应器中将干燥的任何生物质,例如动物、藻类和/或植物生物质,其包括包含脂类的生物质或木质纤维生物质材料,施用至包括催化剂的强酸和金属盐的稀溶液,来水解脂类和/或木质纤维材料的方法;这可以降低纤维素水解的活化能或温度,以获得更高的糖产量;参见例如美国专利号6,660,506和6,423,145。
与本发明的酶——包括酶的混合物或本发明的“混合物”(“cocktais”)——结合使用的另一个示例性方法包括在水介质中,在选定的主要用于实现半纤维素解聚,而不主要用于实现纤维素解聚为葡萄糖的温度和压力下,通过将材料进行第一阶段水解步骤,水解任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类的生物质或木质纤维生物质,其含有半纤维素、纤维素和木质素,或任何其它可由本发明的酶水解的多糖。该步骤产生浆状物,其中含水液相含有从半纤维素解聚得到的溶解的单糖,而固相含有纤维素和木质素。第二阶段水解步骤可以包括使得至少大部分纤维素被解聚的条件,该步骤产生含有溶解的/可溶的纤维素解聚产物的含水液相。参见例如美国专利5,536,325。本发明的酶(包括本发明的混合物或酶的“混合物”(“cocktais”))可以在该示例性方法中的任何阶段加入。
与本发明的酶——包括酶的混合物或本发明的“混合物”(“cocktais”)——结合使用的另一个示例性方法包括:通过一个或多个用大约0.4%至2%强酸进行稀释酸水解的阶段来处理任何生物质,例如动物、藻类和/或植物生物质,其包括包含脂类的生物质或木质纤维生物质材料;以及通过碱法去木质作用来处理酸水解的生物质材料的未反应的固体木质纤维素成分,以产生可生物降解的热塑塑料和衍生产品的前体。参见,例如美国专利6,409,841。本发明的酶可以在该示例性方法的任何阶段加入。
与本发明的酶——包括酶的混合物或本发明的“混合物”(“cocktais”)——结合使用的另一个示例性方法包括:在预水解反应器中预水解任何生物质,例如动物、藻类和/或植物生物质,其包括包含脂类的生物质或木质纤维生物质材料;向该固体材料(例如,木质纤维材料)加入酸性液体,制备混合物;将该混合物加热至反应温度;维持反应温度足够的时间,以将木质纤维素材料分馏成含有至少大约20%的来自木质纤维素材料的木质素的溶解部分以及含有纤维素的固体部分;当处于或接近其中固体部分中的纤维素变得更易于进行酶促消化的反应温度时,从固体部分除去溶解部分;以及回收溶解部分。参见,例如美国专利5,705,369。本发明的酶可以在该示例性方法的任何阶段加入。
本发明提供了制备基于液体烃的发动机燃料组合物(例如,用于火花点火发动机)的方法,所述液体烃掺混有利用本发明的酶或方法制备的燃料级醇。一方面,利用本发明的酶生产的燃料包括,例如液体煤气或液体天然气-乙醇混合物。一方面,共溶剂是生物质衍生的2-甲基四氢呋喃(MTHF)。参见例如美国专利6,712,866。
一方面,用于任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类的生物质或木质纤维生物质——的酶促降解的本发明方法,例如,用于从任何有机材料生产生物燃料(包括生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)的方法,还可以包括生物质材料的超声处理;参见,例如,美国专利6,333,181。
另一方面,本发明用于从纤维素底物生产生物燃料(包括生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)的方法包括提供浆体形式的反应混合物,其包含纤维素底物、本发明的酶和发酵试剂(如,在反应容器内,例如半连续固体送料生物反应器),以及该反应混合物在足以起始并维持发酵反应的条件下反应(如美国专利申请号20060014260中所述)。一方面,实验或理论计算可以确定最优的给料频率。一方面,额外量的纤维素底物和酶根据优化的送料频率的间隔被送进反应容器。
本发明制备生物燃料(包括生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)的一个示例性方法在美国专利申请公开号20050069998、20020164730中描述;并且一方面,包括以下步骤:研磨任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类的生物质或木质纤维生物质材料(如,到15-30mm的大小),使获得的产物在反应器中经历蒸汽爆碎(steamexplosion)预处理(如,在190-230℃的温度)1到10分钟;在气旋中收集预处理的材料或相关产物;以及通过在压力过滤机(filterpress)中过滤分离液态和固态馏分,向发酵沉积物引入固态馏分并加入一种或多种本发明的酶,如纤维素酶和/或β-葡萄糖苷酶(如溶解在柠檬酸缓冲液pH4.8中)。
使用本发明的酶生产本发明的生物燃料(包括生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)——其包括生物乙醇、生物甲醇、生物丁醇或生物丙醇——的另一个示例性的方法包括:预处理起始材料,起始材料包括任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类或至少包含半纤维素和纤维素的木质纤维素生物质原料。一方面,起始材料包括马铃薯、大豆(油菜籽)、大麦、黑麦、玉米、燕麦、小麦、甜菜或甘蔗或成分或废物或食品或饲料生产副产物。起始材料(“原料”)在破坏植物纤维结构的条件下发生反应,以实现半纤维素和纤维素的至少部分水解。破坏性条件可以包括,例如使起始材料在pH0.5至2.5下经受180℃至270℃的平均温度大约5秒至60分钟的时间;或,在pH0.5至2.5下经受220℃至270℃的温度大约5秒至120秒的时间,或同等条件。这产生可利用性增加的原料,该原料有待酶例如本发明的纤维素酶消化。美国专利6,090,595。
使用本发明的酶水解任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类的生物质或木质纤维生物质材料——的示例性条件包括在约30℃到48℃之间的温度和/或在约pH4.0到6.0之间的pH条件下反应。其它示例性条件包括在约30℃到60℃之间的温度和在约4.0到8.0之间的pH。
本发明的葡聚糖酶(或纤维素酶)、甘露聚糖酶、木聚糖酶、淀粉酶、黄原胶酶和/或糖苷酶,例如纤维二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶可用于生物质至燃料的转化以及乙醇的生产中,例如,如PCT申请号WO0043496和WO8100857所述。本发明的葡聚糖酶(或纤维素酶)、甘露聚糖酶、木聚糖酶、淀粉酶、黄原胶酶和/或糖苷酶,例如纤维二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶可用于产生可发酵的糖和含有葡聚糖的生物质,其可被转化为燃料乙醇。生物柴油-使用本发明的酶制造它们
本发明提供包含本发明的酶的组合物,以及用于制造生物柴油燃料的方法,所述生物柴油燃料包含任何生物燃料,例如包括从植物油和/或动物脂肪的酯交换制得的烷基酯的生物柴油。
例如,在可选的方面,本发明的多肽,包括酶的混合物或本发明的“混合物”(“cocktails”),用于酯交换方法的处理,其中将醇(像乙醇、丙醇、丁醇、丙醇、甲醇)与植物油、动物脂肪或再生油脂中含有的甘油三酯油反应,形成包括生物柴油的脂肪酸烷基酯和甘油。一方面,生物柴油由大豆油或再生食用油制造。动物脂肪、其它植物油和其它再生油也可用于(以及由本发明的酶,例如磷脂酶处理的)产生生物柴油,其取决于它们的成本和可用性。另一方面,使用本发明的酶,所有种类的脂肪和油的掺合物用于产生本发明的生物柴油燃料。
本发明提供包括本发明的酶的组合物,以及用于处理“黄油”(“yellowgrease”)的方法,术语“黄油”最初在炼油工业中提出。可使用本发明的组合物和方法处理的黄油包括来自煎炸用油的动物脂(grease),例如来自深炸锅(deepfryer)或饭店隔油器(restaurants′greasetrap)的动物脂、或来自各种(例如较低质量)级别的炼动物油油厂(renderingplant)的牛油(tallow)的动物脂。因此,本发明也提供油、动物脂、煎炸油、植物油、餐馆废油,以及处理包括至少一种本发明的酶的牛油等级。
使用包括酶的本发明组合物和本发明的方法处理的黄油可用于喷洒在路面,例如用于尘土控制,或者用于动物饲料添加剂或饲料或食品补充剂。
另一方面,包括酶的本发明的组合物和本发明的方法可用于处理脂类,例如动物脂,例如餐馆废油,以制造生物燃料,例如生物柴油燃料,例如用于汽车、公共汽车、卡车或船只。一方面,使用本发明的组合物或方法制造的生物柴油可从任何可再生的植物来源,例如大豆和/或从动物脂,例如“黄油”生产。
包括酶的本发明的组合物和本发明的方法可用于处理“SVO”或“直链植物油”,其包括可为柴油发动机提供燃料的任何植物油,例如,其中所述处理包括在例如用于低温的燃料中进行的脂类酯交换。
包括酶的本发明的组合物和本发明的方法可用于处理“WVO”或废植物油,以制造例如黄油,其包括来自餐馆的动物脂。一方面,该动物脂必须被过滤以去除食物颗粒。用包括酶的本发明的组合物和本发明的方法处理的黄油可落入SVO/WVO的范畴,其包括任何动物脂,例如餐馆废动物脂,其可含有牛油和其它动物产物。谷物干酒糟加工
另一方面,本发明的酶(例如磷脂酶)可用于处理/加工“可溶性干酒糟(DDS)”、“谷物干酒糟(DDS)”、“可溶性浓缩酒糟(CDS)”、“谷物湿酒糟(DWG)”或“含可溶物的谷物干酒糟(DDGS)”;谷物干酒糟可以是蒸馏方法的谷物副产品,并且可包含可溶物。这些方法可包括干磨植物副产品,例如用于饲料应用,例如用于家禽、牛、猪和其它家养动物。因此,本发明的酶可用于处理/加工谷物,例如,谷类,其是任何蒸馏方法的副产品,包括使用任何谷物来源的方法,例如来自酿酒厂的传统来源,或可选地,来自乙醇生产厂家(工厂、作坊等等)。本发明的酶可用于处理/加工来自造酒厂的干醪;然后,这种醪可以用于各种目的,例如,作为家畜特别是反刍动物的饲料;因此本发明提供加工家畜诸如反刍动物的饲料的方法,以及包括本发明的肌醇六磷酸酶的酶加工饲料。
本发明的酶可单独使用或与其它酶一起加工“可溶性干酒糟(DDS)”、“谷物干酒糟(DDS)”、“可溶性浓缩酒糟(CDS)”、“谷物湿酒糟(DWG)”或“含可溶物的谷物干酒糟(DDGS)”。例如,本发明的酶可用于图37所述的醇生产方法的任何步骤。本发明的酶可用于提高在任何生物燃料或潜在的生物燃料中磷的生物利用度,包括在“可溶性干酒糟(DDS)”、“谷物干酒糟(DDS)”、“可溶性浓缩酒糟(CDS)”、“谷物湿酒糟(DWG)”或“含可溶物的谷物干酒糟(DDGS)”中发现的磷(参见C.MartinezAmezcua,2004PoultryScience83:971-976)。酒精(spirit)或可饮用醇生产
本发明的本发明的酶也可用于加工谷物干酒糟用于醇生产——如在“酒精”(“spirits”)中的醇,例如啤酒或威士忌生产(除了用于加工生物质来制造生物燃料)。本发明的本发明的酶也可用于乙醇工厂,例如用于加工谷物,例如玉米。谷物干酒糟可首先通过碾磨谷物(例如玉米)以得到粗糙度一致性,并添加热水而制备。冷却后,加入酵母并且该混合物发酵几天至一周。发酵后剩余的固体是谷物酒糟。本发明的本发明的肌醇六磷酸酶可用于该方法的任何步骤。制剂
本发明提供包括本发明酶的新的制剂,以及用于本发明磷脂酶的制剂,其包括含有本发明新型酶的制剂。本发明的酶可单独使用或配制或作为本发明的磷脂酶,或其它磷脂酶,或其它酶例如木聚糖酶、纤维素酶、蛋白酶、脂酶、淀粉酶、或氧化还原酶如漆酶、过氧化物酶、过氧化氢酶、氧化酶或还原酶的混合物来使用或配制。它们可以用于配制成固体形式如粉末、冻干制剂、颗粒、片剂、条、晶体、胶囊、丸剂、小粒,或液体形式如水溶液、气溶胶、凝胶、糊、浆、水/油乳状液、乳剂、胶囊,或小泡或胶束悬浮液。本发明的制剂可以包括任何下述组分或它们的组合:多元醇如聚乙二醇、聚乙烯醇、丙三醇,糖类如蔗糖、山梨醇、海藻糖、葡萄糖、果糖、麦芽糖、甘露糖;胶凝剂如瓜尔胶、鹿角菜胶、藻酸盐、葡聚糖、纤维素衍生物、果胶;盐如氯化钠、硫酸钠、硫酸铵、氯化钙、氯化镁、氯化锌、硫酸锌、脂肪酸及其衍生物的盐;金属螯合剂如EDTA、EGTA、柠檬酸钠;抗微生物剂如脂肪酸或脂肪酸衍生物、对羟基苯甲酸酯、山梨酸酯、甲苯酸盐;阻碍蛋白酶作用的其它调节化合物如蛋白酶、大体积蛋白质(bulkprotein)诸如BSA、小麦水解产物、硼酸盐化合物、氨基酸或肽、合适的pH或温度调节化合物;乳化剂如非离子型和/或离子型洗涤剂;氧化还原剂如胱氨酸/半胱氨酸、谷胱甘肽、氧化型谷胱甘肽、还原型谷胱甘肽、或抗氧化化合物如抗坏血酸以及分散剂。
交联和蛋白质修饰作用,例如聚乙二醇化、脂肪酸修饰和糖基化也可用于提高酶稳定性。本发明磷脂酶的其它用途
本发明的磷脂酶也可以用于研究磷酸肌醇(PI)信号传导系统;双极性紊乱的诊断、预后和治疗开发(参见如,Pandey(2002)Neuropsychopharmacology26:216-228);作为抗氧化剂;作为修饰的磷脂;作为发泡剂和凝胶剂;产生用于血管形成组织的血管生成素脂类;鉴定磷脂酶,如PLA、PLB、PLC、PLD和/或patatin的调节剂(激动剂或者拮抗剂),如作为抑制剂,用作抗-瘤剂、消炎剂以及作为止痛剂。它们可以用于产生酸性磷脂,用于控制食品和药物中的苦味。它们可以用于脂肪纯化。它们可以用于鉴定治疗病毒性、炎症性、过敏性和心血管疾病的肽抑制剂。它们可以用于制备疫苗。它们可以用于制备多不饱和脂肪酸甘油酯和磷脂酰甘油。
本发明的磷脂酶,例如PLA和PLC酶,用于产生免疫毒素和各种用于抗-肿瘤治疗的治疗剂。
本发明磷脂酶可以与其它用于脱色(即去除叶绿素)的酶和洗涤剂(参见上文)联合使用,如,与其它的酶(如脂酶、蛋白酶、酯酶、磷酸酶)联合使用。例如,在应用PLC的任何情况中,可以组合应用PLD和磷酸酶,以便产生与PLC单独使用相同的结果。
下表概述了本发明的若干示例性方法和制剂:本发明的示例性方法目的PLC油脱胶中的化学品使用不用酸消除化学品不用碱消除化学品酸和碱的使用范围(不过量)化学品减少/脱胶方法可选择的实施方式其它类型的酸和碱脱胶方法可选择的实施方式水在PLC油脱胶中的影响硅胶的使用替代水洗步骤水干燥剂的使用消除最终产品中的水碱处理期间较低含量水的影响消除最终产品中的水最低水含量(<5%)消除最终产品中的水最大水含量(>5%)可选方法PLC脱胶的湿度图脱胶方法可选择的实施方式对于PLC脱胶,油依赖于水含量脱胶方法可选择的实施方式原位去除游离脂肪酸,FFA加入FFA螯合剂脱胶方法可选择的实施方式;改善来自腐烂豆的油中的状况混合方案对PLC油脱胶的影响具有最小混合的PLC脱胶保护酶不受混合诱导变性的破坏,节约能量先剪切混合,再搅拌混合进行PLC脱胶脱胶方法可选择的实施方式加入化学品的顺序加入顺序:酶-水,然后酸,然后碱在暴露于酸或碱之前使PLC发挥功效,导致潜在的pH或金属螯合PLC失活针对温度和时间,PLC油脱胶方法可选择的实施方式酶处理步骤(时间):<60min,优选<30min脱胶方法可选择的实施方式酶处理步骤(温度):50-70℃,可能脱胶方法可选择的实施方式<50℃(例如室温)PLC油脱胶的益处产生具有最小的PL含量和丰富的脱胶方法可选择的实施方式水溶性磷酸酯的皂脚通过使用PLC,胶中中性油减少脱胶方法可选择的实施方式植物油中DAG(例如1,3-DAG)产生增加脱胶方法可选择的实施方式的方法使用增加的DAG植物油和其它对健康有益示例性的产物益处处的油的益处研究在油中不留下PLC活性的脱胶方法脱胶方法可选择的实施方式/控制型提高研究在油中不留下可检测PLC蛋白的脱胶方脱胶方法可选择的实施方式/控制型法提高使用酶从卵磷脂胶物质产生DAG示例性产物益处PLC用于专用油(富集的PA、PI)示例性产物益处使用PA/PI特异性酶(例如596ES2/PI特异性脱胶方法可选择的实施方式的)使用PA/PI特异性酶(例如596ES2/PI特异性脱胶方法可选择的实施方式的)+PC/PE特异性酶;加入顺序的影响分批或连续方法脱胶方法可选择的实施方式使用重悬浮的PLC处理的胶,用于进一步的脱胶方法可选择的实施方式油脱胶操作胶中DAG、FFA、P、金属、中性油的质量脱胶方法可选择的实施方式平衡多种方法在提取之前,将PLC加入到剥落的油种子仁方法可选择的实施方式小规模脱胶分析脱胶方法可选择的实施方式使用其它酶来减少胶质量(例如脱胶方法可选择的实施方式PYROLASETM酶、叶绿素酶、过氧化物酶、脂酶、漆酶、甘露聚糖酶、蛋白酶、乳糖酶、淀粉酶等,或其组合)使用化合物以更好地帮助油/胶分离脱胶方法可选择的实施方式硬化PLC处理油中的胶脱胶方法可选择的实施方式糖基化的/去糖基化的磷脂酶变体脱胶方法可选择的实施方式本发明示例性的制剂目的用于稳定的示例性液体制剂使用化合物以增加不同pH和温度范围中的稳定酶以获得最大的DAG产量,可PLC的稳定性(多元醇、盐、金属...)。能改变底物特异性,或引导产物形成1,3-DAG类型。对PLC使用疏水型传递系统(脂质体,在精稳定酶以获得最大的DAG产量,可炼的油滴中水合的酶)能改变底物特异性,或引导产物形成1,3-DAG类型。用于稳定的固体制剂使用不同的PLC、磷脂酶载体系统(固定化稳定酶,并使得在脱胶之后容易从树脂、多孔物质、凝胶、颗粒、粉末、片剂、或油或胶相分离酶;酶制剂的可再囊/胶束、胶囊、结构性液体等)来稳定磷脂利用性;油方法期间物理分离酶相;酶和辅酶。由PLC攻击PI/PA。使用脱胶废物(胶组分、种子壳)用于PLC减少制剂组分的成本,酶与油更好制剂的可混和性,酶的热稳定促进活性的示例性制剂和方法使用化学品或酶帮助酶更好地分散在油中更快的反应时间/脱胶方法/化学品(例如发泡基质等)利用率减少再次使用胶/酶,以进一步进行脱胶反应酶的可再利用性使用增加分聚的制剂或捕获PL进行水解的更快的反应时间/脱胶方法/化学品酶利用率减少使用多种制剂以适应具有不同PL特异性的方法的多功能性;不同的酶可能需酶要不同的制剂或可以在方法的不同阶段加入使用多种酶制剂以防止在制备具有不同底物在多酶形式的实施方式中,保护特异性的另一PLC中某组分使一种PLC失活PLC活性使用多种酶制剂以防止在制备另一酶(水解在多酶形式的实施方式中,保护酶、氧化酶)中某组分使一种PLC失活PLC活性间歇性加入碱,如在时间释放型碱加入制剂保护酶免遭混合诱导变性,节省能中量通过糖基化失活和调节酶活性
本发明提供这样的方法,包括使用重组技术制备和表达具有生物活性的酶或其它蛋白,例如有害的或有毒的酶(其中酶或其它蛋白未正常糖基化),它们是无活性或活性较低,但是可再激活形式的。该方法包括将一种或多种糖基化位点(例如N-连接的或O-连接的糖基化作用)加入到具有生物活性的酶或其它蛋白(例如本发明的酶)中,这是通过下述步骤进行的:对编码序列进行工程化以整合入新的糖基化位点(许多位点);在真核细胞或工程化的等同物中或在能够进行翻译后糖基化的体外系统中表达变体编码序列。例如,3个氨基酸序列NXS/T是真核细胞中的糖基化位点,而原核细胞不是这样的。因此,本发明包括将至少3个氨基酸序列NXS/T加入到蛋白中,以便它的活性因翻译后糖基化的缘故而减少或失活。
糖基化可以产生加入到N残基的2个N-乙酰葡萄糖胺(NGlucNac)分子。随后的加入可以是生物特异性的。在大部分的种中,然后将甘露糖(Mann)加入到NGlucNa上,Mann残基的数目在10至100范围内。硅酸也可以加入到一些种中。在毕赤酵母中,加入NGlucNac,可以加入10至25的Mann残基。
这些方法包括使用任何去糖基化酶或一组酶,它们中的许多酶已被鉴定和/或可以通过商业渠道获得。例如,内切糖苷酶H在最后一个NGlucNac处切割,留下一个NGlucNac依然连接在N残基上。PNGaseF酶切割掉所有糖,并将N残基的氨基酸链转化成羟基,从而使N氨基酸变成酶中的天冬氨酸(D)氨基酸。因此,该方法包括体内或体外使用内切糖苷酶H和/或PNGaseF或等价的酶,从而部分或完全再激活工程化的“临时失活的”蛋白。
该方法包括将酶或其它多肽靶向宿主分泌通道,以便酶被糖基化。设计新的糖基化位点,以便糖基化作用使酶失活,或修饰它的活性,例如减少它的活性,或者另外修饰活性,诸如阻抑底物结合位点。因为酶或是失活的或活性较小,由于这些酶活性的负面影响不再限制蛋白可以在宿主细胞中积聚的数量,所以有害的或有毒的酶可以以较高水平表达。通过除去糖,例如使用商业上可获得的去糖基化酶,例如通过使用全细胞工程化方法体外除去糖或体内除去糖,失活的、糖基化的酶可以被重新激活(部分或完全)。
一方面,将真核糖基化靶位点诸如NXS/T加入到任何蛋白,例如本发明的酶。这使本领域技术人员能够将糖基化位点加入到感兴趣的蛋白,并期望当通过在真核宿主细胞中表达那个蛋白并将该蛋白靶向宿主细胞的分泌通道使得那个蛋白糖基化时,将那个蛋白转化为临时失活的蛋白。
因此,本发明提供了产生在正常情况下数量巨大时因害处或毒性太大而不能被宿主细胞忍受的酶的方法。该结果可以是临时性的,因为它可以重新产生活性酶(通过去糖基化作用,例如通过翻译后修饰/去糖基化作用),用于需要活性酶的进一步的工作。
一方面,本发明提供了制备和表达具有生物活性的蛋白的方法,该蛋白的活性通过糖基化作用而临时失活,该方法包括:(a)提供编码具有生物活性的蛋白的核酸,其中所述蛋白不是天然糖基化的;(b)将至少一个糖基化基序编码序列插入编码蛋白的核酸中,其中所述糖基化形式的蛋白是无活性的;(c)将靶向序列插入蛋白,这样该蛋白被导向宿主细胞的分泌通道,其中所述宿主细胞能够识别糖基化基序并糖基化蛋白;和(d)在宿主细胞中表达修饰的核酸。一方面,该方法进一步包括对表达的蛋白去糖基化,从而再次激活蛋白,例如酶,诸如本发明的酶的活性。一方面,宿主细胞是真核细胞。一方面,通过去糖基化作用,或者化学方法或者酶法方法,体外再次激活无活性的表达的重组蛋白。
对放置一个或多个糖基化基序以临时失活蛋白的测定,仅仅涉及制备变体蛋白编码核酸的常规方法,例如通过GSSM,和常规筛选方案,例如活性或结合分析方法。
因为糖基化作用的缘故,使活性对宿主细胞有害的酶失活。因为它是无活性的,它可以以相当高的水平在真核宿主细胞中积聚。因为它不再具有活性,它不再能够发挥其负面作用。有毒的酶的失活作用是临时性的,这是因为使用EndoH或PNGaseF对酶进行去糖基化作用能完全恢复酶的正常活性。积聚在培养基中大量糖基化的、失活的酶表明,宿主细胞完全耐受无活性形式的酶。
本发明参照以下的实施例来进一步说明;然而,应当理解地是,本发明并不限于这些实施例。实施例 实施例1:用于序列同一性作图的BLAST程序
本实施例描述了示例性的序列同一性程序,用以确定核酸是否在本发明的范围内。应用NCBIBLAST2.2.2程序,默认选择为blastp。除了默认过滤设置外,应用所有默认值(即,除了过滤设置为OFF(关)外,所有参数设置为默认);在该位置应用“-FF”设置,其使得不能进行过滤。由于序列长度短,应用默认过滤常常导致Karlin-Altschul歪曲(violation)。用于本实施例的默认值为:“低复杂度过滤(Filterforlowcomplexity):开(ON)>字长(WordSize):3>矩阵(Matrix):Blosum62>空位成本(GapCosts):存在(Existence):11>延伸(Extension):1”
其它的默认设置为:低复杂度过滤关闭(OFF),对于蛋白字长为3,BLOSUM62矩阵,空位存在罚分-11和空位延伸罚分-1。“-W”选项设定为默认值0。这意味着,如果不设定,字长默认值对于蛋白为3,对于核苷酸为11。设置读作:<<README.bls.txt>>>--------------------------------------------------------------------------------->blastallarguments(变元):>>-pProgramName(程序名称)[String(串)]>-dDatabase(数据库)[String(串)]>default(默认值)=nr>-iQueryFile(查询文件)[FileIn(编入)]>default(默认值)=stdin>-eExpectationvalue(期望值)(E)[Real(真实)]>default(默认值)=10.0>-malignmentviewoptions(比对视角选项):>0=pairwise(成对),>1=query-anchoredshowingidentities(查询-锚定显示同一性),>2=query-anchorednoidentities(查询-锚定无同一性),>3=flatquery-anchored,showidentities(平面查询-锚定,显示同一性),>4=flatquery-anchored,noidentities(平面查询-锚定,无同一性),>5=query-anchorednoidentitiesandbluntends(查询-锚定无同一性和平末端),>6=flatquery-anchored,noidentiliesandbluntends(平面查询-锚定,无同一性和平末端),>7=XMLBlastoutput(输出),>8=tabular(列表),>9tabularwithcommentlines(具有注解行的列表)[Integer(整数)]>default(默认值)=0>-oBLASTreportOutoutFile(报告输出文件)[FileOut(输出)]Optional(任选的)>default(默认值)=stdout>-FFilterquerysequence(过滤查询序列)(DUSTwithblastn,SEGwithothers(用blastn的DUST,用其它的SEG))[String(串)]>default(默认值)=T>-GCosttoopenagap(开放空位的成本)(zeroinvokesdefaultbehavior(零调用默认行为))[Integer(整数)]>default(默认值)=0>-ECosttoextendagap(延伸空位的成本)(zeroinvokesdefaultbehavior(零调用默认行为))[Integer(整数)]>default(默认值)=0>-XXdropoffvalueforgappedalignment(空位比对X离开值)(inbits(字节))(zeroinvokesdefault(零调用默认)>behavior(行为))[Integer(整数)]>default(默认值)=0>-IShowGI′sindeflines[T/F]>default(默认值)=F>-qPenaltyforanucleotidemismatch(核苷酸错配罚分)(blastnonly(仅blastn))[Integer(整数)]>default(默认值)=-3>-rRewardforanucleotidematch(核苷酸匹配得分)(blastuonly(仅blastn))[Integer(整数)]>default(默认值)=1>-vNumberofdatabasesequencestoshowone-linedescriptionsfor(V)(对(V)显示在线描述的数据库序列数目)>[Integer(整数)]>default(默认值)=500>-bNumberofdatabasesequencetoshowalignmentsfor(B)(对(B)显示比对的数据库序列数目)[Integer(整数)]>default(默认值)=250>-fThresholdforextendinghits,defaultifzero(延伸命中的阈值,如果是零为默认值)[Intege(整数)]>default(默认值)=0>-gPerformgappedalignment(进行空位比对)(notavailablewithtblastx(对于tblastx不可用))[T/F]>default(默认值)=T>-QQueryGeneticcodetouse(查询遗传密码子以使用)[Integer(整数)]>default(默认值)=1>-DDBGeneticcode(遗传密码子)(fortblast[nx]only(仅对于tblast[nx]))[Integer(整数)]>default(默认值)=1>-aNumberofprocessorstouse(使用的处理器的数目)[Integer(整数)]>default(默认值)=1>-OSeqAlignfile(文件)[FileOut(输出)]Optional(任选的)>-JBelievethequerydefline[T/F]>default(默认值)=F>-MMatrix(矩阵)[String(串)]>default(默认值)=BLOSUM62>-WWordsize,defaultifzero(字长,如果是零为默认值)[Integer(整数)]>default(默认值)=0>-zEffectivelengthofthedatabase(数据库的有效长度)(usezerofortherealsize(对于真实大小使用零))>[String(串)]>default(默认值)=0>-KNumberofbesthitsfromaregiontokeep(区域最佳命中数目保持)(offbydefault,ifuseda>valueof100isrecommended(推荐使用值100))[Integer(整数)]>default(默认值)=0>-P0formultiplehits1-pass,1forsinglehit1-pass,2for2-pass(0,对于多次命中1-pass,1,对于单次命中1-pass,2,对于2-pass)>[Integer(整数)]>default(默认值)=0>-YEffectivelengthofthesearchspace(检索空间的有效长度)(usezerofortherealsize(对于真实大小使用零))>[Real(真实)]>default(默认值)=0>-SQuerystrandstosearchagainstdatabase(检索数据库的查询线)(forblast[nx],and(对于blast[nx]和)>tblastx).3isboth,1istop,2isbottom(3是两者,1是顶端,2是底端)[Integer(整数)]>default(默认值)=3>-TProduceHTMLoutput(产生HTML输出)[T/F]>default(默认值)=F>-1RestrictsearchofdatabasetolistofGI′s(限制数据库检索至GI′s清单)[String(串)]Optional(任选的)>-UUselowercasefilteringofFASTAsequence(使用FASTA序列的较低情况过滤)[T/F]Optional(任选的)>default(默认值)=F>-yDropoff(X)forblastextensionsinbits(blast延伸的离开(X),字节)(0.0invokesdefault(0.0调用默认行为)>behavior)[Real(真实)]>default(默认值)=0.0>-ZXdropoffvalueforfinalgappedalignment(最后空位比对的X离开值)(inbits(字节))[Integer(整数)]>default(默认值)=0>-RPSI-TBLASTNcheckpointfile(检查点文件)[FileIn(输入)]Optional(任选的)>nMegaBlastsearch(检索)[T/F]>default(默认值)=F>-LLocationonquerysequence(查询序列的位置)[String(串)]Optional(任选的)>-AMultipleHitswindowsize(多命中窗口大小)(zeroforsinglehitalgorithm(对于单命中算法为零))[Integer(整数)]>default(默认值)=40实施例2:PLC介导的脱胶的模拟
该实施例描述了磷脂酶C(PLC)介导脱胶的模拟。
由于在水中溶解性差,首先将磷脂酰胆碱(PC)溶解于乙醇中(100mg/ml)。对于初步测试,制备了PC的储备溶液,是在pH6的50mM的3-吗啉基丙磺酸或60mM柠檬酸/NaOH中。将PC储液(10μl,1μg/μl)加入到Eppendorf管中的500μl精炼的大豆油(含2%的水)中。为了产生乳状液,将管中的内容物通过涡流振荡混合3分钟(参见图5A)。油和水相通过在13,000rpm离心1分钟来分离(图5B)。反应管在期望的温度下(37℃、50℃或60℃)进行预温育,并且加入3μl来自蜡状芽孢杆菌(Bacilluscereus)的PLC(0.9U/μl)至水相(图5C)。通过用氯仿/甲醇/水(65∶25∶4)作为溶剂系统的TLC分析PC的消失(参见如Taguchi(1975),见上文),并且在暴露于I2蒸汽后被观察到。
图5示意性地说明了用于模拟PLC-介导的脱胶的两相系统模型。图5A:通过混合粗制油与2%的水来水合污染的磷脂(P),产生乳状液。图5B:离心后分离水相和油相,并将PLC加入到水相中,其含有沉淀的磷脂(“胶”)。在水相中发生PLC水解。图5C:通过从水相中抽取等分试样并用TLC对它们进行分析,监控反应的时间进程。实施例3:磷脂酶的表达
该实施例描述了构建可以表达多种磷脂酶(包括本发明的酶)的本发明的商业生产菌株。为了产生适合用于对食品级植物油(包括大豆、油菜和向日葵)脱胶的多酶制剂,可以产生在同一表达宿主中表达两种不同磷脂酶序列的重组表达菌株。例如,可以构建该菌株以含有一个或多个拷贝的PLC基因,和一个或多个拷贝的磷脂酰肌醇-PLC基因。这些基因可以存在于一个质粒、多个质粒上,或者这些基因可以通过同源重组被插入到表达宿主的基因组中。当基因通过同源重组导入时,基因可以作为DNA表达盒导入宿主基因组中的单个位点中,所述表达盒含有一个或多个拷贝的两个基因。可选地,每个基因的一个或多个拷贝可以导入宿主染色体中的不同位点。这两个基因序列的表达可以由一种类型的启动子驱动,或者每一基因序列可以由独立的启动子驱动。根据每一基因的拷贝数和启动子的类型,最终的菌株将表达变化比例的每一活性酶类型。表达菌株可以用任何杆菌(例如蜡状芽孢杆菌)或链霉菌、大肠杆菌、粟酒裂殖酵母、巴斯德毕赤酵母或者其它革兰氏阴性、革兰氏阳性或酵母表达系统来构建。
一方面,本发明提供了对大豆油进行脱胶的双酶系统,其中至少一种酶是本发明的酶。PLC加上PI-PLC比单独使用其中一种酶产生更多的DAG。然而,两种酶都比无酶对照样品产生更多的DAG。一方面,反应条件包括1毫升大豆油、在任何添加之前油中~0.4%初始水分含量、50℃、用2.75MNaOH中和的0.2%柠檬酸、10UPLC、15μLPI-PLC(0.45mg总蛋白),1小时总反应时间。图12所示的表概述了从本发明的该双酶脱胶系统获得的数据。
另一方面,本发明的PI-PLC酶可以在与PLC中所述的相同条件下使用。这些条件包括植物油的化学精炼和植物油的水脱胶。实施例4:具有提高的表达和改变的蛋白酶抗性的磷脂酶
本发明提供了挑选磷脂酶C变体(突变体)的方法,该磷脂酶C在糖基化宿主中具有提高的表达并对分泌的蛋白酶具有改变的抗性。在糖基化宿主中提高的表达
潜在的天冬酰胺-连接的糖基化位点——其具有氨基酸共有序列:天冬酰胺-任何氨基酸-丝氨酸或苏氨酸(用单字母氨基酸代码表示为NXS/T),用诱变方法敲除,以便将糖基化识别基序中的天冬酰胺或丝氨酸或苏氨酸改变成不同的氨基酸,因此序列不再编码潜在的糖基化位点。糖基化位点的去除在如下所述位置实现:本发明的磷脂酶C的氨基酸位置氨基酸63、氨基酸131和氨基酸134,该磷脂酶C具有如SEQIDNO:175所述的序列,由SEQIDNO:178编码。当该蛋白在酵母:巴斯德毕赤酵母中异源表达时,其糖基化位点的消除提高这种变体-活性磷脂酶C的表达。这种减少或消除PLC酶中的潜在糖基化位点的策略可以提高活性PLC在任何糖基化宿主中的表达。因此,本发明提供了具有任何本发明的示例性磷脂酶的序列的磷脂酶(和编码它们的核酸),其中一个或多个或所有糖基化位点已被改变,如上所述。因此,本发明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方法,其中该方法包括修饰本发明的磷脂酶编码序列,以便一个或多个或所有N-连接糖基化位点编码基序被修饰成非糖基化基序。本发明也提供了由该方法制备的磷脂酶编码序列,和它们所编码的酶。改变的蛋白酶抗性
本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有增加的抗性的磷脂酶,该方法包括将等同于SEQIDNO:175的位置131上的氨基酸修改成下述一个、多个或所有残基:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);甲硫氨酸(M);亮氨酸(L)。本发明也提供了由该方法制备的序列所编码的分离的、合成的或重组的磷脂酶。本发明也提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具有减少的抗性的磷脂酶,该方法包括将等同于SEQIDNO:175的位置131上的氨基酸修改成下述的一个、多个或所有残基:色氨酸(W);谷氨酸(E);酪氨酸(Y)。本发明也提供了由该方法制备的序列所编码的分离的、合成的或重组的磷脂酶。
将含有天然分泌的巴斯德毕赤酵母蛋白酶的混合物的上清液与野生型和突变型PLC酶制剂混合并温育。终止反应,与无蛋白酶阴性对照相比,通过SDS-PAGE,显现降解。通过测量残留PLC活性也可以测定降解。通过观察发现了新奇现象,即某些敲除糖基化作用的突变显著改变该表达的磷脂酶在发酵期间对降解的敏感性。该方法的优势是在生产期间直接选择对宿主生物分泌的蛋白酶具有增加的或减少的抗性的突变体。
本发明的这种方法可以使用定点诱变(例如GSSM)来改变本发明的磷脂酶C的氨基酸序列,例如如下所示,SEQIDNO:2(SEQIDNO:175)的酶活性子序列。用加粗和下划线标出的每一氨基酸(下面)由天冬酰胺(单字母代码N)改变为天冬氨酸(D)、丝氨酸(S)或另一氨基酸,如下所述。这些氨基酸被命名为下面序列中的氨基酸63、氨基酸131和氨基酸134,其中色氨酸(W)命名为氨基酸1。通过减少在巴斯德毕赤酵母表达系统中表达的蛋白的糖基化作用来进行这些突变,以增加活性磷脂酶C蛋白的表达水平。这些相同的突变可以增加本发明的任何活性磷脂酶C在任何其它表达系统中的表达水平,所述表达系统根据NXS/T系统对天冬酰胺进行糖基化(N-连接的糖基化),其中N是天冬酰胺,X是任何氨基酸,S/T是丝氨酸或苏氨酸。因此,本发明也提供了通过改变位置131处的氨基酸来改变表达的磷脂酶C的敏感性的方法。
SEQIDNO:2的氨基酸1-37是前导序列,其在毕赤酵母中表达期间被去 除或者当在大肠杆菌中表达时用蛋白酶去除。SEQIDNO:2的氨基酸38-286,其中并 入三个修饰(N63D、N131S、N134D),是SEQIDNO:175:注意:为了计算变化的位置,将第一个氨基酸(W)计为位置1。WSAEDKHNEGINSHLWIVNRAIDIMSRNTTIVNPNETALLNEWRADLENGIYSADYENPYYDDSTYASHFYDPDTGTTYIPFAKHAKETGAKYFNLAGQAYQNQDMQQAFFYLGLSLHYLGDVNQPMHAASFTDLSYPMGFHSKYENFVDTIKNNYIVSDSNGYWNWKGANPEDWIEGAAVAAKQDYPGVVNDTTKDWFVKAAVSQEYADKWRAEVTPVTGKRLMEAQRVTAGYIHLWFDTYVNR-
如下面所述,将表达的磷脂酶C变体在存在巴斯德毕赤酵母蛋白酶的情况下温育,获得以下结果:
在SEQIDNO:2的氨基酸位置131的以下氨基酸增加了表达的磷脂酶C对巴斯德毕赤酵母蛋白酶降解作用的抗性:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);甲硫氨酸(M);亮氨酸(L)。在SEQIDNO:2的氨基酸位置131的以下氨基酸减少了表达的磷脂酶C对巴斯德毕赤酵母蛋白酶降解作用的抗性:色氨酸(W);谷氨酸(E);酪氨酸(Y)。因此,本发明提供了变体磷脂酶,其具有任何其中之一或若干或所有这些修饰,这取决于是否需要增加或减少表达的磷脂酶C对蛋白酶降解作用的抗性。本发明提供了在等同于SEQIDNO:2的位置131上具有任何其中之一或若干或所有这些修饰的变体磷脂酶。该残基等同于SEQIDNO:2的位置131,并且对任何特定氨基酸残基的修饰是否可以增加或减少该酶对蛋白酶降解作用的抗性,可以通过本领域熟知的方案常规地和预测性地确定,例如用于评价磷脂酶C(SEQIDNO:2,由SEQIDNO:1编码)的蛋白酶敏感性的示例性分析方法,如下所述:缓冲液:ο1.0MMES,pH6.2ο0.7M醋酸钠(“NaAc”),pH5.2测试ο使用独立的1.5mL微量离心管ο向25μLPLC酶样品,加入5μLNaAc或7μLMES缓冲液,并混合ο加入25μL含蛋白酶的巴斯德毕赤酵母上清液,并混合ο加入2μL5%叠氮钠,并混合ο在加湿温育器中,将管置于盛有水的预热烧杯中的悬浮架上ο对照包括PLC+缓冲液+dH2O,和毕赤酵母SN+缓冲液+dH2Oο温育0-24小时,如果需要,在多个时间点取样。检测ο将样品按1∶2与含5mMEDTA的样品缓冲液混合,100℃加热4分钟,冷却,离心,混合,每泳道加载5μL样品,考马斯(Coomassie)染色,在SDS-PAGE上显现结果。ο也可以直接提取样品和时间点进行标准PLC活性分析。
结果:SDS-PAGE跑胶,结果显示在图17中;其显示了体外消化试验的结果,其中磷脂酶C变体在粗蛋白酶提取物中37℃温育最高达22小时。根据序列“DXD”(氨基酸位置63的天冬氨酸-氨基酸位置131的任何氨基酸-氨基酸位置134的天冬氨酸)的“X”位置发现的氨基酸,命名每一PLC突变体。这些凝胶显示了用粗蛋白酶温育后表达的PLC变体蛋白的稳定性或敏感性。稳定的变体在“-”(无蛋白酶反应的对照)和“+”(反应含有蛋白酶)中显示出具有相似染色强度的PLC带。与“-”泳道相比,在“=”泳道中,对蛋白酶更敏感的变体将显示出PLC蛋白带染色强度的减少。实施例5:获得稳定的高水平表达PLC的方法
本发明提供了在酵母培养物例如巴斯德毕赤酵母培养物中获得稳定的高水平表达和高比活性的磷脂酶例如PLC的发酵方法。由该方法生产的酶可以用于例如植物油精炼,诸如大豆油、油菜油、向日葵油或其它油。
本发明提供了生产方法,该方法包括这样的特征,即能够在酵母细胞培养物,例如巴斯德毕赤酵母,如在分批喂料培养物中以g/l水平,生产活性磷脂酶,例如PLC。在微生物培养物中活性PLC蛋白的异源表达仅以mg/l的水平在文献中偶有描述。此外,本发明的方法是基于这样的发现,在毕赤酵母培养物中PLC蛋白的表达削弱了对MeOH的吸收能力,但是无其它研究过的生理生长特征。与毕赤酵母培养物中常规的异源蛋白表达相反,需要高的共-喂料速率(highco-feedrates)(葡萄糖/或甘油)。除提高酶的生产特征外,较高的共-喂料速率也消除了普通蛋白酶活性的表达,该蛋白酶活性与PLC降解相关。此外,通过在具有Mut+表型的毕赤酵母菌株中产生PLC而不损害与Mut+表型相关的可测量测试(并且因此,不以工业级使用),可以克服较差的MeOH利用率特征,从而进一步提高生产特征。因此,相比于通常用于工业规模的毕赤酵母系统的条件,本发明的该方法将活性PLC的生产率提高>50-倍(从使用常规方法的100U/ml提高至>5000U/ml全肉汤;>5g/l蛋白)。此外,因为PLC是需要结合锌以获得正确的折叠和活性的金属酶,一方面,本发明包括补充锌。对本发明的培养物而言,该锌补充策略使得PLC活性如同全肉汤中一样,几乎完全稳定(<5%的活性丧失),例如在4℃下,>5天。这明显有助于回收方法,因为1)不稳定蛋白活性的产生在回收方法期间继续恶化,和2)其赋予了更大的加工灵活性,特别是在大规模水平。色氨酰基氨肽酶微量培养板分析
本发明提供了色氨酰基氨肽酶微量培养板分析方法,其被开发用于测定毕赤酵母发酵各时间点样品中的相对色氨酰基氨肽酶活性。该分析的通量能力足以满足从大量发酵反应中的多个时间点进行取样。材料与方法缓冲液:ο15mMNaPO4,2mMMnCl2,pH7.5,aq.底物οHTrp-AMC(Bachem,I1670)底物溶液:ο将底物溶于10mM甲醇中ο将100μL10mM底物加入6mL缓冲液中样品:ο毕赤酵母发酵各时间点的样品ο离心除去细胞。微量培养板制备:ο对于每一份平行测定样品、空白和参考,黑色96孔板(black96-well)每个孔加入90μl底物溶液等分试样ο将微量培养板置于荧光微量培养板阅读台上(例如SpectraMax,MolecularDynamics)样品添加和反应动力学:ο设置荧光微量培养板阅读器:οEx.350nm/Em.460nm;自动切断(455nm);PMT介质;每孔3次阅读;自动校准“开”οRT(室温)ο0-30分钟时程;每30秒阅读一次ο在第一次阅读之前,初始化设备板的混合功能,混合5秒ο将样品按96-孔形式等分,并用多通道移液器以每孔10μL转移样品ο取下盖子,重新将微量培养板放置在微量培养板阅读器中ο开始读数
根据未知样品的固有活性,可期望的是改变样品稀释度、分析持续时间和动态取样,以及可以用常规筛选方法测定的所有变量。
底物已经显示出在这些条件下非常稳定,阴性对照空白应当显示出其吸光率没有随时间变化而增加。BodipyBSA蛋白酶微量培养板分析
本发明提供了BodipyBSA蛋白酶微量培养板分析方法,以帮助测定毕赤酵母发酵各时间点样品中的总蛋白酶活性。该分析的物料通过量足以满足从大量发酵反应中进行多时间点取样。材料与方法底物:οDQBSAgreen(MolecularProbes,D12050)底物溶液:ο将一瓶底物(1mg)中的内含物溶于含有0.1%叠氮钠的1mL水中样品:ο毕赤酵母发酵各时间点的样品ο离心除去细胞。阳性对照:ο0.2mg/mL枯草杆菌蛋白酶(Sigma,P5380),于50mMNaPO4,pH7.5中ο在水中连续稀释微量培养板制备:ο对于每一份平行测定样品、空白和参考,黑色96孔板(black96-well)每个孔加入90μl底物溶液等分试样样品添加和反应ο将样品按96-孔形式等分,并用多通道移液器以每孔10μL转移样品ο替换微量培养板的盖子,用箔包裹,在37℃置于加湿温育器中,温育3-4小时或过夜荧光测量:ο设置荧光微量培养板阅读器(SpectraMax):οEx.495nm/Em.525nm;自动切断(515nm);PMT低;每孔3次阅读;自动校准“开”οRT
选择BodipyBSA作为通用蛋白酶底物。缺少对bodipyBSA的水解并不表明不存在蛋白酶,但是已经显示其与PLC酶的水解和PLC活性的丧失相关。已经证明,BSA可以用bodipy卵清蛋白或酪蛋白替代。
一方面,在整个发酵时程内表征蛋白酶活性是有用的,这是因为该活性可以是临时性的和瞬时的。
底物已经显示出在这些条件下非常稳定,阴性对照空白应当显示出其吸光率没有随时间变化而增加。在全培养肉汤或上清液中PLC活性的测量:
本发明提供了在全培养肉汤或上清液中进行的PLC活性测量分析方法;该分析方法是对EdwardA.Dennis(1973)KineticdependenceofphospholipaseA2activityonthedetergentTritonX-100.J.LipidRes.14:152-159,USP24/NF19,Pancrealipase-Assayforlipaseactivity.第1256-1257页中描述的方法的修改。本发明的PLC活性测量分析方法包括:溶液:100mM硫酸锌溶液100mM氯化钙溶液底物溶液(20mM磷脂酰胆碱,40mMTritonX-100,5mM氯化钙)稀释缓冲液(0.1%TritonX-100,1mM硫酸锌,1%阿拉伯胶)分析程序:-用稀释缓冲液(1.0%阿拉伯胶,1.0%TritonX-100,1mM硫酸锌)制备待分析样品的稀释液。在分析前一刻用冰冷的缓冲液制备稀释液,并保藏在冰浴中,直到使用。-将20mL的底物溶液转移入约50mL容量的带夹套的玻璃容器,该玻璃容器的外室与恒温控制的水浴相连。覆盖混合物,并用机械搅拌装置持续搅拌。将混合物的温度维持在37±0.1℃,从通过盖子上的孔插入的微量滴定管,用0.01NKOHVS预滴定底物,将pH调节至7.3。加入50μL的酶稀释液,然后自动持续添加0.01NKOHVS6分钟,将pH维持在7。
此外,对发酵罐培养物进行标准的PAGE凝胶电泳,蛋白质和RNA印迹分析以及标准分析技术,以获得在线/离线发酵参数(生物质水平、气体分析等)的。产生Mut+表型毕赤酵母菌株
本发明提供了细胞、细胞系统和表达磷脂酶C的方法,该方法包括使用具有Mut+表型的毕赤酵母菌株。该方法包括将编码异源PLC的核酸插入毕赤酵母菌株中。然后在表达PLC的条件下培养该细胞。该方法可以进一步为所述培养条件补充锌。
一方面,这些方法、细胞和细胞系统使用SEQIDNO:2,其是需要锌的金属酶。一方面,它以3摩尔/摩尔的量使用。它的MW近似28kDa,pI近似5.2,并具有宽的底物耐受性:PC>PE>PS>>PI。未加工的酶具有24个氨基酸的信号序列,13个氨基酸的前序列,和245个氨基酸残基的“成熟”酶。
一方面,本发明的Mut+毕赤酵母菌株具有两个拷贝的醇氧化酶(AOX)基因,AOX1和AOX2,在转化期间受到影响(“Mut”代表“甲醇利用率(MethanolUtilization)”),如下所述:·Mut+·单交换事件,AOX1和AOX2基因完整·单独依靠甲醇生长和表达。可能共喂料·Muts·双交换事件,破坏AOX1基因·共喂料提高生长和表达·Mut-·重组事件破坏AOX1和AOX2基因·不能代谢甲醇,需要共喂料总之:Mut-<Muts plc<Muts/Mut+ plc<Mut+在Mut+和Muts之间存在发酵差异,包括:·甲醇的最佳诱导浓度·氧消耗率·由于更快的吸收能力,依靠甲醇,Mut+生长比Muts快·诱导之后,容易度过过渡期·Mut+不用于大规模表达·通风/冷却能力,MeOH敏感性
巴斯德毕赤酵母的甲醇利用途经是本领域所熟知的。醇氧化酶(AOX)将甲醇催化转变为甲醛;因此,如果AOX被过量表达,导致“腌渍的(pickled)”酵母细胞。在本发明的一个方面,使用巴斯德毕赤酵母的示例性发酵方案,包括:·种子培养(瓶或桶)·在丰富培养基中进行分批发酵,以增加生物质·分批发酵罐培养·分批阶段(甘油)·随着初始碳源被消耗,生物质增长·葡萄糖或甘油喂料阶段·由D.O.含量引发喂料添加,或线性/指数喂料·增长至足够的生物质,以进行诱导和表达(无乙醇,C-受限的)·甲醇诱导·喂料是受调控的(D.O.%,MeOH传感器,RQ),或者预先设置的喂料方案·与葡萄糖或甘油共喂料,取决于表型和表达参数·Mut+诱导,以1-3g/LMeOH·Muts诱导,以4-7g/LMeOH
图18示出了分批发酵罐培养的结果,如上所述,仅使用甘油。蛋白酶活性来自毕赤酵母中的内源性蛋白酶。分批发酵可以是丰富培养基,以增加生物质。如在图18中所示,在约69小时开始的蛋白酶活性的逐步增加对应于PLC活性的逐步减少。较高的甘油(glyc)共喂料速率提高了活性PLC的表达,减少(消除)了蛋白酶的产生,如下面数据概括表所示:
这些研究在30-LBB发酵罐中、以DSD-PLC进行。测量OUR或体积氧吸收率(Vol.OxygenUptakeRate,“OUR”),作为良好表达的“总培养物健康”指标,或“生物标记”。图19示出了该研究的结果,产生DSD-PLC的巴斯德毕赤酵母MutS30L培养物的OUR曲线比较结果,使用1700U/ml、1100U/ml和100U/ml的PLC,温度为30℃,甘油共喂料,如上所述。
图20示出了产生DSD-PLC,pH6.2(1100U/ml和100U/mlPLC),或异源蛋白的巴斯德毕赤酵母MutS30L培养物的甲醇消耗曲线比较结果,以甘油共喂料,如上所述。这是需求-驱动型(demand-driven)MeOH喂料,残余MeOH水平控制在4g/l。
此外,Mut+表型提高活性PLC表达水平,并增强MeOH吸收,如该数据表格所概括的:
PLC似乎不影响该Mut+表型菌株的生理生长特征,该菌株以6×拷贝数表达重组PLCSEQIDNO:2,数据在图21中示出,OUR图如附图说明中所阐述。这只是供应-驱动型(supply-driven)MeOH喂料,在Mut+培养物中无残留的葡萄糖或MeOH。
此外,产生的PLC蛋白的质量是可变的,具有不可预测性,例如<<或>>50%的总PLC蛋白具有活性,如图22中的SDS-PAGE结果所代表性示出。该OUR图(如上所论述)数据图解概述被插入到SDS-PAGE示图的上面部分。对照命名为JG=0.5μl1.6mgml-1。与蛋白酶或氨肽酶活性没有相关性。显著数量的活性PLC位于细胞内,如图23所示(也显示了研究的方案),其中在细胞内检测到>700U/mlPLC(在图23中,PLC(SEQIDNO:2)+α信号肽(来自酿酒酵母属)+糖基化作用)。形态学变化与活性PLC的浓度相关,如图24中所示。形态学变化的大小依赖于菌株和碳源。
增加的Zn并没有促进具有2×拷贝数的Mut+SEQIDNO:2的毕赤酵母菌株的表达,所述Mut+SEQIDNO:2具有DSD突变,如在下面数据表格中所概述的(超过1×通过共喂料来供应)(上面第一行是空载体对照)。增加的Zn确实提高了作为全肉汤的储藏稳定性(在4℃,>100h后,具有相类的活性水平),和总的方法稳健性。
Zn MeOH(L) 碱(L) 70%(v/v)甘油(L) OD600 PLC(U/ml)
1X(2.2mM) 7.1 2.3 9.6 765 0
0.2X 7.4 2.1 8.6 731 392
1X 7.1 2.8 9.0 776 2700
4X 6.1 2.2 10 780 2448
12X 6.4 2.3 9.8 776 2498
图25用图表概述的数据显示了在95hTFT(totalfermentationtime,总发酵时间)时,毕赤酵母中PLC生产性能的状态。在图表右边的5条柱显示了从“Zeo菌株”得到的结果,或生产PLC的巴斯德毕赤酵母菌株的Zeocin适应性。该菌株是抗生素-抗性的、无标记菌株,在巴斯德毕赤酵母中表达作为异源基因的本发明PLC(SEQIDNO:2)。已经证明,通过用抗生素zeocin来使菌株适应,人们可以获得新的稳定菌株,该菌株具有极大提高的感兴趣蛋白的表达水平。
将原始的抗生素-抗性无标记菌株,菌株#1(含有SEQIDNO:2)在一系列稀释步骤中进行培养,每一次增加抗生素zeocin的浓度。在每一步骤,将前面步骤的一部分培养物用新鲜培养基稀释至在600nm的光密度(OD600)为1.0,并将增加数量的zeocin加入到新的培养基中,再生长24小时。在最后阶段,使用200ug/ml的zeocin浓度,将最终培养物划线接种到MD/YPD板上,以使单菌落生长。结果发现,来自最终阶段培养物的菌落对zeocin显示出高度耐受性,而亲代菌株则显示出非常低的耐受性。其中一个菌落,菌株#2(含有SEQIDNO:2)相比起原始PLC菌株,菌株#1,显示出显著提高的(约70%以上)PLC表达水平。同样证明了,在传代40代之后,菌株#2在zeocin耐受性和PLC表达上都是稳定的,这表明新菌株获得“永久性的”高PLC表达和zeocin耐受性的性状。
通过使用本发明的“Zeo菌株”(Zeocin毕赤酵母适应型)获得高水平的PLC活性:4100u/ml,在小罐(mini-tanks)中。该结果来自包含6×DSDSEQIDNO:2的毕赤酵母菌株。简而言之,该SEQIDNO:2表达菌株通过在一系列的步骤中进行培养而“适应”,每一步骤都使用增加的zeocin浓度。明显地,该适应方法迫使菌株/构建物发生一些变化(在分子或遗传水平上),并使PLC活性水平显著提高。示例性的结果是:·罐1、2和4(每一个代表不同的菌落)的表现都超出原始预适应的SEQIDNO:2-表达菌株,罐1和4都达到4100u/ml,罐2达到3500u/ml。罐1和4早在75hrs时就达到3000u/ml以上,这表示:比原始预适应的SEQIDNO:2-表达菌株(其在此时通常远低于2000u/ml)具有更快的活性积聚水平。实验设计和结果的详细内容是:zeocin适应的基本原理
有关PLC表达的早期工作是在毕赤酵母pPICZa载体中完成的,该载体含有zeocin-抗性标记。zeocin因此被用于转化选择。后来,我们转换到AMR-较少形式的构建物(AMR-lessversionconstruct)以开发商业候选产品。当进行小罐发酵时,我们观察到使用AMR-less构建物获得PLC活性水平显著下降:在pPICZa-DSD构建物中,上清液活性达到4000u/ml,而在2×DSD中仅获得约2000u/ml。使用AMR-less构建物,也观察到明显的生理差异,例如较低的甲醇消耗率和更多的细胞裂解,特别是当使用同样的发酵方案测试较高拷贝数的(5×、6×)构建物时。
pPIZa构建物和AMR-less构建物之间的明显差异之一是在转化过程中zeocin的使用,问题是细胞有可能依靠什么来度过zeocin选择。本发明提供了在zeocin存在下培养AMR-less构建物的方法,然后使细胞经受某些有利于PLC表达的变化。2×DSD的Zeocin适应实验
实验首先用2×DSD(因为此时它是转移分子)进行。该研究以1ug/ml的zeocin浓度(″zeo1″)开始,使培养物生长~24hrs。从那时起,进行各步骤,将zeocin浓度增加至zeo5、zeo10、zeo15、zeo20、zeo40、zeo60、zeo80、zeo100,最后增加至zeo200(zeo100通常用于转化选择)。每一步骤都使用新鲜的培养基,并将前一阶段的培养物用于接种下一阶段的培养物,OD值为1.0,生长~24hrs。将每一阶段的培养物划线接种于YPD板,用于保藏以及获得单菌落。zeo-适应菌落的小罐发酵结果
为了检测zeocin适应的效果,从zeo200和zeo100培养物(其被划线接种于YPD板)挑选12个菌落,并用小罐筛选。结果总结在幻灯片(slide)6中。我们能够发现若干菌落的表现明显超出原始构建物(含SEQIDNO:2的毕赤酵母菌株)。其中,来自zeo200培养物的菌落#5显示PLC活性水平提高约50%。对筛选的观察如下:·zeo-适应的培养物和原始的SEQIDNO:2-表达菌株之间的生长曲线没有明显的差异。·尽管已适应的培养物的稳定性没有被广泛测试,它们还是在无zeocin存在的YPD和/或MD板上被重新划线接种了若干次。所有发酵过程也是在无zeocin存在下进行的。·菌落与菌落之间有明显的变化,无论是生长上的还是PLC表达上的。·有关发酵的一些技术问题可能部分地是这些变化所致。在6×DSD上进行Zeocin适应试验
受来自zeo-适应2×DSD的结果的鼓舞,我们随后对6×DSD(此时测定得知其优于2×DSD)进行了同样的试验。我们以zeocin浓度5ug/ml(“zeo5”)开始,并使培养物生长~24小时。从那时起,进行各个步骤,将zeocin浓度增加至zeo15、zeo30、zeo50、zeo100,最终至zeo200。与2×DSD相同,每一步骤都使用新鲜的培养基,并将前一阶段的培养物用于接种下一阶段的培养物,OD值为1.0,生长~24hrs。将每一阶段的培养物划线接种于YPD板,用于保藏以及获得单菌落。zeo-适应的6×DSD菌落的小罐发酵结果
挑选来自zeo200培养物(其被划线接种于MD板)的六个菌落,并与小罐中的原始SEQIDNO:2-表达菌株一起测试。关键的观察结果如下:·所有三个菌落(罐1、2和4)的表现都超出原始SEQIDNO:2-表达菌株,罐1和4都达到4100u/ml,罐2达到3500u/ml。·罐1和4早在75hrs时就达到3000u/ml以上,这表示与SEQIDNO:2-表达菌株(其在此时通常远低于2000u/ml)相比,具有更快的活性积聚水平。·相比起在10-L罐中进行的3000u/ml,在罐1、2和4中的PLC表达水平也似乎是较高(参见幻灯片4)。因此不清楚是否表观比活性在罐1、2和4中较高,即,是否所产生的PLC不同于原始SEQIDNO:2-表达菌株。·对照,罐7和8此时未达到3000u/ml。不清楚是否罐1、2和4能达到更高的水平。应注意,百分比的增加(35%,4100u/ml对3000u/ml)是小于2×适应的培养物。·图26给出了对来自6×DSDzeocin-适应的菌落表达筛选的概述。原始菌株最高的活性水平为~3000u/ml(小罐和10-L);zeocin-适应的6×DSD的活性水平为4100u/ml(增加~35%)。图27的数据显示,相比起在10-L罐(和罐条件)中的3000u/ml,罐1、2和4中的PLC蛋白水平较高,如上所述(凝胶载量是1.0ul的5×稀释肉汤,0.2ul的全肉汤)。图28显示了zeo-适应的菌落与对照的生长比较。相比起原始SEQIDNO:2-表达菌株,Zeocin-适应的6×DSD菌落(6×DSD)具有相似的生长曲线。
在C-限制的好氧酵母培养物中,分泌蛋白的Qp,在μ=0.10h-1下,一般为0.5-2.5mg/g.h-1。基于400mg/gDW的蛋白含量,“代谢载荷(metabolicburden)”小于总蛋白生产率的10%。在整个发酵期间,PLCmRNA水平保持在高水平上,这与表达并不相关。基于5g/l(150g)PLC蛋白,少于总5molC/h的0.1molC/h(总C的~2%被消耗)成为PLC中的碳,~25%成为生物质。在这些生产条件下,PLC活性似乎没有影响一般的生长生理特征(除MeOH利用能力受影响外)。
总之,本发明提供了zeocin-抗性酵母细胞系统,诸如酵母细胞,细胞系和/或单细胞,用于表达由下述方法制备的异源蛋白(例如酶,诸如PLC),该方法包括下述步骤:提供包含能够表达异源蛋白的异源核酸(例如,包含酶编码序列的载体;可操作性连接到启动子的ORF)的毕赤酵母某种(例如巴斯德毕赤酵母)的细胞;将细胞(许多细胞)培养在包含起始浓度(该浓度足够低以便一些细胞存活,而足够高以选择抗生素抗性细胞)的zeocin的条件下;选择对起始浓度的zeocin具有抗性的细胞,并重新培养在包含较高浓度的zeocin的条件下;选择对较高浓度的zeocin具有抗性的细胞。本发明也提供了该方法制备的酵母细胞、细胞系和/或单细胞。常规的筛选方法能够确定使用什么起始浓度的抗生素,需要或期望多少轮的选择,和如何快速增加各轮选择之间的抗生素浓度。实施例6:热稳定性PLC
本发明提供了热稳定性磷脂酶。具有SEQIDNO:2中所阐明的序列的示例性酶的热稳定性得到了证明。使用SEQIDNO:2证明了本发明可比较的磷脂的热稳定性。在两个不同的系统中测试了SEQIDNO:2的活性:水中和在油中。在含水系统中,替代底物(p-nppc)用于测量活性;该酶在86℃开始丧失活性。然而,在油分析中,在85℃,水解大豆油中存在的PC和PE底物时,该酶显示出良好的活性。检测相同的酶的Tm,发现它在15mg/mL时为86℃,并且是不可逆的。
图29示出了使用10U的SEQIDNO:2时的85℃加热试验的结果,条件如图中所示。图30示出了总结该加热试验的NMR数据。图31、32和33所示出的数据概述了使用p-NPPC时的SEQIDNO:2的热稳定性,在图中所示的条件下。图34示出了来自DSC分析的数据,显示了SEQIDNO:2的热稳定性,酶浓度为15mg/mL,Tm为86℃。实施例7:对本发明PLC的修饰
实施例4所述的修饰的磷脂酶C酶(SEQIDNO:175,由SEQIDNO:178编码)是较长序列(SEQIDNO:176)的酶学活性子序列。SEQIDNO:176具有SEQIDNO:2的1至37残基的前导序列(粗体)。由SEQIDNO:177编码的SEQIDNO:176被用作使用GSSM技术进行进一步修饰的模板。从N-末端甲硫氨酸起始编号位置。实施例4所述的突变用下划线和粗体标出(此处的编号为N100D、N168S和N171D)。MKKKVLALAAMVALAAPVQSVVFAQTNNSESPAPILRWSAEDKHNEGINSHLWIVNRAIDIMSRNTTIVNPNETALLNEWRADLENGIYSADYENPYYDDSTYASHFYDPDTGTTYIPFAKHAKETGAKYFNLAGQAYQNQDMQQAFFYLGLSLHYLGDVNQPMHAASFTDLSYPMGFHSKYENFVDTIKNNYIVSDSNGYWNWKGANPEDWIEGAAVAAKQDYPGVVNDTTKDWFVKAAVSQEYADKWRAEVTPVTGKRLMEAQRVTAGYIHLWFDTYVNR(SEQIDNO:176)WSAEDKHNEGINSHLWIVNRAIDIMSRNTTIVNPNETALLNEWRADLENGIYSADYENPYYDDSTYASHFYDPDTGTTYIPFAKHAKETGAKYFNLAGQAYQNQDMQQAFFYLGLSLHYLGDVNQPMHAASFTDLSYPMGFHSKYENFVDTIKNNYIVSDSNGYWNWKGANPEDWIEGAAVAAKQDYPGVVNDTTKDWFVKAAVSQEYADKWRAEVTPVTGKRLMEAQRVTAGYIHLWFDTYVNR(SEQIDNO:175)ATGAAAAAGAAAGTATTAGCACTAGCAGCTATGGTTGCTTTAGCTGCGCCAGTTCAAAGTGTAGTATTTGCACAAACAAATAATAGTGAAAGTCCTGCACCGATTTTAAGATGGTCAGCTGAGGATAAGCATAATGAGGGGATTAACTCTCATTTGTGGATTGTAAATCGTGCAATTGACATCATGTCTCGTAATACAACGATTGTGAATCCGAATGAAACTGCATTATTAAATGAGTGGCGTGCTGATTTAGAAAATGGTATTTATTCTGCTGATTACGAGAATCCTTATTATGATGATAGTACATATGCTTCTCACTTTTATGATCCGGATACTGGAACAACATATATTCCTTTTGCGAAACATGCAAAAGAAACAGGCGCAAAATATTTTAACCTTGCTGGTCAAGCATACCAAAATCAAGATATGCAGCAAGCATTCTTCTACTTAGGATTATCGCTTCATTATTTAGGAGATGTGAATCAGCCAATGCATGCAGCATCTTTTACGGATCTTTCTTATCCAATGGGTTTCCATTCTAAATACGAAAATTTTGTTGATACAATAAAAAATAACTATATTGTTTCAGATAGCAATGGATATTGGAATTGGAAAGGAGCAAACCCAGAAGATTGGATTGAAGGAGCAGCGGTAGCAGCTAAACAAGATTATCCTGGCGTTGTGAACGATACGACAAAAGATTGGTTTGTAAAAGCAGCCGTATCTCAAGAATATGCAGATAAATGGCGTGCGGAAGTAACACCGGTGACAGGAAAGCGTTTAATGGAAGCGCAGCGCGTTACAGCTGGTTATATTCATTTGTGGTTTGATACGTATGTAAATCGCTAA(SEQIDNO:177)TGGTCAGCTGAGGATAAGCATAATGAGGGGATTAACTCTCATTTGTGGATTGTAAATCGTGCAATTGACATCATGTCTCGTAATACAACGATTGTGAATCCGAATGAAACTGCATTATTAAATGAGTGGCGTGCTGATTTAGAAAATGGTATTTATTCTGCTGATTACGAGAATCCTTATTATGATGATAGTACATATGCTTCTCACTTTTATGATCCGGATACTGGAACAACATATATTCCTTTTGCGAAACATGCAAAAGAAACAGGCGCAAAATATTTTAACCTTGCTGGTCAAGCATACCAAAATCAAGATATGCAGCAAGCATTCTTCTACTTAGGATTATCGCTTCATTATTTAGGAGATGTGAATCAGCCAATGCATGCAGCATCTTTTACGGATCTTTCTTATCCAATGGGTTTCCATTCTAAATACGAAAATTTTGTTGATACAATAAAAAATAACTATATTGTTTCAGATAGCAATGGATATTGGAATTGGAAAGGAGCAAACCCAGAAGATTGGATTGAAGGAGCAGCGGTAGCAGCTAAACAAGATTATCCTGGCGTTGTGAACGATACGACAAAAGATTGGTTTGTAAAAGCAGCCGTATCTCAAGAATATGCAGATAAATGGCGTGCGGAAGTAACACCGGTGACAGGAAAGCGTTTAATGGAAGCGCAGCGCGTTACAGCTGGTTATATTCATTTGTGGTTTGATACGTATGTAAATCGCTAA(SEQIDNO:178)
使用如上所述的基因位点饱和诱变(GSSM)方法进行单一残基突变并分析磷脂酶活性。用于筛选目的,表达载体是在E.coli宿主Top10中的pASK。GSSM命中(hits)选自初级筛选,其中PA/PI乳剂用作为底物,并且用LCMS分析样本。然后在大豆油上确证这些初级命中,并用31PNMR和HPLC分析。
制备用于NMR分析的样本的大豆油分析和方法如下:
通过在900mL水中溶解25g脱氧胆酸、5.84gEDTA、5.45gTris碱来制备NMR洗涤剂,然后使用KOH小粒将pH调节至10.5。NMR内标是在HPLC-级异丙醇中的50mMTIP和12.5mMTBP。低顺磁性重水(D,99.9%)来自CambridgeIsotopeLaboratoriesInc.(DLM-11-100)。NMR对照是AvantiLecithin(InternationalLecithin&PhospholipidsSocietymixedsoyphospholipidsreferenceStandardoil),AvantiPolarLipidsInc,#95309。
标准和样本如下制备:彻底混合一批天然大豆油将1mL油分散至2mL管中并且加入60uL的纯化酶(作为对照,18个单位)或纯的细胞裂解液(用于筛选突变体)并且混合15秒。单位的定义为在37℃,pH7.3时每分钟水解1μmolPC。在60℃在热混合器中以14000rpm振荡温育48小时,间歇涡旋。温育后,使用旋转彻底混合样本称量每个样本250mg(+/-0.2mg)至2mL管,并称量10mg(+/-0.1mg)AvantiLecithin的NMR对照。向每个样本中加入900uLNMR洗涤剂,然后加入100uLD2O。在30-37℃并且以14000rpm在Eppendorf热混合器中通过旋转和振荡彻底混合样本30分钟以13,000RPM离心10分钟小心去除顶部油层向每个样本中添加750uL己烷并温和旋转*以13,000RPM离心10分钟小心去除600uL底层水层并且转移至新管加入25uL内标(InternalStandard),充分混合将500uL转移至5mmNMR管
DAG的释放根据如下方法用定量HPLC测量:
样本溶液是~50ul油样本和950ul己醇/异丙醇(9∶1)来形成1ml溶液。标准溶液是,例如0.25mg/ml、0.5mg/ml、1mg/ml、2mg/ml和4mg/mlEnovaTM油。Enova油是高DAG油,其具有与常规植物油(1,3-DAG和1,2-DAG)相似的脂肪酸分布。HPLC设置:柱:ChromegasphereTMSI-60,15cm×4.6mm温度:40℃流速:2mL/min进样量:20ul流动相A:己醇流动相B:己醇/异丙醇/乙酸乙酯/蚁酸=800∶100∶100∶1梯度洗脱:
ELSD设置:示例性设置是温度40℃、增益(gain)5和氮气3.5巴(bars)。通过将保留时间与标准的保留时间比较来鉴定DAG峰。定量是基于检测器的响应(峰面积)和分析物浓度之间的关系。
基于:NMR和HPLC数据,选择如下表5所示的突变。表5显示起始氨基酸、氨基酸改变和改变的氨基酸的位置数。该表还显示原始密码子、替换的密码子和其它用于相同氨基酸改变的密码子。例如,第二行,“E41A”显示位置41的氨基酸原始为“E”(谷氨酸),但被改变为“A”(丙氨酸)。E41A改变的原始密码子是“GAG”,但被改变为“GCA”。然而,密码子“GCG”、“GCC”或“GCT”也可使用。表5所述的密码子变体产生的变体(SEQIDNO:176的)具有最佳变化或优于“野生型”(SEQIDNO:176)的PA水解的“改进”。本发明提供核酸,和它们编码的多肽,其包括一种、几种或所有的变化或所有变化的等同物,如表5所示。
在图35中,单个磷脂(PL)种类的重量分数相对于反应后剩余的总PL给出,其反映了突变体对具体种类的特异性。此处,种类是磷脂酸(PA)、磷脂酰乙醇胺(PE)、磷脂酰肌醇(PI)、卵磷脂(PC)。“TIP”是指NMR内标。“释放的DAG”由HPLC测定并且反映了样本和总1,3-DAG和1,2-DAG对照之间的相对值。阳性对照为Tan等人之前在Biochemistry37:4275-4279(1998)所述的E41A突变体的纯化样本。结果显示突变体释放DAG良好并且对各个种类具有良好活性,种类包括卵磷脂(PC)和磷脂酰乙醇胺(PE),与模板(SEQIDNO:176)相当或优于模板。例如,D100L和D100M显示对PA具有特别活性。Q265R显示对PI具有特别活性。这些突变可被组合以提供具有对各种底物所期望活性的酶。表5:GSSM命中(hit)
因此,本发明提供包括具有编码上表所列氨基酸突变,例如本文所述的密码子改变的一个、两个或更多核酸突变的序列SEQIDNO:177或SEQIDNO:178的核酸;这些核酸和多肽进一步在本文所述的实施方式中提供。
GSSM命中被筛选以及选择高命中(tophits)之后(见表5),在卵黄平板上进行进一步的特征分析,以便使用基因重装配(GeneReassembly)技术缩小用于组合的单个GSSM突变体的数目。表7显示了卵黄分析数据(卵黄分析如下所述),以及油分析和耐热残留活性测定的结果。图36说明了单个GSSM高表达突变型(upmutant),其被选择用于包含在基因重装配方法中。基因重装配按前述进行。
如下,表6列出了288个本发明的示例性多肽序列,其通过选择的单个GSSM高表达突变型的基因重装配组合来产生。所有都是起始氨基酸序列SEQIDNO:176(“野生型”或“WT”序列)的变体。
为了帮助阅读表6,例如,本发明的示例性磷脂酶表征为进化的磷脂酶1(第二行):-在残基位置41的野生型氨基酸残基“E”或谷氨酸(glu)被修饰为“Y”或酪氨酸(tyr)残基;-在残基位置100的野生型氨基酸残基“N”或天冬胺酸(asp)被修饰为“M”或甲硫氨酸(met)残基;-在残基位置168的野生型氨基酸残基“N”或天冬胺酸(asp)被修饰为“S”或丝氨酸(ser)残基;-在残基位置171的野生型氨基酸残基“N”或天冬胺酸(asp)保留为“N”;以及-在残基位置176的野生型氨基酸残基“M”或甲硫氨酸(met)保留为“M”。注意:进化的磷脂酶172(173行,粗体)不是本发明的示例性磷脂酶,它是起始磷脂酶序列SEQIDNO:2(见实施例4)。6:从单个GSSM高表达突变型的基因重装配组合产生的磷脂酶文库
进化的磷脂酶 E41 N100 N168 N171 M176
1 Y M S N M
2 F W S E M
3 A M N E W
4 Y F S E M
5 Y Y S N M
表7总结了分析本发明的示例性酶(以及对于巴斯德毕赤酵母表达系统——编码它们的核酸的表达活性)的各种酶学活性和表达系统行为的分析结果,其中所有的本发明的多肽都是起始磷脂酶序列SEQIDNO:176(由例如核酸序列SEQIDNO:177编码)的序列变体。为了帮助阅读表7,例如,在E41A行中,该行描述了本发明的示例性酶,其具有SEQIDNO:176,但在氨基酸位置41用“A”或丙氨酸(ala)替代“E”或(glu),等等。 卵黄分析
卵黄分析按如下进行:通过在高压灭菌之前向培养基中加入0.5%(按重量计)卵黄卵磷脂,来制备卵黄琼脂平板。如果在高压灭菌培养基之前用高剪切力混合器分散卵磷脂,平板将更均匀。在琼脂中打孔,等体积(例如2ml)的连续稀释样本,包括阳性对照,上样至孔中。平板在37℃放置3-12小时,在此期间酶扩散出孔,水解卵黄卵磷脂并由于二酰甘油的形成而形成沉淀带。由环直径或综合密度值(integrateddensityvalue,IDV)测量的沉淀环内的面积针对阳性对照的标准曲线作图,以测定样本磷脂酶的活性。整个方法可用于测定样本的未知PLC活性。该方法是半定量的。卵磷脂(PC):来自Sigma,目录号P5394PC来自干卵黄,X-E型,TLC测定约60%PC。
尽管本发明以通过参考它的某些示例性方面而被详细描述,但是应理解的是,修改和变化在被描述和要求保护的精神和范围内。
序列表
<110>E.奥多诺谷
N.R.巴尔顿
<120>磷脂酶、编码它们的核酸及其制备和应用方法
<130>564462015940
<140>尚未授予
<140>与此同时
<150>60/826,512
<151>2006-09-21
<160>178
<170>FastSEQforWindowsVersion4.0
<210>1
<211>849
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>1
atgaaaaagaaagtattagcactagcagctatggttgctttagctgcgccagttcaaagt60
gtagtatttgcacaaacaaataatagtgaaagtcctgcaccgattttaagatggtcagct120
gaggataagcataatgaggggattaactctcatttgtggattgtaaatcgtgcaattgac180
atcatgtctcgtaatacaacgattgtgaatccgaatgaaactgcattattaaatgagtgg240
cgtgctgatttagaaaatggtatttattctgctgattacgagaatccttattatgataat300
agtacatatgcttctcacttttatgatccggatactggaacaacatatattccttttgcg360
aaacatgcaaaagaaacaggcgcaaaatattttaaccttgctggtcaagcataccaaaat420
caagatatgcagcaagcattcttctacttaggattatcgcttcattatttaggagatgtg480
aatcagccaatgcatgcagcaaactttacgaatctttcttatccaatgggtttccattct540
aaatacgaaaattttgttgatacaataaaaaataactatattgtttcagatagcaatgga600
tattggaattggaaaggagcaaacccagaagattggattgaaggagcagcggtagcagct660
aaacaagattatcctggcgttgtgaacgatacgacaaaagattggtttgtaaaagcagcc720
gtatctcaagaatatgcagataaatggcgtgcggaagtaacaccggtgacaggaaagcgt780
ttaatggaagcgcagcgcgttacagctggttatattcatttgtggtttgatacgtatgta840
aatcgctaa849
<210>2
<211>282
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(24)
<400>2
MetLysLysLysValLeuAlaLeuAlaAlaMetValAlaLeuAlaAla
151015
ProValGlnSerValValPheAlaGlnThrAsnAsnSerGluSerPro
202530
AlaProIleLeuArgTrpSerAlaGluAspLysHisAsnGluGlyIle
354045
AsnSerHisLeuTrpIleValAsnArgAlaIleAspIleMetSerArg
505560
AsnThrThrIleValAsnProAsnGluThrAlaLeuLeuAsnGluTrp
65707580
ArgAlaAspLeuGluAsnGlyIleTyrSerAlaAspTyrGluAsnPro
859095
TyrTyrAspAsnSerThrTyrAlaSerHisPheTyrAspProAspThr
100105110
GlyThrThrTyrIleProPheAlaLysHisAlaLysGluThrGlyAla
115120125
LysTyrPheAsnLeuAlaGlyGlnAlaTyrGlnAsnGlnAspMetGln
130135140
GlnAlaPhePheTyrLeuGlyLeuSerLeuHisTyrLeuGlyAspVal
145150155160
AsnGlnProMetHisAlaAlaAsnPheThrAsnLeuSerTyrProMet
165170175
GlyPheHisSerLysTyrGluAsnPheValAspThrIleLysAsnAsn
180185190
TyrIleValSerAspSerAsnGlyTyrTrpAsnTrpLysGlyAlaAsn
195200205
ProGluAspTrpIleGluGlyAlaAlaValAlaAlaLysGlnAspTyr
210215220
ProGlyValValAsnAspThrThrLysAspTrpPheValLysAlaAla
225230235240
ValSerGlnGluTyrAlaAspLysTrpArgAlaGluValThrProVal
245250255
ThrGlyLysArgLeuMetGluAlaGlnArgValThrAlaGlyTyrIle
260265270
HisLeuTrpPheAspThrTyrValAsnArg
275280
<210>3
<211>852
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>3
atgaaaagaaaaattttagctatagcttccgtaattgctttaacagctcctatccaaagt60
gtggcgtttgcgcatgaaaatggtcaccaagatccaccaattgctctaaagtggtcagca120
gaatctatacataatgaaggagtaagttctcatttatggattgtaaacagagccattgat180
attatgtcccaaaatacgactgttgtgaagcaaaatgagacagctctattaaatgaatgg240
cgtacggatctagagaaaggcatttactctgcggattatgaaaacccatactatgataat300
tccacattcgcttcacacttctatgatcctgattcaggaaaaacgtatattccatttgct360
aaacaagcaaagcaaacaggagcgaaatattttaaattagctggtgaagcttatcaaaat420
aaagatctgaaaaacgcattcttttatttaggattatcacttcactatttaggggatgtc480
aaccaaccaatgcatgcagcaaactttactaatatttcgcatccatttggcttccactca540
aaatatgaaaatttcgttgatacagtgaaagacaattatagagtaacggatggaaatggc600
tattggaattggcaaagtgcaaatccagaagagtgggttcatgcatcagcatcagcagca660
aaagctgattttccatcaattgttaatgataagacgaaaaattggttcctaaaagcagct720
gtatcacaagactctgctgataaatggcgtgcagaagtaacaccgataacaggaaaacgt780
ttaatggaagcgcagcgtgttacagctggatatatccatttatggtttgatacgtacgtg840
aataacaaataa852
<210>4
<211>283
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(24)
<400>4
MetLysArgLysIleLeuAlaIleAlaSerValIleAlaLeuThrAla
151015
ProIleGlnSerValAlaPheAlaHisGluAsnGlyHisGlnAspPro
202530
ProIleAlaLeuLysTrpSerAlaGluSerIleHisAsnGluGlyVal
354045
SerSerHisLeuTrpIleValAsnArgAlaIleAspIleMetSerGln
505560
AsnThrThrValValLysGlnAsnGluThrAlaLeuLeuAsnGluTrp
65707580
ArgThrAspLeuGluLysGlyIleTyrSerAlaAspTyrGluAsnPro
859095
TyrTyrAspAsnSerThrPheAlaSerHisPheTyrAspProAspSer
100105110
GlyLysThrTyrIleProPheAlaLysGlnAlaLysGlnThrGlyAla
115120125
LysTyrPheLysLeuAlaGlyGluAlaTyrGlnAsnLysAspLeuLys
130135140
AsnAlaPhePheTyrLeuGlyLeuSerLeuHisTyrLeuGlyAspVal
145150155160
AsnGlnProMetHisAlaAlaAsnPheThrAsnIleSerHisProPhe
165170175
GlyPheHisSerLysTyrGluAsnPheValAspThrValLysAspAsn
180185190
TyrArgValThrAspGlyAsnGlyTyrTrpAsnTrpGlnSerAlaAsn
195200205
ProGluGluTrpValHisAlaSerAlaSerAlaAlaLysAlaAspPhe
210215220
ProSerIleValAsnAspLysThrLysAsnTrpPheLeuLysAlaAla
225230235240
ValSerGlnAspSerAlaAspLysTrpArgAlaGluValThrProIle
245250255
ThrGlyLysArgLeuMetGluAlaGlnArgValThrAlaGlyTyrIle
260265270
HisLeuTrpPheAspThrTyrValAsnAsnLys
275280
<210>5
<211>843
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>5
atgaaaagaaaaattttagctatagcttctgtaattgctttaacagctcctattcaaagt60
gtggcgtttgcgcatgaatctgatgggcctattgctttaagatggtcagcggaatctgta120
cataatgaaggagtaagttctcatttatggattgtaaacagagcaattgatattatgtcc180
caaaatacgactgtggtgaagcaaaatgagacagctctattaaatgaatggcgtacgaat240
ttggaggaaggtatttattctgcagattataaaaacccatactatgataattccacattc300
gcttcacacttctatgatcctgattcagaaaaaacgtatattccatttgctaaacaagca360
aagcaaacgggagcaaagtattttaaattagctggtgaagcttatcaaaataaagatctg420
aaaaatgcattcttttatttaggattatcacttcattatttaggggatgtcaatcaacca480
atgcatgcagcaaactttactaacatttcgcatccatttggcttccactcaaaatatgaa540
aacttcgttgatacagtgaaagacaattatagagtaacagatggagatggctattggaat600
tggaaaagtgcaaatccagaagagtgggttcatgcatcagcatcagcagcaaaagctgat660
ttcccatcaattgttaatgataatacgaaaagttggttcctaaaagcagcggtatcacaa720
gactctgctgacaaatggcgtgctgaagtaacaccggtaacaggaaaacgtttaatggaa780
gcacagcgtattacagctggatatattcatttatggtttgatacgtacgtgaataacaaa840
taa843
<210>6
<211>280
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(24)
<400>6
MetLysArgLysIleLeuAlaIleAlaSerValIleAlaLeuThrAla
151015
ProIleGlnSerValAlaPheAlaHisGluSerAspGlyProIleAla
202530
LeuArgTrpSerAlaGluSerValHisAsnGluGlyValSerSerHis
354045
LeuTrpIleValAsnArgAlaIleAspIleMetSerGlnAsnThrThr
505560
ValValLysGlnAsnGluThrAlaLeuLeuAsnGluTrpArgThrAsn
65707580
LeuGluGluGlyIleTyrSerAlaAspTyrLysAsnProTyrTyrAsp
859095
AsnSerThrPheAlaSerHisPheTyrAspProAspSerGluLysThr
100105110
TyrIleProPheAlaLysGlnAlaLysGlnThrGlyAlaLysTyrPhe
115120125
LysLeuAlaGlyGluAlaTyrGlnAsnLysAspLeuLysAsnAlaPhe
130135140
PheTyrLeuGlyLeuSerLeuHisTyrLeuGlyAspValAsnGlnPro
145150155160
MetHisAlaAlaAsnPheThrAsnIleSerHisProPheGlyPheHis
165170175
SerLysTyrGluAsnPheValAspThrValLysAspAsnTyrArgVal
180185190
ThrAspGlyAspGlyTyrTrpAsnTrpLysSerAlaAsnProGluGlu
195200205
TrpValHisAlaSerAlaSerAlaAlaLysAlaAspPheProSerIle
210215220
ValAsnAspAsnThrLysSerTrpPheLeuLysAlaAlaValSerGln
225230235240
AspSerAlaAspLysTrpArgAlaGluValThrProValThrGlyLys
245250255
ArgLeuMetGluAlaGlnArgIleThrAlaGlyTyrIleHisLeuTrp
260265270
PheAspThrTyrValAsnAsnLys
275280
<210>7
<211>963
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>7
gtgattactttgataaaaaaatgtttattagtattgacgatgactctattgttaggggtt60
ttcgtaccgctgcagccatcacatgctactgaaaattatccaaatgattttaaactgttg120
caacataatgtatttttattgcctgaatcagtttcttattggggtcaggacgaacgtgca180
gattatatgagtaatgcagattacttcaagggacatgatgctctgctcttaaatgagctt240
tttgacaatggaaattcgaacatgctgctaatgaacttatccacggaatatccatatcaa300
acgccagtgcttggccgttcgatgagtggatgggatgaaactagaggaagctattctaat360
tttgtacccgaagatggcggtgtagcaattatcagtaaatggccaatcgtggagaaaata420
cagcatgtttacgcgaatggttgcggtgcagactattatgcaaataaaggatttgtttat480
gcaaaagtacaaaaaggggataaattctatcatcttatcagcactcatgctcaagccgaa540
gatactgggtgtgatcagggtgaaggagcagaaattcgtcattcacagtttcaagaaatc600
aacgactttattaaaaataaaaacattccgaaagatgaagtggtatttattggtggtgac660
tttaatgtgatgaagagtgacacaacagagtacaatagcatgttatcaacattaaatgtc720
aatgcgcctaccgaatatttagggcatagctctacttgggacccagaaacgaacagcatt780
acaggttacaattaccctgattatgcgccacagcatttagattatatttttgtggaaaaa840
gatcataaacaaccaagttcatgggtaaatgaaacgattactccgaagtctccaacttgg900
aaggcaatctatgagtataatgattattccgatcactatcctgttaaagcatacgtaaaa960
taa963
<210>8
<211>320
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(29)
<400>8
MetIleThrLeuIleLysLysCysLeuLeuValLeuThrMetThrLeu
151015
LeuLeuGlyValPheValProLeuGlnProSerHisAlaThrGluAsn
202530
TyrProAsnAspPheLysLeuLeuGlnHisAsnValPheLeuLeuPro
354045
GluSerValSerTyrTrpGlyGlnAspGluArgAlaAspTyrMetSer
505560
AsnAlaAspTyrPheLysGlyHisAspAlaLeuLeuLeuAsnGluLeu
65707580
PheAspAsnGlyAsnSerAsnMetLeuLeuMetAsnLeuSerThrGlu
859095
TyrProTyrGlnThrProValLeuGlyArgSerMetSerGlyTrpAsp
100105110
GluThrArgGlySerTyrSerAsnPheValProGluAspGlyGlyVal
115120125
AlaIleIleSerLysTrpProIleValGluLysIleGlnHisValTyr
130135140
AlaAsnGlyCysGlyAlaAspTyrTyrAlaAsnLysGlyPheValTyr
145150155160
AlaLysValGlnLysGlyAspLysPheTyrHisLeuIleSerThrHis
165170175
AlaGlnAlaGluAspThrGlyCysAspGlnGlyGluGlyAlaGluIle
180185190
ArgHisSerGlnPhcGlnGluIleAsnAspPheIleLysAsnLysAsn
195200205
IleProLysAspGluValValPheIleGlyGlyAspPheAsnValMet
210215220
LysSerAspThrThrGluTyrAsnSerMetLeuSerThrLeuAsnVal
225230235240
AsnAlaProThrGluTyrLeuGlyHisSerSerThrTrpAspProGlu
245250255
ThrAsnSerIleThrGlyTyrAsnTyrProAspTyrAlaProGlnHis
260265270
LeuAspTyrIlePheValGluLysAspHisLysGlnProSerSerTrp
275280285
ValAsnGluThrIleThrProLysSerProThrTrpLysAlaIleTyr
290295300
GluTyrAsnAspTyrSerAspHisTyrProValLysAlaTyrValLys
305310315320
<210>9
<211>999
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>9
atgaaattactgcgtgtctttgtgtgcgtttttgctttactcagcgcacacagcaaagcc60
gatacacttaaagtaatggcttataatattatgcaactaaacgtacaagattgggatcaa120
gcaaatcgtgcacagcgettgccaaacgtcatatctcaattaagtgacagtcctgatgtc180
attcttatcagcgaagcgtttagcagccaatcagaatctgcgttagcgcaacttgctcaa240
ctttacccttatcaaactcccaatgttggcgaagactgtagtggcgctggctggcaaagc300
ttaacgggtaactgctcgaatagcccctttgtgatccgcggtggagtggtgattttatct360
aagtaccccatcattacgcaaaaagcccatgtgtttaataacagcctgactgatagttgg420
gattatttagcaaacaaaggtttcgcttatgttgaaatagaaaaacatggcaaacgttac480
caccttattggcacgcatttacaagcaacgcatgatggcgacacagaagctgagcatatt540
gtgagaatgggtcaattacaagagatacaagatttcattcaaagcgagcaaattcacact600
tctgagccggtcattatcggcggtgatatgaacgtagagtggagcaagcaatctgaaatt660
acagatatgctcgaagtggttcgcagccgtctaattttcaacacacctgaagttggctct720
ttctctgcaaaacacaactggtttaccaaagctaacgcctactatttcgactacagctta780
gagtataacgacacgctcgattatgtactttggcatgcagaccataagcaacccaccaat840
accccagaaatgttagtacgttacccaaaagcagagcgtgacttttactggcgttactta900
cgcggaaattggaacttaccttctggccgttattatcatgatggatactataacgaactg960
tctgatcactacccagtgcaagttaactttgaattttaa999
<210>10
<211>332
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(20)
<400>10
MetLysLeuLeuArgValPheValCysValPheAlaLeuLeuSerAla
151015
HisSerLysAlaAspThrLeuLysValMetAlaTyrAsnIleMetGln
202530
LeuAsnValGlnAspTrpAspGlnAlaAsnArgAlaGlnArgLeuPro
354045
AsnValIleSerGlnLeuSerAspSerProAspValIleLeuIleSer
505560
GluAlaPheSerSerGlnSerGluSerAlaLeuAlaGlnLeuAlaGln
65707580
LeuTyrProTyrGlnThrProAsnValGlyGluAspCysSerGlyAla
859095
GlyTrpGlnSerLeuThrGlyAsnCysSerAsnSerProPheValIle
100105110
ArgGlyGlyValValIleLeuSerLysTyrProIleIleThrGlnLys
115120125
AlaHisValPheAsnAsnSerLeuThrAspSerTrpAspTyrLeuAla
130135140
AsnLysGlyPheAlaTyrValGluIleGluLysHisGlyLysArgTyr
145150155160
HisLeuIleGlyThrHisLeuGlnAlaThrHisAspGlyAspThrGlu
165170175
AlaGluHisIleValArgMetGlyGlnLeuGlnGluIleGlnAspPhe
180185190
IleGlnSerGluGlnIleHisThrSerGluProValIleIleGlyGly
195200205
AspMetAsnValGluTrpSerLysGlnSerGluIleThrAspMetLeu
210215220
GluValValArgSerArgLeuIlePheAsnThrProGluValGlySer
225230235240
PheSerAlaLysHisAsnTrpPheThrLysAlaAsnAlaTyrTyrPhe
245250255
AspTyrSerLeuGluTyrAsnAspThrLeuAspTyrValLeuTrpHis
260265270
AlaAspHisLysGlnProThrAsnThrProGluMetLeuValArgTyr
275280285
ProLysAlaGluArgAspPheTyrTrpArgTyrLeuArgGlyAsnTrp
290295300
AsnLeuProSerGlyArgTyrTyrHisAspGlyTyrTyrAsnGluLeu
305310315320
SerAspHisTyrProValGlnValAsnPheGluPhe
325330
<210>11
<211>1041
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>11
atggcttcacaattcaggaatctggtttttgaaggaggcggtgtaaagggaatcgcctat60
atcggcgccatgcaggtgctggagcagcgcggacatttggagcacgttgtgagggtggga120
ggaacaagtgcaggggctattaacgctctcattttttcgctgggctttaccattaaagag180
cagcaggatattctcaattccaccaacttcagggagtttatggacagctctttcggattt240
gtgcgaaacttcagaaggctctggagtgaattcgggtggaaccgcggtgatgtgttttcg300
gagtgggcaggagagctggtgaaagagaaactcggcaagaagaacgccaccttcggcgat360
ctgaaaaaagcgaagcgccccgatctctacgttatcggaaccaacctctccaccgggttt420
tccgagactttttcgcatgaacgccacgccaacatgccgctggtggatgcggtgcggatc480
agcatgtcgatcccgctcttttttgcggcacgcagacttggcaaacgaagcgatgtgtat540
gtggatggaggtgttatgctcaactacccggtaaagctgttcgacagggagaaatacatc600
gatttggagaaggagaaagaggcagcccgctacgtggagtactacaatcaagagaatgcc660
cggtttctgcttgagcggcccggccgaagcccgtacgtttacaaccggcagaccctaggc720
ctgcggctcgactcgcaggaagagatcggcctgttccgttacgatgagccgctgaagggc780
aaacagatcaaccgcttccccgaatatgccaaagccctgatcggtgcactgatgcaggtg840
caggagaacatccacctgaaaagcgacgactggcagcgaacgctctacatcaacacgctg900
gatgtgggtaccacagatttcgacattaatgacgagaagaaaaaagtgctggtgaatgag960
ggaatcaagggagcggaaacctacttccgctggtttgaggatcccgaagctaaaccggtg1020
aacaaggtggatttggtctga1041
<210>12
<211>346
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>12
MetAlaSerGlnPheArgAsnLeuValPheGluGlyGlyGlyValLys
151015
GlyIleAlaTyrIleGlyAlaMetGlnValLeuGluGlnArgGlyHis
202530
LeuGluHisValValArgValGlyGlyThrSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheSerLeuGlyPheThrIleLysGluGlnGlnAspIle
505560
LeuAsnSerThrAsnPheArgGluPheMetAspSerSerPheGlyPhe
65707580
ValArgAsnPheArgArgLeuTrpSerGluPheGlyTrpAsnArgGly
859095
AspValPheSerGluTrpAlaGlyGluLeuValLysGluLysLeuGly
100105110
LysLysAsnAlaThrPheGlyAspLeuLysLysAlaLysArgProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheSerGluThrPhe
130135140
SerHisGluArgHisAlaAsnMetProLeuValAspAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaArgArgLeuGlyLysArg
165170175
SerAspValTyrValAspGlyGlyValMetLeuAsnTyrProValLys
180185190
LeuPheAspArgGluLysTyrIleAspLeuGluLysGluLysGluAla
195200205
AlaArgTyrValGluTyrTyrAsnGlnGluAsnAlaArgPheLeuLeu
210215220
GluArgProGlyArgSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerGlnGluGluIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysGlnIleAsnArgPheProGluTyrAlaLysAla
260265270
LeuIleGlyAlaLeuMetGlnValGlnGluAsnIleHisLeuLysSer
275280285
AspAspTrpGlnArgThrLeuTyrIleAsnThrLeuAspValGlyThr
290295300
ThrAspPheAspIleAsnAspGluLysLysLysValLeuValAsnGlu
305310315320
GlyIleLysGlyAlaGluThrTyrPheArgTrpPheGluAspProGlu
325330335
AlaLysProValAsnLysValAspLeuVal
340345
<210>13
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>13
atgacaacacaatttagaaacttgatatttgaaggcggcggtgtaaaaggtgttgcttac60
attggcgccatgcagattctcgaaaatcgtggcgtgttgcaagatattcacagagtcgga120
gggtgcagtgcgggtgcgatcaacgcgctgatttttgcgctgggttacacggtccgtgag180
caaaaagagatcttacaagccacggattttaaccagtttatggataactcttggggtgtt240
attcgtgatattcgcaggcttgctcgagactttggctggcacaagggtgacttctttaat300
agctggataggtgatttgattcatcgtcgtttggggaatcgccgagcgacgttcaaagat360
ctgcaaaaggccaagcttcctgatctttatgtcatcggtactaatctgtctacagggtat420
gcagaggttttttcagccgaaagacaccccgatatggagctagcgacagcggtgcgtatc480
tccatgtcgataccgctgttctttgcggccgtgcgtcacggtgaacgacaagatgtgtat540
gtcgatgggggtgttcaacttaactatccgattaaactgtttgatcgggagcgttacatt600
gatctggtcaaagatcccggtgccgttcggcgaacgggttattacaacaaagaaaacgct660
cgctttcagcttgagcggccgggccatagcccctatgtttacaatcgccagaccttgggt720
ttgcgactggatagtcgagaggagatagggctctttcgttatgacgaacccctcaagggc780
aaacccattaagtccttcactgactacgctcgacaacttttcggtgcgttgatgaatgca840
caggaaaacattcatctacatggcgatgattgggcgcgcacggtctatatcgatacattg900
gatgtgggtacgacggatttcaatctttctgatgcaaccaagcaagcactgattgagcaa960
ggaattaacggcaccgaaaattatttcgactggtttgataatccgttagagaagcctgtg1020
aatagagtggagtcatag1038
<210>14
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>14
MetThrThrGlnPheArgAsnLeuIlePheGluGlyGlyGlyValLys
151015
GlyValAlaTyrIleGlyAlaMetGlnIleLeuGluAsnArgGlyVal
202530
LeuGlnAspIleHisArgValGlyGlyCysSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheAlaLeuGlyTyrThrValArgGluGlnLysGluIle
505560
LeuGlnAlaThrAspPheAsnGlnPheMetAspAsnSerTrpGlyVal
65707580
IleArgAspIleArgArgLeuAlaArgAspPheGlyTrpHisLysGly
859095
AspPhePheAsnSerTrpIleGlyAspLeuIleHisArgArgLeuGly
100105110
AsnArgArgAlaThrPheLysAspLeuGlnLysAlaLysLeuProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyTyrAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetGluLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaValArgHisGlyGluArg
165170175
GlnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProIleLys
180185190
LeuPheAspArgGluArgTyrIleAspLeuValLysAspProGlyAla
195200205
ValArgArgThrGlyTyrTyrAsnLysGluAsnAlaArgPheGlnLeu
210215220
GluArgProGlyHisSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerArgGluGluIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysProIleLysSerPheThrAspTyrAlaArgGln
260265270
LeuPheGlyAlaLeuMetAsnAlaGlnGluAsnIleHisLeuHisGly
275280285
AspAspTrpAlaArgThrValTyrIleAspThrLeuAspValGlyThr
290295300
ThrAspPheAsnLeuSerAspAlaThrLysGlnAlaLeuIleGluGln
305310315320
GlyIleAsnGlyThrGluAsnTyrPheAspTrpPheAspAsnProLeu
325330335
GluLysProValAsnArgValGluSer
340345
<210>15
<211>1344
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>15
atgctggtcatcattcatggctggagcgatgaggcgggctcgttcaagaccctggccaga60
cgtttggccaaggcgccacccgagggcctcgggacgcaggtcacggaaatccatctgggt120
gattatgtgtccctggatgaccaggtgacgttcaatgatctggtcgatgccatggccaga180
gcctggagcgatcgtggtctgcccacggccccgcgcagcgtcgatgccgtcgtgcacagc240
accggcggcctggtgatccgcgactggctcacgcagctgtacacgccggaaacagccccc300
attcgtcgcctgctgatgctcgctccggccaatttcggctcgccgctggcacacaccgga360
cgcagcatgatcggccgggtcaccaagggctggaagggcacgcggctctttgaaacgggc420
aagcacattctcaaagggctcgaactggccagcccctacgcctgggcgctggccgaacgc480
gatctgttcagcgatcagaactattatggcgccgggcgcatcctgtgcactgtcctggtg540
ggcaacgccggttatcgcggcatcagcgccgtcgccaaccggcccggcacggacggcacc600
gtgcgcgtcagcagcgccaatctccaagcggccaggatgctgctcgatttcagcgccagt660
ccacaggctgagccggaattcaccctgcacgacagcaccgcggaaattgccttcggcatc720
gccgacgaggaagaccacagcaccatcgccgccaaggatcgcggcccgcgcaaggcagtc780
acctgggaactgattctcaaagccctgcagatcgaggatgcaagctttgctcaatggtgc840
cggcagatgcaggagcattccgcggccgtgacggaaacggcggaaaagcgccgcaatgtt900
cactacaacagcttccagaataccgtcgtgcgcgtggtggacaaccacggtgccgccgtg960
caggattatctcatcgagttttacatgaatgatgatcgcaaactccgcgatcagcgcctc1020
acccagcgcctgcaggagcaggtgattaccaacgtgcacggctacggtgacgacaagtcc1080
tatcgcagcatgctgatcaactgcacggagctctatgcgctgatgtccagaccgcaggat1140
cgcctgaacatcagcatcaccgcctatccggatctctccaagggactggtggggtatcgc1200
acctacacggacgaggatatcggttccctctctctggatgcagcgcagatccgaaagctc1260
tttaagccgcaccgtaccctgttgatgacactgtgcctgcaacgctatcagaaagatgat1320
gtgttccgattcagggatgtttga1344
<210>16
<211>447
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>16
MetLeuValIleIleHisGlyTrpSerAspGluAlaGlySerPheLys
151015
ThrLeuAlaArgArgLeuAlaLysAlaProProGluGlyLeuGlyThr
202530
GlnValThrGluIleHisLeuGlyAspTyrValSerLeuAspAspGln
354045
ValThrPheAsnAspLeuValAspAlaMetAlaArgAlaTrpSerAsp
505560
ArgGlyLeuProThrAlaProArgSerValAspAlaValValHisSer
65707580
ThrGlyGlyLeuValIleArgAspTrpLeuThrGlnLeuTyrThrPro
859095
GluThrAlaProIleArgArgLeuLeuMetLeuAlaProAlaAsnPhe
100105110
GlySerProLeuAlaHisThrGlyArgSerMetIleGlyArgValThr
115120125
LysGlyTrpLysGlyThrArgLeuPheGluThrGlyLysHisIleLeu
130135140
LysGlyLeuGluLeuAlaSerProTyrAlaTrpAlaLeuAlaGluArg
145150155160
AspLeuPheSerAspGlnAsnTyrTyrGlyAlaGlyArgIleLeuCys
165170175
ThrValLeuValGlyAsnAlaGlyTyrArgGlyIleSerAlaValAla
180185190
AsnArgProGlyThrAspGlyThrValArgValSerSerAlaAsnLeu
195200205
GlnAlaAlaArgMetLeuLeuAspPheSerAlaSerProGlnAlaGlu
210215220
ProGluPheThrLeuHisAspSerThrAlaGluIleAlaPheGlyIle
225230235240
AlaAspGluGluAspHisSerThrIleAlaAlaLysAspArgGlyPro
245250255
ArgLysAlaValThrTrpGluLeuIleLeuLysAlaLeuGlnIleGlu
260265270
AspAlaSerPheAlaGlnTrpCysArgGlnMetGlnGluHisSerAla
275280285
AlaValThrGluThrAlaGluLysArgArgAsnValHisTyrAsnSer
290295300
PheGlnAsnThrValValArgValValAspAsnHisGlyAlaAlaVal
305310315320
GlnAspTyrLeuIleGluPheTyrMetAsnAspAspArgLysLeuArg
325330335
AspGlnArgLeuThrGlnArgLeuGlnGluGlnValIleThrAsnVal
340345350
HisGlyTyrGlyAspAspLysSerTyrArgSerMetLeuIleAsnCys
355360365
ThrGluLeuTyrAlaLeuMetSerArgProGlnAspArgLeuAsnIle
370375380
SerIleThrAlaTyrProAspLeuSerLysGlyLeuValGlyTyrArg
385390395400
ThrTyrThrAspGluAspIleGlySerLeuSerLeuAspAlaAlaGln
405410415
IleArgLysLeuPheLysProHisArgThrLeuLeuMetThrLeuCys
420425430
LeuGlnArgTyrGlnLysAspAspValPheArgPheArgAspVal
435440445
<210>17
<211>1137
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>17
atgaaaaaaagccttcaacaacatcttgccgctgacggcagcccaaagaatattctttct60
ctcgacgggggaggaatcagaggggctttgacccttggttttctcaaaaaaatagaaagc120
atcctgcaggaaaaacatgggaaggactatctcctttgcgatcactttgatttgatcggt180
ggaacttccacaggctccatcattgcagcagcattggctataggcatgacagtggaggaa240
atcactaaaatgtatatggatctgggcggaaaaattttcggcaagaaaaggagtttctgg300
agaccctgggaaactgcgaaatacttgaaagcaggatatgaccacaaagctcttgaaaag360
agtctgaaagatgctttccaggattttcttttaggaagtgaccaaattagaacaggtctt420
tgtatagtagccaaaagagcagataccaatagtatatggccattgattaaccaccccaaa480
ggaaaattctatgattcagaacaaggcaaaaacaaaaatatccccttatggcaggcagta540
agggcgagtaccgctgctccaacctatttcgctccacaattaatagatgtgggtgatggt600
caaaaggctgcttttgtggacggaggggtaagcatggccaataaccccgcattaaccctg660
ttaaaagtggctacacttaaaggttttccttttcattggccaatgggagaagacaaactg720
accatagtttcagtaggcaccggatatagtgttttccaaagacaaaagggtgaaatcacc780
aaagcttccttattaacttgggccaaaaacgtcccggaaatgttgatgcaggatgcttct840
tggcagaatcagaccatacttcagtggatttctaaatcccccactgcacattccatagat900
atggaaatggaagaccttagagatgactttctaggcggaagaccactcatcaaatacctc960
aggtacaacttccccttgacagtaaatgatctcaatggattgaagcttgggaaaagcttt1020
acccaaaaagaggtcgaagatttggtggaaatgagcaatgcacataaccgagaggagttg1080
tataggattggggagaaggcggctgaagggtcggtaaaaaaagaacattttgaataa1137
<210>18
<211>378
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>18
MetLysLysSerLeuGlnGlnHisLeuAlaAlaAspGlySerProLys
151015
AsnIleLeuSerLeuAspGlyGlyGlyIleArgGlyAlaLeuThrLeu
202530
GlyPheLeuLysLysIleGluSerIleLeuGlnGluLysHisGlyLys
354045
AspTyrLeuLeuCysAspHisPheAspLeuIleGlyGlyThrSerThr
505560
GlySerIleIleAlaAlaAlaLeuAlaIleGlyMetThrValGluGlu
65707580
IleThrLysMetTyrMetAspLeuGlyGlyLysIlePheGlyLysLys
859095
ArgSerPheTrpArgProTrpGluThrAlaLysTyrLeuLysAlaGly
100105110
TyrAspHisLysAlaLeuGluLysSerLeuLysAspAlaPheGlnAsp
115120125
PheLeuLeuGlySerAspGlnIleArgThrGlyLeuCysIleValAla
130135140
LysArgAlaAspThrAsnSerIleTrpProLeuIleAsnHisProLys
145150155160
GlyLysPheTyrAspSerGluGlnGlyLysAsnLysAsnIleProLeu
165170175
TrpGlnAlaValArgAlaSerThrAlaAlaProThrTyrPheAlaPro
180185190
GlnLeuIleAspValGlyAspGlyGlnLysAlaAlaPheValAspGly
195200205
GlyValSerMetAlaAsnAsnProAlaLeuThrLeuLeuLysValAla
210215220
ThrLeuLysGlyPheProPheHisTrpProMetGlyGluAspLysLeu
225230235240
ThrIleValSerValGlyThrGlyTyrSerValPheGlnArgGlnLys
245250255
GlyGluIleThrLysAlaSerLeuLeuThrTrpAlaLysAsnValPro
260265270
GluMetLeuMetGlnAspAlaSerTrpGlnAsnGlnThrIleLeuGln
275280285
TrpIleSerLysSerProThrAlaHisSerIleAspMetGluMetGlu
290295300
AspLeuArgAspAspPheLeuGlyGlyArgProLeuIleLysTyrLeu
305310315320
ArgTyrAsnPheProLeuThrValAsnAspLeuAsnGlyLeuLysLeu
325330335
GlyLysSerPheThrGlnLysGluValGluAspLeuValGluMetSer
340345350
AsnAlaHisAsnArgGluGluLeuTyrArgIleGlyGluLysAlaAla
355360365
GluGlySerValLysLysGluHisPheGlu
370375
<210>19
<211>1248
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>19
atgaaaaagacaacgttagttttggctctattgatgccatttggtgccgcctccgcacaa60
gacaatagtatgactccagaagcaatcacatcagctcaagtcgcacaaacacaatcagcc120
tccacctatacctacgttaggtgttggtatcgaacagacgcaagccatgattcaccagca180
accgactgggagtgggctagaaaggaaaacggagactattacaccattgacggttactgg240
tggtcatcgatctcctttaaaaatatgttctatagcgagactcctcaacaagagatcaag300
cagcgttgtgtagacaccttggatgttcagcacgacaaagccgacatcacctactttgcc360
gctgacaaccgcttctcttacaaccattctatctggactaacgatcacggctttcaagcg420
aaccaaatcaaccgaatagtcgcttttggcgatagtctttcagacacgggcaacctattt480
aatgggtcacaatggattttccctaaccctaattcttggttcttgggtcacttctctaac540
ggcttcgtttggactgaatacttggctaacgctaagggcgttccactctataactgggct600
gtgggtggcgcagcaggaaccaaccaatatgtcgctctaactggtgtctatgatcaggtc660
acttcgtacctgacttacatgaagatggcgaaaaattatcgcccagagaacacactattc720
acattagagtttggattgaatgactttatgaattacggacgtgaagtagctgatgtaaaa780
gctgactttagtagcgcactgattcgcctcaccgacgctggcgcaaaaaacattctgttg840
ttcaccctaccagatgcgaccaaagcccctcagtttaagtactcaacggcccaagaaatc900
gagacagttcgtggcaagattctggcgttcaaccagttcatcaaagaacaagcagagtac960
tatcaaagcaaaggtgacaacgtgatcctatttgatgcgcacgctctattctctagcatc1020
accagcgacccacaaaaacacgggttcagaaacgcaaaagatgcctgcctagatattaat1080
cgtagtgcatctcaagactacctatacagccatagtctgaccaacgactgtgcaacctat1140
ggttctgatagctatgtattttggggcgtaacacacccaaccacagcaactcataaatac1200
atcgcaacgcatatactgatgaattcaatgtcgaccttcgacttttaa1248
<210>20
<211>415
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(19)
<400>20
MetLysLysThrThrLeuValLeuAlaLeuLeuMetProPheGlyAla
151015
AlaSerAlaGlnAspAsnSerMetThrProGluAlaIleThrSerAla
202530
GlnValAlaGlnThrGlnSerAlaSerThrTyrThrTyrValArgCys
354045
TrpTyrArgThrAspAlaSerHisAspSerProAlaThrAspTrpGlu
505560
TrpAlaArgLysGluAsnGlyAspTyrTyrThrIleAspGlyTyrTrp
65707580
TrpSerSerIleSerPheLysAsnMetPheTyrSerGluThrProGln
859095
GlnGluIleLysGlnArgCysValAspThrLeuAspValGlnHisAsp
100105110
LysAlaAspIleThrTyrPheAlaAlaAspAsnArgPheSerTyrAsn
115120125
HisSerIleTrpThrAsnAspHisGlyPheGlnAlaAsnGlnIleAsn
130135140
ArgIleValAlaPheGlyAspSerLeuSerAspThrGlyAsnLeuPhe
145150155160
AsnGlySerGlnTrpIlePheProAsnProAsnSerTrpPheLeuGly
165170175
HisPheSerAsnGlyPheValTrpThrGluTyrLeuAlaAsnAlaLys
180185190
GlyValProLeuTyrAsnTrpAlaValGlyGlyAlaAlaGlyThrAsn
195200205
GlnTyrValAlaLeuThrGlyValTyrAspGlnValThrSerTyrLeu
210215220
ThrTyrMetLysMetAlaLysAsnTyrArgProGluAsnThrLeuPhe
225230235240
ThrLeuGluPheGlyLeuAsnAspPheMetAsnTyrGlyArgGluVal
245250255
AlaAspValLysAlaAspPheSerSerAlaLeuIleArgLeuThrAsp
260265270
AlaGlyAlaLysAsnIleLeuLeuPheThrLeuProAspAlaThrLys
275280285
AlaProGlnPheLysTyrSerThrAlaGlnGluIleGluThrValArg
290295300
GlyLysIleLeuAlaPheAsnGlnPheIleLysGluGlnAlaGluTyr
305310315320
TyrGlnSerLysGlyAspAsnValIleLeuPheAspAlaHisAlaLeu
325330335
PheSerSerIleThrSerAspProGlnLysHisGlyPheArgAsnAla
340345350
LysAspAlaCysLeuAspIleAsnArgSerAlaSerGlnAspTyrLeu
355360365
TyrSerHisSerLeuThrAsnAspCysAlaThrTyrGlySerAspSer
370375380
TyrValPheTrpGlyValThrHisProThrThrAlaThrHisLysTyr
385390395400
IleAlaThrHisIleLeuMetAsnSerMetSerThrPheAspPhe
405410415
<210>21
<211>1716
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>21
atgcagcagcataaattgaggaatttcaacaagggattgaccggcgtcgtattgagcgta60
ttgacctctaccagcgccatggcttttacacaaatcggtggcggcggcgcgattccgatg120
ggccatgaatggctcacgcgcagatccgcactggaattattaaatgcagaccatatcgtc180
tccaacgacccgctcgacccacgcttgggctggagccagggcttggccaaaaatttggat240
ctctccaatgcattgaacgaagtgcagcgcatccagagcgttaccaagaccaacgcactt300
tatgaaccacgctatgatgacgtgttttctgcgattgtcggcgaacgctgggtggacacg360
gccggtttcaacgttgcgaaggctaccgtcggtaaaatcgattgtttcagcgcggtcgcg420
caagaacctgccgatgttcagcaagaccatttcatgcgtcgttacgatgacgtgggcgga480
caaggtggcgttaacgccgcacgccgcgggcaacaacgtttcatcacccatttcatcaac540
gccgcgatggccgaagaaaaaagcataaaagcgtgggacggcggtggatactccacgctg600
gaaaaagtcagccacaattatttcttgtttggtcgcgctgtgcatttgttccaggattct660
ttcagcccggaacacaccgtgcgtctgccgcaagacaactacgaaaaagtacgtcaggta720
aaagcctatctgtgttccgaaggcgcagagcaacatacgcataacgcgcaggatgcgatc780
agcttcaccagcggcgacgttatctggaagaaaaacacccgtctggatgccggctggagc840
acctacaaacccagcaatatgaaacccgttgccttggtggcgatggaagcctcgaaggac900
ttgtgggccgccttcattcgcaccatggccgcaccgcgcagcgagcgtcgcgccattgct960
cagcaagaggcacaaacgctggtaaacaactggttgtcgttcgacgaacaggaaatgctg1020
agctggtacgacgaagaaactcatcgcgatcacacttacgtgctcgaacccggccagaac1080
ggccccggtatttccatgttcgattgcatggtgggtctgggcgtgacgtctggcagccag1140
gctgcgcgtgtggccgaactggatcaacaacgtcgccagtgcttgttcaacgtcaaggcc1200
accaccggttacagcgatctgaacgatccgcacatggatatcccgtataactggcaatgg1260
acgtcgaccacgcagtggaaagtgccaagcgcgagctggacgattccgcagttgccggcc1320
gacgcaggcaagaaagtgacgatcaaaaacgccatcaacggcaatccgctggtagcgccg1380
gctggcgtcaaacacaacagcgatatttattccgcgccgggtgaagccatcgaattcatt1440
ttcgtcggtgactacaacaatgagtcttatctgcgctcgaaaaaagatgcggatttgttc1500
ttgagctacagtgcggtatccggcaagggcttgctgtacaacacaccgaatcaggcaggt1560
tatcgcgtgaaaccggcgggcgtgctgtggacgatcgagaacacctactggaatgatttc1620
ctgtggttcaacagttcgaacaaccgcatctacgtaagcggcacgggcgatgccaacaag1680
ttacattcacagtggatcattgacggtctgaaataa1716
<210>22
<211>571
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(28)
<400>22
MetGlnGlnHisLysLeuArgAsnPheAsnLysGlyLeuThrGlyVal
151015
ValLeuSerValLeuThrSerThrSerAlaMetAlaPheThrGlnIle
202530
GlyGlyGlyGlyAlaIleProMetGlyHisGluTrpLeuThrArgArg
354045
SerAlaLeuGluLeuLeuAsnAlaAspHisIleValSerAsnAspPro
505560
LeuAspProArgLeuGlyTrpSerGlnGlyLeuAlaLysAsnLeuAsp
65707580
LeuSerAsnAlaLeuAsnGluValGlnArgIleGlnSerValThrLys
859095
ThrAsnAlaLeuTyrGluProArgTyrAspAspValPheSerAlaIle
100105110
ValGlyGluArgTrpValAspThrAlaGlyPheAsnValAlaLysAla
115120125
ThrValGlyLysIleAspCysPheSerAlaValAlaGlnGluProAla
130135140
AspValGlnGlnAspHisPheMetArgArgTyrAspAspValGlyGly
145150155160
GlnGlyGlyValAsnAlaAlaArgArgGlyGlnGlnArgPheIleThr
165170175
HisPheIleAsnAlaAlaMetAlaGluGluLysSerIleLysAlaTrp
180185190
AspGlyGlyGlyTyrSerThrLeuGluLysValSerHisAsnTyrPhe
195200205
LeuPheGlyArgAlaValHisLeuPheGlnAspSerPheSerProGlu
210215220
HisThrValArgLeuProGlnAspAsnTyrGluLysValArgGlnVal
225230235240
LysAlaTyrLeuCysSerGluGlyAlaGluGlnHisThrHisAsnAla
245250255
GlnAspAlaIleSerPheThrSerGlyAspValIleTrpLysLysAsn
260265270
ThrArgLeuAspAlaGlyTrpSerThrTyrLysProSerAsnMetLys
275280285
ProValAlaLeuValAlaMetGluAlaSerLysAspLeuTrpAlaAla
290295300
PheIleArgThrMetAlaAlaProArgSerGluArgArgAlaIleAla
305310315320
GlnGlnGluAlaGlnThrLeuValAsnAsnTrpLeuSerPheAspGlu
325330335
GlnGluMetLeuSerTrpTyrAspGluGluThrHisArgAspHisThr
340345350
TyrValLeuGluProGlyGlnAsnGlyProGlyIleSerMetPheAsp
355360365
CysMetValGlyLeuGlyValThrSerGlySerGlnAlaAlaArgVal
370375380
AlaGluLeuAspGlnGlnArgArgGlnCysLeuPheAsnValLysAla
385390395400
ThrThrGlyTyrSerAspLeuAsnAspProHisMetAspIleProTyr
405410415
AsnTrpGlnTrpThrSerThrThrGlnTrpLysValProSerAlaSer
420425430
TrpThrIleProGlnLeuProAlaAspAlaGlyLysLysValThrIle
435440445
LysAsnAlaIleAsnGlyAsnProLeuValAlaProAlaGlyValLys
450455460
HisAsnSerAspIleTyrSerAlaProGlyGluAlaIleGluPheIle
465470475480
PheValGlyAspTyrAsnAsnGluSerTyrLeuArgSerLysLysAsp
485490495
AlaAspLeuPheLeuSerTyrSerAlaValSerGlyLysGlyLeuLeu
500505510
TyrAsnThrProAsnGlnAlaGlyTyrArgValLysProAlaGlyVal
515520525
LeuTrpThrIleGluAsnThrTyrTrpAsnAspPheLeuTrpPheAsn
530535540
SerSerAsnAsnArgIleTyrValSerGlyThrGlyAspAlaAsnLys
545550555560
LeuHisSerGlnTrpIleIleAspGlyLeuLys
565570
<210>23
<211>1473
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>23
atgacgatccgctcgaccgactacgcgctgctcgcgcaggagagctaccacgacagccag60
gtcgatgctgacgtcaagctcgatggcatctcctacaaggtattcgccaccacggacgac120
cccctcaccggcttccaggccaccgcttaccagcgccaggatacgggcgaggtggtcatc180
gcctaccgcggcacggaattcgaccgcgaacccgtgcgcgatggcggcgtcgacgcaggc240
atggtgttgcttggcgtcaacgcccagtcacctgcatccgaggtattcacccgcgaagtg300
atcgaaaaggcgaagcacgaagccgagctcaacgatcgcgagccgaagatcaccgtcacc360
gggcattccctcggcggcaccctcgccgaaatcaatgccgcgaaatacggcctccacggc420
gaaaccttcaatgcctacggtgcggccagcctcaagggcatccccgagggcggcgacacg480
gtgatcgaccatgtccgcgccggcgatctcgtcagcgccgccagcccgcactacgggcag540
gtgcgtgtgtacgcagctcagcaggatatcgataccctgcaacatgccggctaccgcgac600
gacagtggcatcttcagcctgcgcaaccccatcaaggccacggatttcgacgcccacgcg660
atcgataacttcgtgcccaacagcaagctgcttggccaatcgatcatcgctcctgagaac720
gaagcccgttacgaagcccacaagggcatgatcgatcgctatcgcgatgacgtggccgat780
atccggaaaggcatctccgctccctgggaaatccccaaggccgtcggcgagctgaaggac840
aagctcgaacacgaagccttcgagctggccggcaagggcatcctcgccgtcgagcacggt900
gtagccgaggtcgttcacgaggcgaaggaagggttcgatcatctcaaggaaggcttgcac960
cacgtcagggaagagatcagcgagggcatccacgccgtggaagagaaggcttccagcgca1020
tggcacaccctcacccacccgaaggaatggttcgagcacgacaaacctcaagtgaatctc1080
gaccatccccagcatccagacaacgccttgttcaagcaggcgcagggcgcggtacacgcc1140
ctcgatgccacgcaaggccgcacgccagataggacgagcgaccagatcgcaggttctctg1200
gtggtcgcggcgcgacgcgatggtctcgagcgggtggaccgcgccgtgctcagcgatgac1260
actagccggctctacggcgtgcagggtgcgacggattcgcccttgaagcagttcaccgag1320
gtgaacacgacagtggcggcgcaaacgtcactgcagcaaagcagccaggcatggcagcag1380
caagcagagatcgcgcgacagaaccaggcaaccagccaggctcagcgcatggaaccgcag1440
gtgcccccgcaggcaccggcacatggcatgtaa1473
<210>24
<211>490
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>24
MetThrIleArgSerThrAspTyrAlaLeuLeuAlaGlnGluSerTyr
151015
HisAspSerGlnValAspAlaAspValLysLeuAspGlyIleSerTyr
202530
LysValPheAlaThrThrAspAspProLeuThrGlyPheGlnAlaThr
354045
AlaTyrGlnArgGlnAspThrGlyGluValValIleAlaTyrArgGly
505560
ThrGluPheAspArgGluProValArgAspGlyGlyValAspAlaGly
65707580
MetValLeuLeuGlyValAsnAlaGlnSerProAlaSerGluValPhe
859095
ThrArgGluValIleGluLysAlaLysHisGluAlaGluLeuAsnAsp
100105110
ArgGluProLysIleThrValThrGlyHisSerLeuGlyGlyThrLeu
115120125
AlaGluIleAsnAlaAlaLysTyrGlyLeuHisGlyGluThrPheAsn
130135140
AlaTyrGlyAlaAlaSerLeuLysGlyIleProGluGlyGlyAspThr
145150155160
ValIleAspHisValArgAlaGlyAspLeuValSerAlaAlaSerPro
165170175
HisTyrGlyGlnValArgValTyrAlaAlaGlnGlnAspIleAspThr
180185190
LeuGlnHisAlaGlyTyrArgAspAspSerGlyIlePheSerLeuArg
195200205
AsnProIleLysAlaThrAspPheAspAlaHisAlaIleAspAsnPhe
210215220
ValProAsnSerLysLeuLeuGlyGlnSerIleIleAlaProGluAsn
225230235240
GluAlaArgTyrGluAlaHisLysGlyMetIleAspArgTyrArgAsp
245250255
AspValAlaAspIleArgLysGlyIleSerAlaProTrpGluIlePro
260265270
LysAlaValGlyGluLeuLysAspLysLeuGluHisGluAlaPheGlu
275280285
LeuAlaGlyLysGlyIleLeuAlaValGluHisGlyValAlaGluVal
290295300
ValHisGluAlaLysGluGlyPheAspHisLeuLysGluGlyLeuHis
305310315320
HisValArgGluGluIleSerGluGlyIleHisAlaValGluGluLys
325330335
AlaSerSerAlaTrpHisThrLeuThrHisProLysGluTrpPheGlu
340345350
HisAspLysProGlnValAsnLeuAspHisProGlnHisProAspAsn
355360365
AlaLeuPheLysGlnAlaGlnGlyAlaValHisAlaLeuAspAlaThr
370375380
GlnGlyArgThrProAspArgThrSerAspGlnIleAlaGlySerLeu
385390395400
ValValAlaAlaArgArgAspGlyLeuGluArgValAspArgAlaVal
405410415
LeuSerAspAspThrSerArgLeuTyrGlyValGlnGlyAlaThrAsp
420425430
SerProLeuLysGlnPheThrGluValAsnThrThrValAlaAlaGln
435440445
ThrSerLeuGlnGlnSerSerGlnAlaTrpGlnGlnGlnAlaGluIle
450455460
AlaArgGlnAsnGlnAlaThrSerGlnAlaGlnArgMetGluProGln
465470475480
ValProProGlnAlaProAlaHisGlyMet
485490
<210>25
<211>1098
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>25
atgtgcgccaaagttaaagtagtcaaaataaagacaaacacaggcagcccaaacaaatac60
cacttcaagaacctcgtcttcgaaggcggcggcgtgaaaggcattgcctatgtgggagcc120
cttaccaagctcgacgaggaaggcatccttcaaaacattaagcgcgtggccggcacctca180
gcaggagcaatggtggccgtcctcgtcggattgggcttcaccgctaaggagataagcgac240
atcctgtgggacatcaaattccagaactttttagacaactcatggggcgtgatacgcaac300
accaatcgtctgctgacggaatacggctggtataagggcgagtttttccgcgacctcatg360
gctgattacatcaaaagaaagacagacgatggcgagattactttcggggagttggaggcc420
atgagaaaagagggcaagcccttcttggaaatccatctggttggctccgacctcacgaca480
gggtattccagagtgttcaactccaaaaacaccccaaatgtgaaagtcgccgatgccgcc540
cgcatctccatgtcgataccgctgtttttctccgctgtgagaggcgtgcaaggcgacgac600
cacctctatgtggacggtgggcttttggacaactacgccatcaagattttcgaccagtcg660
aaactcgtttcagacaaaaacaacaaaaggaagaccgagtattacaacaggctcaaccag720
caagtgaacgcgaaagcaacgaaaagcaagacggaatctgtagagtatgtctacaacaag780
gagactttgggcttccgcttggatgccaaagaggacatcaacctcttcctcaaccacgat840
gatgcccctcaaaaagaaatcaagagtttcttctcttacaccaaagctttggtttccacg900
ctcatcgatttccagaacaatgtacacctgcacagcgacgactggcagcgtacggtctac960
atcgacacactcggtgtcagctccattgacttcggtctgtcaaacacaacgaaacaagct1020
cttgtcgattcgggctacaactacaccacagcctacctcgactggtacaacaacgacgag1080
gataaagccaacaagtaa1098
<210>26
<211>365
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>26
MetCysAlaLysValLysValValLysIleLysThrAsnThrGlySer
151015
ProAsnLysTyrHisPheLysAsnLeuValPheGluGlyGlyGlyVal
202530
LysGlyIleAlaTyrValGlyAlaLeuThrLysLeuAspGluGluGly
354045
IleLeuGlnAsnIleLysArgValAlaGlyThrSerAlaGlyAlaMet
505560
ValAlaValLeuValGlyLeuGlyPheThrAlaLysGluIleSerAsp
65707580
IleLeuTrpAspIleLysPheGlnAsnPheLeuAspAsnSerTrpGly
859095
ValIleArgAsnThrAsnArgLeuLeuThrGluTyrGlyTrpTyrLys
100105110
GlyGluPhePheArgAspLeuMetAlaAspTyrIleLysArgLysThr
115120125
AspAspGlyGluIleThrPheGlyGluLeuGluAlaMetArgLysGlu
130135140
G1yLysProPheLeuGluIleHisLeuValGlySerAspLeuThrThr
145150155160
GlyTyrSerArgValPheAsnSerLysAsnThrProAsnValLysVal
165170175
AlaAspAlaAlaArgIleSerMetSerIleProLeuPhePheSerAla
180185190
ValArgGlyValGlnGlyAspAspHisLeuTyrValAspGlyGlyLeu
195200205
LeuAspAsnTyrAlaIleLysIlePheAspGlnSerLysLeuValSer
210215220
AspLysAsnAsnLysArgLysThrGluTyrTyrAsnArgLeuAsnGln
225230235240
GlnValAsnAlaLysAlaThrLysSerLysThrGluSerValGluTyr
245250255
ValTyrAsnLysGluThrLeuGlyPheArgLeuAspAlaLysGluAsp
260265270
IleAsnLeuPheLeuAsnHisAspAspAlaProGlnLysGluIleLys
275280285
SerPhePheSerTyrThrLysAlaLeuValSerThrLeuIleAspPhe
290295300
GlnAsnAsnValHisLeuHisSerAspAspTrpGlnArgThrValTyr
305310315320
IleAspThrLeuGlyValSerSerIleAspPheGlyLeuSerAsnThr
325330335
ThrLysGlnAlaLeuValAspSerGlyTyrAsnTyrThrThrAlaTyr
340345350
LeuAspTrpTyrAsnAsnAspGluAspLysAlaAsnLys
355360365
<210>27
<211>1287
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>27
gtgtcgattaccgtttaccggaagccctccggcgggtttggagcgatagttcctcaagcg60
aaaattgagaaccttgttttcgagggcggcggaccaaagggcctggtctatgtcggcgcg120
gtcgaggttctcggcgaaaggggactgctggaagggatcgcaaatgtcggcggcgcttca180
gcaggcgccatgaccgctctagccgtcggtctgggactgagccccagggaaattcgcgcg240
gtcgtctttaaccagaacattgcggacctcaccgatatcgagaagaccgtcgagccgtcc300
tccgggattacaggcatgttcaagagcgtgttcaagaagggttggcaggcggtgcgcaac360
gtaaccggcacctctgacgagcgcgggcgcgggctctatcgcggcgagaagttgcgagcc420
tggatcagagacctgattgcacagcgagtcgaggcggggcgctccgaggtcctgagccga480
gccgacgccgatggacggaacttctatgagaaagccgccgcaaagaagggcgccctgaca540
tttgccgagcttgatcgggtggcgcaaatggcgccgggcctgcggcttcgccgcctggcc600
ttcaccggaaccaacttcacgtcgaagaagctcgaagtgttcagtctgcacgagaccccg660
gacatgccgatcgacgtcgcggtacgcatctccgcatcgttgccatggtttttcaaatcc720
gtgaaatggaacggctccgaatacatagatggcggctgcctgtcgaacttcccaatgccg780
atattcgacgtcgatccctatcgtggcgacgcatcgtcgaaaatccggctcggcatcttc840
ggccagaacctcgcgacgctcggcttcaaggtcgacagcgaggaggagatccgcgacatt900
ctctggcgtagccccgagagcacgagcgacggctttttccaaggcatcctgtcaagcgtg960
aaagcttctgcagaacactgggtcgtcggcatcgacgtcgaaggcgccacccgcgcgtcg1020
aacgtggccgttcacggcaagtatgctcagcgaacgatccagataccggacctcggatat1080
agcacgttcaagttcgatctttcggacgctgacaaggagcgcatggccgaggccggcgca1140
aaggccacgcgggaatggctggcgctgtacttcgacgacgccggaatagaggtcgaattt1200
tctgatccgaacgaattgcgcggccagttgtccgacgccgcattcgcagacctcgaggat1260
tcgtttcgagccttgatcgcggcctag1287
<210>28
<211>428
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>28
MetSerIleThrValTyrArgLysProSerGlyGlyPheGlyAlaIle
151015
ValProGlnAlaLysIleGluAsnLeuValPheGluGlyGlyGlyPro
202530
LysGlyLeuValTyrValGlyAlaValGluValLeuGlyGluArgGly
354045
LeuLeuGluGlyIleAlaAsnValGlyGlyAlaSerAlaGlyAlaMet
505560
ThrAlaLeuAlaValGlyLeuGlyLeuSerProArgGluIleArgAla
65707580
ValValPheAsnGlnAsnIleAlaAspLeuThrAspIleGluLysThr
859095
ValGluProSerSerGlyIleThrGlyMetPheLysSerValPheLys
100105110
LysGlyTrpGlnAlaValArgAsnValThrGlyThrSerAspGluArg
115120125
GlyArgGlyLeuTyrArgGlyGluLysLeuArgAlaTrpIleArgAsp
130135140
LeuIleAlaGlnArgValGluAlaGlyArgSerGluValLeuSerArg
145150155160
AlaAspAlaAspGlyArgAsnPheTyrGluLysAlaAlaAlaLysLys
165170175
GlyAlaLeuThrPheAlaGluLeuAspArgValAlaGlnMetAlaPro
180185190
GlyLeuArgLeuArgArgLeuAlaPheThrGlyThrAsnPheThrSer
195200205
LysLysLeuGluValPheSerLeuHisGluThrProAspMetProIle
210215220
AspValAlaValArgIleSerAlaSerLeuProTrpPhePheLysSer
225230235240
ValLysTrpAsnGlySerGluTyrIleAspGlyGlyCysLeuSerAsn
245250255
PheProMetProIlePheAspValAspProTyrArgGlyAspAlaSer
260265270
SerLysIleArgLeuGlyIlePheGlyGlnAsnLeuAlaThrLeuGly
275280285
PheLysValAspSerGluGluGluIleArgAspIleLeuTrpArgSer
290295300
ProGluSerThrSerAspGlyPhePheGlnGlyIleLeuSerSerVal
305310315320
LysAlaSerAlaGluHisTrpValValGlyIleAspValGluGlyAla
325330335
ThrArgAlaSerAsnValAlaValHisGlyLysTyrAlaGlnArgThr
340345350
IleGlnIleProAspLeuGlyTyrSerThrPheLysPheAspLeuSer
355360365
AspAlaAspLysGluArgMetAlaGluAlaGlyAlaLysAlaThrArg
370375380
GluTrpLeuAlaLeuTyrPheAspAspAlaGlyIleGluValGluPhe
385390395400
SetAspProAsnGluLeuArgGlyGlnLeuSerAspAlaAlaPheAla
405410415
AspLeuGluAspSerPheArgAlaLeuIleAlaAla
420425
<210>29
<211>753
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>29
atgggaaacggtgcagcagttggttcgaatgataatggtagagaagaaagtgtttacgta60
ctttctgtgatcgcctgtaatgtttattatttacaaaagtgtgaaggtggggcatcgcgt120
gatagcgtgattagagaaatcaatagccaaactcaacctttaggatatgagattgtagca180
gattctattcgtgatggtcatattggctcttttgcctgtaagatggctgtctttagaaat240
aatggaaacggcaattgtgttttagcaatcaaagggactgatatgaataatatcaatgac300
ttggtgaatgacctaaccatgatattaggaggtattggttctgttgctgcaatccaacca360
acgattaacatggcacaagaactcatcgaccaatatggagtgaatttgattacaggtcac420
tcccttggaggctacatgactgagatcatcgccaccaatcgtggacttccaggtattgca480
ttttgcgcaccaggttcaaatggtcccattgtaaaattaggtggacaagagacacctggc540
tttcacaatgtgaactttgaacatgatccagcaggtaacgttatgacgggggtttatact600
catgtccaatggagtatttatgtaggatgtgatggtatgactcatggtattgaaaatatg660
gtgaattattttaaagataaaagagatttaaccaatcgcaatattcaaggaagaagtgaa720
agtcataatacgggttattattacccaaaataa753
<210>30
<211>250
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>30
MetGlyAsnGlyAlaAlaValGlySerAsnAspAsnGlyArgGluGlu
151015
SerValTyrValLeuSerValIleAlaCysAsnValTyrTyrLeuGln
202530
LysCysGluGlyGlyAlaSerArgAspSerValIleArgGluIleAsn
354045
SerGlnThrGlnProLeuGlyTyrGluIleValAlaAspSerIleArg
505560
AspGlyHisIleGlySerPheAlaCysLysMetAlaValPheArgAsn
65707580
AsnGlyAsnGlyAsnCysValLeuAlaIleLysGlyThrAspMetAsn
859095
AsnIleAsnAspLeuValAsnAspLeuThrMetIleLeuGlyGlyIle
100105110
GlySerValAlaAlaIleGlnProThrIleAsnMetAlaGlnGluLeu
115120125
IleAspGlnTyrGlyValAsnLeuIleThrGlyHisSerLeuGlyGly
130135140
TyrMetThrGluIleIleAlaThrAsnArgGlyLeuProGlyIleAla
145150155160
PheCysAlaProGlySerAsnGlyProIleValLysLeuGlyGlyGln
165170175
GluThrProGlyPheHisAsnValAsnPheGluHisAspProAlaGly
180185190
AsnValMetThrGlyValTyrThrHisValGlnTrpSerIleTyrVal
195200205
GlyCysAspGlyMetThrHisGlyIleGluAsnMetValAsnTyrPhe
210215220
LysAspLysArgAspLeuThrAsnArgAsnIleGlnGlyArgSerGlu
225230235240
SerHisAsnThrGlyTyrTyrTyrProLys
245250
<210>31
<211>1422
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>31
atgaaaaagaaattatgtacatgggctctcgtaacagcgatatcttctggagttgttgcg60
attccaaccgtagcatctgcttgcggaatgggtgaagtaatgaaacaggaggatcaagag120
cacaaacgtgtgaagagatggtctgcggagcatccgcaccatgctaatgaaagcacgcac180
ttatggattgctcgaaatgcgattcaaattatgagtcgtaatcaagataagacggttcaa240
gaaaatgaattacaattcttaaaaatacctgaatataaggagttatttgaaagagggctt300
tatgatgccgattatcttgatgagtttaacgatggaggtacaggtacaatcggtattgat360
gggctaattaaaggaggctggaaatctcatttctatgatcctgatacgaaaaagaactat420
aaaggagaagaagaaccaacagccctttcgcaaggggataaatattttaaattagcagga480
gattattttaagaaagaagattggaaacaagctttctattatttaggtgttgcgacgcat540
tacttcacagatgctactcagccaatgcatgctgctaattttacagctgtcgacatgagt600
gcaataaagtttcatagcgcttttgaaaattatgtaacgacagttcagacaccgtttgaa660
gtgaaggatgataagggaacatataatttggtcaattctgatgatccgaagcagtggata720
catgaaacagcgaaactcgcaaaagcagaaattatgaatattactagtgataatattaaa780
tctcaatataataaaggaaacaaagatctttggcaacaagaagttatgccagctgtccag840
aggagtttagagaaagcgcaaagaaacacggcgggatttattcatttatggtttaaaaca900
tatgttggcaaaactgcagctgaagatattgaaactacacaggtaaaagattctaatgga960
gaagcaatacaagaacaaaaaaaatactacgttgtgcctagtgagtttttaaatagaggt1020
ttgacctttgaggtatatgcttcgaatgactacgcactattatctaatcacgtagatgat1080
aataaagttcatggtacacctgttcagtttgtttttgataaagagaataacggaattgtt1140
catcggggagaaagtgtactgctgaaaatgacgcaatctaactatgatgattatgtattt1200
cttaattactctaatatgacaaattggttacatcttgcgaaacgaaaaacaaatactgca1260
cagtttaaagtgtatccaaatccggataactcatctgaatatttcctatatacagatgga1320
tacccggtaaattatcaagaaaatggtaatgggaagagctggattgagttaggaaagaaa1380
acggataaaccgaaagcgtggaaatttcaacaggcagaataa1422
<210>32
<211>473
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(20)
<400>32
MetLysLysLysLeuCysThrTrpAlaLeuValThrAlaIleSerSer
151015
GlyValValAlaIleProThrValAlaSerAlaCysGlyMetGlyGlu
202530
ValMetLysGlnGluAspGlnGluHisLysArgValLysArgTrpSer
354045
AlaGluHisProHisHisAlaAsnGluSerThrHisLeuTrpIleAla
505560
ArgAsnAlaIleGlnIleMetSerArgAsnGlnAspLysThrValGln
65707580
GluAsnGluLeuGlnPheLeuLysIleProGluTyrLysGluLeuPhe
859095
GluArgGlyLeuTyrAspAlaAspTyrLeuAspGluPheAsnAspGly
100105110
GlyThrGlyThrIleGlyIleAspGlyLeuIleLysGlyGlyTrpLys
115120125
SerHisPheTyrAspProAspThrLysLysAsnTyrLysGlyGluGlu
130135140
GluProThrAlaLeuSerGlnGlyAspLysTyrPheLysLeuAlaGly
145150155160
AspTyrPheLysLysGluAspTrpLysGlnAlaPheTyrTyrLeuGly
165170175
ValAlaThrHisTyrPheThrAspAlaThrGlnProMetHisAlaAla
180185190
AsnPheThrAlaValAspMetSerAlaIleLysPheHisSerAlaPhe
195200205
GluAsnTyrValThrThrValGlnThrProPheGluValLysAspAsp
210215220
LysGlyThrTyrAsnLeuValAsnSerAspAspProLysGlnTrpIle
225230235240
HisGluThrAlaLysLeuAlaLysAlaGluIleMetAsnIleThrSer
245250255
AspAsnIleLysSerGlnTyrAsnLysGlyAsnLysAspLeuTrpGln
260265270
GlnGluValMetProAlaValGlnArgSerLeuGluLysAlaGlnArg
275280285
AsnThrAlaGlyPheIleHisLeuTrpPheLysThrTyrValGlyLys
290295300
ThrAlaAlaGluAspIleGluThrThrGlnValLysAspSerAsnGly
305310315320
GluAlaIleGlnGluGlnLysLysTyrTyrValValProSerGluPhe
325330335
LeuAsnArgGlyLeuThrPheGluValTyrAlaSerAsnAspTyrAla
340345350
LeuLeuSerAsnHisValAspAspAsnLysValHisGlyThrProVal
355360365
GlnPheValPheAspLysGluAsnAsnGlyIleValHisArgGlyGlu
370375380
SerValLeuLeuLysMetThrGlnSerAsnTyrAspAspTyrValPhe
385390395400
LeuAsnTyrSerAsnMetThrAsnTrpLeuHisLeuAlaLysArgLys
405410415
ThrAsnThrAlaGlnPheLysValTyrProAsnProAspAsnSerSer
420425430
GluTyrPheLeuTyrThrAspGlyTyrProValAsnTyrGlnGluAsn
435440445
GlyAsnGlyLysSerTrpIleGluLeuGlyLysLysThrAspLysPro
450455460
LysAlaTrpLysPheGlnGlnAlaGlu
465470
<210>33
<211>792
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>33
atgagagcactcgtgctggcaggcggtggagccaagggctcgtttcaagtgggcgtgctg60
cagcggttcacccccgcagacttcggtctcgtggtgggatgctcggtcggagctttaaac120
gccgcggggtttgcccacctgggtagccatggcatcaaagacctctggcaagggatcagg180
agtcgagatgacatcctgtcccgtgtctggtggccgtttggctcagacgggatcttctcg240
cagaagcctcttgaaaagctcgtctccaaagcatgcacgggtcctgctcgggtgccggtc300
cacgtggcgacggtctgccttgaacgcggccttgtccactacgggatctccggggactct360
gactttgagaagaaagtgctggcatcggctgcgatcccaggcgtggtgaagccagttaag420
atccatggcgaccactacgtcgacggtggtgtcagagagatctgtccgctgcgtcgagcc480
atcgacctgggcgccacggagatcacagtcatcatgtgcgctccggaatacatcccgacc540
tggtcgcgtagttcctcgctgttcccgtttgtgaacgtgatgatccggtctctcgacatc600
ctgaccgatgagatcctggtcaacgacatcgccgagtgcgtggcaaagaacaagatgcca660
ggtaaacgtcacgtaaagctcaccatctaccggccgaagaaagagctcatgggcacgctc720
gactttgaccccaaagccatcgccgcagggatcaaggcaggcaccgaagcccagccaagg780
ttctgggagtaa792
<210>34
<211>263
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>34
MetArgAlaLeuValLeuAlaGlyGlyGlyAlaLysGlySerPheGln
151015
ValGlyValLeuGlnArgPheThrProAlaAspPheGlyLeuValVal
202530
GlyCysSerValGlyAlaLeuAsnAlaAlaGlyPheAlaHisLeuGly
354045
SerHisGlyIleLysAspLeuTrpGlnGlyIleArgSerArgAspAsp
505560
IleLeuSerArgValTrpTrpProPheGlySerAspGlyIlePheSer
65707580
GlnLysProLeuGluLysLeuValSerLysAlaCysThrGlyProAla
859095
ArgValProValHisValAlaThrValCysLeuGluArgGlyLeuVal
100105110
HisTyrGlyIleSerGlyAspSerAspPheGluLysLysValLeuAla
115120125
SerAlaAlaIleProGlyValValLysProValLysIleHisGlyAsp
130135140
HisTyrValAspGlyGlyValArgGluIleCysProLeuArgArgAla
145150155160
IleAspLeuGlyAlaThrGluIleThrValIleMetCysAlaProGlu
165170175
TyrIleProThrTrpSerArgSerSerSerLeuPheProPheValAsn
180185190
ValMetIleArgSerLeuAspIleLeuThrAspGluIleLeuValAsn
195200205
AspIleAlaGluCysValAlaLysAsnLysMetProGlyLysArgHis
210215220
ValLysLeuThrIleTyrArgProLysLysGluLeuMetGlyThrLeu
225230235240
AspPheAspProLysAlaIleAlaAlaGlyIleLysAlaGlyThrGlu
245250255
AlaGlnProArgPheTrpGlu
260
<210>35
<211>1389
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>35
atgcccgagccgcccgccgcatgccgttgcgattgcgcctgcgagcgcgaccagcacctt60
ttttgcaagggacccaagcgtatcctcgcgctcgacggcggcggcgtgcgcggcgccgtc120
agcgtcgcattcctcgaacggatcgaggcggtgctcgaggcccggctcggacgcaaggtg180
ctgctcggccactggttcgacctgatcggcggcacctcgacgggcgccatcatcggcggc240
gcgctggcgatgggattcgcggccgaggacgtccaaagattctatcacgagctcgcgccg300
cgggtgttcaggcatccgctcctgcgcatcggtctcctgcgcccgttccgcgcgaaattc360
gacgcccgcctgctgcgcgaggagatccaccgcatcatcggcgacagcacgctcggcgac420
aaagcgctgatgaccgggttcgcgctcgtcgccaagcggatggacaccggcagcacctgg480
atcctcgccaacaacaagcgcagcaaatactgggaagggcgggacggcgtcgtcggcaac540
aaggattatctcctcggcagcctcattcgcgcgagcacggcggcgccgctgtatttcgac600
cccgaggaggtcgtgatcgcggaggcccgcaaggacatcgagggcatcaggggcctgttc660
gtcgacggcggcgtcacgccgcacaacaatccttcgctcgcgatgctgctgctggcgctg720
ctcgacgcctaccggctgcgctgggaaacgggaccggacaagctcacggtcgtctcgatc780
ggcactggaacgcatcgcgaccgcgtcgttcccgacacgctcggcatgggcaagaacgcg840
aagatcgcgctgcgcgccatgagctcgctgatgaacgacgtgcacgagctcgcgctcacg900
cagatgcagtacctcggtgagacgctcaccccgtggcgcatcaacgacgagctcggcgac960
atgcggaccgagcggccgccgcaaggcaagctcttccgcttcctccgctacgacgtccgg1020
ctggagctcgattggatcaacgaggacgaggagcgccggcgcaagatcaagaacaaattc1080
aagcgcgagctgaccgagaccgacatgatccgcctgcgcagcctcgacgatccgacgacc1140
atcccggacctctacatgcttgcccaggtcgcggccgaggagcaggtcaaggcggagcac1200
tggctcggcgacgtgccggagtggagcgaaggcgcgcgcccgtgtgcgccgcgccggcac1260
ctgccgccgacgccgccgggccgctccgaggattcggcgcgcttccgggccgagaaggcc1320
gtcggcgagtggctcagttttgcgcgcgcgaacatcacgcgcctcatgtcgcggaagccg1380
ccgggttga1389
<210>36
<211>462
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>36
MetProGluProProAlaAlaCysArgCysAspCysAlaCysGluArg
151015
AspGlnHisLeuPheCysLysGlyProLysArgIleLeuAlaLeuAsp
202530
GlyGlyGlyValArgGlyAlaValSerValAlaPheLeuGluArgIle
354045
GluAlaValLeuGluAlaArgLeuGlyArgLysValLeuLeuGlyHis
505560
TrpPheAspLeuIleGlyGlyThrSerThrGlyAlaIleIleGlyGly
65707580
AlaLeuAlaMetGlyPheAlaAlaGluAspValGlnArgPheTyrHis
859095
GluLeuAlaProArgValPheArgHisProLeuLeuArgIleGlyLeu
100105110
LeuArgProPheArgAlaLysPheAspAlaArgLeuLeuArgGluGlu
115120125
IleHisArgIleIleGlyAspSerThrLeuGlyAspLysAlaLeuMet
130135140
ThrGlyPheAlaLeuValAlaLysArgMetAspThrGlySerThrTrp
145150155160
IleLeuAlaAsnAsnLysArgSerLysTyrTrpGluGlyArgAspGly
165170175
ValValGlyAsnLysAspTyrLeuLeuGlySerLeuIleArgAlaSer
180185190
ThrAlaAlaProLeuTyrPheAspProGluGluValValIleAlaGlu
195200205
AlaArgLysAspIleGluGlyIleArgGlyLeuPheValAspGlyGly
210215220
ValThrProHisAsnAsnProSerLeuAlaMetLeuLeuLeuAlaLeu
225230235240
LeuAspAlaTyrArgLeuArgTrpGluThrGlyProAspLysLeuThr
245250255
ValValSerIleGlyThrGlyThrHisArgAspArgValValProAsp
260265270
ThrLeuGlyMetGlyLysAsnAlaLysIleAlaLeuArgAlaMetSer
275280285
SerLeuMetAsnAspValHisGluLeuAlaLeuThrGlnMetGlnTyr
290295300
LeuGlyGluThrLeuThrProTrpArgIleAsnAspGluLeuGlyAsp
305310315320
MetArgThrGluArgProProGlnGlyLysLeuPheArgPheLeuArg
325330335
TyrAspValArgLeuGluLeuAspTrpIleAsnGluAspGluGluArg
340345350
ArgArgLysIleLysAsnLysPheLysArgGluLeuThrGluThrAsp
355360365
MetIleArgLeuArgSerLeuAspAspProThrThrIleProAspLeu
370375380
TyrMetLeuAlaGlnValAlaAlaGluGluGlnValLysAlaGluHis
385390395400
TrpLeuGlyAspValProGluTrpSerGluGlyAlaArgProCysAla
405410415
ProArgArgHisLeuProProThrProProGlyArgSerGluAspSer
420425430
AlaArgPheArgAlaGluLysAlaValGlyGluTrpLeuSerPheAla
435440445
ArgAlaAsnIleThrArgLeuMetSerArgLysProProGly
450455460
<210>37
<211>1329
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>37
atgagaaatttcagcaagggattgaccagtattttgcttagcatagcgacatccaccagt60
gcgatggcctttacccagatcggggccggcggagcgattccgatgggccatgagtggcta120
acccgccgctcggcgctggaactgctgaatgccgacaatctggtcggcaatgacccggcc180
gacccacgcttgggctggagcgaaggtctcgccaacaatctcgatctctcgaatgcccag240
aacgaagtgcagcgcatcaagagcattaccaagagccacgccctgtatgagccgcgttac300
gatgacgttttcgccgccatcgtcggcgagcgctgggttgataccgccggtttcaacgtg360
gccaaggccaccgtcggcaagatcgattgcttcagcgccgtcgcgcaagagcccgccgat420
gtgcaacaagaccatttcatgcgccgttatgacgacgtgggtggacaagggggcgtgaac480
gctgcccgccgcgcgcagcagcgctttatcaatcacttcgtcaacgcagccatggccgaa540
gagaagagcatcaaggcatgggatggcggcggttattcttcgctggaaaaagtcagccac600
aactacttcttgtttggccgcgccgttcatttgttccaggattctttcagccccgaacac660
accgtgcgcctgcctgaagacaattacgtcaaagtccgtcaggtcaaggcgtatctctgc720
tctgaaggtgccgaacagcatacgcacaacacgcaagatgccatcaacttcaccagcggc780
gatgtcatctggaaacagaacacccgtctggatgcaggctggagcacctacaaggccagc840
aacatgaagccggtggcattggttgccctcgaagccagcaaagatttgtgggccgccttt900
attcgcaccatggccgtttcccgcgaggagcgtcgcgccgtcgccgaacaggaagcgcag960
gctctcgtcaatcactggttgtcgttcgacgaacaggaaatgctgaactggtacgaagaa1020
gaagagcaccgcgatcatacgtacgtcaaggaacccggccagagcggcccaggttcgtcg1080
ttattcgattgcatggttggtctgggtgtggcctcgggcagtcaggcgcaacgggtggcg1140
gaactcgatcagcaacgccgccaatgtttgttcaacgtcaaggccgctactggctatggc1200
gatctgaatgatccacacatggatattccgtacaactggcaatgggtgtcgtcgacgcaa1260
tggaaaatccctgcggccgactggaaaatcccgcagctgcccgccgattcagggaaatca1320
gtcgtcatc1329
<210>38
<211>443
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(23)
<400>38
MetArgAsnPheSerLysGlyLeuThrSerIleLeuLeuSerIleAla
151015
ThrSerThrSerAlaMetAlaPheThrGlnIleGlyAlaGlyGlyAla
202530
IleProMetGlyHisGluTrpLeuThrArgArgSerAlaLeuGluLeu
354045
LeuAsnAlaAspAsnLeuValGlyAsnAspProAlaAspProArgLeu
505560
GlyTrpSerGluGlyLeuAlaAsnAsnLeuAspLeuSerAsnAlaGln
65707580
AsnGluValGlnArgIleLysSerIleThrLysSerHisAlaLeuTyr
859095
GluProArgTyrAspAspValPheAlaAlaIleValGlyGluArgTrp
100105110
ValAspThrAlaGlyPheAsnValAlaLysAlaThrValGlyLysIle
115120125
AspCysPheSerAlaValAlaGlnGluProAlaAspValGlnGlnAsp
130135140
HisPheMetArgArgTyrAspAspValGlyGlyGlnGlyGlyValAsn
145150155160
AlaAlaArgArgAlaGlnGlnArgPheIleAsnHisPheValAsnAla
165170175
AlaMetAlaGluGluLysSerIleLysAlaTrpAspGlyGlyGlyTyr
180185190
SerSerLeuGluLysValSerHisAsnTyrPheLeuPheGlyArgAla
195200205
ValHisLeuPheGlnAspSerPheSerProGluHisThrValArgLeu
210215220
ProGluAspAsnTyrValLysValArgGlnValLysAlaTyrLeuCys
225230235240
SerGluGlyAlaGluGlnHisThrHisAsnThrGlnAspAlaIleAsn
245250255
PheThrSerGlyAspValIleTrpLysGlnAsnThrArgLeuAspAla
260265270
GlyTrpSerThrTyrLysAlaSerAsnMetLysProValAlaLeuVal
275280285
AlaLeuGluAlaSerLysAspLeuTrpAlaAlaPheIleArgThrMet
290295300
AlaValSerArgGluGluArgArgAlaValAlaGluGlnGluAlaGln
305310315320
AlaLeuValAsnHisTrpLeuSerPheAspGluGlnGluMetLeuAsn
325330335
TrpTyrGluGluGluGluHisArgAspHisThrTyrValLysGluPro
340345350
GlyGlnSerGlyProGlySerSerLeuPheAspCysMetValGlyLeu
355360365
GlyValAlaSerGlySerGlnAlaGlnArgValAlaGluLeuAspGln
370375380
GlnArgArgGlnCysLeuPheAsnValLysAlaAlaThrGlyTyrGly
385390395400
AspLeuAsnAspProHisMetAspIleProTyrAsnTrpGlnTrpVal
405410415
SerSerThrGlnTrpLysIleProAlaAlaAspTrpLysIleProGln
420425430
LeuProAlaAspSerGlyLysSerValValIle
435440
<210>39
<211>1335
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>39
atggccaaccccatcgtcatcatccacggctggagcgacgacttcggctcgttccgcaag60
ctgcgcgacttcctctccaccaacctcggcgttccggcgaagatcctcaagctcggcgac120
tggatctcgctcgacgacgacgtcggctacgccgacatcgcgatggcgctggaacgcgcg180
tggaaggcggagaaactgccgaccgcgccgcgttcggtcgacgtcgtcgtgcacagcacc240
ggcgcgctggtggtgcgcgaatggatgacgcgctaccacgcgcccgaaaccgtgccgatc300
cagcgcttcctgcacctggcgccggccaacttcggctcgcacctcgcgcacaagggccgc360
tcgttcatcggccgcgcggtgaagggctggaagaccggcttcgaaaccggcacccgcatc420
ctgcgcgggctggaactcgcctcgccctactcgcgcgcgctggccgagcgcgacctgttc480
gtggcgccgtcgaagcgctggtacggcgccggccgcatcctcgccaccgtgctggtcggc540
aacagcggctactccggcatccaggccatcgccaacgaggacggctccgacggcaccgtg600
cgcatcggcaccgccaacctgcaggcggcgcttgcgaaggtggtgttcccgcccggcccg660
gtcgcgccggtggtgcagttccgcaacatcgcgggcgccaccgcgttcgccatcgtcgac720
ggcgacaaccattccgacatcaccatgaaggacaagccgtcgaagaccggcatccgcgag780
gaactgatcctcggcgcgctgaaggtgcgcgacgccgacttccccgagaacgccgacggc840
gcgttcccgtggcaggcgaagctcgacgcgaaggccggtgcggccaaggtgtcttcgccc900
gggcgccagaacaccgtggtgcacctcaccgacagcttcggcgacgacgtcgtcgatttc960
ttcttcgagttctggcgcagcgaacgcagcgacaaggtgttcgagcagcgcttctacaag1020
gacgtcatcgacgacgtgcacgtgtacgacggcaacggcgcgtggcgctcgctcaacctc1080
gacctcgacaagttcgaggcgctgcgcaaggacccgaagctcggcttcgagaaactgctg1140
gtcagcgtgttcgcctcgcccgcgaagaagggcgacgccaaggtcggctacagcaccgcc1200
accggccgcgacatcggcgcctggcacgtcgaaggccgtgacttcgccaaggccttcacg1260
ccgcaccgcaccctgttcgtcgacatcgagatcccacgcatcgtcgacgacgcggtgttc1320
cggttccgggaatag1335
<210>40
<211>444
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>40
MetAlaAsnProIleValIleIleHisGlyTrpSerAspAspPheGly
151015
SerPheArgLysLeuArgAspPheLeuSerThrAsnLeuGlyValPro
202530
AlaLysIleLeuLysLeuGlyAspTrpIleSerLeuAspAspAspVal
354045
GlyTyrAlaAspIleAlaMetAlaLeuGluArgAlaTrpLysAlaGlu
505560
LysLeuProThrAlaProArgSerValAspValValValHisSerThr
65707580
GlyAlaLeuValValArgGluTrpMetThrArgTyrHisAlaProGlu
859095
ThrValProIleGlnArgPheLeuHisLeuAlaProAlaAsnPheGly
100105110
SerHisLeuAlaHisLysGlyArgSerPheIleGlyArgAlaValLys
115120125
GlyTrpLysThrGlyPheGluThrGlyThrArgIleLeuArgGlyLeu
130135140
GluLeuAlaSerProTyrSerArgAlaLeuAlaGluArgAspLeuPhe
145150155160
ValAlaProSerLysArgTrpTyrGlyAlaGlyArgIleLeuAlaThr
165170175
ValLeuValGlyAsnSerGlyTyrSerGlyIleGlnAlaIleAlaAsn
180185190
GluAspGlySerAspGlyThrValArgIleGlyThrAlaAsnLeuGln
195200205
AlaAlaLeuAlaLysValValPheProProGlyProValAlaProVal
210215220
ValGlnPheArgAsnIleAlaGlyAlaThrAlaPheAlaIleValAsp
225230235240
GlyAspAsnHisSerAspIleThrMetLysAspLysProSerLysThr
245250255
GlyIleArgGluGluLeuIleLeuGlyAlaLeuLysValArgAspAla
260265270
AspPheProGluAsnAlaAspGlyAlaPheProTrpGlnAlaLysLeu
275280285
AspAlaLysAlaGlyAlaAlaLysValSerSerProGlyArgGlnAsn
290295300
ThrValValHisLeuThrAspSerPheGlyAspAspValValAspPhe
305310315320
PhePheGluPheTrpArgSerGluArgSerAspLysValPheGluGln
325330335
ArgPheTyrLysAspValIleAspAspValHisValTyrAspGlyAsn
340345350
GlyAlaTrpArgSerLeuAsnLeuAspLeuAspLysPheGluAlaLeu
355360365
ArgLysAspProLysLeuGlyPheGluLysLeuLeuValSerValPhe
370375380
AlaSerProAlaLysLysGlyAspAlaLysValGlyTyrSerThrAla
385390395400
ThrGlyArgAspIleGlyAlaTrpHisValGluGlyArgAspPheAla
405410415
LysAlaPheThrProHisArgThrLeuPheValAspIleGluIlePro
420425430
ArgIleValAspAspAlaValPheArgPheArgGlu
435440
<210>41
<211>1419
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>41
atgacgctccgatcaacggactatgcgctgctggcgcaggagagctaccacgacagccag60
gtggacgccgacgtcaagctggatggcgtggcgtataaagtcttcgccaccaccagcgac120
gggctcaccggattccaggccacggcctaccagcgccaggacaccggcgaggtagtgatt180
gcgtaccgcggcacggagtttgatcgcgagcccgtccgcgacggcggcgtcgatgcgggc240
atggtgctgctcggtgtcaacgcacaggcaccagcgtcggaagtgttcacccggcaagtg300
atcgagaaggcgaaacacgaagccgagctcaacgaccgcgaaccgcagatcaccgtcacc360
ggccattccctcggcggcaccctcgccgagatcaacgccgcgaagtacggcctccatggc420
gaaaccttcaacgcctacggcgcagccagcctcaagggtattccggagggcggcgatacc480
gtcatcgaccacgtccgtgccggcgatctcgtcagcgcggccagcccccactacgggcag540
gtacgcgtctacgcggcgcagcaggacatcgatacgctgcaacacgccggttaccgcgat600
gacagcggcatcctcagcttgcgcaacccgatcaaggccacggatttcgatgcccatgcc660
atcgataacttcgtgcccaacagcaagctgctcggtcagtcgatcatcgcgccggaaaac720
gtggcgcgttacgatgcccacaaaggcatggtcgaccgttaccgcgatgacgtggccgat780
atccgcaagggcatctcggcgccctgggaaatccccaaggccatcggcgagctgaaggac840
accctggagcacgaagccttcgaactcgccggcaagggcattctcgcggtggagcacggc900
ttcgaacatctcaaggaggagatcggcgaaggcatccacgccgtggaggagaaagcttcc960
agcgcgtggcataccctcacccatcccaaggaatggttcgagcacgataaacccaaggtg1020
accctggaccacccggaccaccccgaccatgccctgttcaagcaggcgcagggcgcggtg1080
cacacagtcgatgcctcgcacggccgcacccctgacaagaccagcgaccagatcgccggc1140
tcgctggtggtatcggcacgccgtgacggccttgagcgggtagaccgcgctgtactcagc1200
gatgacgccaaccgcctgtacggtgtgcagggtgcggtggactcgccgctgaagcaggtc1260
accgaagtgaacaccgccaccgccgcgcagacatcgctccagcagagcagcgtggcctgg1320
cagcaacaggcagaaatcgcgcgtcagaaccaggcggcaagccaggctcagcgcatggac1380
cagcaggtgccgccgcaggcacccgcgcacggcatgtaa1419
<210>42
<211>472
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>42
MetThrLeuArgSerThrAspTyrAlaLeuLeuAlaGlnGluSerTyr
151015
HisAspSerGlnValAspAlaAspValLysLeuAspGlyValAlaTyr
202530
LysValPheAlaThrThrSerAspGlyLeuThrGlyPheGlnAlaThr
354045
AlaTyrGlnArgGlnAspThrGlyGluValValIleAlaTyrArgGly
505560
ThrGluPheAspArgGluProValArgAspGlyGlyValAspAlaGly
65707580
MetValLeuLeuGlyValAsnAlaGlnAlaProAlaSerGluValPhe
859095
ThrArgGlnValIleGluLysAlaLysHisGluAlaGluLeuAsnAsp
100105110
ArgGluProGlnIleThrValThrGlyHisSerLeuGlyGlyThrLeu
115120125
AlaGluIleAsnAlaAlaLysTyrGlyLeuHisGlyGluThrPheAsn
130135140
AlaTyrGlyAlaAlaSerLeuLysGlyIleProGluGlyGlyAspThr
145150155160
ValIleAspHisValArgAlaGlyAspLeuValSerAlaAlaSerPro
165170175
HisTyrGlyGlnValArgValTyrAlaAlaGlnGlnAspIleAspThr
180185190
LeuGlnHisAlaGlyTyrArgAspAspSerGlyIleLeuSerLeuArg
195200205
AsnProIleLysAlaThrAspPheAspAlaHisAlaIleAspAsnPhe
210215220
ValProAsnSerLysLeuLeuGlyGlnSerIleIleAlaProGluAsn
225230235240
ValAlaArgTyrAspAlaHisLysGlyMetValAspArgTyrArgAsp
245250255
AspValAlaAspIleArgLysGlyIleSerAlaProTrpGluIlePro
260265270
LysAlaIleGlyGluLeuLysAspThrLeuGluHisGluAlaPheGlu
275280285
LeuAlaGlyLysGlyIleLeuAlaValGluHisGlyPheGluHisLeu
290295300
LysGluGluIleGlyGluGlyIleHisAlaValGluGluLysAlaSer
305310315320
SerAlaTrpHisThrLeuThrHisProLysGluTrpPheGluHisAsp
325330335
LysProLysValThrLeuAspHisProAspHisProAspHisAlaLeu
340345350
PheLysGlnAlaGlnGlyAlaValHisThrValAspAlaSerHisGly
355360365
ArgThrProAspLysThrSerAspGlnIleAlaGlySerLeuValVal
370375380
SerAlaArgArgAspGlyLeuGluArgValAspArgAlaValLeuSer
385390395400
AspAspAlaAsnArgLeuTyrGlyValGlnGlyAlaValAspSerPro
405410415
LeuLysGlnValThrGluValAsnThrAlaThrAlaAlaGlnThrSer
420425430
LeuGlnGlnSerSerValAlaTrpGlnGlnGlnAlaGluIleAlaArg
435440445
GlnAsnGlnAlaAlaSerGlnAlaGlnArgMetAspGlnGlnValPro
450455460
ProGlnAlaProAlaHisGlyMet
465470
<210>43
<211>1287
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>43
atgtcgattaccgtttaccggaagccctccggcgggtttggagcgatagttcctcaagcg60
aaaattgagaaccttgttttcgagggcggcggaccaaagggcctggtctatgtcggcgcg120
gtcgaggttctcggtgaaaggggactgctggaagggatcgcaaatgtcggcggcgcttca180
gcaggcgccatgaccgctctagccgtcggtctgggactgagccccagggaaattcgcgcg240
gtcgtctttaaccagaacattgcggacctcaccgatatcgagaagaccgtcgagccgtcc300
tccgggatcacaggcatgttcaagagcgtgttcaagaagggttggcaggcggtgcgcaac360
gtaaccggcacctctgacgagcgcgggcgcgggctctatcgcggcgagaagttgcgagcc420
tggatcagagacctgattgcacagcgagtcgaggcagggcgctcagaggtgctgagccga480
gccgacgccgacgggcggaacttctatgagaaagccgccgcaaagaagggcgccctgaca540
tttgccgaacttgatcgggtggcgcaaatggcgccgggcctgcggcttcgccgcctggcc600
ttcaccggaaccaacttcacgtcgaagaagctcgaagtgttcagtctgcacgagaccccg660
gacatgccgatcgacgtcgcggtacgcatctcggcatcgttgccatggtttttcaaatcc720
gtgaaatggaacggctccgaatacatagatggcggatgcctgtcgaacttcccaatgccg780
atattcgacgtcgatccctatcgtggcgacgcatcgtcgaagatccggctcggcatcttc840
ggccagaacctcgcgacgctcggcttcaaggtcgacagcgaggaggagatccgcgacatc900
ctctggcgtagccccgagagcacgagcgacggctttttccaaggcatcctgtcaagcgtg960
aaagcctcggcagaacactgggtcgtcggcatcgatgtcgagggcgccacccgcgcgtcg1020
aacgtggccgttcacggcaagtatgctcagcgaacgatccagataccggacctcggatat1080
agcacgttcaagttcgatctctcagacgcggacaaggagcgcatggccgaggccggcgca1140
aaggccacgcgggaatggctggcgctgtacttcgacgacgccggaatagaggtcgaattt1200
tctgatccgaacgaattgcgcggccagttgtccgacgccgcattcgcagacctcgaggat1260
tcgtttcgagccttgatcgcggcctag1287
<210>44
<211>428
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>44
MetSerIleThrValTyrArgLysProSerGlyGlyPheGlyAlaIle
151015
ValProGlnAlaLysIleGluAsnLeuValPheGluGlyGlyGlyPro
202530
LysGlyLeuValTyrValGlyAlaValGluValLeuGlyGluArgGly
354045
LeuLeuGluGlyIleAlaAsnValGlyGlyAlaSerAlaGlyAlaMet
505560
ThrAlaLeuAlaValGlyLeuGlyLeuSerProArgGluIleArgAla
65707580
ValValPheAsnGlnAsnIleAlaAspLeuThrAspIleGluLysThr
859095
ValGluProSerSerGlyIleThrGlyMetPheLysSerValPheLys
100105110
LysGlyTrpGlnAlaValArgAsnValThrGlyThrSerAspGluArg
115120125
GlyArgGlyLeuTyrArgGlyGluLysLeuArgAlaTrpIleArgAsp
130135140
LeuIleAlaGlnArgValGluAlaGlyArgSerGluValLeuSerArg
145150155160
AlaAspAlaAspGlyArgAsnPheTyrGluLysAlaAlaAlaLysLys
165170175
GlyAlaLeuThrPheAlaGluLeuAspArgValAlaGlnMetAlaPro
180185190
GlyLeuArgLeuArgArgLeuAlaPheThrGlyThrAsnPheThrSer
195200205
LysLysLeuGluValPheSerLeuHisGluThrProAspMetProIle
210215220
AspValAlaValArgIleSerAlaSerLeuProTrpPhePheLysSer
225230235240
ValLysTrpAsnGlySerGluTyrIleAspGlyGlyCysLeuSerAsn
245250255
PheProMetProIlePheAspValAspProTyrArgGlyAspAlaSer
260265270
SerLysIleArgLeuGlyIlePheGlyGlnAsnLeuAlaThrLeuGly
275280285
PheLysValAspSerGluGluGluIleArgAspIleLeuTrpArgSer
290295300
ProGluSerThrSerAspGlyPhePheGlnGlyIleLeuSerSerVal
305310315320
LysAlaSerAlaGluHisTrpValValGlyIleAspValGluGlyAla
325330335
ThrArgAlaSerAsnValAlaValHisGlyLysTyrAlaGlnArgThr
340345350
IleGlnIleProAspLeuGlyTyrSerThrPheLysPheAspLeuSer
355360365
AspAlaAspLysGluArgMetAlaGluAlaGlyAlaLysAlaThrArg
370375380
GluTrpLeuAlaLeuTyrPheAspAspAlaGlyIleGluValGluPhe
385390395400
SerAspProAsnGluLeuArgGlyGlnLeuSerAspAlaAlaPheAla
405410415
AspLeuGluAspSerPheArgAlaLeuIleAlaAla
420425
<210>45
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>45
atgacaacccaatttagaaacttgatatttgaaggcggcggtgtaaaaggtgttgcttac60
attggcgccatgcagattctcgaaaatcgtggcgtgttgcaagatattcaccgagtcgga120
gggtgcagtgcgggtgcgattaatgcgctgatttttgcgctgggttacacggttcgtgag180
caaaaagagatcttacaagccaccgattttaaccagtttatggataactcttggggtgtt240
attcgtgatattcgcaggcttgctcgagactttggctggaataagggtgatttctttagt300
agctggataggtgatttgattcatcgtcgtttggggaatcgccgagcgacgttcaaagat360
ctgcaaaatgccaagcttcctgatctttatgtcatcggtactaatctgtctacagggttt420
gcagaggttttttctgccgaaagacaccccgatatggagctggcgacagcggtgcgtatc480
tccatgtcgataccgctgttctttgcagccgtgcgtcacggtgatcgacaagatgtgtat540
gtcgatgggggtgttcaacttaactatccgattaaactgtttgatcgggagcgttacatt600
gatctggccaaagatcccggtgctgttcggcgaacgggttattacaacaaagaaaacgct660
cgctttcagcttgagcggcccggtcatagcccctatgtttacaatcgccagaccttgggt720
ttgcgtcttgatagtcgcgagcagatagggctctttcgttatgacgaacccctcaagggc780
aaacccattaagtccttcactgactacgctcgacaacttttcggtgcgttgatgaatgca840
caggaaaagattcatctacatggcgatgattggcaacgcacggtctatatcgatacattg900
gatgtgggtacgacggacttcaatctttctgatgcaactaagcaagcactgattgagcaa960
ggaattaacggcaccgaaaattatttcgagtggtttgataatccgttagagaagcccgtg1020
aatagagtggagtcatag1038
<210>46
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>46
MetThrThrGlnPheArgAsnLeuIlePheGluGlyGlyGlyValLys
151015
GlyValAlaTyrIleGlyAlaMetGlnIleLeuGluAsnArgGlyVal
202530
LeuGlnAspIleHisArgValGlyGlyCysSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheAlaLeuGlyTyrThrValArgGluGlnLysGluIle
505560
LeuGlnAlaThrAspPheAsnGlnPheMetAspAsnSerTrpGlyVal
65707580
IleArgAspIleArgArgLeuAlaArgAspPheGlyTrpAsnLysGly
859095
AspPhePheSerSerTrpIleGlyAspLeuIleHisArgArgLeuGly
100105110
AsnArgArgAlaThrPheLysAspLeuGlnAsnAlaLysLeuProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetGluLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaValArgHisGlyAspArg
165170175
GlnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProIleLys
180185190
LeuPheAspArgGluArgTyrIleAspLeuAlaLysAspProGlyAla
195200205
ValArgArgThrGlyTyrTyrAsnLysGluAsnAlaArgPheGlnLeu
210215220
GluArgProGlyHisSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerArgGluGlnIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysProIleLysSerPheThrAspTyrAlaArgGln
260265270
LeuPheGlyAlaLeuMetAsnAlaGlnGluLysIleHisLeuHisGly
275280285
AspAspTrpGlnArgThrValTyrIleAspThrLeuAspValGlyThr
290295300
ThrAspPheAsnLeuSerAspAlaThrLysGlnAlaLeuIleGluGln
305310315320
GlyIleAsnGlyThrGluAsnTyrPheGluTrpPheAspAsnProLeu
325330335
GluLysProValAsnArgValGluSer
340345
<210>47
<211>1476
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>47
atgtcaacaaaagtagtatttgtacatggatggagcgttaccaacctaaatacatatggc60
gaacttccgttgagattaaaggccgaagcaataagcaggaacctgaacatcgaagtaaat120
gaaattttcctgggccgttatatcagctttaatgataacattacattagatgacgtttcg180
cgggcttttaatacggccattagcgaacagttagacaatacagacaggtttatatgtatt240
acacattctaccggagggccggttattcgcgaatggttaaataaatactattataatgaa300
cgtccaccactaagtcatttaataatgcttgcaccggccaattttggttcggcattggct360
cgtttagggaaaagtaaattaagccgtattaaaagttggtttgaaggtgtagaaccaggg420
cagaaaattttagactggctggagtgtggaagcaaccaatcgtggttactaaataaagac480
tggatcgacaatggcaattttcagattggcgctgataagtatttcccgtttgttatcatt540
ggccagtcgattgatcgtaaactttacgatcatcttaactcatataccggcgagcttggg600
tccgatggtgtagttcgcacctcaggagctaatcttaattcgcggtatattaagcttgtt660
caggacagaaatacaatagctaatggaaatatttccagtacattacgaattgccgaatat720
agagaagcttgtgcaacgcccatacgggtagttagaggtaaatcgcattcgggcgatgaa780
atgggtatcatgaaaagtgttaaaaaagaaattactgatgccggaagcaaggaaacaata840
aatgccatattcgagtgtattgaagttacaaacaacgaacaatatcaatccttaattact900
aaatttgataacgaaacagcacaggtacaaaaggatgagctgattgaaacggaaacagaa960
ttatttttaatgcaccgtcatttcattcacgaccgcttttcgcaattcatttttaaagta1020
actgactcagaagggcaacctgttacagattatgatttaatttttacagccgggccacaa1080
aacgatgcgaaccacttaccggaaggatttgccattgacaggcaacaaaattcaaataat1140
aacgaaaccattacgtattattttaattacgatgtattgaaaggggctcccgcaaatgtt1200
taccgggacgcattaccaggtatttctatgctggggctaaccataaacccaaggccggac1260
gaaggttttgtaagatatatcccatgcagcattaaagccaattccgagttgatggaaaaa1320
gcctttaaaccaaattctactaccttggtcgatattgttattcaacgtgtagttagcaaa1380
gaagtttttcggttggaaaagttaactggtagctcaatgccaacagacaaagatgggaat1440
tttaaaaatactgaacctggtaacgaaataatatga1476
<210>48
<211>491
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>48
MetSerThrLysValValPheValHisGlyTrpSerValThrAsnLeu
151015
AsnThrTyrGlyGluLeuProLeuArgLeuLysAlaGluAlaIleSer
202530
ArgAsnLeuAsnIleGluValAsnGluIlePheLeuGlyArgTyrIle
354045
SerPheAsnAspAsnIleThrLeuAspAspValSerArgAlaPheAsn
505560
ThrAlaIleSerGluGlnLeuAspAsnThrAspArgPheIleCysIle
65707580
ThrHisSerThrGlyGlyProValIleArgGluTrpLeuAsnLysTyr
859095
TyrTyrAsnGluArgProProLeuSerHisLeuIleMetLeuAlaPro
100105110
AlaAsnPheGlySerAlaLeuAlaArgLeuGlyLysSerLysLeuSer
115120125
ArgIleLysSerTrpPheGluGlyValGluProGlyGlnLysIleLeu
130135140
AspTrpLeuGluCysGlySerAsnGlnSerTrpLeuLeuAsnLysAsp
145150155160
TrpIleAspAsnGlyAsnPheGlnIleGlyAlaAspLysTyrPhePro
165170175
PheValIleIleGlyGlnSerIleAspArgLysLeuTyrAspHisLeu
180185190
AsnSerTyrThrGlyGluLeuGlySerAspGlyValValArgThrSer
195200205
GlyAlaAsnLeuAsnSerArgTyrIleLysLeuValGlnAspArgAsn
210215220
ThrIleAlaAsnGlyAsnIleSerSerThrLeuArgIleAlaGluTyr
225230235240
ArgGluAlaCysAlaThrProIleArgValValArgGlyLysSerHis
245250255
SerGlyAspGluMetGlyIleMetLysSerValLysLysGluIleThr
260265270
AspAlaGlySerLysGluThrIleAsnAlaIlePheGluCysIleGlu
275280285
ValThrAsnAsnGluGlnTyrGlnSerLeuIleThrLysPheAspAsn
290295300
GluThrAlaGlnValGlnLysAspGluLeuIleGluThrGluThrGlu
305310315320
LeuPheLeuMetHisArgHisPheIleHisAspArgPheSerGlnPhe
325330335
IlePheLysValThrAspSerGluGlyGlnProValThrAspTyrAsp
340345350
LeuIlePheThrAlaGlyProGlnAsnAspAlaAsnHisLeuProGlu
355360365
GlyPheAlaIleAspArgGlnGlnAsnSerAsnAsnAsnGluThrIle
370375380
ThrTyrTyrPheAsnTyrAspValLeuLysGlyAlaProAlaAsnVal
385390395400
TyrArgAspAlaLeuProGlyIleSerMetLeuGlyLeuThrIleAsn
405410415
ProArgProAspGluGlyPheValArgTyrIleProCysSerIleLys
420425430
AlaAsnSerGluLeuMetGluLysAlaPheLysProAsnSerThrThr
435440445
LeuValAspIleValIleGlnArgValValSerLysGluValPheArg
450455460
LeuGluLysLeuThrGlySerSerMetProThrAspLysAspGlyAsn
465470475480
PheLysAsnThrGluProGlyAsnGluIleIle
485490
<210>49
<211>1257
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>49
atgaatttttggtcctttcttcttagtataaccttacctatgggggtaggcgttgctcat60
gcacagcccgatacggattttcaatcggctgagccttatgtctcttctgcgccaatgggg120
cgacaaacttatacttacgtgcgttgttggtatcgcaccagccacagtacggatgatcca180
gcgacagattggcagtgggcgagaaactccgatggtagctattttactttgcaaggatac240
tggtggagctcggtaagactaaaaaatatgttttacactcaaacctcgcaaaatgttatt300
cgtcagcgctgcgaacacactttaagcattaatcatgataatgcggatattactttttat360
gcggcggataatcgtttctcattaaaccatacgatttggtcgaatgatcctgtcatgcag420
gctaatcaaatcaacaagattgtcgcgtttggtgacagcttgtccgataccggtaatatt480
tttaatgccgcgcagtggcgttttcctaatcccaatagttggtttttggggcatttttct540
aacggtttggtatggactgagtacttagctaaacagaaaaacttaccgatatataactgg600
gcggttggtggcgctgctggggcgaatcaatatgtggcgttaaccggtgttacaggccaa660
gtgaactcttatttacagtacatgggtaaagcgcaaaactatcgtccacagaataccttg720
tacactttggtcttcggtttgaatgattttatgaattataaccgtgaggttgctgaggtg780
gcggctgattttgaaacggcattacagcgtttaacgcaagctggcgcgcaaaatatttta840
atgatgacgctaccggatgtgactaaagcaccacagtttacctactcaactcaagcggaa900
atcgacttgattcaaggtaaaatcaatgcgttgaacatcaagttaaaacagttgactgcg960
caatatattttacaaggctatgccattcatctatttgatacttatgagttatttgattca1020
atggtcgctgaaccggaaaagcatggctttgctaatgccagtgaaccttgtttgaatctc1080
acccgttcttcagcggcggattatttgtaccgtcatcccattaccaatacttgtgctcgt1140
tatggtgcagacaaatttgtattttgggatgtcacccatccaaccacggcaactcatcgc1200
tatatttcacaaacgctgttagcgccgggtaatggattacaatattttaatttttaa1257
<210>50
<211>418
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(23)
<400>50
MetAsnPheTrpSerPheLeuLeuSerIleThrLeuProMetGlyVal
151015
GlyValAlaHisAlaGlnProAspThrAspPheGlnSerAlaGluPro
202530
TyrValSerSerAlaProMetGlyArgGlnThrTyrThrTyrValArg
354045
CysTrpTyrArgThrSerHisSerThrAspAspProAlaThrAspTrp
505560
GlnTrpAlaArgAsnSerAspGlySerTyrPheThrLeuGlnGlyTyr
65707580
TrpTrpSerSerValArgLeuLysAsnMetPheTyrThrGlnThrSer
859095
GlnAsnValIleArgGlnArgCysGluHisThrLeuSerIleAsnHis
100105110
AspAsnAlaAspIleThrPheTyrAlaAlaAspAsnArgPheSerLeu
115120125
AsnHisThrIleTrpSerAsnAspProValMetGlnAlaAsnGlnIle
130135140
AsnLysIleValAlaPheGlyAspSerLeuSerAspThrGlyAsnIle
145150155160
PheAsnAlaAlaGlnTrpArgPheProAsnProAsnSerTrpPheLeu
165170175
GlyHisPheSerAsnGlyLeuValTrpThrGluTyrLeuAlaLysGln
180185190
LysAsnLeuProIleTyrAsnTrpAlaValGlyGlyAlaAlaGlyAla
195200205
AsnGlnTyrValAlaLeuThrGlyValThrGlyGlnValAsnSerTyr
210215220
LeuGlnTyrMetGlyLysAlaGlnAsnTyrArgProGlnAsnThrLeu
225230235240
TyrThrLeuValPheGlyLeuAsnAspPheMetAsnTyrAsnArgGlu
245250255
ValAlaGluValAlaAlaAspPheGluThrAlaLeuGlnArgLeuThr
260265270
GlnAlaGlyAlaGlnAsnIleLeuMetMetThrLeuProAspValThr
275280285
LysAlaProGlnPheThrTyrSerThrGlnAlaGluIleAspLeuIle
290295300
GlnGlyLysIleAsnAlaLeuAsnIleLysLeuLysGlnLeuThrAla
305310315320
GlnTyrIleLeuGlnGlyTyrAlaIleHisLeuPheAspThrTyrGlu
325330335
LeuPheAspSerMetValAlaGluProGluLysHisGlyPheAlaAsn
340345350
AlaSerGluProCysLeuAsnLeuThrArgSerSerAlaAlaAspTyr
355360365
LeuTyrArgHisProIleThrAsnThrCysAlaArgTyrGlyAlaAsp
370375380
LysPheValPheTrpAspValThrHisProThrThrAlaThrHisArg
385390395400
TyrIleSerGlnThrLeuLeuAlaProGlyAsnGlyLeuGlnTyrPhe
405410415
AsnPhe
<210>51
<211>1482
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>51
atgacaatccgctcaacggactatgcgctgctcgcgcaggagagctaccacgacagccag60
gtcgatgccgacgtcaaactcgatggcatcgcctacaaggtcttcgccaccaccgatgac120
ccgctcacggggttccaggccaccgcgtaccagcgccaggacaccggcgaagtcgtcatc180
gcctatcgtggtacggaattcgaccgcgagcccgttcgcgacggcggcgtcgatgccggc240
atggtgctgctgggggtgaatgcccagtcgcctgcctccgagctatttacccgcgaagtg300
atcgagaaggcgacgcacgaagccgaactcaatgaccgcgagccccggatcaccgtgact360
ggccactccctcggcggcaccctcgccgaaatcaacgcggccaagtacggcctgcacggc420
gaaaccttcaacgcatacggtgcggccagcctcaagggcatcccggaaggcggcaatacc480
gtgatcgaccacgtgcgcgctggcgacctcgtcagcgccgccagcccgcattacgggcag540
gtgcgcgtctacgcggcccagcaggatatcgacaccttgcagcatgccggctaccgcgac600
gacagcggcatccttagcctgcgcaacccgatcaaggccacggatttcgacgcgcacgcc660
atcgacaacttcgtgccgaacagcaaactgcttggccagtcgatcatcgcgccggaaaac720
gaagcccgttacgaagcccacaagggcatggtcgaccgctaccgcgatgacgtggctgac780
atccgcatgctcgtctccgctcccctgaacatcccgcgcaccatcggcgatatcaaggat840
gccgtggaacgcgaggcatttgagctggctggcaagggcatcctcgccgttgaacacggc900
atcgaagaggtcgtgcacgaggcaaaggaaggcttcgagcacctcaaggaaggctttgag960
cacctgaaggaagaagtcagcgagggcttccatgccttcgaggaaaaggcctccagcgcg1020
tggcatacgctgacccatcccaaggaatggttcgagcacgacaagccgcaggtcgccctg1080
aaccacccacagcacccggacaacgaactgttcaagaaggtgctcgaaggcgtgcaccag1140
gttgatgcgaagcagggtcgttcacccgaccagctcagtgagaacctggccgcatcgctt1200
accgttgccgcacgcaaggaaggcctggacaaggtcaaccacgtgctgctcgacgacccc1260
ggcattcgcacctacgccgtgcagggtgagctcaactcgccgttgaagcaggtctccagt1320
gtcgataacgcccaggcggtcgccacaccggtggcccagagcagcgcgcaatggcagcag1380
gctgccgaggcgcggcaggcacagcacaatgaggcgcttgcgcagcagcaggcgcaacag1440
cagcagaacaaccggcccaaccatggggttgccggcccgtga1482
<210>52
<211>493
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>52
MetThrIleArgSerThrAspTyrAlaLeuLeuAlaGlnGluSerTyr
151015
HisAspSerGlnValAspAlaAspValLysLeuAspGlyIleAlaTyr
202530
LysValPheAlaThrThrAspAspProLeuThrGlyPheGlnAlaThr
354045
AlaTyrGlnArgGlnAspThrGlyGluValValIleAlaTyrArgGly
505560
ThrGluPheAspArgGluProValArgAspGlyGlyValAspAlaGly
65707580
MetValLeuLeuGlyValAsnAlaGlnSerProAlaSerGluLeuPhe
859095
ThrArgGluValIleGluLysAlaThrHisGluAlaGluLeuAsnAsp
100105110
ArgGluProArgIleThrValThrGlyHisSerLeuGlyGlyThrLeu
115120125
AlaGluIleAsnAlaAlaLysTyrGlyLeuHisGlyGluThrPheAsn
130135140
AlaTyrGlyAlaAlaSerLeuLysGlyIleProGluGlyGlyAsnThr
145150155160
ValIleAspHisValArgAlaGlyAspLeuValSerAlaAlaSerPro
165170175
HisTyrGlyGlnValArgValTyrAlaAlaGlnGlnAspIleAspThr
180185190
LeuGlnHisAlaGlyTyrArgAspAspSerGlyIleLeuSerLeuArg
195200205
AsnProIleLysAlaThrAspPheAspAlaHisAlaIleAspAsnPhe
210215220
ValProAsnSerLysLeuLeuGlyGlnSerIleIleAlaProGluAsn
225230235240
GluAlaArgTyrGluAlaHisLysGlyMetValAspArgTyrArgAsp
245250255
AspValAlaAspIleArgMetLeuValSerAlaProLeuAsnIlePro
260265270
ArgThrIleGlyAspIleLysAspAlaValGluArgGluAlaPheGlu
275280285
LeuAlaGlyLysGlyIleLeuAlaValGluHisGlyIleGluGluVal
290295300
ValHisGluAlaLysGluGlyPheGluHisLeuLysGluGlyPheGlu
305310315320
HisLeuLysGluGluValSerGluGlyPheHisAlaPheGluGluLys
325330335
AlaSerSerAlaTrpHisThrLeuThrHisProLysGluTrpPheGlu
340345350
HisAspLysProGlnValAlaLeuAsnHisProGlnHisProAspAsn
355360365
GluLeuPheLysLysValLeuGluGlyValHisGlnValAspAlaLys
370375380
GlnGlyArgSerProAspGlnLeuSerGluAsnLeuAlaAlaSerLeu
385390395400
ThrValAlaAlaArgLysGluGlyLeuAspLysValAsnHisValLeu
405410415
LeuAspAspProGlyIleArgThrTyrAlaValGlnGlyGluLeuAsn
420425430
SerProLeuLysGlnValSerSerValAspAsnAlaGlnAlaValAla
435440445
ThrProValAlaGlnSerSerAlaGlnTrpGlnGlnAlaAlaGluAla
450455460
ArgGlnAlaGlnHisAsnGluAlaLeuAlaGlnGlnGlnAlaGlnGln
465470475480
GlnGlnAsnAsnArgProAsnHisGlyValAlaGlyPro
485490
<210>53
<211>1491
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>53
atgcgtcaggttacattagtatttgttcatggctacagcgttacaaacatcgacacttat60
ggtgaaatgccactcaggctccgcaacgaaggagccacacgtgatatagaaataaaaatt120
gagaacattttcctggggcgctacatcagctttaatgatgatgtgagattaaatgatgtt180
tccagagcattggaaacagccgtacaacaacagattgcaccgggaaataaaaacaattcc240
cgttacgtattcatcacccactctaccggcggaccggtagtgagaaactggtgggatctg300
tactataaaaacagcacgaaacaatgccctatgagccacctcattatgctggctcctgcc360
aattttggctcggcactggcacaactgggaaaaagcaaactaagccgcattaaatcctgg420
ttcgatggtgtggaacccggacagaatgtattgaattggctggaactgggaagcgcggaa480
gcatggaagctaaacaccgactggattaagagtgatggaagtcagatctcggcacagggt540
atttttccttttgtgatcataggtcaggacattgaccgcaaattatacgatcatttaaac600
tcctacaccggtgagctgggttccgacggcgtggtgcgttcggccgcagccaatttaaat660
gctacttatgtaaaactcacacaacctaaacccaccttggtaaatggaaaactggtaaca720
ggtaatctggaaataggagaagtaaaacaagcgccttatacacccatgcgcatcgtctca780
aaaaaatcgcattccaacaaggatatgggaattatgagaagtgtactgaaatcaacaaat840
gatgccaacagcgccgaaacggtaaacgccatttttgactgcattaatgtgaaaacctta900
accgattaccagagcattgccacacagtttgattcgcaaacaaaagacgtgcaggaaaat960
tcaattattgaaagggaaaaaacgccctttggaactaaaaactatattcacgaccgtttc1020
tcccaggtcattttcagagtaacagacagtgaaggttacccggttaccagttttgatctg1080
atcctcaccggcggcgaaaaaaatgatcccaacgccttgcctcagggcttttttgtggac1140
agacaatgcaacagtgtcaataaatcgaccattacttattttttaaattacgatattatg1200
aacggcacaccagctatagcaggtataagaccggcatccaaaggcatggaaaaactgggt1260
ctgatcattaacccaaggcctgaagaaggctttgtgcgttacattccctgcaaaataaac1320
acatcgcccgatttgtttgacgccgctctgaaacccaacgccacaacgcttattgatatt1380
gtattgcaacgcgtggtaagtaccgaagtattccgctttgaaggaacagacggggtaacg1440
ccgcctaaaaaagatttctcgaaagtgaaacccggaacggatattatttga1491
<210>54
<211>496
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>54
MetArgGlnValThrLeuValPheValHisGlyTyrSerValThrAsn
151015
IleAspThrTyrGlyGluMetProLeuArgLeuArgAsnGluGlyAla
202530
ThrArgAspIleGluIleLysIleGluAsnIlePheLeuGlyArgTyr
354045
IleSerPheAsnAspAspValArgLeuAsnAspValSerArgAlaLeu
505560
GluThrAlaValGlnGlnGlnIleAlaProGlyAsnLysAsnAsnSer
65707580
ArgTyrValPheIleThrHisSerThrGlyGlyProValValArgAsn
859095
TrpTrpAspLeuTyrTyrLysAsnSerThrLysGlnCysProMetSer
100105110
HisLeuIleMetLeuAlaProAlaAsnPheGlySerAlaLeuAlaGln
115120125
LeuGlyLysSerLysLeuSerArgIleLysSerTrpPheAspGlyVal
130135140
GluProGlyGlnAsnValLeuAsnTrpLeuGluLeuGlySerAlaGlu
145150155160
AlaTrpLysLeuAsnThrAspTrpIleLysSerAspGlySerGlnIle
165170175
SerAlaGlnGlyIlePheProPheValIleIleGlyGlnAspIleAsp
180185190
ArgLysLeuTyrAspHisLeuAsnSerTyrThrGlyGluLeuGlySer
195200205
AspGlyValValArgSerAlaAlaAlaAsnLeuAsnAlaThrTyrVal
210215220
LysLeuThrGlnProLysProThrLeuValAsnGlyLysLeuValThr
225230235240
GlyAsnLeuGluIleGlyGluValLysGlnAlaProTyrThrProMet
245250255
ArgIleValSerLysLysSerHisSerAsnLysAspMetGlyIleMet
260265270
ArgSerValLeuLysSerThrAsnAspAlaAsnSerAlaGluThrVal
275280285
AsnAlaIlePheAspCysIleAsnValLysThrLeuThrAspTyrGln
290295300
SerIleAlaThrGlnPheAspSerGlnThrLysAspValGlnGluAsn
305310315320
SerIleIleGluArgGluLysThrProPheGlyThrLysAsnTyrIle
325330335
HisAspArgPheSerGlnValIlePheArgValThrAspSerGluGly
340345350
TyrProValThrSerPheAspLeuIleLeuThrGlyGlyGluLysAsn
355360365
AspProAsnAlaLeuProGlnGlyPhePheValAspArgGlnCysAsn
370375380
SerValAsnLysSerThrIleThrTyrPheLeuAsnTyrAspIleMet
385390395400
AsnGlyThrProAlaIleAlaGlyIleArgProAlaSerLysGlyMet
405410415
GluLysLeuGlyLeuIleIleAsnProArgProGluGluGlyPheVal
420425430
ArgTyrIleProCysLysIleAsnThrSerProAspLeuPheAspAla
435440445
AlaLeuLysProAsnAlaThrThrLeuIleAspIleValLeuGlnArg
450455460
ValValSerThrGluValPheArgPheGluGlyThrAspGlyValThr
465470475480
ProProLysLysAspPheSerLysValLysProGlyThrAspIleIle
485490495
<210>55
<211>1041
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>55
atggcttcacaattcagaaatctggtttttgaaggaggcggtgtgaagggcatcgcctat60
atcggcgccatgcaggtgctggagcagcggggactgctcaaggatattgtccgggtggga120
ggtaccagtgcaggcgccatcaacgcgctgatcttttcgctgggctttaccatcaaagag180
cagcaggatattctcaactccaccaacttcagggagtttatggacagctcgttcgggttc240
atccgaaacttccggaggttatggagcgaattcggttggaaccgcggcgatgtattttcg300
gactgggccggggagctggtgaaagagaagctcggcaaaaagaacgccacgttcggcgat360
ctgaaaaaggcgaaacgtcccgatctgtacgtgatcggcaccaatctctctacggggttt420
tccgagaccttttcgcacgaacgccacgccgacatgcctctggtagatgcggtgcggata480
agcatgtcgatcccgctcttttttgctgcacggaggctgggaaaacgtaaggatgtgtat540
gtggatggcggggtgatgctcaactatcccgtgaagctgttcgacagggagaagtatatc600
gatttggagaaagagaatgaggcggcccgctatgtggagtactacaatcaagagaatgcc660
cggtttctgctcgagcggcccggccgaagcccttatgtgtataaccggcagactctcggt720
ctgcggctcgacacgcaggaagagatcggcctgttccgttacgatgagccgctgaagggc780
aagcagatcaaccgtttccccgaatacgccagagccctgatcggctcgctgatgcaggta840
caggagaacatccacctgaaaagtgacgactggcagcgaacgctctacatcaacacgctg900
gatgtgggcaccaccgatttcgacattaccgacgagaagaaaaaagtgctggtgaatgag960
gggatcaagggagcggagacctatttccgctggtttgaggatcccgaagaaaaaccggtg1020
aataaggtgaatcttgtctga1041
<210>56
<211>346
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>56
MetAlaSerGlnPheArgAsnLeuValPheGluGlyGlyGlyValLys
151015
GlyIleAlaTyrIleGlyAlaMetGlnValLeuGluGlnArgGlyLeu
202530
LeuLysAspIleValArgValGlyGlyThrSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheSerLeuGlyPheThrIleLysGluGlnGlnAspIle
505560
LeuAsnSerThrAsnPheArgGluPheMetAspSerSerPheGlyPhe
65707580
IleArgAsnPheArgArgLeuTrpSerGluPheGlyTrpAsnArgGly
859095
AspValPheSerAspTrpAlaGlyGluLeuValLysGluLysLeuGly
100105110
LysLysAsnAlaThrPheGlyAspLeuLysLysAlaLysArgProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheSerGluThrPhe
130135140
SerHisGluArgHisAlaAspMetProLeuValAspAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaArgArgLeuGlyLysArg
165170175
LysAspValTyrValAspGlyGlyValMetLeuAsnTyrProValLys
180185190
LeuPheAspArgGluLysTyrIleAspLeuGluLysGluAsnGluAla
195200205
AlaArgTyrValGluTyrTyrAsnGlnGluAsnAlaArgPheLeuLeu
210215220
GluArgProGlyArgSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspThrGlnGluGluIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysGlnIleAsnArgPheProGluTyrAlaArgAla
260265270
LeuIleGlySerLeuMetGlnValGlnGluAsnIleHisLeuLysSer
275280285
AspAspTrpGlnArgThrLeuTyrIleAsnThrLeuAspValGlyThr
290295300
ThrAspPheAspIleThrAspGluLysLysLysValLeuValAsnGlu
305310315320
GlyIleLysGlyAlaGluThrTyrPheArgTrpPheGluAspProGlu
325330335
GluLysProValAsnLysValAsnLeuVal
340345
<210>57
<211>1413
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>57
atgcaattagtgttcgtacacgggtggagtgttacccataccaatacctatggtgaatta60
cccgaaagtttggcggcaggcgccgcgacacacggcctgcagatcgatatcaggcacgtt120
tttctcggcaagtacatcagctttcacgatgaggtgactctggatgatatagcacgtgcc180
ttcgacaaggcgctgagagacatgtcgggtgatggtgacacggtctcgcctttctcctgt240
atcacgcattcgaccggcggccctgtcgttcggcactggattaacaaattctacggcgcg300
cgagggctatcgaaactgccgctggagcatttggttatgctggcgcctgccaaccacggc360
tccagcctggcggtactcggcaagcaacgtcttggtcgcatcaagtcctggttcgatggc420
gtggagcccggacaaaaagtgctcgactggctatcgctgggcagcaatgggcaatgggcg480
ctcaacagggattttttgagctaccgcccggccaaacatggcttcttcccttttgttctg540
acgggccagggtatagacacaaaattctacgattttttgaacagctaccttgtggagccc600
ggcagtgacggtgtggttcgcgtggcgggtgccaatatgcattttcgctacctctccctg660
gtacaatctgagaccgtattacacaccccgggcaaggtgctacagctggaatataacgag720
cggcgccccgtgaagtccccacaagcggtaccgatgggcgtcttctcccaatttagccac780
tctggcgacaagatggggattatggcagtcaagcgcaagaaagacgcgcatcaaatgatc840
gtaacggaagtgctgaagtgtctctgcgtatcggacagcgatgaatatcagcaaagaggc900
cttgaacttgcagaactgaccgccagcgaacagcgcaagcccatcgaagaccaggacaag960
attatcagccgctatagcatgctggtatttagagtgcgcgaccaggcgggcaatacgatc1020
ggagtgcacgatttcgatatcctcttactggccggagatacctatagccccgacaaactg1080
ccagaggggttcttcatggataaacaggccaatagagatgccggctcactgatctactat1140
gtggatgccgacaaaatgtccgagatgaaagatggctgctacggactgcgggtggtcgtg1200
cggccggagaaagggttttcctattacacaacaggtgagttcaggtcagagggtatcccc1260
gtggaccgtgtatttgcagcaaacgaaaccacctatattgatatcaccatgaaccgaagt1320
gtcgatcaaaatgtattccggttttcgcctgcaacagagccacctgaaagcttcaaaaga1380
accacgccctcaggtaccgatatcccttcatag1413
<210>58
<211>470
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>58
MetGlnLeuValPheValHisGlyTrpSerValThrHisThrAsnThr
151015
TyrGlyGluLeuProGluSerLeuAlaAlaGlyAlaAlaThrHisGly
202530
LeuGlnIleAspIleArgHisValPheLeuGlyLysTyrIleSerPhe
354045
HisAspGluValThrLeuAspAspIleAlaArgAlaPheAspLysAla
505560
LeuArgAspMetSerGlyAspGlyAspThrValSerProPheSerCys
65707580
IleThrHisSerThrGlyGlyProValValArgHisTrpIleAsnLys
859095
PheTyrGlyAlaArgGlyLeuSerLysLeuProLeuGluHisLeuVal
100105110
MetLeuAlaProAlaAsnHisGlySerSerLeuAlaValLeuGlyLys
115120125
GlnArgLeuGlyArgIleLysSerTrpPheAspGlyValGluProGly
130135140
GlnLysValLeuAspTrpLeuSerLeuGlySerAsnGlyGlnTrpAla
145150155160
LeuAsnArgAspPheLeuSerTyrArgProAlaLysHisGlyPhePhe
165170175
ProPheValLeuThrGlyGlnGlyIleAspThrLysPheTyrAspPhe
180185190
LeuAsnSerTyrLeuValGluProGlySerAspGlyValValArgVal
195200205
AlaGlyAlaAsnMetHisPheArgTyrLeuSerLeuValGlnSerGlu
210215220
ThrValLeuHisThrProGlyLysValLeuGlnLeuGluTyrAsnGlu
225230235240
ArgArgProValLysSerProGlnAlaValProMetGlyValPheSer
245250255
GlnPheSerHisSerGlyAspLysMetGlyIleMetAlaValLysArg
260265270
LysLysAspAlaHisGlnMetIleValThrGluValLeuLysCysLeu
275280285
CysValSerAspSerAspGluTyrGlnGlnArgGlyLeuGluLeuAla
290295300
GluLeuThrAlaSerGluGlnArgLysProIleGluAspGlnAspLys
305310315320
IleIleSerArgTyrSerMetLeuValPheArgValArgAspGlnAla
325330335
GlyAsnThrIleGlyValHisAspPheAspIleLeuLeuLeuAlaGly
340345350
AspThrTyrSerProAspLysLeuProGluGlyPhePheMetAspLys
355360365
GlnAlaAsnArgAspAlaGlySerLeuIleTyrTyrValAspAlaAsp
370375380
LysMetSerGluMetLysAspGlyCysTyrGlyLeuArgValValVal
385390395400
ArgProGluLysGlyPheSerTyrTyrThrThrGlyGluPheArgSer
405410415
GluGlyIleProValAspArgValPheAlaAlaAsnGluThrThrTyr
420425430
IleAspIleThrMetAsnArgSerValAspGlnAsnValPheArgPhe
435440445
SerProAlaThrGluProProGluSerPheLysArgThrThrProSer
450455460
GlyThrAspIleProSer
465470
<210>59
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>59
atgacaacacaatttagaaacttgatctttgaaggcggcggtgtaaaaggcgttgcttac60
attggcgccatgcagattcttgaaaatcgtggcgtgttgcaagatattcgccgagtcgga120
gggtgcagtgcgggtgcgattaacgcgctgatttttgcgctgggttacacggtccgtgag180
caaaaagagatcttacaagccaccgattttaaccagtttatggataactcttggggggtt240
attcgtgatattcgcaggcttgctcgagactttggctggaataagggtgatttctttagt300
agctggataggtgatttgattcatcgtcgtttggggaatcgccgagcgacgttcaaagat360
ctgcaaaaggccaagcttcctgatctttatgtcatcggtactaatctgtctacagggttt420
gcagaggtgttttctgccgaaagacaccccgatatggagctggcgacagcggtgcgtatc480
tccatgtcgataccgctgttctttgcggcagtgcgtcatggtgatcgacaagatgtgtat540
gtcgatgggggtgttcaacttaactatccgattaaactgtttgatcgggagcgttatatt600
gatctggccaaagatcccggtgccgttcggcgaacgggttattacaacaaagaaaacgct660
cgctttcagcttgatcggccgggccatagcccctatgtttacaatcgccagaccttgggt720
ttgcgactggatagtcgcgaggagatagggctctttcgttatgacgaacccctcaagggc780
aaacccattaagtccttcactgactacgctcgacaacttttcggtgcgctgatgaatgca840
caggaaaagattcatctacatggcgatgattggcaacgcacggtctatatcgatacactc900
gatgtgggtacgacggacttcaatctttctgatgcaaccaagcaagcactgattgagcaa960
ggaattaacggcaccgaaaattatttcgactggtttgataatccgttagagaagcctgtg1020
aatagagtggagtcatag1038
<210>60
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>60
MetThrThrGlnPheArgAsnLeuIlePheGluGlyGlyGlyValLys
151015
GlyValAlaTyrIleGlyAlaMetGlnIleLeuGluAsnArgGlyVal
202530
LeuGlnAspIleArgArgValGlyGlyCysSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheAlaLeuGlyTyrThrValArgGluGlnLysGluIle
505560
LeuGlnAlaThrAspPheAsnGlnPheMetAspAsnSerTrpGlyVal
65707580
IleArgAspIleArgArgLeuAlaArgAspPheGlyTrpAsnLysGly
859095
AspPhePheSerSerTrpIleGlyAspLeuIleHisArgArgLeuGly
100105110
AsnArgArgAlaThrPheLysAspLeuGlnLysAlaLysLeuProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetGluLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaValArgHisGlyAspArg
165170175
GlnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProIleLys
180185190
LeuPheAspArgGluArgTyrIleAspLeuAlaLysAspProGlyAla
195200205
ValArgArgThrGlyTyrTyrAsnLysGluAsnAlaArgPheGlnLeu
210215220
AspArgProGlyHisSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerArgGluGluIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysProIleLysSerPheThrAspTyrAlaArgGln
260265270
LeuPheGlyAlaLeuMetAsnAlaGlnGluLysIleHisLeuHisGly
275280285
AspAspTrpGlnArgThrValTyrIleAspThrLeuAspValGlyThr
290295300
ThrAspPheAsnLeuSerAspAlaThrLysGlnAlaLeuIleGluGln
305310315320
GlyIleAsnGlyThrGluAsnTyrPheAspTrpPheAspAsnProLeu
325330335
GluLysProValAsnArgValGluSer
340345
<210>61
<211>1257
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>61
atgacattaaaactctccctgctgatcgcgagcctgagcgccgtgtctccagcagtcttg60
gcaaacgacgtcaatccagcgccactcatggcgccgtccgaagcggattccgcgcagacg120
ctgggcagtctgacgtacacctatgttcgctgctggtatcgtccggctgcgacgcataat180
gatccttacaccacctgggagtgggcgaagaacgcggacggcagtgatttcaccattgat240
ggctattggtggtcatcggtgagttacaaaaacatgttctataccgatactcagcccgat300
accatcatgcagcgctgtgcagagacgttggggttaacccacgataccgctgacatcacc360
tatgccgcggccgatacccgtttctcctacaaccacaccatctggagcaacgatgtcgcc420
aacgcgccgagcaaaatcaataaggtgatcgcctttggtgacagcctgtcagacacgggc480
aacatttttaacgcctcgcaatggcgcttcccgaacccgaactcctggtttgtcggccac540
ttctcaaacgggtttgtctggaccgagtatctggcgcaaggtttggggctgcccctctac600
aactgggccgtgggcggcgcggcggggcgcaatcaatactgggcgctgactggcgtgaat660
gaacaggtcagttcgtacctgacctacatggagatggcgccgaattaccgtgcggagaac720
acgctgtttacactcgaattcggtctgaatgattttatgaactacgaccgttcactggca780
gacgtcaaagcagattacagctcggcgctgattcgtctggtggaagccggagcgaaaaat840
atggtgctgttgaccctaccggatgccacgcgcgcgccgcagttccaatattcaacgcaa900
gaacacatcgacgaggtgcgcgccaaagtgattggcatgaacgcgttcattcgtgagcag960
gcacgctacttccagatgcagggcatcaacatttcgctgtttgacgcctacacgctgttt1020
gatcagatgatcgccgacccagccgcgcacggctttgataatgccagcgcgccatgtctt1080
gatattcagcgcagctctgcggcggactatctctacacgcatgctctggcagccgagtgt1140
gcctcatccggttcagaccgctttgtgttctgggatgtgactcacccaaccacggcaacg1200
catcgctacatcgccgaccacattctggctaccggtgttgcgcagttcccgcgttaa1257
<210>62
<211>418
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(21)
<400>62
MetThrLeuLysLeuSerLeuLeuIleAlaSerLeuSerAlaValSer
151015
ProAlaValLeuAlaAsnAspValAsnProAlaProLeuMetAlaPro
202530
SerGluAlaAspSerAlaGlnThrLeuGlySerLeuThrTyrThrTyr
354045
ValArgCysTrpTyrArgProAlaAlaThrHisAsnAspProTyrThr
505560
ThrTrpGluTrpAlaLysAsnAlaAspGlySerAspPheThrIleAsp
65707580
GlyTyrTrpTrpSerSerValSerTyrLysAsnMetPheTyrThrAsp
859095
ThrGlnProAspThrIleMetGlnArgCysAlaGluThrLeuGlyLeu
100105110
ThrHisAspThrAlaAspIleThrTyrAlaAlaAlaAspThrArgPhe
115120125
SerTyrAsnHisThrIleTrpSerAsnAspValAlaAsnAlaProSer
130135140
LysIleAsnLysValIleAlaPheGlyAspSerLeuSerAspThrGly
145150155160
AsnIlePheAsnAlaSerGlnTrpArgPheProAsnProAsnSerTrp
165170175
PheValGlyHisPheSerAsnGlyPheValTrpThrGluTyrLeuAla
180185190
GlnGlyLeuGlyLeuProLeuTyrAsnTrpAlaValGlyGlyAlaAla
195200205
GlyArgAsnGlnTyrTrpAlaLeuThrGlyValAsnGluGlnValSer
210215220
SerTyrLeuThrTyrMetGluMetAlaProAsnTyrArgAlaGluAsn
225230235240
ThrLeuPheThrLeuGluPheGlyLeuAsnAspPheMetAsnTyrAsp
245250255
ArgSerLeuAlaAspValLysAlaAspTyrSerSerAlaLeuIleArg
260265270
LeuValGluAlaGlyAlaLysAsnMetValLeuLeuThrLeuProAsp
275280285
AlaThrArgAlaProGlnPheGlnTyrSerThrGlnGluHisIleAsp
290295300
GluValArgAlaLysValIleGlyMetAsnAlaPheIleArgGluGln
305310315320
AlaArgTyrPheGlnMetGlnGlyIleAsnIleSerLeuPheAspAla
325330335
TyrThrLeuPheAspGlnMetIleAlaAspProAlaAlaHisGlyPhe
340345350
AspAsnAlaSerAlaProCysLeuAspIleGlnArgSerSerAlaAla
355360365
AspTyrLeuTyrThrHisAlaLeuAlaAlaGluCysAlaSerSerGly
370375380
SerAspArgPheValPheTrpAspValThrHisProThrThrAlaThr
385390395400
HisArgTyrIleAlaAspHisIleLeuAlaThrGlyValAlaGlnPhe
405410415
ProArg
<210>63
<211>1242
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>63
atgaaaaatacgttaattttggctggctgtatattggcagctccagccgtcgcagatgac60
ctaacaatcacccctgaaactataagtgtgcgctacgcgtctgaggtgcagaacaaacaa120
acatacacttatgttcgctgctggtatcgtccagcgcagaaccatgacgacccttccact180
gagtgggaatgggctcgtgacgacaatggcgattacttcactatcgatgggtactggtgg240
tcgtctgtctccttcaaaaacatgttctataccaataccccgcaaacagaaattgaaaac300
cgctgtaaagaaacactaggggttaatcatgatagtgccgatcttctttactatgcatca360
gacaatcgtttctcctacaaccatagtatttggacaaacgacaacgcagtaaacaacaaa420
atcaatcgtattgtcgcattcggtgatagcctgtctgacaccggtaatctgtacaatgga480
tcccaatgggtattccccaaccgtaattcttggtttctcggtcacttttcaaacggtttg540
gtgtggactgaatacttagcgcaaaacaaaaacgtaccactgtacaactgggcggtcggt600
ggcgccgccggcaccaaccaatacgtcgcattgacaggcatttatgaccaagtgacgtct660
tatcttacgtacatgaagatggcaaagaactacaacccaaacaacagtttgatgacgctg720
gaatttggcctaaatgatttcatgaattacggccgagaagtggcggacgtgaaagctgac780
ttaagtagcgcattgattcgcttgaccgaatcaggcgcaagcaacattctactcttcacg840
ttaccggacgcaacaaaggcaccgcagtttaaatattcgactcaggaggaaattgagacc900
gttcgagctaagattcttgagttcaacacttttattgaagaacaagcgttactctatcaa960
gctaaaggactgaatgtggccctctacgatgctcatagcatctttgatcagctgacatcc1020
aatcctaaacaacacggttttgagaactcaacagatgcctgtctgaacatcaaccgcagt1080
tcctctgtcgactacctttacagtcatgagctaactaacgattgtgcgtatcatagctct1140
gataaatatgtgttctggggagtcactcacccaaccacagcaacacataaatacattgcc1200
gaccaaatcattcagaccaagctagaccagttcaatttctaa1242
<210>64
<211>413
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(18)
<400>64
MetLysAsnThrLeuIleLeuAlaGlyCysIleLeuAlaAlaProAla
151015
ValAlaAspAspLeuThrIleThrProGluThrIleSerValArgTyr
202530
AlaSerGluValGlnAsnLysGlnThrTyrThrTyrValArgCysTrp
354045
TyrArgProAlaGlnAsnHisAspAspProSerThrGluTrpGluTrp
505560
AlaArgAspAspAsnGlyAspTyrPheThrIleAspGlyTyrTrpTrp
65707580
SerSerValSerPheLysAsnMetPheTyrThrAsnThrProGlnThr
859095
GluIleGluAsnArgCysLysGluThrLeuGlyValAsnHisAspSer
100105110
AlaAspLeuLeuTyrTyrAlaSerAspAsnArgPheSerTyrAsnHis
115120125
SerIleTrpThrAsnAspAsnAlaValAsnAsnLysIleAsnArgIle
130135140
ValAlaPheGlyAspSerLeuSerAspThrGlyAsnLeuTyrAsnGly
145150155160
SerGlnTrpValPheProAsnArgAsnSerTrpPheLeuGlyHisPhe
165170175
SerAsnGlyLeuValTrpThrGluTyrLeuAlaGlnAsnLysAsnVal
180185190
ProLeuTyrAsnTrpAlaValGlyGlyAlaAlaGlyThrAsnGlnTyr
195200205
ValAlaLeuThrGlyIleTyrAspGlnValThrSerTyrLeuThrTyr
210215220
MetLysMetAlaLysAsnTyrAsnProAsnAsnSerLeuMetThrLeu
225230235240
GluPheGlyLeuAsnAspPheMetAsnTyrGlyArgGluValAlaAsp
245250255
ValLysAlaAspLeuSerSerAlaLeuIleArgLeuThrGluSerGly
260265270
AlaSerAsnIleLeuLeuPheThrLeuProAspAlaThrLysAlaPro
275280285
GlnPheLysTyrSerThrGlnGluGluIleGluThrValArgAlaLys
290295300
IleLeuGluPheAsnThrPheIleGluGluGlnAlaLeuLeuTyrGln
305310315320
AlaLysGlyLeuAsnValAlaLeuTyrAspAlaHisSerIlePheAsp
325330335
GlnLeuThrSerAsnProLysGlnHisGlyPheGluAsnSerThrAsp
340345350
AlaCysLeuAsnIleAsnArgSerSerSerValAspTyrLeuTyrSer
355360365
HisGluLeuThrAsnAspCysAlaTyrHisSerSerAspLysTyrVal
370375380
PheTrpGlyValThrHisProThrThrAlaThrHisLysTyrIleAla
385390395400
AspGlnIleIleGlnThrLysLeuAspGlnPheAsnPhe
405410
<210>65
<211>1164
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>65
atgaacccttttcttgaagataaaattaaatcctccggtcccaagaaaatcctcgcctgc60
gatggcggaggtattttgggtttgatgagcgttgaaatcctagcaaaaattgaagcggat120
ttacgcactaagttaggtaaagaccagaacttcgtgctcgcggattatttcgattttgtc180
tgcggcaccagcaccggcgcgattatcgctgcctgtatttctagtggcatgtcgatggct240
aaaatacgccaattctatctcgacagtgggaagcaaatgttcgataaggcctccttgctt300
aagcgcttgcaatacagttatgacgatgagccattggcgaggcagttgcgtgcagccttt360
gatgagcaactgaaggaaaccgatgccaagctgggtagtgcgcacctaaaaacgctgttg420
atgatggtgatgcgtaaccacagcaccgactcaccttggccggtttccaataacccttac480
gcaaaatacaataatatcgcccgaaaggattgcaacctcaacctgcctttatggcaattg540
gtccgtgccagcaccgccgctccgacgtatttcccaccggaagtcatcactttcgcagat600
ggcacacccgaagaatacaacttcatcttcgtcgacggtggcgtgaccacctacaacaac660
ccagcatatcttgctttcctaatggccactgccaagccttatgccctcaactggccgaca720
ggcagcaaccagttattgatcgtttccgtaggcaccggaagtgccgccaatgtccgacct780
aatctggacgtggatgatatgaacctgatccattttgccaaaaacatcccttcagccctg840
atgaatgccgcatctgccggttgggatatgacctgccgggtattgggtgaatgccgccat900
ggtggcatgttagatcgggagtttggtgacatggtgatgcccgcgtcaagagatcttaat960
tttaccggccctaagctttttacttatatgcgttatgatcccgatgtttcctttgagggc1020
ttgaagactatcggtatatcagatatcgatccagccaaaatgcagcaaatggattccgtc1080
aataatattccagatatacaacgggtaggtatcgaatatgccaaacgccatgttgataca1140
gctcattttgaggggtttaaataa1164
<210>66
<211>387
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>66
MetAsnProPheLeuGluAspLysIleLysSerSerGlyProLysLys
151015
IleLeuAlaCysAspGlyGlyGlyIleLeuGlyLeuMetSerValGlu
202530
IleLeuAlaLysIleGluAlaAspLeuArgThrLysLeuGlyLysAsp
354045
GlnAsnPheValLeuAlaAspTyrPheAspPheValCysGlyThrSer
505560
ThrGlyAlaIleIleAlaAlaCysIleSerSerGlyMetSerMetAla
65707580
LysIleArgGlnPheTyrLeuAspSerGlyLysGlnMetPheAspLys
859095
AlaSerLeuLeuLysArgLeuGlnTyrSerTyrAspAspGluProLeu
100105110
AlaArgGlnLeuArgAlaAlaPheAspGluGlnLeuLysGluThrAsp
115120125
AlaLysLeuGlySerAlaHisLeuLysThrLeuLeuMetMetValMet
130135140
ArgAsnHisSerThrAspSerProTrpProValSerAsnAsnProTyr
145150155160
AlaLysTyrAsnAsnIleAlaArgLysAspCysAsnLeuAsnLeuPro
165170175
LeuTrpGlnLeuValArgAlaSerThrAlaAlaProThrTyrPhePro
180185190
ProGluValIleThrPheAlaAspGlyThrProGluGluTyrAsnPhe
195200205
IlePheValAspGlyGlyValThrThrTyrAsnAsnProAlaTyrLeu
210215220
AlaPheLeuMetAlaThrAlaLysProTyrAlaLeuAsnTrpProThr
225230235240
GlySerAsnGlnLeuLeuIleValSerValGlyThrGlySerAlaAla
245250255
AsnValArgProAsnLeuAspValAspAspMetAsnLeuIleHisPhe
260265270
AlaLysAsnIleProSerAlaLeuMetAsnAlaAlaSerAlaGlyTrp
275280285
AspMetThrCysArgValLeuGlyGluCysArgHisGlyGlyMetLeu
290295300
AspArgGluPheGlyAspMetValMetProAlaSerArgAspLeuAsn
305310315320
PheThrGlyProLysLeuPheThrTyrMetArgTyrAspProAspVal
325330335
SerPheGluGlyLeuLysThrIleGlyIleSerAspIleAspProAla
340345350
LysMetGlnGlnMetAspSerValAsnAsnIleProAspIleGlnArg
355360365
ValGlyIleGluTyrAlaLysArgHisValAspThrAlaHisPheGlu
370375380
GlyPheLys
385
<210>67
<211>1419
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>67
atggtcattgtcttcgtccacggatggagcgtgcgcaacaccaacacgtacgggcagctg60
cccttgcgtctcaagaagagcttcaaagccgccgggaaacagattcaggtcgagaacatc120
tacctgggcgagtacgtgagctttgacgaccaggtaacagtcgacgacatcgcccgcgca180
ttcgattgcgcactgcgggaaaaactatacgatccggcgacgaagcagtggacgaagttc240
gcctgcatcactcattccaccggcggcccggtcgcgcgcttgtggatggatctctactac300
ggcgccgccagactggccgagtgcccgatgtcccacctcgtgatgctcgccccggccaat360
catggctcggcccttgcccagctcggcaagagccgcctcagccgcatcaagagcttcttc420
gagggtgtcgaaccgggccagcgcgtcctcgactggctcgaactcggcagtgagctgagt480
tgggccctcaacacgagatggctcgactacgactgccgcgccgccgcctgctgggtcttc540
accctcaccggccagcgcatcgaccggagtttgtacgaccatctcaacagctataccggt600
gagcagggatcggatggcgtcgtgcgcgtcgccgcggccaacatgaacaccaagctgctg660
acctttgaacagaaggggcgcaagctcgtgttcacaggccagaagaagaccgccgacacc720
ggccttggcgtcgtgccgggccggtcgcactccggccgcgacatgggcatcatcgccagc780
gtgcgcggcaccggcgaccatcccaccctggaatgggtgactcgttgcctggccgtcacc840
gacgtcaacacgtacgatgccgtctgtaaggatctggacgctctcaccgcccagacccag900
aaggatgaaaaggtggaagaggtcaaaggcctgctgcggacggtcagataccagacggac960
cgctacgtcatgctcgtcttccgcctgaagaacgaccgcggcgactacctctccgattac1020
gatctcctgctcaccgccggacccaactactcgcccgacgacctgcccgaaggcttcttc1080
gtcgaccgccaacggaaccagcggaacccgggcaagctcacttactacctgaactacgac1140
gccatggccaaattgaaaggtaagaccgccgagggccgtctgggcttcaagatcctggcg1200
cgcccggtgaaaggcggcctcgtctactatgaggttgcggagttccagtccgacgtgggc1260
ggcgtcagcagcatgctgcagcccaacgcaacagtgatgatcgacatcaccctcaatcgc1320
aacgtcgacgcgcgcgtcttccggttcaccgagaatctgcccacgggtgaccagggcgag1380
gaaatcagcggcgtcccgctggggcagaacgtcccgtag1419
<210>68
<211>472
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>68
MetValIleValPheValHisGlyTrpSerValArgAsnThrAsnThr
151015
TyrGlyGlnLeuProLeuArgLeuLysLysSerPheLysAlaAlaGly
202530
LysGlnIleGlnValGluAsnIleTyrLeuGlyGluTyrValSerPhe
354045
AspAspGlnValThrValAspAspIleAlaArgAlaPheAspCysAla
505560
LeuArgGluLysLeuTyrAspProAlaThrLysGlnTrpThrLysPhe
65707580
AlaCysIleThrHisSerThrGlyGlyProValAlaArgLeuTrpMet
859095
AspLeuTyrTyrGlyAlaAlaArgLeuAlaGluCysProMetSerHis
100105110
LeuValMetLeuAlaProAlaAsnHisGlySerAlaLeuAlaGlnLeu
115120125
GlyLysSerArgLeuSerArgIleLysSerPhePheGluGlyValGlu
130135140
ProGlyGlnArgValLeuAspTrpLeuGluLeuGlySerGluLeuSer
145150155160
TrpAlaLeuAsnThrArgTrpLeuAspTyrAspCysArgAlaAlaAla
165170175
CysTrpValPheThrLeuThrGlyGlnArgIleAspArgSerLeuTyr
180185190
AspHisLeuAsnSerTyrThrGlyGluGlnGlySerAspGlyValVal
195200205
ArgValAlaAlaAlaAsnMetAsnThrLysLeuLeuThrPheGluGln
210215220
LysGlyArgLysLeuValPheThrGlyGlnLysLysThrAlaAspThr
225230235240
GlyLeuGlyValValProGlyArgSerHisSerGlyArgAspMetGly
245250255
IleIleAlaSerValArgGlyThrGlyAspHisProThrLeuGluTrp
260265270
ValThrArgCysLeuAlaValThrAspValAsnThrTyrAspAlaVal
275280285
CysLysAspLeuAspAlaLeuThrAlaGlnThrGlnLysAspGluLys
290295300
ValGluGluValLysGlyLeuLeuArgThrValArgTyrGlnThrAsp
305310315320
ArgTyrValMetLeuValPheArgLeuLysAsnAspArgGlyAspTyr
325330335
LeuSerAspTyrAspLeuLeuLeuThrAlaGlyProAsnTyrSerPro
340345350
AspAspLeuProGluGlyPhePheValAspArgGlnArgAsnGlnArg
355360365
AsnProGlyLysLeuThrTyrTyrLeuAsnTyrAspAlaMetAlaLys
370375380
LeuLysGlyLysThrAlaGluGlyArgLeuGlyPheLysIleLeuAla
385390395400
ArgProValLysGlyGlyLeuValTyrTyrGluValAlaGluPheGln
405410415
SerAspValGlyGlyValSerSerMetLeuGlnProAsnAlaThrVal
420425430
MetIleAspIleThrLeuAsnArgAsnValAspAlaArgValPheArg
435440445
PheThrGluAsnLeuProThrGlyAspGlnGlyGluGluIleSerGly
450455460
ValProLeuGlyGlnAsnValPro
465470
<210>69
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>69
atgacaacacaatttagaaacttgatatttgaaggcggcggtgtaaaaggtgttgcttac60
attggcgccatgcagattctcgaaaatcgtggcgtgttgcaagatattcgccgagtcgga120
gggtgcagtgcgggtgcgatcaacgegctgatttttgcgctgggttacactgtccgtgag180
caaaaagagatcttacaagccacggattttaaccagtttatggataactcttggggtgtt240
attcgtgatattcgcaggcttgctcgagactttggctggcacaagggtgacttctttaat300
agctggataggtgatttgattcatcgtcgtttggggaatcgccgagcgacgttcaaagat360
ctgcaaaaggccaagcttcctgatctttatgtcatcggtactaatctgtctacggggtat420
gcagaggttttttcagccgaaagacaccccgatatggagctagcgacagcggtgcgtatc480
tccatgtcgataccgctgttctttgcggccgtgcgccacggtgaccgacaagatgtgtat540
gtcgatgggggtgttcaacttaactatccgattaaactttttgatcgggagcgttacatt600
gatctggccaaagatcccggtgccgttcggcgaacgggctattacaacaaagaaaacgct660
cgctttcagcttgagcggccgggctatagcccctatgtttacaatcgccagaccttgggt720
ttgcgactagatagtcgagaggagatagggctctttcgttatgacgaacccctcaagggc780
aaacccattaagtccttcactgactacgctcgacaacttttcggtgcgttgatgaatgca840
caggaaaagattcatctacatggcgatgattggcagcgcacggtctatatcgatacattg900
gatgtgggtacgacggacttcaatctttctgatgcaactaagcaagcactgattgaacag960
ggaattaacggcaccgaaaattatttcgagtggtttgataatccgttggagaagcctgtt1020
aatagagtggagtcatag1038
<210>70
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>70
MetThrThrGlnPheArgAsnLeuIlePheGluGlyGlyGlyValLys
151015
GlyValAlaTyrIleGlyAlaMetGlnIleLeuGluAsnArgGlyVal
202530
LeuGlnAspIleArgArgValGlyGlyCysSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheAlaLeuGlyTyrThrValArgGluGlnLysGluIle
505560
LeuGlnAlaThrAspPheAsnGlnPheMetAspAsnSerTrpGlyVal
65707580
IleArgAspIleArgArgLeuAlaArgAspPheGlyTrpHisLysGly
859095
AspPhePheAsnSerTrpIleGlyAspLeuIleHisArgArgLeuGly
100105110
AsnArgArgAlaThrPheLysAspLeuGlnLysAlaLysLeuProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyTyrAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetGluLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaValArgHisGlyAspArg
165170175
GlnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProIleLys
180185190
LeuPheAspArgGluArgTyrIleAspLeuAlaLysAspProGlyAla
195200205
ValArgArgThrGlyTyrTyrAsnLysGluAsnAlaArgPheGlnLeu
210215220
GluArgProGlyTyrSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerArgGluGluIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysProIleLysSerPheThrAspTyrAlaArgGln
260265270
LeuPheGlyAlaLeuMetAsnAlaGlnGluLysIleHisLeuHisGly
275280285
AspAspTrpGlnArgThrValTyrIleAspThrLeuAspValGlyThr
290295300
ThrAspPheAsnLeuSerAspAlaThrLysGlnAlaLeuIleGluGln
305310315320
GlyIleAsnGlyThrGluAsnTyrPheGluTrpPheAspAsnProLeu
325330335
GluLysProValAsnArgValGluSer
340345
<210>71
<211>3264
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>71
atgtcgctatcatcaccgcccgaaacccccgaaccccccgaacccccgtcacccggcgcg60
cgatcgctccggggaggatggagccgccgggtggccggcctgctggccctggtgctgctc120
accgggctcctccagatcgtcgtgccgctcgcacggcccgccgcggcggccgtacagcag180
cccgcgatgacgtggaacctgcatggggccaagaagaccgcggaactggttcccgatctg240
atgcgtaaccataacgtcaccgtcgcggccctccaggaagtggccaacggcaacttcctg300
ggcctcactcccacagagcacgacgtgccctacctcaagccggacggcacgacctcgact360
ccgccggatccgcagaaatggcgggtcgagaagtacaacctcgccaaggacgatgcaacc420
gctttcgtgatccggaccggctccaacaaccgcgggctcgcgatcgtcaccacccaggac480
gtcggcgatgtctcgcagaatgtacacgtcgtcaatgtgaccgaggattgggaaggcaag540
atgttccccgccctgggggtgaagatcgacggcgcctggtactactccatccacgcctcc600
accacgccgaagcgcgcgaacaacaacgccggcactctggtcgaggacctctccaagctg660
cacgagacggccgctttcgaaggcgactgggccgcgatgggcgactggaaccggtacccc720
tccgaggactcgaacgcctacgagaaccaacggaagcatctcaaaggcgccatgcggaca780
aactttccggataatcaggcggcgttgcgcgaagtcctggagttcgagtccgacgaacgc840
gtcatctggcagggtgcgaggacccacgaccacggcgccgagctcgactacatggtggcc900
aagggagccggtaacgactacaaggccagccgatcgacgtcgaagcacggctccgatcac960
tacccggtgttcttcggtattggggacgattcggacacctgcatgggcggcacggcgccg1020
gtggcggcgaacgcgccgcgtgcggccgccaccgagtcctgtcccctggacgacgatctg1080
ccggccgtcatcgtctcgatgggggacagctatatctccggcgagggagggcgctggcag1140
ggcaacgccaacacctcctccgggggcgactcctggggcaccgaccgggccgccgacggc1200
acggaggtctacgagaagaactccgaaggcagcgatgcctgtcaccgctccgacgtcgcg1260
gagatcaagcgcgccgacatcgccgacatcccggcggaacgcaggatcaacatcgcctgc1320
tcgggcgccgagaccaagcacctgctcaccgagaccttcaagggtgaaaagccccagatc1380
gagcagctcgccgacgtcgccgaaacccaccgggtggacacgatcgtggtctccatcggc1440
ggcaacgacctcgagttcgccgacatcgtgagccagtgcgccacggccttcatgctcggg1500
gaaggcgcgtgtcacacggacgtcgacgatacccttgatagccggttgggcgatgtgagc1560
agatccgtctccgaggttctggccgccatccgcgacaccatgarcgaggccgggcaggac1620
gataccagctacaagctcgttctccagtcctaccctgccccgttgcccgcgtcggatgag1680
atgcggtacacgggcgatcactacgaccggtacaccgagggcggctgccccttctatgac1740
gtcgacctggactggacgcgcgacgtcctcatcaaaaagatcgaagccacgctgcgcggg1800
gtggccaagagtgcggatgcggccttcctcaacctgacggacacgttcacggggcacgag1860
ctgtgctcgaagcacacccgacaggcggagtccggcgaatcgctggcgaatccaatactg1920
gaacacgaggccgagtgggtgcgcttcgtaccaggtctcaccacgccgggtgacacggcc1980
gaagccatccatccgaatgcgttcggccagcacgccctcagtagctgcctcagccaggcc2040
gtccggacgatggacgattcggaccagaggtacttcgagtgcgacgggcgggacaccgga2100
aatccccgcctcgtgtggccacgcagttcgcccatcgacgccgtcgtggagaccgcggac2160
ggttggcagggcgacgacttccggctcgccgaccactacatgttccagcgcggcgtctac2220
gcccgcttcaacccggacgcggaccggagcggcgcgatcgatccgggccgaatcaccttc2280
ggccaaaccgacggatggctcggtgaggtgaaggacacttcgaactggccgagcctgagt2340
ggaaccgacttcgtcgacggcatcgacgccgccgccgaggcacgcaccagcaccggtcac2400
cagctgctgctgttccacagcggcgttgaggacaaccagtacgtgcgggtcgagatggcg2460
ccgggcaccactgacgaccagctcgtcaggggccccgtgcccatcacgaggtactggccc2520
ctcttccaggacacccctttcgaatggggcgtggatgccgccgcgggggaccagctgaac2580
cgggcgatggtcttcaggcacggctatgtggggctggtgcaggtctccctcgacgctctc2640
agcgacgaatggctcgtggaaccgacgttgatcggctcggcgattccggcgctggagggc2700
accccgttcgagacaggggtggacgcggcgatcgtgcggcaccagcaaccgacggccatg2760
tgggtcgacctgatcagcggtacgcaggtggtgacgctgctggtggacttggacgatctg2820
tcgaagagcacgtacatgacgagcatcgtggagatcacgacgatgtggccgagcctgcgc2880
ggcagcatcttcgactggaccggcggagaggcgtggaagccggagaagatgcagatcaag2940
accggcgcgggcgatccctacgacatggacgccgacgaccggcaggccaagcctgcggtg3000
tcgggctcgcacgagcagtgccgtccggagggactagcgcagacccccggcgtgaacacg3060
ccgtactgcgaggtgtacgacaccgacggccgcgaatggctgggcgggaacgggcacgac3120
aggcgggtcatcggctacttcaccggctggcgcaccggtgagaacgaccagccgcgctac3180
ctggtgccgaacatcccgtggtcgaaggtgacccacatcaactacgcgttcgcgaaagtc3240
gacgacgacaacaagatccaaaga3264
<210>72
<211>1088
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>72
MetSerLeuSerSerProProGluThrProGluProProGluProPro
151015
SerProGlyAlaArgSerLeuArgGlyGlyTrpSerArgArgValAla
202530
GlyLeuLeuAlaLeuValLeuLeuThrGlyLeuLeuGlnIleValVal
354045
ProLeuAlaArgProAlaAlaAlaAlaValGlnGlnProAlaMetThr
505560
TrpAsnLeuHisGlyAlaLysLysThrAlaGluLeuValProAspLeu
65707580
MetArgAsnHisAsnValThrValAlaAlaLeuGlnGluValAlaAsn
859095
GlyAsnPheLeuGlyLeuThrProThrGluHisAspValProTyrLeu
100105110
LysProAspGlyThrThrSerThrProProAspProGlnLysTrpArg
115120125
ValGluLysTyrAsnLeuAlaLysAspAspAlaThrAlaPheValIle
130135140
ArgThrGlySerAsnAsnArgGlyLeuAlaIleValThrThrGlnAsp
145150155160
ValGlyAspValSerGlnAsnValHisValValAsnValThrGluAsp
165170175
TrpGluGlyLysMetPheProAlaLeuGlyValLysIleAspGlyAla
180185190
TrpTyrTyrSerIleHisAlaSerThrThrProLysArgAlaAsnAsn
195200205
AsnAlaGlyThrLeuValGluAspLeuSerLysLeuHisGluThrAla
210215220
AlaPheGluGlyAspTrpAlaAlaMetGlyAspTrpAsnArgTyrPro
225230235240
SerGluAspSerAsnAlaTyrGluAsnGlnArgLysHisLeuLysGly
245250255
AlaMetArgThrAsnPheProAspAsnGlnAlaAlaLeuArgGluVal
260265270
LeuGluPheGluSerAspGluArgValIleTrpGlnGlyAlaArgThr
275280285
HisAspHisGlyAlaGluLeuAspTyrMetValAlaLysGlyAlaGly
290295300
AsnAspTyrLysAlaSerArgSerThrSerLysHisGlySerAspHis
305310315320
TyrProValPhePheGlyIleGlyAspAspSerAspThrCysMetGly
325330335
GlyThrAlaProValAlaAlaAsnAlaProArgAlaAlaAlaThrGlu
340345350
SerCysProLeuAspAspAspLeuProAlaValIleValSerMetGly
355360365
AspSerTyrIleSerGlyGluGlyGlyArgTrpGlnGlyAsnAlaAsn
370375380
ThrSerSerGlyGlyAspSerTrpGlyThrAspArgAlaAlaAspGly
385390395400
ThrGluValTyrGluLysAsnSerGluGlySerAspAlaCysHisArg
405410415
SerAspValAlaGluIleLysArgAlaAspIleAlaAspIleProAla
420425430
GluArgArgIleAsnIleAlaCysSerGlyAlaGluThrLysHisLeu
435440445
LeuThrGluThrPheLysGlyGluLysProGlnIleGluGlnLeuAla
450455460
AspValAlaGluThrHisArgValAspThrIleValValSerIleGly
465470475480
GlyAsnAspLeuGluPheAlaAspIleValSerGlnCysAlaThrAla
485490495
PheMetLeuGlyGluGlyAlaCysHisThrAspValAspAspThrLeu
500505510
AspSerArgLeuGlyAspValSerArgSerValSerGluValLeuAla
515520525
AlaIleArgAspThrMetIleGluAlaGlyGlnAspAspThrSerTyr
530535540
LysLeuValLeuGlnSerTyrProAlaProLeuProAlaSerAspGlu
545550555560
MetArgTyrThrGlyAspHisTyrAspArgTyrThrGluGlyGlyCys
565570575
ProPheTyrAspValAspLeuAspTrpThrArgAspValLeuIleLys
580585590
LysIleGluAlaThrLeuArgGlyValAlaLysSerAlaAspAlaAla
595600605
PheLeuAsnLeuThrAspThrPheThrGlyHisGluLeuCysSerLys
610615620
HisThrArgGlnAlaGluSerGlyGluSerLeuAlaAsnProIleLeu
625630635640
GluHisGluAlaGluTrpValArgPheValProGlyLeuThrThrPro
645650655
GlyAspThrAlaGluAlaIleHisProAsnAlaPheGlyGlnHisAla
660665670
LeuSerSerCysLeuSerGlnAlaValArgThrMetAspAspSerAsp
675680685
GlnArgTyrPheGluCysAspGlyArgAspThrGlyAsnProArgLeu
690695700
ValTrpProArgSerSerProIleAspAlaValValGluThrAlaAsp
705710715720
GlyTrpGlnGlyAspAspPheArgLeuAlaAspHisTyrMetPheGln
725730735
ArgGlyValTyrAlaArgPheAsnProAspAlaAspArgSerGlyAla
740745750
IleAspProGlyArgIleThrPheGlyGlnThrAspGlyTrpLeuGly
755760765
GluValLysAspThrSerAsnTrpProSerLeuSerGlyThrAspPhe
770775780
ValAspGlyIleAspAlaAlaAlaGluAlaArgThrSerThrGlyHis
785790795800
GlnLeuLeuLeuPheHisSerGlyValGluAspAsnGlnTyrValArg
805810815
ValGluMetAlaProGlyThrThrAspAspGlnLeuValArgGlyPro
820825830
ValProIleThrArgTyrTrpProLeuPheGlnAspThrProPheGlu
835840845
TrpGlyValAspAlaAlaAlaGlyAspGlnLeuAsnArgAlaMetVal
850855860
PheArgHisGlyTyrValGlyLeuValGlnValSerLeuAspAlaLeu
865870875880
SerAspGluTrpLeuValGluProThrLeuIleGlySerAlaIlePro
885890895
AlaLeuGluGlyThrProPheGluThrGlyValAspAlaAlaIleVal
900905910
ArgHisGlnGlnProThrAlaMetTrpValAspLeuIleSerGlyThr
915920925
GlnValValThrLeuLeuValAspLeuAspAspLeuSerLysSerThr
930935940
TyrMetThrSerIleValGluIleThrThrMetTrpProSerLeuArg
945950955960
GlySerIlePheAspTrpThrGlyGlyGluAlaTrpLysProGluLys
965970975
MetGlnIleLysThrGlyAlaGlyAspProTyrAspMetAspAlaAsp
980985990
AspArgGlnAlaLysProAlaValSerGlySerHisGluGlnCysArg
99510001005
ProGluGlyLeuAlaGlnThrProGlyValAsnThrProTyrCysGlu
101010151020
ValTyrAspThrAspGlyArgGluTrpLeuGlyGlyAsnGlyHisAsp
1025103010351040
ArgArgValIleGlyTyrPheThrGlyTrpArgThrGlyGluAsnAsp
104510501055
GlnProArgTyrLeuValProAsnIleProTrpSerLysValThrHis
106010651070
IleAsnTyrAlaPheAlaLysValAspAspAspAsnLysIleGlnArg
107510801085
<210>73
<211>753
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>73
atgggaaacggtgcagcagttggttccaatgataatggtagagaagaaagtgtttacgta60
ctttctgtgatcgcctgtaatgtttattatttacagaagtgtgaaggtggggcatcgcgt120
gatagcgtgattagagaaattaatagccaaactcaacctttaggatatgagattgtagca180
gattctattcgtgatggtcatattggttcttttgcctgtaagatggcagtctttagaaat240
aatggtaatggcaattgtgttttagcgatcaaagggacagatatgaataatatcaatgac300
ttggtgaatgatctaaccatgatattaggaggcattggttctgttgctgcaatccaacca360
acgattaacatggcacaagaactcatcgaccaatatggagtgaatttgattactggtcac420
tcccttggaggctacatgactgaaatcatcgctaccaatcgtggactaccaggtattgca480
ttttgcgcaccaggttcaaatggtccaattgtaaaattaggtggacaagagacacctggc540
tttcacaatgttaactttgaacatgatccagcaggtaacgttatgactggggtttatact600
catgtccaatggagtatttatgtaggatgtgatggtatgactcatggtattgaaaatatg660
gtgaattattttaaagataaaagagatttaaccaatcgcaatattcaaggaagaagtgaa720
agtcataatacgggttattattacccaaaataa753
<210>74
<211>250
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>74
MetGlyAsnGlyAlaAlaValGlySerAsnAspAsnGlyArgGluGlu
l51015
SerValTyrValLeuSerValIleAlaCysAsnValTyrTyrLeuGln
202530
LysCysGluGlyGlyAlaSerArgAspSerValIleArgGluIleAsn
354045
SerGlnThrGlnProLeuGlyTyrGluIleValAlaAspSerIleArg
505560
AspGlyHisIleGlySerPheAlaCysLysMetAlaValPheArgAsn
65707580
AsnGlyAsnGlyAsnCysValLeuAlaIleLysGlyThrAspMetAsn
859095
AsnIleAsnAspLeuValAsnAspLeuThrMetIleLeuGlyGlyIle
100105110
GlySerValAlaAlaIleGlnProThrIleAsnMetAlaGlnGluLeu
115120125
IleAspGlnTyrGlyValAsnLeuIleThrGlyHisSerLeuGlyGly
130135140
TyrMetThrGluIleIleAlaThrAsnArgGlyLeuProGlyIleAla
145150155160
PheCysAlaProGlySerAsnGlyProIleValLysLeuGlyGlyGln
165170175
GluThrProGlyPheHisAsnValAsnPheGluHisAspProAlaGly
180185190
AsnValMetThrGlyValTyrThrHisValGlnTrpSerIleTyrVal
195200205
GlyCysAspGlyMetThrHisGlyIleGluAsnMetValAsnTyrPhe
210215220
LysAspLysArgAspLeuThrAsnArgAsnIleGlnGlyArgSerGlu
225230235240
SerHisAsnThrGlyTyrTyrTyrProLys
245250
<210>75
<211>1335
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>75
atgactactaaaatctttttaattcacggatggtctgtcaagacaacacaaacatatcag60
gcgctgcaccttaagttggcagagcagggatatcagctggaagatatttacctcgggcgg120
tatctgtcccttgaaaatcatatcgaaatacgggatattgcaaaagcaatgcaccgtgca180
ttgctggagaggattaccgactggagtcagcctttccattttattactcacagtacggga240
ggtatggtcgccaaatattggatattgaatcattataaaggaagtattgcaaaacaaaaa300
ccactcaaaaatgtagtgtttctggctgcacctaattttggttcaaggctggcacaccat360
ggacgtaccatgctgggagaaataatggaactgggagaaacagggaagaagattcttgaa420
tctctggagttaggaagtgctttttcgtgggatgtgaatgagcagttttttaatgcgtcc480
aattggaaagataaagaaataaagttctataacctgataggagacagggtcaaaacggat540
ttttttaaatccaaaatttttccagctgcgtttgaaagcgggtcagatatggtgattcgg600
gttgcggcaggaaatcagaactttgtccggtacaggtacgatagtcagaaagatagcttt660
actgttgtcaatgagttgaaaggaattgcttttggtgctctctaccaatatacacattcc720
aatgatgattatggaatcctgaacagcatcaaaaaaagttcaacccttgaaaaccatcag780
gcactcagactaattgtagaatgtctgaaggtttcgggagataaagaatatgaaaatgtt840
gttgcacagttggctgcagcgacaaaagaaaccagagaaaaacgccagggatatgcacag900
ctggatttccgttttcgggatgatgaaggctttccaatagatgattatgttgtagagctg960
ggagtaatggtaaatggaaaacctaaaccatctaaaacagtagatgacgtgcataagaat1020
aaaattacaccaaaccatcttactgtattcattaacctgaaagaactggaacctaatctg1080
aagtactttatcaatattaaatcgatatcggaatcctccatgtatagttacgatcctgct1140
gtcaggactatagagcttgcttctaacgagattacaaaaattatccgtgaggaccataca1200
acacagattgatgtgatactttcccggactcctgctaaaaaccttttcatgtttcatcgc1260
ggagatgatgaagacctacatgtgacatggtcgcggtacggagaaacaaaaagtacaaag1320
cagggaataaaataa1335
<210>76
<211>444
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>76
MetThrThrLysIlePheLeuIleHisGlyTrpSerValLysThrThr
l51015
GlnThrTyrGlnAlaLeuHisLeuLysLeuAlaGluGlnGlyTyrGln
202530
LeuGluAspIleTyrLeuGlyArgTyrLeuSerLeuGluAsnHisIle
354045
GluIleArgAspIleAlaLysAlaMetHisArgAlaLeuLeuGluArg
505560
IleThrAspTrpSerGlnProPheHisPheIleThrHisSerThrGly
65707580
GlyMetValAlaLysTyrTrpIleLeuAsnHisTyrLysGlySerIle
859095
AlaLysGlnLysProLeuLysAsnValValPheLeuAlaAlaProAsn
100105110
PheGlySerArgLeuAlaHisHisGlyArgThrMetLeuGlyGluIle
115120125
MetGluLeuGlyGluThrGlyLysLysIleLeuGluSerLeuGluLeu
130135140
GlySerAlaPheSerTrpAspValAsnGluGlnPhePheAsnAlaSer
145150155160
AsnTrpLysAspLysGluIleLysPheTyrAsnLeuIleGlyAspArg
165170175
ValLysThrAspPhePheLysSerLysIlePheProAlaAlaPheGlu
180185190
SerGlySerAspMetValIleArgValAlaAlaGlyAsnGlnAsnPhe
195200205
ValArgTyrArgTyrAspSerGlnLysAspSerPheThrValValAsn
210215220
GluLeuLysGlyIleAlaPheGlyAlaLeuTyrGlnTyrThrHisSer
225230235240
AsnAspAspTyrGlyIleLeuAsnSerIleLysLysSerSerThrLeu
245250255
GluAsnHisGlnAlaLeuArgLeuIleValGluCysLeuLysValSer
260265270
GlyAspLysGluTyrGluAsnValValAlaGlnLeuAlaAlaAlaThr
275280285
LysGluThrArgGluLysArgGlnGlyTyrAlaGlnLeuAspPheArg
290295300
PheArgAspAspGluGlyPheProIleAspAspTyrValValGluLeu
305310315320
GlyValMetValAsnGlyLysProLysProSerLysThrValAspAsp
325330335
ValHisLysAsnLysIleThrProAsnHisLeuThrValPheIleAsn
340345350
LeuLysGluLeuGluProAsnLeuLysTyrPheIleAsnIleLysSer
355360365
IleSerGluSerSerMetTyrSerTyrAspProAlaValArgThrIle
370375380
GluLeuAlaSerAsnGluIleThrLysIleIleArgGluAspHisThr
385390395400
ThrGlnIleAspValIleLeuSerArgThrProAlaLysAsnLeuPhe
405410415
MetPheHisArgGlyAspAspGluAspLeuHisValThrTrpSerArg
420425430
TyrGlyGluThrLysSerThrLysGlnGlyIleLys
435440
<210>77
<211>1026
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>77
atggcttatcactttaaaaacttggtcttcgaaggcggtggcgtgaaaggcatcgcctac60
gtgggtgctcttgaagtacttgagagagaaggcattctgaaagacatcaaacgcgtggct120
ggtacttcggctggagcgctggttgccgtcttaatcagtttgggctataccgcccaagaa180
ttgaaggacatcctatggaaaatcaatttccaaaactttttggacagctcgtggggcttg240
gtgcgcaacacggcacgtttcattgaggattacggttggtacaaaggtgagtttttccgc300
gaattggttgccggctacatcaaggaaaaaacgggcaatagtgaaagcactttcaaggat360
ctggccaaatcaaaagatttccgtggcctcagccttattggtagcgatctgtccacagga420
tactcaaaggtgttcagcaacgaattcaccccaaacgtcaaagtagctgatgcagcccgc480
atctccatgtcgatacccctgtttttcaaagccgttcgcggtgtaaacggtgatggacac540
atttacgtcgatggtggactgttagacaactatgccatcaaggtgttcgaccgcgtcaat600
tacgtaaagaataagaacaacgtacggtacaccgagtattatgaaaagaccaacaagtcg660
ctgaaaagcaaaaacaagctgaccaacgaatacgtctacaataaagaaactttgggcttc720
cgattggatgccaaagaacagattgagatgtttctcgaccatagtatagaaccaaaggca780
aaggacattgactcactattctcttacacgaaggctttggtcaccaccctcatcgacttt840
caaaacaatgtacatttgcatagtgacgactggcaacgcacagtctatatcgactcttta900
ggtatcagttccactgacttcggcatctctgactctaaaaaacagaaactcgtcgattca960
ggcattttgcatacgcaaaaatacctggattggtataacaacgacgaagagaaagccaac1020
aaatag1026
<210>78
<211>341
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>78
MetAlaTyrHisPheLysAsnLeuValPheGluGlyGlyGlyValLys
151015
GlyIleAlaTyrValGlyAlaLeuGluValLeuGluArgGluGlyIle
202530
LeuLysAspIleLysArgValAlaGlyThrSerAlaGlyAlaLeuVal
354045
AlaValLeuIleSerLeuGlyTyrThrAlaGlnGluLeuLysAspIle
505560
LeuTrpLysIleAsnPheGlnAsnPheLeuAspSerSerTrpGlyLeu
65707580
ValArgAsnThrAlaArgPheIleGluAspTyrGlyTrpTyrLysGly
859095
GluPhePheArgGluLeuValAlaGlyTyrIleLysGluLysThrGly
100105110
AsnSerGluSerThrPheLysAspLeuAlaLysSerLysAspPheArg
115120125
GlyLeuSerLeuIleGlySerAspLeuSerThrGlyTyrSerLysVal
130135140
PheSerAsnGluPheThrProAsnValLysValAlaAspAlaAlaArg
145150155160
IleSerMetSerIleProLeuPhePheLysAlaValArgGlyValAsn
165170175
GlyAspGlyHisIleTyrValAspGlyGlyLeuLeuAspAsnTyrAla
180185190
IleLysValPheAspArgValAsnTyrValLysAsnLysAsnAsnVal
195200205
ArgTyrThrGluTyrTyrGluLysThrAsnLysSerLeuLysSerLys
210215220
AsnLysLeuThrAsnGluTyrValTyrAsnLysGluThrLeuGlyPhe
225230235240
ArgLeuAspAlaLysGluGlnIleGluMetPheLeuAspHisSerIle
245250255
GluProLysAlaLysAspIleAspSerLeuPheSerTyrThrLysAla
260265270
LeuValThrThrLeuIleAspPheGlnAsnAsnValHisLeuHisSer
275280285
AspAspTrpGlnArgThrValTyrIleAspSerLeuGlyIleSerSer
290295300
ThrAspPheGlyIleSerAspSerLysLysGlnLysLeuValAspSer
305310315320
GlyIleLeuHisThrGlnLysTyrLeuAspTrpTyrAsnAsnAspGlu
325330335
GluLysAlaAsnLys
340
<210>79
<211>1701
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>79
atgagaaatttcagcaagggattgaccagtattttgcttagcatagcgacatccaccagt60
gcgatggcctttacccagatcggggccggcggagcgattccgatgggccatgagtggcta120
acccgccgctcggcgctggaactgctgaatgccgacaatctggtcggcaatgacccggcc180
gacccacgcttgggctggagcgaaggtctcgccaacaatctcgatctctcgaatgcccag240
aacgaagtgcagcgcatcaagagcattaccaagagccacgccctgtatgagccgcgttac300
gatgacgttttcgccgccatcgtcggcgagcgctgggttgataccgccggtttcaacgtg360
gccaaggccaccgtcggcaagatcgattgcttcagcgccgtcgcgcaagagcccgccgat420
gtgcaacaagaccatttcatgcgccgttatgacgacgtgggtggacaagggggcgtgaac480
gctgcccgccgcgcgcagcagcgctttatcaatcacttcgtcaacgcagccatggccgaa540
gagaagagcatcaaggcatgggatggcggcggttattcttcgctggaaaaagtcagccac600
aactacttcttgtttggccgcgccgttcatttgttccaggattctttcagccccgaacac660
accgtgcgcctgcctgaagacaattacgtcaaagtccgtcaggtcaaggcgtatctctgc720
tctgaaggtgccgaacagcatacgcacaacacgcaagatgccatcaacttcaccagcggc780
gatgtcatctggaaacagaacacccgtctggatgcaggctggagcacctacaaggccagc840
aacatgaagccggtggcattggttgccctcgaagccagcaaagatttgtgggccgccttt900
attcgcaccatggccgtttcccgcgaggagcgtcgcgccgtcgccgaacaggaagcgcag960
gctctcgtcaatcactggttgtcgttcgacgaacaggaaatgctgaactggtacgaagaa1020
gaagagcaccgcgatcatacgtacgtcaaggaacccggccagagcggcccaggttcgtcg1080
ttattcgattgcatggttggtctgggtgtggcctcgggcagtcaggcgcaacgggtggcg1140
gaactcgatcagcaacgccgccaatgtttgttcaacgtcaaggccgctactggctatggc1200
gatctgaatgatccacacatggatattccgtacaactggcaatgggtgtcgtcgacgcaa1260
tggaaaatccctgcggccgactggaaaatcccgcagctgcccgccgattcagggaaatca1320
gtcgtcatcaagaattcgatcaatggcgatccgctggtggcacctgccgggctcaagcac1380
aacaccgatgtttacggtgcaccgggtgaggcgattgaattcattttcgtcggtgatttc1440
aaccatgaggcgtatttccgcaccaaggacaacgcggatctgttcctgagttacagcgcg1500
gtatcgggcaagggcttgctgtacaacacgcccaaccaggccggttatcgtgttcagcct1560
tatggtgtgctgtggacgattgagaatacctactggaatgatttcctctggtacaacagc1620
tcgaacgaccgcatctatgtcagcggcaccggcgctgccaacaagtcacactcccagtgg1680
attattgacggcttgcagtga1701
<210>80
<211>566
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(23)
<400>80
MetArgAsnPheSerLysGlyLeuThrSerIleLeuLeuSerIleAla
151015
ThrSerThrSerAlaMetAlaPheThrGlnIleGlyAlaGlyGlyAla
202530
IleProMetGlyHisGluTrpLeuThrArgArgSerAlaLeuGluLeu
354045
LeuAsnAlaAspAsnLeuValGlyAsnAspProAlaAspProArgLeu
505560
GlyTrpSerGluGlyLeuAlaAsnAsnLeuAspLeuSerAsnAlaGln
65707580
AsnGluValGlnArgIleLysSerIleThrLysSerHisAlaLeuTyr
859095
GluProArgTyrAspAspValPheAlaAlaIleValGlyGluArgTrp
100105110
ValAspThrAlaGlyPheAsnValAlaLysAlaThrValGlyLysIle
115120125
AspCysPheSerAlaValAlaGlnGluProAlaAspValGlnGlnAsp
130135140
HisPheMetArgArgTyrAspAspValGlyGlyGlnGlyGlyValAsn
145150155160
AlaAlaArgArgAlaGlnGlnArgPheIleAsnHisPheValAsnAla
165170175
AlaMetAlaGluGluLysSerIleLysAlaTrpAspGlyGlyGlyTyr
180185190
SerSerLeuGluLysValSerHisAsnTyrPheLeuPheGlyArgAla
195200205
ValHisLeuPheGlnAspSerPheSerProGluHisThrValArgLeu
210215220
ProGluAspAsnTyrValLysValArgGlnValLysAlaTyrLeuCys
225230235240
SerGluGlyAlaGluGlnHisThrHisAsnThrGlnAspAlaIleAsn
245250255
PheThrSerGlyAspValIleTrpLysGlnAsnThrArgLeuAspAla
260265270
GlyTrpSerThrTyrLysAlaSerAsnMetLysProValAlaLeuVal
275280285
AlaLeuGluAlaSerLysAspLeuTrpAlaAlaPheIleArgThrMet
290295300
AlaValSerArgGluGluArgArgAlaValAlaGluGlnGluAlaGln
305310315320
AlaLeuValAsnHisTrpLeuSerPheAspGluGlnGluMetLeuAsn
325330335
TrpTyrGluGluGluGluHisArgAspHisThrTyrValLysGluPro
340345350
GlyGlnSerGlyProGlySerSerLeuPheAspCysMetValGlyLeu
355360365
GlyValAlaSerGlySerGlnAlaGlnArgValAlaGluLeuAspGln
370375380
GlnArgArgGlnCysLeuPheAsnValLysAlaAlaThrGlyTyrGly
385390395400
AspLeuAsnAspProHisMetAspIleProTyrAsnTrpGlnTrpVal
405410415
SerSerThrGlnTrpLysIleProAlaAlaAspTrpLysIleProGln
420425430
LeuProAlaAspSerGlyLysSerValValIleLysAsnSerIleAsn
435440445
GlyAspProLeuValAlaProAlaGlyLeuLysHisAsnThrAspVal
450455460
TyrGlyAlaProGlyGluAlaIleGluPheIlePheValGlyAspPhe
465470475480
AsnHisGluAlaTyrPheArgThrLysAspAsnAlaAspLeuPheLeu
485490495
SerTyrSerAlaValSerGlyLysGlyLeuLeuTyrAsnThrProAsn
500505510
GlnAlaGlyTyrArgValGlnProTyrGlyValLeuTrpThrIleGlu
515520525
AsnThrTyrTrpAsnAspPheLeuTrpTyrAsnSerSerAsnAspArg
530535540
IleTyrValSerGlyThrGlyAlaAlaAsnLysSerHisSerGlnTrp
545550555560
IleIleAspGlyLeuGln
565
<210>81
<211>1422
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>81
atgaaaaagaaattatgtacaatggctcttgtaacagcaatatcttctggtgttgttacg60
attccaacagaagcacaagcttgtggaataggcgaagtaatgaaacaggagaaccaagag120
cacaaacgtgtgaaaagatggtctgcggagcatccgcatcattcaaatgaaagtacacat180
ttatggattgcacgaaatgcgattcaaattatgagtcgtaatcaagataagacggttcaa240
gaaaatgaattacaatttttaaatactcctgaatataaggagttatttgaaagaggtctt300
tatgatgctgattaccttgatgaatttaacgatggaggtacaggtacaatcggcattgat360
gggctaattagaggagggtggaaatctcatttttacgatcccgatacaagaaagaactat420
aaaggggaagaagaaccaacagctctttcacaaggagataaatattttaaattagcaggt480
gaatactttaagaagggcgaccaaaaacaagctttttattatttaggtgttgcaacgcat540
tactttacagatgctactcaaccaatgcatgctgctaattttacagccgtcgacacgagt600
gctttaaagtttcatagcgcttttgaaaattatgtgacgacaattcagacacagtatgaa660
gtatctgatggtgagggcgtatataatttagtgaattctaatgatccaaaacagtggatc720
catgaaacagcgagactcgcaaaagtggaaatcgggaacattaccaatgacgagattaaa780
tctcactataataaaggaaacaatgctctttggcaacaagaagttatgccagctgtccag840
aggagtttagagaacgcacaaagaaacacggcgggatttattcatttatggtttaaaaca900
tttgttggcaatactgccgctgaagaaattgaaaatactgtagtgaaagattctaaagga960
gaagcaatacaagataataaaaaatacttcgtagtgccaagtgagtttctaaatagaggt1020
ttgacctttgaagtatatgcaaggaatgactatgcactattatctaattacgtagatgat1080
agtaaagttcatggtacgccagttcagtttgtatttgataaagataataacggtatcctt1140
catcgaggagaaagtgtactgctgaaaatgacgcaatctaactatgataattacgtattt1200
ctaaactactctaacttgacaaactgggtacatcttgcgcaacaaaaaacaaatactgca1260
cagtttaaagtgtatccaaatccgaataacccatctgaatattacctatatacagatgga1320
tacccagtaaattatcaagaaaatggtaacggaaagagctggattgtgttaggaaagaaa1380
acagatacaccaaaagcttggaaatttatacaggctgaatag1422
<210>82
<211>473
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(25)
<400>82
MetLysLysLysLeuCysThrMetAlaLeuValThrAlaIleSerSer
151015
GlyValValThrIleProThrGluAlaGlnAlaCysGlyIleGlyGlu
202530
ValMetLysGlnGluAsnGlnGluHisLysArgValLysArgTrpSer
354045
AlaGluHisProHisHisSerAsnGluSerThrHisLeuTrpIleAla
505560
ArgAsnAlaIleGlnIleMetSerArgAsnGlnAspLysThrValGln
65707580
GluAsnGluLeuGlnPheLeuAsnThrProGluTyrLysGluLeuPhe
859095
GluArgGlyLeuTyrAspAlaAspTyrLeuAspGluPheAsnAspGly
100105110
GlyThrGlyThrIleGlyIleAspGlyLeuIleArgGlyGlyTrpLys
115120125
SerHisPheTyrAspProAspThrArgLysAsnTyrLysGlyGluGlu
130135140
GluProThrAlaLeuSerGlnGlyAspLysTyrPheLysLeuAlaGly
145150155160
GluTyrPheLysLysGlyAspGlnLysGlnAlaPheTyrTyrLeuGly
165170175
ValAlaThrHisTyrPheThrAspAlaThrGlnProMetHisAlaAla
180185190
AsnPheThrAlaValAspThrSerAlaLeuLysPheHisSerAlaPhe
195200205
GluAsnTyrValThrThrIleGlnThrGlnTyrGluValSerAspGly
210215220
GluGlyValTyrAsnLeuValAsnSerAsnAspProLysGlnTrpIle
225230235240
HisGluThrAlaArgLeuAlaLysValGluIleGlyAsnIleThrAsn
245250255
AspGluIleLysSerHisTyrAsnLysGlyAsnAsnAlaLeuTrpGln
260265270
GlnGluValMetProAlaValGlnArgSerLeuGluAsnAlaGlnArg
275280285
AsnThrAlaGlyPheIleHisLeuTrpPheLysThrPheValGlyAsn
290295300
ThrAlaAlaGluGluIleGluAsnThrValValLysAspSerLysGly
305310315320
GluAlaIleGlnAspAsnLysLysTyrPheValValProSerGluPhe
325330335
LeuAsnArgGlyLeuThrPheGluValTyrAlaArgAsnAspTyrAla
340345350
LeuLeuSerAsnTyrValAspAspSerLysValHisGlyThrProVal
355360365
GlnPheValPheAspLysAspAsnAsnGlyIleLeuHisArgGlyGlu
370375380
SerValLeuLeuLysMetThrGlnSerAsnTyrAspAsnTyrValPhe
385390395400
LeuAsnTyrSerAsnLeuThrAsnTrpValHisLeuAlaGlnGlnLys
405410415
ThrAsnThrAlaGlnPheLysValTyrProAsnProAsnAsnProSer
420425430
GluTyrTyrLeuTyrThrAspGlyTyrProValAsnTyrGlnGluAsn
435440445
GlyAsnGlyLysSerTrpIleValLeuGlyLysLysThrAspThrPro
450455460
LysAlaTrpLysPheIleGlnAlaGlu
465470
<210>83
<211>1290
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>83
atgaaaaagatagtgatttattcatttgtagcaggggttatgacatcaggcggcgtattt60
gccgccagtgacaatattgtggagacgtcgaccccaccacagcatcaggccccaagcaga120
caggacagggcattattcgcgggtgatacaacaacctatataaaatgtgtctacaaagtg180
gatggccaggatgacagcaatccatcctcatcttggttatgggcgaaagtgggtagcaac240
tatgcgaagctgaaggggtattggtataattcaatgccgctggcaaacatgttttacact300
gaagtaccctatgcagaggtgatggacttgtgtaatagcaccctgaaggcggtaggtgcc360
aactccactcttgttattccatatgcatcggattacaccctgtcctattactatgtgatt420
tggaatcaaggggctaaccagccggttatcaacgttggcggcagagagcttgaccgtatg480
gtggtctttggtgacagcttgagcgataccgtcaatgtctataacggctcgtacggtacc540
gtgccgaatagtacctcctggttattgggccatttctctaacggaaagctttggcatgaa600
tacctttccacggtattgaatctgcctagctatgtgtgggcgactggcaatgcggagagt660
ggagagaaacccttctttaacggattcagtaagcaggtggattctttcagggattatcac720
gctcgcactaaaggctacgatattagcaagacgttgtttaccgttctgtttggtggaaat780
gattttataacggggggaaaaagcgccgatgaggtcattgagcaatatacggtgtcattg840
aactacttggctcaactaggggcgaagcaggttgcaattttccgcttgccagatttttca900
gtgatacccagcgtttcaacgtggacagaggctgataaggacaaactgagagagaatagt960
gttcagtttaatgaccaagccgagaagctgatcgctaaactaaacgcggcacatccccaa1020
acgacgttttatacgctgaggttggatgacgcttttaagcaggtgttggaaaacagcgac1080
caatacggctttgttaataagactgatacctgcctggatatttcccaaggcggatacaac1140
tatgccattggggcccgcgcgaaaacggcatgtaagagcagcaatgcggcgtttgtattc1200
tgggacaatatgcatccgaccaccaaaacacacggattgttggccgatcttttaaaagat1260
gatgtggtacgcggcctcgctgcgccatga1290
<210>84
<211>429
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(22)
<400>84
MetLysLysIleValIleTyrSerPheValAlaGlyValMetThrSer
151015
GlyGlyValPheAlaAlaSerAspAsnIleValGluThrSerThrPro
202530
ProGlnHisGlnAlaProSerArgGlnAspArgAlaLeuPheAlaGly
354045
AspThrThrThrTyrIleLysCysValTyrLysValAspGlyGlnAsp
505560
AspSerAsnProSerSerSerTrpLeuTrpAlaLysValGlySerAsn
65707580
TyrAlaLysLeuLysGlyTyrTrpTyrAsnSerMetProLeuAlaAsn
859095
MetPheTyrThrGluValProTyrAlaGluValMetAspLeuCysAsn
100105110
SerThrLeuLysAlaValGlyAlaAsnSerThrLeuValIleProTyr
115120125
AlaSerAspTyrThrLeuSerTyrTyrTyrValIleTrpAsnGlnGly
130135140
AlaAsnGlnProValIleAsnValGlyGlyArgGluLeuAspArgMet
145150155160
ValValPheGlyAspSerLeuSerAspThrValAsnValTyrAsnGly
165170175
SerTyrGlyThrValProAsnSerThrSerTrpLeuLeuGlyHisPhe
180185190
SerAsnGlyLysLeuTrpHisGluTyrLeuSerThrValLeuAsnLeu
195200205
ProSerTyrValTrpAlaThrGlyAsnAlaGluSerGlyGluLysPro
210215220
PhePheAsnGlyPheSerLysGlnValAspSerPheArgAspTyrHis
225230235240
AlaArgThrLysGlyTyrAspIleSerLysThrLeuPheThrValLeu
245250255
PheGlyGlyAsnAspPheIleThrGlyGlyLysSerAlaAspGluVal
260265270
IleGluGlnTyrThrValSerLeuAsnTyrLeuAlaGlnLeuGlyAla
275280285
LysGlnValAlaIlePheArgLeuProAspPheSerValIleProSer
290295300
ValSerThrTrpThrGluAlaAspLysAspLysLeuArgGluAsnSer
305310315320
ValGlnPheAsnAspGlnAlaGluLysLeuIleAlaLysLeuAsnAla
325330335
AlaHisProGlnThrThrPheTyrThrLeuArgLeuAspAspAlaPhe
340345350
LysGlnValLeuGluAsnSerAspGlnTyrGlyPheValAsnLysThr
355360365
AspThrCysLeuAspIleSerGlnGlyGlyTyrAsnTyrAlaIleGly
370375380
AlaArgAlaLysThrAlaCysLysSerSerAsnAlaAlaPheValPhe
385390395400
TrpAspAsnMetHisProThrThrLysThrHisGlyLeuLeuAlaAsp
405410415
LeuLeuLysAspAspValValArgGlyLeuAlaAlaPro
420425
<210>85
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>85
atgacaacacaatttagaaacttgatatttgaaggcggcggtgtaaaaggtgttgcttac60
attggcgccatgcagattcttgaaaatcgtggcgtgttgcaagatattcgccgagtcgga120
gggtgcagtgcgggtgcgattaacgcgctgatttttgcgctaggttacacggtccgtgaa180
caaaaagagatcttacaagccaccgattttaaccagtttatggataactcttggggggtt240
attcgtgatattcgcaggcttgctcgagactttggctggaataagggtgatttctttagt300
agctggataggtgatttgattcatcgtcgtttggggaatcgccgagcgacgttcaaagat360
ctgcaaaaggccaagcttcctgatctttatgtcatcggtactaatctgtctacagggttt420
gcagaggtgttttctgccgaaagacaccccgatatggagctggcgacagcggtgcgtatc480
tccatgtcgataccgctgttctttgcggccgtgcgtcacggtgatcgacaagatgtgtat540
gtcgatgggggtgttcaacttaactatccgattaaactgtttgatcgggagcgttacatt600
gatttggccaaagatcccggtgccgttcggcgaacgggttattacaacaaagaaaacgct660
cgctttcagcttgatcggccgggccatagcccctatgtttacaatcgccagaccttgggt720
ttgcgactggatagtcgcgaggagatagggctctttcgttatgacgaacccctcaagggc780
aaacccattaagtccttcactgactacgctcgacaacttttcggtgcgttgatgaatgca840
caggaaaagattcatctacatggcgatgattggcaacgcacgatctatatcgatacattg900
gatgtgggtacgacggacttcaatctttctgatgcaactaagcaagcactgattgagcaa960
ggaattaacggcaccgaaaattatttcgagtggtttgataatccgttagagaagcctgtg1020
aatagagtggagtcatag1038
<210>86
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>86
MetThrThrGlnPheArgAsnLeuIlePheGluGlyGlyGlyValLys
151015
GlyValAlaTyrIleGlyAlaMetGlnIleLeuGluAsnArgGlyVal
202530
LeuGlnAspIleArgArgValGlyGlyCysSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheAlaLeuGlyTyrThrValArgGluGlnLysGluIle
505560
LeuGlnAlaThrAspPheAsnGlnPheMetAspAsnSerTrpGlyVal
65707580
IleArgAspIleArgArgLeuAlaArgAspPheGlyTrpAsnLysGly
859095
AspPhePheSerSerTrpIleGlyAspLeuIleHisArgArgLeuGly
100105110
AsnArgArgAlaThrPheLysAspLeuGlnLysAlaLysLeuProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetGluLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaValArgHisGlyAspArg
165170175
GlnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProIleLys
180185190
LeuPheAspArgGluArgTyrIleAspLeuAlaLysAspProGlyAla
195200205
ValArgArgThrGlyTyrTyrAsnLysGluAsnAlaArgPheGlnLeu
210215220
AspArgProGlyHisSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerArgGluGluIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysProIleLysSerPheThrAspTyrAlaArgGln
260265270
LeuPheGlyAlaLeuMetAsnAlaGlnGluLysIleHisLeuHisGly
275280285
AspAspTrpGlnArgThrIleTyrIleAspThrLeuAspValGlyThr
290295300
ThrAspPheAsnLeuSerAspAlaThrLysGlnAlaLeuIleGluGln
305310315320
GlyIleAsnGlyThrGluAsnTyrPheGluTrpPheAspAsnProLeu
325330335
GluLysProValAsnArgValGluSer
340345
<210>87
<211>870
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>87
atgtcaaagaaactcgtaatatcggtagcgggcggcggagcactcggaatcggaccactc60
gcattcctgtgcaagattgaacagatgctgggaaagaagataecccaggttgcgcaggca120
tacgccggcacttcaaccggagcaataattgcggcaggactggccgaaggctactccgcg180
catgaactgttcgacctatacaaatcaaatctcagcaagatattcaccaaatacagctgg240
tacaaacgcctgcagccaacgtgtcctacatatgacaacagtaacctaaagaaattactg300
aaggacaaattcaagggcaaggtcggcgactggaaaactcccgtatacatcccggcaaca360
cacatgaacggccaatccgtagaaaaggtgtgggacttgggtgacaagaatgttgacaag420
tggtttgccattctgacaagtaccgcggcaccaacctatttcgactgcatatacgacgac480
gagaagaactgctacatcgatggtggcatgtggtgcaacgcaccaatcgatgtgcttaat540
gcaggcctgatcaagtccggctggtccaactacaaggtcctggacctggagaccggcatg600
gacacaccgaatacggaaagcggaaacaagacacttctcggatggggggaatacatcata660
agcaactgggtagcccgttccagcaagtccggcgaatacgaggtaaaggccataatcggg720
gaagacaatgtatgtgttgcccgtccatacgtaagcaagaaaccgaagatggatgacgtg780
gacagcaagacgctggatgaagtcgtggatatctgggaaaactacttctacgccaagcag840
aaagacatcgcatcgtggctgaaaatctag870
<210>88
<211>289
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>88
MetSerLysLysLeuValIleSerValAlaGlyGlyGlyAlaLeuGly
151015
IleGlyProLeuAlaPheLeuCysLysIleGluGlnMetLeuGlyLys
202530
LysIleProGlnValAlaGlnAlaTyrAlaGlyThrSerThrGlyAla
354045
IleIleAlaAlaGlyLeuAlaGluGlyTyrSerAlaHisGluLeuPhe
505560
AspLeuTyrLysSerAsnLeuSerLysIlePheThrLysTyrSerTrp
65707580
TyrLysArgLeuGlnProThrCysProThrTyrAspAsnSerAsnLeu
859095
LysLysLeuLeuLysAspLysPheLysGlyLysValGlyAspTrpLys
100105110
ThrProValTyrIleProAlaThrHisMetAsnGlyGlnSerValGlu
115120125
LysValTrpAspLeuGlyAspLysAsnValAspLysTrpPheAlaIle
130135140
LeuThrSerThrAlaAlaProThrTyrPheAspCysIleTyrAspAsp
145150155160
GluLysAsnCysTyrIleAspGlyGlyMetTrpCysAsnAlaProIle
165170175
AspValLeuAsnAlaGlyLeuIleLysSerGlyTrpSerAsnTyrLys
180185190
ValLeuAspLeuGluThrGlyMetAspThrProAsnThrGluSerGly
195200205
AsnLysThrLeuLeuGlyTrpGlyGluTyrIleIleSerAsnTrpVal
210215220
AlaArgSerSerLysSerGlyGluTyrGluValLysAlaIleIleGly
225230235240
GluAspAsnValCysValAlaArgProTyrValSerLysLysProLys
245250255
MetAspAspValAspSerLysThrLeuAspGluValValAspIleTrp
260265270
GluAsnTyrPheTyrAlaLysGlnLysAspIleAlaSerTrpLeuLys
275280285
Ile
<210>89
<211>1422
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>89
atgaaaaagaaattatgtacactggcttttgtaacagcaatatcttctatcgctatcaca60
attccaacagaagcacaagcttgtggaataggcgaagtaatgaaacaggagaaccaagag120
cacaaacgtgtgaagagatggtctgcggaacatccacatcatcctaatgaaagtacgcac180
ttatggattgcgcgaaatgcaattcaaataatggcccgtaatcaagataagacggttcaa240
gaaaatgaattacaatttttaaatactcctgaatataaggagttatttgaaagaggtctt300
tatgatgctgattaccttgatgaatttaacgatggaggtacaggtacaatcggcattgat360
gggctaattaaaggagggtggaaatctcatttttacgatcccgatacgagaaagaactat420
aaaggggaagaagaaccaacagctctctctcaaggagataaatattttaaattagcaggc480
gattactttaagaaagaggattggaaacaagctttctattatttaggtgttgcgacgcac540
tacttcacagatgctactcagccaatgcatgctgctaattttacagccgtcgacacgagt600
gctttaaagtttcatagcgcttttgaaaattatgtgacgacaattcagacacagtatgaa660
gtatctgatggtgagggcgtatataatttagtgaattctaatgatccaaaacagtggatc720
catgaaacagcgagactcgcaaaagtggaaatcgggaacattaccaatgacgagattaaa780
tctcactataataaaggaaacaatgctctttggcaacaagaagttatgccagctgtccag840
aggagtttagagaacgcacaaagaaacacggcgggatttattcatttatggtttaaaaca900
tttgttggcaatactgccgctgaagaaattgaaaatactgtagtgaaagattctaaagga960
gaagcaatacaagataataaaaaatacttcgtagtgccaagtgagtttctaaatagaggt1020
ttgacctttgaagtatatgcaaggaatgactatgcactattatctaattacgtagatgat1080
agtaaagttcatggtacgccagttcagtttgtatttgataaagataataacggtatcctt1140
catcgaggagaaagtatactgctgaaaatgacgcaatctaactatgataattacgtattt1200
ctaaactactctaacttgacaaactgggtacatcttgcgcaacaaaaaacaaatactgca1260
cagtttaaagtgtatccaaatccgaataacccatctgaatattacctatatacagatgga1320
tacccagtaaattatcaagaaaatggtaacggaaagagctggattgtgttaggaaagaaa1380
acagatacaccaaaagcttggaaatttatacaggctgaatag1422
<210>90
<211>473
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(25)
<400>90
MetLysLysLysLeuCysThrLeuAlaPheValThrAlaIleSerSer
151015
IleAlaIleThrIleProThrGluAlaGlnAlaCysGlyIleGlyGlu
202530
ValMetLysGlnGluAsnGlnGluHisLysArgValLysArgTrpSer
354045
AlaGluHisProHisHisProAsnGluSerThrHisLeuTrpIleAla
505560
ArgAsnAlaIleGlnIleMetAlaArgAsnGlnAspLysThrValGln
65707580
GluAsnGluLeuGlnPheLeuAsnThrProGluTyrLysGluLeuPhe
859095
GluArgGlyLeuTyrAspAlaAspTyrLeuAspGluPheAsnAspGly
100105110
GlyThrGlyThrIleGlyIleAspGlyLeuIleLysGlyGlyTrpLys
115120125
SerHisPheTyrAspProAspThrArgLysAsnTyrLysGlyGluGlu
130135140
GluProThrAlaLeuSerGlnGlyAspLysTyrPheLysLeuAlaGly
145150155160
AspTyrPheLysLysGluAspTrpLysGlnAlaPheTyrTyrLeuGly
165170175
ValAlaThrHisTyrPheThrAspAlaThrGlnProMetHisAlaAla
180185190
AsnPheThrAlaValAspThrSerAlaLeuLysPheHisSerAlaPhe
195200205
GluAsnTyrValThrThrIleGlnThrGlnTyrGluValSerAspGly
210215220
GluGlyValTyrAsnLeuValAsnSerAsnAspProLysGlnTrpIle
225230235240
HisGluThrAlaArgLeuAlaLysValGluIleGlyAsnIleThrAsn
245250255
AspGluIleLysSerHisTyrAsnLysGlyAsnAsnAlaLeuTrpGln
260265270
GlnGluValMetProAlaValGlnArgSerLeuGluAsnAlaGlnArg
275280285
AsnThrAlaGlyPheIleHisLeuTrpPheLysThrPheValGlyAsn
290295300
ThrAlaAlaGluGluIleGluAsnThrValValLysAspSerLysGly
305310315320
GluAlaIleGlnAspAsnLysLysTyrPheValValProSerGluPhe
325330335
LeuAsnArgGlyLeuThrPheGluValTyrAlaArgAsnAspTyrAla
340345350
LeuLeuSerAsnTyrValAspAspSerLysValHisGlyThrProVal
355360365
GlnPheValPheAspLysAspAsnAsnGlyIleLeuHisArgGlyGlu
370375380
SerIleLeuLeuLysMetThrGlnSerAsnTyrAspAsnTyrValPhe
385390395400
LeuAsnTyrSerAsnLeuThrAsnTrpValHisLeuAlaGlnGlnLys
405410415
ThrAsnThrAlaGlnPheLysValTyrProAsnProAsnAsnProSer
420425430
GluTyrTyrLeuTyrThrAspGlyTyrProValAsnTyrGlnGluAsn
435440445
GlyAsnGlyLysSerTrpIleValLeuGlyLysLysThrAspThrPro
450455460
LysAlaTrpLysPheIleGlnAlaGlu
465470
<210>91
<211>1035
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>91
atgacaacccaatttagaaacctgatctttgagggcggcggtgtaaagggcattgcttac60
gtcggagcaatgcagattcttgaaaatcgtggtgtattacaagatattcaccgagtcgga120
ggttgtagtgcgggtgcgattaacgcgctgatttttgcgctgggttacacagtccgtgag180
caaaaagagatcttacaaattaccgattttaaccagtttatggataactcgtggggtgtt240
attcgggatattcgcaggcttgcgagagaatttggctggaataagggtaacttctttaat300
acctggataggtgatttgattcatcgtcgtttgggtaatcgccgagccacgttcaaagat360
ctgcaaaaggcaaagcttcctgatctttatgtcatcggtactaatctgtctacagggttt420
gcagaggttttttctgccgaaagacaccccgatatggagctggcgacagcggtgcgtatc480
tccatgtcgataccgctgttctttgcggccgtgcgtcacggtgatcgacaagatgtgtat540
gtcgatgggggtgtgcagcttaactacccgatcaagctgtttgatcgaactcgttatatt600
gacctcgccaaagatccgggtgctgctcgccacacgggttattacaataaagagaatgct660
cgttttcagcttgagcgaccgggccacagtccttatgtgtacaatcgccaaacattaggc720
ttgcgtcttgacagtcgtgaagagatagcgctgtttcgttacgacgaacctcttcagggt780
aaacccattaagtccttcactgactacgctcgacaactttttggtgcgctgaagaatgca840
caggaaaacattcacctacatggcgatgattggcagcgcacggtctatatcgatacattg900
gatgtgggtacgacggatttcaatctttctgatgcaaccaagcaagcactgattgaacag960
ggaattaacggcaccgaaaattatttcgagtggtttgataatccgtttgagaagcctgtg1020
aatagagtggagtaa1035
<210>92
<211>344
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>92
MetThrThrGlnPheArgAsnLeuIlePheGluGlyGlyGlyValLys
151015
GlyIleAlaTyrValGlyAlaMetGlnIleLeuGluAsnArgGlyVal
202530
LeuGlnAspIleHisArgValGlyGlyCysSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheAlaLeuGlyTyrThrValArgGluGlnLysGluIle
505560
LeuGlnIleThrAspPheAsnGlnPheMetAspAsnSerTrpGlyVal
65707580
IleArgAspIleArgArgLeuAlaArgGluPheGlyTrpAsnLysGly
859095
AsnPhePheAsnThrTrpIleGlyAspLeuIleHisArgArgLeuGly
100105110
AsnArgArgAlaThrPheLysAspLeuGlnLysAlaLysLeuProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetGluLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaValArgHisGlyAspArg
165170175
GlnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProIleLys
180185190
LeuPheAspArgThrArgTyrIleAspLeuAlaLysAspProGlyAla
195200205
AlaArgHisThrGlyTyrTyrAsnLysGluAsnAlaArgPheGlnLeu
210215220
GluArgProGlyHisSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerArgGluGluIleAlaLeuPheArgTyrAspGlu
245250255
ProLeuGlnGlyLysProIleLysSerPheThrAspTyrAlaArgGln
260265270
LeuPheGlyAlaLeuLysAsnAlaGlnGluAsnIleHisLeuHisGly
275280285
AspAspTrpGlnArgThrValTyrIleAspThrLeuAspValGlyThr
290295300
ThrAspPheAsnLeuSerAspAlaThrLysGlnAlaLeuIleGluGln
305310315320
GlyIleAsnGlyThrGluAsnTyrPheGluTrpPheAspAsnProPhe
325330335
GluLysProValAsnArgValGlu
340
<210>93
<211>963
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>93
gtgattactttgataaaaaaatgtttattagtattgacgatgactctattatcaggggtt60
ttcgtaccgctgcagccatcatatgctactgaaaattatccaaatgattttaaactgttg120
caacataatgtatttttattgcctgaatcagtttcttattggggtcaggacgaacgtgca180
gattatatgagtaatgcagattactttaagggacatgatgctctgctcttaaatgagctt240
tttgacaatggaaattcgaacgtgctgctaatgaacttatccaaggaatatacatatcaa300
acgccagtgcttggccgttcgatgagtggatgggatgaaactagaggaagctattctaat360
tttgtacccgaagatggtggtgtagcaattatcagtaaatggccaatcgtggagaaaata420
cagcatgtttacgcgaatggttgcggtgcagactattatgcaaataaaggatttgtttat480
gcaaaagtacaaaaaggggataaattctatcatcttatcagcactcatgctcaagccgaa540
gataccgggtgtgatcagggtgaaggagcagaaattcgtcattcacagtttcaagaaatc600
aacgactttattaaaaataaaaacattccgaaagatgaagtggtatttattggtggtgac660
tttaatgtgatgaagagtgacacaacagagtacaatagcatgttatcaacattaaatgtc720
aatgcgcctaccgaatatttagggcataactctacttgggacccagaaacgaacagcatt780
acaggttacaattaccctgattatgcgccacagcatttagattatatttttgtggaaaa840
gatcataaacaaccaagttcatgggtaaatgaaacgattactccgaagtctccaacttgg900
aaggcaatctatgagtataatgattattccgatcactatcctgttaaagcatacgtaaaa960
taa963
<210>94
<211>320
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(29)
<400>94
MetIleThrLeuIleLysLysCysLeuLeuValLeuThrMetThrLeu
151015
LeuSerGlyValPheValProLeuGlnProSerTyrAlaThrGluAsn
202530
TyrProAsnAspPheLysLeuLeuGlnHisAsnValPheLeuLeuPro
354045
GluSerValSerTyrTrpGlyGlnAspGluArgAlaAspTyrMetSer
505560
AsnAlaAspTyrPheLysGlyHisAspAlaLeuLeuLeuAsnGluLeu
65707580
PheAspAsnGlyAsnSerAsnValLeuLeuMetAsnLeuSerLysGlu
859095
TyrThrTyrGlnThrProValLeuGlyArgSerMetSerGlyTrpAsp
100105110
GluThrArgGlySerTyrSerAsnPheValProGluAspGlyGlyVal
115120125
AlaIleIleSerLysTrpProlleValGluLysIleGlnHisValTyr
130135140
AlaAsnGlyCysGlyAlaAspTyrTyrAlaAsnLysGlyPheValTyr
145150155160
AlaLysValGlnLysGlyAspLysPheTyrHisLeuIleSerThrHis
165170175
AlaGlnAlaGluAspThrGlyCysAspGlnGlyGluGlyAlaGluIle
180185190
ArgHisSerGlnPheGlnGluIleAsnAspPheIleLysAsnLysAsn
195200205
IleProLysAspGluValValPheIleGlyGlyAspPheAsnValMet
210215220
LysSerAspThrThrGluTyrAsnSerMetLeuSerThrLeuAsnVal
225230235240
AsnAlaProThrGluTyrLeuGlyHisAsnSerThrTrpAspProGlu
245250255
ThrAsnSerIleThrGlyTyrAsnTyrProAspTyrAlaProGlnHis
260265270
LeuAspTyrIlePheValGluLysAspHisLysGlnProSerSerTrp
275280285
ValAsnGluThrIleThrProLysSerProThrTrpLysAlaIleTyr
290295300
GluTyrAsnAspTyrSerAspHisTyrProValLysAlaTyrValLys
305310315320
<210>95
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>95
atggcttcacaattcaggaatctggtatttgaaggaggtggtgtaaaagggattgcgtac60
ataggtgcgatgcaggtgctggatcagcgcggttatttgggtgataacatcaaacgcgtt120
ggtggaaccagtgcaggtgccataaatgcgctgatttattcgttaggatatgacatccac180
gaacaacaagagatactgaactctacagattttaaaaagtttatggataactcttttgga240
tttgtgagggatttcagaaggctatggaatgaatttggatggaatagaggagactttttt300
cttaaatggtcaggtgagctgatcaaaaataaattgggcacctcaaaagccacctttcag360
gatttgaaggatgccggtcagccagatttgtatgtaattggaacaaatttatcgacgggg420
ttttccgagactttttcatatgaacgtcaccccgatatgactcttgcagaagccgtaaga480
atcagtatgtcgcttccgctgtttttcagggctgtgcggttgggcgacaggaatgatgta540
tatgtggatggtggggttcagctcaattacccggtaaaactatttgatcgtgaaaaatat600
attgatatggataatgaggcggctgcagcacgatttactgattattacaacaaagaaaat660
gccagattttcgctccagcggcctggacgaagcccctatgtatataatcgtcaaaccctt720
ggtttgagactggatacagccgaagaaattgcgcttttcaggtacgatgaacccattcag780
gggaaagagatcaaacggtttccggaatatgcaaaggctctgatcggcgcactaatgcag840
gtgcaggaaaacatacatctccacagtgacgactggcagcgtacgctgtatatcaatacc900
ctggatgtaaaaaccacagattttgaattaaccgatgagaaaaaaaaggaactggtagaa960
cagggaatccttggcgcggaaacctatttcaaatggtttgaagacagggatgaagtagtt1020
gtaaaccgccttgcttag1038
<210>96
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>96
MetAlaSerGlnPheArgAsnLeuValPheGluGlyGlyGlyValLys
151015
GlyIleAlaTyrIleGlyAlaMetGlnValLeuAspGlnArgGlyTyr
202530
LeuGlyAspAsnIleLysArgValGlyGlyThrSerAlaGlyAlaIle
354045
AsnAlaLeuIleTyrSerLeuGlyTyrAspIleHisGluGlnGlnGlu
505560
lleLeuAsnSerThrAspPheLysLysPheMetAspAsnSerPheGly
65707580
PheValArgAspPheArgArgLeuTrpAsnGluPheGlyTrpAsnArg
859095
GlyAspPhePheLeuLysTrpSerGlyGluLeuIleLysAsnLysLeu
100105110
GlyThrSerLysAlaThrPheGlnAspLeuLysAspAlaGlyGlnPro
115120125
AspLeuTyrValIleGlyThrAsnLeuSerThrGlyPheSerGluThr
130135140
PheSerTyrGluArgHisProAspMetThrLeuAlaGluAlaValArg
145150155160
IleSerMetSerLeuProLeuPhePheArgAlaValArgLeuGlyAsp
165170175
ArgAsnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProVal
180185190
LysLeuPheAspArgGluLysTyrIleAspMetAspAsnGluAlaAla
195200205
AlaAlaArgPheThrAspTyrTyrAsnLysGluAsnAlaArgPheSer
210215220
LeuGlnArgProGlyArgSerProTyrValTyrAsnArgGlnThrLeu
225230235240
GlyLeuArgLeuAspThrAlaGluGluIleAlaLeuPheArgTyrAsp
245250255
GluProIleGlnGlyLysGluIleLysArgPheProGluTyrAlaLys
260265270
AlaLeuIleGlyAlaLeuMetGlnValGlnGluAsnIleHisLeuHis
275280285
SerAspAspTrpGlnArgThrLeuTyrIleAsnThrLeuAspValLys
290295300
ThrThrAspPheGluLeuThrAspGluLysLysLysGluLeuValGlu
305310315320
GlnGlyIleLeuGlyAlaGluThrTyrPheLysTrpPheGluAspArg
325330335
AspGluValValValAsnArgLeuAla
340345
<210>97
<211>1422
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>97
atgaaaaggaaactatgtacatgggctctcgtaacagcaatagcttctagtactgcggta60
attccaacagcagcagaagcttgtggattaggagaagtaatcaaacaagagaatcaagag120
cacaaacgtgtgaaaagatggtctgcggagcatccgcatcattcacatgaaagtacccat180
ttatggattgcacaaaatgcgattcaaattatgagccgtaatcaagataagacggttcaa240
gaaaatgaattacaatttttaaatacccctgaatataaggagttatttgaaagaggtctt300
tatgatgctgattaccttgatgaatttaacgatggaggtacaggtataatcggcattgat360
gggctaattcgaggagggtggaaatctcatttctacgatcccgatacaagaaagaactat420
aaaggggaggaagaaccaacagctctttctcaaggagataaatattttaaattagcaggt480
gaatactttaagaagaatgattggaaacaggctttctattatttaggtgttgcgacgcac540
tactttacagatgctactcagccaatgcatgctgctaattttacagctgtcgacaggagt600
gctataaagtttcatagtgcttttgaagattatgtgacgacaattcaggaacagtttaaa660
gtatcagatggagagggaaaatataatttagtaaattctaatgatccgaaacagtggatc720
catgaaacagcgagactcgcaaaagtggaaatcgggaacattaccaatgatgtgattaaa780
tctcactataataaaggaaacaatgctctttggcagcaagaagttatgccagctgttcag840
agaagtttagaacaagcccaaagaaatacggcgggatttattcatttatggtttaaaaca900
tatgttggaaaaacagctgctgaagatattgaaaatactatagtgaaagattctagggga960
gaagcaatacaagagaataaaaaatactttgtagtaccaagtgagtttttaaatagaggc1020
ttaacatttgaagtgtatgctgcttatgactatgcgttattatctaaccatgtggatgat1080
aataatattcatggtacaccggttcaaattgtatttgataaagaaaataatgggatcctt1140
catcaaggagaaagtgcattgttaaagatgacacaatccaactacgataattatgtattt1200
ctaaattattctatcataacaaattgggtacatcttgcaaaaagagaaaacaatactgca1260
cagtttaaagtgtatccaaatccaaataatccaactgaatatttcatatatacagatggc1320
tatccagttaattatcaagaaaaaggtaaagagaaaagctggattgttttaggaaagaaa1380
acggataaaccaaaagcatggaaatttatacaggcggaataa1422
<210>98
<211>473
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(25)
<400>98
MetLysArgLysLeuCysThrTrpAlaLeuValThrAlaIleAlaSer
151015
SerThrAlaValIleProThrAlaAlaGluAlaCysGlyLeuGlyGlu
202530
ValIleLysGlnGluAsnGlnGluHisLysArgValLysArgTrpSer
354045
AlaGluHisProHisHisSerHisGluSerThrHisLeuTrpIleAla
505560
GlnAsnAlaIleGlnIleMetSerArgAsnGlnAspLysThrValGln
65707580
GluAsnGluLeuGlnPheLeuAsnThrProGluTyrLysGluLeuPhe
859095
GluArgGlyLeuTyrAspAlaAspTyrLeuAspGluPheAsnAspGly
100105110
GlyThrGlyIleIleGlyIleAspGlyLeuIleArgGlyGlyTrpLys
115120125
SerHisPheTyrAspProAspThrArgLysAsnTyrLysGlyGluGlu
130135140
GluProThrAlaLeuSerGlnGlyAspLysTyrPheLysLeuAlaGly
145150155160
GluTyrPheLysLysAsnAspTrpLysGlnAlaPheTyrTyrLeuGly
165170175
ValAlaThrHisTyrPheThrAspAlaThrGlnProMetHisAlaAla
180185190
AsnPheThrAlaValAspArgSerAlaIleLysPheHisSerAlaPhe
195200205
GluAspTyrValThrThrIleGlnGluGlnPheLysValSerAspGly
210215220
GluGlyLysTyrAsnLeuValAsnSerAsnAspProLysGlnTrpIle
225230235240
HisGluThrAlaArgLeuAlaLysValGluIleGlyAsnIleThrAsn
245250255
AspValIleLysSerHisTyrAsnLysGlyAsnAsnAlaLeuTrpGln
260265270
GlnGluValMetProAlaValGlnArgSerLeuGluGlnAlaGlnArg
275280285
AsnThrAlaGlyPheIleHisLeuTrpPheLysThrTyrValGlyLys
290295300
ThrAlaAlaGluAspIleGluAsnThrIleValLysAspSerArgGly
305310315320
GluAlaIleGlnGluAsnLysLysTyrPheValValProSerGluPhe
325330335
LeuAsnArgGlyLeuThrPheGluValTyrAlaAlaTyrAspTyrAla
340345350
LeuLeuSerAsnHisValAspAspAsnAsnIleHisGlyThrProVal
355360365
GlnIleValPheAspLysGluAsnAsnGlyIleLeuHisGlnGlyGlu
370375380
SerAlaLeuLeuLysMetThrGlnSerAsnTyrAspAsnTyrValPhe
385390395400
LeuAsnTyrSerIleIleThrAsnTrpValHisLeuAlaLysArgGlu
405410415
AsnAsnThrAlaGlnPheLysValTyrProAsnProAsnAsnProThr
420425430
GluTyrPheIleTyrThrAspGlyTyrProValAsnTyrGlnGluLys
435440445
GlyLysGluLysSerTrpIleValLeuGlyLysLysThrAspLysPro
450455460
LysAlaTrpLysPheIleGlnAlaGlu
465470
<210>99
<211>1053
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>99
atggcaaagcgttttattctttcgatcgatggtggtggcattcgcgggatcatcccggcg60
gccatcctggtggagctggccaagcggttggaggggctgccgcttcacaaggcattcgac120
atgatcgccgggacatccaccggcggcatcattgcggcggggctgacatgcccgcatcct180
gacgatgaggagacggcggcgtgcacgccgaccgatcttctcaagctttatgtcgatcac240
ggcggcaagatcttcgagaaaaacccgatcctcggcctcatcaacccattcggcctcaac300
gatccgcgctaccagccagatgagctggaaaacaggctgaaggcgcagctcggcttgacg360
gcgacgctcgataaagggctcaccaaggtgctgatcacggcctatgatatccagcagcgg420
caggcgctgttcatggcaaacaccgacaacgagaacagcaatttccgctactgggaggca480
gcgcgggcgacatcggccgcacccacctattttccgccggcgctgatcgaaagggttggc540
gagaagaacaaggacaagcgcttcgtgccattgatcgacggcggcgtcttcgccaacgat600
cctatccttgccgcctatgtggaggcgcgaaagcagaaatggggcaatgacgagctcgtt660
ttcctgtcgcttggtaccggccagcaaaaccgcccgatcgcctatcaggaggccaagggc720
tggggcattttaggctggatgcagccgtctcatgacacgccgctgatctcgatcctgatg780
cagggacaggcgagcaccgcctcctatcaggccaatgcgctgctcaatccgcccggcacc840
aagatcgactattcgaccgtggtgacgaaggacaacgcggcttcgctcagctatttccgt900
ctcgaccggcagctgagctcgaaggagaacgacgcgctggacgacgcatcgcccgaaaac960
atcagggcgctgaaggcaatcgccgcgcaaatcatcaaggataacgcgccggcgctcgac1020
gaaatcgccaaacgcatcctggccaaccaataa1053
<210>100
<211>350
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>100
MetAlaLysArgPheIleLeuSerIleAspGlyGlyGlyIleArgGly
151015
IleIleProAlaAlaIleLeuValGluLeuAlaLysArgLeuGluGly
202530
LeuProLeuHisLysAlaPheAspMetIleAlaGlyThrSerThrGly
354045
GlyIleIleAlaAlaGlyLeuThrCysProHisProAspAspGluGlu
505560
ThrAlaAlaCysThrProThrAspLeuLeuLysLeuTyrValAspHis
65707580
GlyGlyLysIlePheGluLysAsnProIleLeuGlyLeuIleAsnPro
859095
PheGlyLeuAsnAspProArgTyrGlnProAspGluLeuGluAsnArg
100105110
LeuLysAlaGlnLeuGlyLeuThrAlaThrLeuAspLysGlyLeuThr
115120125
LysValLeuIleThrAlaTyrAspIleGlnGlnArgGlnAlaLeuPhe
130135140
MetAlaAsnThrAspAsnGluAsnSerAsnPheArgTyrTrpGluAla
145150155160
AlaArgAlaThrSerAlaAlaProThrTyrPheProProAlaLeuIle
165170175
GluArgValGlyGluLysAsnLysAspLysArgPheValProLeuIle
180185190
AspGlyGlyValPheAlaAsnAspProIleLeuAlaAlaTyrValGlu
195200205
AlaArgLysGlnLysTrpGlyAsnAspGluLeuValPheLeuSerLeu
210215220
GlyThrGlyGlnGlnAsnArgProIleAlaTyrGlnGluAlaLysGly
225230235240
TrpGlyIleLeuGlyTrpMetGlnProSerHisAspThrProLeuIle
245250255
SerIleLeuMetGlnGlyGlnAlaSerThrAlaSerTyrGlnAlaAsn
260265270
AlaLeuLeuAsnProProGlyThrLysIleAspTyrSerThrValVal
275280285
ThrLysAspAsnAlaAlaSerLeuSerTyrPheArgLeuAspArgGln
290295300
LeuSerSerLysGluAsnAspAlaLeuAspAspAlaSerProGluAsn
305310315320
IleArgAlaLeuLysAlaIleAlaAlaGlnIleIleLysAspAsnAla
325330335
ProAlaLeuAspGluIleAlaLysArgIleLeuAlaAsnGln
340345350
<210>101
<211>996
<212>DNA
<213>Bacteria
<400>101
ttgtcgctcgtcgcgtcgctccgccgcgcccccggcgccgccctggccctcgcgcttgcc60
gccgccaccctggccgtgaccgcgcagggcgcgaccgccgcccccgccgcggccgccgcc120
gaggccccgcggctcaaggtgctcacgtacaacacgttcctgttctcgaagacgctctac180
ccgaactggggccaggaccaccgggccaaggcgatccccaccgcccccttctaccagggc240
caggacgtcgtggtcctccaggaggccttcgacaactccgcgtcggacgccctcaaggcg300
aactccgccggccagtacccctaccagacccccgtcgtgggccgcggcaccggcggctgg360
gacgccaccggcgggtcctactcctcgaccacccccgaggacggcggcgtgacgatcctc420
agcaagtggccgatcgtccgcaaggagcagtacgtctacaaggacgcgtgcggcgccgac480
tggtggtccaacaagggcttcgcctacgtcgtgctcaacgtgaacggcagcaaggtgcac540
gtcctcggcacccacgcccagtccaccgacccgggctgctcggcgggcgaggcggtgcag600
atgcggagccgccagttcaaggcgatcgacgccttcctcgacgccaagaacatcccggcg660
ggcgagcaggtgatcgtcgccggcgacatgaacgtcgactcgcgcacgcccgagtacggc720
accatgctcgccgacgccggtctggcggcggccgacgcgcgcaccggccacccgtactcc780
ttcgacaccgagctgaactcgatcgcctccgagcgctacccggacgacccgcgcgaggac840
ctcgattacgtcctctaccgcgccgggaacgcccgccccgccaactggaccaacaacgtg900
gtcctggagaagagcgccccgtggaccgtctccagctggggcaagagctacacctacacc960
aacctctccgaccactacccggtcaccggcttctga996
<210>102
<211>331
<212>PRT
<213>细菌
<220>
<221>信号
<222>(1)...(39)
<400>102
LeuSerLeuValAlaSerLeuArgArgAlaProGlyAlaAlaLeuAla
151015
LeuAlaLeuAlaAlaAlaThrLeuAlaValThrAlaGlnGlyAlaThr
202530
AlaAlaProAlaAlaAlaAlaAlaGluAlaProArgLeuLysValLeu
354045
ThrTyrAsnThrPheLeuPheSerLysThrLeuTyrProAsnTrpGly
505560
GlnAspHisArgAlaLysAlaIleProThrAlaProPheTyrGlnGly
65707580
GlnAspValValValLeuGlnGluAlaPheAspAsnSerAlaSerAsp
859095
AlaLeuLysAlaAsnSerAlaGlyGlnTyrProTyrGlnThrProVal
100105110
ValGlyArgGlyThrGlyGlyTrpAspAlaThrGlyGlySerTyrSer
115120125
SerThrThrProGluAspGlyGlyValThrIleLeuSerLysTrpPro
130135140
IleValArgLysGluGlnTyrValTyrLysAspAlaCysGlyAlaAsp
145150155160
TrpTrpSerAsnLysGlyPheAlaTyrValValLeuAsnValAsnGly
165170175
SerLysValHisValLeuGlyThrHisAlaGlnSerThrAspProGly
180185190
CysSerAlaGlyGluAlaValGlnMetArgSerArgGlnPheLysAla
195200205
IleAspAlaPheLeuAspAlaLysAsnIleProAlaGlyGluGlnVal
210215220
IleValAlaGlyAspMetAsnValAspSerArgThrProGluTyrGly
225230235240
ThrMetLeuAlaAspAlaGlyLeuAlaAlaAlaAspAlaArgThrGly
245250255
HisProTyrSerPheAspThrGluLeuAsnSerIleAlaSerGluArg
260265270
TyrProAspAspProArgGluAspLeuAspTyrValLeuTyrArgAla
275280285
GlyAsnAlaArgProAlaAsnTrpThrAsnAsnValValLeuGluLys
290295300
SerAlaProTrpThrValSerSerTrpGlyLysSerTyrThrTyrThr
305310315320
AsnLeuSerAspHisTyrProValThrGlyPhe
325330
<210>103
<211>2205
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>103
atgagcgagaagaaggagattcgcgttgcgttgatcatggggggtggcgtcagcctcggc60
agtttttcgggtggtgcgcttctcaagaccatcgagctgctgcagcacactgcccgcggt120
ccggcgaagatcgatgtcgtgaccggtgcctcggcgggaagcatgacgctgggcgtagtc180
atctaccacctcatgcggggatcgtcgaccgatgagattctccgcgatctgaggcggtcg240
tgggtggaaatgatctcgttcgacggcctctgtccgccgaacctgtcccgtcacgacaag300
ccgagcctgttttccgatgagatcgtccggaagatcgcggccaccgtcatcgatatgggg360
cgcaagctcgaggcggctcctcatccgcttttcgccgacgaactcgtagcctcgttcgca420
ctgacgaacctgaacggcatccccgcccgtacggagggccagctcatccggcaggcaaag480
ggaggcggagggtccgagaagggctcgaaatccgttttcgccgacgccgtgcagactacc540
tttcaccacgacgtgatgcgattcgtggtgcggcgcgatcacaacgggcaaggcagcctg600
ttcgacagccgttaccgggcacgcatactccctccatggaatgttgggaagggcggcgat660
gcatgggaagcctttcgcacggcggctgttgcctcgggggcgtttccggccgcatttcct720
cccgtcgagatcagccgcaaccgcgacgaattcaacatctggcccgatcgcatcgaggac780
cagaaggcatttacgttcgattacgtggacggcggggtacttcgcaacgaacccctccgg840
gaggcgattcacctggccgcgctgcgcgatgagggagcgacggacatcgagcgtgtgttc900
atcctcatcgacccgaacatcagcggcaccggcgaggtcttcccgctctcctataaccag960
cagatgcggatcaagccgaactacgattccaacggcgacgtccgacagtacgatctcgat1020
gtgccggactacaccggcaatctgatcggggcgatcggtcggctgggttcggtgatcgtc1080
gggcaggcgacgttccgcgactggctcaaggctgccaaagtgaacagccagatcgagtgg1140
cgacgggaattgctgcccattctccgcgacctgaacccgaaccccggggaggaggcgcgc1200
aggggcgtgaacgggatgatcgacaagatctaccggcaaaagtatcagcgcgccctcgag1260
tcaaagagcgttccggtcgaggaggtggaacggcgcgttgccgaagacatcgaacgggac1320
ctggcgcggcgccgttcggaggccggcgacaacgacttcattgcccggctcctcctgctc1380
gtcgacctgatcggcaacctgcgtgagaagcagaagctgaacatggtggcgatcaccccc1440
gcttccgcgccgcacaacgacgggcgccccttgccgctggccggcaattttatgttcagc1500
ttcggggggttcttcagggaggagtacaggcaatacgacttctcggtcggcgaattcgca1560
gcatggaacgtcctgagcacgccggcctccgagacgccctttcttgccgagaccgccccg1620
aaaccgcccgcccgacctccccagccgccggcaatcaatcctacctaccgctcactcggc1680
ccgcccatccagcagcggttcgaggagttcgttcgtgggcacgttcgcgcctttatcgct1740
tcggtcgctccgctgggaacgagagggatcgtcacgggcaagattggcggaaagcttcga1800
acgatgctgatggcctcgcgcaacgggaaatcagagtacttccggcttcgcctctccggc1860
gttgacgggctctacctccgaggctccaagggccgcaacctgagggcggttaacggatcg1920
atcgacacggtcgtcggcgtctatatcgacgaggaagatcagcaccgcgatgagtttttc1980
ggtccccatgtcttcggcgcgaacggctcaggctttacgatggaactatgggagtcccgc2040
ggttttttcgggcgtgatcgtcgcgtcgctgtgatcgagttggagaacaaccccggcggg2100
ttcgcaatcgccgccggatgcaggcggcggcccggcgtggtgctggatatggccaggcgt2160
aacgggcagccactgcggacggtggatgtgatggaatttgcgtga2205
<210>104
<211>734
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>104
MetSerGluLysLysGluIleArgValAlaLeuIleMetGlyGlyGly
151015
ValSerLeuGlySerPheSerGlyGlyAlaLeuLeuLysThrIleGlu
202530
LeuLeuGlnHisThrAlaArgGlyProAlaLysIleAspValValThr
354045
GlyAlaSerAlaGlySerMetThrLeuGlyValValIleTyrHisLeu
505560
MetArgGlySerSerThrAspGluIleLeuArgAspLeuArgArgSer
65707580
TrpValGluMetIleSerPheAspGlyLeuCysProProAsnLeuSer
859095
ArgHisAspLysProSerLeuPheSerAspGluIleValArgLysIle
100105110
AlaAlaThrValIleAspMetGlyArgLysLeuGluAlaAlaProHis
115120125
ProLeuPheAlaAspGluLeuValAlaSerPheAlaLeuThrAsnLeu
130135140
AsnGlyIleProAlaArgThrGluGlyGlnLeuIleArgGlnAlaLys
145150155160
GlyGlyGlyGlySerGluLysGlySerLysSerValPheAlaAspAla
165170175
ValGlnThrThrPheHisHisAspValMetArgPheValValArgArg
180185190
AspHisAsnGlyGlnGlySerLeuPheAspSerArgTyrArgAlaArg
195200205
IleLeuProProTrpAsnValGlyLysGlyGlyAspAlaTrpGluAla
210215220
PheArgThrAlaAlaValAlaSerGlyAlaPheProAlaAlaPhePro
225230235240
ProValGluIleSerArgAsnArgAspGluPheAsnIleTrpProAsp
245250255
ArgIleGluAspGlnLysAlaPheThrPheAspTyrValAspGlyGly
260265270
ValLeuArgAsnGluProLeuArgGluAlaIleHisLeuAlaAlaLeu
275280285
ArgAspGluGlyAlaThrAspIleGluArgValPheIleLeuIleAsp
290295300
ProAsnIleSerGlyThrGlyGluValPheProLeuSerTyrAsnGln
305310315320
GlnMetArgIleLysProAsnTyrAspSerAsnGlyAspValArgGln
325330335
TyrAspLeuAspValProAspTyrThrGlyAsnLeuIleGlyAlaIle
340345350
GlyArgLeuGlySerValIleValGlyGlnAlaThrPheArgAspTrp
355360365
LeuLysAlaAlaLysValAsnSerGlnIleGluTrpArgArgGluLeu
370375380
LeuProIleLeuArgAspLeuAsnProAsnProGlyGluGluAlaArg
385390395400
ArgGlyValAsnGlyMetIleAspLysIleTyrArgGlnLysTyrGln
405410415
ArgAlaLeuGluSerLysSerValProValGluGluValGluArgArg
420425430
ValAlaGluAspIleGluArgAspLeuAlaArgArgArgSerGluAla
435440445
GlyAspAsnAspPheIleAlaArgLeuLeuLeuLeuValAspLeuIle
450455460
GlyAsnLeuArgGluLysGlnLysLeuAsnMetValAlaIleThrPro
465470475480
AlaSerAlaProHisAsnAspGlyArgProLeuProLeuAlaGlyAsn
485490495
PheMetPheSerPheGlyGlyPhePheArgGluGluTyrArgGlnTyr
500505510
AspPheSerValGlyGluPheAlaAlaTrpAsnValLeuSerThrPro
515520525
AlaSerGluThrProPheLeuAlaGluThrAlaProLysProProAla
530535540
ArgProProGlnProProAlaIleAsnProThrTyrArgSerLeuGly
545550555560
ProProIleGlnGlnArgPheGluGluPheValArgGlyHisValArg
565570575
AlaPheIleAlaSerValAlaProLeuGlyThrArgGlyIleValThr
580585590
GlyLysIleGlyGlyLysLeuArgThrMetLeuMetAlaSerArgAsn
595600605
GlyLysSerGluTyrPheArgLeuArgLeuSerGlyValAspGlyLeu
610615620
TyrLeuArgGlySerLysGlyArgAsnLeuArgAlaValAsnGlySer
625630635640
IleAspThrValValGlyValTyrIleAspGluGluAspGlnHisArg
645650655
AspGluPhePheGlyProHisValPheGlyAlaAsnGlySerGlyPhe
660665670
ThrMetGluLeuTrpGluSerArgGlyPhePheGlyArgAspArgArg
675680685
ValAlaValIleGluLeuGluAsnAsnProGlyGlyPheAlaIleAla
690695700
AlaGlyCysArgArgArgProGlyValValLeuAspMetAlaArgArg
705710715720
AsnGlyGlnProLeuArgThrValAspValMetGluPheAla
725730
<210>105
<211>756
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>105
atgaaccgttgtcggaactcactcaacctccaacttcgcgcggtgaccgtggcggcgttg60
gtagtcgtcgcatcctcggccgcgctggcgtgggacagcgcctcgcgcaatccgacccat120
cccacccacagctacctcaccgaatacgccatcgatcagcttggggtggcgcggccggag180
ctccggcaataccgcaagcagatcatcgagggcgccaacaccgagctgcacgaactgcca240
gtcaaggggacggcctatggcctcgacctcgacgccaagcggcgggaacaccgcggcacc300
aatgccgggacagacgacatcgccggctggtgggcggaaagcctccaagcctatcgcgcc360
ggtgccaaggaacgcgcctacttcgtgctgggggtggtgctgcacatggtcgaggacatg420
ggcgtgccggcgcacgcgaacggcgtctaccaccagggcaacctgactgaattcgacaat480
ttcgagttcatgggactgtcgaactggaagccctctttcgccgacatcaaccggaccgat540
ccgggctacgccgacccgtcgcgctactacgagttcagccgagattggacggcggcagac600
gcacccggctatcgcgaccgcgacagcttctcgaagacctgggttctcgccagcccggcc660
gaacgtcagctgcttcagaaccgccagggccggaccgccacggtcgccatgtgggcgtta720
cggagcgcgacgaaggcgttcgccgggaaaccctag756
<210>106
<211>251
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(30)
<400>106
MetAsnArgCysArgAsnSerLeuAsnLeuGlnLeuArgAlaValThr
151015
ValAlaAlaLeuValValValAlaSerSerAlaAlaLeuAlaTrpAsp
202530
SerAlaSerArgAsnProThrHisProThrHisSerTyrLeuThrGlu
354045
TyrAlaIleAspGlnLeuGlyValAlaArgProGluLeuArgGlnTyr
505560
ArgLysGlnIleIleGluGlyAlaAsnThrGluLeuHisGluLeuPro
65707580
ValLysGlyThrAlaTyrGlyLeuAspLeuAspAlaLysArgArgGlu
859095
HisArgGlyThrAsnAlaGlyThrAspAspIleAlaGlyTrpTrpAla
100105110
GluSerLeuGlnAlaTyrArgAlaGlyAlaLysGluArgAlaTyrPhe
115120125
ValLeuGlyValValLeuHisMetValGluAspMetGlyValProAla
130135140
HisAlaAsnGlyValTyrHisGlnGlyAsnLeuThrGluPheAspAsn
145150155160
PheGluPheMetGlyLeuSerAsnTrpLysProSerPheAlaAspIle
165170175
AsnArgThrAspProGlyTyrAlaAspProSerArgTyrTyrGluPhe
180185190
SerArgAspTrpThrAlaAlaAspAlaProGlyTyrArgAspArgAsp
195200205
SerPheSerLysThrTrpValLeuAlaSerProAlaGluArgGlnLeu
210215220
LeuGlnAsnArgGlnGlyArgThrAlaThrValAlaMetTrpAlaLeu
225230235240
ArgSerAlaThrLysAlaPheAlaGlyLysPro
245250
<210>107
<211>990
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>107
atgagcaataagaagtttattttgaaattattcatatgtagtactatacttagcacattt60
gtatttgctttcaatgataagcaagcagttgctgctagcgctggtaatgggcttgaaaac120
tggtcaaaatggatgcaacctatacccgataacgtaccgttagcacgaatttcaattcca180
ggaacacatgatagtggaacgttcaagttgcaaaatccgataaagcaagtatggggaatg240
acgcaagaatataattttcgttaccaaatggatcacggagctagaatttttgatattaga300
gggcgtttaacagatgataatacgatagttcttcatcatggaccattatatctttatgta360
acattgcatgaatttataaatgaagcgaaacaatttttaaaagataatccaagtgaaacg420
attattatgtctttaaaaaaagagtatgaggatatgaaaggggcagaagattcatttagt480
agtacgtttgaaaaaaaatattttcctgatcctatctttttaaaaacagaagggaatata540
agacttggagatgctcgaggaaaaattgtgctactaaaaagatacagtggtagtaatgaa600
tctggaggatataataatttttattggccagataatgacacgtttacgacaactgtaaat660
caaaatgtaaatgtaacagtacaagataaatataaggtgagttatgatgagaaagtaaca720
tctattaaagatacgataaatgaaacgattaacaacagtgaagattgtaatcatctatat780
attaattttacaagcttgtcttctggtggtacagcatggaatagtccatattattacgcg840
tcctacataaatcctgaaattgcaaactatatgaagcaaaagaatcctacgagagtgggc900
tgggtaattcaagattatataaatgaaaaatggtccccaatactttatgaagaagttata960
agagcgaataagtcacttgtaaaagagtaa990
<210>108
<211>329
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>108
MetSerAsnLysLysPheIleLeuLysLeuPheIleCysSerThrIle
151015
LeuSerThrPheValPheAlaPheAsnAspLysGlnAlaValAlaAla
202530
SerAlaGlyAsnGlyLeuGluAsnTrpSerLysTrpMetGlnProIle
354045
ProAspAsnValProLeuAlaArgIleSerIleProGlyThrHisAsp
505560
SerGlyThrPheLysLeuGlnAsnProIleLysGlnValTrpGlyMet
65707580
ThrGlnGluTyrAsnPheArgTyrGlnMetAspHisGlyAlaArgIle
859095
PheAspIleArgGlyArgLeuThrAspAspAsnThrIleValLeuHis
100105110
HisGlyProLeuTyrLeuTyrValThrLeuHisGluPheIleAsnGlu
115120125
AlaLysGlnPheLeuLysAspAsnProSerGluThrIleIleMetSer
130135140
LeuLysLysGluTyrGluAspMetLysGlyAlaGluAspSerPheSer
145150155160
SerThrPheGluLysLysTyrPheProAspProIlePheLeuLysThr
165170175
GluGlyAsnIleArgLeuGlyAspAlaArgGlyLysIleValLeuLeu
180185190
LysArgTyrSerGlySerAsnGluSerGlyGlyTyrAsnAsnPheTyr
195200205
TrpProAspAsnAspThrPheThrThrThrValAsnGlnAsnValAsn
210215220
ValThrValGlnAspLysTyrLysValSerTyrAspGluLysValThr
225230235240
SerIleLysAspThrIleAsnGluThrIleAsnAsnSerGluAspCys
245250255
AsnHisLeuTyrIleAsnPheThrSerLeuSerSerGlyGlyThrAla
260265270
TrpAsnSerProTyrTyrTyrAlaSerTyrIleAsnProGluIleAla
275280285
AsnTyrMetLysGlnLysAsnProThrArgValGlyTrpValIleGln
290295300
AspTyrIleAsnGluLysTrpSerProIleLeuTyrGluGluValIle
305310315320
ArgAlaAsnLysSerLeuValLysGlu
325
<210>109
<211>990
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>109
atgagcaataagaagtttattttgaaattattcatatgtagtactatacttagcacattt60
gtatttgctttcaatgataagcaagcagttgctgctagcgctggtaatgggcttgaaaac120
tggtcaaaatggatgcaacctatacccgataacgtaccgttagcacgaatttcaattcca180
ggaacacatgatagtggaacgttcaagttgcaaaatccgataaagcaagtatggggaatg240
acgcaagaatataattttcgttaccaaatggatcacggagctagaatttttgatattaga300
gggcgtttaacagatgataatacgatagttcttcatcatgggccattatatctttatgta360
acattgcatgaatttataaatgaagcgaaacaatttttaaaagataatccaagtgaaacg420
attattatgtctttaaaaaaagagtatgaggatatgaaaggggcagaagattcatttagt480
agtacgtttgaaaaaaaatattttcctgatcctatctttttaaaaacagaagggaatata540
agacttggagatgctcgaggaaaaattgtgctactaaaaagatacagtggtagtaatgaa600
tctggaggatataataatttttattggccagataatgagacgtttacgacaactgtaaat660
caaaatgtaaatgtaacagtacaagataaatataaagtgagttatgatgagaaagtaaaa720
tctattaaagatacgataaatgaaacgattaacaacagtgaagattgtaatcatctatat780
attaattttacaagcttgtcttctggtggtacagcatggaatagtccatattattatgcg840
tcctacataaatcctgaaattgcaaactatatgaagcaaaagaatcctatgagagtgggc900
tgggtaattcaagattatataaatgaaaaatggtccccaatactttatgaagaagttata960
agagcgaataagtcacttgtaaaagagtaa990
<210>110
<211>329
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<400>110
MetSerAsnLysLysPheIleLeuLysLeuPheIleCysSerThrIle
151015
LeuSerThrPheValPheAlaPheAsnAspLysGlnAlaValAlaAla
202530
SerAlaGlyAsnGlyLeuGluAsnTrpSerLysTrpMetGlnProIle
354045
ProAspAsnValProLeuAlaArgIleSerIleProGlyThrHisAsp
505560
SerGlyThrPheLysLeuGlnAsnProIleLysGlnValTrpGlyMet
65707580
ThrGlnGluTyrAsnPheArgTyrGlnMetAspHisGlyAlaArgIle
859095
PheAspIleArgGlyArgLeuThrAspAspAsnThrIleValLeuHis
100105110
HisGlyProLeuTyrLeuTyrValThrLeuHisGluPheIleAsnGlu
115120125
AlaLysGlnPheLeuLysAspAsnProSerGluThrIleIleMetSer
130135140
LeuLysLysGluTyrGluAspMetLysGlyAlaGluAspSerPheSer
145150155160
SerThrPheGluLysLysTyrPheProAspProIlePheLeuLysThr
165170175
GluGlyAsnIleArgLeuGlyAspAlaArgGlyLysIleValLeuLeu
180185190
LysArgTyrSerGlySerAsnGluSerGlyGlyTyrAsnAsnPheTyr
195200205
TrpProAspAsnGluThrPheThrThrThrValAsnGlnAsnValAsn
210215220
ValThrValGlnAspLysTyrLysValSerTyrAspGluLysValLys
225230235240
SerIleLysAspThrIleAsnGluThrIleAsnAsnSerGluAspCys
245250255
AsnHisLeuTyrIleAsnPheThrSerLeuSerSerGlyGlyThrAla
260265270
TrpAsnSerProTyrTyrTyrAlaSerTyrIleAsnProGluIleAla
275280285
AsnTyrMetLysGlnLysAsnProMetArgValGlyTrpValIleGln
290295300
AspTyrIleAsnGluLysTrpSerProIleLeuTyrGluGluValIle
305310315320
ArgAlaAsnLysSerLeuValLysGlu
325
<210>111
<211>828
<212>DNA
<213>细菌
<400>111
gtgggtgccggggcgatccttctcaccggggcccccaccgcctcggccgtggacacgcgc60
gcgtggatggggggacacggggacggcacgccgctccagcggctcaccatccccggcacc120
cacgactccggcgcccggttcggcgggccctggtcggagtgccagaacaccaccatcgcc180
cagcagctggacagcgggatccggttcctggacgtccggtgccgggtcaccggcgggtcc240
ttcgccatccaccacggggcctcctaccagaacatgatgttcggcgacgtcctcgtcgcc300
tgccgcgacttcctcgccgcgcacccctccgagaccgtcctcatgcgggtcaagcaggag360
tactcgaccgactccgacgccaccttccgggccgtcttcgacgactacctcgacgcgcgc420
ggctggcgctccctgttccgcatcggcgacggggtcccgctgctcggcgaggcccgcggc480
cgggtcgtgctcatcgccgacaacggcggactgccgggcggtctgcgctggggcgacggc540
tcggccctcgccatccaggacgactggaacgcgctgcccgaccccaagtacgccaagatc600
gaggcgcacttccgtaccgccgtcgcccagccgggccggctgtacgtgaacttcgtcagc660
acctccgcctacctgccgccccgctggaactccgacaacctcaacccgcgcgtgcaccgc720
tacctcgacagcgcggccgccgcgggcgcgaagggcctcgggatcgtccccatggacttc780
cccaacacccgctcgggtctggtcgaggcgctgctccggcacaactga828
<210>112
<211>275
<212>PRT
<213>细菌
<220>
<221>信号
<222>(1)...(16)
<220>
<221>结构域
<222>(34)...(168)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>112
MetGlyAlaGlyAlaIleLeuLeuThrGlyAlaProThrAlaSerAla
151015
ValAspThrArgAlaTrpMetGlyGlyHisGlyAspGlyThrProLeu
202530
GlnArgLeuThrIleProGlyThrHisAspSerGlyAlaArgPheGly
354045
GlyProTrpSerGluCysGlnAsnThrThrIleAlaGlnGlnLeuAsp
505560
SerGlyIleArgPheLeuAspValArgCysArgValThrGlyGlySer
65707580
PheAlaIleHisHisGlyAlaSerTyrGlnAsnMetMetPheGlyAsp
859095
ValLeuValAlaCysArgAspPheLeuAlaAlaHisProSerGluThr
100105110
ValLeuMetArgValLysGlnGluTyrSerThrAspSerAspAlaThr
115120125
PheArgAlaValPheAspAspTyrLeuAspAlaArgGlyTrpArgSer
130135140
LeuPheArgIleGlyAspGlyValProLeuLeuGlyGluAlaArgGly
145150155160
ArgValValLeuIleAlaAspAsnGlyGlyLeuProGlyGlyLeuArg
165170175
TrpGlyAspGlySerAlaLeuAlaIleGlnAspAspTrpAsnAlaLeu
180185190
ProAspProLysTyrAlaLysIleGluAlaHisPheArgThrAlaVal
195200205
AlaGlnProGlyArgLeuTyrValAsnPheValSerThrSerAlaTyr
210215220
LeuProProArgTrpAsnSerAspAsnLeuAsnProArgValHisArg
225230235240
TyrLeuAspSerAlaAlaAlaAlaGlyAlaLysGlyLeuGlyIleVal
245250255
ProMetAspPheProAsnThrArgSerGlyLeuValGluAlaLeuLeu
260265270
ArgHisAsn
275
<210>113
<211>981
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>113
atgagcaataagaagtttattttgaaattattcatatgtagtactatacttagcacattt60
gtatttgctttcaatgataagcaagcagttgctgctagcgctggtaatgggcttgaaaac120
tggtcaaaatggatgcaacctatacccgataacgtaccgttagcacgaatttcaattcca180
ggaacacatgatagtggaacgttcaagttgcaaaatccgataaagcaagtatggggaatg240
acgcaagaatataattttcgttaccaaatggatcacggagctagaatttttgatattaga300
gggcgtttaacagatgataatacgatagttcttcatcatgggccattatatctttatgta360
acattgcatgaatttataaatgaagcgaaacaatttttaaaagataatccaagtgaaacg420
attattatgtctttaaaaaaagagtatgaggatatgaaaggggcagaagattcatttagt480
agtacgtttgaaaaaaaatattttcctgatcctatctttttaaaaacagaagggaatata540
agacttggagatgctcgaggaaaaattgtgctactaaaaagatacagtggtagtaatgaa600
tctggaggatataataatttttattggccagataatgagacgtttacgacaactgtaaat660
caaaatgtaaatgtaacagtacaagataaatataaagtgagttatgatgagaaagtaaaa720
tctattaaagatacgataaatgaaacgattaacaacagtgaagattgtaatcatctatat780
attaattttacaagcttgtcttctggtggtacagcatggaatagtccatattattatgcg840
tcctacataaatcctgaaattgcaaactatatgaagcaaaagaatcctatgagagtgggc900
tgggtaattcaagattatataaatgaaaaatggtccccaatactttatgaagaagttata960
agagcgaataagtcactgtaa981
<210>114
<211>326
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>114
MetSerAsnLysLysPheIleLeuLysLeuPheIleCysSerThrIle
151015
LeuSerThrPheValPheAlaPheAsnAspLysGlnAlaValAlaAla
202530
SerAlaGlyAsnGlyLeuGluAsnTrpSerLysTrpMetGlnProIle
354045
ProAspAsnValProLeuAlaArgIleSerIleProGlyThrHisAsp
505560
SerGlyThrPheLysLeuGlnAsnProIleLysGlnValTrpGlyMet
65707580
ThrGlnGluTyrAsnPheArgTyrGlnMetAspHisGlyAlaArgIle
859095
PheAspIleArgGlyArgLeuThrAspAspAsnThrIleValLeuHis
100105110
HisGlyProLeuTyrLeuTyrValThrLeuHisGluPheIleAsnGlu
115120125
AlaLysGlnPheLeuLysAspAsnProSerGluThrIleIleMetSer
130135140
LeuLysLysGluTyrGluAspMetLysGlyAlaGluAspSerPheSer
145150155160
SerThrPheGluLysLysTyrPheProAspProIlePheLeuLysThr
165170175
GluGlyAsnIleArgLeuGlyAspAlaArgGlyLysIleValLeuLeu
180185190
LysArgTyrSerGlySerAsnGluSerGlyGlyTyrAsnAsnPheTyr
195200205
TrpProAspAsnGluThrPheThrThrThrValAsnGlnAsnValAsn
210215220
ValThrValGlnAspLysTyrLysValSerTyrAspGluLysValLys
225230235240
SerIleLysAspThrIleAsnGluThrIleAsnAsnSerGluAspCys
245250255
AsnHisLeuTyrIleAsnPheThrSerLeuSerSerGlyGlyThrAla
260265270
TrpAsnSerProTyrTyrTyrAlaSerTyrIleAsnProGluIleAla
275280285
AsnTyrMetLysGlnLysAsnProMetArgValGlyTrpValIleGln
290295300
AspTyrIleAsnGluLysTrpSerProIleLeuTyrGluGluValIle
305310315320
ArgAlaAsnLysSerLeu
325
<210>115
<211>987
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>115
atgaacaataagaagtttattttgaagttattcatatgtagtatggtacttagcgccttt60
gtatttgctttcaatgataagaaaaccgttgcagctagctctattaatgagcttgaaaat120
tggtctagatggatgaaacctataaatgatgacataccgttagcacgaatttcaattcca180
ggaacacatgatagtggaacgttcaagttgcaaaatccgataaagcaagtgtggggaatg240
acgcaagaatatgattttcgttatcaaatggatcatggagctagaatttttgatataaga300
gggcgtttaacagatgataatacgatagttcttcatcatgggccattatatctttatgta360
acactgcacgaatttataaacgaagcgaaacaatttttaaaagataatccaagtgaaacg420
attattatgtctttaaaaaaagagtatgaggatatgaaaggggcggaaagctcatttagt480
agtacgtttgagaaaaattattttcgtgatccaatctttttaaaaacagaagggaatata540
aagcttggagatgctcgtgggaaaattatattactaaaacgatatagtggtagtaatgaa600
tctgggggatataataatttctattggccagacaatgagacgtttacctcaactataaat660
caaaatgtaaatgtcacagtacaagataaatataaagtgagttatgatgagaaagtaaac720
gctattaaagatacattaaatgaaacgattaacaatagtgaagatgttaatcatctatat780
attaattttataagcttgtcttctggtggtacagcatggaatagtccatattattatgcg840
tcctacataaatcctgaaattgcaaattatatgaagcaaaagaatcctacgagagtgggc900
tggataatacaagattatataaatgaaaaatggtcaccattactttatcaagaagttata960
agagcgaataagtcacttgtaaaatag987
<210>116
<211>328
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>116
MetAsnAsnLysLysPheIleLeuLysLeuPheIleCysSerMetVal
151015
LeuSerAlaPheValPheAlaPheAsnAspLysLysThrValAlaAla
202530
SerSerIleAsnGluLeuGluAsnTrpSerArgTrpMetLysProIle
354045
AsnAspAspIleProLeuAlaArgIleSerIleProGlyThrHisAsp
505560
SerGlyThrPheLysLeuGlnAsnProIleLysGlnValTrpGlyMet
65707580
ThrGlnGluTyrAspPheArgTyrGlnMetAspHisGlyAlaArgIle
859095
PheAspIleArgGlyArgLeuThrAspAspAsnThrIleValLeuHis
100105110
HisGlyProLeuTyrLeuTyrValThrLeuHisGluPheIleAsnGlu
115120125
AlaLysGlnPheLeuLysAspAsnProSerGluThrIleIleMetSer
130135140
LeuLysLysGluTyrGluAspMetLysGlyAlaGluSerSerPheSer
145150155160
SerThrPheGluLysAsnTyrPheArgAspProIlePheLeuLysThr
165170175
GluGlyAsnIleLysLeuGlyAspAlaArgGlyLysIleIleLeuLeu
180185190
LysArgTyrSerGlySerAsnGluSerGlyGlyTyrAsnAsnPheTyr
195200205
TrpProAspAsnGluThrPheThrSerThrIleAsnGlnAsnValAsn
210215220
ValThrValGlnAspLysTyrLysValSerTyrAspGluLysValAsn
225230235240
AlaIleLysAspThrLeuAsnGluThrIleAsnAsnSerGluAspVal
245250255
AsnHisLeuTyrIleAsnPheIleSerLeuSerSerGlyGlyThrAla
260265270
TrpAsnSerProTyrTyrTyrAlaSerTyrIleAsnProGluIleAla
275280285
AsnTyrMetLysGlnLysAsnProThrArgValGlyTrpIleIleGln
290295300
AspTyrIleAsnGluLysTrpSerProLeuLeuTyrGlnGluValIle
305310315320
ArgAlaAsnLysSerLeuValLys
325
<210>117
<211>987
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>117
atgaacaataagaagtttattttgaagttattcatatgtagtatggtacttagcgccttt60
gtatttgctttcaatgataagaaaaccgttgcagctagctctattaatgagcttgaaaat120
tggtctagatggatgaaacctataaatgatgacataccgttagcacgaatttcaattcca180
ggaacacatgatagtggaacgttcaagttgcaaaatccgataaagcaagtgtggggaatg240
acgcaagaatatgattttcgttatcaaatggatcatggagctagaatttttgatataaga300
gggcgtttaacagatgataatacgatagttcttcatcatgggccattatatctttatgta360
acactgcacgaatttataaacgaagcgaaacaatttttaaaagataatccaagtgaaacg420
attattatgtctttaaaaaaagagtatgaggatatgaaaggggcggaaagctcatttagt480
agtacgtttgagaaaaattattttcgtgatccaatctttttaaaaacagaaggaaatata540
aagcttggagatgctcgtgggaaaattgtattactaaaaagatatagtggtagtaatgaa600
tctgggggatataataatttctattggccagacaatgagacgtttacctcaactataaat660
caaaatgtaaatgtaacagtacaagataaatataaagtgagttatgatgagaaaataaac720
gctattaaagatacattaaatgaaacgattaacaatagtgaagatgttaatcatctatat780
attaattttacaagcttgtcttctggtggtacagcatggaatagtccatattattatgcg840
tcctacataaatcctgaaattgcaaattatatgaagcaaaagaatcctacgagagtgggc900
tggataatacaagattatataaatgaaaaatggtcaccattactttatcaagaagttata960
agagcgaataagtcacttgtaaaatag987
<210>118
<211>328
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>118
MetAsnAsnLysLysPheIleLeuLysLeuPheIleCysSerMetVal
151015
LeuSerAlaPheValPheAlaPheAsnAspLysLysThrValAlaAla
202530
SerSerIleAsnGluLeuGluAsnTrpSerArgTrpMetLysProIle
354045
AsnAspAspIleProLeuAlaArgIleSerIleProGlyThrHisAsp
505560
SerGlyThrPheLysLeuGlnAsnProIleLysGlnValTrpGlyMet
65707580
ThrGlnGluTyrAspPheArgTyrGlnMetAspHisGlyAlaArgIle
859095
PheAspIleArgGlyArgLeuThrAspAspAsnThrIleValLeuHis
100105110
HisGlyProLeuTyrLeuTyrValThrLeuHisGluPheIleAsnGlu
115120125
AlaLysGlnPheLeuLysAspAsnProSerGluThrIleIleMetSer
130135140
LeuLysLysGluTyrGluAspMetLysGlyAlaGluSerSerPheSer
145150155160
SerThrPheGluLysAsnTyrPheArgAspProIlePheLeuLysThr
165170175
GluGlyAsnIleLysLeuGlyAspAlaArgGlyLysIleValLeuLeu
180185190
LysArgTyrSerGlySerAsnGluSerGlyGlyTyrAsnAsnPheTyr
195200205
TrpProAspAsnGluThrPheThrSerThrIleAsnGlnAsnValAsn
210215220
ValThrValGlnAspLysTyrLysValSerTyrAspGluLysIleAsn
225230235240
AlaIleLysAspThrLeuAsnGluThrIleAsnAsnSerGluAspVal
245250255
AsnHisLeuTyrIleAsnPheThrSerLeuSerSerGlyGlyThrAla
260265270
TrpAsnSerProTyrTyrTyrAlaSerTyrIleAsnProGluIleAla
275280285
AsnTyrMetLysGlnLysAsnProThrArgValGlyTrpIleIleGln
290295300
AspTyrIleAsnGluLysTrpSerProLeuLeuTyrGlnGluValIle
305310315320
ArgAlaAsnLysSerLeuValLys
325
<210>119
<211>987
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>119
atgaacaataagaagtttattttgaagttattcatatgtagtatggtacttagcgccttt60
gtatttgctttcaatgataagaaaaccgttgcagctagctctattaatgtgcttgaaaat120
tggtctagatggatgaaacctataaatgatgacataccgttagcacgaatttcaattcca180
ggaacacatgatagtggaacgttcaagttgcaaaatccgataaagcaagtgtggggaatg240
acgcaagaatatgattttcgttatcaaatggatcatggagctagaatttttgatataaga300
gggcgtttaacagatgataatacgatagttcttcatcatgggccattatatctttatgta360
acactgcacgaatttataaacgaagcgaaacaatttttaaaagataatccaagtgaaacg420
attattatgtctttaaaaaaagagtatgaggatatgaaaggggcggaaagctcatttagt480
agtacgtttgagaaaaattattttcgtgatccaatctttttaaaaacagaagggaatata540
aagcttggagatgctcgtgggaaaattgtattactaaaaagatatagtggtagtaatgaa600
tctgggggatataataatttctattggccagacaatgagacgtttacctcaactataaat660
caaaatgtaaatgtaacagtacaagataaatataaagtgagttatgatgagaaaataaac720
gctattaaagatacattaaatgaaacgattaacaatagtgaagatgttaatcatctatat780
attaattttacaagcttgtcttctggtggtacagcatggaatagtccatattattatgcg840
tcctacataaatcctgaaattgcaaattatatgaagcaaaagaatcctacgagagtgggc900
tggataatacaagattatataaatgaaaaatggtcaccattactttatcaagaagttata960
agagcgaataagtcacttgtaaaatag987
<210>120
<211>328
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>120
MetAsnAsnLysLysPheIleLeuLysLeuPheIleCysSerMetVal
151015
LeuSerAlaPheValPheAlaPheAsnAspLysLysThrValAlaAla
202530
SerSerIleAsnValLeuGluAsnTrpSerArgTrpMetLysProIle
354045
AsnAspAspIleProLeuAlaArgIleSerIleProGlyThrHisAsp
505560
SerGlyThrPheLysLeuGlnAsnProIleLysGlnValTrpGlyMet
65707580
ThrGlnGluTyrAspPheArgTyrGlnMetAspHisGlyAlaArgIle
859095
PheAspIleArgGlyArgLeuThrAspAspAsnThrIleValLeuHis
100105110
HisGlyProLeuTyrLeuTyrValThrLeuHisGluPheIleAsnGlu
115120125
AlaLysGlnPheLeuLysAspAsnProSerGluThrIleIleMetSer
130135140
LeuLysLysGluTyrGluAspMetLysGlyAlaGluSerSerPheSer
145150155160
SerThrPheGluLysAsnTyrPheArgAspProIlePheLeuLysThr
165170175
GluGlyAsnIleLysLeuGlyAspAlaArgGlyLysIleValLeuLeu
180185190
LysArgTyrSerGlySerAsnGluSerGlyGlyTyrAsnAsnPheTyr
195200205
TrpProAspAsnGluThrPheThrSerThrIleAsnGlnAsnValAsn
210215220
ValThrValGlnAspLysTyrLysValSerTyrAspGluLysIleAsn
225230235240
AlaIleLysAspThrLeuAsnGluThrIleAsnAsnSerGluAspVal
245250255
AsnHisLeuTyrIleAsnPheThrSerLeuSerSerGlyGlyThrAla
260265270
TrpAsnSerProTyrTyrTyrAlaSerTyrIleAsnProGlnIleAla
275280285
AsnTyrMetLysGlnLysAsnProThrArgValGlyTrpIleIleGln
290295300
AspTyrIleAsnG1uLysTrpSerProLeuLeuTyrGlnGluValIle
305310315320
ArgAlaAsnLysSerLeuValLys
325
<210>121
<211>990
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>121
atgcgtaataagaagtttattttgaaattattaatatgtagtacggtacttagcaccttt60
gtatttgctttcaatgataagcaaactgttgcagctagctctattaatgaactcgaaaat120
tggtctagatggatgcagcctatacctgatgacatgccgttagcaagaatttcaattcca180
ggaacacatgatagtggaacgttcaaactgcaaaatccgataaagcaagtatggggaatg240
acgcaagaatatgattttcgttaccaaatggatcatggggctagaatttttgatataaga300
gggcgtttaacagatgataatacgatagtccttcatcatgggccattatatctttatgta360
acactgaacgaatttataaatgaagcgaaacaatttttaaaagataacccaagtgaaacg420
attattatgtctttaaagaaagagtatgaggatatgaaaggggcagaaaattcatttagt480
agtacgtttgaaaaaaaatattttcttgatcctatctttttaaaaacagaagggaatata540
aaacttggagatgctcgtgggaaaattgtactactaaaaagatatagtggtagtaatgaa600
tctggaggatataataatttttattggccagataacgagacgtttacgacaactgtaaat660
caaaatgtaaatgtaacagtacaagataaatataaagtgagttatgatgagaaagtaaaa720
tctattaaagatacgataaatgaaacgattaacaatagtgaagattttaatcatctatat780
attaattttacaagcttgtcttctggtggtacagcatggaatagtccatattattatgca840
tcctacataaatcctgaaattgcaaaccatatgaagcaaaagaatcctacgagagtgggc900
tgggtaattcaagattatataaatgaaaaatggtcaccaatactttatcaagaagttata960
agagcgaataagtcacttataaaagagtag990
<210>122
<211>329
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>122
MetArgAsnLysLysPheIleLeuLysLeuLeuIleCysSerThrVal
151015
LeuSerThrPheValPheAlaPheAsnAspLysGlnThrValAlaAla
202530
SerSerIleAsnGluLeuGluAsnTrpSerArgTrpMetGlnProIle
354045
ProAspAspMetProLeuAlaArgIleSerIleProGlyThrHisAsp
505560
SerGlyThrPheLysLeuGlnAsnProIleLysGlnValTrpGlyMet
65707580
ThrGlnGluTyrAspPheArgTyrGlnMetAspHisGlyAlaArgIle
859095
PheAspIleArgGlyArgLeuThrAspAspAsnThrIleValLeuHis
100105110
HisGlyProLeuTyrLeuTyrValThrLeuAsnGluPheIleAsnGlu
115120125
AlaLysGlnPheLeuLysAspAsnProSerGluThrIleIleMetSer
130135140
LeuLysLysGluTyrGluAspMetLysGlyAlaGluAsnSerPheSer
145150155160
SerThrPheGluLysLysTyrPheLeuAspProIlePheLeuLysThr
165170175
GluGlyAsnIleLysLeuGlyAspAlaArgGlyLysIleValLeuLeu
180185190
LysArgTyrSerGlySerAsnGluSerGlyGlyTyrAsnAsnPheTyr
195200205
TrpProAspAsnGluThrPheThrThrThrValAsnGlnAsnValAsn
210215220
ValThrValGlnAspLysTyrLysValSerTyrAspGluLysValLys
225230235240
SerIleLysAspThrIleAsnGluThrIleAsnAsnSerGluAspPhe
245250255
AsnHisLeuTyrIleAsnPheThrSerLeuSerSerGlyGlyThrAla
260265270
TrpAsnSerProTyrTyrTyrAlaSerTyrIleAsnProGluIleAla
275280285
AsnHisMetLysGlnLysAsnProThrArgValGlyTrpValIleGln
290295300
AspTyrIleAsnGluLysTrpSerProIleLeuTyrGlnGluValIle
305310315320
ArgAlaAsnLysSerLeuIleLysGlu
325
<210>123
<211>849
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>123
atgaaaaagaaagtattagcactagcagctatggttgctttagctgcaccagttcaaagt60
gtagtgtttgcgcaaacaaataatagtgaaagtcctgcaccgatcttaagatggtcagct120
gaggacaagcataatgagggagttagtactcatttgtggattgtaaatcgtgcaattgac180
atcatgtctcgtaatacagcgattgtgaagccaaatgaaactgctttattaaatgagtgg240
cgtactgatttagaaaatggtatttattctgctgattacgagaatccttattatgataat300
agtacatatgcttctcatttttacgatccggatactggaaaaacatatattccttttgcg360
aaacaggcaaaagaaacaggtacaaaatattttaaacttgctggtgaagcatacaaaaat420
caagatatgaaacaggcattcttctatttaggattatcacttcattatttaggagatgta480
aatcagccaatgcatgcagcaaactttacgaatctttcttatccaatgggtttccattct540
aaatatgaaaattttgttgatacaataaaaaataactatatagtttcagatagtagtgga600
tattggaattggaaaggggcaaacccagaagattggattcaaggagcagcagtagcggct660
aaacaagattatcctggtattgtgaacgatacgacaaaagattggtttgtaaaagcagct720
gtatctcaagcatatgcagataaatggcgtgcagaagtaacaccggtgacaggaaaacgc780
ttaatggaggcacagcgcgttacagctggttatattcatttatggtttgatacgtatgta840
aatcactaa849
<210>124
<211>282
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(24)
<220>
<221>结构域
<222>(1)...(281)
<223>锌依赖型磷脂酶C
<400>124
MetLysLysLysValLeuAlaLeuAlaAlaMetValAlaLeuAlaAla
151015
ProValGlnSerValValPheAlaGlnThrAsnAsnSerGluSerPro
202530
AlaProIleLeuArgTrpSerAlaGluAspLysHisAsnGluGlyVal
354045
SerThrHisLeuTrpIleValAsnArgAlaIleAspIleMetSerArg
505560
AsnThrAlaIleValLysProAsnGluThrAlaLeuLeuAsnGluTrp
65707580
ArgThrAspLeuGluAsnGlyIleTyrSerAlaAspTyrGluAsnPro
859095
TyrTyrAspAsnSerThrTyrAlaSerHisPheTyrAspProAspThr
100105110
GlyLysThrTyrIleProPheAlaLysGlnAlaLysGluThrGlyThr
115120125
LysTyrPheLysLeuAlaGlyGluAlaTyrLysAsnGlnAspMetLys
130135140
GlnAlaPhePheTyrLeuGlyLeuSerLeuHisTyrLeuGlyAspVal
145150155160
AsnGlnProMetHisAlaAlaAsnPheThrAsnLeuSerTyrProMet
165170175
GlyPheHisSerLysTyrGluAsnPheValAspThrIleLysAsnAsn
180185190
TyrIleValSerAspSerSerGlyTyrTrpAsnTrpLysGlyAlaAsn
195200205
ProGluAspTrpIleGlnGlyAlaAlaValAlaAlaLysGlnAspTyr
210215220
ProGlyIleValAsnAspThrThrLysAspTrpPheValLysAlaAla
225230235240
ValSerGlnAlaTyrAlaAspLysTrpArgAlaGluValThrProVal
245250255
ThrGlyLysArgLeuMetGluAlaGlnArgValThrAlaGlyTyrIle
260265270
HisLeuTrpPheAspThrTyrValAsnHis
275280
<210>125
<211>1710
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>125
atggctgacaacgagttgcccctggcgcggcccagggagacgccgccgtgccgccccggc60
acgttcgagcttgggctcgccctggctggcgcggtctctggcggcgcctacgccgcggga120
gtcctggatttcttctacgaagccctcgagcattggtacgaggccagggaggcgggagcg180
ccggtgcccaaccacgacgtgctcctccggatcatctcgggtgcgtcggcgggcagtatc240
aatggcgtgctttcgggcatcgcgctgccgtaccgttttccccacgtgcacagcgggccc300
gcgcccgagggtgccacgggcaaccccttctacgacgcctgggtgaagcgcatcgacgtg360
cgcgaactgttgggcaacgaagacctggccgatcccacgcagccggtggcatccctgctc420
gacgccacctgcctggatacgatcgcgaaggacatgctcggcttctcggcggcgccggcc480
acccggccgtacgtcgctaatccgctgaaatgcgtgttcacggtgaccaacctgcgtggc540
gttccttacgtcgtgcagttcaagggaaacccggagatccccggccacggcatgatggcc600
cacgccgactggctgcgcttcgccgtcgacaccgggcagggcgaccgggatggggaatgg660
atgttccccgatgaacggctcgtcagcgggccgagccatgcgcggactccggcctggcaa720
ggtttcatggaggcggcgctcgcttcgtcggcgttcccggccggcttgcgtttccgcgaa780
gtcgcccggccctggagcgattacgaccagcgcgtcgtggtggtgcccaaccaggcgggg840
gccgcggtcccggtcccgctcccgccggcctgggcggagggcgagggcagcgatggggac900
taccggttcgtcgcggtggatggtggcgcgatggacaacgagccgttcgaacttgcccgt960
accgagctggcgggcacgctcggccgcaatccacgcgaagggaaccgggtcaaccgcatc1020
gtgatcatgctcgatccgtttcccgaggccgaggcgccgggacccgcggaagccgcgagc1080
acgaatctcgtcgaggcgatggcctcgctgtttggtgcgtggaaacagcaggcacggttc1140
aagccggaggaagtggcgctcgccctggattcgaccgtgtacagccgcttcatgatcgcg1200
cccagccggccgtgcatggagggcgggccacggtggatcggtgggcgagcgctcgccgcg1260
ggtgcgctgggtggcttctcggggttcctggcggaggcatacaggcaccacgatttcctc1320
ctgggacgccgcaactgccaacgcttcctcgccgagcgcctgttgatccccgcggacaat1380
ccgatcttcgccggctggatcgacgatccctccctgcagggctacatccgcgagatcgat1440
ggcgtgcgttacgccccggtcatcccgctggtgggcggctgccagggcttgcgcgagccg1500
ttgcccacgtggccgcgtggtgcattcgacctggactcgctcatgccgctggtcgagcgc1560
cgcatgcagcgcctgtattcggcggctaccgcgacgctcggtggccgcttcgccacctgg1620
ctggcgtggcgcttctacctgcgccgcaagctcctcgacctggtctcaagccgtatccgt1680
agcgcattgagggacttcggcctttggtga1710
<210>126
<211>569
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>126
MetAlaAspAsnGluLeuProLeuAlaArgProArgGluThrProPro
151015
CysArgProGlyThrPheGluLeuGlyLeuAlaLeuAlaGlyAlaVal
202530
SerGlyGlyAlaTyrAlaAlaGlyValLeuAspPhePheTyrGluAla
354045
LeuGluHisTrpTyrGluAlaArgGluAlaGlyAlaProValProAsn
505560
HisAspValLeuLeuArgIleIleSerGlyAlaSerAlaGlySerIle
65707580
AsnGlyValLeuSerGlyIleAlaLeuProTyrArgPheProHisVal
859095
HisSerGlyProAlaProGluGlyAlaThrGlyAsnProPheTyrAsp
100105110
AlaTrpValLysArgIleAspValArgGluLeuLeuGlyAsnGluAsp
115120125
LeuAlaAspProThrGlnProValAlaSerLeuLeuAspAlaThrCys
130135140
LeuAspThrIleAlaLysAspMetLeuGlyPheSerAlaAlaProAla
145150155160
ThrArgProTyrValAlaAsnProLeuLysCysValPheThrValThr
165170175
AsnLeuArgGlyValProTyrValValGlnPheLysGlyAsnProGlu
180185190
IleProGlyHisGlyMetMetAlaHisAlaAspTrpLeuArgPheAla
195200205
ValAspThrGlyGlnGlyAspArgAspGlyGluTrpMetPheProAsp
210215220
GluArgLeuValSerGlyProSerHisAlaArgThrProAlaTrpGln
225230235240
GlyPheMetGluAlaAlaLeuAlaSerSerAlaPheProAlaGlyLeu
245250255
ArgPheArgGluValAlaArgProTrpSerAspTyrAspGlnArgVal
260265270
ValValValProAsnGlnAlaGlyAlaAlaValProValProLeuPro
275280285
ProAlaTrpAlaGluGlyGluGlySerAspGlyAspTyrArgPheVal
290295300
AlaValAspGlyGlyAlaMetAspAsnGluProPheGluLeuAlaArg
305310315320
ThrGluLeuAlaGlyThrLeuGlyArgAsnProArgGluGlyAsnArg
325330335
ValAsnArgIleValIleMetLeuAspProPheProGluAlaGluAla
340345350
ProGlyProAlaGluAlaAlaSerThrAsnLeuValGluAlaMetAla
355360365
SerLeuPheGlyAlaTrpLysGlnGlnAlaArgPheLysProGluGlu
370375380
ValAlaLeuAlaLeuAspSerThrValTyrSerArgPheMetIleAla
385390395400
ProSerArgProCysMetGluGlyGlyProArgTrpIleGlyGlyArg
405410415
AlaLeuAlaAlaGlyAlaLeuGlyGlyPheSerGlyPheLeuAlaGlu
420425430
AlaTyrArgHisHisAspPheLeuLeuGlyArgArgAsnCysGlnArg
435440445
PheLeuAlaGluArgLeuLeuIleProAlaAspAsnProIlePheAla
450455460
GlyTrpIleAspAspProSerLeuGlnGlyTyrIleArgGluIleAsp
465470475480
GlyValArgTyrAlaProValIleProLeuValGlyGlyCysGlnGly
485490495
LeuArgGluProLeuProThrTrpProArgGlyAlaPheAspLeuAsp
500505510
SerLeuMetProLeuValGluArgArgMetGlnArgLeuTyrSerAla
515520525
AlaThrAlaThrLeuGlyGlyArgPheAlaThrTrpLeuAlaTrpArg
530535540
PheTyrLeuArgArgLysLeuLeuAspLeuValSerSerArgIleArg
545550555560
SerAlaLeuArgAspPheGlyLeuTrp
565
<210>127
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>127
atgacaacccaatttagaaacttgatctttgaaggtggtggtgtaaaaggagttgcttac60
attggcgccatgcagattcttgaaaatcgtggcgtgttgcaagatattcaccgagtcgga120
ggttgcagtgccggtgcgattaacgcgctgatttttgcgctgggttacacggttcgtgag180
caaaaagagatcttacaagccaccgattttaaccagtttatggataactcttggggggtt240
attcgtgatattcgcaggcttgctcgagactttggctggaataagggtggcttctttaat300
agctggataggtgatttgattcatcgtcgtttggggaatcgccgagcgacgttcaaggat360
ctgcaaaaggccaagcttcctgatctttatgtcatcggtactaatctgtctacagggttt420
gcagaggttttttctgccgaaagacaccccgatatggagctagcgacageggtgcgcatc480
tccatgtcgataccgctgttctttgcggccgtgcgccacggtgatcgacaagatgtgtat540
gtcgatggaggtgttcaacttaactatccgattaaactgtttgatcgggagcgttatatt600
gatctggccaaagatcccggtgccgttcggcgaacgggttattacaataaagaaaacgct660
cgctttcagcttgaacggccgggccatagcccctatgtttacaatcgccagaccttgggt720
ttgcgactggatagtcgagaggagatagggctttttcgttatgacgaacccctcaagggc780
aaaccgattaagtccttcactgactacgctcgacaacttttcggtgcgttgatgaatgcg840
caggaaaacattcatctacatggcgatgattggcagcgcacggtctatatcgacacactg900
gatgtgagtacgacggacttcaatctttctgatgcaaccaagcaagcactgattgagcaa960
ggaattaacggcaccgaaaattatttcgagtggtttgataatccgttagagaagcctgtg1020
aatagagtggagtcatag1038
<210>128
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(8)...(195)
<223>Patatin-样磷脂酶
<400>128
MetThrThrGlnPheArgAsnLeuIlePheGluGlyGlyGlyValLys
151015
GlyValAlaTyrIleGlyAlaMetGlnIleLeuGluAsnArgGlyVal
202530
LeuGlnAspIleHisArgValGlyGlyCysSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheAlaLeuGlyTyrThrValArgGluGlnLysGluIle
505560
LeuGlnAlaThrAspPheAsnGlnPheMetAspAsnSerTrpGlyVal
65707580
IleArgAspIleArgArgLeuAlaArgAspPheGlyTrpAsnLysGly
859095
GlyPhePheAsnSerTrpIleGlyAspLeuIleHisArgArgLeuGly
100105110
AsnArgArgAlaThrPheLysAspLeuGlnLysAlaLysLeuProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetGluLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaValArgHisGlyAspArg
165170175
GlnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProIleLys
180185190
LeuPheAspArgGluArgTyrIleAspLeuAlaLysAspProGlyAla
195200205
ValArgArgThrGlyTyrTyrAsnLysGluAsnAlaArgPheGlnLeu
210215220
GluArgProGlyHisSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerArgGluGluIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysProIleLysSerPheThrAspTyrAlaArgGln
260265270
LeuPheGlyAlaLeuMetAsnAlaGlnGluAsnIleHisLeuHisGly
275280285
AspAspTrpGlnArgThrValTyrIleAspThrLeuAspValSerThr
290295300
ThrAspPheAsnLeuSerAspAlaThrLysGlnAlaLeuIleGluGln
305310315320
GlyIleAsnGlyThrGluAsnTyrPheGluTrpPheAspAsnProLeu
325330335
GluLysProValAsnArgValGluSer
340345
<210>129
<211>1434
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>129
atgaaaaagaaaatatgtacattggctcttgtatcagcaataacttctggagttgtgacg60
attccaacggtagcatctgcttgcagaataggcgaagaagtaatgaaacaggagaaacag120
gataatcaagagcacaaacgtgtgaaaagatggtctgcggagcatccgcatcattctaat180
gaaagcacgcacttatggattgctcgaaatgcgattcaaattatgagtcgtaatcaagat240
aacacggtccaaaacaatgaattacagttcttaaatattcctgaatataaggagttattt300
gaaagaggactttatgatgctgattaccttgatgaatttaacgatggcggtacaggtaca360
atcggcattgatgggctaattaaaggagggtggaaatctcatttttatgatccagatacg420
aaaaagaattataaaggagaagaagctccaacagcccttacgcaaggagataaatatttt480
aaattagcaggagactattttaagaaagaggatttgaaacaagctttctactatttaggt540
gttgcgactcactatttcacagatgctactcagccaatgcatgctgctaattttacagct600
gtcgacatgagtgcgataaagtttcatagcgcttttgaaaattatgtaacgacaattcag660
acgccatttgaagtgaaggatgataaaggaacctataatttggttgattctaatgatccg720
aagcagtggatacatgaaacagcgaaactcgcaaaagcggaaattatgaatattactaat780
gatactattaaatctcaatataataaagggaacaatgatctttggcaacaaggagttatg840
ccagctgttcagagaagtctggaaacagcacaaaggaacacggcaggatttattcattta900
tggtttaaaacatatgttggcaaaactgctgctgaagatattgaaaatacacaagtaaaa960
gattctaacggagaagcaatacaagaaaataaaaaatactacgttgtaccgagtgagttt1020
ttaaatagaggtttgacctttgaggtatatgctgcaaatgactacgcactattagctaat1080
cacgtagatgataataaagttcatggtacacctgttcagtttgtttttgataaagacaat1140
aacggaattcttcatcggggagaaagtgcactgatgaaaatgacgcaatctaactatgct1200
gattatgtatttctcaattactctaatatgacaaattgggtacatcttgcgaaacgaaaa1260
acaaatacttcacagtttaaagtgtatccaaatccggataactcatctgaatatttctta1320
tatacagatggatacccggtaaattatcaagaaaatggtaacggaaagagctggattgtg1380
ttaggaaagaaaacggataaaccaaaagcgtggaaatttatacaggcggaataa1434
<210>130
<211>477
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(27)
<220>
<221>结构域
<222>(1)...(307)
<223>锌依赖型磷脂酶C
<400>130
MetLysLysLysIleCysThrLeuAlaLeuValSerAlaIleThrSer
151015
GlyValValThrIleProThrValAlaSerAlaCysArgIleGlyGlu
202530
GluValMetLysGlnGluLysGlnAspAsnGlnGluHisLysArgVal
354045
LysArgTrpSerAlaGluHisProHisHisSerAsnGluSerThrHis
505560
LeuTrpIleAlaArgAsnAlaIleGlnIleMetSerArgAsnGlnAsp
65707580
AsnThrValGlnAsnAsnGluLeuGlnPheLeuAsnIleProGluTyr
859095
LysGluLeuPheGluArgGlyLeuTyrAspAlaAspTyrLeuAspGlu
100105110
PheAsnAspGlyGlyThrGlyThrIleGlyIleAspGlyLeuIleLys
115120125
GlyGlyTrpLysSerHisPheTyrAspProAspThrLysLysAsnTyr
130135140
LysGlyGluGluAlaProThrAlaLeuThrGlnGlyAspLysTyrPhe
145150155160
LysLeuAlaGlyAspTyrPheLysLysGluAspLeuLysGlnAlaPhe
165170175
TyrTyrLeuGlyValAlaThrHisTyrPheThrAspAlaThrGlnPro
180185190
MetHisAlaAlaAsnPheThrAlaValAspMetSerAlaIleLysPhe
195200205
HisSerAlaPheGluAsnTyrValThrThrIleGlnThrProPheGlu
210215220
ValLysAspAspLysGlyThrTyrAsnLeuValAspSerAsnAspPro
225230235240
LysGlnTrpIleHisGluThrAlaLysLeuAlaLysAlaGluIleMet
245250255
AsnIleThrAsnAspThrIleLysSerGlnTyrAsnLysGlyAsnAsn
260265270
AspLeuTrpGlnGlnGlyValMetProAlaValGlnArgSerLeuGlu
275280285
ThrAlaGlnArgAsnThrAlaGlyPheIleHisLeuTrpPheLysThr
290295300
TyrValGlyLysThrAlaAlaGluAspIleGluAsnThrGlnValLys
305310315320
AspSerAsnGlyGluAlaIleGlnGluAsnLysLysTyrTyrValVal
325330335
ProSerGluPheLeuAsnArgGlyLeuThrPheGluValTyrAlaAla
340345350
AsnAspTyrAlaLeuLeuAlaAsnHisValAspAspAsnLysValHis
355360365
GlyThrProValGlnPheValPheAspLysAspAsnAsnGlyIleLeu
370375380
HisArgGlyGluSerAlaLeuMetLysMetThrGlnSerAsnTyrAla
385390395400
AspTyrValPheLeuAsnTyrSerAsnMetThrAsnTrpValHisLeu
405410415
AlaLysArgLysThrAsnThrSerGlnPheLysValTyrProAsnPro
420425430
AspAsnSerSerGluTyrPheLeuTyrThrAspGlyTyrProValAsn
435440445
TyrGlnGluAsnGlyAsnGlyLysSerTrpIleValLeuGlyLysLys
450455460
ThrAspLysProLysAlaTrpLysPheIleGlnAlaGlu
465470475
<210>131
<211>927
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>131
atgccgagcccaaaaagtaatattgatgttatcagcatcgatggtggtggaatacgtgga60
gtattctccgttacattattggatagattatgtaagacctatcccaatcttcttaagaaa120
acatatctgtttgctggaacatctacaggtgggatcattgccttaggattagcaaacaac180
atgacacctcttgagataagagccttgtacgagaagaacggttcaaagatatttcataaa240
tctgtgtgggaaggcgttaaagatttaggtggaaccataggtgcaaagtatagtaacaag300
aatcttaaatccgttttgaaaaaatactttggttcattgaagttaaaagatttatctaaa360
aaagtactaatacctacttttgatttacactcagacaaagaagaaggctatccaatgtgg420
aagcctaagttctatcacaactttgatggagaaacggaagatatagaaaagctcgttctt480
gatgtagctatgatgacatcagcagcgcccactttcttccctacatacaacgggcatatt540
gatggcggtgttgtagccaacaatccatcgatggccgcattagcccagattatggatgaa600
agatatggcatcaatgcctctgaagttcatattcttaatataggaacaggttttaaccct660
gcttatgttaagatgaatccaggggaagagaaagactggggtgaacttcagtggataaaa720
cctttaatcaatcttctagtcgatggctctatggatgtttctacttattattgtaagcaa780
gtcttacgtgataatttttatagggttaacatgaaattacctaagaacgtagaaatggat840
gatcctaattctattccttatttaattgaacttgcaaactcagttgatctaactgaatgt900
atcaactggcttaattcgaggtggtaa927
<210>132
<211>308
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(11)...(194)
<223>Patatin-样磷脂酶
<400>132
MetProSerProLysSerAsnIleAspValIleSerIleAspGlyGly
151015
GlyIleArgGlyValPheSerValThrLeuLeuAspArgLeuCysLys
202530
ThrTyrProAsnLeuLeuLysLysThrTyrLeuPheAlaGlyThrSer
354045
ThrGlyGlyIleIleAlaLeuGlyLeuAlaAsnAsnMetThrProLeu
505560
GluIleArgAlaLeuTyrGluLysAsnGlySerLysIlePheHisLys
65707580
SerValTrpGluGlyValLysAspLeuGlyGlyThrIleGlyAlaLys
859095
TyrSerAsnLysAsnLeuLysSerValLeuLysLysTyrPheGlySer
100105110
LeuLysLeuLysAspLeuSerLysLysValLeuIleProThrPheAsp
115120125
LeuHisSerAspLysGluGluGlyTyrProMetTrpLysProLysPhe
130135140
TyrHisAsnPheAspGlyGluThrGluAspIleGluLysLeuValLeu
145150155160
AspValAlaMetMetThrSerAlaAlaProThrPhePheProThrTyr
165170175
AsnGlyHisIleAspGlyGlyValValAlaAsnAsnProSerMetAla
180185190
AlaLeuAlaGlnIleMetAspGluArgTyrGlyIleAsnAlaSerGlu
195200205
ValHisIleLeuAsnIleGlyThrGlyPheAsnProAlaTyrValLys
210215220
MetAsnProGlyGluGluLysAspTrpGlyGluLeuGlnTrpIleLys
225230235240
ProLeuIleAsnLeuLeuValAspGlySerMetAspValSerThrTyr
245250255
TyrCysLysGlnValLeuArgAspAsnPheTyrArgValAsnMetLys
260265270
LeuProLysAsnValGluMetAspAspProAsnSerIleProTyrLeu
275280285
IleGluLeuAlaAsnSerValAspLeuThrGluCysIleAsnTrpLeu
290295300
AsnSerArgTrp
305
<210>133
<211>1053
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>133
atgactacacagtttcgcaatctcgttttcgaaggaggcggcgtcaggggtatagcctat60
gtgggggcaatgcaggttcttgagcaacggggaatgctcaggaacatagaccgtgcaggc120
ggcacgagcgccggtgcgattaacgcactcatcttttcactcggctatgacataaggtct180
cagctcgaaatactccattctaccgactttagaaattttatggatagttccttcgggata240
atcagggatatccgccgtcttgcacgggatttcggatggtacaagggtgatttcttcaca300
ggctggattggcaagcttataaaagacaggctcggtagcgagaaagcaactttccgtgac360
cttgcagaatcagattgtcccgatctgtatgtgatcggcaccaacctctcaaccggcttc420
gccgaggtattctcagccgagagacatcccgatatgcctcttgcaacggctgtccgtatc480
agcatgtcgatccctctattttttgctgcaatgcgttatggtccgagggaagacgtattt540
gtagacggtggggtagtactcaactatcctgtaaagctgtttgacaggttgaaatacatt600
gaaagcggggagacggaggaagccgcacgctataccgaatattataacagggagaacgca660
cggttccttctcaaaagtcccgaccgcagtccctatgtttataaccgtcagacactgggt720
ttgcgtctcgatacgcgtgaggagattgcacatttccgttatgacgagcccctggagggt780
aaaaaaatcatacgctttacggattatgcacgggcactcgtttcaaccttgcttcaggtt840
caggaaaaccagcatctgcacagtgacgactggcagcgtacagtttacattgacacactg900
gatgtgaagacgactgattttgatatcacggataagcagaaggacatcctgataaagcag960
ggaattaacggagcggagaactatttgggttggtttgaagacccgtatgaaaaacccgcc1020
aaccgcctgcccggtggcagcaagtctgactga1053
<210>134
<211>350
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(8)...(195)
<223>Patatin-样磷脂酶
<400>134
MetThrThrGlnPheArgAsnLeuValPheGluGlyGlyGlyValArg
151015
GlyIleAlaTyrValGlyAlaMetGlnValLeuGluGlnArgGlyMet
202530
LeuArgAsnIleAspArgAlaGlyGlyThrSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheSerLeuGlyTyrAspIleArgSerGlnLeuGluIle
505560
LeuHisSerThrAspPheArgAsnPheMetAspSerSerPheGlyIle
65707580
IleArgAspIleArgArgLeuAlaArgAspPheGlyTrpTyrLysGly
859095
AspPhePheThrGlyTrpIleGlyLysLeuIleLysAspArgLeuGly
100105110
SerGluLysAlaThrPheArgAspLeuAla6luSerAspCysProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetProLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaMetArgTyrGlyProArg
165170175
GluAspValPheValAspGlyGlyValValLeuAsnTyrProValLys
180185190
LeuPheAspArgLeuLysTyrIleGluSerGlyGluThrGluGluAla
195200205
AlaArgTyrThrGluTyrTyrAsnArgGluAsnAlaArgPheLeuLeu
210215220
LysSerProAspArgSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspThrArgGluGluIleAlaHisPheArgTyrAspGlu
245250255
ProLeuGluGlyLysLysIleIleArgPheThrAspTyrAlaArgAla
260265270
LeuValSerThrLeuLeuGlnValGlnGluAsnGlnHisLeuHisSer
275280285
AspAspTrpGlnArgThrValTyrIleAspThrLeuAspValLysThr
290295300
ThrAspPheAspIleThrAspLysGlnLysAspIleLeuIleLysGln
305310315320
GlyIleAsnGlyAlaGluAsnTyrLeuGlyTrpPheGluAspProTyr
325330335
GluLysProAlaAsnArgLeuProGlyGlySerLysSerAsp
340345350
<210>135
<211>1710
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>135
atggctgacaacgagttacccctggcccgccccagggaaacccctccgtgccgtcccggc60
acgttcgagctggggctggcgctcgccggcgcggtatcgggcggcgcctacgccgcgggc120
gtgctggatttcttctacgaggcgctggagcactggtacgacgcgaaggcgaacggtgcg180
cccgtgccgagccacgacgtgctgctacggatcatttcaggcgcctccgcgggcagcatc240
aacggcgtgctttccggcatcgcgttgccgtaccgcttcccgcacgtgcacagcggaccc300
gcgccccggcaggcgacgggaaaccccttctacgacgcgtgggtgaggcgcatcgatgta360
cgcgagctgctgggcgaggccgacctggctaacccggcgcggccgatcacctcgctgctt420
gattccagcagcctggatacgatcgcgaaggacatgctcggctacgccggcgtgccggcc480
gcgcgcccttacatcgcgaacccgctgaaatgcgtgttcaccgtgacgaatcttcgcggc540
gtgccctacgtggtgcagttcaagggcaaccccgagattcccggccacggcatgatggcg600
cacgccgattggctgcgcttcgccatcgactcggggcagggcgaacgcgatggcgcatgg660
atgttccccgacgagcgcatcgtcagcggcccgagccatgcgcgcagcccggcctggcat720
gcgctcatggaggcggccctggcgtcgtccgcgttcccggccggcctgcgcttccgcgag780
gtggcccggccgtggagcgattacgaccagcgcgtggttgtcgtgcccggtcaggatggc840
atggcggtgccggtaccgctgccaccagcgtggggcgaaggggagggtgggaagggcgac900
taccgctttgtcgccgtggatggtggcgccatggataacgaaccgttcgagctggcccgc960
acggagcttgcgggcacgatgggccgcaacccgcgtgaaggtacccgggtgaatcgtatc1020
gtgattatgctcgatccgtttccggaggccgaggcgcccggcccctcggaggcggcgtcg1080
acgaacctggtggaagcgatggcgtcgctgttcggtgcatggaagcagcaggcgcggttc1140
aagcccgaggaagtggcgctggccctcgatagcacggtgtacagccgcttcatgatcgcg1200
cctagccgcccctgcacggatggcggcccgcggtggatcggcggccgcgcgctcaccgcg1260
ggcgcactgggtggcttctcggggttcctggccgaggattaccgccaccacgatttcctc1320
ctgggccggcgtaactgccagcggtttctcgccgagcggctgctcgttcccgcaacgaac1380
ccgatcttcgctggatggatcgacgatcccgcactgcagggctacgtgcgtgagatcgat1440
ggtgagcgctttgcccccgtgattcccctagtgggcggctgccaggccctgcaagagccc1500
ttgccggcgtggccgcgtggggcgttcgacatggatgcgctcatgcccctggtcgagaag1560
cgcatgcaggccctgtacacggcggccaccacgaagctgggtggccgcttcgccatgtgg1620
ctcgcgtggcgcttcttcatccgccgcaaactcctcgacatcgtctcaagccgtatccgc1680
aatgcgctgaaagacttcggcctttggtga1710
<210>136
<211>569
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>136
MetAlaAspAsnGluLeuProLeuAlaArgProArgGluThrProPro
151015
CysArgProGlyThrPheGluLeuGlyLeuAlaLeuAlaGlyAlaVal
202530
SerGlyGlyAlaTyrAlaAlaGlyValLeuAspPhePheTyrGluAla
354045
LeuGluHisTrpTyrAspAlaLysAlaAsnGlyAlaProValProSer
505560
HisAspValLeuLeuArgIleIleSerGlyAlaSerAlaGlySerIle
65707580
AsnGlyValLeuSerGlyIleAlaLeuProTyrArgPheProHisVal
859095
HisSerGlyProAlaProArgGlnAlaThrGlyAsnProPheTyrAsp
100105110
AlaTrpValArgArgIleAspValArgGluLeuLeuGlyGluAlaAsp
115120125
LeuAlaAsnProAlaArgProIleThrSerLeuLeuAspSerSerSer
130135140
LeuAspThrIleAlaLysAspMetLeuGlyTyrAlaGlyValProAla
145150155160
AlaArgProTyrIleAlaAsnProLeuLysCysValPheThrValThr
165170175
AsnLeuArgGlyValProTyrValValGlnPheLysGlyAsnProGlu
180185190
IleProGlyHisGlyMetMetAlaHisAlaAspTrpLeuArgPheAla
195200205
IleAspSerGlyGlnGlyGluArgAspGlyAlaTrpMetPheProAsp
210215220
GluArgIleValSerGlyProSerHisAlaArgSerProAlaTrpHis
225230235240
AlaLeuMetGluAlaAlaLeuAlaSerSerAlaPheProAlaGlyLeu
245250255
ArgPheArgGluValAlaArgProTrpSerAspTyrAspGlnArgVal
260265270
ValValValProGlyGlnAspGlyMetAlaValProValProLeuPro
275280285
ProAlaTrpGlyGluGlyGluGlyGlyLysGlyAspTyrArgPheVal
290295300
AlaValAspGlyGlyAlaMetAspAsnGluProPheGluLeuAlaArg
305310315320
ThrGluLeuAlaGlyThrMetGlyArgAsnProArgGluGlyThrArg
325330335
ValAsnArgIleValIleMetLeuAspProPheProGluAlaGluAla
340345350
ProGlyProSerGluAlaAlaSerThrAsnLeuValGluAlaMetAla
355360365
SerLeuPheGlyAlaTrpLysGlnGlnAlaArgPheLysProGluGlu
370375380
ValAlaLeuAlaLeuAspSerThrValTyrSerArgPheMetIleAla
385390395400
ProSerArgProCysThrAspGlyGlyProArgTrpIleGlyGlyArg
405410415
AlaLeuThrAlaGlyAlaLeuGlyGlyPheSerGlyPheLeuAlaGlu
420425430
AspTyrArgHisHisAspPheLeuLeuGlyArgArgAsnCysGlnArg
435440445
PheLeuAlaGluArgLeuLeuValProAlaThrAsnProIlePheAla
450455460
GlyTrpIleAspAspProAlaLeuGlnGlyTyrValArgGluIleAsp
465470475480
GlyGluArgPheAlaProValIleProLeuValGlyGlyCysGlnAla
485490495
LeuGlnGluProLeuProAlaTrpProArgGlyAlaPheAspMetAsp
500505510
AlaLeuMetProLeuValGluLysArgMetGlnAlaLeuTyrThrAla
515520525
AlaThrThrLysLeuGlyGlyArgPheAlaMetTrpLeuAlaTrpArg
530535540
PhePheIleArgArgLysLeuLeuAspIleValSerSerArgIleArg
545550555560
AsnAlaLeuLysAspPheGlyLeuTrp
565
<210>137
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>137
atgacaacacaatttagaaacttgatatttgaaggcggcggtgtaaaaggtgttgcttac60
attggcgccatgcagattcttgaaaatcgtggcgtgttgcaagatattcgccgagtcgga120
gggtgcagtgcgggtgcgattaacgcgctgatttttgcgctaggttacacggtccgtgaa180
caaaaagagatcttacaagccaccgattttaaccagtttatggataactcttggggggtt240
attcgtgatattcgcaggcttgctcgagactttggctggaataagggtgatttctttagt300
agctggataggtgatttgattcatcgtcgtttggggaatcgccgagcgacgttcaaagat360
ctgcaaaaggccaagcttcctgatctttatgtcatcggtactaatctgtctacagggttt420
gcagaggtgttttctgccgaaagacaccccgatatggagctggcgacagcggtgcgtatc480
tccatgtcgataccgctgttctttgcggccgtgcgtcacggtgatcgacaagatgtgtat540
gtcgatgggggtgttcaacttaactatccgattaaactgtttgatcgggagcgttacatt600
gatttggccaaagatcccggtgccgttcggcgaacgggttattacaacaaagaaaacgct660
cgctttcagcttgatcggccgggccatagcccctatgtttacaatcgccagaccttgggt720
ttgcgactggatagtcgcgaggagatagggctctttcgttatgacgaacccctcaagggc780
aaacccattaagtccttcactgactacgctcgacaacttttcggtgcgttgatgaatgca840
caggaaaagattcatctacatggcgatgattggcaacgcacgatctatatcgatacattg900
gatgtgggtacgacggacttcaatctttctgatgcaactaagcaagcactgattgagcaa960
ggaattaacggcaccgaaaattatttcgagtggtttgataatccgttagagaagcctgtg1020
aatagagtggagtcatag1038
<210>138
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(8)...(195)
<223>Patatin-样磷脂酶
<400>138
MetThrThrGlnPheArgAsnLeuIlePheGluGlyGlyGlyValLys
151015
GlyValAlaTyrIleGlyAlaMetGlnIleLeuGluAsnArgGlyVal
202530
LeuGlnAspIleArgArgValGlyGlyCysSerAlaGlyAlaIleAsn
354045
AlaLeuIlePheAlaLeuGlyTyrThrValArgGluGlnLysGluIle
505560
LeuGlnAlaThrAspPheAsnGlnPheMetAspAsnSerTrpGlyVal
65707580
IleArgAspIleArgArgLeuAlaArgAspPheGlyTrpAsnLysGly
859095
AspPhePheSerSerTrpIleGlyAspLeuIleHisArgArgLeuGly
100105110
AsnArgArgAlaThrPheLysAspLeuGlnLysAlaLysLeuProAsp
115120125
LeuTyrValIleGlyThrAsnLeuSerThrGlyPheAlaGluValPhe
130135140
SerAlaGluArgHisProAspMetGluLeuAlaThrAlaValArgIle
145150155160
SerMetSerIleProLeuPhePheAlaAlaValArgHisGlyAspArg
165170175
GlnAspValTyrValAspGlyGlyValGlnLeuAsnTyrProIleLys
180185190
LeuPheAspArgGluArgTyrIleAspLeuAlaLysAspProGlyAla
195200205
ValArgArgThrGlyTyrTyrAsnLysGluAsnAlaArgPheGlnLeu
210215220
AspArgProGlyHisSerProTyrValTyrAsnArgGlnThrLeuGly
225230235240
LeuArgLeuAspSerArgGluGluIleGlyLeuPheArgTyrAspGlu
245250255
ProLeuLysGlyLysProIleLysSerPheThrAspTyrAlaArgGln
260265270
LeuPheGlyAlaLeuMetAsnAlaGlnGluLysIleHisLeuHisGly
275280285
AspAspTrpGlnArgThrIleTyrIleAspThrLeuAspValGlyThr
290295300
ThrAspPheAsnLeuSerAspAlaThrLysGlnAlaLeuIleGluGln
305310315320
GlyIleAsnGlyThrGluAsnTyrPheGluTrpPheAspAsnProLeu
325330335
GluLysProValAsnArgValGluSer
340345
<210>139
<211>1692
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>139
atgaaaataaagccgctcacgttttcttttggattagcagtcactagctcggtgcaagcc60
ttcactcaatttggcggacaaggcgttatgccgatgggtcacgaatggttaacgcgcacc120
gctgctctcgaggtacttaatgcagagcatatcatcgaagcggatccgaatgacccaaga180
tatacttggcaggacggacttgctaaaaaccttgaacttaataccgcccaatctgaaatc240
acgcgcttacaatctcatttaaataataacccgctctatgagccgagatacgacggtata300
aactcagccatcgttggtgaacgctgggtcgatattgcagggtttaacgtcacaacagcc360
agcgcagacccgactggccctaattgctttagcgcagtttcacaagagcccgcagatatt420
cagcaagaccactttatgcgccgctatgatgatattggaggtcaaggtggagttgatgct480
gcttatcgcgcacagcaacgatttgtgcaacactttgtggatgcggccatggccgaaaaa540
aaacgactaaaagtatgggacggtggtggccattctgcgttagcagaggtagatcataat600
tactttttatttggtcgtgcggttcacctatttcaagactcatttagtccagaacacacg660
gtacggctccctcaagataactacgaaaaagtttggcaggttaaggcatatctttgctca720
gagggggctgagcaacattcacacgataccaaagacgtgctcaactttgccagtggcgat780
gttatttggcaacctcaaacccgactagaagcaggctggcaatcttaccagatcagcagt840
atgaagcccgttgctattgtggcccttgaagccagtaaagatctttgggctgcgtttatt900
cgcaccatggcgaccccaaaagcacagagacgtaacgtggcaacgcaagaagcccaacaa960
cttgtacaaaactggttgtcttttgatgaggcccagatgctgacttggtatcaagatgag1020
aataagcgtgaccatacttatgtgcttgcccccaatgaaacgggaaaaggaaaatctctg1080
gaagcctgtatgacagagctaaaggtaggcactagcagtcaagcagaacgggttgcgcaa1140
ctggaagccgagcgtaatcaatgcctatacaacattgaggcggaacctggctttgcagac1200
ttaaacgatccacacctcgatattccatataactggcgctggaagtctctgacttggcaa1260
acgcctcctagtggctggacatacccacaactaaatgcagataccggcgagcaagtcgcc1320
attaaatcgccgataaataatcagtatttatctgcacaaactctaagtaacgacaccccg1380
atcactctgagtcaagcacatccaatttccttgatccaagtgacgaatgcacagggccag1440
cactattttaggagcgctcaagccccttcactatttctgggttatagcaacaaaattgca1500
ggctacctcaagcttgtagattcacccaagcaagccctatatacgttgatttatcaaggt1560
ggtctttggaatatccaaaatgaattttggcaacagtatatctggttaaatcaagacaaa1620
gagcggccggaattaaatcgccatggtgagcctagccaattaaacgctcagtggatggtc1680
gaacacttataa1692
<210>140
<211>563
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(20)
<400>140
MetLysIleLysProLeuThrPheSerPheGlyLeuAlaValThrSer
151015
SerValGlnAlaPheThrGlnPheGlyGlyGlnGlyValMetProMet
202530
GlyHisGluTrpLeuThrArgThrAlaAlaLeuGluValLeuAsnAla
354045
GluHisIleIleGluAlaAspProAsnAspProArgTyrThrTrpGln
505560
AspGlyLeuAlaLysAsnLeuGluLeuAsnThrAlaGlnSerGluIle
65707580
ThrArgLeuGlnSerHisLeuAsnAsnAsnProLeuTyrGluProArg
859095
TyrAspGlyIleAsnSerAlaIleValGlyGluArgTrpValAspIle
100105110
AlaGlyPheAsnValThrThrAlaSerAlaAspProThrGlyProAsn
115120125
CysPheSerAlaValSerGlnGluProAlaAspIleGlnGlnAspHis
130135140
PheMetArgArgTyrAspAspIleGlyGlyGlnGlyGlyValAspAla
145150155160
AlaTyrArgAlaGlnGlnArgPheValGlnHisPheValAspAlaAla
165170175
MetAlaGluLysLysArgLeuLysValTrpAspGlyGlyGlyHisSer
180185190
AlaLeuAlaGluValAspHisAsnTyrPheLeuPheGlyArgAlaVal
195200205
HisLeuPheGlnAspSerPheSerProGluHisThrValArgLeuPro
210215220
GlnAspAsnTyrGluLysValTrpGlnValLysAlaTyrLeuCysSer
225230235240
GluGlyAlaGluGlnHisSerHisAspThrLysAspValLeuAsnPhe
245250255
AlaSerGlyAspValIleTrpGlnProGlnThrArgLeuGluAlaGly
260265270
TrpGlnSerTyrGlnIleSerSerMetLysProValAlaIleValAla
275280285
LeuGluAlaSerLysAspLeuTrpAlaAlaPheIleArgThrMetAla
290295300
ThrProLysAlaGlnArgArgAsnValAlaThrGlnGluAlaGlnGln
305310315320
LeuValGlnAsnTrpLeuSerPheAspGluAlaGlnMetLeuThrTrp
325330335
TyrGlnAspGluAsnLysArgAspHisThrTyrValLeuAlaProAsn
340345350
GluThrGlyLysGlyLysSerLeuGluAlaCysMetThrGluLeuLys
355360365
ValGlyThrSerSerGlnAlaGluArgValAlaGlnLeuGluAlaGlu
370375380
ArgAsnGlnCysLeuTyrAsnIleGluAlaGluProGlyPheAlaAsp
385390395400
LeuAsnAspProHisLeuAspIleProTyrAsnTrpArgTrpLysSer
405410415
LeuThrTrpGlnThrProProSerGlyTrpThrTyrProGlnLeuAsn
420425430
AlaAspThrGlyGluGlnValAlaIleLysSerProIleAsnAsnGln
435440445
TyrLeuSerAlaGlnThrLeuSerAsnAspThrProIleThrLeuSer
450455460
GlnAlaHisProIleSerLeuIleGlnValThrAsnAlaGlnGlyGln
465470475480
HisTyrPheArgSerAlaGlnAlaProSerLeuPheLeuGlyTyrSer
485490495
AsnLysIleAlaGlyTyrLeuLysLeuValAspSerProLysGlnAla
500505510
LeuTyrThrLeuIleTyrGlnGlyGlyLeuTrpAsnIleGlnAsnGlu
515520525
PheTrpGlnGlnTyrIleTrpLeuAsnGlnAspLysGluArgProGlu
530535540
LeuAsnArgHisGlyGluProSerGlnLeuAsnAlaGlnTrpMetVal
545550555560
GluHisLeu
<210>141
<211>471
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>141
atgcaaaaaaaaaccagtacatgtgaagacgagggcccgtaccgggcagtcttgtttgat60
ttggacggcaccctgttggatacggagcggattggggcggcctcctgggaccatgcggga120
gacgaattgggtctgcgggtgccggaggcggtaaagcggcagatggtgggtcggacgctg180
ccggatattcatgcaattgtacgggaaggcatgccggacgtggacgcggatcgtctgctg240
gagcgggccaatcatcattatcaccgtttggtgaccgaagtgccaccgccggtgaaggcc300
ggggcgcgggaactgctggaatggctgaagggtgctggggtgcccatggcggtggcgact360
tccagccgccgggttcaggccgaagacaaattaagccgtaccggcctgcggcattttttt420
gatgtgattgtggccggcgatgaaatcgcgcggggcaagccggatccaaag471
<210>142
<211>157
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(14)...(157)
<223>卤酸脱卤酶样水解酶
<400>142
MetGlnLysLysThrSerThrCysGluAspGluGlyProTyrArgAla
151015
ValLeuPheAspLeuAspGlyThrLeuLeuAspThrGluArgIleGly
202530
AlaAlaSerTrpAspHisAlaGlyAspGluLeuGlyLeuArgValPro
354045
GluAlaValLysArgGlnMetValGlyArgThrLeuProAspIleHis
505560
AlaIleValArgGluGlyMetProAspValAspAlaAspArgLeuLeu
65707580
GluArgAlaAsnHisHisTyrHisArgLeuValThrGluValProPro
859095
ProValLysAlaGlyAlaArgGluLeuLeuGluTrpLeuLysGlyAla
100105110
GlyValProMetAlaValAlaThrSerSerArgArgValGlnAlaGlu
115120125
AspLysLeuSerArgThrGlyLeuArgHisPhePheAspValIleVal
130135140
AlaGlyAspGluIleAlaArgGlyLysProAspProLys
145150155
<210>143
<211>603
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>143
atgaataacaagagcttcatcacaatccatggcattcgtaagtttggctcttctcccact60
cacatgcgccctataaacgaatcactcctctctagtaatctgaggacaatcccagtcaat120
tatggctacaccctgctcccaatcacgaacagaaagagtgtttctagggcaattcctgtg180
ctagaaaacgagctaaagcgagggagggacatcacccttatcgggtattctaacggcgct240
tggacagctctacagcttgcggaaatggcttatccaatccaacgtctagtgctcatctct300
cctgctcttcactctgctcacgccttccctcaaatcccttctcttgagcgtgtagacgtg360
ttctattgccctacagataatgttggtgatcttgccaagacttggaggggagttactaga420
atcatgccttggagatggttctctccacacccttacggaagaatgatgaaaactggattt480
attggagaggatgaacgtgtctttaaccacaggcttggcgatcatgtaggccatgctttc540
tacaaccatgctgatgctgtttcacacattatagaggtgattaaatatgaaactccttat600
tag603
<210>144
<211>200
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>144
MetAsnAsnLysSerPheIleThrIleHisGlyIleArgLysPheGly
151015
SerSerProThrHisMetArgProIleAsnGluSerLeuLeuSerSer
202530
AsnLeuArgThrIleProValAsnTyrGlyTyrThrLeuLeuProIle
354045
ThrAsnArgLysSerValSerArgAlaIleProValLeuGluAsnGlu
505560
LeuLysArgGlyArgAspIleThrLeuIleGlyTyrSerAsnGlyAla
65707580
TrpThrAlaLeuGlnLeuAlaGluMetAlaTyrProIleGlnArgLeu
859095
ValLeuIleSerProAlaLeuHisSerAlaHisAlaPheProGlnIle
100105110
ProSerLeuGluArgValAspValPheTyrCysProThrAspAsnVal
115120125
GlyAspLeuAlaLysThrTrpArgGlyValThrArgIleMetProTrp
130135140
ArgTrpPheSerProHisProTyrGlyArgMetMetLysThrGlyPhe
145150155160
IleGlyGluAspGluArgValPheAsnHisArgLeuGlyAspHisVal
165170175
GlyHisAlaPheTyrAsnHisAlaAspAlaValSerHisIleIleGlu
180185190
ValIleLysTyrGluThrProTyr
195200
<210>145
<211>1197
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>145
atgaacgcaacctccgcaacgatcgccgccaccgacacccagcagcgcggtggcttcgcc60
ggcaccgatccgcaaccggtcgatcgggtgctggccgcactgatccaggacaactacgac120
cgcgtcgaccagcgtcgcggcgacccgccgatcgaccgcccgctgccgcagggctgggcg180
cgcatgggcgacgacgaagtgcgcgccgcgggcatcgatcctgcgatgcagcacgatgcc240
aagagcggcttcgacgcctcgttctaccgcgacgaccagggccgggtggccctggtctat300
gccggcagcgacgagggccaggactggaagcacaacttcggccagggcctgggtttccag360
gacgcgcagtacgaccaggcgatcgcgctggcgcgcgaggcgaaatcggccttcggcgac420
cagctcgtgctgtcgggccagtcgctcggcggcggcctggccgcggcagcgtccatggtc480
aacgaggtgcccgcggtgaccttcaacgccgccggcgtgcacgaccacacggtcgagcgc540
tacggcctggacgcggacgcggtcaagcgccaggcggaccagggcctggtccggcactac600
gtggtcgagaacgacatcctgacccacctgcaggagaacgcgttcccgctcaatgcggcg660
atgccggatgcgcccggcgcgcgcatcgacctgcccgatccggatccgctgaccacgttc720
gagaagctgctgccctggaagacctggccgcaccgcgtgcataaccactacatcgaggcg780
gtgatcgagtccatggacaaggccggctacacgctcgaaggcgcggcggcgacgcgggat840
gcgtcgcaggacaccgccaaccggctgctcgacgattcggtgcgcgggctcgcgccgcag900
cgcgaacgcctcgggctgcaggacgacgaccgcttcttcaacgcggccgccggcatggcc960
gcctcggccggacgcgatggcctgcgcagcatccagcacgtggtcgccacgcccgacggc1020
cacggcgtgttcgcggtcgaaggcgacctgcgcgacgccggccaccgccgcagcctggtc1080
gacgtggaacgcggcgccgcgacgccggtcgaggacagcgtggccagcctgcgcgagcac1140
gcctcgcgttccccggagcaggagccgcagcgggagcgccacctggcgatggcctga1197
<210>146
<211>398
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>146
MetAsnAlaThrSerAlaThrIleAlaAlaThrAspThrGlnGlnArg
151015
GlyGlyPheAlaGlyThrAspProGlnProValAspArgValLeuAla
202530
AlaLeuIleGlnAspAsnTyrAspArgValAspGlnArgArgGlyAsp
354045
ProProIleAspArgProLeuProGlnGlyTrpAlaArgMetGlyAsp
505560
AspGluValArgAlaAlaGlyIleAspProAlaMetGlnHisAspAla
65707580
LysSerGlyPheAspAlaSerPheTyrArgAspAspGlnGlyArgVal
859095
AlaLeuValTyrAlaGlySerAspGluGlyGlnAspTrpLysHisAsn
100105110
PheGlyGlnGlyLeuGlyPheGlnAspAlaGlnTyrAspGlnAlaIle
115120125
AlaLeuAlaArgGluAlaLysSerAlaPheGlyAspGlnLeuValLeu
130135140
SerGlyGlnSerLeuGlyGlyGlyLeuAlaAlaAlaAlaSerMetVal
145150155160
AsnGluValProAlaValThrPheAsnAlaAlaGlyValHisAspHis
165170175
ThrValGluArgTyrGlyLeuAspAlaAspAlaValLysArgGlnAla
180185190
AspGlnGlyLeuValArgHisTyrValValGluAsnAspIleLeuThr
195200205
HisLeuGlnGluAsnAlaPheProLeuAsnAlaAlaMetProAspAla
210215220
ProGlyAlaArgIleAspLeuProAspProAspProLeuThrThrPhe
225230235240
GluLysLeuLeuProTrpLysThrTrpProHisArgValHisAsnHis
245250255
TyrIleGluAlaValIleGluSerMetAspLysAlaGlyTyrThrLeu
260265270
GluGlyAlaAlaAlaThrArgAspAlaSerGlnAspThrAlaAsnArg
275280285
LeuLeuAspAspSerValArgGlyLeuAlaProGlnArgGluArgLeu
290295300
GlyLeuGlnAspAspAspArgPhePheAsnAlaAlaAlaGlyMetAla
305310315320
AlaSerAlaGlyArgAspGlyLeuArgSerIleGlnHisValValAla
325330335
ThyProAspGlyHisGlyValPheAlaValGluGlyAspLeuArgAsp
340345350
AlaGlyHisArgArgSerLeuValAspValGluArgGlyAlaAlaThr
355360365
ProValGluAspSerValAlaSerLeuArgGluHisAlaSerArgSer
370375380
ProGluGlnGluProGlnArgGluArgHisLeuAlaMetAla
385390395
<210>147
<211>1104
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>147
atgcaagtcagtggtgcaatggaagcaataaatcctgcgcagatgaatgcagcggaagtc60
acttcatcgcaggtatctgaccagatcatcggcggcgttagccaggtgccggaagcaggt120
ttagctagtgaagtcggagcaatggcgatggcacctgctgctgaagatgcggcccttgcc180
gccatggttgccggccctgccaatcaagccagttacggcaatttgcccagtgactggacg240
gaagccgactataatcatgctctcgacatggccaagctgtcttcccaagcttatagccgg300
ttcaacgatatcaccgtcgatcttctgttggctccatttggtggtattggtgacataaaa360
gcgcaggattttaccaccgataactggcgcctaatggacaccagtggcaagagtgacttt420
ttcttacccgtacagagcgggctggacttcactgtttttgaggcggtagccgatgacccg480
gcagctaatgtgaaggaaggggatattgtgctcgcatttcgcggcagtgagcctacctcc540
gcaccggattggatcaataatgtaaaacaggcggcgggtaattcctctcagtatgctcag600
gcggtagaagtcgcgaaggagctgcaagggcaggtagaccagtacaatgcagacaataac660
ctgaccggcaatgatgccagaagcctccattttaccggccatagcctgggcgggggattg720
gcaacagcggccgcgctggccacaggcagtagcgctaccgccttcaatgcagcgggcctt780
ggggattccaccctaaagaaccttgggctcaatgaagggctggcggcaggcttccacaat840
aacgttaccaatattaatgtggaaggcgatctgttgagcgatgccaaccgccaaaaggat900
gtctataccacgggttcaggcatcctcgatgaaaccaggcagtatggggaacaggtttgg960
ctgcagggcgtcgatgataaggccagattgggcggaccgcttaatcccctgataccggga1020
gtggctgatgacctggcaatccaggcactcaaccatgcctggcatgtgtatacctaccag1080
ttggaaaatcgcaacttcgcctaa1104
<210>148
<211>367
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>148
MetGlnValSerGlyAlaMetGluAlaIleAsnProAlaGlnMetAsn
151015
AlaAlaGluValThrSerSerGlnValSerAspGlnIleIleGlyGly
202530
ValSerGlnValProGluAlaGlyLeuAlaSerGluValGlyAlaMet
354045
AlaMetAlaProAlaAlaGluAspAlaAlaLeuAlaAlaMetValAla
505560
GlyProAlaAsnGlnAlaSerTyrGlyAsnLeuProSerAspTrpThr
65707580
GluAlaAspTyrAsnHisAlaLeuAspMetAlaLysLeuSerSerGln
859095
AlaTyrSerArgPheAsnAspIleThrValAspLeuLeuLeuAlaPro
100105110
PheGlyGlyIleGlyAspIleLysAlaGlnAspPheThrThrAspAsn
115120125
TrpArgLeuMetAspThrSerGlyLysSerAspPhePheLeuProVal
130135140
GlnSerGlyLeuAspPheThrValPheGluAlaValAlaAspAspPro
145150155160
AlaAlaAsnValLysGluGlyAspIleValLeuAlaPheArgGlySer
165170175
GluProThrSerAlaProAspTrpIleAsnAsnValLysGlnAlaAla
180185190
GlyAsnSerSerGlnTyrAlaGlnAlaValGluValAlaLysGluLeu
195200205
GlnGlyGlnValAspGlnTyrAsnAlaAspAsnAsnLeuThrGlyAsn
210215220
AspAlaArgSerLeuHisPheThrGlyHisSerLeuGlyGlyGlyLeu
225230235240
AlaThrAlaAlaAlaLeuAlaThrGlySerSerAlaThrAlaPheAsn
245250255
AlaAlaGlyLeuGlyAspSerThrLeuLysAsnLeuGlyLeuAsnGlu
260265270
GlyLeuAlaAlaGlyPheHisAsnAsnValThrAsnIleAsnValGlu
275280285
GlyAspLeuLeuSerAspAlaAsnArgGlnLysAspValTyrThrThr
290295300
GlySerGlyIleLeuAspGluThrArgGlnTyrGlyGluGlnValTrp
305310315320
LeuGlnGlyValAspAspLysAlaArgLeuGlyGlyProLeuAsnPro
325330335
LeuIleProGlyValAlaAspAspLeuAlaIleGlnAlaLeuAsnHis
340345350
AlaTrpHisValTyrThrTyrGlnLeuGluAsnArgAsnPheAla
355360365
<210>149
<211>975
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>149
atgagcgtccaactgcaaccgagccagctccagccgacttggcagaaaccgctggaaccc60
ctggccccgccgatccaggcggcaccgccgctgccgcaaggctcgtacgccctggacccc120
agctaccacccgcagctggccgcggtcaccgcgaagcaggcgccggccgccaacgccgcg180
ccggacccgacctcgttcgaccagcaactgcgcggcaaggattcgcaggccatcgacctg240
gagatggcgcagctctcgcaggcggtctacaaccccgacaccaagaccgtcggcaactgg300
acccgtctcgacgacgcccagctgacccaggccggaatcgatcccaagtcgctggagaac360
agcgacaccggcttccgcgccggcatctacaccgacggcaacggcaagtacgtggtcgcc420
tacgccggttccaacgacgtgcaggactggatcaccaacgcgcgccagggcatcggctgg480
gattccaagcagtacgaccaggccgtgcagctggcccaggacgcgcagcaggccttcggc540
gagaacatggtcatcaccggccattcgctcggcggcggcctggccgcgaccgcggcgctg600
gccaccgacaccgccgcagtgaccttcaacgcctccggcgtgcacgacgacaccctgcgc660
ggactgggcctggacccgggtaccgccaagagcgacgccgccgacggccagatccgccgc720
tacaacatcggcggcgaaatcctgactgcggcgcaggaagacgtgccgctgctcaacggc780
attcccgacgcgcccggccacgagatcaacctcaacgacccggacccgccgaaggccccg840
gatttcacctggaacccgatcgagatggccaagcgcaccgccgaatacgtggccgccaag900
gcgatccgtccgggcgagctgcacgccatcggcccggtgatcgaggcgctgcagcagcag960
acgccctggcaatga975
<210>150
<211>324
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>150
MetSerValGlnLeuGlnProSerGlnLeuGlnProThrTrpGlnLys
151015
ProLeuGluProLeuAlaProProIleGlnAlaAlaProProLeuPro
202530
GlnGlySerTyrAlaLeuAspProSerTyrHisProGlnLeuAlaAla
354045
ValThrAlaLysGlnAlaProAlaAlaAsnAlaAlaProAspProThr
505560
SerPheAspGlnGlnLeuArgGlyLysAspSerGlnAlaIleAspLeu
65707580
GluMetAlaGlnLeuSerGlnAlaValTyrAsnProAspThrLysThr
859095
ValGlyAsnTrpThrArgLeuAspAspAlaGlnLeuThrGlnAlaGly
100105110
IleAspProLysSerLeuGluAsnSerAspThrGlyPheArgAlaGly
115120125
IleTyrThrAspGlyAsnGlyLysTyrValValAlaTyrAlaGlySer
130135140
AsnAspValGlnAspTrpIleThrAsnAlaArgGlnGlyIleGlyTrp
145150155160
AspSerLysGlnTyrAspGlnAlaValGlnLeuAlaGlnAspAlaGln
165170175
GlnAlaPheGlyGluAsnMetValIleThrGlyHisSerLeuGlyGly
180185190
GlyLeuAlaAlaThrAlaAlaLeuAlaThrAspThrAlaAlaValThr
195200205
PheAsnAlaSerGlyValHisAspAspThrLeuArgGlyLeuGlyLeu
210215220
AspProGlyThrAlaLysSerAspAlaAlaAspGlyGlnIleArgArg
225230235240
TyrAsnIleGlyGlyGluIleLeuThrAlaAlaGlnGluAspValPro
245250255
LeuLeuAsnGlyIleProAspAlaProGlyHisGluIleAsnLeuAsn
260265270
AspProAspProProLysAlaProAspPheThrTrpAsnProIleGlu
275280285
MetAlaLysArgThrAlaGluTyrValAlaAlaLysAlaIleArgPro
290295300
GlyGluLeuHisAlaIleGlyProValIleGluAlaLeuGlnGlnGln
305310315320
ThrProTrpGln
<210>151
<211>1341
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>151
atgggcggagaacggcaccccgatggcgtgagcacgataccggcaacggcctcggacctg60
gcgagctttgaccgcgccagtggacagctggcgacattcgccgcgcctgtcctccacgac120
agtggcaaaccagacgatcgtctgttcgtcgcggcgttcgacggcaccggcaacagcatg180
gtcaaggacgcgccggagaatcacacgaacgttgcgcgcatcgccaggcagatcgagtcc240
ctgggcgatcccgccatcgcgcaaggctatgtggaaggcccgggcacgcagggcggaatc300
ggcggaggcatcgacctcatgacagggcagagctacgaagcccgcatggaggacatgtac360
ctgcagttcgtgaagcaatccgccgcgtggttgaaggagaacccggatgcggacatccgc420
atcgccgccatcggattcagtcgtggcgcggaacaggcggccggcttcacccggatggtc480
gaagaacgcggcatccggaatccggaaggcgcgcaggtcacgcgcgacggcgatggtcgg540
gtactgcgtgtcgactacatcggtccaccgctgcgcgaacccggcaccgtcatccaggcg600
gttggcctgttcgaccccgtcggcacgggtgagccgcgcgatcacgaccgccgtctgcca660
ccgtcggtggtgtcgggtttccagatcaccgccgacgatgagcggcgcaacctgttccag720
tccacccgcgtgatggatcctggcgtgaccgatggegggcgcttcctcaacgtcaccgtc780
gccggtgcgcacagcgacatcggcggtggctatacgcaggatggcatcgcgatccgcagc840
ggcaacctgatgatcgactacctcaacggtctgagcgaccggccattcctggacaagcgt900
gaagaaccgttcgatcccgctcgcaacgtgatccatcgctccgaggaacaccggttcttc960
taccgcacctcgatctacgacaaggcgggaacgcgcgggatgcaggaggaactcgcgccg1020
tcgcacctgtgcaggatcgactgcctcgatgcacagccccgcaatgaaacgctcgcgcgc1080
gagctggcctggcgacccgtcgagatcggaccggtcccggtcggcgcggaggtgtcgcgt1140
tcgggcggcatggtcgagcgtctgttgcaggcggccaaacacggcgacggtggcgccgtc1200
gagcgcatctcgcgggagtatctgcacggagacgccgggcaggcgtggctgcaggcaggc1260
cagcagcggctcgacgccgcctccatcacgcaggcaccaccggtggaacgccagcaggag1320
ccggccgcgctcgcgcgctga1341
<210>152
<211>446
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>152
MetGlyGlyGluArgHisProAspGlyValSerThrIleProAlaThr
151015
AlaSerAspLeuAlaSerPheAspArgAlaSerGlyGlnLeuAlaThr
202530
PheAlaAlaProValLeuHisAspSerGlyLysProAspAspArgLeu
354045
PheValAlaAlaPheAspGlyThrGlyAsnSerMetValLysAspAla
505560
ProGluAsnHisThrAsnValAlaArgIleAlaArgGlnIleGluSer
65707580
LeuGlyAspProAlaIleAlaGlnGlyTyrValGluGlyProGlyThr
859095
GlnGlyGlyIleGlyGlyGlyIleAspLeuMetThrGlyGlnSerTyr
100105110
GluAlaArgMetGluAspMetTyrLeuGlnPheValLysGlnSerAla
115120125
AlaTrpLeuLysGluAsnProAspAlaAspIleArgIleAlaAlaIle
130135140
GlyPheSerArgGlyAlaGluGlnAlaAlaGlyPheThrArgMetVal
145150155160
GluGluArgGlyIleArgAsnProGluGlyAlaGlnValThrArgAsp
165170175
GlyAspGlyArgValLeuArgValAspTyrIleGlyProProLeuArg
180185190
GluProGlyThrValIleGlnAlaValGlyLeuPheAspProValGly
195200205
ThrGlyGluProArgAspHisAspArgArgLeuProProSerValVal
210215220
SerGlyPheGlnIleThrAlaAspAspGluArgArgAsnLeuPheGln
225230235240
SerThrArgValMetAspProGlyValThrAspGlyGlyArgPheLeu
245250255
AsnValThrValAlaGlyAlaHisSerAspIleGlyGlyGlyTyrThr
260265270
GlnAspGlyIleAlaIleArgSerGlyAsnLeuMetIleAspTyrLeu
275280285
AsnGlyLeuSerAspArgProPheLeuAspLysArgGluGluProPhe
290295300
AspProAlaArgAsnValIleHisArgSerGluGluHisArgPhePhe
305310315320
TyrArgThrSerIleTyrAspLysAlaGlyThrArgGlyMetGlnGlu
325330335
GluLeuAlaProSerHisLeuCysArgIleAspCysLeuAspAlaGln
340345350
ProArgAsnGluThrLeuAlaArgGluLeuAlaTrpArgProValGlu
355360365
IleGlyProValProValGlyAlaGluValSerArgSerGlyGlyMet
370375380
ValGluArgLeuLeuGlnAlaAlaLysHisGlyAspGlyGlyAlaVal
385390395400
GluArgIleSerArgGluTyrLeuHisGlyAspAlaGlyGlnAlaTrp
405410415
LeuGlnAlaGlyGlnGlnArgLeuAspAlaAlaSerIleThrGlnAla
420425430
ProProValGluArgGlnGlnGluProAlaAlaLeuAlaArg
435440445
<210>153
<211>384
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>153
atgtctttactttatgcaccagaagagttttggctagcagatgtagaaactttagaaagt60
gtatgtaatggctgtggtactgaaggctggaaaggtaaactaattcctaacagcatgtat120
ggtctagatatacgcattgcttgtgatatccatgactggatgtatcactttggtaagtca180
gaaaaagataaagaaaaagcagataaagcttttttaaataatcttattcgccttatcaat240
gatgaaggtggcttcttagcttggcctagacgttatagggctatgacttattataacgca300
gtcaaagattttggtgggcctgcattttgggcaaataaaaaccctaagggtactatgaaa360
gaacctaagggtactcctgcttaa384
<210>154
<211>127
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>154
MetSerLeuLeuTyrAlaProGluGluPheTrpLeuAlaAspValGlu
151015
ThrLeuGluSerValCysAsnGlyCysGlyThrGluGlyTrpLysGly
202530
LysLeuIleProAsnSerMetTyrGlyLeuAspIleArgIleAlaCys
354045
AspIleHisAspTrpMetTyrHisPheGlyLysSerGluLysAspLys
505560
GluLysAlaAspLysAlaPheLeuAsnAsnLeuIleArgLeuIleAsn
65707580
AspGluGlyGlyPheLeuAlaTrpProArgArgTyrArgAlaMetThr
859095
TyrTyrAsnAlaValLysAspPheGlyGlyProAlaPheTrpAlaAsn
100105110
LysAsnProLysGlyThrMetLysGluProLysGlyThrProAla
115120125
<210>155
<211>1263
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>155
atgcggacgacaactacaaattggagacaaatcgtgaaaagcctgaagctcttcctgatg60
ggcctttgcctgttcatttccgcttcattcgcatcatctgcctatgcactgggcagttac120
acctacacgtacctgcgctgtttctatcgcgtcgatacatccccgctgaagcccaagacc180
acctacgtctggggcatcgatccgggcagcggcggctactaccgcatctatggccgctgg240
tggaaagacggcttgctgagctgggaaaacatgttctacagcgacgtgtcgcaagatacg300
ctgaaatcggtttgccagagcacgctcgccggctacggcatcaaccgcagcgtcgcactc360
tcggcggcggccgatacgtcgctctcgctcaattacacggtgtggaccaacgacagcgca420
tcgcagggctcacgcatcaacaaaatcgtcgcattcggcgacagcctgtcggacaaccag480
aatctgtacaacgcgacccaatggcaactgccgaaccgcaacagttggtttctcggccgc540
ttctcgaatgacaggaactggatcgaatacctgtcgagcaacgtgaatctgccgatgtac600
aactgggcagtggcgggcgcggcggcggatcagtactacgtcatcccgggtgtgtcgcaa660
caggtcgactcgtggatcacctacatgcagagcgcgccgaattaccaggccgcgaatacg720
ctgttcaccgtgcttgtcggcggcaacgatctggtgaactacggccggtctgtcgactcg780
atcatctccgcggagcagcaggcgctggtgaagatgatcaatgccggcgctcgcaacatc840
ctgttgctgaatctgcccgacgtatcgcgcgcaccggtattccagtatcgcagcgacgcc900
gccaccatcgccgcgcaagtccgcgacttcaaccagaagctggcgcaactgcgcgacaat960
cttcaggcgacgtacggcccgtcgctcgtcattcgcatgttcgatacctacaccttgttc1020
aacgatctgctgaacaatccgaccaactatggcgtgacgaacacctggcagtcctgcctc1080
gacatcaactcggattccgggtcgaactatctttatacctggccgacgcgcgccgaatgc1140
accaacgccgacagcttcgtgttctgggacacgctgcacccgaccacgcatacgcacaag1200
ctgctgggcgacaatgcggcgaatttcgtacgcgccggtttccccgcattgtctgcgcct1260
tga1263
<210>156
<211>420
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(36)
<220>
<221>结构域
<222>(149)...(406)
<223>GDSL-样脂酶/酰基水解酶
<400>156
MetArgThrThrThrThrAsnTrpArgGlnIleVaILysSerLeuLys
151015
LeuPheLeuMetGlyLeuCysLeuPheIleSerAlaSerPheAlaSer
202530
SerAlaTyrAlaLeuGlySerTyrThrTyrThrTyrLeuArgCysPhe
354045
TyrArgValAspThrSerProLeuLysProLysThrThrTyrValTrp
505560
GlyIleAspProGlySerGlyGlyTyrTyrArgIleTyrGlyArgTrp
65707580
TrpLysAspGlyLeuLeuSerTrpGluAsnMetPheTyrSerAspVal
859095
SerGlnAspThrLeuLysSerValCysGlnSerThrLeuAlaGlyTyr
100105110
GlyIleAsnArgSerValAlaLeuSerAlaAlaAlaAspThrSerLeu
115120125
SerLeuAsnTyrThrValTrpThrAsnAspSerAlaSerGlnGlySer
130135140
ArgIleAsnLysIleValAlaPheGlyAspSerLeuSerAspAsnGln
145150155160
AsnLeuTyrAsnAlaThrGlnTrpGlnLeuProAsnArgAsnSerTrp
165170175
PheLeuGlyArgPheSerAsnAspArgAsnTrpIleGluTyrLeuSer
180185190
SerAsnValAsnLeuProMetTyrAsnTrpAlaValAlaGlyAlaAla
195200205
AlaAspGlnTyrTyrValIleProGlyValSerGlnGlnValAspSer
210215220
TrpIleThrTyrMetGlnSerAlaProAsnTyrGlnAlaAlaAsnThr
225230235240
LeuPheThrValLeuValGlyGlyAsnAspLeuValAsnTyrGlyArg
245250255
SerValAspSerIleIleSerAlaGluGlnGlnAlaLeuValLysMet
260265270
IleAsnAlaGlyAlaArgAsnIleLeuLeuLeuAsnLeuProAspVal
275280285
SerArgAlaProValPheGlnTyrArgSerAspAlaAlaThrIleAla
290295300
AlaGlnValArgAspPheAsnGlnLysLeuAlaGlnLeuArgAspAsn
305310315320
LeuGlnAlaThrTyrGlyProSerLeuValIleArgMetPheAspThr
325330335
TyrThrLeuPheAsnAspLeuLeuAsnAsnProThrAsnTyrGlyVal
340345350
ThrAsnThrTrpGlnSerCysLeuAspIleAsnSerAspSerGlySer
355360365
AsnTyrLeuTyrThrTrpProThrArgAlaGluCysThrAsnAlaAsp
370375380
SerPheValPheTrpAspThrLeuHisProThrThrHisThrHisLys
385390395400
LeuLeuGlyAspAsnAlaAlaAsnPheValArgAlaGlyPheProAla
405410415
LeuSerAlaPro
420
<210>157
<211>1329
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>157
atgagcctcaacagccaagactacgctgcgctatccgaagatgcatacaaggattatgcg60
gtcggtcgtcgagcgcctggtcaagaagaaatcgttccgatcaacgggcacaagtacaag120
atcctcgagcacgttgacaatcggctgaacggttatcagggaacgatctaccagcgagtc180
gacaccaatgaaattgtcgtcgcacatcgcggaaccgaacaaatcgcacgcgatgcgatt240
ctgaccgatggtggcatggtcgttgcccgtaccaatgtgcaggcgccagacgcaatcgcg300
ctgacccaacgcgccctggcttacgccaagaaggaggggcaggatctcggccaacgtccg360
cctgaggtcaccgtcaccggccactccctcggcggcgctctggcccagatcacctcgcac420
cacttcaacgtcaagggcgagaccttcaacgcctatggcgcggtcagcctcagctaccgc480
atcccggaaggtggcaacaccatgatcaaccatgtcatggcctccgatccggtcagcgcg540
gcgtcgccacatttcggccaggtgcggatctacgccaggccgaatgaaatcagcacgctc600
gccgcgaacggtttcagcaatcactcgttgcgcgcccttatccccgaccggccgatcatc660
gccgcaggcagctcgttcggcgcgcacaagctgggcaacttcctcggtgacggctcggtg720
ctgcagcacccggaaacgcagaagctggcaaaagacaacgccaggatgatcgaggaatac780
cgcgacgacgttgaattactgcgccgtggtgtcacccgcgcggcgcggggcattccgggc840
ggcgccgtcgacctgtacgaccacatccgcggcccgctgcagcccggtgagccggcacgc900
cgcgaagcggagaagaacggccatcacaccagcatgctgcgaatggacgatgccaaccat960
gtgggcaacccactgttcaacgacgcgatccgtggcgtgcacgcgcaggatgtccgcgtc1020
ggccgggtaccagacgtgatgagcacgcaactggcaggcagtctggccgccgaaatgcac1080
gcagcaggcggcaagcgcatcgacgaagtggtcatgaatgccgatgcctcgcgcagcttc1140
gccgtgcagggccagggcggtgaccccgcccaccttcgtgtgtcggtggatacggcagtg1200
gcgatgaacaccccgctggaacagagcagccagcgcatcgaccagcaggccgccgaccag1260
cgcgttgcgctggagcgcgaccagcagctggaacagcagcggaaccagacccgcagcctg1320
caggcctga1329
<210>158
<211>442
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>158
MetSerLeuAsnSerGlnAspTyrAlaAlaLeuSerGluAspAlaTyr
151015
LysAspTyrAlaValGlyArgArgAlaProGlyGlnGluGluIleVal
202530
ProIleAsnGlyHisLysTyrLysIleLeuGluHisValAspAsnArg
354045
LeuAsnGlyTyrGlnGlyThrIleTyrGlnArgValAspThrAsnGlu
505560
IleValValAlaHisArgGlyThrGluGlnIleAlaArgAspAlaIle
65707580
LeuThrAspGlyGlyMetValValAlaArgThrAsnValGlnAlaPro
859095
AspAlaIleAlaLeuThrGlnArgAlaLeuAlaTyrAlaLysLysGlu
100105110
GlyGlnAspLeuGlyGlnArgProProGluValThrValThrGlyHis
115120125
SerLeuGlyGlyAlaLeuAlaGlnIleThrSerHisHisPheAsnVal
130135140
LysGlyGluThrPheAsnAlaTyrGlyAlaValSerLeuSerTyrArg
145150155160
IleProGluGlyGlyAsnThrMetIleAsnHisValMetAlaSerAsp
165170175
ProValSerAlaAlaSerProHisPheGlyGlnValArgIleTyrAla
180185190
ArgProAsnGluIleSerThrLeuAlaAlaAsnGlyPheSerAsnHis
195200205
SerLeuArgAlaLeuIleProAspArgProIleIleAlaAlaGlySer
210215220
SerPheGlyAlaHisLysLeuGlyAsnPheLeuGlyAspGlySerVal
225230235240
LeuGlnHisProGluThrGlnLysLeuAlaLysAspAsnAlaArgMet
245250255
IleGluGluTyrArgAspAspValGluLeuLeuArgArgGlyValThr
260265270
ArgAlaAlaArgGlyIleProGlyGlyAlaValAspLeuTyrAspHis
275280285
IleArgGlyProLeuGlnProGlyGluProAlaArgArgGluAlaGlu
290295300
LysAsnGlyHisHisThrSerMetLeuArgMetAspAspAlaAsnHis
305310315320
ValGlyAsnProLeuPheAsnAspAlaIleArgGlyValHisAlaGln
325330335
AspValArgValGlyArgValProAspValMetSerThrGlnLeuAla
340345350
GlySerLeuAlaAlaGluMetHisAlaAlaGlyGlyLysArgIleAsp
355360365
GluValValMetAsnAlaAspAlaSerArgSerPheAlaValGlnGly
370375380
GlnGlyGlyAspProAlaHisLeuArgValSerValAspThrAlaVal
385390395400
AlaMetAsnThrProLeuGluGlnSerSerGlnArgIleAspGlnGln
405410415
AlaAlaAspGlnArgValAlaLeuGluArgAspGlnGlnLeuGluGln
420425430
GlnArgAsnGlnThrArgSerLeuGlnAla
435440
<210>159
<211>1428
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>159
atgtcgatcacgctggtattcgtgcacggctggagtgtcacaagcaaggacacctacggg60
aagcttcccgaggccatctctcaagccgctgcggccgcgggcatcgatgtagagctgaag120
gacatctacctcggccgctacatcagctttcacgacgaggttacggtcgacgacatcgcg180
accgcgatgaatcacgcggtggcgaacgacttgaaaggggtgaaggagttctcgtgcatc240
acgcactccacgggcggcccggtcgtgcgtcgctgggtagatatgttctacggcgcgaag300
gacctcgacaactgtccgctgcgtcatctcatcatgctggcgcctgcaaaccatggttcc360
gcgttggccgtcttggggaagggccgcgtcggtcgaatccaggcgtggtggggtggggtc420
gagcccggtcagggcgtgctcgactggctttgcctcggcagctcggaagcgtgggagctc480
caggacagcttcacggattactcgctggacgacgcgaagttcttcccgttcgtgctgagc540
ggcgagacgattgataagcacttctacgacttcctcaacagctatctggatgaagtgggc600
tcggatggcgtggttcgtctggcgggggccaatctgaactacacgtttattcggctcgac660
caaactgaaaagcgttacgacgacggcgaggaaacgggctacatactgactgttcggccg720
cggacaaagccgcgcccacccgtaacggcgttcggagtcataccgagcgcgagtcactcg780
ggtaacgacatcggcatcatgcgcagcgtcacgccggcgaactccgattcgaagcctgtc840
gtggcgcaaatcgtgaaatgcctcggcgtggagacacaagcggattacaaagcgcgtgtc900
accgagctggccgcgttcaccgccgaaacgcagaaagccaacgccgtgcagtacggcggc960
aaagagcgccatttcgtgatgttcatcttccgcatccgcgacgacagagggcgcacgata1020
agcgactacgacctgttgctgctcggcgacggtttccacccggacaagctgcccaaggga1080
ttcttcgttgaccgtcaacgcaatcccaagtcccaggcgctggtctactacctcgactac1140
gacgcgctgacggctgacgacgacaccgacttaggtattcgagtgaacgcgcgaccgctc1200
tatagcgcgcccggagcagcagagccagacgcattcgcgggctatcgagccgccgagtat1260
cgattcacgggcaaagtactgaagcaattcgtgcgcccgaacgaaactgtgtacgtcgac1320
atcgtgctgaatcgcatggtggacgttgaaacgctccggctggagcctctggaaggatcg1380
ccgcgtgggtcgttcaagaaaactctgcccaaagggccggtgagttag1428
<210>160
<211>475
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>160
MetSerIleThrLeuValPheValHisGlyTrpSerValThrSerLys
151015
AspThrTyrGlyLysLeuProGluAlaIleSerGlnAlaAlaAlaAla
202530
AlaGlyIleAspValGluLeuLysAspIleTyrLeuGlyArgTyrIle
354045
SerPheHisAspGluValThrValAspAspIleAlaThrAlaMetAsn
505560
HisAlaValAlaAsnAspLeuLysGlyValLysGluPheSerCysIle
65707580
ThrHisSerThrGlyGlyProValValArgArgTrpValAspMetPhe
859095
TyrGlyAlaLysAspLeuAspAsnCysProLeuArgHisLeuIleMet
100105110
LeuAlaProAlaAsnHisGlySerAlaLeuAlaValLeuGlyLysGly
115120125
ArgValGlyArgIleGlnAlaTrpTrpGlyGlyValGluProGlyGln
130135140
GlyValLeuAspTrpLeuCysLeuGlySerSerGluAlaTrpGluLeu
145150155160
GlnAspSerPheThrAspTyrSerLeuAspAspAlaLysPhePhePro
165170175
PheValLeuSerGlyGluThrIleAspLysHisPheTyrAspPheLeu
180185190
AsnSerTyrLeuAspGluValGlySerAspGlyValValArgLeuAla
195200205
GlyAlaAsnLeuAsnTyrThrPheIleArgLeuAspGlnThrGluLys
210215220
ArgTyrAspAspGlyGluGluThrGlyTyrIleLeuThrValArgPro
225230235240
ArgThrLysProArgProProValThrAlaPheGlyValIleProSer
245250255
AlaSerHisSerGlyAsnAspIleGlyIleMetArgSerValThrPro
260265270
AlaAsnSerAspSerLysProValValAlaGlnIleValLysCysLeu
275280285
GlyValGluThrGlnAlaAspTyrLysAlaArgValThrGluLeuAla
290295300
AlaPheThrAlaGluThrGlnLysAlaAsnAlaValGlnTyrGlyGly
305310315320
LysGluArgHisPheValMetPheIlePheArgIleArgAspAspArg
325330335
GlyArgThrIleSerAspTyrAspLeuLeuLeuLeuGlyAspGlyPhe
340345350
HisProAspLysLeuProLysGlyPhePheValAspArgGlnArgAsn
355360365
ProLysSerGlnAlaLeuValTyrTyrLeuAspTyrAspAlaLeuThr
370375380
AlaAspAspAspThrAspLeuGlyIleArgValAsnAlaArgProLeu
385390395400
TyrSerAlaProGlyAlaAlaGluProAspAlaPheAlaGlyTyrArg
405410415
AlaAlaGluTyrArgPheThrGlyLysValLeuLysGlnPheValArg
420425430
ProAsnGluThrValTyrValAspIleValLeuAsnArgMetValAsp
435440445
ValGluThrLeuArgLeuGluProLeuGluGlySerProArgGlySer
450455460
PheLysLysThrLeuProLysGlyProValSer
465470475
<210>161
<211>1740
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>161
atgaacagaaaattattatcgttatgcttgggagcaacgtcctgtattgcactatcactt60
cctgtgcatgcatttacgcaaaagggtgcgggtacggaaatttctaatgggatacctatg120
gggcacgaatgggttacgcgtttgtctgcattggaattgcttggtggcgatcctattatg180
ccgccagatccaaatgacccacgtaaaaactggactaaagggaaagccaaaaacctcgat240
ctttccagcccaggtgcgcgtgcagaagttgcgcggattatgagtgttgattatcacgat300
aaaatattccagtcgacgtacaaagttgttttcgacgctattattggcgagcgctgggta360
gatttggcgggatataacgtgacgaccagcatgttgggaaaaataaactgttttgatgct420
gtagcccaagagccagtagaaatccagtacgatcattttatgcgtcgttacgacgagcgc480
ggtggaaaaggtggagcgactgctgcgaccaattcacgcgagcgttttgtgcaatatttt540
gttgcagcggcaatggctccccaaacaactatgaaagtatgggatggcggtgttgttagt600
gatttggttaccgtagataggaattactttttatttggcagggctgcgcatttattcgaa660
gactcatttagttcagaacatacagtgcgggtgagtgatgataattttgaactggtgcgc720
caagtaaaaagctacatgtgtgctgcaggttctgaacagcatacgcattcaaatgaaaaa780
atatttaattacaccagtggcgatgttatttggaaaccgggtactggtttggatccaagt840
tggtccgcatataaaccaagcaacatgaaaaccgtcgcattggtggcgaccgaagcaact900
aaagatttatgggcagcgtttattcgctccatgggcacgcctatagcgcagcgtgagcag960
tgggcgcgtaaagaggctaataaactggccgataattggttggcttttgataaatacaaa1020
ctccccgattggtatgacattgaagctcatcgggatgatacctatgtattggctgatggg1080
cagacagggaaaggccaaactgttgccgcttgtatgcaaaagttgggggttgcatcaggc1140
aagcaggaggataaggttcgccaattggaagcagatcaaaaaacctgtttatacaatgtc1200
gtggctgaagagggatacgccgatttatttgatcccgcatttcacatgccattcaattgg1260
cgttggaaaacaggccggtttggtgattggttacaaccaccagcaggatggaaaattcca1320
actcgtccagcggatacaggcacacgcgtgaatattctcagtgcgacaaacaatctccct1380
atggtggcagctgatggtgtaagccataaccagtgggtttatgttaaagcaggttttcct1440
gcgctgggttttatcaaagtgccggatgaaaataatactgacaaaaagaatagtattttt1500
tatcgcgtaattaatgatcccgatttatttttaagttacaacgccactactggcgcagta1560
aaactctgggccagtccgaaccaggctaattatgcaactgaaccaaaatcagggaatatt1620
gcaatcaagagtttgtattgggatcaatatatgtggctttcaaacgaatccccttatatt1680
acccgtaccgggaatcccaaaaatttggatgcccaatggaaagaagtagccgctaagtaa1740
<210>162
<211>579
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(24)
<400>162
MetAsnArgLysLeuLeuSerLeuCysLeuGlyAlaThrSerCysIle
151015
AlaLeuSerLeuProValHisAlaPheThrGlnLysGlyAlaGlyThr
202530
GluIleSerAsnGlyIleProMetGlyHisGluTrpValThrArgLeu
354045
SerAlaLeuGluLeuLeuGlyGlyAspProIleMetProProAspPro
505560
AsnAspProArgLysAsnTrpThrLysGlyLysAlaLysAsnLeuAsp
65707580
LeuSerSerProGlyAlaArgAlaGluValAlaArgIleMetSerVal
859095
AspTyrHisAspLysIlePheGlnSerThrTyrLysValValPheAsp
100105110
AlaIleIleGlyGluArgTrpValAspLeuAlaGlyTyrAsnValThr
115120125
ThrSerMetLeuGlyLysIleAsnCysPheAspAlaValAlaGlnGlu
130135140
ProValGluIleGlnTyrAspHisPheMetArgArgTyrAspGluArg
145150155160
GlyGlyLysGlyGlyAlaThrAlaAlaThrAsnSerArgGluArgPhe
165170175
ValGlnTyrPheValAlaAlaAlaMetAlaProGlnThrThrMetLys
180185190
ValTrpAspGlyGlyValValSerAspLeuValThrValAspArgAsn
195200205
TyrPheLeuPheGlyArgAlaAlaHisLeuPheGluAspSerPheSer
210215220
SerGluHisThrValArgValSerAspAspAsnPheGluLeuValArg
225230235240
GlnValLysSerTyrMetCysAlaAlaGlySerGluGlnHisThrHis
245250255
SerAsnGluLysIlePheAsnTyrThrSerGlyAspValIleTrpLys
260265270
ProGlyThrGlyLeuAspProSerTrpSerAlaTyrLysProSerAsn
275280285
MetLysThrValAlaLeuValAlaThrGluAlaThrLysAspLeuTrp
290295300
AlaAlaPheIleArgSerMetGlyThrProIleAlaGlnArgGluGln
305310315320
TrpAlaArgLysGluAlaAsnLysLeuAlaAspAsnTrpLeuAlaPhe
325330335
AspLysTyrLysLeuProAspTrpTyrAspIleGluAlaHisArgAsp
340345350
AspThrTyrValLeuAlaAspGlyGlnThrGlyLysGlyGlnThrVal
355360365
AlaAlaCysMetGlnLysLeuGlyValAlaSerGlyLysGlnGluAsp
370375380
LysValArgGlnLeuGluAlaAspGlnLysThrCysLeuTyrAsnVal
385390395400
ValAlaGluGluGlyTyrAlaAspLeuPheAspProAlaPheHisMet
405410415
ProPheAsnTrpArgTrpLysThrGlyArgPheGlyAspTrpLeuGln
420425430
ProProAlaGlyTrpLysIleProThrArgProAlaAspThrGlyThr
435440445
ArgValAsnIleLeuSerAlaThrAsnAsnLeuProMetValAlaAla
450455460
AspGlyValSerHisAsnGlnTrpValTyrValLysAlaGlyPhePro
465470475480
AlaLeuGlyPheIleLysValProAspGluAsnAsnThrAspLysLys
485490495
AsnSerIlePheTyrArgValIleAsnAspProAspLeuPheLeuSer
500505510
TyrAsnAlaThrThrGlyAlaValLysLeuTrpAlaSerProAsnGln
515520525
AlaAsnTyrAlaThrGluProLysSerGlyAsnIleAlaIleLysSer
530535540
LeuTyrTrpAspGlnTyrMetTrpLeuSerAsnGluSerProTyrIle
545550555560
ThrArgThrGlyAsnProLysAsnLeuAspAlaGlnTrpLysGluVal
565570575
AlaAlaLys
<210>163
<211>1104
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>163
atgcaagtcaatggtgcaattgcagttactgatccggcgttgagcaatgcagtggaagca60
acctcttaccagacatctgaacagattgtgggtggagtaagcgaagcggcggaagcaggg120
ttggcggcagaagtgggcgcggcggagacgttcgctgcagctgacgatgttgccctttca180
tccatggtcgccggcccggctaatgatgcctcttacggcaacctgcccgcagggtgggat240
gaggcccggtttgatcatgccctggatatggccaagttgtcctctcaggcctacagcagt300
ttcaatgacagaactgtagatcttctactggcgccgtttagcggtatcaatgacataaaa360
aatcaagatttctccaccgataattatctccctataaattccggtggcaaatctgacttc420
ctgttgcccctgcagaatgggctggactatacggtcttccagcaagtcaccgatcctaat480
ggtgtcgatcatgccgccaagactgccggcggcgatatcgttctttccttccggggcagt540
gaacccacatccgccccggattgggtgaacaatgtgaagcaggccgctggccattctccc600
caatatggggccgcggtaaatgtggcgagggatttgcagcagcaagtggatgcctataat660
gagaagcatgggcttgaaggcgacgctgccatgaagctccacttcaccggccacagcctg720
ggtggcggattggccactgccgctgccctggctaccggtagcgaagcgacagtctttaat780
gctgccggtctctcagaccataccattaacaaccttggcctggacgcaagccatgccgac840
aaggtgaccaatattaacgtggaaggcgatctgctgagcgatggcaaccggcagaaggat900
gctcacaccacgggctctggtgtctttggcgataccaagcaatatggtgagcaggtctgg960
ctgcagggtgtagatgaccgcgcaagatttggcggccctctcaacttcctggtgccgggc1020
tttgtcaacgacctggccattcaggggcttaatcacgcctggcatgtgtatacctaccaa1080
ttggaaaaccgcaactttgcctga1104
<210>164
<211>367
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(174)...(296)
<223>脂酶(类型3)
<400>164
MetGlnValAsnGlyAlaIleAlaValThrAspProAlaLeuSerAsn
151015
AlaValGluAlaThrSerTyrGlnThrSerGluGlnIleValGlyGly
202530
ValSerGluAlaAlaGluAlaGlyLeuAlaAlaGluValGlyAlaAla
354045
GluThrPheAlaAlaAlaAspAspValAlaLeuSerSerMetValAla
505560
GlyProAlaAsnAspAlaSerTyrGlyAsnLeuProAlaGlyTrpAsp
65707580
GluAlaArgPheAspHisAlaLeuAspMetAlaLysLeuSerSerGln
859095
AlaTyrSerSerPheAsnAspArgThrValAspLeuLeuLeuAlaPro
100105110
PheSerGlyIleAsnAspIleLysAsnGlnAspPheSerThrAspAsn
115120125
TyrLeuProIleAsnSerGlyGlyLysSerAspPheLeuLeuProLeu
130135140
GlnAsnGlyLeuAspTyrThrValPheGlnGlnValThrAspProAsn
145150155160
GlyValAspHisAlaAlaLysThrAlaGlyGlyAspIleValLeuSer
165170175
PheArgGlySerGluProThrSerAlaProAspTrpValAsnAsnVal
180185190
LysGlnAlaAlaGlyHisSerProGlnTyrGlyAlaAlaValAsnVal
195200205
AlaArgAspLeuGlnGlnGlnValAspAlaTyrAsnGluLysHisGly
210215220
LeuGluGlyAspAlaAlaMetLysLeuHisPheThrGlyHisSerLeu
225230235240
GlyGlyGlyLeuAlaThrAlaAlaAlaLeuAlaThrGlySerGluAla
245250255
ThrValPheAsnAlaAlaGlyLeuSerAspHisThrIleAsnAsnLeu
260265270
GlyLeuAspAlaSerHisAlaAspLysValThrAsnIleAsnValGlu
275280285
GlyAspLeuLeuSerAspGlyAsnArgGlnLysAspAlaHisThrThr
290295300
GlySerGlyValPheGlyAspThrLysGlnTyrGlyGluGlnValTrp
305310315320
LeuGlnGlyValAspAspArgAlaArgPheGlyGlyProLeuAsnPhe
325330335
LeuValProGlyPheValAsnAspLeuAlaIleGlnGlyLeuAsnHis
340345350
AlaTrpHisValTyrThrTyrGlnLeuGluAsnArgAsnPheAla
355360365
<210>165
<211>927
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>165
atgcccaaatacagaattcttagtttggacggcggcggaatccgggggctgctcagcgcg60
attctgctcgagcggttggaagcggaggcacccaattggctgagccaggtggacctgatc120
gccggcacatccaccggcgggatcatcgccctgggtctcgccaaaggcctcagcccaacc180
caactgcgcaatctctatcaactgcgcggggcggcgatattcgatgattcatggtgggac240
gacgtgctcgatattgggaagatttcgggcgcggattatgataacaagcaactcaccaaa300
gagttgaagacgattctcggcaacacgaaactgcgcgagttgtcgaagcgggttttgatt360
tcgagtttcgatctggacagtgaagagcgcgatcccaccaaacgaagttggacgccgaag420
ttcttccacaacttcccgggcatcgacagcgacggcgagcaactggcctacaaggtggcg480
ctgtacaccagtgccgcgccgacgtattttccgaccgtggacgggtacatcgatggcggt540
gtggtggccaacaaccccagcatggcagccctcgcgcaaacgcaggacacccgcgcgctg600
aaaacaccgccgcgcttctccgaaatccggctgctctcgatcggcacgggcaaatccctc660
tatcgcatcgaagggcagaacctggactggggctacgcccagtgggccaagccgctcatc720
aacatcatgatggacggcgtgatgggtgtggcagattaccagtgccggcaggtcctggac780
gacaattattgccggatttcgcccaccttcccgcccggcgcggtgtttcccttggacggt840
gtcaaacagattcccgacctggtgacctttgccacttccgtggacctcacgcgcgccgtt900
cagtggatcaagagcaagtgggcttag927
<210>166
<211>308
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(7)...(191)
<223>Patatin-样磷脂酶
<400>166
MetProLysTyrArgIleLeuSerLeuAspGlyGlyGlyIleArgGly
151015
LeuLeuSerAlaIleLeuLeuGluArgLeuGluAlaGluAlaProAsn
202530
TrpLeuSerGlnValAspLeuIleAlaGlyThrSerThrGlyGlyIle
354045
IleAlaLeuGlyLeuAlaLysGlyLeuSerProThrGlnLeuArgAsn
505560
LeuTyrGlnLeuArgGlyAlaAlaIlePheAspAspSerTrpTrpAsp
65707580
AspValLeuAspIleGlyLysIleSerGlyAlaAspTyrAspAsnLys
859095
GlnLeuThrLysGluLeuLysThrIleLeuGlyAsnThrLysLeuArg
100105110
GluLeuSerLysArgValLeuIleSerSerPheAspLeuAspSerGlu
115120125
GluArgAspProThrLysArgSerTrpThrProLysPhePheHisAsn
130135140
PheProGlyIleAspSerAspGlyGluGlnLeuAlaTyrLysValAla
145150155160
LeuTyrThrSerAlaAlaProThrTyrPheProThrValAspGlyTyr
165170175
IleAspGlyGlyValValAlaAsnAsnProSerMetAlaAlaLeuAla
180185190
GlnThrGlnAspThrArgAlaLeuLysThrProProArgPheSerGlu
195200205
IleArgLeuLeuSerIleGlyThrGlyLysSerLeuTyrArgIleGlu
210215220
GlyGlnAsnLeuAspTrpGlyTyrAlaGlnTrpAlaLysProLeuIle
225230235240
AsnIleMetMetAspGlyValMetGlyValAlaAspTyrGlnCysArg
245250255
GlnValLeuAspAspAsnTyrCysArgIleSerProThrPheProPro
260265270
GlyAlaValPheProLeuAspGlyValLysGlnIleProAspLeuVal
275280285
ThrPheAlaThrSerValAspLeuThrArgAlaValGlnTrpIleLys
290295300
SerLysTrpAla
305
<210>167
<211>522
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>167
atggcgaggagctggaagtggaggccgcttcttagctctttcttattggtatccttggcg60
cccttctcgacgtccgtgccttgcttcaagctacccggccttgagagcgtggccttctgg120
ataagcactactatgaacttcttcccgttcctcctctacacggctatactagcctacgtt180
aggaaagactacaaaatagtgctagaggggctcgccctgaacgcgttcgtgctcgtcctc240
aagtactcgttccacacccccaggccggagggctctggccacctaaccccgggctacccc300
tccggccacacggcgagggccttctggctggcgctcgagctcgaaggggtctggaggtac360
cctatgttaacctacgcggctctggtcgcgtggtcgcgcgttcagctctgcgcgcactac420
ccgctggacgtagtgggaggagcgttgagcgctttggccttccgcgacttatgggaggtt480
ctgctggagagggtaggagccttgagggggcagcgcgcttag522
<210>168
<211>173
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(30)
<220>
<221>结构域
<222>(48)...(167)
<223>PAP2超家族
<400>168
MetAlaArgSerTrpLysTrpArgProLeuLeuSerSerPheLeuLeu
151015
ValSerLeuAlaProPheSerThrSerValProCysPheLysLeuPro
202530
GlyLeuGluSerValAlaPheTrpIleSerThrThrMetAsnPhePhe
354045
ProPheLeuLeuTyrThrAlaIleLeuAlaTyrValArgLysAspTyr
505560
LysIleValLeuGluGlyLeuAlaLeuAsnAlaPheValLeuValLeu
65707580
LysTyrSerPheHisThrProArgProGluGlySerGlyHisLeuThr
859095
ProGlyTyrProSerGlyHisThrAlaArgAlaPheTrpLeuAlaLeu
100105110
GluLeuGluGlyValTrpArgTyrProMetLeuThrTyrAlaAlaLeu
115120125
ValAlaTrpSerArgValGlnLeuCysAlaHisTyrProLeuAspVal
130135140
ValGlyGlyAlaLeuSerAlaLeuAlaPheArgAspLeuTrpGluVal
145150155160
LeuLeuGluArgValGlyAlaLeuArgGlyGlnArgAla
165170
<210>169
<211>579
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>169
atgagcattcgcgcagtcttcttcgaccttggcggagtcatcgtccgcactgaatatcaa60
tcaccgcgccagcagctggcagaccggcttggcctggactacgatgacttgagcaggatc120
gtctttgatagcgagacgggcatcaaggcgacggttggcacgatcacatcccagcagcat180
tgggaagcggtgatgaaacgcctgaaacgccctcatgaggaaattaccgccatccgcgat240
gaattctttgcaggcgacatcattgaccgtgagatcatcagtttcctccgttcactgcgc300
ggcacctgcaaaaccggattgatctcgaacgcctggagcgacttgcgcgactttatgaca360
cgcgaaaaaataatcgacgccttcgaccatatcatcatctcgtcggaggtaggtgtggcc420
aagccggaagcgaagatcttccagattgccctggagcaggccggggtgagtccgaacgag480
gcggtgtttgtcgatgatttttacgtcaatatcgaaggctgtgaaaaagtcggaatgaag540
ggcattcattttaaggaccccgaatccgctttggctcaa579
<210>170
<211>193
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(3)...(187)
<223>卤酸脱卤酶样水解酶
<400>170
MetSerIleArgAlaValPhePheAspLeuGlyGlyValIleValArg
151015
ThrGluTyrGlnSerProArgGlnGlnLeuAlaAspArgLeuGlyLeu
202530
AspTyrAspAspLeuSerArgIleValPheAspSerGluThrGlyIle
354045
LysAlaThrValGlyThrIleThrSerGlnGlnHisTrpGluAlaVal
505560
MetLysArgLeuLysArgProHisGluGluIleThrAlaIleArgAsp
65707580
GluPhePheAlaGlyAspIleIleAspArgGluIleIleSerPheLeu
859095
ArgSerLeuArgGlyThrCysLysThrGlyLeuIleSerAsnAlaTrp
100105110
SerAspLeuArgAspPheMetThrArgGluLysIleIleAspAlaPhe
115120125
AspHisIleIleIleSerSerGluValGlyValAlaLysProGluAla
130135140
LysIlePheGlnIleAlaLeuGluGlnAlaGlyValSerProAsnGlu
145150155160
AlaValPheValAspAspPheTyrValAsnIleGluGlyCysGluLys
165170175
ValGlyMetLysGlyIleHisPheLysAspProGluSerAlaLeuAla
180185190
Gln
<210>171
<211>834
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>171
atgggcaaagcgatgttcttcacggcagatgacggggcgcggctggcctattctgaccag60
ggtaaggggctgccggtcctgtgcctggccgggctgacgcggaacatgggcgatttcaat120
tacgtcgctccgcatctgtcgggcgtgcggctgatccggatggactatcgcggacgcggg180
cagtccgaccgcaccggcgccgccacctataccgtcccgcaggaaggcaaggatgcgctg240
gcgctgctggatcacctgggggtggacagggccgcgatcctgggcacgtctcgcggcggg300
ctgatcgggatgctgctggccgccgtggcgcatgaccggctgctggggctgtgcctgaac360
gatgtcggcccggtgatcgagcgcgcggggctggagcggatcttcgactatgtcgggcgc420
aacccggcggcgcggacgcatgaggcgctggcggaacgactgcctgcggccatgcccggc480
ttcacaaatgtccccgatggccgttggctggcggatgcgcagaagcattacgacgaaacg540
ccggaggggctgcggatcaaatatgaccctgccctgcgcgaggcgttcctggcagccttc600
gagggcgctgcgccggatctgtggccgctgtgggatgcgactgcgggactgcccgtcgcg660
ctgatccggggggccagttccgacctgctgtctgctacggttgccgccgagatgctgcgc720
cgccgccccgacacgatctttgccgaggttccgggccgcgcccatgtgccttggctggac780
gagccggaatcgctggatgcgatcaatgcctggctggatcgctgcgggcgctag834
<210>172
<211>277
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>172
MetGlyLysAlaMetPhePheThrAlaAspAspGlyAlaArgLeuAla
151015
TyrSerAspGlnGlyLysGlyLeuProValLeuCysLeuAlaGlyLeu
202530
ThrArgAsnMetGlyAspPheAsnTyrValAlaProHisLeuSerGly
354045
ValArgLeuIleArgMetAspTyrArgGlyArgGlyGlnSerAspArg
505560
ThrGlyAlaAlaThrTyrThrValProGlnGluGlyLysAspAlaLeu
65707580
AlaLeuLeuAspHisLeuGlyValAspArgAlaAlaIleLeuGlyThr
859095
SerArgGlyGlyLeuIleGlyMetLeuLeuAlaAlaValAlaHisAsp
100105110
ArgLeuLeuGlyLeuCysLeuAsnAspValGlyProValIleGluArg
115120125
AlaGlyLeuGluArgIlePheAspTyrValGlyArgAsnProAlaAla
130135140
ArgThrHisGluAlaLeuAlaGluArgLeuProAlaAlaMetProGly
145150155160
PheThrAsnValProAspGlyArgTrpLeuAlaAspAlaGlnLysHis
165170175
TyrAspGluThrProGluGlyLeuArgIleLysTyrAspProAlaLeu
180185190
ArgGluAlaPheLeuAlaAlaPhcGluGlyAlaAlaProAspLeuTrp
195200205
ProLeuTrpAspAlaThrAlaGlyLeuProValAlaLeuIleArgGly
210215220
AlaSerSerAspLeuLeuSerAlaThrValAlaAlaGluMetLeuArg
225230235240
ArgArgProAspThrIlePheAlaGluValProGlyArgAlaHisVal
245250255
ProTrpLeuAspGluProGluSerLeuAspAlaIleAsnAlaTrpLeu
260265270
AspArgCysGlyArg
275
<210>173
<211>642
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>173
gtgagcgggctggccggggtgctcttcgacatgggtggcgtggtcatggactcgccgctg60
cacgccatcgcgcggtacgagcgggagcgcgggctgccgccgcactcgatcaaccgcgcg120
atcgcgaccgccggcgagacgggggcgtgggcccgactcgagcgcggcgagctgaccgtg180
gcgacgttctgcgcaccgttcgaagcggactgtcgcgcccgcggcgtcgaggtggatggg240
gcggcggtcatggccgcgatcgccgcggccggcgtggcgcgccccgccatgctggaggcg300
attcgcagactccgcgcgcacgggctccgcgtcggcgcgctcaccaacaactggcggcga360
gaaggacccgacgacgacgtgatcccgcaccgtctgcgctcccacttcgacgccttcgtg420
gaatcacgcgcggtcggcctgcgcaagcccgacccgcgaatctacgtgctggcctgccac480
gagctgggcgtggagccgtcgcggacggcgttcctcgacgacatcggcggcaacctcaag540
ccggcgcgcgcgctcgggatggcgacgatcaaggtggacgacccggagcgggcgctggtg600
gagctcggtgtgctcgtggagatggacctgctcggcccgtga642
<210>174
<211>213
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(4)...(195)
<223>卤酸脱卤酶样水解酶
<400>174
MetSerGlyLeuAlaGlyValLeuPheAspMetGlyGlyValValMet
151015
AspSerProLeuHisAlaIleAlaArgTyrGluArgGluArgGlyLeu
202530
ProProHisSerIleAsnArgAlaIleAlaThrAlaGlyGluThrGly
354045
AlaTrpAlaArgLeuGluArgGlyGluLeuThrValAlaThrPheCys
505560
AlaProPheGluAlaAspCysArgAlaArgGlyValGluValAspGly
65707580
AlaAlaValMetAlaAlaIleAlaAlaAlaGlyValAlaArgProAla
859095
MetLeuGluAlaIleArgArgLeuArgAlaHisGlyLeuArgValGly
100105110
AlaLeuThrAsnAsnTrpArgArgGluGlyProAspAspAspValIle
115120125
ProHisArgLeuArgSerHisPheAspAlaPheValGluSerArgAla
130135140
ValGlyLeuArgLysProAspProArgIleTyrValLeuAlaCysHis
145150155160
GluLeuGlyValGluProSerArgThrAlaPheLeuAspAspIleGly
165170175
GlyAsnLeuLysProAlaArgAlaLeuGlyMetAlaThrIleLysVal
180185190
AspAspProGluArgAlaLeuValGluLeuGlyValLeuValGluMet
195200205
AspLeuLeuGlyPro
210
<210>175
<211>245
<212>PRT
<213>合成的
<220>
<223>合成产生
<400>175
TrpSerAlaGluAspLysHisAsnGluGlyIleAsnSerHisLeuTrp
151015
IleValAsnArgAlaIleAspIleMetSerArgAsnThrThrIleVal
202530
AsnProAsnGluThrAlaLeuLeuAsnGluTrpArgAlaAspLeuGlu
354045
AsnGlyIleTyrSerAlaAspTyrGluAsnProTyrTyrAspAspSer
505560ThrTyrAlaSerHisPheTyrAspProAspThrGlyThrThrTyrIle
65707580
ProPheAlaLysHisAlaLysGluThrGlyAlaLysTyrPheAsnLeu
859095
AlaGlyGlnAlaTyrGlnAsnGlnAspMetGlnGlnAlaPhePheTyr
100105110
LeuGlyLeuSerLeuHisTyrLeuGlyAspValAsnGlnProMetHis
115120125
AlaAlaSerPheThrAspLeuSerTyrProMetGlyPheHisSerLys
130135140
TyrGluAsnPheValAspThrIleLysAsnAsnTyrIleValSerAsp
145150155160
SerAsnGlyTyrTrpAsnTrpLysGlyAlaAsnProGluAspTrpIle
165170175
GluGlyAlaAlaValAlaAlaLysGlnAspTyrProGlyValValAsn
180185190
AspThrThrLysAspTrpPheValLysAlaAlaValSerGlnGluTyr
195200205
AlaAspLysTrpArgAlaGluValThrProValThrGlyLysArgLeu
210215220
MetGluAlaGlnArgValThrAlaGlyTyrIleHisLeuTrpPheAsp
225230235240
ThrTyrValAsnArg
245
<210>176
<211>282
<212>PRT
<213>合成的
<220>
<223>合成产生
<220>
<221>信号
<222>(1)...(37)
<400>176
MetLysLysLysValLeuAlaLeuAlaAlaMetValAlaLeuAlaAla
151015
ProValGlnSerValValPheAlaGlnThrAsnAsnSerGluSerPro
202530
AlaProIleLeuArgTrpSerAlaGluAspLysHisAsnGluGlyIle
354045
AsnSerHisLeuTrpIleValAsnArgAlaIleAspIleMetSerArg
505560
AsnThrThrIleValAsnProAsnGluThrAlaLeuLeuAsnGluTrp
65707580
ArgAlaAspLeuGluAsnGlyIleTyrSerAlaAspTyrGluAsnPro
859095
TyrTyrAspAspSerThrTyrAlaSerHisPheTyrAspProAspThr
100105110
GlyThrThrTyrIleProPheAlaLysHisAlaLysGluThrGlyAla
115120125
LysTyrPheAsnLeuAlaGlyGlnAlaTyrGlnAsnGlnAspMetGln
130135140
GlnAlaPhePheTyrLeuGlyLeuSerLeuHisTyrLeuGlyAspVal
145150155160
AsnGlnProMetHisAlaAlaSerPheThrAspLeuSerTyrProMet
165170175
GlyPheHisSerLysTyrGluAsnPheValAspThrIleLysAsnAsn
180185190
TyrIleValSerAspSerAsnGlyTyrTrpAsnTrpLysGlyAlaAsn
195200205
ProGluAspTrpIleGluGlyAlaAlaValAlaAlaLysGlnAspTyr
210215220
ProGlyValValAsnAspThrThrLysAspTrpPheValLysAlaAla
225230235240
ValSerGlnGluTyrAlaAspLysTrpArgAlaGluValThrProVal
245250255
ThrGlyLysArgLeuMetGluAlaGlnArgValThrAlaGlyTyrIle
260265270
HisLeuTrpPheAspThrTyrValAsnArg
275280
<210>177
<211>849
<212>DNA
<213>合成的
<220>
<223>合成产生
<400>177
atgaaaaagaaagtattagcactagcagctatggttgctttagctgcgccagttcaaagt60
gtagtatttgcacaaacaaataatagtgaaagtcctgcaccgattttaagatggtcagct120
gaggataagcataatgaggggattaactctcatttgtggattgtaaatcgtgcaattgac180
atcatgtctcgtaatacaacgattgtgaatccgaatgaaactgcattattaaatgagtgg240
cgtgctgatttagaaaatggtatttattctgctgattacgagaatccttattatgatgat300
agtacatatgcttctcacttttatgatccggatactggaacaacatatattccttttgcg360
aaacatgcaaaagaaacaggcgcaaaatattttaaccttgctggtcaagcataccaaaat420
caagatatgcagcaagcattcttctacttaggattatcgcttcattatttaggagatgtg480
aatcagccaatgcatgcagcatcttttacggatctttcttatccaatgggtttccattct540
aaatacgaaaattttgttgatacaataaaaaataactatattgtttcagatagcaatgga600
tattggaattggaaaggagcaaacccagaagattggattgaaggagcagcggtagcagct660
aaacaagattatcctggcgttgtgaacgatacgacaaaagattggtttgtaaaagcagcc720
gtatctcaagaatatgcagataaatggcgtgcggaagtaacaccggtgacaggaaagcgt780
ttaatggaagcgcagcgcgttacagctggttatattcatttgtggtttgatacgtatgta840
aatcgctaa849
<210>178
<211>738
<212>DNA
<213>人工的
<220>
<223>合成产生
<400>178
tggtcagctgaggataagcataatgaggggattaactctcatttgtggattgtaaatcgt60
gcaattgacatcatgtctcgtaatacaacgattgtgaatccgaatgaaactgcattatta120
aatgagtggcgtgctgatttagaaaatggtatttattctgctgattacgagaatccttat180
tatgatgatagtacatatgcttctcacttttatgatccggatactggaacaacatatatt240
ccttttgcgaaacatgcaaaagaaacaggcgcaaaatattttaaccttgctggtcaagca300
taccaaaatcaagatatgcagcaagcattcttctacttaggattatcgcttcattattta360
ggagatgtgaatcagccaatgcatgcagcatcttttacggatctttcttatccaatgggt420
ttccattctaaatacgaaaattttgttgatacaataaaaaataactatattgtttcagat480
agcaatggatattggaattggaaaggagcaaacccagaagattggattgaaggagcagcg540
gtagcagctaaacaagattatcctggcgttgtgaacgatacgacaaaagattggtttgta600
aaagcagccgtatctcaagaatatgcagataaatggcgtgcggaagtaacaccggtgaca660
ggaaagcgtttaatggaagcgcagcgcgttacagctggttatattcatttgtggtttgat720
acgtatgtaaatcgctaa738

Claims (41)

1.分离的、合成的或者重组的核酸序列,其为编码具有磷脂酶活性的多肽的根据SEQIDNO:177的核酸序列,其相对于SEQIDNO:177具有一个编码选自以下的氨基酸突变的突变:E41A、E41W、E41F、E41Y、E41R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、D171V、D171E和M176W。
2.权利要求1所述的核酸,其中在隐蔽转录起始位点的核苷酸残基被修饰以消除大部分或所有截短转录体的产生。
3.权利要求2所述的核酸,其中所述在隐蔽转录起始位点的核苷酸残基修饰是在核糖体结合位点中的改变。
4.与权利要求1中所述的核苷酸序列完全互补的核酸序列。
5.载体或表达盒,其包括权利要求1所述的核酸序列,其中所述载体或表达盒包含在病毒载体、质粒、噬菌体、噬菌粒、粘粒、人工染色体中。
6.载体或表达盒,其包括权利要求1所述的核酸序列,其中所述载体或表达盒是腺病毒载体、逆转录病毒载体、腺相关病毒载体、细菌人工染色体、细菌噬菌体P1衍生载体、酵母人工染色体、或者哺乳动物人工染色体。
7.权利要求5所述的载体或表达盒,其中所述载体是克隆载体。
8.权利要求5所述的载体或表达盒,其中所述噬菌体是细菌噬菌体。
9.权利要求5所述的载体或表达盒,其中所述粘粒是F粘粒。
10.宿主细胞或转化细胞,其包括权利要求1所述的核酸序列,或权利要求5所述的载体或表达盒,并且所述的宿主细胞或转化细胞是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或者植物细胞。
11.分离的、合成的或者重组的多肽,其为具有磷脂酶活性的根据SEQIDNO:176的氨基酸序列,并且其相对于SEQIDNO:176具有一个选自以下的氨基酸突变:E41A、E41W、E41F、E41Y、E41R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、D171V、D171E和M176W。
12.权利要求11所述的多肽,其中所述多肽由权利要求1所述的核酸编码。
13.权利要求11所述的多肽,其中所述多肽缺乏信号序列或原蛋白序列。
14.权利要求11所述的多肽,其中所述多肽进一步包含异源氨基酸序列。
15.权利要求11所述的多肽,其中所述多肽进一步包含信号序列、标记或表位。
16.权利要求11所述的多肽,其中所述多肽在至少一个糖基化位点中被糖基化。
17.权利要求16所述的多肽,其中所述糖基化是N-连接糖基化或O-连接糖基化。
18.权利要求16所述的多肽,其中所述多肽在酵母细胞中表达后进行糖基化并且所述酵母细胞是巴斯德毕赤酵母或粟酒裂殖酵母。
19.固定化多肽,其中所述多肽是权利要求11所述的多肽并且被固定在细胞、金属、树脂、聚合物、陶瓷、玻璃、微电极、石墨颗粒、珠子、凝胶、板、阵列或者毛细管上。
20.生产重组多肽的方法,其包括:
(a)提供权利要求1所述的核酸;以及(b)在允许所述多肽表达的条件下表达步骤(a)所述的核酸,从而生产重组多肽。
21.修饰编码磷脂酶多肽的核酸中的密码子的方法,所述方法包括:
(a)提供权利要求1所述的核酸序列;以及
(b)确定步骤(a)的核酸中的密码子,并用编码相同氨基酸的不同密码子作为替代密码子来替换之,从而修饰编码磷脂酶的核酸中的密码子。
22.水解、分解、液化或破坏含磷脂组合物的方法,其包括:
(a)提供权利要求11所述的多肽;
(b)提供含磷脂组合物;以及
(c)在所述磷脂酶水解、分解、液化或破坏所述含磷脂组合物的条件下,将步骤(a)所述的多肽与步骤(b)所述组合物接触。
23.组合物,其包括权利要求11所述的多肽或权利要求1所述的核酸。
24.脱胶油或脂肪的方法,其包括:
(a)提供权利要求11所述的多肽;
(b)提供包括脂肪或油的组合物;以及
(c)将步骤(a)所述的多肽与步骤(b)所述的组合物接触。
25.权利要求24所述的方法,其中所述油是或包括植物油、动物油或藻类油。
26.权利要求24所述的方法,其中所述油是或包括鱼油。
27.权利要求25所述的方法,其中所述植物油是米糠油、大豆油、油菜籽油、玉米油、棕榈仁的油、油菜油、葵花油、芝麻油或花生油。
28.权利要求24所述的方法,其中所述多肽结合于过滤器,并使脂肪或者油通过所述过滤器。
29.权利要求24所述的方法,其中所述多肽加入到脂肪或油的溶液中,然后使所述溶液通过过滤器。
30.权利要求24所述的方法,其中所述多肽增加了中性油在处理的脂肪或油中的量。
31.权利要求24所述的方法,其中所述多肽增加二酰甘油的产生以增加油相,或其中最终脱胶油或脂肪产物的1,3-DAG得以富集,或其中所述最终脱胶油或脂肪产物包括不少于1.0%的1,3-DAG。
32.权利要求24所述的方法,其中一种或多种另外的多肽被提供,并且所述一种或多种多肽是蛋白酶、淀粉酶、脂酶、角质酶、另一种磷脂酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯聚糖酶、半乳聚糖酶、木聚糖酶、氧化酶、乳糖酶、过氧化物酶或其组合。
33.将非水合磷脂转化为水合形式的方法,包括:
(a)提供权利要求11的多肽;
(b)提供包括非水合磷脂的组合物;以及
(c)在所述多肽将非水合磷脂转化为水合形式的条件下,将步骤(a)所述的多肽与步骤(b)所述组合物接触。
34.碱法精炼含磷脂组合物的方法,其包括:
(a)提供权利要求11的多肽;
(b)提供含磷脂组合物;以及
(c)在碱法精炼之前、期间或者之后,将步骤(a)所述的多肽与步骤(b)所述的组合物接触。
35.精炼油或脂肪的方法,其包括:
(a)提供权利要求11的多肽;
(b)提供包括油或脂肪的组合物;以及
(c)将步骤(a)所述的多肽与步骤(b)所述的组合物接触。
36.物理精炼含磷脂组合物的方法,其包括:
(a)提供权利要求11的多肽;
(b)提供含有磷脂的组合物;以及
(c)将步骤(a)所述的多肽与步骤(b)所述的组合物接触。
37.通过减少油被夹带走的数量来减少胶质量并增加中性油产量的方法,其包括:
(a)提供权利要求11的多肽;
(b)提供包括含有磷脂的脂肪或油的组合物;以及
(c)在所述多肽能够催化水解组合物中的磷脂一段时间以足以减少胶质量和增加中性油的条件下,将步骤(a)所述的多肽与步骤(b)所述的组合物接触。
38.分离的、合成的或者重组的磷脂酶,其由权利要求20所述的方法制备。
39.制造生物燃料的方法,其包括:
(a)提供权利要求11所述的多肽;
(b)提供包括磷脂的生物质组合物;
(c)将(a)所述的多肽与(b)所述的生物质组合物接触。
40.权利要求39所述的方法,其中所述生物燃料是生物柴油或包括生物柴油。
41.权利要求39所述的方法,其中所述生物质组合物包括藻类、植物油、动物脂肪、动物脂。
CN200780042983.3A 2006-09-21 2007-09-21 磷脂酶、编码它们的核酸及其制备和应用方法 Expired - Fee Related CN101558154B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US82651206P 2006-09-21 2006-09-21
US60/826,512 2006-09-21
PCT/US2007/079109 WO2008036863A2 (en) 2006-09-21 2007-09-21 Phospholipases, nucleic acids encoding them and methods for making and using them

Publications (2)

Publication Number Publication Date
CN101558154A CN101558154A (zh) 2009-10-14
CN101558154B true CN101558154B (zh) 2016-02-24

Family

ID=39201292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780042983.3A Expired - Fee Related CN101558154B (zh) 2006-09-21 2007-09-21 磷脂酶、编码它们的核酸及其制备和应用方法

Country Status (13)

Country Link
US (1) US8637290B2 (zh)
EP (1) EP2057274B1 (zh)
KR (1) KR20090068266A (zh)
CN (1) CN101558154B (zh)
AR (1) AR062947A1 (zh)
BR (1) BRPI0716872A2 (zh)
CA (1) CA2663001A1 (zh)
EA (1) EA015591B1 (zh)
ES (1) ES2451266T3 (zh)
MX (1) MX2009003034A (zh)
PL (1) PL2057274T3 (zh)
PT (1) PT2057274E (zh)
WO (1) WO2008036863A2 (zh)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0209154A (pt) 2001-05-18 2004-07-20 Danisco Processo de preparação de uma massa com uma enzima
US20080070291A1 (en) 2004-06-16 2008-03-20 David Lam Compositions and Methods for Enzymatic Decolorization of Chlorophyll
ATE514767T1 (de) 2004-07-16 2011-07-15 Danisco Enzymatisches öldegummierungsverfahren
EA020035B1 (ru) 2007-12-21 2014-08-29 ДюПон НЬЮТРИШН БАЙОСАЙЕНСИЗ АпС Способы
EP2246440A1 (en) * 2009-04-29 2010-11-03 Aterovax Enzymatic assay for the quantitative determination of phospholipase a1 or a2 activity in a sample
UA109884C2 (uk) * 2009-10-16 2015-10-26 Поліпептид, що має активність ферменту фосфатидилінозитол-специфічної фосфоліпази с, нуклеїнова кислота, що його кодує, та спосіб його виробництва і застосування
UA111708C2 (uk) 2009-10-16 2016-06-10 Бандж Ойлз, Інк. Спосіб рафінування олії
US9670513B2 (en) 2011-01-21 2017-06-06 Novozymes A/S Production of fatty acid alkyl esters
US20130014431A1 (en) * 2011-07-11 2013-01-17 Phillips 66 Company Advanced, biomass-derived, low-sulfur bunker fuels
KR101336785B1 (ko) * 2011-11-18 2013-12-04 한국생명공학연구원 갯벌 메타게놈 유래 신규 유전자 및 이로부터 얻어지는 포스포리파제 및 리파제 동시 활성을 보이는 신규 단백질
WO2013121047A1 (de) 2012-02-17 2013-08-22 Clariant Produkte (Deutschland) Gmbh Verfahren für die enzymatische ölentschleimung
GB201208105D0 (en) * 2012-05-09 2012-06-20 Univ Dundee Modified plants
EP2885411B1 (en) 2012-08-16 2018-12-05 VIB vzw Means and methods for altering the lignin pathway in plants
RU2517538C1 (ru) * 2012-11-22 2014-05-27 Федеральное государственное бюджетное учреждение науки институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук (ИБХ РАН) Фосфолипидный флуоресцентный зонд и тест-система для определения активности фосфолипазы а2 в сыворотке крови
EP2931744B1 (en) * 2012-12-11 2021-08-18 Novozymes A/S Polypeptides having phospholipase c activity and polynucleotides encoding same
BR112015014339B1 (pt) * 2012-12-20 2021-08-10 Cargill, Incorporated Processo para a produção de um fluido dielétrico
WO2014140924A2 (en) * 2013-03-12 2014-09-18 International Park Of Creativity Biological devices and methods for increasing the production of lycopene from plants
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
KR102571391B1 (ko) 2013-09-13 2023-08-29 제넨테크, 인크. 정제된 재조합 폴리펩티드를 포함하는 방법 및 조성물
PL3044323T3 (pl) 2013-09-13 2022-06-27 F.Hoffmann-La Roche Ag Sposoby wykrywania i ilościowego oznaczania białka komórki gospodarza w liniach komórkowych
CN104560910B (zh) * 2013-10-16 2021-03-26 丰益(上海)生物技术研发中心有限公司 提高毕赤酵母发酵产磷脂酶c产量的培养基及方法
CN104630175B (zh) * 2013-11-14 2019-10-25 丰益(上海)生物技术研发中心有限公司 一种磷脂酶c
EP2910129A1 (de) * 2014-02-21 2015-08-26 Clariant Produkte (Deutschland) GmbH Zusammensetzung für die enzymatische Ölentschleimung
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
EP3122874A4 (en) * 2014-03-27 2017-08-16 Novozymes A/S Polypeptides having phospholipase c activity and polynucleotides encoding same
US9616114B1 (en) 2014-09-18 2017-04-11 David Gordon Bermudes Modified bacteria having improved pharmacokinetics and tumor colonization enhancing antitumor activity
US20180168175A1 (en) 2015-04-14 2018-06-21 Dsm Ip Assets B.V. Use of phospholipase c
CN113913475A (zh) 2015-10-09 2022-01-11 诺维信公司 酶或非酶生物柴油精制方法
RU2018132952A (ru) 2016-02-19 2020-03-19 Басф Се Липазы для выпекания
CN105567713B (zh) * 2016-03-09 2019-01-08 河北省农林科学院粮油作物研究所 花生AhPLDα3蛋白及其编码基因与应用
CN106085984B (zh) * 2016-06-02 2019-07-19 天津科技大学 一种新型磷脂酶d及其制备磷脂酸、磷脂酰丝氨酸的方法
EP3472335A1 (en) 2016-06-16 2019-04-24 Novozymes A/S Reduction of phospholipids in phospholipid-containing oil material
US11180535B1 (en) 2016-12-07 2021-11-23 David Gordon Bermudes Saccharide binding, tumor penetration, and cytotoxic antitumor chimeric peptides from therapeutic bacteria
US11129906B1 (en) 2016-12-07 2021-09-28 David Gordon Bermudes Chimeric protein toxins for expression by therapeutic bacteria
MX2019011162A (es) * 2017-03-20 2019-10-17 Novozymes As Metodo para desengomado y refinado de aceite vegetal.
BR112019023695A2 (pt) 2017-05-12 2020-06-09 Basf Se formulação detergente, e, método de limpeza
CN111278970A (zh) 2017-10-25 2020-06-12 巴斯夫欧洲公司 β-淀粉酶
CN109321546B (zh) 2017-12-12 2021-08-31 丰益(上海)生物技术研发中心有限公司 磷脂酶c及其编码基因
US10258917B1 (en) 2018-02-09 2019-04-16 Tenneco Automotive Operating Company Inc. System for removing water and particulates from engine exhaust
CN108359654B (zh) * 2018-03-02 2021-11-05 江苏中酶生物科技有限公司 一种具有磷脂酶b活性的多肽或蛋白质及其应用
EP3776557A4 (en) * 2018-04-13 2021-12-15 The Hong Kong Polytechnic University DATA STORAGE USING PEPTIDES
CN112368375A (zh) 2018-04-26 2021-02-12 巴斯夫欧洲公司 脂肪酶
WO2019211143A1 (en) 2018-05-03 2019-11-07 Basf Se Amylase enzymes
CN109134645A (zh) * 2018-09-12 2019-01-04 深圳市菲鹏生物制药股份有限公司 一种细胞浓缩补料培养工艺
CN111378634B (zh) * 2018-12-28 2024-04-02 丰益(上海)生物技术研发中心有限公司 具有磷脂酶c活性的多肽及其用途
CN111051505B (zh) * 2018-12-29 2023-11-03 邦泰生物工程(深圳)有限公司 一种磷脂酶d突变体、其应用及其制备磷酯酰丝氨酸的方法
EP3927837A1 (en) 2019-02-20 2021-12-29 Basf Se Industrial fermentation process for bacillus using defined medium and magnesium feed
WO2020169564A1 (en) 2019-02-20 2020-08-27 Basf Se Industrial fermentation process for bacillus using defined medium and trace element feed
EP3938504A1 (en) 2019-03-11 2022-01-19 Basf Se Amylases and methods for making and using them
WO2020193532A1 (en) 2019-03-25 2020-10-01 Basf Se Cleaning composition having amylase enzymes
EP3947664A2 (en) 2019-03-25 2022-02-09 Basf Se Amylase enzymes
EP3947665A2 (en) 2019-03-25 2022-02-09 Basf Se Amylase enzymes
US20220275355A1 (en) 2019-06-13 2022-09-01 Basf Se Method of Recovering a Protein from Fermentation Broth Using a Divalent Cation
CN114096677A (zh) 2019-07-05 2022-02-25 巴斯夫欧洲公司 使用补料分批预培养的微生物细胞工业发酵方法
BR112022000573A2 (pt) 2019-08-22 2022-03-15 Basf Se Polipeptídeo isolado, sintético ou recombinante com atividade alfa-amilase, ácido nucleico isolado, sintético ou recombinante, construto de ácido nucleico, vetor de expressão, célula hospedeira, composição, método para produzir polipeptídeo isolado, sintético ou recombinante, método para preparar uma massa ou um produto de panificação, e, métodos para usar o polipeptídeo isolado, sintético ou recombinante e um domínio c de uma primeira amilase
CN111004787B (zh) * 2020-01-06 2022-05-10 江南大学 一种链霉菌磷脂酶d突变体、改造方法及其应用
US20220042049A1 (en) * 2020-08-06 2022-02-10 Poet Research, Inc. Endogenous lipase for metal reduction in distillers corn oil
CN112452277A (zh) * 2020-11-16 2021-03-09 西南石油大学 一种记忆效应影响下水合物生成实验装置
CN117580956A (zh) 2021-05-04 2024-02-20 诺维信公司 用于加氢处理的植物油(hvo)生产的原料的酶处理

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005032496A2 (en) * 2003-03-07 2005-04-14 Diversa Corporation Hydrolases, nucleic acids encoding them and mehods for making and using them
US20050108789A1 (en) * 2002-04-19 2005-05-19 Diversa Corporation Phosholipases, nucleic acids encoding them and methods for making and using them

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE318048B (zh) 1959-09-21 1969-12-01 Pellerin Ab Zenith
GB1541017A (en) 1975-03-10 1979-02-21 Unilever Ltd Degumming process for triglyceride oils
SE417441B (sv) 1977-08-19 1981-03-16 Kare Larsson Forfarande for att isolera polera lipider ur en blandning av polera och opolera cerealiclipider genom blandning med vatten och derpa foljande tyngdkraftsseparation
US4240972A (en) 1978-12-19 1980-12-23 Canada Packers Limited Continuous process for contacting of triglyceride oils with _an acid
US5366558A (en) 1979-03-23 1994-11-22 Brink David L Method of treating biomass material
WO1981000857A1 (en) 1979-09-28 1981-04-02 Vsesoyuzny Ni Biotek Inst Method of production of ethyl alcohol from starch raw material
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4707364A (en) 1984-01-27 1987-11-17 Miles Laboratories, Inc. Composition for accelerating cheese aging
US5087571A (en) 1984-06-22 1992-02-11 President And Fellows Of Harvard College Method for providing a cell culture from a transgenic non-human mammal
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
DE3590766C2 (zh) 1985-03-30 1991-01-10 Marc Genf/Geneve Ch Ballivet
US4752483A (en) 1986-05-30 1988-06-21 Campbell Soup Company Method for producing a highly flavored cheese ingredient
US5030240A (en) 1986-06-09 1991-07-09 The Clorox Company Enzymatic peracid bleaching system
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5573933A (en) 1987-04-14 1996-11-12 Luminis Pty, Ltd. Transgenic pigs
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5288619A (en) 1989-12-18 1994-02-22 Kraft General Foods, Inc. Enzymatic method for preparing transesterified oils
EP0528881A4 (en) 1990-04-24 1993-05-26 Stratagene Methods for phenotype creation from multiple gene populations
US5326477A (en) 1990-05-07 1994-07-05 Bio-Sep, Inc. Process for digesting solid waste
AU646877B2 (en) 1990-06-15 1994-03-10 Scios Nova Inc. Transgenic non-human mammal displaying the amyloid-forming pathology of alzheimer's disease
DK0558676T3 (da) 1990-11-23 2000-09-25 Aventis Cropscience Nv Fremgangsmåde til transformering af enkimbladede planter
EP0563296B1 (en) 1990-12-20 1999-03-17 Ixsys, Inc. Optimization of binding proteins
US6110700A (en) 1991-03-11 2000-08-29 The General Hospital Corporation PRAD1 cyclin and its cDNA
DE4115938A1 (de) 1991-05-16 1992-11-19 Metallgesellschaft Ag Enzymatisches verfahren zur verminderung des gehaltes an phosphorhaltigen bestandteilen in pflanzlichen und tierischen oelen
US5922854A (en) 1991-06-14 1999-07-13 Kumar; Ramesh Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids
CA2075135A1 (en) 1991-08-02 1993-02-03 David E. Ellis Particle-mediated transformation of gymnosperms
US5632957A (en) 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
JP2626380B2 (ja) 1991-11-12 1997-07-02 株式会社大林組 クレーン用吊治具の旋回防止装置
JPH05236997A (ja) 1992-02-28 1993-09-17 Hitachi Ltd ポリヌクレオチド捕捉用チップ
JPH06306386A (ja) 1993-04-25 1994-11-01 Showa Sangyo Co Ltd 油脂の精製方法
JP2937746B2 (ja) 1993-04-25 1999-08-23 昭和産業株式会社 油脂の精製方法
EP0670670A4 (en) 1993-09-30 1996-04-24 Agracetus HETEROLOGICAL PEROXIDASE PROCESSING TRANSGENIC COTTON PLANTS.
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US6468742B2 (en) 1993-11-01 2002-10-22 Nanogen, Inc. Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip
US5965452A (en) 1996-07-09 1999-10-12 Nanogen, Inc. Multiplexed active biologic array
DE4339556C1 (de) 1993-11-19 1995-02-02 Metallgesellschaft Ag Verfahren zum Entschleimen von Pflanzenöl mittels Enzymen
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5639940A (en) 1994-03-03 1997-06-17 Pharmaceutical Proteins Ltd. Production of fibrinogen in transgenic animals
CA2184687A1 (en) 1994-03-09 1995-09-14 Pedro Antonio Prieto Humanized milk
JPH09509848A (ja) 1994-03-09 1997-10-07 アボツト・ラボラトリーズ オリゴ糖及び複合糖質を産生するトランスジェニック動物
JPH09510617A (ja) 1994-03-29 1997-10-28 ノボ ノルディスク アクティーゼルスカブ アルカリ性バチルスアミラーゼ
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5959171A (en) 1994-08-17 1999-09-28 Pharming B.V. Method for the production of biologically active polypeptides in a mammal's
JPH10504964A (ja) 1994-09-01 1998-05-19 メルク エンド カンパニー インコーポレーテッド 家族性型ヒトアミロイド前駆タンパク質を発現するトランスジェニック動物
US6111166A (en) 1994-09-19 2000-08-29 Medarex, Incorporated Transgenic mice expressing human Fcα and β receptors
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US5880327A (en) 1994-09-21 1999-03-09 American National Red Cross Transgenic mammals expressing human coagulation factor VIII
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US6187992B1 (en) 1994-12-05 2001-02-13 Merck & Co., Inc. Transgenic mouse having a disrupted amyloid precursor protein gene
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US5705369A (en) 1994-12-27 1998-01-06 Midwest Research Institute Prehydrolysis of lignocellulose
US6093562A (en) 1996-02-05 2000-07-25 Novo Nordisk A/S Amylase variants
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
WO1996039154A1 (en) 1995-06-06 1996-12-12 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
RU2182163C2 (ru) * 1995-06-07 2002-05-10 Уильям К. Орр Состав топлива
KR19990022557A (ko) 1995-06-07 1999-03-25 윌리엄 씨. 오어 증기상 연소법 및 조성물 ⅱ
CA2225475A1 (en) 1995-06-27 1997-01-16 Unilever Plc Immobilized enzyme and its use for the processing of triglyceride oils
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
DE19527274A1 (de) 1995-07-26 1997-01-30 Metallgesellschaft Ag Enzymatisches Verfahren zur Entschleimung von pflanzlichen Ölen mit Aspergillus-Phospholipase
SE504664C2 (sv) 1995-09-22 1997-03-24 Scotia Lipidteknik Ab Sätt att framställa fraktionerad olja, oljan, dess användning samt emulsionskomposition innehållande oljan
US5721118A (en) 1995-10-31 1998-02-24 The Regents Of The University Of California, San Diego Mammalian artificial chromosomes and methods of using same
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US6238884B1 (en) 1995-12-07 2001-05-29 Diversa Corporation End selection in directed evolution
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US6022963A (en) 1995-12-15 2000-02-08 Affymetrix, Inc. Synthesis of oligonucleotide arrays using photocleavable protecting groups
US6013440A (en) 1996-03-11 2000-01-11 Affymetrix, Inc. Nucleic acid affinity columns
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6025155A (en) 1996-04-10 2000-02-15 Chromos Molecular Systems, Inc. Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes
US5697987A (en) 1996-05-10 1997-12-16 The Trustees Of Princeton University Alternative fuel
US6197070B1 (en) 1996-05-15 2001-03-06 The Procter & Gamble Company Detergent compositions comprising alpha combination of α-amylases for malodor stripping
WO1997046313A1 (en) 1996-06-07 1997-12-11 Eos Biotechnology, Inc. Immobilised linear oligonucleotide arrays
US6326341B1 (en) 1996-09-11 2001-12-04 The Procter & Gamble Company Low foaming automatic dishwashing compositions
US6127137A (en) 1996-10-31 2000-10-03 Novo Nordisk A/S Acidic phospholipase, production and methods using thereof
EP0948608A1 (en) 1996-10-31 1999-10-13 Novo Nordisk A/S Novel phospholipase, production and use thereof
US6103505A (en) 1996-12-09 2000-08-15 Novo Nordisk A/S Method for reducing phosphorus content of edible oils
CN1148442C (zh) 1996-12-09 2004-05-05 诺维信公司 利用来自具有磷脂酶a和/或b活性的丝状真菌的磷脂酶降低含有大量非水合磷的食用油中的含磷成分
WO1998027199A1 (en) 1996-12-19 1998-06-25 Unilever N.V. Immobilized enzyme and its use for the processing of triglyceride oils
US6069122A (en) 1997-06-16 2000-05-30 The Procter & Gamble Company Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
EP2261373A3 (en) 1997-01-17 2011-12-14 Codexis Mayflower Holdings, LLC Evolution of whole cells and organisms by recursive sequence recombination
DE19703364A1 (de) 1997-01-30 1998-08-06 Henkel Ecolab Gmbh & Co Ohg Pastenförmiges Wasch- und Reinigungsmittel
US6303803B1 (en) 1997-01-31 2001-10-16 Cargill, Incorporated Removal of sterols from fats and oils
US5880300A (en) 1997-01-31 1999-03-09 Cargill, Incorporated Phospholipid-based removal of sterols from fats and oils
JP4263248B2 (ja) 1997-03-18 2009-05-13 ノボザイムス アクティーゼルスカブ Dnaのシャッフリングによるライブラリーの作成方法
PL335860A1 (en) 1997-03-18 2000-05-22 Novo Nordisk As Method of in vitro constructing a dna library
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6333181B1 (en) 1997-04-07 2001-12-25 University Of Florida Research Foundation, Inc. Ethanol production from lignocellulose
US5916780A (en) 1997-06-09 1999-06-29 Iogen Corporation Pretreatment process for conversion of cellulose to fuel ethanol
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
CN1273609A (zh) 1997-08-15 2000-11-15 希斯克有限公司 检测或量化核酸物类的方法和组合物
DE69825496T2 (de) 1997-09-11 2005-07-28 Bioventures, Inc., Murfreesboro Verfahren zur Erstellung von Arrays hoher Dichte
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
US6399383B1 (en) 1997-10-28 2002-06-04 Maxygen, Inc. Human papilloma virus vectors
EP2386568B1 (en) 1997-10-30 2014-08-06 Novozymes A/S Alpha-amylase mutants
US6596539B1 (en) 1997-10-31 2003-07-22 Maxygen, Inc. Modification of virus tropism and host range by viral genome shuffling
ES2190120T3 (es) 1997-11-10 2003-07-16 Procter & Gamble Procedimiento para la preparacion de una pastilla de detergente.
EP0921189B1 (en) 1997-11-14 2005-01-12 Sankyo Company Limited Transgenic animal allergy models and methods for their use
WO1999029902A1 (en) 1997-12-08 1999-06-17 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
AU2674299A (en) 1998-02-11 1999-08-30 Maxygen, Inc. Targeting of genetic vaccine vectors
CA2320958A1 (en) 1998-02-11 1999-08-19 Maxygen, Inc. Antigen library immunization
AU3463699A (en) 1998-04-03 1999-10-25 Phylos, Inc. Addressable protein arrays
US6156952A (en) 1998-04-09 2000-12-05 Constituent Institution Of The University Of Maryland System HIV transgenic animals and uses therefor
KR20010043194A (ko) 1998-05-01 2001-05-25 피아 스타르 N­히드록시아세트아닐라이드와 같은 증강제
US6048695A (en) 1998-05-04 2000-04-11 Baylor College Of Medicine Chemically modified nucleic acids and methods for coupling nucleic acids to solid support
DE19824705A1 (de) 1998-06-03 1999-12-09 Henkel Kgaa Amylase und Protease enthaltende Wasch- und Reinigungsmittel
US6022567A (en) 1998-06-23 2000-02-08 Nestec S.A. Flavor enhancer
KR20010071613A (ko) 1998-06-29 2001-07-28 추후기재 매우 다양한 라이브러리의 생산방법
JP4335995B2 (ja) 1998-07-22 2009-09-30 昭 神谷 環境保全型粒状洗浄用組成物
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
US6183962B1 (en) 1998-09-09 2001-02-06 Millennium Pharmaceuticals, Inc. Protein kinase molecules and uses therefor
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6172248B1 (en) 1998-11-20 2001-01-09 Ip Holdings, L.L.C. Methods for refining vegetable oils and byproducts thereof
US6277489B1 (en) 1998-12-04 2001-08-21 The Regents Of The University Of California Support for high performance affinity chromatography and other uses
FR2788782B1 (fr) 1999-01-25 2003-01-31 Gie Agro Ind Produit multienzymatique a activites glucoamylasique, proteolytique et xylanasique et procede pour sa production par fermentation a l'etat solide de son de ble avec aspergillus niger
DE1100895T1 (de) 1999-03-15 2001-09-06 Univ British Columbia Abc1 polypeptide und verfahren und reagenzien zur modulation des cholesterolgehalts
US6399121B1 (en) 1999-03-16 2002-06-04 Novozymes A/S Process for producing cheese
DK1162889T4 (da) 1999-03-16 2012-12-17 Novozymes As Proces til fremstilling af ost
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
US6309871B1 (en) 1999-03-31 2001-10-30 Novozymes A/S Polypeptides having alkaline α-amylase activity
US6221653B1 (en) 1999-04-27 2001-04-24 Agilent Technologies, Inc. Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
US6409841B1 (en) 1999-11-02 2002-06-25 Waste Energy Integrated Systems, Llc. Process for the production of organic products from diverse biomass sources
EP1106603A3 (en) 1999-12-06 2003-11-19 Fuji Photo Film Co., Ltd. DNA chip and reactive solid carrier
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
WO2002010403A2 (en) 2000-07-31 2002-02-07 Bayer Aktiengesellschaft Regulation of human phosphatidylinositol-specific phospholipase c-like enzyme
US6423145B1 (en) 2000-08-09 2002-07-23 Midwest Research Institute Dilute acid/metal salt hydrolysis of lignocellulosics
CA2425671A1 (en) 2000-10-12 2002-04-18 Exelixis, Inc. Human ect2 and methods of use
US6309872B1 (en) 2000-11-01 2001-10-30 Novozymes Biotech, Inc Polypeptides having glucoamylase activity and nucleic acids encoding same
US6660491B2 (en) 2000-11-24 2003-12-09 Ikeda Food Research Co., Ltd. Process for producing dietary sterol fatty acid esters
WO2003070013A1 (en) 2002-02-20 2003-08-28 Novozymes A/S Process for producing cheese
PT1497418E (pt) 2002-04-19 2013-01-25 Dsm Ip Assets Bv Fosfolípases, ácidos nucleicos que as codificam e métodos para as preparar e utilizar
US20060014260A1 (en) 2004-05-07 2006-01-19 Zhiliang Fan Lower cellulase requirements for biomass cellulose hydrolysis and fermentation
WO2006096834A2 (en) 2005-03-08 2006-09-14 Diversa Corporation Hydrolases, nucleic acids encoding them and methods for improving paper strength
JP6449266B2 (ja) 2013-06-21 2019-01-09 バイオ−ラッド・ラボラトリーズ・インコーポレーテッド 流体ピックアップを備えるマイクロ流体システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050108789A1 (en) * 2002-04-19 2005-05-19 Diversa Corporation Phosholipases, nucleic acids encoding them and methods for making and using them
WO2005032496A2 (en) * 2003-03-07 2005-04-14 Diversa Corporation Hydrolases, nucleic acids encoding them and mehods for making and using them

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAN CRISTINA A ET AL.Engineering of the nonspecific phospholipase C from Bacillus cereus: Replacement of glutamic acid-4 by alanine results in loss of interfacial catalysis and enhanced phosphomonoesterase activity.《BIOCHEMISTRY》.1998,第37卷4275-4279. *

Also Published As

Publication number Publication date
AR062947A1 (es) 2008-12-17
CA2663001A1 (en) 2008-03-27
EA200970308A1 (ru) 2009-10-30
EP2057274B1 (en) 2013-12-11
EP2057274A2 (en) 2009-05-13
EP2057274A4 (en) 2010-01-06
BRPI0716872A2 (pt) 2015-06-16
CN101558154A (zh) 2009-10-14
ES2451266T3 (es) 2014-03-26
WO2008036863A2 (en) 2008-03-27
MX2009003034A (es) 2009-11-18
PT2057274E (pt) 2014-03-13
EA015591B1 (ru) 2011-10-31
WO2008036863A3 (en) 2008-10-23
PL2057274T3 (pl) 2014-05-30
US20110093965A1 (en) 2011-04-21
KR20090068266A (ko) 2009-06-25
US8637290B2 (en) 2014-01-28

Similar Documents

Publication Publication Date Title
CN101558154B (zh) 磷脂酶、编码它们的核酸及其制备和应用方法
CN102712671B (zh) 磷脂酶、编码其的核酸以及制备和使用它们的方法
CN101426918B (zh) 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
CN102575243B (zh) 油脱胶方法
CN102174546A (zh) 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
EP2216403A2 (en) Esterases and related nucleic acids and methods
CN102197043A (zh) 水解酶、编码它们的核酸及其制备和应用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: DISIMAN FOOD MAJOR CO., LTD.

Free format text: FORMER OWNER: DIVERSA CORP.

Effective date: 20130417

Owner name: DSM IP ASSETS BV

Free format text: FORMER OWNER: DISIMAN FOOD MAJOR CO., LTD.

Effective date: 20130417

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20130417

Address after: Holland Heerlen

Applicant after: DSM food professional Co.,Ltd.

Address before: California, USA

Applicant before: VERENIUM Corp.

Effective date of registration: 20130417

Address after: Holland Heerlen

Applicant after: DSM IP ASSETS B.V.

Address before: Holland Heerlen

Applicant before: DSM food professional Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160224

Termination date: 20170921

CF01 Termination of patent right due to non-payment of annual fee