CN106414731A - 具有内切葡聚糖酶活性的多肽 - Google Patents

具有内切葡聚糖酶活性的多肽 Download PDF

Info

Publication number
CN106414731A
CN106414731A CN201580027144.9A CN201580027144A CN106414731A CN 106414731 A CN106414731 A CN 106414731A CN 201580027144 A CN201580027144 A CN 201580027144A CN 106414731 A CN106414731 A CN 106414731A
Authority
CN
China
Prior art keywords
seq
polypeptide
enzyme
acid
detergent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580027144.9A
Other languages
English (en)
Inventor
K.詹森
K.M.施诺
J.萨洛蒙
B.亨里萨特
L.莫非
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes AS filed Critical Novozymes AS
Publication of CN106414731A publication Critical patent/CN106414731A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • C11D3/38636Preparations containing enzymes, e.g. protease or amylase containing enzymes other than protease, amylase, lipase, cellulase, oxidase or reductase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09KMATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
    • C09K8/00Compositions for drilling of boreholes or wells; Compositions for treating boreholes or wells, e.g. for completion or for remedial operations
    • C09K8/52Compositions for preventing, limiting or eliminating depositions, e.g. for cleaning
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09KMATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
    • C09K8/00Compositions for drilling of boreholes or wells; Compositions for treating boreholes or wells, e.g. for completion or for remedial operations
    • C09K8/60Compositions for stimulating production by acting on the underground formation
    • C09K8/62Compositions for forming crevices or fractures
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • C11D3/38645Preparations containing enzymes, e.g. protease or amylase containing cellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/0104Alpha-L-rhamnosidase (3.2.1.40)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/02Carbon-oxygen lyases (4.2) acting on polysaccharides (4.2.2)
    • C12Y402/02012Xanthan lyase (4.2.2.12)
    • EFIXED CONSTRUCTIONS
    • E21EARTH DRILLING; MINING
    • E21BEARTH DRILLING, e.g. DEEP DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B37/00Methods or apparatus for cleaning boreholes or wells
    • EFIXED CONSTRUCTIONS
    • E21EARTH DRILLING; MINING
    • E21BEARTH DRILLING, e.g. DEEP DRILLING; OBTAINING OIL, GAS, WATER, SOLUBLE OR MELTABLE MATERIALS OR A SLURRY OF MINERALS FROM WELLS
    • E21B43/00Methods or apparatus for obtaining oil, gas, water, soluble or meltable materials or a slurry of minerals from wells
    • E21B43/25Methods for stimulating production
    • E21B43/26Methods for stimulating production by forming crevices or fractures
    • CCHEMISTRY; METALLURGY
    • C09DYES; PAINTS; POLISHES; NATURAL RESINS; ADHESIVES; COMPOSITIONS NOT OTHERWISE PROVIDED FOR; APPLICATIONS OF MATERIALS NOT OTHERWISE PROVIDED FOR
    • C09KMATERIALS FOR MISCELLANEOUS APPLICATIONS, NOT PROVIDED FOR ELSEWHERE
    • C09K2208/00Aspects relating to compositions of drilling or well treatment fluids
    • C09K2208/24Bacteria or enzyme containing gel breakers

Abstract

本发明涉及具有黄原胶降解活性的内切葡聚糖酶和编码该内切葡聚糖酶的多核苷酸。本发明还涉及包括该多核苷酸的核酸构建体、载体、和宿主细胞,连同生产和使用这些内切葡聚糖酶的方法。

Description

具有内切葡聚糖酶活性的多肽
对序列表的引用
本申请包括计算机可读形式的序列表,将其通过引用结合在此。
发明背景
发明领域
本发明涉及具有内切葡聚糖酶活性的多肽,特别涉及具有内切葡聚糖酶活性并对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,和编码这些多肽的多核苷酸。本发明还涉及包括这些多核苷酸的核酸构建体、载体、和宿主细胞连同产生和使用这些多肽的方法。本发明进一步涉及包括用于洗涤剂和用于钻井和石油工业的多肽和任选的黄原胶裂解酶的组合物。
相关技术说明
黄原胶是一种来源于野油菜黄单胞菌的细菌包被的多糖。黄原胶通过由野油菜黄单胞菌细菌发酵葡萄糖、蔗糖或乳糖而产生。在发酵周期后,用异丙醇将该多糖从生长培养基中沉淀,干燥,并磨成细粉。稍后,将该粉末添加至液体介质中,以形成胶质。
黄原胶由五糖亚基组成,形成纤维素主链,其三糖侧链由通过α1,3键附接到主链中的交替葡萄糖残基的甘露糖(β1,4)葡萄糖醛酸(β1,2)甘露糖组成。该生物聚合物由于其优异的假塑性,触变性和粘度而具有巨大的商业意义。目前,其广泛用作食品和非食品工业中的增稠剂或增粘剂,并且用作多种多样的悬浮液,乳液和泡沫的稳定剂。
近年来,黄原胶已经被用作许多消费品中的成分,包括食品(例如在沙拉酱(salatdressing)和乳制品中作为增稠剂)和化妆品(例如在牙膏和化妆品中作为稳定剂和增稠剂,以阻止成分分离)和化妆品(例如防晒霜)。另外的黄原胶已经在石油工业中发现用途,其中黄原胶被大量使用以增稠钻井泥浆。这些流体用于将由钻头切割的固体携带回表面。当循环停止时,固体仍保持悬浮在钻井流体中。水平钻井的广泛使用和对钻井固体的良好控制的需求已经导致其扩大使用。它还被添加到自固化混凝土中,包括倒在水下的混凝土,以增加其粘度。
黄原胶的广泛使用已导致希望降解和/或改性黄原胶的溶液或凝胶。黄原胶的完全酶降解需要若干酶活性,包括黄原胶裂解酶活性和内切-β-1,4-葡聚糖酶活性。
黄原胶裂解酶是切割黄原胶的β-D-甘露糖基-β-D-1,4-葡萄糖醛酸基键,由此去除末端丙酮酸甘露糖的酶。两种分离自溶藻弧菌类芽孢杆菌XL-1的黄原胶裂解酶(例如,Ruijssenaars(鲁基森纳斯)等人.(1999)‘A pyruvated mannose-specific xanthanlyase involved in xanthan degradation by Paenibacillus alginolyticus XL-1(在由溶藻弧菌类芽孢杆菌XL-1降解黄原胶中涉及的一种丙酮酸甘露糖特异性黄原胶裂解酶)’,Appl.Environ.Microbiol.(应用与环境微生物)65(6):2446-2452,和Ruijssenaars(鲁基森纳斯)等人.(2000),‘A novel gene encoding xanthan lyase of Paenibacillusalginolyticus strain XL-1(一种编码溶藻弧菌类芽孢杆菌菌株XL-1的黄原胶降解酶的新颖基因)’,Appl.Environ.Microbiol.(应用与环境微生物)66(9):3945-3950)。
具有内切-β-1,4-葡聚糖酶活性的酶在去除末端丙酮酸甘露糖后必须能够切割黄原胶的高度取代的主链。已知这类酶来自糖基水解酶家族GH9(WO 2013/167581)。
发明概述
诸位发明人已经惊奇地发现了一个新组的酶,该新组的酶具有内切-β-1,4-葡聚糖酶活性并且能够切割黄原胶的高度取代的骨架–并且其不属于已知包括这种酶活性的糖基水解酶家族。这些酶与具有黄原酸降解活性的任何已知的酶没有显着的序列相似性,并且不能分配至已知的糖基水解酶家族。新组的内切葡聚糖酶通过与专利申请号EP14170186.2的SEQ ID NO 2中披露的和本文SEQ ID NO 42中显示的多肽的氨基酸序列比对来鉴定。
本发明提供了用于降解黄原胶的新的且改进的酶以及此类酶用于清洁目的(例如去除黄原胶污物)以及在钻探和石油工业中的用途。由于酶对纤维素也具有显着的活性,所以酶也可以用于降解纤维素材料的过程中,例如,在纤维素生物质的降解中用于生产,例如,可发酵糖。
因此,本发明涉及具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,这些多肽选自下组,该组由以下各项组成:
(a)与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽;
(b)由多核苷酸编码的多肽,该多核苷酸在中严格条件下与(i)SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQID NO:39中任一项的成熟多肽编码序列,(ii)(i)的全长补体杂交;
(c)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的变体,该变体在一个或多个位置包括取代、缺失、和/或插入;和
(e)(a)、(b)、(c)、或(d)的多肽的片段,该片段具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性。
本发明还涉及编码本发明的多肽的多核苷酸;核酸构建体;重组表达载体;包括这些多核苷酸的重组宿主细胞;以及产生这些多肽的方法。
本发明还涉及包括这些多肽的组合物,以及包括这些多肽的全发酵液配制品或细胞培养组合物。
本发明还涉及多肽和组合物用于降解黄原胶的用途,例如用于洗涤或清洁纺织品和/或硬表面如餐具洗涤。
本发明还涉及多肽和组合物用于降解纤维素材料的用途。
附图简要说明
图1示出氨基酸序列SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40的多重比对。还包括与专利申请号EP14170186.2的SEQ ID NO:2具有一致性的SEQ ID NO:42。
序列简要说明
SEQ ID 来源于
SEQ ID NO 01/02 分解雨林土壤宏基因组B
SEQ ID NO 03/04 生物反应器富集废水宏基因组
SEQ ID NO 05/06 Lewinella cohaerens
SEQ ID NO 07/08 Chthoniobacter flavus
SEQ ID NO 09/10 嗜常温稻草/堆肥富集宏基因组
SEQ ID NO 11/12 人类粪便微生物组
SEQ ID NO 13/14 闪烁杆菌属细菌
SEQ ID NO 15/16 丰佑菌科细菌
SEQ ID NO 17/18 丰佑菌科细菌
SEQ ID NO 19/20 Paludibacterium yongneupense
SEQ ID NO 21/22 迪克亚杆菌属物种
SEQ ID NO 23/24 闪烁杆菌属细菌
SEQ ID NO 25/26 Teredinibacter turnerae
SEQ ID NO 27/28 Teredinibacter turnerae
SEQ ID NO 29/30 Diplosphaera colitermitum
SEQ ID NO 31/32 Teredinibacter turnerae
SEQ ID NO 33/34 Teredinibacter turnerae
SEQ ID NO 35/36 Teredinibacter turnerae
SEQ ID NO 37/38 Teredinibacter turnerae
SEQ ID NO 39/40 牛瘤胃微生物群落
SEQ ID NO 41/42 浮霉状菌属(专利申请号EP14170186.2的SEQ ID NO:2)
定义
等位基因变体:术语“等位基因变体”意指占用同一染色体位点的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生,并且可以导致群体内多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
纤维素结合结构域:术语“纤维素结合结构域”是指介导酶结合至纤维素底物的非晶区域的酶的区域。
催化结构域:术语“催化结构域”意思指酶的包含该酶的催化机器的区域。
cDNA:术语“cDNA”意指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。
清洁或洗涤剂应用:术语“清洁或洗涤剂应用”意指将本发明的多肽施用于在任何组合物中,用于手动、机械或自动化清洁或洗涤硬表面或纺织品的目的。
清洁或洗涤剂组合物:术语“清洁或洗涤剂组合物”是指用于从有待清洁的物品(例如纺织品、餐具和硬表面)去除不希望的化合物的组合物。这些术语涵盖选择用于希望的具体类型的清洁组合物和产品的形式(例如、液体、凝胶、粉末、颗粒、糊状、或喷雾组合物)的任何材料/化合物,并且包括但不限于洗涤剂组合物(例如,液体和/或固体衣物洗涤剂和精细织物洗涤剂;硬表面清洁配制品,如用于玻璃、木材、陶瓷和金属台面以及窗户;地毯清洁剂;炉灶清洁剂;织物清新剂;织物柔软剂;和纺织品和衣物预洗涤剂,连同餐具洗涤剂)。除了本发明的多肽之外,该洗涤剂配制品还可以包含一种或多种另外的酶(例如蛋白酶、淀粉酶、脂肪酶、角质酶、纤维素酶、内切葡聚糖酶、木葡聚糖酶、果胶酶、果胶裂解酶、黄原胶酶、黄原胶裂解酶、过氧化物酶、卤代过氧合酶、过氧化氢酶以及甘露聚糖酶,或其任何混合物),和/或组分,例如表面活性剂、助洗剂、螯合剂(chelator)或螯合试剂(chelatingagent)、漂白系统或漂白组分、聚合物、织物调理剂、增泡剂、抑泡剂、染料、香料、晦暗抑制剂、光学增亮剂、杀细菌剂、杀真菌剂、污垢悬浮剂、防蚀剂、酶抑制剂或稳定剂、酶激活剂、一种或多种转移酶、水解酶、氧化还原酶、上蓝剂和荧光染料、抗氧化剂以及增溶剂。
编码序列:术语“编码序列”意指直接指定一个多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框架决定,该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。
降解黄原胶:在此将术语“降解黄原胶”或“黄原胶降解活性”定义为将黄原胶解聚、降解或分解为更小的组分。黄原胶的降解可以是去除一个或多个侧链糖,将黄原胶的骨架切成更小的组分,或去除一个或多个侧链糖并且将黄原胶的骨架切成更小的组分。黄原胶的降解优选地可以使用如描述于实例5中的粘度降低方法来测量。可替代地,黄原胶的降解可以使用如实例6中所描述的还原末端方法来测量。
洗涤剂组合物:术语“洗涤剂组合物”是指用于从有待清洁的物品(例如纺织品、餐具和硬表面)去除不希望的化合物的组合物。该洗涤剂组合物可以用于例如清洁纺织品、餐具以及硬表面,用于家用清洁剂和工业清洁二者。这些术语涵盖选择用于希望的具体类型的清洁组合物和产品的形式(例如、液体、凝胶、粉末、颗粒、糊状、或喷雾组合物)的任何材料/化合物,并且包括但不限于洗涤剂组合物(例如,液体和/或固体衣物洗涤剂和精细织物洗涤剂;硬表面清洁配制品,如用于玻璃、木材、陶瓷和金属台面以及窗户;地毯清洁剂;炉灶清洁剂;织物清新剂;织物柔软剂;和纺织品和衣物预洗涤剂,连同餐具洗涤剂)。除了包含本发明的多肽之外,该洗涤剂配制品还可以包含一种或多种另外的酶(例如,黄原胶裂解酶、蛋白酶、淀粉酶、脂肪酶、角质酶、纤维素酶、内切葡聚糖酶、木葡聚糖酶、果胶酶、果胶裂解酶、黄原胶酶、过氧化物酶、卤代过氧合酶、过氧化氢酶以及甘露聚糖酶,或其任何混合物),和/或组分,例如表面活性剂、助洗剂、螯合剂(chelator)或螯合试剂(chelatingagent)、漂白系统或漂白组分、聚合物、织物调理剂、增泡剂、抑泡剂、染料、香料、晦暗抑制剂、光学增亮剂、杀细菌剂、杀真菌剂、污垢悬浮剂、防蚀剂、酶抑制剂或稳定剂、酶激活剂、一种或多种转移酶、水解酶、氧化还原酶、上蓝剂和荧光染料、抗氧化剂以及增溶剂。
餐具洗涤:术语“餐具洗涤”是指所有形式的洗涤餐具,例如手动或自动餐具洗涤。洗涤餐具包括但不限于,清洁所有形式的陶器,例如盘子、杯子、玻璃杯、碗,所有形式的用餐工具,例如匙、刀、叉,以及上菜用具连同陶瓷,塑料,金属,瓷器,玻璃及丙烯酸酯。
餐具洗涤组合物:术语“餐具洗涤组合物”是指用于清洁硬表面的所有形式的组合物。本发明不局限于任何具体类型的餐具洗涤组合物或任何具体洗涤剂。
内切葡聚糖酶:术语“内切葡聚糖酶”意指一种内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键和混合β-1,3葡聚糖如谷类β-D-葡聚糖、木葡聚糖、黄原胶以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原末端的增加来确定内切葡聚糖酶活性(张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481)。
对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶:术语“对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶”或“具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽”定义为对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶。本发明的内切葡聚糖酶对用黄原胶裂解酶预处理的黄原胶具有活性。在本发明的一个方面中,对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶是具有以下项中任一项中所示序列的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。可以如实例6中所披露地确定对用黄原胶裂解酶预处理的黄原胶的活性。
酶洗涤益处:在此将术语“酶洗涤益处”定义为将一种酶添加至洗涤剂中与不具有该酶的同一洗涤剂相比的有利效果。可以由酶提供的重要的洗涤益处是在洗涤和或清洁之后没有或有非常少的可见污垢的污物去除,预防或减少在洗涤过程中释放的污垢的再沉积(一种也被称作抗再沉积的效果),完全或部分恢复纺织品的白度(一种也被称作增白的效果),这些纺织品初始是白色的但是在重复使用和洗涤后获得浅灰色或浅黄色的外观。不直接与污垢的催化去污或其再沉积的预防相关的纺织品护理益处对于酶洗涤益处而言也是重要的。此类纺织品护理益处的实例是预防或减少染料从一织物转移至另一织物或同一织物的另一部分(一种也被称作染料转移抑制或抗返染的效果),从织物表面去除突出或断裂的纤维以减少起球倾向或去除已经存在的绒球或绒毛(一种也被称作抗起球的效果),改进织物柔软性,织物的颜色澄清以及去除陷在织物或服装的纤维中的微粒状污垢。酶漂白是一种另外的酶洗涤益处,其中通常将催化活性用于催化漂白组分(例如过氧化氢或其他过氧化物)的形成。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰以及分泌。
表达载体:术语“表达载体”意指线性或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列相连接。
片段:术语“片段”意指在成熟多肽的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的多肽;其中该片段具有内切葡聚糖酶活性和/或对用黄原胶预处理的黄原胶具有活性。
糖苷水解酶家族:糖苷水解酶是催化糖基键水解以释放更小的糖的酶。存在超过100类的糖苷水解酶,这些糖苷水解酶已被分类为糖基水解酶(GH)家族,参见汉丽塞塔(Henrissat)等人(1991)‘基于氨基酸序列相似性的糖基水解酶分类(A classificationof glycosyl hydrolases based on amino-acid sequence similarities)’,生物化学杂志(J.Biochem.)280:309-316和Uniprot网站,www.cazy.org
硬表面清洁:在此将术语“硬表面清洁”定义为清洁硬表面,其中硬表面可以包括地板、桌子、墙壁、屋顶等,连同硬物体的表面,例如汽车(汽车洗涤)和餐具(餐具洗涤)。餐具洗涤包括但不限于,清洁盘子、杯子、玻璃杯、碗、及刀具(例如匙、刀、叉)、上菜用具、陶瓷、塑料、金属、瓷器、玻璃及丙烯酸酯。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
改进的洗涤性能:在此将术语“改进的洗涤性能”定义为一种(变体)酶(还有酶的共混物,不只是变体还有骨架,以及与某种清洁组合物组合,等)相对于亲本蛋白酶变体的洗涤性能展示出一种蛋白质变体的洗涤性能的改变,例如增加的去污。术语“洗涤性能”包括在衣物洗涤并且例如在餐具洗涤中的洗涤性能。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然发生的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然发生的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中,例如,可以将宿主细胞进行遗传修饰来表达本发明的多肽。来自宿主细胞的发酵液将包括分离的多肽。
洗衣:术语“洗衣”涉及家用洗衣和工业洗衣两者并且意指用包含本发明的清洁或洗涤剂组合物的溶液处理纺织品的过程。洗衣过程可以例如使用例如家用或工业洗衣机进行或可以手动进行。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N末端加工、C末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。内切葡聚糖酶的成熟肽是:SEQID NO:2中的位置1至813,SEQ ID NO:4中的位置1至836,SEQ ID NO:6中的位置1至949,SEQID NO:8中的位置1至830,SEQ ID NO:10中的位置1至866,SEQ ID NO:12中的位置1至827,SEQ ID NO:14中的位置1至903,SEQ ID NO:16中的位置1至932,SEQ ID NO:18中的位置1至920,SEQ ID NO:20中的位置1至844,SEQ ID NO:22中的位置1至849,SEQ ID NO:24中的位置1至903,SEQ ID NO:26中的位置1至894,SEQ ID NO:28中的位置1至894,SEQ ID NO:30中的位置1至955,SEQ ID NO:32中的位置1至894,SEQ ID NO:34中的位置1至893,SEQ ID NO:36中的位置1至894,SEQ ID NO:38中的位置1至894,和SEQ ID NO:40中的位置1至867。
本领域中已知的是,一个宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即,具有不同C末端和/或N末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的成熟多肽的多核苷酸。内切葡聚糖酶基因的成熟肽编码部分是:SEQ ID NO:1中的位置67至2508,SEQ ID NO:3中的位置76至2583,SEQ ID NO:5中的位置67至2913,SEQ ID NO:7中的位置73至2562,SEQ ID NO:9中的位置115至2712,SEQ ID NO:11中的位置103至2565,SEQ ID NO:13中的位置1至2712,SEQID NO:15中的位置1至2799,SEQ ID NO:17中的位置1至2763,SEQ ID NO:19中的位置1至2535,SEQ ID NO:21中的位置1至2550,SEQ ID NO:23中的位置1至2712,SEQ ID NO:25中的位置1至2685,SEQ ID NO:27中的位置1至2685,SEQ ID NO:29中的位置1至2868,SEQ IDNO:31中的位置1至2685,SEQ ID NO:33中的位置1至2682,SEQ ID NO:35中的位置1至2685,SEQ ID NO:37中的位置1至2685,和SEQ ID NO:39中的位置1至2604。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或是合成的,该核酸分子包括一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置,从而使得该控制序列指导该编码序列的表达。
序列一致性:用参数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的:
(一致的残基X 100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,同上)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位拓展罚分0.5,和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的:
(一致的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)
严格条件:术语“非常低严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在45℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“低严格条件”意指对于至少100个核苷酸长度的探针,按照标准DNA印迹程序在42℃于5X SSPE、0.3%SDS、200微克/ml剪切和变性的鲑精DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在50℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“中严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在55℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在60℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在65℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“非常高严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在70℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
子序列:术语“子序列”是指具有从成熟多肽编码序列的5’和/或3’端缺失的一个或多个(例如,若干个)核苷酸的多核苷酸;其中该子序列编码具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的片段。
纺织品:术语“纺织品”意指包括纱线、纱线中间体、纤维、非机织物材料、天然材料、合成材料、以及任何其他纺织品材料的任何纺织品材料,这些材料制造的织物和由这些织物制成的产品(例如服装和其他物品)。该纺织品或织物可以处于针织品、机织物、牛仔布、非机织物、毡、纱线、以及毛巾布的形式。这些纺织品可以是纤维素基的,如天然纤维素,包括棉布、亚麻/亚麻布、黄麻、苎麻、剑麻或椰壳纤维或者人造纤维素(例如,来源于木浆),包括纤维胶/人造丝、苎麻、醋酸纤维素纤维(三胞)、莱赛尔纤维(lyocell)或其共混物。纺织品或织物也可以不基于纤维素,如天然聚酰胺,包括羊毛、驼毛、羊绒、马海毛、兔毛和蚕丝或合成聚合物如尼龙、芳族聚酰胺、聚酯、丙烯酸、聚丙烯和氨纶/弹性纤维(spandex/elastane)、或其共混物其以及基于纤维素和不基于纤维素的纤维的共混物。共混物的例子是棉和/或人造丝/纤维胶与一种或多种伴随材料的共混物,该伴随材料例如是羊毛、合成纤维(例如聚酰胺纤维、丙烯酸纤维、聚酯纤维、聚乙烯醇纤维、聚氯乙烯纤维、聚亚胺酯纤维、聚脲纤维、芳族聚酰胺纤维)以及含纤维素的纤维(例如人造丝/纤维胶、苎麻、亚麻/亚麻布、黄麻、醋酸纤维素纤维、莱赛尔纤维)。织物可以是常规的可洗涤衣物,例如弄脏的家居衣物。当使用术语织物或衣服时,旨在也包括广义术语纺织品。
纺织品护理益处:不直接与污垢的催化去污或其再沉积的预防相关的纺织品护理益处对于酶洗涤益处而言也是重要的。此类纺织品护理益处的实例是预防或减少染料从一纺织品转移至另一纺织品或同一纺织品的另一部分(一种也被称作染料转移抑制或抗返染的效果),从纺织品表面去除突出或断裂的纤维以减少起球倾向或去除已经存在的绒球或绒毛(一种也被称作抗起球的效果),改进纺织品柔软性,纺织品的颜色澄清以及去除陷在纺织品的纤维中的微粒状污垢。酶漂白是一种另外的酶洗涤益处,其中通常将催化活性用于催化漂白组分(例如过氧化氢或其他过氧化物或其他漂白种类)的形成。
变体:术语“变体”意指具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶活性的多肽,并且在一个或多个(例如,若干个)位置包括改变,即取代、插入和/或缺失。取代意指占据位置的氨基酸替换不同的氨基酸;缺失意指去除占据一个位置的氨基酸;并且插入意指在邻接并且紧随占据位置的氨基酸之后添加氨基酸。
洗涤性能:术语“洗涤性能”被用作酶在例如洗涤或硬表面清洁过程中去除存在于有待清洁的物体上的污渍的能力。可以通过计算如‘用于衣物洗涤的自动机械应力测定(AMSA)’中的所谓的强度值(Int)或如WO2013/167581中所定义的反射值(Rem)来量化洗涤性能的改进。
白度:在此将术语“白度”定义为在不同领域并且针对不同顾客具有不同含义的广义术语。白度的损失可以例如归因于灰化、黄化、或光学增亮剂/调色剂的去除。灰化和黄化可归因于污垢再沉积、身体污垢、来自例如铁和铜离子或染料转移的着色。白度可包括来自以下列表的一个或若干个问题:着色剂或染料作用;不完全污物去除(例如身体污垢、皮脂等);再沉积(物体的灰化、黄化或其他变色)(去除的污垢与纺织品的其他部分(弄脏的或未弄脏的)再关联);在应用过程中纺织品的化学变化;以及颜色的澄清或淡色化。
黄原胶裂解酶:在此将术语“黄原胶裂解酶”定义为一种切割黄原胶中的β-D-甘露糖基-β-D-1,4-葡萄糖醛酸基键的酶(EC 4.2.2.12)。出于本发明的目的,根据实例6中所述的程序确定黄原胶裂解酶活性。
发明详述
本发明提供了对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶以及编码这些多肽的多核苷酸。内切葡聚糖酶不属于已知包括降解黄原胶的酶的GH家族。另外,黄原胶裂解酶与对用黄原胶裂解酶预处理的黄原胶具有活性的本发明的内切葡聚糖酶的组合示出超过单独使用黄原胶裂解酶或对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶的协同的改进洗涤性能。此外,酶可以对任何底物纤维素,凝胶多糖和β-葡聚糖具有活性。
对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶
在一个实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、和SEQ ID NO:40,该多肽具有对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶。在一个方面中,这些多肽与SEQ ID NO:14的成熟多肽的区别不超过50个氨基酸,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、或49个。在一个优选方面中,该多肽与以下项中任一项的成熟多肽相差高达10个氨基酸,例如1、2、3、4、5、6、7、8、9、或10个:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少70%:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少75%:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少80%:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少85%:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少90%:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少95%:SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一个具体的实施例中,本发明涉及与以下项中任一项的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中该多肽具有以下项中任一项的成熟多肽的内切葡聚糖酶活性和/或黄原胶降解活性的至少100%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ IDNO:40。
在一个实施例中,该多肽已经被分离。
本发明的多肽优选地包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的氨基酸1至846或其等位基因变体,或由其组成;或者是其具有内切葡聚糖酶活性和/或黄原胶降解活性的片段。在另一个方面中,该多肽包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽,或由其组成。
在另一个实施例中,本发明涉及具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶活性的多肽,该多肽由多核苷酸编码,该多核苷酸在高严格条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQID NO:37、和SEQ ID NO:39的成熟多肽编码序列,或(ii)(i)的全长补体杂交(萨姆布鲁克(Sambrook)等人,1989,分子克隆实验手册(Molecular Cloning,A Laboratory Manual),第2版,冷泉港,纽约)。在一个实施例中,该多肽已经被分离。
可以根据本领域中熟知的方法,使用SEQ ID NO:1的多核苷酸或其子序列,连同SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQID NO:38、和SEQ ID NO:40中任一项的多肽或其片段来设计核酸探针,以鉴定并且克隆编码多肽的DNA,这些多肽具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性。具体地,可以遵循标准DNA印迹程序,使用此类探针与来自不同属或物种的菌株的感兴趣的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中的对应基因。此类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,核酸探针的长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以检测相应的基因。本发明涵盖此类探针。
可以筛选从此类其他菌株制备的基因组DNA或cDNA文库的与上述探针杂交并且编码本发明的多肽的DNA。来自此类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳、或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他适合的载体材料上。为了鉴定与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项、或其子序列杂交的克隆或DNA,在DNA印迹中使用载体材料。
出于本发明的目的,杂交指示多核苷酸在非常低至非常高严格条件下与对应于以下项的标记的核酸探针杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项;(ii)SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列;(iii)其全长补体;或(iv)其子序列。在这些条件下与该核酸探针杂交的分子可以使用例如X射线薄膜或本领域中已知的任何其他检测手段进行检测。
在一个方面中,该核酸探针是核苷酸,该核苷酸是SEQ ID NO:1、SEQ ID NO:3、SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的子序列。在另一个方面中,该核酸探针是多核苷酸,该多核苷酸编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ IDNO:38、和SEQ ID NO:40中任一项的多肽;其成熟肽;或其片段。在另一个方面中,该核酸探针是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ IDNO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项。
在另一个实施例中,本发明涉及具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,该多肽由多核苷酸编码,该多核苷酸与SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQID NO:39中任一项的成熟多肽编码序列具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在另外的实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的变体,该变体在一个或多个(例如,若干个)位置包括取代、缺失、和/或插入。在一个实施例中,引入SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽中的氨基酸取代、缺失和/或插入的数量高达10个,例如,1、2、3、4、5、6、7、8、9、或10个。这些氨基酸变化可以具有微小性质,即,不会显著地影响蛋白的折叠和/或活性的保守氨基酸取代或插入;小缺失,典型地为1-30个氨基酸;小氨基或羧基-末端延伸,如氨基末端甲硫氨酸残基;高达20-25个残基的小连接肽;或便于通过改变净电荷或另一种功能来纯化的较小延伸,例如His-标记(聚组氨酸段)、抗原表位或结合结构域。
保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(Neurath)和R.L.希尔(Hill),1979,在蛋白质(The Proteins),学术出版社(Academic Press),纽约中描述。常见的取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
可替代地,氨基酸改变具有这样一种性质:改变多肽的物理化学特性。例如,氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH,等等。
可以根据本领域中已知的程序,如定点诱变或丙氨酸扫描诱变(坎宁汉(Cunningham)和威尔斯(Wells),1989,科学(Science)244:1081-1085)来鉴定多肽中的必需氨基酸。在后一技术中,在分子中的每个残基处引入单一的丙氨酸突变,并对得到的分子测试内切葡聚糖酶活性和/或黄原胶降解活性从而鉴定对分子活性至关重要的氨基酸残基。还参见希尔顿(Hilton)等人,1996,生物化学杂志(J.Biol.Chem.)271:4699-4708。也可结合假定接触位点氨基酸的突变,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记进行确定的对结构进行物理学分析,从而确定酶的活性位点或其他生物学相互作用。参见,例如德·沃斯(de Vos)等人,1992,科学(Science)255:306-312;史密斯(Smith)等人,1992,分子生物学杂志(J.Mol.Biol.)224:899-904;Wlodaver等人,1992,欧洲生物化学学会联盟通讯(FEBS Lett.)309:59-64。还可以从与相关多肽的比对推断鉴定必需氨基酸。
可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,罗曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向诱变(德比舍尔(Derbyshire)等人,1986,基因(Gene)46:145;内尔(Ner)等人,1988,DNA 7:127)。
可以结合诱变/改组方法与高通量自动化筛选方法来检测由宿主细胞表达的克隆的、诱变的多肽的活性(内斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。
多肽可以是杂合多肽,其中一个多肽的区域融合在另一多肽的区域的N末端或C末端。
多肽还可以是融合多肽或可切割的融合多肽,其中另一多肽融合在本发明的多肽的N-末端或C-末端。通过将编码另一多肽的多核苷酸融合到本发明的多核苷酸而产生融合多肽。用于产生融合多肽的技术在本领域是已知的,并且包括连接编码多肽的编码序列,这样使得它们在框内并且使得融合多肽的表达处于相同的一个或多个启动子和终止子的控制下。融合多肽还可以使用内含肽技术来构建,其中融合多肽在翻译后产生(库珀(Cooper)等人,1993,欧洲分子生物学学会杂志(EMBO J.)12:2575-2583;道森(Dawson)等人,1994,科学(Science)266:776-779)。
融合多肽可以在两种多肽之间进一步包括切割位点。在融合蛋白分泌之时,该位点被切割,从而释放出这两种多肽。切割位点的实例包括但不限于在如下文献中披露的位点:马丁(Martin)等人,2003,工业微生物学生物技术杂志(J.Ind.Microbiol.Biotechnol.)3:568-576;Svetina等人,2000,生物技术杂志(J.Biotechnol.)76:245-251;拉斯马森-威尔逊(Rasmussen-Wilson)等人,1997,应用与环境微生物学(Appl.Environ.Microbiol.)63:3488-3493;沃德(Ward)等人,1995,生物技术(Biotechnology)13:498-503;以及孔特雷拉斯(Contreras)等人,1991,生物技术9:378-381;伊顿(Eaton)等人,1986,生物化学(Biochemistry)25:505-512;Collins-Racie等人,1995,生物技术13:982-987;卡特(Carter)等人,1989,蛋白质:结构、功能和遗传学(Proteins:Structure,Function,and Genetics)6:240-248;和史蒂文斯(Stevens),2003,世界药物发现(Drug Discovery World)4:35-48。
具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽的来源
本发明的多肽可获得自任何属的微生物。出于本发明的目的,如在此结合给定的来源使用的术语“从…中获得”应意指由多核苷酸编码的多肽是由该来源或者由其中已经插入来自该来源的多核苷酸的菌株产生的。在一个方面中,获得自给定来源的多肽被分泌到细胞外。
在一个方面中,该多肽是细菌多肽。在一个方面中,该多肽是真菌多肽。在一个方面中,该多肽是从以下项中任一项获得的多肽:赖文氏菌属(Lewinella)物种、Chthoniobacter物种、闪烁杆菌属(Fervidibacteria)物种、丰佑菌科(Opitutaceae)物种、迪克亚杆菌属(Dickeya)物种、Teredinibacter物种、和Diplosphaera物种,这些包括以下物种:Lewinella cohaerens、Chthoniobacter flavus、Teredinibacter turnerae、和Diplosphaera colitermitum。
这种以及相关物种的菌株可以容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(CentraalbureauVoor Schimmelcultures,CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(NRRL)。
可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的DNA样品鉴定和获得该多肽。用于从自然生活环境中直接分离微生物和DNA的技术是本领域熟知的。然后可以通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦用一种或多种探针检测到编码多肽的多核苷酸,就可以通过使用本领域普通技术人员已知的技术分离或克隆该多核苷酸(参见,例如,萨姆布鲁克(Sambrook)等人,1989,见上文)。
多核苷酸
本发明还涉及编码本发明的多肽的多核苷酸,如在此所述。在一个实施例中,编码本发明的多肽的多核苷酸已经被分离。
用于分离或克隆多核苷酸的技术是本领域中已知的并且包括从基因组DNA或cDNA,或其组合进行分离。来自基因组DNA的多核苷酸的克隆可以例如通过使用众所周知的聚合酶链反应(PCR)或用以对具有共有的结构特征的克隆的DNA片段进行检测的表达库抗体筛选来实现。参见例如,伊尼斯(Innis)等人,1990,PCR:方法和应用指南(PCR:A Guideto Methods and Application),学术出版社(Academic Press),纽约。可以使用其他核酸扩增程序例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以克隆自赖文氏菌属物种、Chthoniobacter物种、闪烁杆菌属物种、丰佑菌科物种、迪克亚杆菌属物种、Teredinibacter物种、和Diplosphaera物种,包括以下物种:Lewinella cohaerens、Chthoniobacter flavus、Teredinibacter turnerae、和Diplosphaera colitermitum,或者相关有机体的菌株,并且因此例如可以是多核苷酸的多肽编码区域的等位基因的或物种的变体。
修饰编码本发明的多肽的多核苷酸对于合成与所述多肽基本上类似的多肽可为必需的。术语“基本上类似”于该多肽是指该多肽的非天然存在的形式。这些多肽可能以某种工程化方式而不同于从其天然来源分离的多肽,例如在比活性、热稳定性、最适pH等方面不同的变体。这些变体可以基于以SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列,例如,其子序列形式呈现的多核苷酸,和/或通过引入不会改变该多肽的氨基酸序列,但对应于预定用于产生该酶的宿主生物体的密码子用法的核苷酸取代,或通过引入可以产生不同氨基酸序列的核苷酸取代来构建。对于核苷酸取代的一般描述,参见例如福德(Ford)等人,1991,蛋白质表达与纯化(Protein Expression and Purification)2:95-107。
核酸构建体
本发明还涉及核酸构建体,这些核酸构建体包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,在与控制序列相容的条件下,这些控制序列指导编码序列在适合的宿主细胞中表达。
可以用许多方式操作所述多核苷酸以便于多肽的表达。取决于表达载体,在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
该控制序列可以是启动子,即,被宿主细胞识别以对编码本发明的多肽的多核苷酸进行表达的多核苷酸。该启动子包含转录控制序列,这些序列介导该多肽的表达。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括变体、截短型及杂合型启动子,并且可以由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明的核酸构建体的转录的适合启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金杆菌cryIIIA基因(阿盖塞(Agaisse)和勒尔克吕(Lereclus),1994,分子微生物学(Molecular Microbiology)13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(埃贡(Egon)等人,1988,基因(Gene)69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)、以及原核β-内酰胺酶基因(维拉-卡马洛夫(Villa-Kamaroff)等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:3727-3731)以及tac启动子(德波尔(DeBoer)等人,1983,美国国家科学院院刊80:21-25)。其他启动子描述在吉尔伯特(Gilbert)等人,1980,科学美国人(Scientific American)242:74-94的“来自重组细菌的有用蛋白质(Useful proteinsfrom recombinant bacteria)”;以及在萨姆布鲁克(Sambrook)等人,1989,同上。串联启动子的实例披露在WO 99/43835中。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的合适启动子的实例是获得自以下各项的基因的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶–样蛋白酶(WO 96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(达莉亚)(WO 00/56900)、镶片镰孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导子替换未翻译的前导子;非限制性实例包括来自编码中性α-淀粉酶的黑曲霉基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的构巢曲霉或米曲霉基因的未翻译的前导子替换未翻译的前导子);及其变体、截短型及杂合型启动子。其他启动子描述于美国专利号6,011,147中。
在酵母宿主中,有用的启动子获得自以下各项的基因:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇去氢酶/甘油醛-3-磷酸去氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及酿酒酵母3-磷酸甘油酸激酶。罗马诺斯(Romanos)等人,1992,酵母(Yeast)8:423-488描述了酵母宿主细胞的其他有用的启动子。
控制序列还可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3'末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。
用于细菌宿主细胞的优选终止子是从克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)以及大肠杆菌核糖体RNA(rrnB)的基因获得。
用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
用于酵母宿主细胞的优选终止子是从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得。用于酵母宿主细胞的其他有用的终止子由罗马诺斯(Romanos)等人,1992,见上文描述。
该控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域,它增加该基因的表达。
适合的mRNA稳定子区的实例是从以下获得的:苏云金杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(化(Hue)等人,1995,细菌学杂志(Journal ofBacteriology)177:3465-3471)。
该控制序列还可以是前导子,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导子可操作地连接到编码该多肽的多核苷酸的5'末端。可以使用在宿主细胞中起作用的任何前导子。
用于丝状真菌宿主细胞的优选前导子是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
酵母宿主细胞的适合的前导子是从以下各项的基因中获得的:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母醇去氢酶/甘油醛-3-磷酸去氢酶(ADH2/GAP)。
控制序列还可以是一种多腺苷酸化序列,可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将聚腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因中获得的:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖镰孢胰蛋白酶样蛋白酶。
有用于酵母宿主细胞的多腺苷酸化序列在郭(Guo)和谢尔曼(Sherman),1995,分子细胞生物学(Mol.Cellular Biol.)15:5983-5990中描述。
控制序列还可以是编码连接至多肽的N-末端的信号肽并指导该多肽进入细胞的分泌途径的信号肽编码区域。多核苷酸的编码序列的5’端本身可包含在翻译阅读框中天然与编码多肽的编码序列区段相连接的信号肽编码序列。可替代地,该编码序列的5’末端可以包含对于该编码序列来说是外来的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可简单地替换天然的信号肽编码序列以便增强该多肽的分泌。然而,可以使用指导所表达多肽进入宿主细胞的分泌通路的任何信号肽编码序列。
用于细菌宿主细胞的有效信号肽编码序列是从以下各项的基因获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)以及枯草芽孢杆菌prsA。西蒙纳(Simonen)和帕尔瓦(Palva),1993,微生物学评论(Microbiological Reviews)57:109-137描述了另外的信号肽。
用于丝状真菌宿主细胞的有效信号肽编码序列是获得自以下各项的基因的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶以及米黑毛霉天冬氨酸蛋白酶。
对于酵母宿主细胞有用的信号肽获得自以下项的基因:酿酒酵母α-因子和酿酒酵母转化酶。罗马诺斯(Romanos)等人,1992,见上文,描述了其他有用的信号肽编码序列。
控制序列还可以是编码位于多肽的N-末端的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下各项的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及酿酒酵母α-因子。
当信号肽和前肽序列同时存在时,前肽序列的位置紧邻于多肽的N-末端,且信号肽序列的位置紧邻于前肽序列的N-末端。
还可能希望地是添加调节序列,这些调节序列相对于宿主细胞的生长来调节多肽的表达。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac以及trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生重组表达载体,该重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该多肽的多核苷酸。可替代地,该多核苷酸可以通过将该多核苷酸或包括该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是线性的或闭合的环状质粒。
该载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可以包含任何用以保证自我复制的要素。可替代地,该载体可以是这样载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入宿主细胞的基因组中的总DNA)或转座子。
该载体优选包含允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
细菌性选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性(如氨比西林、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选在曲霉属细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。优选在木霉属细胞中使用的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统。在一个方面中,双选择性标记是hph-tk双选择性标记系统。
载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,该载体可以进一步包括使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点(origin of replication)”或“质粒复制子(plasmid replicator)”意指使得质粒或载体可在体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。
用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点ARS1、ARS4、ARS1与CEN3的组合以及ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO00/24883中的方法完成。
可以将本发明的多核苷酸的多于一个拷贝插入宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。
用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,同上)。
宿主细胞
本发明还涉及重组宿主细胞,这些宿主细胞包含可操作地连接到一个或多个控制序列的本发明的多核苷酸,这些控制序列指导本发明的多肽的产生。将包括多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。
该宿主细胞可以是有用于重组产生本发明的多肽的任何细胞,例如原核细胞或真核细胞。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属、以及链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。
细菌宿主细胞可以是任何芽孢杆菌细胞,包括但不限于:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、以及苏云金杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于:似马链球菌、酿脓链球菌、乳房链球菌以及马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌细胞,包括但不局限于不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰链丝菌、以及浅青紫链霉菌细胞。
将DNA引入芽孢杆菌属细胞中可通过以下来实现:原生质体转化(参见例如,张(Chang)和科恩(Cohen),1979,分子遗传学与基因组学(Mol.Gen.Genet.)168:111-115)、感受态细胞转化(参见,例如,杨格(Young)和斯皮宰曾(Spizizen),1961,细菌学杂志(J.Bacteriol.)81:823-829;或杜拜努(Dubnau)以及大卫杜夫-阿贝尔森(Davidoff-Abelson),1971,分子生物学杂志(J.Mol.Biol.)56:209-221)、电穿孔(参见,例如,茂川(Shigekawa)和道尔(Dower),1988,生物技术(Biotechniques)6:742-751)、或者接合(参见,例如克勒(Koehler)和索恩(Thorne),1987,细菌学杂志169:5271-5278)。将DNA引入大肠杆菌细胞中可通过以下来实现:原生质体转化(参见例如,哈纳汗(Hanahan),1983,分子生物学杂志(J.Mol.Biol.)166:557-580)或电穿孔(参见例如,道尔(Dower)等人,1988,核酸研究(Nucleic Acids Res.)16:6127-6145)。将DNA引入链霉菌属细胞中可通过以下来实现:原生质体转化、电穿孔(参见例如,贡(Gong)等人,2004,叶线形微生物学(FoliaMicrobiol.)(Praha(布拉格))49:399-405)、接合(参见例如,马佐迪耶(Mazodier)等人,1989,细菌学杂志(J.Bacteriol.)171:3583-3585)、或转导(参见例如,伯克(Burke)等人,2001,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)98:6289-6294)。将DNA引入假单孢菌属细胞中可通过以下来实现:电穿孔(参见例如,蔡(Choi)等人,2006,微生物学方法杂志(J.Microbiol.Methods)64:391-397)或接合(参见例如,皮内多(Pinedo)和斯梅茨(Smets),2005,应用与环境微生物学(Appl.Environ.Microbiol.)71:51-57)。将DNA引入链球菌属细胞中可通过以下来实现:天然感受态(参见,例如,佩里(Perry)和藏满(Kuramitsu),1981,感染与免疫(Infect.Immun.)32:1295-1297)、原生质体转化(参见,例如,凯特(Catt)和乔力克(Jollick),1991,微生物学(Microbios)68:189-207)、电穿孔(参见,例如,巴克利(Buckley)等人,1999,应用与环境微生物学(Appl.Environ.Microbiol.)65:3800-3804)、或者接合(参见,例如,克莱威尔(Clewell),1981,微生物学评论(Microbiol.Rev.)45:409-436)。然而,可以使用本领域已知的用于将DNA引入宿主细胞中的任何方法。
宿主细胞还可以是真核细胞,如哺乳动物、昆虫、植物、或真菌细胞。
宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、以及接合菌门(Zygomycota)、连同卵菌门(Oomycota)和全部有丝分裂孢子真菌(如由霍克斯沃思(Hawksworth)等人在安斯沃思和拜斯比真菌词典(Ainsworth and Bisby’s Dictionary of The Fungi),第8版,1995,国际应用生物科学中心(CAB International),大学出版社(University Press),英国剑桥(Cambridge,UK)中进行定义的)。
该真菌宿主细胞可以是酵母细胞。如在此使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类在将来可能有变化,出于本发明的目的,酵母应如酵母生物学和活动性(Biology and Activities of Yeast)(斯金纳(Skinner)、帕斯莫尔(Passmore)、以及达文波特(Davenport)编辑,应用细菌学学会讨论会(Soc.App.Bacteriol.Symposium)系列第9期,1980)所述地进行定义。
酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁弗酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由霍克斯沃思等人,1995,见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。
丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以通过涉及原生质体形成、原生质体转化、以及以本身已知的方式进行细胞壁再生的过程来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法由马拉迪尔(Malardier)等人,1989,基因(Gene)78:147-156、以及WO 96/00787描述。可以使用由如以下文献描述的程序转化酵母:贝克尔(Becker)和瓜伦特(Guarente),在阿贝尔森(Abelson),J.N.和西蒙(Simon),M.I.编,酵母遗传学与分子生物学指南(Guide to Yeast Genetics and Molecular Biology),酶学方法(Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology),第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;伊藤(Ito)等人,1983,细菌学杂志(J.Bacteriol.)153:163;以及Hinnen等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:1920。
生产方法
本发明还涉及产生本发明的多肽的方法,包含(a)在有益于产生该多肽的条件下培养细胞,该细胞以其野生型形式产生该多肽;并且可任选地(b)回收该多肽。在一个方面中,该细胞是浮霉状菌属细胞。在另一个方面中,该细胞是来自浮霉状菌属物种R1菌株的细胞。
本发明还涉及产生本发明的多肽的方法,这些方法包括(a)在有益于产生该多肽的条件下培养本发明的重组宿主细胞;并且可任选地(b)回收该多肽。
这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的一种营养培养基中培养的。例如,可以通过在适合的培养基中和在允许表达和/或分离该多肽的条件下,进行摇瓶培养,或者在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续,分批,分批补料,或固态发酵)来培养细胞。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包括碳和氮来源及无机盐。合适的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽分泌到该营养培养基中,那么可直接从培养基中回收多肽。如果多肽不被分泌,那么其可从细胞裂解液中进行回收。
可以使用特异性针对这些多肽的本领域已知的方法来检测该多肽。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定该多肽的活性。
可以使用本领域已知的方法来回收多肽。例如,该多肽可以通过常规程序,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从该营养培养基回收。在一个方面中,回收包括该多肽的发酵液。
可以通过本领域中已知的多种程序来纯化该多肽以获得基本上纯的多肽,这些程序包括但不限于:色谱法(例如,离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如,制备型等电点聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或提取(参见例如,蛋白纯化(Protein Purification),詹森(Janson)和赖登(Ryden)编辑,VCH出版社(VCH Publishers),纽约,1989)。
在替代性方面中,没有回收该多肽,而是将表达该多肽的本发明的宿主细胞用作该多肽的来源。
植物
本发明还涉及分离的植物,例如转基因植物、植物部分或植物细胞,这些植物包括本发明的多肽,从而表达并且产生可回收的量的多肽。该多肽可以从植物或植物部分回收。可替代地,可以按原样将包含该多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性、以及流变性质,或用以破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,如草甸草(蓝草,早熟禾属);饲草,如羊茅属(Festuca)、黑麦草属(Lolium);温带草,如翦股颖属(Agrostis);以及谷类,例如小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍(玉米)。
双子叶植物的实例是烟草、豆类(如羽扇豆(lupins)、马铃薯、糖甜菜(sugarbeet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(familyBrassicaceae))(如花椰菜、油菜籽、以及紧密相关的模式生物拟南芥)。
植物部分的实例是茎、愈伤组织、叶、根、果实、种子、以及块茎、以及包括这些部分的独立组织,例如,表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。特定植物细胞区室,如叶绿体、质外体(apoplast)、线粒体、液泡、过氧化物酶体以及细胞质也被认为是植物部分。此外,任何植物细胞,无论是何种组织来源,都被认为是植物部分。同样地,植物部分,如分离以有助于本发明的利用的特定组织和细胞也被认为是植物部分,例如胚、胚乳、糊粉和种皮。
同样包括于本发明范围内的是此类植物、植物部分以及植物细胞的子代。
表达多肽的转基因植物或植物细胞可以根据本领域已知的方法构建。
本发明还涉及产生本发明的多肽的方法,这些方法包括(a)在有益于产生该多肽的条件下培养转基因植物或植物细胞,该转基因植物或植物细胞包括编码该多肽的多核苷酸;以及(b)回收该多肽。
发酵液配制品或细胞组合物
本发明还涉及包含本发明的多肽的发酵液配制品或细胞组合物。发酵液产物进一步包括在发酵过程中使用的另外的成分,例如像,细胞(包括含有编码本发明的多肽的基因的宿主细胞,这些宿主细胞被用于产生感兴趣的多肽)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中,该组合物是含有一种或多种有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。
如在此使用的术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制剂。例如,当微生物培养物生长至饱和,在碳限制条件下孵育以允许蛋白质合成(例如,由宿主细胞进行酶的表达)并且分泌到细胞培养基中时,产生发酵液。发酵液可以包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,发酵液是未分级的并且包括用过的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液包含用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。
在一个实施例中,该发酵液配制品和细胞组合物包括第一有机酸组分(包括至少一种1-5碳的有机酸和/或其盐)以及第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在一个具体实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐、或两种或更多种前述酸的混合物并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐、或两种或更多种前述酸的混合物。
在一个方面中,该组合物包含一种或多种有机酸,并且任选地进一步包含杀死的细胞和/或细胞碎片。在一个实施例中,从细胞杀灭的全培养液中去除这些杀死的细胞和/或细胞碎片,以提供不含这些组分的组合物。
这些发酵液配制品或细胞组合物可以进一步包含一种防腐剂和/或抗微生物(例如抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域中已知的其他试剂。
该细胞杀灭的全培养液或组合物可以包含在发酵结束时得到的发酵材料的未分级的内容物。典型地,该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如,丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白合成之后存在的细胞碎片。在一些实施例中,细胞杀灭的全培养液或组合物含有用过的细胞培养基、胞外酶和杀灭的丝状真菌细胞。在一些实施例中,可以使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。
如在此描述的全培养液或细胞组合物典型地是液体,但是可以含有不溶性组分,例如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中,可以去除不溶性组分以提供澄清的液体组合物。
可以通过WO 90/15861或WO 2010/096673所述的方法产生本发明的全培养液配制品和细胞组合物。
洗涤剂组合物
在一个实施例中,本发明涉及包括分离的内切葡聚糖酶的洗涤剂组合物,该分离的内切葡聚糖酶对用黄原胶裂解酶预处理的黄原胶具有活性,并且与SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ IDNO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQID NO:40中任一项的成熟多肽具有至少60%,例如,至少65%、至少70%、至少70%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一个实施例中,本发明针对洗涤剂组合物,该洗涤剂组合物包含结合一种或多种额外的清洁组合物组分的本发明的酶。另外的组分的选择在普通技术人员技术内并且包括常规成分,包括以下列出的示例性、非限制性组分。
对于纺织品护理,组分的选择可以包括以下考虑:有待清洁的纺织品的类型、污物的类型和/或程度、进行清洁时的温度以及洗涤剂产品的配制。尽管根据一种具体的功能性将以下提及的组分通过一般标题进行了分类,但是由于该组分可能具有熟练的业内人士将领会的一种或多种另外的功能,因此不应该将这理解为限制。
洗涤剂组合物可以适于洗涤纺织品,例如像织物、衣服或亚麻布,或用于清洁硬表面,例如像地板、桌子、或餐具洗涤。
本发明的酶-在本发明的一个实施例中,可以将本发明的多肽以对应于以下的量添加至一种洗涤剂组合物中:每升的洗涤液0.0001-200mg的酶蛋白,例如0.0005-100mg的酶蛋白,优选0.001-30mg的酶蛋白,更优选0.005-8mg的酶蛋白,甚至更优选0.01-2mg的酶蛋白。
用于在自动洗碗机(ADW)中使用的组合物例如可以包括按该组合物的重量计0.0001%-50%,例如0.001%-20%,例如0.01%-10%,例如0.05%-5%的酶蛋白。
用于在洗衣造粒(laundry granulation)中使用的组合物例如可以包含按该组合物的重量计0.0001%-50%,例如0.001%-20%,例如0.01%-10%,例如0.05%-5%的酶蛋白。
用于在洗衣液中使用的组合物例如可以包括按该组合物的重量计0.0001%-10%,例如0.001%-7%,例如0.1%-5%的酶蛋白。
可以使用常规稳定剂稳定本发明的洗涤剂组合物的一种或多种酶,这些常规稳定剂例如是多元醇,例如丙二醇或甘油、糖或糖醇、乳酸、硼酸或硼酸衍生物,例如芳香族硼酸酯,或苯基硼酸衍生物,例如4-甲酰苯基硼酸,并且可以如在例如WO 92/19709和WO 92/19708中所述配制该组合物。
在某些市场中,不同洗涤条件并且就其本身而言,使用不同类型的洗涤剂。这披露于例如EP 1 025 240中。例如,在亚洲(日本)使用低的洗涤剂浓度体系,而美国使用中等洗涤剂浓度体系,并且欧洲使用高的洗涤剂浓度体系。
低的洗涤剂浓度体系包含以下洗涤剂,其中在洗涤水中存在少于约800ppm的洗涤剂组分。日本洗涤剂典型地被认为是低的洗涤剂浓度体系,因为它们具有存在于洗涤水中的大约667ppm的洗涤剂组分。
中等洗涤剂浓度体系包含以下洗涤剂,其中在洗涤水中存在约800ppm与约2000ppm之间的洗涤剂组分。北美洗涤剂通常被认为是中等洗涤剂浓度体系,因为它们具有存在于洗涤水中的大约975ppm的洗涤剂组分。
高的洗涤剂浓度体系包含以下洗涤剂,其中在洗涤水中存在多于约2000ppm的洗涤剂组分。欧洲洗涤剂通常被认为是高的洗涤剂浓度体系,因为在洗涤水中它们具有大约4500-5000ppm的洗涤剂组分。
拉丁美洲洗涤剂通常是高泡沫磷酸盐助洗剂洗涤剂并且在拉丁美洲使用的洗涤剂的范围可以落入中等和高的洗涤剂浓度两者中,因为在洗涤水中它们的洗涤剂组分的范围从1500ppm至6000ppm。此类洗涤剂组合物都是本发明的实施例。
本发明的多肽还可以结合到WO 97/07202中所披露的洗涤剂配制品中,通过引用将其结合在此。
表面活性剂-洗涤剂组合物可以包括一种或多种表面活性剂,它们可以是阴离子的和/或阳离子的和/或非离子的和/或半极性的和/或兼性离子的或其混合物。在一个具体实施例中,洗涤剂组合物包括一种或多种非离子型表面活性剂和一种或多种阴离子表面活性剂的混合物。这种或这些表面活性剂典型地以按重量计从约0.1%至60%的水平存在,例如约1%至约40%、或约3%至约20%、或约3%至约10%。基于所希望的清洁应用来选择这种或这些表面活性剂,并且这种或这些表面活性剂包括本领域中已知的任何一种或多种常规表面活性剂。可以利用本领域中已知的用于在洗涤剂中使用的任何表面活性剂。
当包含在其中时,所述去污剂通常将会含有按重量计约1%至约40%,例如约5%至约30%,包括约5%至约15%,或约20%至约25%的阴离子型表面活性剂。阴离子表面活性剂的非限制性实例包括硫酸盐和磺酸盐,具体地,直链烷基苯磺酸盐(LAS),LAS的异构体,支链烷基苯磺酸盐(BABS),苯基链烷磺酸盐,α-烯烃磺酸盐(AOS),烯烃磺酸盐,链烯烃磺酸盐,链烷-2,3-二基双(硫酸盐),羟基链烷磺酸盐以及二磺酸盐,烷基硫酸盐(AS)(例如十二烷基硫酸钠(SDS)),脂肪醇硫酸盐(FAS),伯醇硫酸盐(PAS),醇醚硫酸盐(AES或AEOS或FES,也被称为醇乙氧基硫酸盐或脂肪醇醚硫酸盐),仲链烷磺酸盐(SAS),石蜡烃磺酸盐(PS),酯磺酸盐,磺化的脂肪酸甘油酯,α-磺酸基脂肪酸甲酯(α-SFMe或SES)(包括甲酯磺酸盐(MES)),烷基琥珀酸或烯基琥珀酸,十二烯基/十四烯基琥珀酸(DTSA),氨基酸的脂肪酸衍生物,磺酸基琥珀酸或皂的二酯和单酯,以及它们的组合。
当被包括在其中时,洗涤剂将通常包含按重量计从约0%至约10%的阳离子表面活性剂。阳离子表面活性剂的非限制性实例包括烷基二甲基乙醇季胺(ADMEAQ)、十六烷基三甲基溴化铵(CTAB)、二甲基二硬脂酰氯化铵(DSDMAC)、以及烷基苄基二甲基铵、烷基季铵化合物、烷氧基化季铵(AQA)化合物及其组合。
当被包括在其中时,洗涤剂将通常包含按重量计从约0.2%至约40%的非离子型表面活性剂,例如从约0.5%至约30%,特别是从约1%至约20%、从约3%至约10%,例如从约3%至约5%、或从约8%至约12%。非离子型表面活性剂的非限制性实例包括醇乙氧基化物(AE或AEO)、醇丙氧基化物、丙氧基化的脂肪醇(PFA),烷氧基化的脂肪酸烷基酯(例如乙氧基化的和/或丙氧基化的脂肪酸烷基酯),烷基酚乙氧基化物(APE),壬基酚乙氧基化物(NPE),烷基多糖苷(APG),烷氧基化胺,脂肪酸单乙醇酰胺(FAM),脂肪酸二乙醇酰胺(FADA),乙氧基化的脂肪酸单乙醇酰胺(EFAM),丙氧基化的脂肪酸单乙醇酰胺(PFAM),多羟基烷基脂肪酸酰胺,或葡萄糖胺的N-酰基N-烷基衍生物(葡糖酰胺(GA),或脂肪酸葡糖酰胺(FAGA)),连同在SPAN和TWEEN商品名下可获得的产品及其组合。
当被包括在其中时,洗涤剂将通常包含按重量计从约0%至约10%的半极性表面活性剂。半极性表面活性剂的非限制性实例包括氧化胺(AO),例如烷基二甲基氧化胺、N-(椰油基烷基)-N,N-二甲基氧化胺和N-(牛油-烷基)-N,N-双(2-羟乙基)氧化胺、脂肪酸链烷醇酰胺和乙氧基化的脂肪酸链烷醇酰胺及其组合。
当被包括在其中时,洗涤剂将通常包含按重量计从约0%至约10%的兼性离子表面活性剂。兼性离子表面活性剂的非限制性实例包括甜菜碱、烷基二甲基甜菜碱、磺基甜菜碱及其组合。
助水溶剂-助水溶剂是如下化合物,该化合物在水性溶液中溶解疏水化合物(或相反地,在非极性环境中的极性物质)。一般地,助水溶物具有亲水和疏水两种特征(所谓的两亲性质,如由表面活性剂已知的);然而,助水溶剂的分子结构一般不利于自发性自聚集,参见例如通过霍奇登(Hodgdon)和卡勒(Kaler)(2007),胶体&界面科学新见(CurrentOpinion in Colloid&Interface Science)12:121-128的综述。助水溶剂并不显示临界浓度,高于该浓度就会发生如对表面活性剂而言所发现的自聚集以及脂质形成胶束、薄层或其他很好地定义的中间相。相反,许多助水溶物显示连续类型的聚集过程,其中聚集物的大小随着浓度增加而增长。然而,很多助水溶剂改变了包括极性和非极性特征的物质的系统(包括水、油、表面活性剂、和聚合物的混合物)的相行为、稳定性、和胶体特性。经典地从制药、个人护理、食品跨行业至技术应用使用助水溶剂。助水溶剂在洗涤剂组合物中的使用允许例如更浓的表面活性剂配制品(如在通过去除水而压缩液体洗涤剂的过程中)而不引起不希望的现象,例如相分离或高粘度。
洗涤剂可以包含按重量计0-5%,例如约0.5%至约5%、或约3%至约5%的助水溶剂。可以利用本领域中已知的用于在洗涤剂中使用的任何助水溶剂。助水溶剂的非限制性实例包括苯磺酸钠、对甲苯磺酸钠(STS)、二甲苯磺酸钠(SXS)、枯烯磺酸钠(SCS)、伞花烃磺酸钠、氧化胺、醇和聚乙二醇醚、羟基萘甲酸钠、羟基萘磺酸钠、乙基己基磺酸钠及其组合。
助洗剂或共助洗剂-该洗涤剂组合物可以包含按重量计约0-65%,例如约5%至约45%的洗涤剂助洗剂或共助洗剂、或其混合物。在洗涤餐具洗涤剂中,助洗剂的水平典型地是40%-65%,特别是50%-65%。助洗剂和/或共助洗剂可以具体是形成具有Ca和Mg的水溶性复合物的螫合剂。可以利用本领域中已知的用于在衣物洗涤剂中使用的任何助洗剂和/或共-助洗剂。助洗剂的非限制性实例包括沸石、二磷酸盐(焦磷酸盐)、三磷酸盐例如三磷酸钠(STP或STPP)、碳酸盐例如碳酸钠、可溶性硅酸盐例如硅酸钠、层状硅酸盐(例如,来自赫斯特公司(Hoechst)的SKS-6)、乙醇胺例如2-氨基乙-1-醇(MEA)、二乙醇胺(DEA,也称为亚氨基二乙醇)、三乙醇胺(TEA,也称为2,2’,2”-次氨基三乙醇)、以及羧甲基菊粉(CMI)及其组合。
洗涤剂组合物还可以包含按重量计0-20%,例如约5%至约10%的洗涤剂共助洗剂或其混合物。洗涤剂组合物可以单独地包括一种共助洗剂,或与一种助洗剂,例如沸石助洗剂组合。共助洗剂的非限制性实例包括聚丙烯酸酯的均聚物或其共聚物,例如聚(丙烯酸)(PAA)或共聚(丙烯酸/马来酸)(PAA/PMA)。另外的非限制性实例包括柠檬酸盐,螯合剂,例如氨基羧酸盐、氨基多羧酸盐和膦酸盐,以及烷基-或烯基琥珀酸。另外的具体实例包括2,2’,2”-次氨基三乙酸(NTA)、乙二胺四乙酸(EDTA)、二亚乙基三胺五乙酸(DTPA)、亚氨基二丁二酸(iminodisuccinic acid)(IDS)、乙二胺-N,N’-二丁二酸(EDDS)、甲基甘氨酸二乙酸(MGDA)、谷氨酸-N,N-二乙酸(GLDA)、1-羟基乙烷-1,1-二膦酸(HEDP)、乙二胺四-(亚甲基膦酸)(EDTMPA)、二亚乙基三胺五(亚甲基膦酸)(DTPMPA或DTMPA)、N-(2-羟乙基)亚氨基二乙酸(EDG)、天冬氨酸-N-单乙酸(ASMA)、天冬氨酸-N,N-二乙酸(ASDA)、天冬氨酸-N-单丙酸(ASMP)、亚氨基二丁二酸(iminodisuccinic acid)(IDA)、N-(2-磺甲基)-天冬氨酸(SMAS)、N-(2-磺乙基)-天冬氨酸(SEAS)、N-(2-磺甲基)-谷氨酸(SMGL)、N-(2-磺乙基)-谷氨酸(SEGL)、N-甲基亚氨基二乙酸(MIDA)、α-丙氨酸-N,N-二乙酸(α-ALDA)、丝氨酸-N,N-二乙酸(SEDA)、异丝氨酸-N,N-二乙酸(ISDA)、苯丙氨酸-N,N-二乙酸(PHDA)、邻氨基苯甲酸-N,N-二乙酸(ANDA)、磺胺酸-N,N-二乙酸(SLDA)、牛磺酸-N,N-二乙酸(TUDA)以及磺甲基-N,N-二乙酸(SMDA)、N-(2-羟乙基)-亚乙基二胺-N,N’,N’-三乙酸盐(HEDTA)、二乙醇甘氨酸(DEG)、二亚乙基三胺五(亚甲基膦酸)(DTPMP)、氨基三(亚甲基膦酸)(ATMP)及其组合和盐。其他示例性助洗剂和/或共助洗剂描述于例如WO 09/102854、US 5977053中
漂白系统-该洗涤剂可以包括按重量计0-50%,例如约0.1%至约25%的漂白系统。可以利用本领域中已知的用于在衣物洗涤剂中使用的任何漂白系统。适合的漂白系统组分包括漂白催化剂、光漂白剂、漂白活化剂、过氧化氢源如过碳酸钠和过硼酸钠、预成型过酸及其混合物。适合的预成型过酸包括,但不限于:过氧羧酸及盐,过碳酸及盐,过亚氨酸(perimidic acid)及盐,过氧单硫酸及盐(例如过硫酸氢钾(Oxone(R)),及其混合物。漂白系统的非限制性实例包括基于过氧化物的漂白系统,这些系统可以包括例如与过酸形成漂白活化剂组合的无机盐,包括碱金属盐,如过硼酸盐(通常是单水合物或四水合物)、过碳酸盐、过硫酸盐、过磷酸盐、过硅酸盐的钠盐。术语漂白活化剂在此意指一种与过氧化物漂白剂(像过氧化氢)反应以形成过酸的化合物。以此方式形成的过酸构成活化的漂白剂。有待在此使用的适合漂白活化剂包括属于酯酰胺、酰亚胺或酸酐类别的那些。适合的实例是四乙酰基乙二胺(TAED)、4-[(3,5,5-三甲基己酰)氧基]苯磺酸钠(ISONOBS)、二过氧月桂酸、4-(十二酰基氧基)苯磺酸盐(LOBS)、4-(癸酰基氧基)苯磺酸盐、4-(癸酰基氧基)苯甲酸盐(DOBS)、4-(壬酰基氧基)-苯磺酸盐(NOBS)、和/或披露于WO 98/17767中的那些。感兴趣的漂白活化剂的具体家族披露于EP 624154中并且在那个家族中特别优选的是乙酰柠檬酸三乙酯(ATC)。ATC或短链甘油三酸酯(像三醋汀)具有以下优点,它是环境友好的,因为它最终降解为柠檬酸和醇。此外,乙酰柠檬酸三乙酯和三醋汀在储存时在产品中具有良好的水解稳定性,并且它是一种有效的漂白活化剂。最后,ATC为洗衣添加剂提供一种良好的助洗能力。可替代地,漂白系统可以包括例如酰胺、酰亚胺、或砜型的过氧酸。漂白系统还可以包括过酸,例如6-(苯二甲酰亚氨基)过己酸(PAP)。漂白系统还可以包括漂白催化剂。在一些实施例中,漂白组分可以是选自下组的有机催化剂,该组由以下各项组成:具有下式的有机催化剂:
(iii)及其混合物;其中每个R1独立地是包含从9至24个碳的支链烷基基团或包含从11至24个碳的直链烷基基团,优选地,每个R1独立地是包含从9至18个碳的支链烷基基团或包含从11至18个碳的直链烷基基团,更优选地,每个R1独立地选自下组,该组由以下各项组成:2-丙基庚基、2-丁基辛基、2-戊基壬基、2-己基癸基、正-十二烷基、正-十四烷基、正-十六烷基、正-十八烷基、异-壬基、异-癸基、异-十三基和异-十五烷基。其他示例性漂白系统描述于例如WO 2007/087258、WO 2007/087244、WO 2007/087259以及WO 2007/087242中。适合的光漂白剂可以例如是磺化的酞菁锌。
聚合物-该洗涤剂可以包含按重量计0-10%,例如0.5%-5%、2%-5%、0.5%-2%或0.2%-1%的聚合物。可以利用本领域中已知的用于在洗涤剂中使用的任何聚合物。聚合物可以作为如以上提到的共助洗剂起作用,或可以提供抗再沉积、纤维保护、污垢释放、染料转移抑制、油污清洁和/或防沫特性。一些聚合物可以具有多于一种的以上提到的特性和/或多于一种的以下提到的基序(motif)。示例性聚合物包括(羧甲基)纤维素(CMC)、聚(乙烯醇)(PVA)、聚(乙烯吡咯烷酮)(PVP)、聚(乙二醇)或聚(环氧乙烷)(PEG)、乙氧基化的聚(亚乙基亚胺)、羧甲基菊粉(CMI)、和聚羧化物,例如PAA、PAA/PMA、聚-天冬氨酸、和甲基丙烯酸月桂酯/丙烯酸共聚物、疏水修饰CMC(HM-CMC)和硅酮、对苯二甲酸和低聚乙二醇的共聚物、聚(对苯二甲酸乙二酯)和聚(氧乙烯对苯二甲酸乙二酯)的共聚物(PET-POET)、PVP、聚(乙烯基咪唑)(PVI)、聚(乙烯吡啶-N-氧化物)(PVPO或PVPNO)以及聚乙烯吡咯烷酮-乙烯基咪唑(PVPVI)。另外的示例性聚合物包括磺化的聚羧酸酯、聚环氧乙烷和聚环氧丙烷(PEO-PPO)以及乙氧基硫酸二季铵盐。其他示例性聚合物披露于例如WO 2006/130575中。也考虑了以上提到的聚合物的盐。
织物调色剂-本发明的洗涤剂组合物还可以包括织物调色剂,例如当配制在洗涤剂组合物中时,可以在织物与包括所述洗涤剂组合物的洗涤液体接触时沉积在所述织物上,并且从而通过可见光吸收/反射来改变所述织物色彩的染料或色素。荧光增白剂发射至少一些可见光。相比之下,因为它们吸收至少一部分可见光光谱,所以织物调色剂改变表面的色彩。适合的织物调色剂包括染料和染料-粘土轭合物,并且还可以包括色素。适合的染料包括小分子染料和聚合物染料。适合的小分子染料包括选自下组的小分子染料,该组由落入颜色索引(Colour Index)(C.I.)分类的以下染料组成:直接蓝、直接红、直接紫、酸性蓝、酸性红、酸性紫、碱性蓝、碱性紫和碱性红、或其混合物,例如描述于WO 2005/03274、WO2005/03275、WO 2005/03276和EP 1876226中(将其通过引用而特此结合)。洗涤剂组合物优选包括从约0.00003wt%至约0.2wt%、从约0.00008wt%至约0.05wt%、或甚至从约0.0001wt%至约0.04wt%的织物调色剂。该组合物可以包括从0.0001wt%至0.2wt%的织物调色剂,当该组合物处于单位剂量袋的形式时,这可以是特别优选的。适合的调色剂还披露于例如WO 2007/087257和WO 2007/087243中。
另外的酶-洗涤剂添加剂连同洗涤剂组合物可以包括一种或多种额外的酶,例如蛋白酶、脂肪酶、角质酶、淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如漆酶、过氧化物酶和/或黄原胶裂解酶。
一般而言,一种或多种所选酶的特性应与选定的洗涤剂相容(即,最适pH,与其他酶和非酶成分的相容性,等等),并且该一种或多种酶应以有效量存在。
纤维素酶:适合的纤维素酶包括细菌或真菌来源的那些。包括经化学修饰的或蛋白质工程改造的变体。适合的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰刀菌属、梭孢壳菌属、支顶孢属的纤维素酶,例如披露于US 4,435,307、US 5,648,263、US 5,691,178、US 5,776,757以及WO 89/09259中的由特异腐质霉、嗜热毁丝霉和尖孢镰刀菌产生的真菌纤维素酶。
尤其适合的纤维素酶是具有颜色护理益处的碱性或中性纤维素酶。此类纤维素酶的实例是描述于EP 0 495 257、EP 0 531 372、WO 96/11262、WO 96/29397、WO 98/08940中的纤维素酶。其他实例为纤维素酶变体,例如在WO 94/07998、EP 0 531 315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO 98/12307以及PCT/DK 98/00299中描述的那些。
表现出内切-β-1,4-葡聚糖酶活性的纤维素酶(EC 3.2.1.4)的实例是已经描述于WO 02/099091中的那些。
纤维素酶的其他实例包括描述于WO 96/29397中的家族45纤维素酶,并且特别是在对应于WO 02/099091的SEQ ID NO:8中的以下位置的一个或多个位置具有取代、插入和/或缺失的其变体:2、4、7、8、10、13、15、19、20、21、25、26、29、32、33、34、35、37、40、42、42a、43、44、48、53、54、55、58、59、63、64、65、66、67、70、72、76、79、80、82、84、86、88、90、91、93、95、95d、95h、95j、97、100、101、102、103、113、114、117、119、121、133、136、137、138、139、140a、141、143a、145、146、147、150e、150j、151、152、153、154、155、156、157、158、159、160c、160e、160k、161、162、164、165、168、170、171、172、173、175、176、178、181、183、184、185、186、188、191、192、195、196、200、和/或20,优选选自P19A、G20K、Q44K、N48E、Q119H或Q146R。
可商购的纤维素酶包括CelluzymeTM、和CarezymeTM(诺维信公司(Novozymes A/S))、ClazinaseTM、和Puradax HATM(杰能科国际有限公司(Genencor InternationalInc.))、以及KAC-500(B)TM(花王株式会社(Kao Corporation))。
蛋白酶:另外的酶可以是另一种蛋白酶或蛋白酶变体。该蛋白酶可以是动物、植物或微生物来源的,包括化学或基因修饰的变体。优选微生物来源。它可以是一种碱性蛋白酶,例如丝氨酸蛋白酶或金属蛋白酶。丝氨酸蛋白酶可以例如是S1家族(如胰蛋白酶)或S8家族(如枯草杆菌蛋白酶)。金属蛋白酶的蛋白酶可以例如是来自例如家族M4、M5、M7或M8的嗜热菌蛋白酶。
术语“枯草杆菌酶”是指根据斯艾森(Siezen)等人,蛋白质工程学(ProteinEngng.)4(1991)719-737和斯艾森等人,蛋白质科学(Protein Science)6(1997)501-523的丝氨酸蛋白酶亚组。丝氨酸蛋白酶是特征为在活性位点具有与底物形成共价加合物的丝氨酸的蛋白酶的一个亚组。枯草杆菌酶可以划分为6个亚部,即,枯草杆菌蛋白酶家族、嗜热蛋白酶家族、蛋白酶K家族、羊毛硫抗生素肽酶家族、Kexin家族和Pyrolysin家族。在本发明的一个方面,该蛋白酶可以是一种类枯草杆菌蛋白酶,例如枯草杆菌蛋白酶或其变体。另外,类枯草杆菌蛋白酶(以及丝氨酸蛋白酶)的特征为除了丝氨酸以外,还具有两个活性位点氨基酸残基,即一个组氨酸和一个天冬氨酸残基。
枯草杆菌蛋白酶的实例是来源于芽孢杆菌的那些,如枯草杆菌蛋白酶lentus、芽孢杆菌lentus、枯草杆菌蛋白酶Novo、嘉士伯枯草杆菌蛋白酶(subtilisin Carlsberg)、地衣芽孢杆菌、枯草杆菌蛋白酶BPN’、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147以及枯草杆菌蛋白酶168(描述于WO 89/06279中)以及蛋白酶PD138(WO 93/18140)。另外的丝氨酸蛋白酶实例描述于WO 98/020115、WO 01/44452、WO 01/58275、WO 01/58276、WO 03/006602以及WO04/099401中。枯草杆菌酶变体的实例可以是在以下任意位置中具有突变的那些:3、4、9、15、27、36、68、76、87、95、96、97、98、99、100、101、102、103、104、106、118、120、123、128、129、130、160、167、170、194、195、199、205、217、218、222、232、235、236、245、248、252以及274,使用BPN’编号。更优选地,这些枯草杆菌酶变体可以包含以下突变:S3T、V4I、S9R、A15T、K27R、*36D、V68A、N76D、N87S,R、*97E、A98S、S99G,D,A、S99AD、S101G,M,R S103A、V104I,Y,N、S106A、G118V,R、H120D,N、N123S、S128L、P129Q、S130A、G160D、Y167A、R170S、A194P、G195E、V199M、V205I、L217D、N218D、M222S、A232V、K235L、Q236H、Q245R、N252K、T274A(使用BPN’进行编号)。另外的优选的蛋白酶是来自迟缓芽孢杆菌DSM 5483的碱性蛋白酶(如在(例如)WO 95/23221中所述)、以及其变体(在WO 92/21760、WO 95/23221、EP 1921147以及EP 1921148中描述的)。
胰蛋白酶样蛋白酶的实例为胰蛋白酶(例如,猪或牛来源的),以及在WO 89/06270和WO 94/25583中描述的镰孢属蛋白酶。有用的蛋白酶的实例为在WO 92/19729、WO 98/20115、WO 98/20116、以及WO 98/34946中描述的变体,尤其是在一个或多个以下位置中具有取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235、以及274。
金属蛋白酶的实例是如描述于WO 07/044993中的中性金属蛋白酶。
优选的可商购的蛋白酶酶类包括AlcalaseTM、CoronaseTM、DuralaseTM、DurazymTM、EsperaseTM、EverlaseTM、KannaseTM、LiquanaseTM、Liquanase UltraTM、OvozymeTM、PolarzymeTM、PrimaseTM、RelaseTM、SavinaseTM和Savinase UltraTM(诺维信公司(NovozymesA/S)),AxapemTM(Gist-Brocases N.V.公司),BLAP和BLAP X(Henkel AG&Co.KGaA),ExcellaseTM、FN2TM、FN3TM、FN4TM、MaxacaTM、MaxapemTM、MaxataseTM、ProperaseTM、PurafastTM、PurafectTM、Purafect OxPTM、Purafect PrimeTM和PuramaxTM(杰能科有限公司(Genencorint.))。
脂肪酶和角质酶:适合的脂肪酶和角质酶包括细菌或真菌来源的那些。包括化学修饰的或蛋白质工程化的变体酶。实例包括来自嗜热真菌属的脂肪酶,例如如描述于EP258068和EP 305216中的来自疏绵状嗜热丝孢菌(早先命名为疏棉状腐质霉);来自腐质霉属的角质酶,例如特异腐质霉(WO 96/13580);来自假单胞菌属的菌株的脂肪酶(这些中的一些现在改名为伯克霍尔氏菌属),例如产碱假单胞菌或类产碱假单胞菌(EP 218272)、洋葱假单胞菌(EP 331376)、假单胞菌属菌株SD705(WO 95/06720&WO 96/27002)、威斯康星假单胞菌(P.wisconsinensis)(WO 96/12012);GDSL-型链霉菌属脂肪酶(WO 10/065455);来自稻瘟病菌的角质酶(WO 10/107560);来自门多萨假单胞菌的角质酶(US 5,389,536);来自褐色嗜热裂孢菌(Thermobifida fusca)的脂肪酶(WO 11/084412);嗜热脂肪土芽孢杆菌脂肪酶(WO 11/084417);来自枯草芽孢杆菌的脂肪酶(WO 11/084599);以及来自灰色链霉菌(WO 11/150157)和始旋链霉菌(S.pristinaespiralis)的脂肪酶(WO 12/137147)。
另外的实例是有时被称为酰基转移酶或过水解酶(perhydrolase)的脂肪酶,例如与南极假丝酵母脂肪酶A具有同源性的酰基转移酶(WO 10/111143)、来自耻垢分枝杆菌的酰基转移酶(WO 05/56782)、来自CE 7家族的过水解酶(WO 09/67279)、以及耻垢分枝杆菌过水解酶的变体,特别是用于在来自亨斯迈纺织染化私人有限公司(Huntsman TextileEffects Pte Ltd)的商业化产品Gentle Power Bleach(柔和漂白剂)中使用的S54V变体(WO 10/100028)。
其他实例是脂肪酶变体,例如描述于EP 407225、WO 92/05249、WO 94/01541、WO94/25578、WO 95/14783、WO 95/30744、WO 95/35381、WO 95/22615、WO 96/00292、WO 97/04079、WO 97/07202、WO 00/34450、WO 00/60063、WO 01/92502、WO 07/87508以及WO 09/109500中的那些。
优选的商业化脂肪酶产品包括LipolaseTM、LipexTM;LipolexTM和LipocleanTM(诺维信公司),Lumafast(来自杰能科公司(Genencor))以及Lipomax(来自吉斯特布罗卡德斯公司(Gist-Brocades))。
淀粉酶-淀粉酶可以是一种α-淀粉酶、β-淀粉酶或葡糖淀粉酶并且可以是细菌或真菌来源的。包括经化学修饰的或蛋白质工程改造的变体。淀粉酶包括例如获得自芽孢杆菌属的α-淀粉酶,例如GB 1,296,839中更详细描述的地衣芽孢杆菌具体株系的α-淀粉酶。
淀粉酶的实例是具有WO 95/10603中的SEQ ID NO:3的那些或与SEQ ID NO:3具有90%序列一致性的其变体。优选的变体描述于WO 94/02597、WO 94/18314、WO 97/43424以及WO 99/019467的SEQ ID NO:4中,例如在WO 95/10603中的SEQ ID NO:3的一个或多个以下位置具有取代的变体:15、23、105、106、124、128、133、154、156、178、179、181、188、190、197、201、202、207、208、209、211、243、264、304、305、391、408以及444。
可以使用的另外的淀粉酶是具有WO 02/010355中的SEQ ID NO:6的淀粉酶或其与SEQ ID NO:6具有90%序列一致性的变体。SEQ ID NO:6的优选变体是在位置181和182中具有缺失并且在位置193中具有取代的那些。
其他淀粉酶实例是包含示于WO 2006/066594的SEQ ID NO:6中的来源于解淀粉芽孢杆菌的α-淀粉酶的残基1-33和示于WO 2006/066594的SEQ ID NO:4中的地衣芽孢杆菌α-淀粉酶的残基36-483的杂合α-淀粉酶或具有90%序列一致性的其变体。这一杂合α-淀粉酶的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:G48、T49、G107、H156、A181、N190、M197、I201、A209以及Q264。包括示于WO 2006/066594的SEQ ID NO:6中的来源于解淀粉芽孢杆菌的α-淀粉酶的残基1-33和SEQ ID NO:4的残基36-483的杂合α-淀粉酶的最优选变体是具有以下取代的那些:
M197T;
H156Y+A181T+N190F+A209V+Q264S;或
G48+T49+G107+H156+A181+N190+I201+A209+Q264。
另外的淀粉酶实例是具有WO 99/019467中的SEQ ID NO:6的淀粉酶或其与SEQ IDNO:6具有90%序列一致性的变体。SEQ ID NO:6的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:R181、G182、H183、G184、N195、I206、E212、E216以及K269。特别优选的淀粉酶是在位置G182和H183或位置H183和G184中具有缺失的那些。
另外的淀粉酶是具有WO 96/023873的SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7的那些或其与SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7具有90%序列一致性的变体。SEQID NO:1、SEQ ID NO:2或SEQ ID NO:7的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:140、181、182、183、184、195、206、212、243、260、269、304以及476。更优选的变体是在位置182和183或位置183和184中具有缺失的那些。SEQ ID NO:1、SEQ IDNO:2或SEQ ID NO:7的最优选的淀粉酶变体是在位置183和184中具有缺失并且在位置140、195、206、243、260、304以及476中具有取代的那些。
可以使用的其他淀粉酶是具有WO 08/153815中的SEQ ID NO:2、WO 01/66712中的SEQ ID NO:10的淀粉酶或其与WO 08/153815的SEQ ID NO:2具有90%序列一致性或与WO01/66712中的SEQ ID NO:10具有90%序列一致性的变体。WO 01/66712中的SEQ ID NO:10的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:176、177、178、179、190、201、207、211以及264。
可以使用的另外的淀粉酶是具有WO 09/061380的SEQ ID NO:2的淀粉酶或其与SEQ ID NO:2具有90%序列一致性的变体。SEQ ID NO:2的优选变体是在以下位置中的一个或多个中具有取代、缺失或插入的那些:Q87、Q98、S125、N128、T131、T165、K178、R180、S181、T182、G183、M201、F202、N225、S243、N272、N282、Y305、R309、D319、Q320、Q359、K444以及G475。SEQ ID NO:2的最优选的变体是在以下位置中的一个或多个中具有取代:Q87E,R、Q98R、S125A、N128C、T131I、T165I、K178L、T182G、M201L、F202Y、N225E,R、N272E,R、S243Q,A,E,D、Y305R、R309A、Q320R、Q359E、K444E以及G475K,和/或在位置R180和/或S181具有缺失的那些。SEQ ID NO:2的最优选的淀粉酶变体是具有以下取代的那些:
N128C+K178L+T182G+Y305R+G475K;
N128C+K178L+T182G+F202Y+Y305R+D319T+G475K;
S125A+N128C+K178L+T182G+Y305R+G475K;或
S125A+N128C+T131I+T165I+K178L+T182G+Y305R+G475K,其中该变体任选地进一步在位置243处包括取代和/或在位置180和/或位置181处包括缺失。
淀粉酶的其他实例是具有WO 01/66712中的SEQ ID NO:12的α-淀粉酶或与SEQ IDNO:12具有至少90%,例如至少95%序列一致性的变体。优选的淀粉酶变体是在WO 01/66712中的SEQ ID NO:12的以下位置中的一个或多个中具有取代、缺失或插入的那些:R28,R118,N174;R181,G182,D183,G184,G186,W189,N195,M202,Y298,N299,K302,S303,N306,R310,N314;R320,H324,E345,Y396,R400,W439,R444,N445,K446,Q449,R458,N471,N484。特别优选的淀粉酶包括具有D183和G184的缺失并且具有R118K、N195F、R320K及R458K的取代的变体,以及另外在选自下组的一个或多个位置中具有取代的变体:M9、G149、G182、G186、M202、T257、Y295、N299、M323、E345以及A339,最优选的是另外在所有这些位置中具有取代的变体。
可商购的淀粉酶是DuramylTM、TermamylTM、FungamylTM、StainzymeTM、StainzymePlusTM、NatalaseTM和BANTM(诺维信公司),RapidaseTM和PurastarTM(来自杰能科国际有限公司)。
过氧化物酶/氧化酶:适合的过氧化物酶/氧化酶包括植物、细菌或真菌来源的那些。包括经化学修饰的或蛋白质工程改造的变体。有用的过氧化物酶的实例包括来自鬼伞属,例如来自灰盖鬼伞的过氧化物酶,及其变体,如在WO 93/24618、WO 95/10602、以及WO98/15257中描述的那些。
可商购的过氧化物酶包括GuardzymeTM(诺维信公司)。
该一种或多种酶可以通过添加包含一种或多种酶的单独的添加剂,或通过添加包括所有这些酶的组合添加剂而被包括于洗涤剂组合物中。本发明的洗涤剂添加剂,即单独的或组合的添加剂,可以配制成例如颗粒、液体、浆液等,优选的洗涤剂添加剂剂型为颗粒,特别是无粉尘颗粒;液体,特别是稳定化液体;或者浆液。
非尘颗粒可以例如如在US 4,106,991和4,661,452中所披露而产生,并且可以任选地通过本领域已知的方法进行包衣。蜡状包衣材料的实例为具有1000至20000的平均摩尔重量的聚(环氧乙烷)产物(聚乙二醇,PEG);具有从16至50个环氧乙烷单元的乙氧化壬基苯酚;乙氧化脂肪醇,其中该醇包含从12至20个碳原子,并且其中具有15至80个环氧乙烷单元;脂肪醇;脂肪酸;以及脂肪酸的甘油单酯和甘油二酯以及甘油三酯。适用于通过流化床技术应用的成膜包衣材料的实例在GB 1483591中给出。液体酶制品可以例如通过根据已确立的方法添加多元醇(如丙二醇)、糖或糖醇、乳酸或硼酸而稳定化。受保护的酶可以根据EP238,216中披露的方法来制备。
辅料-还可以利用本领域中已知的用于在衣物洗涤剂中使用的任何洗涤剂组分。其他任选的洗涤剂组分包括防腐剂、防缩剂、抗污垢再沉积剂、抗皱剂、杀细菌剂、粘合剂、腐蚀抑制剂、崩解剂(disintegrant)/崩解试剂(disintegration agent)、染料、酶稳定剂(包括硼酸、硼酸盐、CMC和/或多元醇如丙二醇)、织物整理剂(包括粘土)、填充剂/加工助剂、荧光增白剂/光学增亮剂、增泡剂、泡沫(泡)调节剂、香料、污垢助悬剂、软化剂、抑泡剂、晦暗抑制剂以及芯吸剂,单独抑或组合使用。可以利用本领域中已知的用于在衣物洗涤剂中使用的任何成分。此类成分的选择完全在普通技术人员的技术内。
分散剂:本发明的洗涤剂组合物还可以包含分散剂。具体地说,粉状洗涤剂可以包括分散剂。适合的水溶性有机材料包括均聚合或共聚合的酸或其盐,其中聚羧酸包括至少两个羧基,这两个羧基被不超过两个碳原子彼此分开。适合的分散剂例如描述于粉状洗涤剂,表面活性剂科学系列(Surfactant Science Series),第71卷中,马塞尔·德克尔公司(Marcel Dekker)。
染料转移抑制剂:本发明的洗涤剂组合物还可以包括一种或多种染料转移抑制剂。适合的聚合物染料转移抑制剂包括但不限于聚乙烯吡咯烷酮聚合物、多胺N-氧化物聚合物、N-乙烯吡咯烷酮与N-乙烯基咪唑的共聚物、聚乙烯噁唑烷酮以及聚乙烯咪唑或其混合物。当存在于主题组合物中时,染料转移抑制剂可以按组合物重量计的以下水平存在:从约0.0001%至约10%、从约0.01%至约5%或甚至从约0.1%至约3%。
荧光增白剂:本发明的洗涤剂组合物还将优选地包含另外的组分,这些组分可以给正清洁的物品着色,例如荧光增白剂或光学增亮剂。其中增亮剂优选以约0.01%至约0.5%的水平存在。在本发明的组合物中可以使用适合用于在衣物洗涤剂组合物中使用的任何荧光增白剂。最常用的荧光增白剂是属于以下类别的那些:二氨芪-磺酸衍生物、二芳基吡唑啉衍生物和二苯基-联苯乙烯基衍生物。荧光增白剂的二氨芪-磺酸衍生物型的实例包括以下各项的钠盐:4,4'-双-(2-二乙醇氨基-4-苯胺基-s-三嗪-6-基氨基)芪-2,2'-二磺酸盐;4,4'-双-(2,4-二苯胺基-s-三嗪-6-基氨基)芪-2.2'-二磺酸盐;4,4'-双-(2-苯胺基-4(N-甲基-N-2-羟基-乙氨基)-s-三嗪-6-基氨基)芪-2,2'-二磺酸盐,4,4'-双-(4-苯基-2,1,3-三唑-2-基)芪-2,2'-二磺酸盐;4,4'-双-(2-苯胺基-4(1-甲基-2-羟基-乙氨基)-s-三嗪-6-基氨基)芪-2,2'-二磺酸盐和2-(二苯乙烯基-4"-萘-1.,2':4,5)-1,2,3-三唑-2"-磺酸盐。优选的荧光增白剂是可从汽巴–嘉基股份有限公司(Ciba-Geigy AG)(巴塞尔,瑞士)获得的天来宝(Tinopal)DMS和天来宝CBS。天来宝DMS是4,4'-双-(2-吗啉基-4苯胺基-s-三嗪-6-基氨基)芪二磺酸盐的二钠盐。天来宝CBS是2,2'-双-(苯基-苯乙烯基)二磺酸盐的二钠盐。还优选荧光增白剂,是可商购的Parawhite KX,由派拉蒙矿物与化学(Paramount Minerals and Chemicals),孟买,印度供应。适合用于在本发明中使用的其他荧光剂包括1-3-二芳基吡唑啉和7-烷氨基香豆素。适合的荧光增亮剂水平包括从约0.01wt%、从0.05wt%、从约0.1wt%或甚至从约0.2wt%的较低水平至0.5wt%或甚至0.75wt%的较高水平。
污垢释放聚合物:本发明的洗涤剂组合物还可以包括一种或多种污垢释放聚合物,这些污垢释放聚合物帮助从织物,例如棉或聚酯基织物上去除污垢,特别是从聚酯基织物上去除疏水污垢。污物释放聚合物可以例如是非离子型或阴离子型对苯二甲酸基聚合物、聚乙烯基己内酰胺和相关共聚物、乙烯基接枝共聚物、聚酯聚酰胺,参见例如粉状洗涤剂,表面活性剂科学系列第71卷第7章,马塞尔·德克尔公司(Marcel Dekker,Inc.)。另一种类型的污物释放聚合物是包括一个芯结构和连接至该芯结构的多个烷氧基化基团的两亲性烷氧基化油污清洁聚合物。核心结构可以包括聚烷基亚胺结构或聚烷醇胺结构,如WO2009/087523中详细描述的(将其通过引用而特此结合)。此外,任意接枝共聚物是适合的污物释放聚合物。适合的接枝共聚物更详细地描述于WO 2007/138054、WO 2006/108856以及WO 2006/113314中(将其通过引用而特此结合)。其他污垢释放聚合物是取代的多糖结构,尤其是取代的纤维素结构,例如改性纤维素衍生物,例如EP 1867808或WO 2003/040279中描述的那些(将二者都通过引用而特此结合)。适合的纤维素聚合物包括纤维素、纤维素醚、纤维素酯、纤维素酰胺及其混合物。适合的纤维素聚合物包括阴离子改性的纤维素、非离子改性的纤维素、阳离子改性的纤维素、兼性离子改性的纤维素及其混合物。适合的纤维素聚合物包括甲基纤维素、羧甲基纤维素、乙基纤维素、羟乙基纤维素、羟丙基甲基纤维素、酯羧甲基纤维素及其混合物。
抗再沉积剂:本发明的洗涤剂组合物还可以包括一种或多种抗再沉积剂,例如羧甲基纤维素(CMC)、聚乙烯醇(PVA)、聚乙烯吡咯烷酮(PVP)、聚环氧乙烷和/或聚乙二醇(PEG)、丙烯酸的均聚物、丙烯酸与马来酸的共聚物以及乙氧基化聚乙亚胺。以上在污垢释放聚合物下描述的纤维素基聚合物还可以用作抗再沉积剂。
其他适合的辅料包括但不限于防缩剂、抗皱剂、杀细菌剂、粘合剂、载体、染料、酶稳定剂、织物软化剂、填充剂、泡沫调节剂、助水溶剂、香料、色素、抑泡剂、溶剂以及用于液体洗涤剂的结构剂和/或结构弹性剂。
洗涤剂产品的配制
本发明的洗涤剂组合物可以处于任何常规形式,例如条、均匀的片剂、具有两个或更多个层的片剂、具有一个或多个室的袋、规则的或压缩的粉末、颗粒、膏、凝胶、或规则的、压缩的或浓缩的液体。存在多种洗涤剂配制品形式,例如层(相同或不同相)、袋以及用于机械给料装置的形式。
可以将小袋配置为单一隔室或多隔室。它可以具有适合保存该组合物的任何形式、形状和材料,例如在与水接触之前,不允许该组合物从袋中释放出来。袋由封装内体积的水溶性膜制成。可以将所述内体积分为袋的室。优选的膜是形成膜或片的聚合材料,优选是聚合物。优选的聚合物、共聚物或其衍生物选自聚丙烯酸酯、和水溶性丙烯酸酯共聚物、甲基纤维素、羧甲基纤维素、糊精钠、乙基纤维素、羟乙基纤维素、羟丙基甲基纤维素、麦芽糊精、聚甲基丙烯酸酯,最优选地是聚乙烯醇共聚物和羟丙基甲基纤维素(HPMC)。优选地,在膜中的聚合物(例如PVA)的水平是至少约60%。优选的平均分子量将典型地是约20,000至约150,000。膜还可以是共混物组合物,该共混物组合物包括可水解降解并且水可溶的聚合物共混物,例如聚乳酸和聚乙烯醇(已知在贸易参考M8630下,如由美国印第安纳州盖里(Gary,Ind.,US)的克里斯克拉夫特工业产品公司(Chris Craft In.Prod.)销售)加增塑剂,像甘油、乙二醇、丙二醇、山梨醇及其混合物。这些袋可以包括固体衣物清洁组合物或部分组分和/或液体清洁组合物或由水溶性膜分开的部分组分。用于液体组分的室在构成上可以与包含固体的室不同。参考文献:(US 2009/0011970A1)。
可以由水可溶的袋中或片剂的不同层中的室来将洗涤剂成分物理地彼此分开。由此可以避免组分之间的负面的存储相互作用。在洗涤溶液中,每个室的不同溶解曲线还可以引起选择的组分的延迟溶解。
非单位剂量的液体或凝胶洗涤剂可以是水性的,典型地包含按重量计至少20%并且最高达95%的水,例如高达约70%的水、高达约65%的水、高达约55%的水、高达约45%的水、高达约35%的水。包括但不限于链烷醇、胺、二醇、醚以及多元醇的其他类型的液体可以被包括在水性液体或凝胶中。含水液体或凝胶洗涤剂可以包含从0-30%的有机溶剂。液体或凝胶洗涤剂可以是非水性的。
本发明的酶可以被添加至洗衣皂条中并且用于手洗洗衣、织物和/或纺织品。术语洗衣皂条包括洗衣条、皂条、组合条(combo bar)、合成洗涤剂条以及洗涤剂条。条的类型通常区别在于它们包含的表面活性剂的类型,并且术语洗衣皂条包括包含来自脂肪酸的皂和/或合成皂的那些。洗衣皂条具有在室温下为固体而非液体、凝胶或粉末的物理形式。术语固体被定义为不随着时间显著变化的物理形式,即如果将一固体物体(例如洗衣皂条)放置于一个容器内部,该固体物体不发生改变来填充它被放置于其中的容器。条典型地是处于条形的固体但是可以处于其他固体形状,例如圆形或卵形。
洗衣皂条可以包含一种或多种另外的酶,蛋白酶抑制剂例如肽醛类(或次硫酸盐加合物或半缩醛加合物),硼酸,硼酸盐,硼砂和/或苯基硼酸衍生物例如4-甲酰苯基硼酸,一种或多种肥皂或合成表面活性剂,多元醇例如甘油,pH控制化合物例如脂肪酸、柠檬酸、乙酸和/或甲酸,和/或一价阳离子和有机阴离子的盐,其中该一价阳离子可以是例如Na+、K+或NH4 +并且该有机阴离子可以是例如甲酸盐、乙酸盐、柠檬酸盐或乳酸盐,这样使得一价阳离子和有机阴离子的盐可以是例如甲酸钠。
洗衣皂条还可以包含络合剂像EDTA和HEDP,香料和/或不同类型的填充剂,表面活性剂例如阴离子型合成表面活性剂,助洗剂,聚合的污垢释放剂,洗涤剂螯合剂,稳定剂,填充剂,染料,着色剂,染料转移抑制剂,烷氧基化的聚碳酸酯,抑泡剂,结构剂,粘合剂,浸出剂,漂白活化剂,粘土去污剂,抗再沉积剂,聚合分散剂,增白剂,织物柔软剂,香料和/或本领域已知的其他化合物。
洗衣皂条可以在常规的洗衣皂条制造设备中进行加工,例如但不限制于:混合器、压条机例如双级真空压条机、挤出机、切割机、标识压模机(logo-stamper)、冷却隧道以及包装机。本发明不局限于通过任何单一方法制备洗衣皂条。可以在过程的不同阶段向肥皂中添加本发明的预混料。例如,可以制备包含肥皂、酶、任选地一种或多种另外的酶、蛋白酶抑制剂以及一价阳离子和有机阴离子的盐的预混料并且然后将该混合物压条。可以同时添加作为例如处于液态的蛋白酶抑制剂的酶以及任选的另外的酶。除了混合步骤和压条步骤以外,该工艺还可以进一步包括研磨、挤出、切割、压模、冷却和/或包装的步骤。
用于降解黄原胶的用途
已经将黄原胶用作许多消费品(包括食品和化妆品)中的成分并且已经用于石油工业中。因此,黄原胶的降解可以导致改进的清洁过程,例如更容易去除包含胶质(例如黄原胶)的污物,连同通常用于石油与钻探工业中的黄原胶的降解。因此,本发明针对本发明的内切葡聚糖酶或其组合物用于降解黄原胶的用途。本发明还针对黄原胶裂解酶或其组合物用于降解黄原胶的用途。一个实施例是本发明的内切葡聚糖酶与黄原胶裂解酶一起或其组合物用于降解黄原胶的用途。可以优选地使用如描述于实例5中的粘度减小测定(ViPr测定)或可替代地,如描述于实例6中的还原末端测定测量黄原胶的降解。
在一个实施例中,可以使用如有关黄原胶的在此描述的粘度减小测定测量黄原胶的降解。一个优选实施例是黄原胶(0.25%或0.5%)在缓冲液或水中的用途,其中在5分钟、30分钟、1小时、1.5小时、2小时、2.5小时、3小时、3.5小时或4小时后测量粘度的下降。一个更优选的实施例是黄原胶(0.25%)在水中的用途,其中在3小时后测量粘度的下降。
当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少200Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少250Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少300Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少350Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少400Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少450Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少500Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少550Pa。当使用粘度减小测定时,用于降解黄原胶的粘度的下降是至少600Pa。
可替代地,可以使用由莱韦尔(Lever)(1972),Lever(Lever)47:273-279,1972研发的比色测定,将黄原胶降解活性测量为用黄原胶裂解酶预处理的黄原胶上的还原末端。一个优选实施例是用黄原胶裂解酶预处理的0.1%黄原胶的用途。可以通过计算空白与样品之间的差异确定用黄原胶裂解酶预处理的黄原胶的降解,其中大于0.1mAU,大于0.15mAU,大于0.2mAU,大于0.25mAU,大于0.5mAU,优选大于0.6mAU,更优选大于0.7mAU或甚至更优选大于0.8mAU的差异示出用黄原胶裂解酶预处理的黄原胶的降解。
在去污剂中的用途。
本发明针对本发明的内切葡聚糖酶或其组合物在清洁过程中的用途,例如纺织品和织物的湿洗,例如家用衣物洗涤和工业衣物洗涤,以及家用和工业硬表面清洁,例如餐具洗涤。可以将本发明的内切葡聚糖酶添加至包括一种或多种洗涤剂组分的洗涤剂组合物中。
一个实施例是本发明的内切葡聚糖酶连同黄原胶裂解酶或其组合物在清洁过程中的用途,例如纺织品和织物的湿洗(例如家用衣物洗涤和工业衣物洗涤)以及家用和工业硬表面清洁,例如餐具洗涤。可以将本发明的内切葡聚糖酶连同黄原胶裂解酶添加至包括一种或多种洗涤剂组分的洗涤剂组合物中。
可以将本发明的多肽添加至洗涤剂组合物中并且因此变成洗涤剂组合物的组分。本发明的洗涤剂组合物可以配制为例如用于家用和工业衣物清洁两者的手洗或机洗衣物洗涤剂组合物,包括适用于预处理有污物的织物的洗衣添加剂组合物和漂洗添加的织物软化剂组合物,或者配制为用于一般家用或工业硬表面清洁操作的洗涤剂组合物,或者配制用于手洗或机洗(家用和工业两者)餐具洗涤操作。在一个特定的方面中,本发明提供了一种洗涤剂添加剂,该添加剂包括如在此描述的本发明的多肽。
在一个实施例中,可以如WO 2013/167581中所述,使用AMAS,对黄原胶与碳黑小块布样测量ΔInt酶值。一个优选实施例是黄原胶与碳黑(DN31、DN31C或DN31D)小块布样在20℃或40℃下的使用。一个更优选的实施例是黄原胶与碳黑(DN31C或DN31D)小块布样在40℃下的使用。一个甚至更优选的实施例是黄原胶与碳黑(DN31D)小块布样在40℃下的使用。用于对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶和用于黄原胶裂解酶的优选的酶浓度分别为0.5mg EP/L和1.0mg EP/L。
如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少3个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少3.5个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少4个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少4.5个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少5个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少5.5个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少6个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少7个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少8个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少9个单位。如通过AMSA所确定,黄原胶与碳黑小块布样的δ强度值是至少10个单位。
在一个实施例中,可以如WO 2013/167581中所述,使用MiniLOM测定,对黄原胶与碳黑小块布样测量ΔRem酶值。一个优选实施例是黄原胶与碳黑(DN31、DN31C或DN31D)小块布样在20℃或40℃下的使用。一个更优选的实施例是黄原胶与碳黑(DN31C或DN31D)小块布样在40℃下的使用。一个甚至更优选的实施例是黄原胶与碳黑(DN31D)小块布样在40℃下的使用。优选地在460nm测量反射值。用于对用黄原胶裂解酶预处理的黄原胶具有活性的内切葡聚糖酶和用于黄原胶裂解酶的优选的酶浓度分别为0.5mg EP/L和1.0mg EP/L。
如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少1.5个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少1.75个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少2个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少2.25个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少2.5个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少2.75个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少3个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少3.5个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少4个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少4.5个单位。如通过MiniLOM所确定,黄原胶与碳黑小块布样的ΔRem酶值是至少5个单位。
本发明还涉及用于降解纺织品的表面或硬表面上的黄原胶的方法,这些方法包括向黄原胶施用包括一种或多种本发明的内切葡聚糖酶的组合物。本发明进一步涉及用于降解纺织品的表面或硬表面上的黄原胶的方法,这些方法包括向黄原胶施用包括一种或多种黄原胶裂解酶的组合物。一个实施例是一种用于纺织品的表面或硬表面上的降解黄原胶的方法(例如餐具洗涤),该方法包括向黄原胶施用包括一种或多种本发明的内切葡聚糖酶连同一种或多种黄原胶裂解酶的组合物。一个实施例是包括如在此描述的一种或多种洗涤剂组分的组合物。
在地下地层的压裂(石油和/或天然气钻探)中的用途
使用水力压裂来创造自钻孔延伸至岩层的地下压裂,以便增加通过地层可以产生的流体的流速。通常,将高粘度压裂液以足够压裂地下地层的压力泵入井中。为了维持向地层的增加的暴露,将固体支撑剂添加至压裂液中,通过施加至流体的高压将其带进压裂处。一旦高粘度压裂液将该支撑剂带进地层中,破碎物用于减少流体的粘度,这允许该支撑剂停留在压裂处中并且由此增加地层向井的暴露。破碎物通过减少聚合物的分子量而工作,以此方式‘破碎’或降解聚合物。压裂处然后变为一种高渗透性管道,用于有待产生的流体和空气回至井中。此类过程进一步披露于美国专利号7,360,593、5,806,597、5,562,160、5,201,370以及5,067,566中。
因此,本发明涉及本发明的内切葡聚糖酶作为酶破碎物的用途。本发明的一个实施例是本发明的内切葡聚糖酶连同黄原胶裂解酶作为酶破碎物的用途。
因此,本发明提供了一种用于破碎钻井孔中的黄原胶的方法,该方法包括:(i)将包括水性流体的可胶凝压裂液、一种或多种能水合的聚合物、用于交联能水合的聚合物以形成一种聚合物凝胶的适合的交联剂,以及一种或多种本发明的酶(即,酶破碎物)共混在一起;(ii)将交联聚合物凝胶在足够压裂周围地层的压力下泵入钻井孔中;并且(iii)允许酶破碎物降解交联聚合物,以减少流体的粘度,这样使得可以将流体从地层泵回至井表面。因此,本发明的内切葡聚糖酶可以用于控制压裂液的粘度。此外,一种或多种本发明的内切葡聚糖酶连同一种或多种黄原胶裂解酶可以用于控制压裂液的粘度。
本发明的酶破碎物可以是压裂液或破碎物-交联剂-聚合物复合物的一种成分,该压裂液或复合物进一步包括一种能水合的聚合物和一种交联剂。压裂液或复合物可以是一种凝胶或可以是可胶凝化的。该复合物在以下方法中是有用的,该方法用于在一种压裂液中使用该复合物以将钻井孔周围的地下地层压裂,这是通过在足够将周围的地下地层压裂的压力下将该流体泵至钻井孔中的所希望的位置。该复合物可以通过维持特定条件的pH和温度来维持基本上非反应的状态,直到该流体被放置在钻井孔中的时刻并且完成所希望的压裂。一旦压力完成,该复合物维持无活性的特定条件便不再维持。当这些条件显著变化时,该复合物变得有活性并且破碎物开始催化聚合物降解,从而导致压裂液变得足够流动,以从地下地层泵至井表面。
降解黄原胶的方法,其中黄原胶用于压裂由钻井孔形成的地下地层
当钻井时,储层钻井液(RDF)在钻探设备内循环以冷却并清洁钻头,去除钻井孔外的钻屑,减少钻柱与钻孔的侧边之间的摩擦力,并且形成滤饼以便阻止流体渗漏进入地层中。用于形成滤饼的驱动力是应用以维持钻孔稳定性的较高的钻井孔压力。这一滤饼限制储层流体在钻探以及完井设备的放置过程中流入钻井孔。如果在井竣工之前或过程中未去除在钻探过程中造成的滤饼损伤,则当该井投入生产时可以出现一系列问题,即完井设备失败和受损的储层生产力。
钻井液(泥浆)(也称为储层钻井液(RDF))可以是合成/油基的或水基的。为了使钻井液对地层的侵入最小化,油基和水基泥浆滤饼两者都典型地包含一种桥接剂或增重剂,通常是碳酸钙颗粒、重晶石或两者的混合物,其桥接在地层的孔喉处并且由此形成相对低渗透性滤饼。油基和水基泥浆滤饼两者还都包含在钻探过程中带出的称作钻屑的固体,与添加在钻井液的配制品中的桥接/增重剂截然相反。这些固体可以是石英(砂)、粉砂和/或页岩,取决于储层地层以及由钻探路径至储层穿过的地层。另外,油基钻井泥浆包含陷于滤饼的孔域中的水滴,而水基泥浆滤饼包含聚合物,例如淀粉和黄原胶,以及其他无机盐。
形成泥浆滤饼对于钻探而言通常是必须的,特别是在具有钻井孔稳定性问题并且典型地具有高渗透性的疏松地层中。然后将滤饼用不同化学品处理,例如螯合剂或酸,以溶解方解石组分;和/或酶或氧化剂,以降解聚合物组分,从而恢复渗透性。
在一个方面中,本发明提供了一种用于降解黄原胶的方法,其中黄原胶用于压裂由钻井孔造成的地下地层,该方法是通过应用包括一种或多种本发明的酶的组合物。该方法可以包括以下步骤:(i)将包括一种或多种本发明的酶的处理流体泵入与有待去除的滤饼接触的钻孔中,以在该处理流体与邻接该滤饼的地层之间建立不同的压力并且(ii)在不同的压力周期过程中均匀地传播滤饼的处理,以通过该处理流体延迟突破。
在一个实施例中,该方法包括在地层与钻孔之间通过处理的滤饼建立渗透性。在另一个实施例中,该滤饼可以包括钻井固体和黏土,并且可以形成自水性钻井液。如果希望的话,用于处理水性钻井液滤饼的处理流体还可以包括一种氧化剂和/或螯合剂,或它可以是基本上不含螯合剂和氧化剂添加剂的。在另一个实例中,该滤饼可以形成自油或反相乳化钻井液。如果希望的话,用于处理油或反相乳化钻井液滤饼的处理流体还可以包括互溶剂、水润湿剂或其组合,从而将疏水性组分分散在滤饼中。
在一个实施例中,该处理流体包括一种或多种本发明的内切葡聚糖酶。在另一个实施例中,该处理流体包括一种或多种黄原胶裂解酶。在一个优选实施例中,该处理流体包括一种或多种内切葡聚糖酶以及一种或多种黄原胶裂解酶。
降解黄原胶的方法,其中黄原胶是钻孔滤饼中的一种组分
在一个方面中,本发明提供了一种一旦钻孔滤饼被泵至表面,用于清洁该滤饼的方法,该滤饼包括聚合物,例如黄原胶和钻井液固体。钻井泥浆从泥浆池泵至钻头然后再泵出至表面,在该过程中带出除其他东西之外的破碎的或切碎的岩石(钻屑)。将钻屑滤出并且将泥浆返回至泥浆池,在泥浆池中细粒可以沉淀和/或可以将添加化学品或酶(破碎物)进行添加。
用于降解黄原胶的方法(其中黄原胶是钻孔滤饼中的一种组分)可以包括以下步骤:(i)用一种处理流体处理该钻孔滤饼,该处理流体包括一种或多种本发明的酶并且(ii)将固体与流体分离。在一个实施例中,该处理流体包括一种或多种本发明的内切葡聚糖酶。在另一个实施例中,该处理流体包括一种或多种黄原胶裂解酶。在一个优选实施例中,该处理流体包括一种或多种本发明的内切葡聚糖酶以及一种或多种黄原胶裂解酶。
可以将钻孔滤饼在泥浆池中用一种或多种本发明的酶处理并且可以再循环钻井液。可替代地,一旦滤饼已经被一种或多种本发明的酶处理,使用固液分离方法(例如离心)将固体与流体分离。
在加工纤维素材料中的用途
本发明的多肽的内切葡聚糖酶活性也可用于降解或转化纤维素材料,包括:用包括本发明的多肽的酶组合物处理纤维素材料。在一个优选方面,该方法进一步包括对降解的或转化的纤维素材料进行回收。
本发明还涉及产生一种发酵产物的方法,这些方法包括:(a)在本发明的多肽的存在下,用一种酶组合物使纤维素材料糖化;(b)用一种或多种(若干种)发酵微生物发酵该糖化的纤维素材料,以产生该发酵产物;并且(c)从该发酵中回收该发酵产物。
本发明还涉及发酵纤维素材料的方法,这些方法包括:用一种或多种(若干种)发酵微生物发酵该纤维素材料,其中在本发明的多肽的存在下,用一种酶组合物糖化该纤维素材料。在一个优选方面,发酵该纤维素材料产生一种发酵产物。在另一个优选方面,该方法进一步包括从发酵中回收发酵产物。
本发明的方法可被用于将一种纤维素材料糖化成可发酵糖,并且将这些可发酵糖转化成许多有用的物质,例如燃料、饮用乙醇、和/或发酵产物(例如酸类、醇类、酮类、气体等)。由该纤维素材料产生所希望的发酵产物典型地涉及预处理、酶水解(糖化)、以及发酵。
根据本发明,可以使用本领域常规的过程来完成纤维素材料的加工。此外,可以使用被配置为根据本发明进行操作的常规生物质加工装置来实施本发明的方法。
分开或同时的水解(糖化)和发酵包括但不限于:分开水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、杂合的水解和发酵(HHF)、分开水解和共发酵(SHCF)、杂合的水解和共发酵(HHCF),以及直接微生物转化(DMC)。
常规装置可以包括补料分批搅拌反应器、分批搅拌反应器、具有超过滤的连续流搅拌反应器、和/或连续活塞流动柱反应器(柯瑞芝(Corazza)等人,2003,用于纤维二糖水解的补料分批反应器中的最佳控制(Optimal control in fed-batch reactor for thecellobiose hydrolysis),技术学报(Acta Scientiarum.Technology)25:33-38;古萨科夫(Gusakov)和辛涅特西(Sinitsyn),1985,纤维素酶水解动力学:1.用于分批反应器过程的数学模型(Kinetics of the enzymatic hydrolysis of cellulose:1.Amathematicalmodel for a batch reactor process),酶与微生物技术(Enz.Microb.Technol.)7:346-352),研磨反应器(隆(Ryu)和李(Lee),1983,通过使用研磨生物反应器,生物转化废物纤维素(Bioconversion of waste cellulose by using anattrition bioreactor),生物技术和生物工程(Biotechnol.Bioeng)25:53-65),或具有电场诱导的有力搅拌的反应器(古萨科夫(Gusakov)等人,1996,使用具有电场诱导的有力搅拌的新颖类型的生物反应器的纤维素酶水解的增强(Enhancement of enzymaticcellulose hydrolysis using anovel type of bioreactor with intensive stirringinduced by electromagnetic field),应用生物化学与生物技术(Appl.Biochem.Biotechnol.)56:141-153)。另外的反应器类型包括:流化床,升流包覆层(blanket),固定化、以及用于水解和/或发酵的挤出机类型的反应器。
预处理。在实践本发明的方法中,可以使用本领域已知的任何预处理过程来破坏纤维素材料的细胞壁组分(钱德拉(Chandra)等人,2007,底物预处理:木质纤维素的有效酶水解的关键?(The key to effective enzymatic hydrolysis of lignocellulosics?)《生物化学工程/生物技术进展》(Adv.Biochem.Engin./Biotechnol.)108:67-93;加尔布(Galbe)和朱奇(Zacchi),2007,用于生物乙醇有效生产的不是纤维素材料的预处理(Pretreatment of lignocellulosic materials for efficient bioethanolproduction),《生物化学工程/生物技术进展》(Adv.Biochem.Engin./Biotechnol.)108:41-65;亨德里克斯(Hendriks)和塞曼(Zeeman),2009,预处理以增强木质纤维素生物质的可消化性(Pretreatments to enhance the digestibility of lignocellulosicbiomass),《生物资源技术》(Bioresource Technol.)100:10-18;莫热(Mosier)等人,2005,用于预处理木质纤维素生物质前景技术的特征(Features of promising technologiesfor pretreatment of lignocellulosic biomass),《生物资源技术》(BioresourceTechnol.)96:673-686;塔赫扎德(Taherzadeh)和卡里米(Karimi),2008,预处理木质纤维素废物来改进乙醇和生物气生产:综述(Pretreatment of lignocellulosic wastes toimprove ethanol and biogas production:A review)《分子科学国际期刊》(Int.J.ofMol.Sci.)9:1621-1651;杨(Yang)和怀曼(Wyman),2008,预处理:用来解锁低成本纤维素乙醇的关键(Pretreatment:the key to unlocking low-cost cellulosic ethanol),《生物燃料、生物产品与生物精炼》(Biofuels Bioproducts and Biorefining-Biofpr.)2:26-40)。
纤维素材料也可以在预处理之前使用本领域中已知的方法进行颗粒尺寸减缩、预浸泡、润湿、洗涤、或调理。
常规预处理包括但不限于:蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、以及γ辐射预处理。
可以在水解和/或发酵前预处理纤维素材料。优选在水解前进行预处理。可替代地,预处理可以与酶水解同时进行,以释放可发酵的糖,例如葡萄糖、木糖、和/或纤维二糖。在多数情况下,预处理步骤自身导致将生物质转化为可发酵糖(即使在没有酶的情况下)。
蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁组分,包括木质素、半纤维素、以及纤维素,以使酶可接触纤维素和其他级分,例如,半纤维素。使纤维素材料经过或通过反应容器,其中注入蒸汽以将温度增加至所需的温度和压力,并且在其中保持所希望的反应时间。蒸汽预处理优选在140℃-230℃,更优选160℃-200℃,并且最优选170℃-190℃下进行,其中最优的温度范围取决于任何化学催化剂的添加。蒸汽预处理的停留时间优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最优的停留时间依赖于温度范围和任何化学催化剂的添加。蒸汽预处理允许相对较高的固体加载量,这样使得纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆发放料(explosive discharge)合并,这被称为蒸汽爆炸,即,快速急骤蒸发至大气压和材料的湍流,以通过破碎增加可接触的表面积(Duff(迪福)和Murray(默里),1996,生物资源技术855:1-33;盖尔贝和赛琪,2002,Appl.Microbiol.Biotechnol.(应用微生物学与生物技术)59:618-628;美国专利申请号20020164730)。在蒸汽预处理过程中,半纤维素乙酰基被裂解,并且得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。
经常在蒸汽预处理之前添加催化剂(例如H2SO4或SO2)(典型地是0.3%至3%w/w),该催化剂减少时间并降低温度、增加回收率、并改进酶水解(巴列斯特罗斯(Ballesteros)等人,2006,应用生物化学与生物技术129-132:496-508;瓦尔加(Varga)等人,2004,应用生物化学与生物技术113-116:509-523;塞斯尼尔(Sassner)等人,2006,酶与微生物技术(Enzyme Microb.Technol.)39:756-762)。
化学预处理:术语“化学处理”是指促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。适合的化学预处理方法的实例包括(例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(AFEX)、氨渗滤(APR)、以及有机溶剂预处理。
在稀酸预处理中,纤维素材料与稀酸(典型地是H2SO4)和水混合,以形成浆液,由蒸汽加热至希望的温度,并且在停留时间后急骤蒸发至大气压。可以用多种反应器设计进行稀酸预处理,例如塞流反应器、逆流反应器、或连续逆流收缩床反应器(达夫(Duff)和默里(Murray),1996,见上文;谢尔(Schell)等人,2004,生物资源技术(BioresourceTechnol.)91:179-188;李(Lee)等人,1999,生物化学工程与生物技术进展(Adv.Biochem.Eng.Biotechnol.)65:93-115)。
还可以使用在碱性条件下的若干种预处理方法。这些碱性预处理包括但不限于:石灰预处理、湿氧化、氨渗滤(APR)、以及氨纤维/冷冻爆炸(AFEX)。
用碳酸钙、氢氧化钠、或氨,在85℃-150℃的低温下进行石灰预处理,并且停留时间为从1小时到几天(怀曼(Wyman)等人,2005,生物资源技术(Bioresource Technol.)96:1959-1966;莫热(Mosier)等人,2005,生物资源技术96:673-686)。WO 2006/110891、WO2006/110899、WO 2006/110900以及WO 2006/110901披露了使用氨的预处理方法。
湿氧化是典型地在加入如过氧化氢等氧化剂或过压的氧气、在180℃-200℃下进行5-15分钟的热预处理(施密特(Schmidt)和汤姆森(Thomsen),1998,生物资源技术(Bioresource Technol.)64:139-151;帕隆恩(Palonen)等人,2004,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)117:1-17;瓦尔加(Varga)等人,2004,生物技术与生物工程(Biotechnol.Bioeng.)88:567-574;马丁(Martin)等人,2006,化学技术与生物技术杂志(J.Chem.Technol.Biotechnol.)81:1669-1677)。预处理优选以1%至40%干物质,更优选2%至30%干物质,并且最优选5%至20%干物质进行,并且经常通过添加碱如碳酸钠来增加初始pH。
被称为湿爆炸(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30%的干物质。在湿爆炸中,在某一停留时间后,在预处理过程中引入氧化剂。然后通过急骤蒸发至大气压结束预处理(WO 2006/032282)。
氨纤维爆炸(AFEX)涉及用液态或气态氨在中等温度(例如90℃-100℃)和高压(例如17-20巴)下处理纤维素材料,持续5-10分钟,其中干物质含量可以高达60%(戈拉帕里(Gollapalli)等人,2002,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)98:23-35;丘恩达瓦特(Chundawat)等人,2007,生物技术与生物工程(Biotechnol.Bioeng.)96:219-231;阿里扎德(Alizadeh)等人,2005,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)121:1133-1141;泰莫里(Teymouri)等人,2005,生物资源技术(Bioresource Technol.)96:2014-2018)。AFEX预处理导致纤维素的解聚和半纤维素的部分水解。木质素-碳水化合物复合物被裂解。
有机溶剂预处理通过使用含水乙醇(40%-60%乙醇)在160℃-200℃下萃取30-60分钟而将纤维素材料脱木质素(潘(Pan)等人,2005,生物技术与生物工程(Biotechnol.Bioeng.)90:473-481;潘等人,2006,生物技术与生物工程94:851-861;库拉比(Kurabi)等人,2005,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)121:219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素被去除。
适合的预处理方法的其他实例由谢尔(Schell)等人,2003,应用生物化学与生物技术(Appl.Biochem.and Biotechnol.)105-108:69-85,和马塞尔(Mosier)等人,2005,生物资源技术(Bioresource Technology)96:673-686,以及美国公开申请号2002/0164730进行描述。
在一个方面中,化学预处理优选是以酸处理进行,并且更优选持续稀酸和/或弱酸处理。酸通常是硫酸,但也可以使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选在1-5,更优选1-4,并且最优选1-3的pH范围内进行。在一个方面中,该酸浓度在优选从0.01wt%至20wt%酸,更优选0.05wt%至10wt%酸,甚至更优选0.1wt%至5wt%酸,并且最优选0.2wt%至2.0wt%酸的范围中。使酸与纤维素材料相接触,并在优选160℃-220℃,并且更优选165℃-195℃范围内的温度下保持从几秒到几分钟,例如1秒至60分钟范围内的时间。
在另一个方面中,预处理是作为氨纤维爆炸步骤(AFEX预处理步骤)进行。
在另一个方面中,预处理在水性浆料中进行。在优选的方面,在预处理过程中纤维素材料以优选10wt%-80wt%之间,更优选20wt%-70wt%之间,并且最优选30wt%-60wt%之间,例如50wt%左右的量存在。可以使用本领域已知的任何方法不洗涤或洗涤预处理的纤维素材料,例如用水洗涤。
机械预处理:术语“机械预处理”是指各种类型的研磨或碾磨(例如,干磨、湿磨、或振动球磨)。
物理预处理:术语“物理预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何预处理。例如,物理预处理可包括辐射(例如微波辐射)、汽蒸/蒸汽爆炸、水热解及其组合。
物理预处理可以包括高压和/或高温(蒸汽爆炸)。在一个方面中,高压意指在优选约300至约600psi,更优选约350至约550psi,并且最优选约400至约500psi,例如450psi左右的范围中的压力。在另一个方面中,高温意指在约100℃至约300℃,优选约140℃至约235℃范围内的温度。在一个优选方面,在分批过程中,以蒸汽枪水解器系统(例如从顺智公司(Sunds Defibrator AB),瑞典(Sweden)可获得的Sunds水解器(Sunds Hydrolyzer))来进行机械预处理,该系统使用如上所定义的高压和高温。
组合的物理和化学预处理:纤维素材料可以物理地并且且化学地预处理。例如,该预处理步骤可包括稀酸或弱酸预处理以及高温和/或高压处理。这些物理预处理和化学预处理可以根据需要顺序地进行或同时进行。也可以包括机械预处理。
因此,在一个优选方面中,使纤维素材料经受机械、化学或物理预处理、或其任何组合,以促进纤维素、半纤维素、和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物(参见,例如,舒·T.-A.(Hsu,T.-A.),1996,生物质的预处理(Pretreatment ofbiomass),生物乙醇手册:生产和利用,怀曼·C.E.编辑,泰勒-弗朗西斯出版集团,华盛顿特区,179-212;高希(Ghosh)和辛格(Singh),1993,用于纤维素生物质的酶/微生物转化的物理化学与生物处理(Physicochemical and biological treatments for enzymatic/microbial conversion of cellulosic biomass),应用微生物学进展(Adv.Appl.Microbiol.)39:295-333;麦克米兰·J.D.(McMillan,J.D.),1994,预处理木质纤维素生物质:综述(Pretreating lignocellulosic biomass:a review),用于燃料生产的生物质的酶转化(Enzymatic Conversion of Biomass for Fuels Production),希默尔·M.E.、贝克·J.O.、以及奥弗伦·R.P.(Overend,R.P.)编辑,美国化学学会讨论会系列566(ACS Symposium Series 566),美国化学学会(American Chemical Society),华盛顿特区,第15章;贡·C.S.(Gong,C.S.)、卡奥·N.J.(Cao,N.J.)、杜·J.(Du,J.)、以及曹·G.T.(Tsao,G.T.),1999,由可再生资源生产乙醇(Ethanol production from renewableresources),生物化学工程/生物技术的进展,舍佩尔·T.编辑,施普林格出版社德国海德堡柏林(Berlin Heidelberg,Germany),65:207-241);奥尔森(Olsson)和哈恩-哈格达尔(Hahn-Hagerdal),1996,用于乙醇生产的木质纤维素水解物的发酵(Fermentation oflignocellulosic hydrolysates for ethanol production),酶与微生物技术(Enz.Microb.Tech.)18:312-331;以及瓦蓝德(Vallander)和埃里克松(Eriksson),1990,由木质纤维素材料生产乙醇:技术现状(Production of ethanol from lignocellulosicmaterials:State of the art),生物化学工程/生物技术的进展42:63-95)。
糖化。在水解步骤(还称为糖化)中,将(例如预处理的)纤维素材料水解,以将纤维素以及可替代地还有半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶性寡糖。水解由酶组合物在本发明的多肽的存在下酶促进行。该组合物可进一步包括一种或多种(若干种)半纤维素分解酶或木聚糖降解酶。还可顺序地添加这些组合物的酶。
酶水解优选在易于由本领域技术人员确定的条件下、在合适的含水环境中执行。在一个优选方面中,水解在适合于一种或多种酶的活性,即对于该一种或多种酶而言最佳的条件下进行。水解可以作为分批补料过程或连续过程进行,其中将预处理的纤维素材料(底物)逐渐补料至例如含酶的水解溶液中。
糖化通常在受控的pH、温度以及混合条件下在搅拌釜反应器或发酵罐中进行。适合的处理时间、温度以及pH条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是典型地进行优选约12至约96小时,更优选约16至约72小时,并且最优选约24至约48小时。温度优选约25℃至约70℃,更优选约30℃至约65℃,并且最优选约40℃至约60℃,特别是约50℃。pH在优选约3至约8,更优选约3.5至约7,并且最优选约4至约6、具体地约pH 5的范围中。干燥固体含量在优选约5wt%至约50wt%,更优选约10wt%至约40wt%,并且最优选约20wt%至约30wt%的范围中。
该酶组合物优选地包括多种具有纤维素分解活性和/或木聚糖降解活性的酶。在一个方面中,该酶组合物包括一种或多种(若干种)纤维素分解酶。在另一个方面中,该酶组合物包括一种或多种(若干种)木聚糖降解酶。在另一个方面中,该酶组合物包括一种或多种(若干种)纤维素分解酶和一种或多种(若干种)木聚糖降解酶。
该一种或多种(若干种)纤维素分解酶优选是选自下组,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。该一种或多种(若干种)木聚糖降解酶优选是选自下组,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
在另一个方面中,该酶组合物进一步或甚至进一步包括具有纤维素分解增强活性的多肽(参见,例如WO 2005/074647、WO 2005/074656、以及WO 2007/089290)。在另一个方面中,该酶组合物可以进一步或甚至进一步包括一种或多种(若干种)另外的酶活性以改进含纤维素材料的降解。优选的另外的酶是半纤维素酶(例如α-D-葡糖醛酸糖苷酶、α-L-阿拉伯呋喃糖苷酶、内切-甘露聚糖酶、β-甘露糖苷酶、α-半乳糖苷酶、内切-α-L-阿拉伯聚糖酶、β-半乳糖苷酶)、碳水化合物-酯酶(例如乙酰基-木聚糖酯酶、乙酰基-甘露聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、葡萄糖醛酸酯酶)、果胶酶、蛋白酶、木质素分解酶(例如漆酶、锰过氧化物酶、木质素过氧化物酶、H2O2生产酶、氧化还原酶)、扩张蛋白、膨胀素、或其混合物。在本发明的方法中,可以在发酵之前或过程中,例如在糖化过程中,或在发酵微生物的繁殖过程中或之后添加这一种或多种另外的酶。
该酶组合物的一种或多种(若干种)组分可以是野生型蛋白、重组蛋白、或野生型蛋白与重组蛋白的组合。例如,一种或多种(若干种)组分可以是用作宿主细胞以重组表达该酶组合物的一种或多种(若干种)其他组分的细胞的原生蛋白质。该酶组合物的一种或多种(若干种)组分可以作为单组分产生,然后将这些单组分组合以形成该酶组合物。酶组合物可以是多组分和单组分蛋白制剂的组合。
用于本发明的方法中的酶可以处于适合用于此处所述的过程中的任何形式,例如像去除或未去除细胞的粗发酵液、具有或不具有细胞碎片的细胞裂解液、半纯化的或纯化的酶制剂、或作为酶来源的宿主细胞。酶组合物可以是干粉或颗粒、非尘颗粒、液体、稳定化的液体、或稳定化的受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶制剂进行稳定化。
在下面各段中对本发明进行了进一步的概述:
1.一种具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,该多肽选自下组,该组由以下各项组成:
(a)与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽;
(b)由多核苷酸编码的多肽,该多核苷酸在中严格条件下与(i)SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQID NO:39中任一项的成熟多肽编码序列,(ii)(i)的全长补体杂交;
(c)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的变体,该变体在一个或多个位置包括取代、缺失、和/或插入;和
(e)(a)、(b)、(c)、或(d)的多肽的片段,该片段具有内切葡聚糖酶活性并且对用黄原胶裂解酶预处理的黄原胶具有活性。
2.如段落1所述的多肽,与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ IDNO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
3.如段落1或2中任一项所述的多肽,该多肽由多核苷酸编码,该多核苷酸在中-高严格条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列,或(ii)(i)的全长补体杂交;
4.如段落1-3中任一项所述的多肽,该多肽由多核苷酸编码,该多核苷酸与SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ IDNO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ IDNO:37、和SEQ ID NO:39中任一项的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
5.如段落1-4中任一项所述的多肽,由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项或SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽组成。
6.如段落1-4中任一项所述的多肽,包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项或SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽。
7.如段落1-4中任一项所述的多肽,该多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ IDNO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的一种变体,该变体在一个或多个位置,例如高达10个,例如,1、2、3、4、5、6、7、8、9、或10个位置包括取代、缺失、和/或插入。
8.如段落1至7所述的多肽,该多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的片段,其中该片段具有内切葡聚糖酶活性并且对用黄原胶裂解酶预处理的黄原胶具有活性。
9.如段落1至8中任一项所述的多肽,其中该成熟多肽是SEQ ID NO:2中位置1至813中所示的多肽,SEQ ID NO:4中位置1至836中所示的多肽,SEQ ID NO:6中位置1至949中所示的多肽,SEQ ID NO:8中位置1至830中所示的多肽,SEQ ID NO:10中位置1至866中所示的多肽,SEQ ID NO:12中位置1至827中所示的多肽,SEQ ID NO:14中位置1至903中所示的多肽,SEQ ID NO:16中位置1至932中所示的多肽,SEQ ID NO:18中位置1至920中所示的多肽,SEQ ID NO:20中位置1至844中所示的多肽,SEQ ID NO:22中位置1至849中所示的多肽,SEQ ID NO:24中位置1至903中所示的多肽,SEQ ID NO:26中位置1至894中所示的多肽,SEQID NO:28中位置1至894中所示的多肽,SEQ ID NO:30中位置1至955中所示的多肽,SEQ IDNO:32中位置1至894中所示的多肽,SEQ ID NO:34中位置1至893中所示的多肽,SEQ ID NO:36中位置1至894中所示的多肽,SEQ ID NO:38中位置1至894中所示的多肽,和SEQ ID NO:40中位置1至867中所示的多肽中的任一项。
10.一种编码如段落1-9中任一项所述的多肽的多核苷酸。
11.一种核酸构建体或表达载体,该核酸构建体或表达载体包括如段落10所述的多核苷酸,该多核苷酸可操作地连接至指导多肽在表达宿主内产生的一个或多个控制序列。
12.一种重组宿主细胞,该重组宿主细胞包括如段落10所述的多核苷酸,该多核苷酸可操作地连接至指导多肽的产生的一个或多个控制序列。
13.一种产生如段落1-9中任一项所述的多肽的方法,该方法包括:在有益于产生该多肽的条件下培养细胞,该细胞以其野生型形式产生该多肽。
14.如段落13所述的方法,该方法进一步包括回收该多肽。
15.一种产生具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽的方法,该方法包括在有益于产生该多肽的条件下培养如段落12所述的宿主细胞。
16.一种用编码如段落1-9中任一项所述的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。
17.一种产生对用黄原胶裂解酶预处理的黄原胶具有内切葡聚糖酶活性和/或具有活性的多肽的方法,该方法包括在有益于产生该多肽的条件下培养如段落16所述的转基因植物或植物细胞。
18.如段落17所述的方法,该方法进一步包括回收该多肽。
19.一种包括如段落1-9中任一项所述的多肽的全培养液配制品或细胞培养组合物。
20.一种包括如段落1-9中任一项所述的多肽的组合物。
21.如段落20所述的组合物,该组合物进一步包括具有黄原胶裂解酶活性的多肽。
22.如段落20或21中任一项所述的组合物,该组合物是洗涤剂组合物,该洗涤剂组合物包括一种或多种洗涤剂组分。
23.如段落20-22中任一项所述的组合物,其中这些洗涤剂组分选自下组,该组包括表面活性剂、助洗剂、助水溶剂、漂白系统、聚合物、织物调色剂、辅料、分散剂、染料转移抑制剂、荧光增白剂以及污垢释放聚合物,或其任何混合物。
24.如段落20-23中任一项所述的组合物,其中该洗涤剂组合物处于以下形式:棒,均匀的片剂,具有两个或更多个层的片剂,具有一个或多个室的袋,规则的或压缩的粉末,颗粒,膏,凝胶,或规则的、压缩的或浓缩的液体。
25.如段落20-23中任一项所述的组合物用于降解黄原胶的用途。
26.如段落25所述的用途,用于控制钻井液的粘度。
27.如段落24所述的用途,用于洗涤或清洁纺织品和/或硬表面,例如餐具洗涤。
28.如段落24所述的用途,其中该洗涤剂组合物具有酶洗涤益处。
29.一种用于降解黄原胶的方法,该方法包括向黄原胶施用根据段落20-24中任一项所述的组合物。
30.如段落29所述的方法,其中该黄原胶在纺织品的表面上或硬表面上,例如餐具洗涤。
31.如段落29所述的方法,其中该黄原胶在由钻井孔穿透的地下地层的压裂中使用。
32.如段落29所述的方法,其中该黄原胶是钻孔滤饼中的组分。
33.一种用于降解或转化纤维素材料的方法,该方法包括:用根据段落20-24中任一项所述的酶组合物或在如段落1-9中任一项所述的多肽的存在下处理纤维素材料。
34.如段落33所述的方法,其中该纤维素材料是经预处理的。
35.如段落32或33所述的方法,其中该酶组合物包括选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、蛋白酶、漆酶、或过氧化物酶。
36.如段落35所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。
37.如段落35所述的方法,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
38.如段落33-37中任一项所述的方法,其进一步包括回收降解的纤维素材料。
39.如段落38所述的方法,其中该降解的纤维素材料是糖,该糖优选地选自下组,该组由以下各项组成:葡萄糖、木糖、甘露糖、半乳糖\以及阿拉伯糖。
40.一种用于产生发酵产物的方法,包括:
(a)在如段落1-9中任一项所述的多肽的存在下,用酶组合物对纤维素材料进行糖化;
(b)用一种或多种发酵微生物对该糖化的纤维素材料进行发酵,以产生该发酵产物;和
(c)从该发酵中回收该发酵产物。
通过以下实例进一步描述本发明,这些实例不应当解释为限制本发明的范围。
实例
实例1:搜索和鉴定假定的内切葡聚糖酶基因
基于专利申请号EP14170186.2的SEQ ID NO 2中披露的内切葡聚糖酶和UniProtrelease2013_04(贝罗奇(Bairoch)等人,2005)以及内部数据库中最接近的同系物,通过提取每种纤维素酶的C末端部分,使用MAFFT(加藤(Katoh),2002)创建多重比对,并使用HMMER3的hmmbuild(埃迪(Eddy),2011)构建HMM,来产生隐马尔科夫模型(HMM)。保守结构域的HMMER3的hmmsearch(埃迪,2011)发现了从DOE联合基因组研究所(DOE Joint GenomeInstitute),NCBI(国家生物技术信息中心(National Center for BiotechnologyInformation),核酸研究(Nucleic Acids Res.)2009年1月)和欧洲核苷酸档案(莱诺宁(Leinonen),核酸研究,2011年1月)可获得的公众可获得的基因组的和宏基因组的组装中的334个同系物。使用以下参数对blast命中(Blast hit)进行分类:覆盖>50%,二进制值>50和E值<1e-05。
实例2:内切葡聚糖酶编码基因的生物信息学分析
通过针对Pfam数据库(M.蓬塔(Punta),P.C.可希尔(Coggill),R.Y.埃伯哈特(Eberhardt),J.米斯特里(Mistry),J.塔特(Tate),C.博斯耐尔(Boursnell),N.庞(Pang),K.福斯卢德(Forslund),G.赛利克(Ceric),J.克莱门茨(Clements),A.赫格尔(Heger),L.霍尔姆(Holm),E.L.L.梭哈摩尔(Sonnhammer),S.R.埃迪,A.贝特曼(Bateman),R.D.费恩(Finn).Pfam:蛋白质家族数据库(the protein families database),核酸研究(NucleicAcids Research)(2014)数据库问题(Database Issue)42:D222-D230)的氨基酸序列(SEQID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40)的blast搜索和通过与专利申请号EP14170186.2的SEQ ID NO 2中披露的内切葡聚糖酶的氨基酸序列比对,来进一步将通过实例1中描述的程序选择的二十个分子分类。在一些情况下,针对Pfam数据库的blast搜索鉴定了相关性非常远的Pfam PF00150结构域,该结构域具有刚好高于由Pfam定义的噪声截止值的%序列一致性和HMM得分(%序列截止值为20.7%,并且HMM得分截止值为20.7)。在大多数情况下,%序列一致性低于噪声截止值。此外,相关性远的PF00150结构域仅是部分的,跨越在定义为在监管下的模型长度和在Pfam主页(pfam.sanger.ac.uk)可获得的模型区段的281个残基中的大约150个残基。此外,在SEQ IDNO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40中鉴定了PF02018结构域或长度与PF02018结构域相等的非注释区域(non-annotated region)。Pf00150的假定的催化结构域由靠近β-链的羧基末端的两个谷氨酸四和七组成,其中一个充当质子供体,并且另一个作为亲核体(詹金斯(Jenkins)J,罗莱焦(Lo Leggio)L,哈里斯(Harris)G,和皮克斯吉尔(Pickersgill)R.,β-葡糖苷酶,β-半乳糖苷酶,家族A纤维素酶,家族F木聚糖酶和两种大麦葡聚糖酶形成具有8倍β/a结构并且具有靠近β-链的羧基末端的两个保守谷氨酸四和七的酶的超家族(Beta-glucosidase,beta-galactosidase,family A cellulases,family F xylanases and two barley glycanases form a superfamily of enzymeswith 8-fold beta/alpha architecture and with two conserved glutamates nearthe carboxy-terminal ends of beta-strands four and seven.)欧洲生化学会联合会快报(FEBS Lett.)1995年4月10;362(3):281-5)。基于氨基酸序列比对,不管相关性远的PF00150结构域的存在,在所有分子(SEQ ID NO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40)中鉴定了假定的谷氨酸质子供体和假定的谷氨酸亲核体(图1)。在高度保守区域中催化残基的存在强烈地表明分子之间的密切关系。假定的谷氨酸质子供体位于部分PF00150结构域中,并且假定的亲核体(E566)位于PF02018结构域之后(或在一些情况下,非注释区域长度等于PF02018结构域)。这表示PF02018结构域已经被引入谷氨酸催化残基之间,生成新颖的结构域结构。
实例3:内切葡聚糖酶的克隆和表达
获得内切葡聚糖酶基因的成熟肽编码部分(SEQ ID NO:1中位置67至2508,SEQ IDNO:3中位置76至2583,SEQ ID NO:5中位置67至2913,和SEQ ID NO:7中位置73至2562),作为合成基因。鉴定内切葡聚糖酶基因的成熟肽编码部分并将其插入大肠杆菌中。从大肠杆菌转化体纯化包含插入片段的表达质粒,并将其转化到枯草芽孢杆菌宿主细胞中。转化的宿主细胞在液体培养基中生长。通过SDS-PAGE和活性测试验证内切葡聚糖酶的表达。
实例4:内切葡聚糖酶的表征
将培养液在台式离心机中以20,000g离心20分钟,并将上清液直接用于内切葡聚糖酶的表征。AZCL-HE-纤维素(交联和染色纤维素)测定用于检测内切葡聚糖酶活性。通过温和搅拌,将1%AZCL-HE-纤维素(来自麦格酶公司(Megazyme))悬浮于0.01%Triton X-100中。将200微升的这种悬浮液和200微升测定缓冲液在艾本德管中混合并且置于冰上。添加20微升内切葡聚糖酶样品。通过将艾本德管转移至设定为测定温度的艾本德恒温混匀仪来启动测定。将管在艾本德恒温混匀仪上在其最高振摇速率(1400rpm)下孵育高达60min。通过转移该管返回至冰浴停止孵育。然后将管在冰冷离心机中离心2min,将200微升上清液转移至微量滴定板,并且读取OD590。枯草芽孢杆菌宿主菌株包括在该测定中。将ΔOD590=OD590(酶)–OD590(枯草芽孢杆菌宿主菌株)用于内切葡聚糖酶活性的测量。
可变测定条件
温度:30℃-80℃
底物:AZCL-HE-纤维素,AZCL-支链淀粉,AZCL-木葡聚糖和AZCL-凝胶多糖。
测定缓冲液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,调节至pH 3-11。
将上述内切葡聚糖酶测定用于获得pH活性曲线,温度-活性曲线连同底物特异性曲线。
实例5:黄原胶降解活性粘度测定
本发明的多肽的黄原胶降解活性可以当与内切葡聚糖酶一起孵育时,通过测量黄原胶溶液或改性黄原胶溶液的粘度的降低来测定。使用描述于WO 2011/107472中的粘度压力测定法进行粘度测量。
底物改性黄原胶(mXG)是用去除末端丙酮酸甘露糖的黄原胶裂解酶处理的黄原胶(XG),并且使用在南海(Nankai),桥本(Hashimoto)等人,1999,应用与环境微生物学(Appl.Environ.Microbiol)65(6):2520-2526中描述的方法的改编版来制备:在2L烧杯中将2.5g黄原胶(斯比凯可(CP Kelco))用5mL的96%乙醇润湿。添加500mL的100mM ACES缓冲液pH 7.00,并且将溶液在环境温度下搅拌2h。添加250μL黄原胶裂解酶(麦格酶公司产品E-XANLB,芽胞杆菌属物种),并且将溶液在50℃下孵育20h。在水解后,在搅拌下,将1400mL的96%乙醇添加到500mL样品中。发生沉淀,并且在大约5min后,倾析出乙醇,由此去除丙酮酸甘露糖残余物。将500mL的96%乙醇再次添加到剩余的溶液中,并在任何沉淀后倾析。将样品在华特门(Whatman)过滤器GF/C上在蒸发漏斗上干燥。将过滤器在50℃下干燥20h。收集样品,研磨并通过300μM筛过筛。
水解条件如下:50℃,0.6%黄原胶(XG)或0.3%改性黄原胶(mXG),在50mM HEPES缓冲液+0.01%triton X-100(pH 7.0)中。在热平衡时添加酶。在热平衡后并且在酶添加之前测量初始粘度。对照与代替酶的添加的缓冲液相同。
粘度的降低是酶活性的量度。当内切葡聚糖酶和黄原胶裂解酶与黄原胶一起孵育时,或当内切葡聚糖酶与改性黄原胶单独孵育时,观察到粘度的显著下降。这表明一旦去除丙酮酸甘露糖,底物现在是空间可用的并且被内切葡聚糖酶降解。
改性黄原胶:底物改性黄原胶(mXG)是用去除末端丙酮酸甘露糖的黄原胶裂解酶处理的黄原胶(XG),并且使用在南海(Nankai),桥本(Hashimoto)等人,1999,应用与环境微生物学(Appl.Environ.Microbiol)65(6):2520-2526中描述的方法的改编版来制备:在2L烧杯中将2.5g黄原胶(斯比凯可(CP Kelco))用5mL的96%乙醇润湿。添加500mL的100mMACES缓冲液pH 7.00,并且将溶液在环境温度下搅拌2h。添加250μL黄原胶裂解酶(麦格酶公司产品E-XANLB,芽胞杆菌属物种),并且将溶液在50℃下孵育20h。在水解后,在搅拌下,将1400mL的96%乙醇添加到500mL样品中。发生沉淀,并且在大约5min后,倾析出乙醇,由此去除丙酮酸甘露糖残余物。将500mL的96%乙醇再次添加到剩余的溶液中,并在任何沉淀后倾析。将样品在华特门(Whatman)过滤器GF/C上在蒸发漏斗上干燥。将过滤器在50℃下干燥20h。收集样品,研磨并通过300μM筛过筛。
实例6:还原末端测定
使用由莱韦尔(Lever)(1972),分析化学(Anal.Biochem.)47:273-279,1972研发的比色测定,通过用黄原胶裂解酶预处理的黄原胶(mXG,如实例5中制备)上的还原末端,确定内切葡聚糖酶活性。产生的任何还原末端都将与PAHBAH反应,从而产生颜色的变化,该颜色变化在用于该测定的条件下与酶活性成比例。
如以上描述的通过还原末端确定黄原胶裂解酶活性,除了将0.1%黄原胶用作底物以外。
材料和化学品:0.1%底物:24ml Milli-Q水中的用黄原胶裂解酶预处理的6ml(5mg/ml)黄原胶。
活性缓冲液:100mM乙酸钠,100mM MES,1mM CaCl2,在0.01%曲通X100中,pH 7。
Ka-Na-酒石酸盐/NaOH缓冲液:将Ka-Na-酒石酸盐(50g)和NaOH(20g)溶解于水中,至总体积为1升。储存在4℃下。
终止溶液:将PAHBAH(西格玛H-9882)溶解于Ka-Na-酒石酸盐/NaOH溶液中,至浓度为15mg/ml(例如,将500mg PAHBAH溶解于33ml Ka-Na-酒石酸盐/NaOH溶液中)
样品制备:使用BioMek液体处理机器人,将酶样品在柯仕达条(costarstrip)中的活性缓冲液中稀释至0.1mg/ml。将50μl的底物和50μl的每种稀释的样品转移至96孔PCR-MTP板,向每个样品中添加50μl活性缓冲液并将溶液混合。将密封的PCR-板在37℃下、在PCR机中孵育15min,然后立即冷却至10℃。向每个样品中添加75μl的终止溶液,将混合物振荡,并且将75μl的每个样品丢弃。将这些样品在95℃下孵育10min,然后在10℃下孵育1min。将150μl的每种样品转移至新的96孔PCR-MTP并且测量405nm处的吸光度。
比色反应与产生的还原末端的量成比例,并且因此与存在的内切葡聚糖酶的量成比例。
序列表
<110> 诺维信公司
<120> 具有内切葡聚糖酶活性的多肽
<130> 12789-WO-PCT
<160> 42
<170> PatentIn版本3.5
<210> 1
<211> 2511
<212> DNA
<213> 土壤宏基因组
<220>
<221> 信号肽
<222> (1)..(66)
<220>
<221> CDS
<222> (1)..(2508)
<220>
<221> 成熟肽
<222> (67)..(2508)
<400> 1
atg ctt cgc gcg gct ttg gcg gca atg gtt atg gcg ggc gct ctg acg 48
Met Leu Arg Ala Ala Leu Ala Ala Met Val Met Ala Gly Ala Leu Thr
-20 -15 -10
gcg ggt tcg gcc gcg ggc gag atg ttc ccc ttc acc atg cca tgg aac 96
Ala Gly Ser Ala Ala Gly Glu Met Phe Pro Phe Thr Met Pro Trp Asn
-5 -1 1 5 10
gac gcc ggc acc ggc aat atc acc gac ctg tcg gcg tgg aac gat aag 144
Asp Ala Gly Thr Gly Asn Ile Thr Asp Leu Ser Ala Trp Asn Asp Lys
15 20 25
ccg gcg ggg gcg agc ggc ttc gtc acc gtc gcg ggc ggc cat ctg gtg 192
Pro Ala Gly Ala Ser Gly Phe Val Thr Val Ala Gly Gly His Leu Val
30 35 40
gcg ggc ggc aaa cgg ctg caa ctc ctc ggc gtc aac gtg acc ttc ggc 240
Ala Gly Gly Lys Arg Leu Gln Leu Leu Gly Val Asn Val Thr Phe Gly
45 50 55
tcc aac gcg cct gag cat gcc gat gcc gat atc gtg gcg cgc cgg atg 288
Ser Asn Ala Pro Glu His Ala Asp Ala Asp Ile Val Ala Arg Arg Met
60 65 70
gcc cgc ttc ggc atc aat atc gtg cgg ctg cac cat atg gac acc tat 336
Ala Arg Phe Gly Ile Asn Ile Val Arg Leu His His Met Asp Thr Tyr
75 80 85 90
gag gcg ccg ttc ggg att ctg gaa aag gat cgc gtc acc ctc aac ccc 384
Glu Ala Pro Phe Gly Ile Leu Glu Lys Asp Arg Val Thr Leu Asn Pro
95 100 105
gac tat ctc gac aag ctg gac tat ttc gtc gcc gcg ctg aag cgg cag 432
Asp Tyr Leu Asp Lys Leu Asp Tyr Phe Val Ala Ala Leu Lys Arg Gln
110 115 120
ggc att tat gtc gac atc aac ctg cat gtc ggc cgc gcc tat ccg ggc 480
Gly Ile Tyr Val Asp Ile Asn Leu His Val Gly Arg Ala Tyr Pro Gly
125 130 135
ttt gcg agt tgg ccg ggc ggc gac agc tat ttc aag ggc gtc gat cac 528
Phe Ala Ser Trp Pro Gly Gly Asp Ser Tyr Phe Lys Gly Val Asp His
140 145 150
ttc gag ccg cag atg atc cgc ttg cag aag gat ttc gcc cgc gac ctg 576
Phe Glu Pro Gln Met Ile Arg Leu Gln Lys Asp Phe Ala Arg Asp Leu
155 160 165 170
ctc cac cat cgc aat ccc tat acc ggc acc cgt tat gcc gac gaa ccg 624
Leu His His Arg Asn Pro Tyr Thr Gly Thr Arg Tyr Ala Asp Glu Pro
175 180 185
gcg gtc gcc atc gtc gag atc aac aac gag aac ggc ctg atc cgc gaa 672
Ala Val Ala Ile Val Glu Ile Asn Asn Glu Asn Gly Leu Ile Arg Glu
190 195 200
tgg ggc gcc ggg gcg ctc gac gcc atg acc gag ccg ctg cgc ggt gag 720
Trp Gly Ala Gly Ala Leu Asp Ala Met Thr Glu Pro Leu Arg Gly Glu
205 210 215
atg acc cgg caa tgg aat gtc tgg ctg aag cag cgc tat ggc agc gat 768
Met Thr Arg Gln Trp Asn Val Trp Leu Lys Gln Arg Tyr Gly Ser Asp
220 225 230
gcg gca ctg cgc caa gcg tgg ggc gcg cgc agc gaa ccg ctc ggc aac 816
Ala Ala Leu Arg Gln Ala Trp Gly Ala Arg Ser Glu Pro Leu Gly Asn
235 240 245 250
gag atg ttc acc acc ggc tgg caa ttg cag acg ctt ggc ggt gcg cac 864
Glu Met Phe Thr Thr Gly Trp Gln Leu Gln Thr Leu Gly Gly Ala His
255 260 265
gca acg ctg acg ccg acc gcg gtc ggg ctc gcc ctg acc atg acc ggc 912
Ala Thr Leu Thr Pro Thr Ala Val Gly Leu Ala Leu Thr Met Thr Gly
270 275 280
aaa ggc caa gag agc tgg cac acg cag atg cac caa ggc ggg ctg aat 960
Lys Gly Gln Glu Ser Trp His Thr Gln Met His Gln Gly Gly Leu Asn
285 290 295
ttc acc gcc gaa cga ccc tac acc ctg acg ctg cgg ctt cgg gcc gat 1008
Phe Thr Ala Glu Arg Pro Tyr Thr Leu Thr Leu Arg Leu Arg Ala Asp
300 305 310
cac ccg atg aaa gtc gcg gtg cag gcg atg cag acc cac gaa ccg tgg 1056
His Pro Met Lys Val Ala Val Gln Ala Met Gln Thr His Glu Pro Trp
315 320 325 330
aaa tgg ttg ttg tcc gat acc att tcg gtc ggc acc gaa tgg aag acg 1104
Lys Trp Leu Leu Ser Asp Thr Ile Ser Val Gly Thr Glu Trp Lys Thr
335 340 345
gtg cat ttc acg ttt gtg ccc gcc ttc ggc gag acc ggc gcg cgg ctg 1152
Val His Phe Thr Phe Val Pro Ala Phe Gly Glu Thr Gly Ala Arg Leu
350 355 360
acg ctg ggc ggt ctc ggg ttt gag acc ggc aca ctg gag att gcc gaa 1200
Thr Leu Gly Gly Leu Gly Phe Glu Thr Gly Thr Leu Glu Ile Ala Glu
365 370 375
gcg agt ttg cgg ccc ggc ggc acg tcg ggg ctg aaa ccg ggc gaa aat 1248
Ala Ser Leu Arg Pro Gly Gly Thr Ser Gly Leu Lys Pro Gly Glu Asn
380 385 390
ctc gac cgc ggc agc gtc gcg atc agc gaa tat agt tcc cgc ttc agc 1296
Leu Asp Arg Gly Ser Val Ala Ile Ser Glu Tyr Ser Ser Arg Phe Ser
395 400 405 410
cgc acg ccg gcg gcg caa cgc gat tgg ctg aat ttc ctg tgg gat acc 1344
Arg Thr Pro Ala Ala Gln Arg Asp Trp Leu Asn Phe Leu Trp Asp Thr
415 420 425
gaa acc cac tat tgg gcc gag atg cag cgg ttc ctg aag gcc gat ctc 1392
Glu Thr His Tyr Trp Ala Glu Met Gln Arg Phe Leu Lys Ala Asp Leu
430 435 440
ggc gtc aaa tcg ctg ctc gtc ggg acg cag acg gtg tac agc ccg gcg 1440
Gly Val Lys Ser Leu Leu Val Gly Thr Gln Thr Val Tyr Ser Pro Ala
445 450 455
cca atc caa tcc ggc ctc gat gtc gtc gac gat cac gcc tat tgg cag 1488
Pro Ile Gln Ser Gly Leu Asp Val Val Asp Asp His Ala Tyr Trp Gln
460 465 470
cat ccg cat ttc ccc ggc cgc gcc tgg gat ccg ggc aac tgg cgg atc 1536
His Pro His Phe Pro Gly Arg Ala Trp Asp Pro Gly Asn Trp Arg Ile
475 480 485 490
aac aat ctg ccg atg gcg ggc ctc gaa ggc ggc ggc acg att gcc gat 1584
Asn Asn Leu Pro Met Ala Gly Leu Glu Gly Gly Gly Thr Ile Ala Asp
495 500 505
ctg gcg ctg cgc cgc gtg ccc ggc aag ccg ttc atc gtg acg gaa tac 1632
Leu Ala Leu Arg Arg Val Pro Gly Lys Pro Phe Ile Val Thr Glu Tyr
510 515 520
aac gcg cca gcg ccg aac gac tac caa ggc gag gcc atg ccg ctg gtt 1680
Asn Ala Pro Ala Pro Asn Asp Tyr Gln Gly Glu Ala Met Pro Leu Val
525 530 535
gcg gcg tat ggc gcg cta cag gat tgg gac ggc att ttc ctg ttc gac 1728
Ala Ala Tyr Gly Ala Leu Gln Asp Trp Asp Gly Ile Phe Leu Phe Asp
540 545 550
tac ggc ggc tgg gac aac aac tgg cac acc gat cat atc gac agc ttc 1776
Tyr Gly Gly Trp Asp Asn Asn Trp His Thr Asp His Ile Asp Ser Phe
555 560 565 570
ttc gac agc cgc tcc aat ccg gtg aaa ctg gcg agc ttg atc gcg acc 1824
Phe Asp Ser Arg Ser Asn Pro Val Lys Leu Ala Ser Leu Ile Ala Thr
575 580 585
gcc gcg atg ctg cgg cgg ggc gat gtc gcg gcg gcc gct ccg acg cgt 1872
Ala Ala Met Leu Arg Arg Gly Asp Val Ala Ala Ala Ala Pro Thr Arg
590 595 600
gca agc atg ccg gac cgc gcg gcg tgg atc gaa gcg ctg cgc caa tcg 1920
Ala Ser Met Pro Asp Arg Ala Ala Trp Ile Glu Ala Leu Arg Gln Ser
605 610 615
gcg tat ccg ccc agc gga gcc aat ttc ggc atg gcg aaa gac gcg gcc 1968
Ala Tyr Pro Pro Ser Gly Ala Asn Phe Gly Met Ala Lys Asp Ala Ala
620 625 630
ttg gcg cgc tcg gtc ggc gcg atc gcg ggc aac ggg gtg gcg ccg tca 2016
Leu Ala Arg Ser Val Gly Ala Ile Ala Gly Asn Gly Val Ala Pro Ser
635 640 645 650
tgg ccg gtc aag agc gag acg ggt gaa ctc act tgg ggt ctc ggc ggc 2064
Trp Pro Val Lys Ser Glu Thr Gly Glu Leu Thr Trp Gly Leu Gly Gly
655 660 665
aag acc gtg gtg atc gat gcg cct cgc agc aag ggt ctg atc ggc ccg 2112
Lys Thr Val Val Ile Asp Ala Pro Arg Ser Lys Gly Leu Ile Gly Pro
670 675 680
cgg ctc ggc cat gaa tat gac gcg cat ggc gtc ggg ctg gaa ctg acc 2160
Arg Leu Gly His Glu Tyr Asp Ala His Gly Val Gly Leu Glu Leu Thr
685 690 695
gaa gcg caa ggc gat tgg ggc gtg gtg acc gcg acc gtc gtt cag ggt 2208
Glu Ala Gln Gly Asp Trp Gly Val Val Thr Ala Thr Val Val Gln Gly
700 705 710
acg gat ttt tcg tcg ccg ggg cgc att ctg gtg acg acg ctc ggc cgc 2256
Thr Asp Phe Ser Ser Pro Gly Arg Ile Leu Val Thr Thr Leu Gly Arg
715 720 725 730
gaa gag aat acc gga cag caa tgg acc gac gcg acg cgg act tcg gtt 2304
Glu Glu Asn Thr Gly Gln Gln Trp Thr Asp Ala Thr Arg Thr Ser Val
735 740 745
ggc cgc aat tgg ggc gca gcg ccg gtg ctg gtc gag ggt ttg ggc gcg 2352
Gly Arg Asn Trp Gly Ala Ala Pro Val Leu Val Glu Gly Leu Gly Ala
750 755 760
cgc atc acc ctg ccc gtt ccg gca gcg cgg gtg tcg gcg ttt gcg ctc 2400
Arg Ile Thr Leu Pro Val Pro Ala Ala Arg Val Ser Ala Phe Ala Leu
765 770 775
gat gcg ctg ggc aat cgt acc acg gca ctg ccg gtg agc ggt tcg agt 2448
Asp Ala Leu Gly Asn Arg Thr Thr Ala Leu Pro Val Ser Gly Ser Ser
780 785 790
cgc gcc aca atc gaa ctc ggc gcg cgg tat cag acg ctg tgg tat gag 2496
Arg Ala Thr Ile Glu Leu Gly Ala Arg Tyr Gln Thr Leu Trp Tyr Glu
795 800 805 810
gtg gtg gtg aag tag 2511
Val Val Val Lys
<210> 2
<211> 836
<212> PRT
<213> 土壤宏基因组
<400> 2
Met Leu Arg Ala Ala Leu Ala Ala Met Val Met Ala Gly Ala Leu Thr
-20 -15 -10
Ala Gly Ser Ala Ala Gly Glu Met Phe Pro Phe Thr Met Pro Trp Asn
-5 -1 1 5 10
Asp Ala Gly Thr Gly Asn Ile Thr Asp Leu Ser Ala Trp Asn Asp Lys
15 20 25
Pro Ala Gly Ala Ser Gly Phe Val Thr Val Ala Gly Gly His Leu Val
30 35 40
Ala Gly Gly Lys Arg Leu Gln Leu Leu Gly Val Asn Val Thr Phe Gly
45 50 55
Ser Asn Ala Pro Glu His Ala Asp Ala Asp Ile Val Ala Arg Arg Met
60 65 70
Ala Arg Phe Gly Ile Asn Ile Val Arg Leu His His Met Asp Thr Tyr
75 80 85 90
Glu Ala Pro Phe Gly Ile Leu Glu Lys Asp Arg Val Thr Leu Asn Pro
95 100 105
Asp Tyr Leu Asp Lys Leu Asp Tyr Phe Val Ala Ala Leu Lys Arg Gln
110 115 120
Gly Ile Tyr Val Asp Ile Asn Leu His Val Gly Arg Ala Tyr Pro Gly
125 130 135
Phe Ala Ser Trp Pro Gly Gly Asp Ser Tyr Phe Lys Gly Val Asp His
140 145 150
Phe Glu Pro Gln Met Ile Arg Leu Gln Lys Asp Phe Ala Arg Asp Leu
155 160 165 170
Leu His His Arg Asn Pro Tyr Thr Gly Thr Arg Tyr Ala Asp Glu Pro
175 180 185
Ala Val Ala Ile Val Glu Ile Asn Asn Glu Asn Gly Leu Ile Arg Glu
190 195 200
Trp Gly Ala Gly Ala Leu Asp Ala Met Thr Glu Pro Leu Arg Gly Glu
205 210 215
Met Thr Arg Gln Trp Asn Val Trp Leu Lys Gln Arg Tyr Gly Ser Asp
220 225 230
Ala Ala Leu Arg Gln Ala Trp Gly Ala Arg Ser Glu Pro Leu Gly Asn
235 240 245 250
Glu Met Phe Thr Thr Gly Trp Gln Leu Gln Thr Leu Gly Gly Ala His
255 260 265
Ala Thr Leu Thr Pro Thr Ala Val Gly Leu Ala Leu Thr Met Thr Gly
270 275 280
Lys Gly Gln Glu Ser Trp His Thr Gln Met His Gln Gly Gly Leu Asn
285 290 295
Phe Thr Ala Glu Arg Pro Tyr Thr Leu Thr Leu Arg Leu Arg Ala Asp
300 305 310
His Pro Met Lys Val Ala Val Gln Ala Met Gln Thr His Glu Pro Trp
315 320 325 330
Lys Trp Leu Leu Ser Asp Thr Ile Ser Val Gly Thr Glu Trp Lys Thr
335 340 345
Val His Phe Thr Phe Val Pro Ala Phe Gly Glu Thr Gly Ala Arg Leu
350 355 360
Thr Leu Gly Gly Leu Gly Phe Glu Thr Gly Thr Leu Glu Ile Ala Glu
365 370 375
Ala Ser Leu Arg Pro Gly Gly Thr Ser Gly Leu Lys Pro Gly Glu Asn
380 385 390
Leu Asp Arg Gly Ser Val Ala Ile Ser Glu Tyr Ser Ser Arg Phe Ser
395 400 405 410
Arg Thr Pro Ala Ala Gln Arg Asp Trp Leu Asn Phe Leu Trp Asp Thr
415 420 425
Glu Thr His Tyr Trp Ala Glu Met Gln Arg Phe Leu Lys Ala Asp Leu
430 435 440
Gly Val Lys Ser Leu Leu Val Gly Thr Gln Thr Val Tyr Ser Pro Ala
445 450 455
Pro Ile Gln Ser Gly Leu Asp Val Val Asp Asp His Ala Tyr Trp Gln
460 465 470
His Pro His Phe Pro Gly Arg Ala Trp Asp Pro Gly Asn Trp Arg Ile
475 480 485 490
Asn Asn Leu Pro Met Ala Gly Leu Glu Gly Gly Gly Thr Ile Ala Asp
495 500 505
Leu Ala Leu Arg Arg Val Pro Gly Lys Pro Phe Ile Val Thr Glu Tyr
510 515 520
Asn Ala Pro Ala Pro Asn Asp Tyr Gln Gly Glu Ala Met Pro Leu Val
525 530 535
Ala Ala Tyr Gly Ala Leu Gln Asp Trp Asp Gly Ile Phe Leu Phe Asp
540 545 550
Tyr Gly Gly Trp Asp Asn Asn Trp His Thr Asp His Ile Asp Ser Phe
555 560 565 570
Phe Asp Ser Arg Ser Asn Pro Val Lys Leu Ala Ser Leu Ile Ala Thr
575 580 585
Ala Ala Met Leu Arg Arg Gly Asp Val Ala Ala Ala Ala Pro Thr Arg
590 595 600
Ala Ser Met Pro Asp Arg Ala Ala Trp Ile Glu Ala Leu Arg Gln Ser
605 610 615
Ala Tyr Pro Pro Ser Gly Ala Asn Phe Gly Met Ala Lys Asp Ala Ala
620 625 630
Leu Ala Arg Ser Val Gly Ala Ile Ala Gly Asn Gly Val Ala Pro Ser
635 640 645 650
Trp Pro Val Lys Ser Glu Thr Gly Glu Leu Thr Trp Gly Leu Gly Gly
655 660 665
Lys Thr Val Val Ile Asp Ala Pro Arg Ser Lys Gly Leu Ile Gly Pro
670 675 680
Arg Leu Gly His Glu Tyr Asp Ala His Gly Val Gly Leu Glu Leu Thr
685 690 695
Glu Ala Gln Gly Asp Trp Gly Val Val Thr Ala Thr Val Val Gln Gly
700 705 710
Thr Asp Phe Ser Ser Pro Gly Arg Ile Leu Val Thr Thr Leu Gly Arg
715 720 725 730
Glu Glu Asn Thr Gly Gln Gln Trp Thr Asp Ala Thr Arg Thr Ser Val
735 740 745
Gly Arg Asn Trp Gly Ala Ala Pro Val Leu Val Glu Gly Leu Gly Ala
750 755 760
Arg Ile Thr Leu Pro Val Pro Ala Ala Arg Val Ser Ala Phe Ala Leu
765 770 775
Asp Ala Leu Gly Asn Arg Thr Thr Ala Leu Pro Val Ser Gly Ser Ser
780 785 790
Arg Ala Thr Ile Glu Leu Gly Ala Arg Tyr Gln Thr Leu Trp Tyr Glu
795 800 805 810
Val Val Val Lys
<210> 3
<211> 2586
<212> DNA
<213> 废水宏基因组
<220>
<221> CDS
<222> (1)..(2583)
<220>
<221> 信号肽
<222> (1)..(75)
<220>
<221> 成熟肽
<222> (76)..(2583)
<400> 3
ttg cgt tta aat ttc gcc tcc ttt cag ttg tta gct tgg tta atg ttt 48
Leu Arg Leu Asn Phe Ala Ser Phe Gln Leu Leu Ala Trp Leu Met Phe
-25 -20 -15 -10
tcc gtc tca gtg gat gca ttg tcc gct gac agt gat ttt ttt cct tac 96
Ser Val Ser Val Asp Ala Leu Ser Ala Asp Ser Asp Phe Phe Pro Tyr
-5 -1 1 5
aaa gtc cga tgg gac gaa gct tct gtt agt gca gtt aat ctg cgc gac 144
Lys Val Arg Trp Asp Glu Ala Ser Val Ser Ala Val Asn Leu Arg Asp
10 15 20
tgg aat cat aga ccc gct ggt agg ctc ggt tgg gtt acg gct cgt gat 192
Trp Asn His Arg Pro Ala Gly Arg Leu Gly Trp Val Thr Ala Arg Asp
25 30 35
ggg cat ctt tat gtt gga aag tct agg cta cgt ttc ttt ggc gtt aat 240
Gly His Leu Tyr Val Gly Lys Ser Arg Leu Arg Phe Phe Gly Val Asn
40 45 50 55
gtt gtc ttt cgg gga gca atg cct gag cgt gat gag gcg gag aaa att 288
Val Val Phe Arg Gly Ala Met Pro Glu Arg Asp Glu Ala Glu Lys Ile
60 65 70
gca gca cgt ttg gct aag tta ggc ttc aat gtg gtc cga ttt cat cat 336
Ala Ala Arg Leu Ala Lys Leu Gly Phe Asn Val Val Arg Phe His His
75 80 85
atg gat acg ctt gtt agt ccc aat ggt ctg ctc aag gat gat ctg cgt 384
Met Asp Thr Leu Val Ser Pro Asn Gly Leu Leu Lys Asp Asp Leu Arg
90 95 100
act ttt gat cca gct cag cta gat aaa ctg gat tac ttt att gca gct 432
Thr Phe Asp Pro Ala Gln Leu Asp Lys Leu Asp Tyr Phe Ile Ala Ala
105 110 115
ttg aag cga gaa ggt atc tac agc gat ctt aat ctt cat gta ggg cgt 480
Leu Lys Arg Glu Gly Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg
120 125 130 135
ctt tat cct ggt ttt gat cgt tgg cgt gat gcc gct gga aat cag cag 528
Leu Tyr Pro Gly Phe Asp Arg Trp Arg Asp Ala Ala Gly Asn Gln Gln
140 145 150
cct gag gct tgg aaa ggg gtt gat gtt ttc tat cct cct atg gtc gat 576
Pro Glu Ala Trp Lys Gly Val Asp Val Phe Tyr Pro Pro Met Val Asp
155 160 165
cag cag aaa gag tac gca aaa gag ttg ctg act cat gta aat cct tat 624
Gln Gln Lys Glu Tyr Ala Lys Glu Leu Leu Thr His Val Asn Pro Tyr
170 175 180
tta ggt aag cga tat tta gat gag cct gct gtc gcc att gtc gag ctc 672
Leu Gly Lys Arg Tyr Leu Asp Glu Pro Ala Val Ala Ile Val Glu Leu
185 190 195
aat aat gag aat ggg ctg atc tat agt tgg agg cgc ggc gat ctt gac 720
Asn Asn Glu Asn Gly Leu Ile Tyr Ser Trp Arg Arg Gly Asp Leu Asp
200 205 210 215
ctg atg agt gag ccg tat cgt gga gag ttg caa cgt cta tgg aac tct 768
Leu Met Ser Glu Pro Tyr Arg Gly Glu Leu Gln Arg Leu Trp Asn Ser
220 225 230
tgg ctt gtt acc cac tat aag agt gac gct ggc ttg cgt ttg gcg tgg 816
Trp Leu Val Thr His Tyr Lys Ser Asp Ala Gly Leu Arg Leu Ala Trp
235 240 245
gag aca aaa gaa gta cct atg ggt atg gag atg ctg gtc agt ccc gga 864
Glu Thr Lys Glu Val Pro Met Gly Met Glu Met Leu Val Ser Pro Gly
250 255 260
gca cct acc ggg ctt gtt cgt gag tgg acg ctg cag tct gtg ggg cag 912
Ala Pro Thr Gly Leu Val Arg Glu Trp Thr Leu Gln Ser Val Gly Gln
265 270 275
gcg aga gcg ata ctt gat ggg tat gag gat ggg atc cag cat ctt aac 960
Ala Arg Ala Ile Leu Asp Gly Tyr Glu Asp Gly Ile Gln His Leu Asn
280 285 290 295
gtt ctt cag cca ggt act gag cgt tgg cac gtt cag gtt cat caa aaa 1008
Val Leu Gln Pro Gly Thr Glu Arg Trp His Val Gln Val His Gln Lys
300 305 310
tct ttg tcg ttt aag gct ggc gaa ctc tac acc cta cat ttg cga ttg 1056
Ser Leu Ser Phe Lys Ala Gly Glu Leu Tyr Thr Leu His Leu Arg Leu
315 320 325
cgc gct aat aag cct cgg tct gta cgt ctc atg gct gtg caa aac cat 1104
Arg Ala Asn Lys Pro Arg Ser Val Arg Leu Met Ala Val Gln Asn His
330 335 340
gct ccg ttt cgg tct ttg tgg gag cag agg ctc aag ctt gat tct gag 1152
Ala Pro Phe Arg Ser Leu Trp Glu Gln Arg Leu Lys Leu Asp Ser Glu
345 350 355
tgg cag gag ttc gta ttt gtt ttt agt tcc cct atc gat gaa gcg ctt 1200
Trp Gln Glu Phe Val Phe Val Phe Ser Ser Pro Ile Asp Glu Ala Leu
360 365 370 375
gca cgg cta act ttg ggt gat ctg gga gct gac tca gga gag att tgg 1248
Ala Arg Leu Thr Leu Gly Asp Leu Gly Ala Asp Ser Gly Glu Ile Trp
380 385 390
att gca ggc agt agt tta aga gcg ggc ggt gat ttt aag ttt ggc gaa 1296
Ile Ala Gly Ser Ser Leu Arg Ala Gly Gly Asp Phe Lys Phe Gly Glu
395 400 405
agc gac tcg tta gtg aag cgc aat gtt ccg att ttt act agc agt gac 1344
Ser Asp Ser Leu Val Lys Arg Asn Val Pro Ile Phe Thr Ser Ser Asp
410 415 420
ttt gga agt cgt tcg ttg cgc gct cag aga gac tgg ctg aac ttt ctg 1392
Phe Gly Ser Arg Ser Leu Arg Ala Gln Arg Asp Trp Leu Asn Phe Leu
425 430 435
tgg gac gtt gag gcg caa tat tgg tcg gaa atg cag ggt tat tta aaa 1440
Trp Asp Val Glu Ala Gln Tyr Trp Ser Glu Met Gln Gly Tyr Leu Lys
440 445 450 455
aat aag ctg ggt gta aag tct ttg gtc att ggg acg caa cta aat cat 1488
Asn Lys Leu Gly Val Lys Ser Leu Val Ile Gly Thr Gln Leu Asn His
460 465 470
agt ccc tcg ctg att cag aga aat atg gat gtg ctg gat gcc cat gct 1536
Ser Pro Ser Leu Ile Gln Arg Asn Met Asp Val Leu Asp Ala His Ala
475 480 485
tat tgg gat cat ccg cgt ttt ccg gat ggt tta tgg agc cct atc aat 1584
Tyr Trp Asp His Pro Arg Phe Pro Asp Gly Leu Trp Ser Pro Ile Asn
490 495 500
tgg ctc att gat aat aag gct atg gcc ggt gtt gat ggg gga ggg gct 1632
Trp Leu Ile Asp Asn Lys Ala Met Ala Gly Val Asp Gly Gly Gly Ala
505 510 515
att tcc cgc ctc gca ttg atg cgg ctg ccg gga aag cca ttt gtt gtt 1680
Ile Ser Arg Leu Ala Leu Met Arg Leu Pro Gly Lys Pro Phe Val Val
520 525 530 535
acg gaa tat aat cat cct gca cct aat gag ttt gca gct gag act ttt 1728
Thr Glu Tyr Asn His Pro Ala Pro Asn Glu Phe Ala Ala Glu Thr Phe
540 545 550
ccg ctt gtt gct gca tac gcg gcg atg caa gac tgg gat ggt gtt ttt 1776
Pro Leu Val Ala Ala Tyr Ala Ala Met Gln Asp Trp Asp Gly Val Phe
555 560 565
cta ttc agc tat ggg act cat agc aga agt tgg aaa agg gat tat gtt 1824
Leu Phe Ser Tyr Gly Thr His Ser Arg Ser Trp Lys Arg Asp Tyr Val
570 575 580
gat aat ttt ttc gac ata aat gct aat cca aat aaa ttt acg agt act 1872
Asp Asn Phe Phe Asp Ile Asn Ala Asn Pro Asn Lys Phe Thr Ser Thr
585 590 595
ttg gcg gcg gcg gcg ctt ttt cgc cgt ggt gac gtt tct tcc caa cga 1920
Leu Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ser Ser Gln Arg
600 605 610 615
ggt gct ttt tcc acc gtt cta cca agt cga tcc gca ttt ata gat gct 1968
Gly Ala Phe Ser Thr Val Leu Pro Ser Arg Ser Ala Phe Ile Asp Ala
620 625 630
ctg cgc cag ata aat aaa aac tat ctt ccg tct ggg ggg gat ttt ggc 2016
Leu Arg Gln Ile Asn Lys Asn Tyr Leu Pro Ser Gly Gly Asp Phe Gly
635 640 645
gtt agc agt aat tct gcg atg cgc gag cct gtt gct ttg act ggg cct 2064
Val Ser Ser Asn Ser Ala Met Arg Glu Pro Val Ala Leu Thr Gly Pro
650 655 660
gtt cgt gtt gat tct ctt ctg cca ata aag agc ctg aca ggg cag ctt 2112
Val Arg Val Asp Ser Leu Leu Pro Ile Lys Ser Leu Thr Gly Gln Leu
665 670 675
gtc tgg ggt gtt gat aaa agc cca aca gta agt ata aat acg cct ttg 2160
Val Trp Gly Val Asp Lys Ser Pro Thr Val Ser Ile Asn Thr Pro Leu
680 685 690 695
agt aaa ggc ttg att ggt gcc agt ctt gct gaa cca ttt gat gca tct 2208
Ser Lys Gly Leu Ile Gly Ala Ser Leu Ala Glu Pro Phe Asp Ala Ser
700 705 710
gga gta cat ttg caa ctg ttg ggt tca gat act ggg agt ggg gtt gtt 2256
Gly Val His Leu Gln Leu Leu Gly Ser Asp Thr Gly Ser Gly Val Val
715 720 725
ttt ctt acg ctt ata gat gga tca agt ttt tct ggc ccc gga aga tta 2304
Phe Leu Thr Leu Ile Asp Gly Ser Ser Phe Ser Gly Pro Gly Arg Leu
730 735 740
tta att act gcg ctt ggt aac agt aaa aat acc aat caa gtc tgg gtg 2352
Leu Ile Thr Ala Leu Gly Asn Ser Lys Asn Thr Asn Gln Val Trp Val
745 750 755
gat aag acg cgt gca agc ctt ggg ggg aag tgg ggg caa gcc cct gtt 2400
Asp Lys Thr Arg Ala Ser Leu Gly Gly Lys Trp Gly Gln Ala Pro Val
760 765 770 775
ctt gtc gaa ggt gtt cgt agt cgt att act ttg cct atc tca agc tct 2448
Leu Val Glu Gly Val Arg Ser Arg Ile Thr Leu Pro Ile Ser Ser Ser
780 785 790
caa gtt cgt gct tgg gct tta gat gag gag ggc cgc cgc aag gag att 2496
Gln Val Arg Ala Trp Ala Leu Asp Glu Glu Gly Arg Arg Lys Glu Ile
795 800 805
gtt gtg gtt cgc gga aat gaa aat gcg gta att gaa acg gga cct aaa 2544
Val Val Val Arg Gly Asn Glu Asn Ala Val Ile Glu Thr Gly Pro Lys
810 815 820
tat aag agt ttg tgg tac gag gtg gaa gtt ctt gca aat tga 2586
Tyr Lys Ser Leu Trp Tyr Glu Val Glu Val Leu Ala Asn
825 830 835
<210> 4
<211> 861
<212> PRT
<213> 废水宏基因组
<400> 4
Leu Arg Leu Asn Phe Ala Ser Phe Gln Leu Leu Ala Trp Leu Met Phe
-25 -20 -15 -10
Ser Val Ser Val Asp Ala Leu Ser Ala Asp Ser Asp Phe Phe Pro Tyr
-5 -1 1 5
Lys Val Arg Trp Asp Glu Ala Ser Val Ser Ala Val Asn Leu Arg Asp
10 15 20
Trp Asn His Arg Pro Ala Gly Arg Leu Gly Trp Val Thr Ala Arg Asp
25 30 35
Gly His Leu Tyr Val Gly Lys Ser Arg Leu Arg Phe Phe Gly Val Asn
40 45 50 55
Val Val Phe Arg Gly Ala Met Pro Glu Arg Asp Glu Ala Glu Lys Ile
60 65 70
Ala Ala Arg Leu Ala Lys Leu Gly Phe Asn Val Val Arg Phe His His
75 80 85
Met Asp Thr Leu Val Ser Pro Asn Gly Leu Leu Lys Asp Asp Leu Arg
90 95 100
Thr Phe Asp Pro Ala Gln Leu Asp Lys Leu Asp Tyr Phe Ile Ala Ala
105 110 115
Leu Lys Arg Glu Gly Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg
120 125 130 135
Leu Tyr Pro Gly Phe Asp Arg Trp Arg Asp Ala Ala Gly Asn Gln Gln
140 145 150
Pro Glu Ala Trp Lys Gly Val Asp Val Phe Tyr Pro Pro Met Val Asp
155 160 165
Gln Gln Lys Glu Tyr Ala Lys Glu Leu Leu Thr His Val Asn Pro Tyr
170 175 180
Leu Gly Lys Arg Tyr Leu Asp Glu Pro Ala Val Ala Ile Val Glu Leu
185 190 195
Asn Asn Glu Asn Gly Leu Ile Tyr Ser Trp Arg Arg Gly Asp Leu Asp
200 205 210 215
Leu Met Ser Glu Pro Tyr Arg Gly Glu Leu Gln Arg Leu Trp Asn Ser
220 225 230
Trp Leu Val Thr His Tyr Lys Ser Asp Ala Gly Leu Arg Leu Ala Trp
235 240 245
Glu Thr Lys Glu Val Pro Met Gly Met Glu Met Leu Val Ser Pro Gly
250 255 260
Ala Pro Thr Gly Leu Val Arg Glu Trp Thr Leu Gln Ser Val Gly Gln
265 270 275
Ala Arg Ala Ile Leu Asp Gly Tyr Glu Asp Gly Ile Gln His Leu Asn
280 285 290 295
Val Leu Gln Pro Gly Thr Glu Arg Trp His Val Gln Val His Gln Lys
300 305 310
Ser Leu Ser Phe Lys Ala Gly Glu Leu Tyr Thr Leu His Leu Arg Leu
315 320 325
Arg Ala Asn Lys Pro Arg Ser Val Arg Leu Met Ala Val Gln Asn His
330 335 340
Ala Pro Phe Arg Ser Leu Trp Glu Gln Arg Leu Lys Leu Asp Ser Glu
345 350 355
Trp Gln Glu Phe Val Phe Val Phe Ser Ser Pro Ile Asp Glu Ala Leu
360 365 370 375
Ala Arg Leu Thr Leu Gly Asp Leu Gly Ala Asp Ser Gly Glu Ile Trp
380 385 390
Ile Ala Gly Ser Ser Leu Arg Ala Gly Gly Asp Phe Lys Phe Gly Glu
395 400 405
Ser Asp Ser Leu Val Lys Arg Asn Val Pro Ile Phe Thr Ser Ser Asp
410 415 420
Phe Gly Ser Arg Ser Leu Arg Ala Gln Arg Asp Trp Leu Asn Phe Leu
425 430 435
Trp Asp Val Glu Ala Gln Tyr Trp Ser Glu Met Gln Gly Tyr Leu Lys
440 445 450 455
Asn Lys Leu Gly Val Lys Ser Leu Val Ile Gly Thr Gln Leu Asn His
460 465 470
Ser Pro Ser Leu Ile Gln Arg Asn Met Asp Val Leu Asp Ala His Ala
475 480 485
Tyr Trp Asp His Pro Arg Phe Pro Asp Gly Leu Trp Ser Pro Ile Asn
490 495 500
Trp Leu Ile Asp Asn Lys Ala Met Ala Gly Val Asp Gly Gly Gly Ala
505 510 515
Ile Ser Arg Leu Ala Leu Met Arg Leu Pro Gly Lys Pro Phe Val Val
520 525 530 535
Thr Glu Tyr Asn His Pro Ala Pro Asn Glu Phe Ala Ala Glu Thr Phe
540 545 550
Pro Leu Val Ala Ala Tyr Ala Ala Met Gln Asp Trp Asp Gly Val Phe
555 560 565
Leu Phe Ser Tyr Gly Thr His Ser Arg Ser Trp Lys Arg Asp Tyr Val
570 575 580
Asp Asn Phe Phe Asp Ile Asn Ala Asn Pro Asn Lys Phe Thr Ser Thr
585 590 595
Leu Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ser Ser Gln Arg
600 605 610 615
Gly Ala Phe Ser Thr Val Leu Pro Ser Arg Ser Ala Phe Ile Asp Ala
620 625 630
Leu Arg Gln Ile Asn Lys Asn Tyr Leu Pro Ser Gly Gly Asp Phe Gly
635 640 645
Val Ser Ser Asn Ser Ala Met Arg Glu Pro Val Ala Leu Thr Gly Pro
650 655 660
Val Arg Val Asp Ser Leu Leu Pro Ile Lys Ser Leu Thr Gly Gln Leu
665 670 675
Val Trp Gly Val Asp Lys Ser Pro Thr Val Ser Ile Asn Thr Pro Leu
680 685 690 695
Ser Lys Gly Leu Ile Gly Ala Ser Leu Ala Glu Pro Phe Asp Ala Ser
700 705 710
Gly Val His Leu Gln Leu Leu Gly Ser Asp Thr Gly Ser Gly Val Val
715 720 725
Phe Leu Thr Leu Ile Asp Gly Ser Ser Phe Ser Gly Pro Gly Arg Leu
730 735 740
Leu Ile Thr Ala Leu Gly Asn Ser Lys Asn Thr Asn Gln Val Trp Val
745 750 755
Asp Lys Thr Arg Ala Ser Leu Gly Gly Lys Trp Gly Gln Ala Pro Val
760 765 770 775
Leu Val Glu Gly Val Arg Ser Arg Ile Thr Leu Pro Ile Ser Ser Ser
780 785 790
Gln Val Arg Ala Trp Ala Leu Asp Glu Glu Gly Arg Arg Lys Glu Ile
795 800 805
Val Val Val Arg Gly Asn Glu Asn Ala Val Ile Glu Thr Gly Pro Lys
810 815 820
Tyr Lys Ser Leu Trp Tyr Glu Val Glu Val Leu Ala Asn
825 830 835
<210> 5
<211> 2916
<212> DNA
<213> Lewinella cohaerens
<220>
<221> CDS
<222> (1)..(2913)
<220>
<221> 信号肽
<222> (1)..(66)
<220>
<221> 成熟肽
<222> (67)..(2913)
<400> 5
atg acc att cat ttc cgc ata cag cta tcc cta ttt gcc ctt gta ttt 48
Met Thr Ile His Phe Arg Ile Gln Leu Ser Leu Phe Ala Leu Val Phe
-20 -15 -10
agc tcg ctc ctc ttt ggt caa aac ttc tcg aat ggc ttt cct ttt gca 96
Ser Ser Leu Leu Phe Gly Gln Asn Phe Ser Asn Gly Phe Pro Phe Ala
-5 -1 1 5 10
ttg cct gtc gat gac aat acc tct tct gta ttt cta ccg gca ttc cct 144
Leu Pro Val Asp Asp Asn Thr Ser Ser Val Phe Leu Pro Ala Phe Pro
15 20 25
gcc agc cct ata aca gaa gcg aaa aga gta gta cct gag ggt agg caa 192
Ala Ser Pro Ile Thr Glu Ala Lys Arg Val Val Pro Glu Gly Arg Gln
30 35 40
ttc gtg cgc caa ggt gaa gcc atc cgt ttt tgg ggt gtc aat atc acg 240
Phe Val Arg Gln Gly Glu Ala Ile Arg Phe Trp Gly Val Asn Ile Thr
45 50 55
tct tca gct tgt ttc cct acc cat acc gag gca gaa acc atc gct cga 288
Ser Ser Ala Cys Phe Pro Thr His Thr Glu Ala Glu Thr Ile Ala Arg
60 65 70
cgc ctt aga aag atg ggg atc aac ctt gtc cgt ttt cat cac ctt gac 336
Arg Leu Arg Lys Met Gly Ile Asn Leu Val Arg Phe His His Leu Asp
75 80 85 90
aac ccc gca tgg gca ggt aat gag ggt aca atc ttc ctc aat agc caa 384
Asn Pro Ala Trp Ala Gly Asn Glu Gly Thr Ile Phe Leu Asn Ser Gln
95 100 105
gac aat acc ctc caa att gac cct gta agc atg gat cgc ctc aac tat 432
Asp Asn Thr Leu Gln Ile Asp Pro Val Ser Met Asp Arg Leu Asn Tyr
110 115 120
ttc att tct cgc ctc aaa caa gaa ggc gtc tat gtc aat tta aac ctc 480
Phe Ile Ser Arg Leu Lys Gln Glu Gly Val Tyr Val Asn Leu Asn Leu
125 130 135
cat gtt acg cgt act ttt cgg tta aac gac ggt gtc ccc ctc gct gat 528
His Val Thr Arg Thr Phe Arg Leu Asn Asp Gly Val Pro Leu Ala Asp
140 145 150
tca atc gct gac ttt ggt aaa gta gtc acg cta tac gac cct cag cta 576
Ser Ile Ala Asp Phe Gly Lys Val Val Thr Leu Tyr Asp Pro Gln Leu
155 160 165 170
caa gct cta caa aaa gaa tat gct aat gaa tta ctg gcc caa gtc aac 624
Gln Ala Leu Gln Lys Glu Tyr Ala Asn Glu Leu Leu Ala Gln Val Asn
175 180 185
ccc tac act gga ata aca ctt gca cta gat cct gtc gta gta atg gta 672
Pro Tyr Thr Gly Ile Thr Leu Ala Leu Asp Pro Val Val Val Met Val
190 195 200
gag atg aac aac gaa aat agc atc tac ggc tgg tgg aaa agc aac gcc 720
Glu Met Asn Asn Glu Asn Ser Ile Tyr Gly Trp Trp Lys Ser Asn Ala
205 210 215
ttg cgc cct ttt aac caa gga ggc cga ctg acg gtc tat cat cat gaa 768
Leu Arg Pro Phe Asn Gln Gly Gly Arg Leu Thr Val Tyr His His Glu
220 225 230
atg ctc aat gac cgt tgg cat acc ttc tta gga caa gaa tat gcc gat 816
Met Leu Asn Asp Arg Trp His Thr Phe Leu Gly Gln Glu Tyr Ala Asp
235 240 245 250
gat gaa agc cta gca gcc agt tgg aac aac gga acc atc ccc gct ggc 864
Asp Glu Ser Leu Ala Ala Ser Trp Asn Asn Gly Thr Ile Pro Ala Gly
255 260 265
acc gag gaa aac ctc acc aac ccc gac ctc gaa gag gga cta tta caa 912
Thr Glu Glu Asn Leu Thr Asn Pro Asp Leu Glu Glu Gly Leu Leu Gln
270 275 280
gcc cct tgg tta ttg gaa acc cat gac att gca caa gct aat att act 960
Ala Pro Trp Leu Leu Glu Thr His Asp Ile Ala Gln Ala Asn Ile Thr
285 290 295
ctc gac aat acc aat cct caa tca ggt aat caa tgt gtt gct tta cag 1008
Leu Asp Asn Thr Asn Pro Gln Ser Gly Asn Gln Cys Val Ala Leu Gln
300 305 310
gtt aca cag gcg acg gga aca gaa tgg cat ata cag ttc aag caa aac 1056
Val Thr Gln Ala Thr Gly Thr Glu Trp His Ile Gln Phe Lys Gln Asn
315 320 325 330
gac ctc aac ttc caa cgc gac tct acc tat gaa ttg cgg ttt tgg gca 1104
Asp Leu Asn Phe Gln Arg Asp Ser Thr Tyr Glu Leu Arg Phe Trp Ala
335 340 345
cgg act gac acc gaa cgg gat ttt tcc att tcc ttc ctt cgt gat gat 1152
Arg Thr Asp Thr Glu Arg Asp Phe Ser Ile Ser Phe Leu Arg Asp Asp
350 355 360
gcc ccc tat acc tgg tac agt ggt cga aca ttt acg gcc aac act cag 1200
Ala Pro Tyr Thr Trp Tyr Ser Gly Arg Thr Phe Thr Ala Asn Thr Gln
365 370 375
tgg cag gaa ttc cgc tta ctg ttt aca gct tct gaa agt act acc gct 1248
Trp Gln Glu Phe Arg Leu Leu Phe Thr Ala Ser Glu Ser Thr Thr Ala
380 385 390
ggc cga ctc agt atc agc cca ctt ggt ggc aat ggc acc tat tgg ttt 1296
Gly Arg Leu Ser Ile Ser Pro Leu Gly Gly Asn Gly Thr Tyr Trp Phe
395 400 405 410
gat aac ttc tca tta tct aat cca gcg gtg gat ggc ctg cta cca ggc 1344
Asp Asn Phe Ser Leu Ser Asn Pro Ala Val Asp Gly Leu Leu Pro Gly
415 420 425
gaa agc ctc aat acc gcc agc atc aaa cgt atc cct tgg agc caa cgc 1392
Glu Ser Leu Asn Thr Ala Ser Ile Lys Arg Ile Pro Trp Ser Gln Arg
430 435 440
cta agt tac acc cct gcc agg gta gct gac cta agc cgc ttt tac gta 1440
Leu Ser Tyr Thr Pro Ala Arg Val Ala Asp Leu Ser Arg Phe Tyr Val
445 450 455
gct ctt caa gcg gag cac ttc cgt gaa atg aaa gaa tac ctc acg gat 1488
Ala Leu Gln Ala Glu His Phe Arg Glu Met Lys Glu Tyr Leu Thr Asp
460 465 470
cag ttg ctt gtg agt gct gct att acc ggc acc aat gcg cta gtt ggt 1536
Gln Leu Leu Val Ser Ala Ala Ile Thr Gly Thr Asn Ala Leu Val Gly
475 480 485 490
cct gcc gat gtg gta cat caa ttg gat ctc gac tat ttg gat gat cat 1584
Pro Ala Asp Val Val His Gln Leu Asp Leu Asp Tyr Leu Asp Asp His
495 500 505
agc tac tgg gat cat cct cac ttt cct aat act gcc tgg gat agc tac 1632
Ser Tyr Trp Asp His Pro His Phe Pro Asn Thr Ala Trp Asp Ser Tyr
510 515 520
gac tgg ctc att aac aac caa ccg cag gtg cta gac cct aac ttt gaa 1680
Asp Trp Leu Ile Asn Asn Gln Pro Gln Val Leu Asp Pro Asn Phe Glu
525 530 535
gcc atc acc cat gct ttt tct gga ctg gca cgc acc gat caa cct ttc 1728
Ala Ile Thr His Ala Phe Ser Gly Leu Ala Arg Thr Asp Gln Pro Phe
540 545 550
aca ctt tcc gaa tac aac cac ggt gct cct aat cgc tac cgc gtt gag 1776
Thr Leu Ser Glu Tyr Asn His Gly Ala Pro Asn Arg Tyr Arg Val Glu
555 560 565 570
atg ccc cat agc ata ttg gcc tat gct gcc ttt cag ggg gca gat ggc 1824
Met Pro His Ser Ile Leu Ala Tyr Ala Ala Phe Gln Gly Ala Asp Gly
575 580 585
atc atg ttt tat act tac gcc gga gag cgc aat caa gac aac gat ctt 1872
Ile Met Phe Tyr Thr Tyr Ala Gly Glu Arg Asn Gln Asp Asn Asp Leu
590 595 600
gtt aat aat ttc ttt gac ttg cac cgt gac cat tcc ata atg gcc caa 1920
Val Asn Asn Phe Phe Asp Leu His Arg Asp His Ser Ile Met Ala Gln
605 610 615
ttt cca ggg gtc gcg atg gct tac cga cga ggg tac ctt cag gaa gca 1968
Phe Pro Gly Val Ala Met Ala Tyr Arg Arg Gly Tyr Leu Gln Glu Ala
620 625 630
caa caa ccc tta atg gcc aat tac aaa gaa gaa gat atc cat agg ttt 2016
Gln Gln Pro Leu Met Ala Asn Tyr Lys Glu Glu Asp Ile His Arg Phe
635 640 645 650
cct atc gta gac aat caa ggc cgc tgg ggg cgt tat aca cct tat gac 2064
Pro Ile Val Asp Asn Gln Gly Arg Trp Gly Arg Tyr Thr Pro Tyr Asp
655 660 665
aaa agg tta att ttg aca aca ggc gta cag acg ggt agt tac gac gct 2112
Lys Arg Leu Ile Leu Thr Thr Gly Val Gln Thr Gly Ser Tyr Asp Ala
670 675 680
cca caa acc agt aat ttt acg gag tgg cct tct cct cca gaa gag gta 2160
Pro Gln Thr Ser Asn Phe Thr Glu Trp Pro Ser Pro Pro Glu Glu Val
685 690 695
ttt aca aca ttc aat gga gaa aca acg ctg aac act act gaa ggg cta 2208
Phe Thr Thr Phe Asn Gly Glu Thr Thr Leu Asn Thr Thr Glu Gly Leu
700 705 710
tta acc acc aat acc gat aaa ttt tgt agt gtt aca ggt ttc ttt tct 2256
Leu Thr Thr Asn Thr Asp Lys Phe Cys Ser Val Thr Gly Phe Phe Ser
715 720 725 730
acc gcc aca gat atg aca ttg gat gcc ttg acc ata aat tct ggc aat 2304
Thr Ala Thr Asp Met Thr Leu Asp Ala Leu Thr Ile Asn Ser Gly Asn
735 740 745
gac ttt ggg act ttg caa tgg atc agt ctt gat gat caa cca cta cct 2352
Asp Phe Gly Thr Leu Gln Trp Ile Ser Leu Asp Asp Gln Pro Leu Pro
750 755 760
gaa gct aaa aaa tct tta atc acc tta act gct gcc cag caa aac aca 2400
Glu Ala Lys Lys Ser Leu Ile Thr Leu Thr Ala Ala Gln Gln Asn Thr
765 770 775
aac atg act tgg aat ggc acc aat acc att cac aac aat tgg ggt aac 2448
Asn Met Thr Trp Asn Gly Thr Asn Thr Ile His Asn Asn Trp Gly Asn
780 785 790
gca ccg acg gaa caa aaa cca cta cag gtg gca ata gag atg gca tta 2496
Ala Pro Thr Glu Gln Lys Pro Leu Gln Val Ala Ile Glu Met Ala Leu
795 800 805 810
aat gcc gat tat ata aaa ctt tac cct tta gat gtt tat gcc aca cct 2544
Asn Ala Asp Tyr Ile Lys Leu Tyr Pro Leu Asp Val Tyr Ala Thr Pro
815 820 825
acg gac tct atc cta gta tta cca aat agt caa ggc cat ttt cct att 2592
Thr Asp Ser Ile Leu Val Leu Pro Asn Ser Gln Gly His Phe Pro Ile
830 835 840
ctc tta gat caa tac caa tac gaa acc cta tgg ttt ggc att aat act 2640
Leu Leu Asp Gln Tyr Gln Tyr Glu Thr Leu Trp Phe Gly Ile Asn Thr
845 850 855
ttt att ggc cca gtc agc act ctt gaa agc gac cag cca act cca ttt 2688
Phe Ile Gly Pro Val Ser Thr Leu Glu Ser Asp Gln Pro Thr Pro Phe
860 865 870
cac ttc tac cct aat ccg gta tta agt gga caa cct gtg caa att aca 2736
His Phe Tyr Pro Asn Pro Val Leu Ser Gly Gln Pro Val Gln Ile Thr
875 880 885 890
gga cca gaa aaa agc act ata ctg ctt ttc aac atc tta ggg cag ttg 2784
Gly Pro Glu Lys Ser Thr Ile Leu Leu Phe Asn Ile Leu Gly Gln Leu
895 900 905
gtt aat caa caa gaa atc aat acc cct ttt tat cgc tta gat acc act 2832
Val Asn Gln Gln Glu Ile Asn Thr Pro Phe Tyr Arg Leu Asp Thr Thr
910 915 920
ggc tta aca gct ggc act tac caa tta gtg ttc cta aac gaa aat agg 2880
Gly Leu Thr Ala Gly Thr Tyr Gln Leu Val Phe Leu Asn Glu Asn Arg
925 930 935
caa cga cta aat aat acc cta ttg atc atc aaa taa 2916
Gln Arg Leu Asn Asn Thr Leu Leu Ile Ile Lys
940 945
<210> 6
<211> 971
<212> PRT
<213> Lewinella cohaerens
<400> 6
Met Thr Ile His Phe Arg Ile Gln Leu Ser Leu Phe Ala Leu Val Phe
-20 -15 -10
Ser Ser Leu Leu Phe Gly Gln Asn Phe Ser Asn Gly Phe Pro Phe Ala
-5 -1 1 5 10
Leu Pro Val Asp Asp Asn Thr Ser Ser Val Phe Leu Pro Ala Phe Pro
15 20 25
Ala Ser Pro Ile Thr Glu Ala Lys Arg Val Val Pro Glu Gly Arg Gln
30 35 40
Phe Val Arg Gln Gly Glu Ala Ile Arg Phe Trp Gly Val Asn Ile Thr
45 50 55
Ser Ser Ala Cys Phe Pro Thr His Thr Glu Ala Glu Thr Ile Ala Arg
60 65 70
Arg Leu Arg Lys Met Gly Ile Asn Leu Val Arg Phe His His Leu Asp
75 80 85 90
Asn Pro Ala Trp Ala Gly Asn Glu Gly Thr Ile Phe Leu Asn Ser Gln
95 100 105
Asp Asn Thr Leu Gln Ile Asp Pro Val Ser Met Asp Arg Leu Asn Tyr
110 115 120
Phe Ile Ser Arg Leu Lys Gln Glu Gly Val Tyr Val Asn Leu Asn Leu
125 130 135
His Val Thr Arg Thr Phe Arg Leu Asn Asp Gly Val Pro Leu Ala Asp
140 145 150
Ser Ile Ala Asp Phe Gly Lys Val Val Thr Leu Tyr Asp Pro Gln Leu
155 160 165 170
Gln Ala Leu Gln Lys Glu Tyr Ala Asn Glu Leu Leu Ala Gln Val Asn
175 180 185
Pro Tyr Thr Gly Ile Thr Leu Ala Leu Asp Pro Val Val Val Met Val
190 195 200
Glu Met Asn Asn Glu Asn Ser Ile Tyr Gly Trp Trp Lys Ser Asn Ala
205 210 215
Leu Arg Pro Phe Asn Gln Gly Gly Arg Leu Thr Val Tyr His His Glu
220 225 230
Met Leu Asn Asp Arg Trp His Thr Phe Leu Gly Gln Glu Tyr Ala Asp
235 240 245 250
Asp Glu Ser Leu Ala Ala Ser Trp Asn Asn Gly Thr Ile Pro Ala Gly
255 260 265
Thr Glu Glu Asn Leu Thr Asn Pro Asp Leu Glu Glu Gly Leu Leu Gln
270 275 280
Ala Pro Trp Leu Leu Glu Thr His Asp Ile Ala Gln Ala Asn Ile Thr
285 290 295
Leu Asp Asn Thr Asn Pro Gln Ser Gly Asn Gln Cys Val Ala Leu Gln
300 305 310
Val Thr Gln Ala Thr Gly Thr Glu Trp His Ile Gln Phe Lys Gln Asn
315 320 325 330
Asp Leu Asn Phe Gln Arg Asp Ser Thr Tyr Glu Leu Arg Phe Trp Ala
335 340 345
Arg Thr Asp Thr Glu Arg Asp Phe Ser Ile Ser Phe Leu Arg Asp Asp
350 355 360
Ala Pro Tyr Thr Trp Tyr Ser Gly Arg Thr Phe Thr Ala Asn Thr Gln
365 370 375
Trp Gln Glu Phe Arg Leu Leu Phe Thr Ala Ser Glu Ser Thr Thr Ala
380 385 390
Gly Arg Leu Ser Ile Ser Pro Leu Gly Gly Asn Gly Thr Tyr Trp Phe
395 400 405 410
Asp Asn Phe Ser Leu Ser Asn Pro Ala Val Asp Gly Leu Leu Pro Gly
415 420 425
Glu Ser Leu Asn Thr Ala Ser Ile Lys Arg Ile Pro Trp Ser Gln Arg
430 435 440
Leu Ser Tyr Thr Pro Ala Arg Val Ala Asp Leu Ser Arg Phe Tyr Val
445 450 455
Ala Leu Gln Ala Glu His Phe Arg Glu Met Lys Glu Tyr Leu Thr Asp
460 465 470
Gln Leu Leu Val Ser Ala Ala Ile Thr Gly Thr Asn Ala Leu Val Gly
475 480 485 490
Pro Ala Asp Val Val His Gln Leu Asp Leu Asp Tyr Leu Asp Asp His
495 500 505
Ser Tyr Trp Asp His Pro His Phe Pro Asn Thr Ala Trp Asp Ser Tyr
510 515 520
Asp Trp Leu Ile Asn Asn Gln Pro Gln Val Leu Asp Pro Asn Phe Glu
525 530 535
Ala Ile Thr His Ala Phe Ser Gly Leu Ala Arg Thr Asp Gln Pro Phe
540 545 550
Thr Leu Ser Glu Tyr Asn His Gly Ala Pro Asn Arg Tyr Arg Val Glu
555 560 565 570
Met Pro His Ser Ile Leu Ala Tyr Ala Ala Phe Gln Gly Ala Asp Gly
575 580 585
Ile Met Phe Tyr Thr Tyr Ala Gly Glu Arg Asn Gln Asp Asn Asp Leu
590 595 600
Val Asn Asn Phe Phe Asp Leu His Arg Asp His Ser Ile Met Ala Gln
605 610 615
Phe Pro Gly Val Ala Met Ala Tyr Arg Arg Gly Tyr Leu Gln Glu Ala
620 625 630
Gln Gln Pro Leu Met Ala Asn Tyr Lys Glu Glu Asp Ile His Arg Phe
635 640 645 650
Pro Ile Val Asp Asn Gln Gly Arg Trp Gly Arg Tyr Thr Pro Tyr Asp
655 660 665
Lys Arg Leu Ile Leu Thr Thr Gly Val Gln Thr Gly Ser Tyr Asp Ala
670 675 680
Pro Gln Thr Ser Asn Phe Thr Glu Trp Pro Ser Pro Pro Glu Glu Val
685 690 695
Phe Thr Thr Phe Asn Gly Glu Thr Thr Leu Asn Thr Thr Glu Gly Leu
700 705 710
Leu Thr Thr Asn Thr Asp Lys Phe Cys Ser Val Thr Gly Phe Phe Ser
715 720 725 730
Thr Ala Thr Asp Met Thr Leu Asp Ala Leu Thr Ile Asn Ser Gly Asn
735 740 745
Asp Phe Gly Thr Leu Gln Trp Ile Ser Leu Asp Asp Gln Pro Leu Pro
750 755 760
Glu Ala Lys Lys Ser Leu Ile Thr Leu Thr Ala Ala Gln Gln Asn Thr
765 770 775
Asn Met Thr Trp Asn Gly Thr Asn Thr Ile His Asn Asn Trp Gly Asn
780 785 790
Ala Pro Thr Glu Gln Lys Pro Leu Gln Val Ala Ile Glu Met Ala Leu
795 800 805 810
Asn Ala Asp Tyr Ile Lys Leu Tyr Pro Leu Asp Val Tyr Ala Thr Pro
815 820 825
Thr Asp Ser Ile Leu Val Leu Pro Asn Ser Gln Gly His Phe Pro Ile
830 835 840
Leu Leu Asp Gln Tyr Gln Tyr Glu Thr Leu Trp Phe Gly Ile Asn Thr
845 850 855
Phe Ile Gly Pro Val Ser Thr Leu Glu Ser Asp Gln Pro Thr Pro Phe
860 865 870
His Phe Tyr Pro Asn Pro Val Leu Ser Gly Gln Pro Val Gln Ile Thr
875 880 885 890
Gly Pro Glu Lys Ser Thr Ile Leu Leu Phe Asn Ile Leu Gly Gln Leu
895 900 905
Val Asn Gln Gln Glu Ile Asn Thr Pro Phe Tyr Arg Leu Asp Thr Thr
910 915 920
Gly Leu Thr Ala Gly Thr Tyr Gln Leu Val Phe Leu Asn Glu Asn Arg
925 930 935
Gln Arg Leu Asn Asn Thr Leu Leu Ile Ile Lys
940 945
<210> 7
<211> 2565
<212> DNA
<213> Chthoniobacter flavus
<220>
<221> CDS
<222> (1)..(2562)
<220>
<221> 信号肽
<222> (1)..(72)
<220>
<221> 成熟肽
<222> (73)..(2562)
<400> 7
atg aat ctt cgc caa act ctc ccc gtc ctc tcc gtt gcg gcc gcc tta 48
Met Asn Leu Arg Gln Thr Leu Pro Val Leu Ser Val Ala Ala Ala Leu
-20 -15 -10
ctt acg gcg cca gtc gtt cgc gct gcc gat ttg ttc cct ttc gtc ctg 96
Leu Thr Ala Pro Val Val Arg Ala Ala Asp Leu Phe Pro Phe Val Leu
-5 -1 1 5
ccg tgg gac gat gcc agc cct tcc atc acc aac gtc agc tcc tgg ctg 144
Pro Trp Asp Asp Ala Ser Pro Ser Ile Thr Asn Val Ser Ser Trp Leu
10 15 20
gac aag ccg gcc ggg aaa gac ggc ttc gtc tac acg cac gat gga cat 192
Asp Lys Pro Ala Gly Lys Asp Gly Phe Val Tyr Thr His Asp Gly His
25 30 35 40
ctt ttc gcc ggc aag aag cgc atc cgt ttc ttt ggg gtc aac ctc gcc 240
Leu Phe Ala Gly Lys Lys Arg Ile Arg Phe Phe Gly Val Asn Leu Ala
45 50 55
ttc gcc gga aat ttc ccc aat cac aac gat gcc gac ccc gtg gcg gct 288
Phe Ala Gly Asn Phe Pro Asn His Asn Asp Ala Asp Pro Val Ala Ala
60 65 70
cgc atg gca aaa ttt ggc atc aac tgt gtc cgc ttt cac cac atg gat 336
Arg Met Ala Lys Phe Gly Ile Asn Cys Val Arg Phe His His Met Asp
75 80 85
acg ggc ttt gcg ccg gcc gga ttg ctg aag aag gac aag aag acc ttc 384
Thr Gly Phe Ala Pro Ala Gly Leu Leu Lys Lys Asp Lys Lys Thr Phe
90 95 100
gac gag gac tcg ctc gac cgg ctc gat tac ttc att gcc cag ctc aaa 432
Asp Glu Asp Ser Leu Asp Arg Leu Asp Tyr Phe Ile Ala Gln Leu Lys
105 110 115 120
aag aac ggg atc tat gcc gac ctg aat ctc cac gtc ggc ctc gaa tat 480
Lys Asn Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Leu Glu Tyr
125 130 135
ccc ggc ttc aag aaa tgg gaa ggc gct tcg aac ttc ttc aag ggc gtg 528
Pro Gly Phe Lys Lys Trp Glu Gly Ala Ser Asn Phe Phe Lys Gly Val
140 145 150
gac aat ttt ttt cca ccg ttc atc gag cag cag cgc gag tac gcg cgc 576
Asp Asn Phe Phe Pro Pro Phe Ile Glu Gln Gln Arg Glu Tyr Ala Arg
155 160 165
atg ctg ctc acg cac gtc aat gct tat acc cac aag cct tat acc gat 624
Met Leu Leu Thr His Val Asn Ala Tyr Thr His Lys Pro Tyr Thr Asp
170 175 180
gaa tcg gcc gtc gcc ttc atc gag atc aac aat gag aat ggg ctg atc 672
Glu Ser Ala Val Ala Phe Ile Glu Ile Asn Asn Glu Asn Gly Leu Ile
185 190 195 200
atg gaa tgg aac aac ggg acg ctc gat gcc atg ccc gat cct ttc gcc 720
Met Glu Trp Asn Asn Gly Thr Leu Asp Ala Met Pro Asp Pro Phe Ala
205 210 215
gcc gag ttg cga aag cag tgg aac gac tgg ttg aaa aag aaa tac gac 768
Ala Glu Leu Arg Lys Gln Trp Asn Asp Trp Leu Lys Lys Lys Tyr Asp
220 225 230
acc ccg gcc aag ctc gcc ggg gca tgg gga aaa ggc gcg gag ccg ctc 816
Thr Pro Ala Lys Leu Ala Gly Ala Trp Gly Lys Gly Ala Glu Pro Leu
235 240 245
ggt cag gag atg ctc aag ccc acg cat acc gcc tgg cat ctc gag caa 864
Gly Gln Glu Met Leu Lys Pro Thr His Thr Ala Trp His Leu Glu Gln
250 255 260
cac ggc gag gcc aag tcg gag ttg agt tcc gaa ccc ggc gaa ggg tcc 912
His Gly Glu Ala Lys Ser Glu Leu Ser Ser Glu Pro Gly Glu Gly Ser
265 270 275 280
gcg ggg gaa acc ctg cac gtc cac gta acc caa ccg ggc cag gaa agc 960
Ala Gly Glu Thr Leu His Val His Val Thr Gln Pro Gly Gln Glu Ser
285 290 295
tgg cat gtg cag ttg gga cag gcg ggg cta aag ctg gcc gcc ggc aag 1008
Trp His Val Gln Leu Gly Gln Ala Gly Leu Lys Leu Ala Ala Gly Lys
300 305 310
acc tac acg ctg cac ttg cgc gcc aag gcg gac gct ccc cgg cgg att 1056
Thr Tyr Thr Leu His Leu Arg Ala Lys Ala Asp Ala Pro Arg Arg Ile
315 320 325
agc atc ggg ctg agc cag gct cat gaa ccg tgg aag aca ctt ggc agc 1104
Ser Ile Gly Leu Ser Gln Ala His Glu Pro Trp Lys Thr Leu Gly Ser
330 335 340
cag agt gtc cgg ctc acc acg gag tgg cag gac gtc cat ttc tcc ata 1152
Gln Ser Val Arg Leu Thr Thr Glu Trp Gln Asp Val His Phe Ser Ile
345 350 355 360
ccg gtc gcg aat acc gag gaa aat gcc cgc ttc tcc ttc acc agt ctc 1200
Pro Val Ala Asn Thr Glu Glu Asn Ala Arg Phe Ser Phe Thr Ser Leu
365 370 375
ggc agc gcg gtc ggt gac tac tgg ttt tcc gac gcg tcg ctg cgt cct 1248
Gly Ser Ala Val Gly Asp Tyr Trp Phe Ser Asp Ala Ser Leu Arg Pro
380 385 390
ggc ggg gtc atc gcg ctg caa gcg ggt gaa tcg gtc ggg aac att cct 1296
Gly Gly Val Ile Ala Leu Gln Ala Gly Glu Ser Val Gly Asn Ile Pro
395 400 405
ttc ttc cgc aag aaa gaa atc ggc atg cgc acc ctc acc gca caa cgc 1344
Phe Phe Arg Lys Lys Glu Ile Gly Met Arg Thr Leu Thr Ala Gln Arg
410 415 420
gat tgg aac gct ttc ctc gtc gac acc gag gtg aac tat tgg acg ggc 1392
Asp Trp Asn Ala Phe Leu Val Asp Thr Glu Val Asn Tyr Trp Thr Gly
425 430 435 440
atg cgc cat ttc gtc cgc gaa gag ttg cat gcg cac agc cag gtc gtc 1440
Met Arg His Phe Val Arg Glu Glu Leu His Ala His Ser Gln Val Val
445 450 455
ggc tcg gcc acc ggc ttc agc cca tgg ctg gcg cag gcg aag ctc gat 1488
Gly Ser Ala Thr Gly Phe Ser Pro Trp Leu Ala Gln Ala Lys Leu Asp
460 465 470
gtc gtc gat gcg cac agc tat tgg cag cat ccg cat ttt ccc cac aaa 1536
Val Val Asp Ala His Ser Tyr Trp Gln His Pro His Phe Pro His Lys
475 480 485
cca tgg gac ccg ggc gac tgg acg gtg caa aac gtc tcg atg gcc ggc 1584
Pro Trp Asp Pro Gly Asp Trp Thr Val Gln Asn Val Ser Met Ala Gly
490 495 500
gcg ccc gac gga ggc aca ctc ccg ggc ctc gca cta cgg cgc gtg gcc 1632
Ala Pro Asp Gly Gly Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Ala
505 510 515 520
ggc aag cct ttc atc gtc acc gaa tat aac gcc tcc gca ccg aac acc 1680
Gly Lys Pro Phe Ile Val Thr Glu Tyr Asn Ala Ser Ala Pro Asn Thr
525 530 535
tat tcg agt gag gct ttc ctc gaa ctc tgc gcc atc gcg ggc ttg cag 1728
Tyr Ser Ser Glu Ala Phe Leu Glu Leu Cys Ala Ile Ala Gly Leu Gln
540 545 550
gac tgg gac ggg gtc ttt gct ttt gcc tac agc cac cgc gaa aac gat 1776
Asp Trp Asp Gly Val Phe Ala Phe Ala Tyr Ser His Arg Glu Asn Asp
555 560 565
tgg aac acc gag cac atc atg ggc ttt ttc gat atc gac cag cac ccg 1824
Trp Asn Thr Glu His Ile Met Gly Phe Phe Asp Ile Asp Gln His Pro
570 575 580
acg aag atg gcc acg cta ccc gcg gcg ctc gcg ctc ttt atg cgg ggc 1872
Thr Lys Met Ala Thr Leu Pro Ala Ala Leu Ala Leu Phe Met Arg Gly
585 590 595 600
gat atc aaa ccc ccg ggc gaa ccc gtc atc gcg gac acc acc tgg aac 1920
Asp Ile Lys Pro Pro Gly Glu Pro Val Ile Ala Asp Thr Thr Trp Asn
605 610 615
gac gcg ctt gaa tcg gtc cgc aaa gga gga tcg tgg gtc gat gcc aat 1968
Asp Ala Leu Glu Ser Val Arg Lys Gly Gly Ser Trp Val Asp Ala Asn
620 625 630
acc tac ggc att ccg aaa gag gaa gcg ttt cgg cgc gcc atc ggc atg 2016
Thr Tyr Gly Ile Pro Lys Glu Glu Ala Phe Arg Arg Ala Ile Gly Met
635 640 645
cgc atc ggc cag gcc acc aaa gtc aac gtg ccg ccg cca tcc gga gat 2064
Arg Ile Gly Gln Ala Thr Lys Val Asn Val Pro Pro Pro Ser Gly Asp
650 655 660
tcg tcg gtg att cgc agt gac aac ggc cag ttc acc tgg gac acc gtt 2112
Ser Ser Val Ile Arg Ser Asp Asn Gly Gln Phe Thr Trp Asp Thr Val
665 670 675 680
tcg cac cgc atg ctc ctc gcg agt ccg cgt tca gcg ggc gtg atc ggc 2160
Ser His Arg Met Leu Leu Ala Ser Pro Arg Ser Ala Gly Val Ile Gly
685 690 695
tcg ctc aaa gag ggc gaa acg atc gac ctc ggc agt gtg cga atc atc 2208
Ser Leu Lys Glu Gly Glu Thr Ile Asp Leu Gly Ser Val Arg Ile Ile
700 705 710
ccg ggt ccc acg cgg cag aac tgg gcg acg atc aat gcc acg gtc atc 2256
Pro Gly Pro Thr Arg Gln Asn Trp Ala Thr Ile Asn Ala Thr Val Ile
715 720 725
gcc ggc ccg gat ttt gaa cac gcg aag cgc att ctc atc acg gcc acg 2304
Ala Gly Pro Asp Phe Glu His Ala Lys Arg Ile Leu Ile Thr Ala Thr
730 735 740
ggt ctg gcc gaa aac acc ggc atg aag tgg aag gat gcg cag aag tcg 2352
Gly Leu Ala Glu Asn Thr Gly Met Lys Trp Lys Asp Ala Gln Lys Ser
745 750 755 760
agc gta ggc gcc gac tgg ggc cac gag cct tcg ctc gtc gag ggg atc 2400
Ser Val Gly Ala Asp Trp Gly His Glu Pro Ser Leu Val Glu Gly Ile
765 770 775
tcc gcc aag atc ggc gtg cct ttc cag aaa ggc gct cag gcg tgg tct 2448
Ser Ala Lys Ile Gly Val Pro Phe Gln Lys Gly Ala Gln Ala Trp Ser
780 785 790
ctc gac gcg cgc ggg cag cgc caa acc gag atc cct gtg aag cga ggg 2496
Leu Asp Ala Arg Gly Gln Arg Gln Thr Glu Ile Pro Val Lys Arg Gly
795 800 805
aca ggc aaa acg gag atc gag att tcc ccc aat caa cag acg ctc tgg 2544
Thr Gly Lys Thr Glu Ile Glu Ile Ser Pro Asn Gln Gln Thr Leu Trp
810 815 820
tgg gag atc gag atc ccg taa 2565
Trp Glu Ile Glu Ile Pro
825 830
<210> 8
<211> 854
<212> PRT
<213> Chthoniobacter flavus
<400> 8
Met Asn Leu Arg Gln Thr Leu Pro Val Leu Ser Val Ala Ala Ala Leu
-20 -15 -10
Leu Thr Ala Pro Val Val Arg Ala Ala Asp Leu Phe Pro Phe Val Leu
-5 -1 1 5
Pro Trp Asp Asp Ala Ser Pro Ser Ile Thr Asn Val Ser Ser Trp Leu
10 15 20
Asp Lys Pro Ala Gly Lys Asp Gly Phe Val Tyr Thr His Asp Gly His
25 30 35 40
Leu Phe Ala Gly Lys Lys Arg Ile Arg Phe Phe Gly Val Asn Leu Ala
45 50 55
Phe Ala Gly Asn Phe Pro Asn His Asn Asp Ala Asp Pro Val Ala Ala
60 65 70
Arg Met Ala Lys Phe Gly Ile Asn Cys Val Arg Phe His His Met Asp
75 80 85
Thr Gly Phe Ala Pro Ala Gly Leu Leu Lys Lys Asp Lys Lys Thr Phe
90 95 100
Asp Glu Asp Ser Leu Asp Arg Leu Asp Tyr Phe Ile Ala Gln Leu Lys
105 110 115 120
Lys Asn Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Leu Glu Tyr
125 130 135
Pro Gly Phe Lys Lys Trp Glu Gly Ala Ser Asn Phe Phe Lys Gly Val
140 145 150
Asp Asn Phe Phe Pro Pro Phe Ile Glu Gln Gln Arg Glu Tyr Ala Arg
155 160 165
Met Leu Leu Thr His Val Asn Ala Tyr Thr His Lys Pro Tyr Thr Asp
170 175 180
Glu Ser Ala Val Ala Phe Ile Glu Ile Asn Asn Glu Asn Gly Leu Ile
185 190 195 200
Met Glu Trp Asn Asn Gly Thr Leu Asp Ala Met Pro Asp Pro Phe Ala
205 210 215
Ala Glu Leu Arg Lys Gln Trp Asn Asp Trp Leu Lys Lys Lys Tyr Asp
220 225 230
Thr Pro Ala Lys Leu Ala Gly Ala Trp Gly Lys Gly Ala Glu Pro Leu
235 240 245
Gly Gln Glu Met Leu Lys Pro Thr His Thr Ala Trp His Leu Glu Gln
250 255 260
His Gly Glu Ala Lys Ser Glu Leu Ser Ser Glu Pro Gly Glu Gly Ser
265 270 275 280
Ala Gly Glu Thr Leu His Val His Val Thr Gln Pro Gly Gln Glu Ser
285 290 295
Trp His Val Gln Leu Gly Gln Ala Gly Leu Lys Leu Ala Ala Gly Lys
300 305 310
Thr Tyr Thr Leu His Leu Arg Ala Lys Ala Asp Ala Pro Arg Arg Ile
315 320 325
Ser Ile Gly Leu Ser Gln Ala His Glu Pro Trp Lys Thr Leu Gly Ser
330 335 340
Gln Ser Val Arg Leu Thr Thr Glu Trp Gln Asp Val His Phe Ser Ile
345 350 355 360
Pro Val Ala Asn Thr Glu Glu Asn Ala Arg Phe Ser Phe Thr Ser Leu
365 370 375
Gly Ser Ala Val Gly Asp Tyr Trp Phe Ser Asp Ala Ser Leu Arg Pro
380 385 390
Gly Gly Val Ile Ala Leu Gln Ala Gly Glu Ser Val Gly Asn Ile Pro
395 400 405
Phe Phe Arg Lys Lys Glu Ile Gly Met Arg Thr Leu Thr Ala Gln Arg
410 415 420
Asp Trp Asn Ala Phe Leu Val Asp Thr Glu Val Asn Tyr Trp Thr Gly
425 430 435 440
Met Arg His Phe Val Arg Glu Glu Leu His Ala His Ser Gln Val Val
445 450 455
Gly Ser Ala Thr Gly Phe Ser Pro Trp Leu Ala Gln Ala Lys Leu Asp
460 465 470
Val Val Asp Ala His Ser Tyr Trp Gln His Pro His Phe Pro His Lys
475 480 485
Pro Trp Asp Pro Gly Asp Trp Thr Val Gln Asn Val Ser Met Ala Gly
490 495 500
Ala Pro Asp Gly Gly Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Ala
505 510 515 520
Gly Lys Pro Phe Ile Val Thr Glu Tyr Asn Ala Ser Ala Pro Asn Thr
525 530 535
Tyr Ser Ser Glu Ala Phe Leu Glu Leu Cys Ala Ile Ala Gly Leu Gln
540 545 550
Asp Trp Asp Gly Val Phe Ala Phe Ala Tyr Ser His Arg Glu Asn Asp
555 560 565
Trp Asn Thr Glu His Ile Met Gly Phe Phe Asp Ile Asp Gln His Pro
570 575 580
Thr Lys Met Ala Thr Leu Pro Ala Ala Leu Ala Leu Phe Met Arg Gly
585 590 595 600
Asp Ile Lys Pro Pro Gly Glu Pro Val Ile Ala Asp Thr Thr Trp Asn
605 610 615
Asp Ala Leu Glu Ser Val Arg Lys Gly Gly Ser Trp Val Asp Ala Asn
620 625 630
Thr Tyr Gly Ile Pro Lys Glu Glu Ala Phe Arg Arg Ala Ile Gly Met
635 640 645
Arg Ile Gly Gln Ala Thr Lys Val Asn Val Pro Pro Pro Ser Gly Asp
650 655 660
Ser Ser Val Ile Arg Ser Asp Asn Gly Gln Phe Thr Trp Asp Thr Val
665 670 675 680
Ser His Arg Met Leu Leu Ala Ser Pro Arg Ser Ala Gly Val Ile Gly
685 690 695
Ser Leu Lys Glu Gly Glu Thr Ile Asp Leu Gly Ser Val Arg Ile Ile
700 705 710
Pro Gly Pro Thr Arg Gln Asn Trp Ala Thr Ile Asn Ala Thr Val Ile
715 720 725
Ala Gly Pro Asp Phe Glu His Ala Lys Arg Ile Leu Ile Thr Ala Thr
730 735 740
Gly Leu Ala Glu Asn Thr Gly Met Lys Trp Lys Asp Ala Gln Lys Ser
745 750 755 760
Ser Val Gly Ala Asp Trp Gly His Glu Pro Ser Leu Val Glu Gly Ile
765 770 775
Ser Ala Lys Ile Gly Val Pro Phe Gln Lys Gly Ala Gln Ala Trp Ser
780 785 790
Leu Asp Ala Arg Gly Gln Arg Gln Thr Glu Ile Pro Val Lys Arg Gly
795 800 805
Thr Gly Lys Thr Glu Ile Glu Ile Ser Pro Asn Gln Gln Thr Leu Trp
810 815 820
Trp Glu Ile Glu Ile Pro
825 830
<210> 9
<211> 2715
<212> DNA
<213> 堆肥宏基因组
<220>
<221> CDS
<222> (1)..(2712)
<220>
<221> 信号肽
<222> (1)..(75)
<220>
<221> 成熟肽
<222> (115)..(2706)
<220>
<221> prot_结构域
<222> (115)..(804)
<220>
<221> prot_结构域
<222> (1504)..(2706)
<220>
<221> prot_结构域
<222> (1516)..(2043)
<400> 9
atg gtc cac ccc cgc ctg cgc aga ccc ctc ctc cga ctg ctc ctc gcc 48
Met Val His Pro Arg Leu Arg Arg Pro Leu Leu Arg Leu Leu Leu Ala
-35 -30 -25
gtt tct ccc gtc ttt tcc gcc ctc gct gcg tcg gcc gcg gac ggc gtc 96
Val Ser Pro Val Phe Ser Ala Leu Ala Ala Ser Ala Ala Asp Gly Val
-20 -15 -10
ccc ttc gac ggc ttc ccc ttt cac atc ccg ccc acc ggc acc gtc ccc 144
Pro Phe Asp Gly Phe Pro Phe His Ile Pro Pro Thr Gly Thr Val Pro
-5 -1 1 5 10
ggc acc gcg ccc gcc gcc ctc ggc ctc ccc gcc cgc ccc gcc gac agc 192
Gly Thr Ala Pro Ala Ala Leu Gly Leu Pro Ala Arg Pro Ala Asp Ser
15 20 25
ccg atc gtc atc cgc ggc gac cag ttc atc cgg gcc gac acc ggc gaa 240
Pro Ile Val Ile Arg Gly Asp Gln Phe Ile Arg Ala Asp Thr Gly Glu
30 35 40
ccc atc cgc ttc tgg ggc gtc aac ctc tcc ttc gcc ggc gcg ttc ccc 288
Pro Ile Arg Phe Trp Gly Val Asn Leu Ser Phe Ala Gly Ala Phe Pro
45 50 55
gat cac gaa aac gcc gat cgc atc gcc gcc cgc ctg gcc agc ctc ggc 336
Asp His Glu Asn Ala Asp Arg Ile Ala Ala Arg Leu Ala Ser Leu Gly
60 65 70
gtc aac atc gtg cgc ttc cac cac atc gac cag cgc cgc ttc ccc ggc 384
Val Asn Ile Val Arg Phe His His Ile Asp Gln Arg Arg Phe Pro Gly
75 80 85 90
ggc ctc tgg cac cgc gac gcc ccc ggc gcc tcc gcc aat ccc cgc gag 432
Gly Leu Trp His Arg Asp Ala Pro Gly Ala Ser Ala Asn Pro Arg Glu
95 100 105
gac gac atc gag cac cgc gtc ttc gac ccc gaa tcc ctc gac cgc ctc 480
Asp Asp Ile Glu His Arg Val Phe Asp Pro Glu Ser Leu Asp Arg Leu
110 115 120
gac tac ctc gtc gcc cgc ctg aag gcg cac ggc atc tac gcc aat ctc 528
Asp Tyr Leu Val Ala Arg Leu Lys Ala His Gly Ile Tyr Ala Asn Leu
125 130 135
aac ctc aag gtc tcc cgc acc ttc agc acc tac gac ggc ccc gcc ttc 576
Asn Leu Lys Val Ser Arg Thr Phe Ser Thr Tyr Asp Gly Pro Ala Phe
140 145 150
ccc gcg ccc gcc gcc gac gaa ttc acc ccc cgc aaa ggc aaa ggc ttc 624
Pro Ala Pro Ala Ala Asp Glu Phe Thr Pro Arg Lys Gly Lys Gly Phe
155 160 165 170
gac cag ttc tac acg ccg gcc atc gag gcc cag aaa acc ttc gcc cgc 672
Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala Gln Lys Thr Phe Ala Arg
175 180 185
ctc ctc ctc acc cac cgc aac ccc tac acc ggc tcc acc tac gcc gcc 720
Leu Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Ser Thr Tyr Ala Ala
190 195 200
gag ccc gcc gtc gcc caa gtc gag atc aac aac gag aac ggc atc ctc 768
Glu Pro Ala Val Ala Gln Val Glu Ile Asn Asn Glu Asn Gly Ile Leu
205 210 215
tgg gcc tgg aac tac aac ctc ctc gac cgc ctc ccc gcc ccc tat ctc 816
Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg Leu Pro Ala Pro Tyr Leu
220 225 230
gcc gaa ctc tcc tcc cgc tgg aac acc tgg ctg cgc gcc cgc tac ccc 864
Ala Glu Leu Ser Ser Arg Trp Asn Thr Trp Leu Arg Ala Arg Tyr Pro
235 240 245 250
gac acc gcc gcc ctc cgc gcc gcc tgg gcg gac ggc tcg gcc gcc gca 912
Asp Thr Ala Ala Leu Arg Ala Ala Trp Ala Asp Gly Ser Ala Ala Ala
255 260 265
tcc tcc gtc ctt tcc ccc ggc gcg ccc gcg agc acc gat ctt ctc gcc 960
Ser Ser Val Leu Ser Pro Gly Ala Pro Ala Ser Thr Asp Leu Leu Ala
270 275 280
ggc gtc gcc ccg gaa ctc cgc acc gcc aga aga gcc cgc gcc acg ctc 1008
Gly Val Ala Pro Glu Leu Arg Thr Ala Arg Arg Ala Arg Ala Thr Leu
285 290 295
ctc ccc ccg ccc gcg cgc gac acc ggc gac gcg gac gcc gac gac acc 1056
Leu Pro Pro Pro Ala Arg Asp Thr Gly Asp Ala Asp Ala Asp Asp Thr
300 305 310
acc gcg ctg cgc ctc acc gtg gac gaa gtc ccc gac gcc gcc tcg tgg 1104
Thr Ala Leu Arg Leu Thr Val Asp Glu Val Pro Asp Ala Ala Ser Trp
315 320 325 330
aac gtc cgc tgc aac tac ccg ctc acc ctc tcc ccc ggc gcg acc tac 1152
Asn Val Arg Cys Asn Tyr Pro Leu Thr Leu Ser Pro Gly Ala Thr Tyr
335 340 345
ctc gcc acc ctc cgc ctc cgg gcc aac cgt gag gaa aaa atc gcc ctg 1200
Leu Ala Thr Leu Arg Leu Arg Ala Asn Arg Glu Glu Lys Ile Ala Leu
350 355 360
cgc ctg cgc gac ccc gac aac caa aac ctc gcc gcg ccg cgc acg ctc 1248
Arg Leu Arg Asp Pro Asp Asn Gln Asn Leu Ala Ala Pro Arg Thr Leu
365 370 375
aac ctc gag acc gac tgg aaa cgg cac acc ctc acc ttt gcc gtc ccc 1296
Asn Leu Glu Thr Asp Trp Lys Arg His Thr Leu Thr Phe Ala Val Pro
380 385 390
gcc ggc gac cac ccc gcc gac acg ctc gcc gcc ctg ctc tcc ctc gaa 1344
Ala Gly Asp His Pro Ala Asp Thr Leu Ala Ala Leu Leu Ser Leu Glu
395 400 405 410
gcg ggc cgc ccc ggt ctc gtc ctc gac atc gac gcc gcc tcc ttc cgc 1392
Ala Gly Arg Pro Gly Leu Val Leu Asp Ile Asp Ala Ala Ser Phe Arg
415 420 425
ctc aac ctc ctc gcc ggc ctg ccc tcc ggc caa ggc atc gac ccc ggc 1440
Leu Asn Leu Leu Ala Gly Leu Pro Ser Gly Gln Gly Ile Asp Pro Gly
430 435 440
gac cgc ccc gtc gcc tgg gtg ctc cgc cgc gac ctg ccc gac cgc acc 1488
Asp Arg Pro Val Ala Trp Val Leu Arg Arg Asp Leu Pro Asp Arg Thr
445 450 455
ccc gcc acc gtc acc gac atc atg cgc ttc ctg cgc gac acc gag gtc 1536
Pro Ala Thr Val Thr Asp Ile Met Arg Phe Leu Arg Asp Thr Glu Val
460 465 470
gcc tac tgg cgc gag atg cac gcc tat ctc cgc gac gaa ctc ggc gtc 1584
Ala Tyr Trp Arg Glu Met His Ala Tyr Leu Arg Asp Glu Leu Gly Val
475 480 485 490
gtc gcc ccc atc gcc ggc acc gcc gtc ggc tac tcc acc ccg cag atc 1632
Val Ala Pro Ile Ala Gly Thr Ala Val Gly Tyr Ser Thr Pro Gln Ile
495 500 505
cag gcc gag acc ggc gac ttc gtg gac acc cac cgc tac tgg ggc gcg 1680
Gln Ala Glu Thr Gly Asp Phe Val Asp Thr His Arg Tyr Trp Gly Ala
510 515 520
ccg cgt ttc ccc agg ttc gac cgc tcc aag ccc tgg acc gtc gaa cag 1728
Pro Arg Phe Pro Arg Phe Asp Arg Ser Lys Pro Trp Thr Val Glu Gln
525 530 535
aag gcc atg gtc gcg cat ccc ggc tca tcc aca ttc gaa cgc atg gcc 1776
Lys Ala Met Val Ala His Pro Gly Ser Ser Thr Phe Glu Arg Met Ala
540 545 550
gcc cgt cgc gtc ttc ggg cgt cct ttc acc gtc acc gaa tac aac cac 1824
Ala Arg Arg Val Phe Gly Arg Pro Phe Thr Val Thr Glu Tyr Asn His
555 560 565 570
ccg ccc tcc agc gac cat cac gcc gag gcc ttc ccg ctg ctc gcc ctc 1872
Pro Pro Ser Ser Asp His His Ala Glu Ala Phe Pro Leu Leu Ala Leu
575 580 585
tac ggc tcc gcg cag gat tgg gac gcg ctc ttc caa ttc gcc tac gcc 1920
Tyr Gly Ser Ala Gln Asp Trp Asp Ala Leu Phe Gln Phe Ala Tyr Ala
590 595 600
cac tcc ccc gac gcc tgg gaa ggc gac acg ctc cgg ggc ttc ttc gac 1968
His Ser Pro Asp Ala Trp Glu Gly Asp Thr Leu Arg Gly Phe Phe Asp
605 610 615
acc gcg ccc aac ccc gcg cac acc gtc gcc gcg ctg gcc gca tcc gac 2016
Thr Ala Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser Asp
620 625 630
atc ttc cga aaa cgc cgc gtc gcc ccg ttc tcc gaa gcc gtc gcc gtc 2064
Ile Phe Arg Lys Arg Arg Val Ala Pro Phe Ser Glu Ala Val Ala Val
635 640 645 650
cac gtt cct ctc gaa cgc cag ctc gaa cgg cag aac aac tac gcc ttc 2112
His Val Pro Leu Glu Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala Phe
655 660 665
ccg cga ctc gtc gag gcc tgc gcc gtc ttc ggc ggc ctc ccc gcc gac 2160
Pro Arg Leu Val Glu Ala Cys Ala Val Phe Gly Gly Leu Pro Ala Asp
670 675 680
gcc tgg ctg cac cgc cgc gtc ggt ctc gcg ctc cac ccc ggc gaa caa 2208
Ala Trp Leu His Arg Arg Val Gly Leu Ala Leu His Pro Gly Glu Gln
685 690 695
ccc gcg tcg ctc cct ccc gcc gcc tct ggc cat cac ctt gtc tgg gac 2256
Pro Ala Ser Leu Pro Pro Ala Ala Ser Gly His His Leu Val Trp Asp
700 705 710
gcc gcg cac gcc ggc tcc gcc cac gtc cgc ttc gtc ggc gac ggc gcc 2304
Ala Ala His Ala Gly Ser Ala His Val Arg Phe Val Gly Asp Gly Ala
715 720 725 730
gcc ggc ctc gtc ggt ttc gtc gcc ggc cgg aca ctc gac ctc ggc tgg 2352
Ala Gly Leu Val Gly Phe Val Ala Gly Arg Thr Leu Asp Leu Gly Trp
735 740 745
ctg cgt atc act cca ggc act aca tcg ctc gac ggt ttc tcc gtc gtc 2400
Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asp Gly Phe Ser Val Val
750 755 760
atg ctc aac gcc gtc gac ggc cag ccc ctc ggc gcg ccc ggc cgc cac 2448
Met Leu Asn Ala Val Asp Gly Gln Pro Leu Gly Ala Pro Gly Arg His
765 770 775
ctg ctc acc gtc gtc gtg cgc gcc gcc aac cgc cac atg gga tgg aac 2496
Leu Leu Thr Val Val Val Arg Ala Ala Asn Arg His Met Gly Trp Asn
780 785 790
gcc gac cgc acc ggc ttc ggc acc gcg tgg ggc gaa ggc ccc gcc ctc 2544
Ala Asp Arg Thr Gly Phe Gly Thr Ala Trp Gly Glu Gly Pro Ala Leu
795 800 805 810
gtc gag acc gcc ccc gtc gac ctc gcc ttc ctc aag ccg gcg cgc gtc 2592
Val Glu Thr Ala Pro Val Asp Leu Ala Phe Leu Lys Pro Ala Arg Val
815 820 825
cac gcg ctc gcg ccc gac ggc acg cgc cgc gtc gag ctc gcg ccc gcg 2640
His Ala Leu Ala Pro Asp Gly Thr Arg Arg Val Glu Leu Ala Pro Ala
830 835 840
gag ggt tcc ggc tcc gcc gtc cgg ttc cgc gcc ggc ccg gaa tac cgc 2688
Glu Gly Ser Gly Ser Ala Val Arg Phe Arg Ala Gly Pro Glu Tyr Arg
845 850 855
acc ctc tgg tat gag att tcc ctc tga 2715
Thr Leu Trp Tyr Glu Ile Ser Leu
860 865
<210> 10
<211> 904
<212> PRT
<213> 堆肥宏基因组
<400> 10
Met Val His Pro Arg Leu Arg Arg Pro Leu Leu Arg Leu Leu Leu Ala
-35 -30 -25
Val Ser Pro Val Phe Ser Ala Leu Ala Ala Ser Ala Ala Asp Gly Val
-20 -15 -10
Pro Phe Asp Gly Phe Pro Phe His Ile Pro Pro Thr Gly Thr Val Pro
-5 -1 1 5 10
Gly Thr Ala Pro Ala Ala Leu Gly Leu Pro Ala Arg Pro Ala Asp Ser
15 20 25
Pro Ile Val Ile Arg Gly Asp Gln Phe Ile Arg Ala Asp Thr Gly Glu
30 35 40
Pro Ile Arg Phe Trp Gly Val Asn Leu Ser Phe Ala Gly Ala Phe Pro
45 50 55
Asp His Glu Asn Ala Asp Arg Ile Ala Ala Arg Leu Ala Ser Leu Gly
60 65 70
Val Asn Ile Val Arg Phe His His Ile Asp Gln Arg Arg Phe Pro Gly
75 80 85 90
Gly Leu Trp His Arg Asp Ala Pro Gly Ala Ser Ala Asn Pro Arg Glu
95 100 105
Asp Asp Ile Glu His Arg Val Phe Asp Pro Glu Ser Leu Asp Arg Leu
110 115 120
Asp Tyr Leu Val Ala Arg Leu Lys Ala His Gly Ile Tyr Ala Asn Leu
125 130 135
Asn Leu Lys Val Ser Arg Thr Phe Ser Thr Tyr Asp Gly Pro Ala Phe
140 145 150
Pro Ala Pro Ala Ala Asp Glu Phe Thr Pro Arg Lys Gly Lys Gly Phe
155 160 165 170
Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala Gln Lys Thr Phe Ala Arg
175 180 185
Leu Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Ser Thr Tyr Ala Ala
190 195 200
Glu Pro Ala Val Ala Gln Val Glu Ile Asn Asn Glu Asn Gly Ile Leu
205 210 215
Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg Leu Pro Ala Pro Tyr Leu
220 225 230
Ala Glu Leu Ser Ser Arg Trp Asn Thr Trp Leu Arg Ala Arg Tyr Pro
235 240 245 250
Asp Thr Ala Ala Leu Arg Ala Ala Trp Ala Asp Gly Ser Ala Ala Ala
255 260 265
Ser Ser Val Leu Ser Pro Gly Ala Pro Ala Ser Thr Asp Leu Leu Ala
270 275 280
Gly Val Ala Pro Glu Leu Arg Thr Ala Arg Arg Ala Arg Ala Thr Leu
285 290 295
Leu Pro Pro Pro Ala Arg Asp Thr Gly Asp Ala Asp Ala Asp Asp Thr
300 305 310
Thr Ala Leu Arg Leu Thr Val Asp Glu Val Pro Asp Ala Ala Ser Trp
315 320 325 330
Asn Val Arg Cys Asn Tyr Pro Leu Thr Leu Ser Pro Gly Ala Thr Tyr
335 340 345
Leu Ala Thr Leu Arg Leu Arg Ala Asn Arg Glu Glu Lys Ile Ala Leu
350 355 360
Arg Leu Arg Asp Pro Asp Asn Gln Asn Leu Ala Ala Pro Arg Thr Leu
365 370 375
Asn Leu Glu Thr Asp Trp Lys Arg His Thr Leu Thr Phe Ala Val Pro
380 385 390
Ala Gly Asp His Pro Ala Asp Thr Leu Ala Ala Leu Leu Ser Leu Glu
395 400 405 410
Ala Gly Arg Pro Gly Leu Val Leu Asp Ile Asp Ala Ala Ser Phe Arg
415 420 425
Leu Asn Leu Leu Ala Gly Leu Pro Ser Gly Gln Gly Ile Asp Pro Gly
430 435 440
Asp Arg Pro Val Ala Trp Val Leu Arg Arg Asp Leu Pro Asp Arg Thr
445 450 455
Pro Ala Thr Val Thr Asp Ile Met Arg Phe Leu Arg Asp Thr Glu Val
460 465 470
Ala Tyr Trp Arg Glu Met His Ala Tyr Leu Arg Asp Glu Leu Gly Val
475 480 485 490
Val Ala Pro Ile Ala Gly Thr Ala Val Gly Tyr Ser Thr Pro Gln Ile
495 500 505
Gln Ala Glu Thr Gly Asp Phe Val Asp Thr His Arg Tyr Trp Gly Ala
510 515 520
Pro Arg Phe Pro Arg Phe Asp Arg Ser Lys Pro Trp Thr Val Glu Gln
525 530 535
Lys Ala Met Val Ala His Pro Gly Ser Ser Thr Phe Glu Arg Met Ala
540 545 550
Ala Arg Arg Val Phe Gly Arg Pro Phe Thr Val Thr Glu Tyr Asn His
555 560 565 570
Pro Pro Ser Ser Asp His His Ala Glu Ala Phe Pro Leu Leu Ala Leu
575 580 585
Tyr Gly Ser Ala Gln Asp Trp Asp Ala Leu Phe Gln Phe Ala Tyr Ala
590 595 600
His Ser Pro Asp Ala Trp Glu Gly Asp Thr Leu Arg Gly Phe Phe Asp
605 610 615
Thr Ala Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser Asp
620 625 630
Ile Phe Arg Lys Arg Arg Val Ala Pro Phe Ser Glu Ala Val Ala Val
635 640 645 650
His Val Pro Leu Glu Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala Phe
655 660 665
Pro Arg Leu Val Glu Ala Cys Ala Val Phe Gly Gly Leu Pro Ala Asp
670 675 680
Ala Trp Leu His Arg Arg Val Gly Leu Ala Leu His Pro Gly Glu Gln
685 690 695
Pro Ala Ser Leu Pro Pro Ala Ala Ser Gly His His Leu Val Trp Asp
700 705 710
Ala Ala His Ala Gly Ser Ala His Val Arg Phe Val Gly Asp Gly Ala
715 720 725 730
Ala Gly Leu Val Gly Phe Val Ala Gly Arg Thr Leu Asp Leu Gly Trp
735 740 745
Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asp Gly Phe Ser Val Val
750 755 760
Met Leu Asn Ala Val Asp Gly Gln Pro Leu Gly Ala Pro Gly Arg His
765 770 775
Leu Leu Thr Val Val Val Arg Ala Ala Asn Arg His Met Gly Trp Asn
780 785 790
Ala Asp Arg Thr Gly Phe Gly Thr Ala Trp Gly Glu Gly Pro Ala Leu
795 800 805 810
Val Glu Thr Ala Pro Val Asp Leu Ala Phe Leu Lys Pro Ala Arg Val
815 820 825
His Ala Leu Ala Pro Asp Gly Thr Arg Arg Val Glu Leu Ala Pro Ala
830 835 840
Glu Gly Ser Gly Ser Ala Val Arg Phe Arg Ala Gly Pro Glu Tyr Arg
845 850 855
Thr Leu Trp Tyr Glu Ile Ser Leu
860 865
<210> 11
<211> 2586
<212> DNA
<213> 人类粪便宏基因组
<220>
<221> CDS
<222> (1)..(2583)
<220>
<221> 信号肽
<222> (1)..(72)
<220>
<221> 成熟肽
<222> (103)..(2565)
<220>
<221> prot_结构域
<222> (103)..(768)
<220>
<221> prot_结构域
<222> (886)..(1209)
<220>
<221> prot_结构域
<222> (1297)..(2565)
<400> 11
atg aca cga aaa ttc ttt att cca ctc acg ctc ggc ggg ctg ttg ctc 48
Met Thr Arg Lys Phe Phe Ile Pro Leu Thr Leu Gly Gly Leu Leu Leu
-30 -25 -20
gga agt ccg ctt aca gcc gcg aac acg gat gcc gtt ccg gag ggc tat 96
Gly Ser Pro Leu Thr Ala Ala Asn Thr Asp Ala Val Pro Glu Gly Tyr
-15 -10 -5
cag ccg ttc ccg ttg caa tgg gat gac aca ctc gcc ggg aca gca acc 144
Gln Pro Phe Pro Leu Gln Trp Asp Asp Thr Leu Ala Gly Thr Ala Thr
-1 1 5 10
gat gtt tct ttc ctc aac gaa aaa cct gcc gga aaa aac ggg cgt ctg 192
Asp Val Ser Phe Leu Asn Glu Lys Pro Ala Gly Lys Asn Gly Arg Leu
15 20 25 30
atc gtt cgc gac gcc cat ttt gtc gaa agt tcc aca gga aaa cgt gtc 240
Ile Val Arg Asp Ala His Phe Val Glu Ser Ser Thr Gly Lys Arg Val
35 40 45
cgt ctg att gga atc ggg att ggc ggt gat gcg ctt ttc gaa atg gat 288
Arg Leu Ile Gly Ile Gly Ile Gly Gly Asp Ala Leu Phe Glu Met Asp
50 55 60
cac gct gcg gca gaa aag gct gca cgg cgt ctt gca aaa gcc ggt gtc 336
His Ala Ala Ala Glu Lys Ala Ala Arg Arg Leu Ala Lys Ala Gly Val
65 70 75
aac gtg gtc cgt ttc cac aat ctt gat ggt tcc gat cga gac cgg gat 384
Asn Val Val Arg Phe His Asn Leu Asp Gly Ser Asp Arg Asp Arg Asp
80 85 90
act ctc att gat ttc aag caa ccg ggc tcc gag cac ttc aat ccc aga 432
Thr Leu Ile Asp Phe Lys Gln Pro Gly Ser Glu His Phe Asn Pro Arg
95 100 105 110
cac ctt gat att ctg gac tat ttc ttc gcc tgt ctg aaa aag gag gga 480
His Leu Asp Ile Leu Asp Tyr Phe Phe Ala Cys Leu Lys Lys Glu Gly
115 120 125
atc tat act gtg atg ggt ctg aaa gtc aac cgg act ctc cgg aaa ggg 528
Ile Tyr Thr Val Met Gly Leu Lys Val Asn Arg Thr Leu Arg Lys Gly
130 135 140
gat gat ctt ccg gaa ggc gtc gac aac gcc gga aaa cgg gtt gac cgc 576
Asp Asp Leu Pro Glu Gly Val Asp Asn Ala Gly Lys Arg Val Asp Arg
145 150 155
ttc aac cgc gca tgg atc gaa tcg cag aaa cgc tgg gcg aaa aac ctg 624
Phe Asn Arg Ala Trp Ile Glu Ser Gln Lys Arg Trp Ala Lys Asn Leu
160 165 170
ctg acc cgt caa aat ccc tat acg aag aca acg ctg gcg gaa gat ccc 672
Leu Thr Arg Gln Asn Pro Tyr Thr Lys Thr Thr Leu Ala Glu Asp Pro
175 180 185 190
gcc gtt ctg agt gtg gaa ctc aac aac gaa agt gcg ctt ctg ttt gaa 720
Ala Val Leu Ser Val Glu Leu Asn Asn Glu Ser Ala Leu Leu Phe Glu
195 200 205
aat ctg aac tgg atc gac acg ctt ccc gct ccc tac aaa cgg gag ctg 768
Asn Leu Asn Trp Ile Asp Thr Leu Pro Ala Pro Tyr Lys Arg Glu Leu
210 215 220
acc gcc ctc tgg aat gac ttc ctt tcc cgc aaa tac aaa aac gac aaa 816
Thr Ala Leu Trp Asn Asp Phe Leu Ser Arg Lys Tyr Lys Asn Asp Lys
225 230 235
gcc ctc ctt gcc gcc tgg aac cgg gac acc agt ctc ccc gga gcc tct 864
Ala Leu Leu Ala Ala Trp Asn Arg Asp Thr Ser Leu Pro Gly Ala Ser
240 245 250
ctc ctg aat ccg gaa ggc cga tgg ggc ttc gaa cag ccg gac gca ttg 912
Leu Leu Asn Pro Glu Gly Arg Trp Gly Phe Glu Gln Pro Asp Ala Leu
255 260 265 270
aag gtt ttc cgc aat acc gcc gac tcg gtt tcg gca acc gta aca cgg 960
Lys Val Phe Arg Asn Thr Ala Asp Ser Val Ser Ala Thr Val Thr Arg
275 280 285
cgc agt aat cag gac tgg cag atc cag ttt cag cgt tcc gga ctc tcc 1008
Arg Ser Asn Gln Asp Trp Gln Ile Gln Phe Gln Arg Ser Gly Leu Ser
290 295 300
ctt gaa aac gga aaa acc tac acg ctg gag ttc gac gtg cga ggc gaa 1056
Leu Glu Asn Gly Lys Thr Tyr Thr Leu Glu Phe Asp Val Arg Gly Glu
305 310 315
ggc gac ccg atc cgc atc gtt ctg tcc cag gac cgt ccc gac tgg cac 1104
Gly Asp Pro Ile Arg Ile Val Leu Ser Gln Asp Arg Pro Asp Trp His
320 325 330
aac tgc gga ctc gaa gcc tcc tta tcc ctg acc tcc gaa tgg aga cac 1152
Asn Cys Gly Leu Glu Ala Ser Leu Ser Leu Thr Ser Glu Trp Arg His
335 340 345 350
cag cgc tac agc ttc cag gca aag aat gcg gat ccc gga cac gtc cgg 1200
Gln Arg Tyr Ser Phe Gln Ala Lys Asn Ala Asp Pro Gly His Val Arg
355 360 365
atc tct ttc ggt gtc gga cat gca cgg aaa gtg gaa atc gcc gcc gtc 1248
Ile Ser Phe Gly Val Gly His Ala Arg Lys Val Glu Ile Ala Ala Val
370 375 380
cgc ctt ttc cct gga acg aaa ccg gtc tcc gcc cgt ctc tcc tcc ggc 1296
Arg Leu Phe Pro Gly Thr Lys Pro Val Ser Ala Arg Leu Ser Ser Gly
385 390 395
agc att ccg ctt ccc gtt gcg ccg aac gat gcc atg agc gct gac tta 1344
Ser Ile Pro Leu Pro Val Ala Pro Asn Asp Ala Met Ser Ala Asp Leu
400 405 410
ctg gag ttt atg gtc gaa ctt gac acc cgc tat gcg gag gag atg ctg 1392
Leu Glu Phe Met Val Glu Leu Asp Thr Arg Tyr Ala Glu Glu Met Leu
415 420 425 430
gac tac ctg cgg aag gat ctc aac gta aaa agt ctg gtg atc gac acg 1440
Asp Tyr Leu Arg Lys Asp Leu Asn Val Lys Ser Leu Val Ile Asp Thr
435 440 445
cag atc gac tgg ggc gga ctc tcc gga ctc cgc cgc gaa aaa cgg atg 1488
Gln Ile Asp Trp Gly Gly Leu Ser Gly Leu Arg Arg Glu Lys Arg Met
450 455 460
gat tac gtt gat gcc cat gcc tac tgg ggg cat ccg gaa ttc acc gga 1536
Asp Tyr Val Asp Ala His Ala Tyr Trp Gly His Pro Glu Phe Thr Gly
465 470 475
gga agc tgg gag ttc aaa ccg ggt tgc tgg aag att ctc aac cag tca 1584
Gly Ser Trp Glu Phe Lys Pro Gly Cys Trp Lys Ile Leu Asn Gln Ser
480 485 490
cag att ccc cgc att gta cac ggc ggc tgg tgt ccg ctg gag cag ttc 1632
Gln Ile Pro Arg Ile Val His Gly Gly Trp Cys Pro Leu Glu Gln Phe
495 500 505 510
agc cga tac cgg atc agc acc aag cct ttt tcc att tcc gaa cac gat 1680
Ser Arg Tyr Arg Ile Ser Thr Lys Pro Phe Ser Ile Ser Glu His Asp
515 520 525
tat ccc tat ccg cac gac tac gcg gtt gag atg atg ccg ctt ctg gtc 1728
Tyr Pro Tyr Pro His Asp Tyr Ala Val Glu Met Met Pro Leu Leu Val
530 535 540
agc gtg gct ctg cgg cag gac tgg gac atg ctt cag ctc ttc atc cac 1776
Ser Val Ala Leu Arg Gln Asp Trp Asp Met Leu Gln Leu Phe Ile His
545 550 555
ggg acc ttc ctt acc cgc gga aaa tcc gcc ggc atc agc cac atg ttt 1824
Gly Thr Phe Leu Thr Arg Gly Lys Ser Ala Gly Ile Ser His Met Phe
560 565 570
gat cag acc aat cat ccc ggc aag atc ggt ttc ttt ccg gct gct gcg 1872
Asp Gln Thr Asn His Pro Gly Lys Ile Gly Phe Phe Pro Ala Ala Ala
575 580 585 590
ctg att ttc cgt cgc ggt atg ttc gaa ccc gct ccg aaa acg gtg gaa 1920
Leu Ile Phe Arg Arg Gly Met Phe Glu Pro Ala Pro Lys Thr Val Glu
595 600 605
ctc cgt ctt ccg gag cag ccg tgg cgc tgg ttc ggc aat cgc ttt gac 1968
Leu Arg Leu Pro Glu Gln Pro Trp Arg Trp Phe Gly Asn Arg Phe Asp
610 615 620
cgg gcg tgg gcg gag acc gga gta cgg cgc agt ctt ctt gac tcc cgg 2016
Arg Ala Trp Ala Glu Thr Gly Val Arg Arg Ser Leu Leu Asp Ser Arg
625 630 635
atg aca atc gtt ccc gat gcg ctg aaa acg ccc ggt cgg gct gag gca 2064
Met Thr Ile Val Pro Asp Ala Leu Lys Thr Pro Gly Arg Ala Glu Ala
640 645 650
tgc gtc tcc gct ccc gat gaa ccg gac cgc ccg atg cgc gga tgg acc 2112
Cys Val Ser Ala Pro Asp Glu Pro Asp Arg Pro Met Arg Gly Trp Thr
655 660 665 670
gaa gga gag aaa aac ttc ttt aca gcg gtc gct ccg cag tgt att gtt 2160
Glu Gly Glu Lys Asn Phe Phe Thr Ala Val Ala Pro Gln Cys Ile Val
675 680 685
ctc tgc ggt cat ttc ggc gga agg acg atg gat gtc ggc gat ctc cgt 2208
Leu Cys Gly His Phe Gly Gly Arg Thr Met Asp Val Gly Asp Leu Arg
690 695 700
ctc cgg gca cgt cca ttc ccc ggc gat ttc ggc gcg gca gtt ctg gtc 2256
Leu Arg Ala Arg Pro Phe Pro Gly Asp Phe Gly Ala Ala Val Leu Val
705 710 715
tcc cgc gat gaa cgt cct ctt ccg gca tcc gga gat att ctc ttc acg 2304
Ser Arg Asp Glu Arg Pro Leu Pro Ala Ser Gly Asp Ile Leu Phe Thr
720 725 730
att gca ggg cgc ttc gaa aac tcc ggg gtt atc tgg aac aag gag cgt 2352
Ile Ala Gly Arg Phe Glu Asn Ser Gly Val Ile Trp Asn Lys Glu Arg
735 740 745 750
gat gcg ctc ctc aac cgt tct cca tgg tgg ggc aat cct ccg gtt ctc 2400
Asp Ala Leu Leu Asn Arg Ser Pro Trp Trp Gly Asn Pro Pro Val Leu
755 760 765
ggt aca aaa acc gat gct gcc atc cgt ttc aaa acc gat ggg ccg cgc 2448
Gly Thr Lys Thr Asp Ala Ala Ile Arg Phe Lys Thr Asp Gly Pro Arg
770 775 780
acg gtc tac gcc ctt gat tcc aat gga aag cgg act gcc gaa ctg ccg 2496
Thr Val Tyr Ala Leu Asp Ser Asn Gly Lys Arg Thr Ala Glu Leu Pro
785 790 795
tcc gca tgg aag gac ggg cat ctc tcc ttc cat gtt cat ccg tca cac 2544
Ser Ala Trp Lys Asp Gly His Leu Ser Phe His Val His Pro Ser His
800 805 810
cgt tcc atg cac tac gaa atc gtc aaa gga gaa aac ctg tga 2586
Arg Ser Met His Tyr Glu Ile Val Lys Gly Glu Asn Leu
815 820 825
<210> 12
<211> 861
<212> PRT
<213> 人类粪便宏基因组
<400> 12
Met Thr Arg Lys Phe Phe Ile Pro Leu Thr Leu Gly Gly Leu Leu Leu
-30 -25 -20
Gly Ser Pro Leu Thr Ala Ala Asn Thr Asp Ala Val Pro Glu Gly Tyr
-15 -10 -5
Gln Pro Phe Pro Leu Gln Trp Asp Asp Thr Leu Ala Gly Thr Ala Thr
-1 1 5 10
Asp Val Ser Phe Leu Asn Glu Lys Pro Ala Gly Lys Asn Gly Arg Leu
15 20 25 30
Ile Val Arg Asp Ala His Phe Val Glu Ser Ser Thr Gly Lys Arg Val
35 40 45
Arg Leu Ile Gly Ile Gly Ile Gly Gly Asp Ala Leu Phe Glu Met Asp
50 55 60
His Ala Ala Ala Glu Lys Ala Ala Arg Arg Leu Ala Lys Ala Gly Val
65 70 75
Asn Val Val Arg Phe His Asn Leu Asp Gly Ser Asp Arg Asp Arg Asp
80 85 90
Thr Leu Ile Asp Phe Lys Gln Pro Gly Ser Glu His Phe Asn Pro Arg
95 100 105 110
His Leu Asp Ile Leu Asp Tyr Phe Phe Ala Cys Leu Lys Lys Glu Gly
115 120 125
Ile Tyr Thr Val Met Gly Leu Lys Val Asn Arg Thr Leu Arg Lys Gly
130 135 140
Asp Asp Leu Pro Glu Gly Val Asp Asn Ala Gly Lys Arg Val Asp Arg
145 150 155
Phe Asn Arg Ala Trp Ile Glu Ser Gln Lys Arg Trp Ala Lys Asn Leu
160 165 170
Leu Thr Arg Gln Asn Pro Tyr Thr Lys Thr Thr Leu Ala Glu Asp Pro
175 180 185 190
Ala Val Leu Ser Val Glu Leu Asn Asn Glu Ser Ala Leu Leu Phe Glu
195 200 205
Asn Leu Asn Trp Ile Asp Thr Leu Pro Ala Pro Tyr Lys Arg Glu Leu
210 215 220
Thr Ala Leu Trp Asn Asp Phe Leu Ser Arg Lys Tyr Lys Asn Asp Lys
225 230 235
Ala Leu Leu Ala Ala Trp Asn Arg Asp Thr Ser Leu Pro Gly Ala Ser
240 245 250
Leu Leu Asn Pro Glu Gly Arg Trp Gly Phe Glu Gln Pro Asp Ala Leu
255 260 265 270
Lys Val Phe Arg Asn Thr Ala Asp Ser Val Ser Ala Thr Val Thr Arg
275 280 285
Arg Ser Asn Gln Asp Trp Gln Ile Gln Phe Gln Arg Ser Gly Leu Ser
290 295 300
Leu Glu Asn Gly Lys Thr Tyr Thr Leu Glu Phe Asp Val Arg Gly Glu
305 310 315
Gly Asp Pro Ile Arg Ile Val Leu Ser Gln Asp Arg Pro Asp Trp His
320 325 330
Asn Cys Gly Leu Glu Ala Ser Leu Ser Leu Thr Ser Glu Trp Arg His
335 340 345 350
Gln Arg Tyr Ser Phe Gln Ala Lys Asn Ala Asp Pro Gly His Val Arg
355 360 365
Ile Ser Phe Gly Val Gly His Ala Arg Lys Val Glu Ile Ala Ala Val
370 375 380
Arg Leu Phe Pro Gly Thr Lys Pro Val Ser Ala Arg Leu Ser Ser Gly
385 390 395
Ser Ile Pro Leu Pro Val Ala Pro Asn Asp Ala Met Ser Ala Asp Leu
400 405 410
Leu Glu Phe Met Val Glu Leu Asp Thr Arg Tyr Ala Glu Glu Met Leu
415 420 425 430
Asp Tyr Leu Arg Lys Asp Leu Asn Val Lys Ser Leu Val Ile Asp Thr
435 440 445
Gln Ile Asp Trp Gly Gly Leu Ser Gly Leu Arg Arg Glu Lys Arg Met
450 455 460
Asp Tyr Val Asp Ala His Ala Tyr Trp Gly His Pro Glu Phe Thr Gly
465 470 475
Gly Ser Trp Glu Phe Lys Pro Gly Cys Trp Lys Ile Leu Asn Gln Ser
480 485 490
Gln Ile Pro Arg Ile Val His Gly Gly Trp Cys Pro Leu Glu Gln Phe
495 500 505 510
Ser Arg Tyr Arg Ile Ser Thr Lys Pro Phe Ser Ile Ser Glu His Asp
515 520 525
Tyr Pro Tyr Pro His Asp Tyr Ala Val Glu Met Met Pro Leu Leu Val
530 535 540
Ser Val Ala Leu Arg Gln Asp Trp Asp Met Leu Gln Leu Phe Ile His
545 550 555
Gly Thr Phe Leu Thr Arg Gly Lys Ser Ala Gly Ile Ser His Met Phe
560 565 570
Asp Gln Thr Asn His Pro Gly Lys Ile Gly Phe Phe Pro Ala Ala Ala
575 580 585 590
Leu Ile Phe Arg Arg Gly Met Phe Glu Pro Ala Pro Lys Thr Val Glu
595 600 605
Leu Arg Leu Pro Glu Gln Pro Trp Arg Trp Phe Gly Asn Arg Phe Asp
610 615 620
Arg Ala Trp Ala Glu Thr Gly Val Arg Arg Ser Leu Leu Asp Ser Arg
625 630 635
Met Thr Ile Val Pro Asp Ala Leu Lys Thr Pro Gly Arg Ala Glu Ala
640 645 650
Cys Val Ser Ala Pro Asp Glu Pro Asp Arg Pro Met Arg Gly Trp Thr
655 660 665 670
Glu Gly Glu Lys Asn Phe Phe Thr Ala Val Ala Pro Gln Cys Ile Val
675 680 685
Leu Cys Gly His Phe Gly Gly Arg Thr Met Asp Val Gly Asp Leu Arg
690 695 700
Leu Arg Ala Arg Pro Phe Pro Gly Asp Phe Gly Ala Ala Val Leu Val
705 710 715
Ser Arg Asp Glu Arg Pro Leu Pro Ala Ser Gly Asp Ile Leu Phe Thr
720 725 730
Ile Ala Gly Arg Phe Glu Asn Ser Gly Val Ile Trp Asn Lys Glu Arg
735 740 745 750
Asp Ala Leu Leu Asn Arg Ser Pro Trp Trp Gly Asn Pro Pro Val Leu
755 760 765
Gly Thr Lys Thr Asp Ala Ala Ile Arg Phe Lys Thr Asp Gly Pro Arg
770 775 780
Thr Val Tyr Ala Leu Asp Ser Asn Gly Lys Arg Thr Ala Glu Leu Pro
785 790 795
Ser Ala Trp Lys Asp Gly His Leu Ser Phe His Val His Pro Ser His
800 805 810
Arg Ser Met His Tyr Glu Ile Val Lys Gly Glu Asn Leu
815 820 825
<210> 13
<211> 2712
<212> DNA
<213> 闪烁杆菌属细菌
<400> 13
atgcggtggt ggatgttggt catcttggcg ttcatctctg gctttggggg ttggtggact 60
atgaggcaag ggttatcgca ggaaggcaaa caggatgcct tgcttttccc tttcgtttta 120
ccttgggacg atgcttctcc atcggtcacc aacatcagtc actggttgca caaacctgct 180
ggcaagtttg ggcatatccg tatcggcgct gacggtcgcc tttacgctgg caagcagcga 240
attcgtttcc tgggcgtgaa cttgtgtttc ggggcatgtt tcccgcgcaa agaggactct 300
gaaaaaattg cggcaaggat ggcgaagttc ggcatcaaca ttgttcgctt ccaccacatg 360
gacatgcaag aatttcccaa cggcatccgc cgtcggggcg tcccccacac ccgcgacctt 420
gaccctgaag cccttgacag acttgactac ctgattgccc aactgaaacg caacggcatc 480
tatgtcaact tgaacttgct cgtttcccgt cccttcaatg ccgccgacgg tttgcccaaa 540
gaaattgagc aactcggttg gaaggagcga cacatcgttg gcttcttcta cgaaccatgc 600
cttgagttgc aaaaggaata tgctcgcaag ttgctgacgc accgcaatcc ttacacgggg 660
ctcacctatg ctgaagaccc tgtcgtcgct ttcgtggaaa tcaacaacga gaacggtctc 720
attcacgctt ggcttagtgg ctctattgac cggatgccaa aagtttttca ggatgagttg 780
caacggcagt ggcatgcttg gctgaaagcc cgatacggca caacggagaa gttgcgcaaa 840
gcgtggggtg tcaaggaaga gcccttgggc aatgaaatgc tgaggaacac gaactttgag 900
gcagggttgc aaaattgggt tttggagcga cacgcgggtg ctgaagcaac agcggaagtt 960
gtcgctgaac ccatccctga actcaaaggt cttcgcttcg tccgcatcaa tgtcaccaaa 1020
cgaggacaag caggctggca tgtccaattc catcaaccga acctgaaagt ccaacccgac 1080
cgaccatata cgctttcctt ctgggcgcga gcggaacgac cttgcaccat ttcagtcgga 1140
atttcgcaag cccacgaacc ttggcagaac cttggcttca gtgccgaagt caaattgaca 1200
caggaatggc gtgaatatcg gttcaccttt accctcaaca ggggtgacga caacgctcgc 1260
gttatcttca gcaacttggg cgctcaaacg acaacttact ggttcgccgc cccctccctt 1320
cgccctggcg gaattgttgg cttggcagcc aacgaacgcc ttgaagatgg cactgtcccg 1380
attttccttc gcgctcgttt cggtgagcgc acacccgaag cgcaacggga ctggatgcga 1440
tttttgtggg agacggaaga tcgctattgg caaacaatct accgctacct caaggacgag 1500
ttggaagtta aggcattggt catcggcaca atcgtcggat gcagcacacc caacatgatg 1560
gcaaaacttg actgcgtgga cacacacgct tattggcaac atccgatgtt cccctcccga 1620
ccttgggatc ctgaggattg gattgtgccc aaccgaacga tggtcaacga acgaggcggg 1680
acgctgccag gtctggcgct gcgacgggtc ttaggcaaac ctcactccgt caccgaatac 1740
aatcatccag caccaaacac atactgcagc gaagccttcc ttttgctggc agcatatgca 1800
gccttgcagg attgggatgc tatctacgcc ttcagttact cgcaccgacg agatggttgg 1860
gacttaaggc gcattcccaa cttctttgac attgaccaac atcccacgaa gatggttacc 1920
cttatccctg cagcagcgat gtttgttcgg ggcgatgtga agcctgccaa gcagcaagtg 1980
gttgtcaggt tgacgaaaga gcaagaggtt gacttgttgc ggcgcagttg ggcttggttg 2040
ctcgtccacg caggtcatgt cggagttccc aacgaagcag cactcgtcca tcgggttgca 2100
attgcgacag atgggaagcg agttccgcca actgctctca agcccgaaca agtgaaaatt 2160
ggcggcaacc gatttgtgtc cgacactggc gaattgattt gggacttgac ggaaaaaggg 2220
cgcggggttg tcatcgttaa cgcccaaaac agcaaagccg ttatcgggtt cgtaggtggc 2280
aagcggtttg agttgagcag cgtcgtgatt gaacctgggc aaactatgca agacggttgg 2340
tgcgccatca cagtcacggc gatggaaggg aacttgccaa ctcgtccctt gcttcgtatc 2400
cttcgtccca tccgtttgct catcactgct acaggctacg cagagaacac cgacatgggt 2460
tggaaagaag ttcccggtta cccacccaaa tcaagttgcg gtcgcaactg gggcaaacca 2520
ccttcgttgg tggaaggcat ctctgccagc atcaccttgc cgttacccgc caagcgagtg 2580
caagcgtggg ctttggacga acggggtcaa cggaaatccc aaatcccagt cactgccgac 2640
ccatcaggca acgccgtcat ccgcatcagt ccccaatggc aaacgctttg gtatgaagtt 2700
gaggcgcggt aa 2712
<210> 14
<211> 903
<212> PRT
<213> 闪烁杆菌属细菌
<400> 14
Met Arg Trp Trp Met Leu Val Ile Leu Ala Phe Ile Ser Gly Phe Gly
1 5 10 15
Gly Trp Trp Thr Met Arg Gln Gly Leu Ser Gln Glu Gly Lys Gln Asp
20 25 30
Ala Leu Leu Phe Pro Phe Val Leu Pro Trp Asp Asp Ala Ser Pro Ser
35 40 45
Val Thr Asn Ile Ser His Trp Leu His Lys Pro Ala Gly Lys Phe Gly
50 55 60
His Ile Arg Ile Gly Ala Asp Gly Arg Leu Tyr Ala Gly Lys Gln Arg
65 70 75 80
Ile Arg Phe Leu Gly Val Asn Leu Cys Phe Gly Ala Cys Phe Pro Arg
85 90 95
Lys Glu Asp Ser Glu Lys Ile Ala Ala Arg Met Ala Lys Phe Gly Ile
100 105 110
Asn Ile Val Arg Phe His His Met Asp Met Gln Glu Phe Pro Asn Gly
115 120 125
Ile Arg Arg Arg Gly Val Pro His Thr Arg Asp Leu Asp Pro Glu Ala
130 135 140
Leu Asp Arg Leu Asp Tyr Leu Ile Ala Gln Leu Lys Arg Asn Gly Ile
145 150 155 160
Tyr Val Asn Leu Asn Leu Leu Val Ser Arg Pro Phe Asn Ala Ala Asp
165 170 175
Gly Leu Pro Lys Glu Ile Glu Gln Leu Gly Trp Lys Glu Arg His Ile
180 185 190
Val Gly Phe Phe Tyr Glu Pro Cys Leu Glu Leu Gln Lys Glu Tyr Ala
195 200 205
Arg Lys Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr Tyr Ala
210 215 220
Glu Asp Pro Val Val Ala Phe Val Glu Ile Asn Asn Glu Asn Gly Leu
225 230 235 240
Ile His Ala Trp Leu Ser Gly Ser Ile Asp Arg Met Pro Lys Val Phe
245 250 255
Gln Asp Glu Leu Gln Arg Gln Trp His Ala Trp Leu Lys Ala Arg Tyr
260 265 270
Gly Thr Thr Glu Lys Leu Arg Lys Ala Trp Gly Val Lys Glu Glu Pro
275 280 285
Leu Gly Asn Glu Met Leu Arg Asn Thr Asn Phe Glu Ala Gly Leu Gln
290 295 300
Asn Trp Val Leu Glu Arg His Ala Gly Ala Glu Ala Thr Ala Glu Val
305 310 315 320
Val Ala Glu Pro Ile Pro Glu Leu Lys Gly Leu Arg Phe Val Arg Ile
325 330 335
Asn Val Thr Lys Arg Gly Gln Ala Gly Trp His Val Gln Phe His Gln
340 345 350
Pro Asn Leu Lys Val Gln Pro Asp Arg Pro Tyr Thr Leu Ser Phe Trp
355 360 365
Ala Arg Ala Glu Arg Pro Cys Thr Ile Ser Val Gly Ile Ser Gln Ala
370 375 380
His Glu Pro Trp Gln Asn Leu Gly Phe Ser Ala Glu Val Lys Leu Thr
385 390 395 400
Gln Glu Trp Arg Glu Tyr Arg Phe Thr Phe Thr Leu Asn Arg Gly Asp
405 410 415
Asp Asn Ala Arg Val Ile Phe Ser Asn Leu Gly Ala Gln Thr Thr Thr
420 425 430
Tyr Trp Phe Ala Ala Pro Ser Leu Arg Pro Gly Gly Ile Val Gly Leu
435 440 445
Ala Ala Asn Glu Arg Leu Glu Asp Gly Thr Val Pro Ile Phe Leu Arg
450 455 460
Ala Arg Phe Gly Glu Arg Thr Pro Glu Ala Gln Arg Asp Trp Met Arg
465 470 475 480
Phe Leu Trp Glu Thr Glu Asp Arg Tyr Trp Gln Thr Ile Tyr Arg Tyr
485 490 495
Leu Lys Asp Glu Leu Glu Val Lys Ala Leu Val Ile Gly Thr Ile Val
500 505 510
Gly Cys Ser Thr Pro Asn Met Met Ala Lys Leu Asp Cys Val Asp Thr
515 520 525
His Ala Tyr Trp Gln His Pro Met Phe Pro Ser Arg Pro Trp Asp Pro
530 535 540
Glu Asp Trp Ile Val Pro Asn Arg Thr Met Val Asn Glu Arg Gly Gly
545 550 555 560
Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Leu Gly Lys Pro His Ser
565 570 575
Val Thr Glu Tyr Asn His Pro Ala Pro Asn Thr Tyr Cys Ser Glu Ala
580 585 590
Phe Leu Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp Trp Asp Ala Ile
595 600 605
Tyr Ala Phe Ser Tyr Ser His Arg Arg Asp Gly Trp Asp Leu Arg Arg
610 615 620
Ile Pro Asn Phe Phe Asp Ile Asp Gln His Pro Thr Lys Met Val Thr
625 630 635 640
Leu Ile Pro Ala Ala Ala Met Phe Val Arg Gly Asp Val Lys Pro Ala
645 650 655
Lys Gln Gln Val Val Val Arg Leu Thr Lys Glu Gln Glu Val Asp Leu
660 665 670
Leu Arg Arg Ser Trp Ala Trp Leu Leu Val His Ala Gly His Val Gly
675 680 685
Val Pro Asn Glu Ala Ala Leu Val His Arg Val Ala Ile Ala Thr Asp
690 695 700
Gly Lys Arg Val Pro Pro Thr Ala Leu Lys Pro Glu Gln Val Lys Ile
705 710 715 720
Gly Gly Asn Arg Phe Val Ser Asp Thr Gly Glu Leu Ile Trp Asp Leu
725 730 735
Thr Glu Lys Gly Arg Gly Val Val Ile Val Asn Ala Gln Asn Ser Lys
740 745 750
Ala Val Ile Gly Phe Val Gly Gly Lys Arg Phe Glu Leu Ser Ser Val
755 760 765
Val Ile Glu Pro Gly Gln Thr Met Gln Asp Gly Trp Cys Ala Ile Thr
770 775 780
Val Thr Ala Met Glu Gly Asn Leu Pro Thr Arg Pro Leu Leu Arg Ile
785 790 795 800
Leu Arg Pro Ile Arg Leu Leu Ile Thr Ala Thr Gly Tyr Ala Glu Asn
805 810 815
Thr Asp Met Gly Trp Lys Glu Val Pro Gly Tyr Pro Pro Lys Ser Ser
820 825 830
Cys Gly Arg Asn Trp Gly Lys Pro Pro Ser Leu Val Glu Gly Ile Ser
835 840 845
Ala Ser Ile Thr Leu Pro Leu Pro Ala Lys Arg Val Gln Ala Trp Ala
850 855 860
Leu Asp Glu Arg Gly Gln Arg Lys Ser Gln Ile Pro Val Thr Ala Asp
865 870 875 880
Pro Ser Gly Asn Ala Val Ile Arg Ile Ser Pro Gln Trp Gln Thr Leu
885 890 895
Trp Tyr Glu Val Glu Ala Arg
900
<210> 15
<211> 2799
<212> DNA
<213> 丰佑菌科细菌
<400> 15
atgttccccc cgatcgtccg aagcagcttt tacctcctcc ttgccgccgc gctgatcccg 60
gcctccgtca ccaccgcgcc tgccgcgacg cctgcggatg atctcccttt tgccaacggt 120
ttcccctttc acatccctcc caccggcacc gtcgccggca cggcgcccgc cgccctcgcc 180
atccccgctc gtcccgccgg agccgacggt cgggtcatcg tccgcggcga ccagttcctc 240
cttgccgata ccgggacccc catccgtttc tggggcgtca acctctgctt ctccggcgct 300
ttccccgacc acgccaccgc cgaccgcatc gccgcccgtc tcgccagtct cggcgtcaac 360
atcgtccgct tccaccacat cgaccagcgc cgctttcccg gcggcctgtg gcatcgcgat 420
tcccccggcg ccaccaacaa cccccgcgag gacaacatcg cgcaccgcac gctcgacccc 480
gaagcgctcg accgcctcga ctacctcgtc gcccgactca aggaacacgg catctacacc 540
aacctcaacc tgaaggtctc ccggatcttc agcaccttcg acgatcccgc gttcccggcc 600
cccgcgcctg gcgaaatcct tccgaagaaa ggcaaaggct tcgaccagtt ttacacgccc 660
gccatcgaag cgcagaaagc ctacgcccgc ctcctcctca cccgtcgcaa tgcctggacc 720
ggcctgacct gggccgaaga ccccgccgtc gcccaggtcg agatcaacaa cgaaaacggc 780
atcctctggg cctggaacta caacctgctc gatcgcctgc ccgcccccta cctcgccgag 840
ctcgccgcgc gctggaacac ctggctgcgc gcccgttaca cggacaccgc ggctctccgg 900
acagcctggg atccggcgag tggcgcgggc gtctcgcccg catccgacgt ggcacgggca 960
tccctgcccg tgagcgttgc ctcccggccc acctccgccg ccggtaacgc aaacgccgcc 1020
gccgcggacg ccgacctcct cgccgggatc agcccggctc ttttcaccgc gaagaaagcc 1080
cgggccacgc ttgcgcccct gcccgcgccc gacaccggcg atgccgacgc cgccgaatcc 1140
gccggcctgc gcctggccgt caacaacgtc cccggcgacg caacctggaa cgtccgttgc 1200
agttactccc tcacgcttcc cgcgctttcc tccggtgcgc cctggaccgt cacccttcgc 1260
cttcgcgcca acaaacccga aaaaatccgt ctgcgcctcc gttcccccga gcaaaacaag 1320
gatatcgccc cgccccgcac gctcaatctc gccaccacct ggaagaccca caccgtcact 1380
tttgccatcc ccgagcatgc cgctcccctc gccgcgcaac tgacgctcga agccggcctc 1440
cccggcctcg ttctcgacat cgcctccgcc agcctccgct cccacacccg ttcggggctc 1500
ccgcgcggcg agggacttgc ctccgacgag cgccccgtca cctggattcc gcgccgcgac 1560
ctctccgggc gaaccgatgc cgtcgtccgc gatgtcatgc acttcctgcg cgacaccgag 1620
atcgcctact ggcgtgaaat gcacgcgttc cttcgtgatg aactccgcgt cgccgctccc 1680
atcacgacca cggccgtcgg ttacaccacg tcgcagatcg ccgccgaaac cgctgacttc 1740
atcgacaccc atcgctactg gggcgcgcct cgctttcccg gtttcaaccg cagcaaaccc 1800
tggaccgtcg aacaaaaagc catggtcgcc cgtcccggcg aatccgccat cgaacgcatg 1860
gccgcccgcc gcgtcttcgg cctccctttc accgtcaccg aatacaacca cccgccctcc 1920
agcgatcacc acgccgaagg cttccccctc ctcgccctct ggggcgctgc gcaggattgg 1980
aacggcctct tcgaattcgc ctactcccac agcgacgcct gggaaagcga caccatgacc 2040
ggcttcttcg acaccgctcc caaccctgtt cacaccgtcg ccgctctcgc cgcctccgac 2100
ctcttccgca accgccgcct cgcccccctc gctcccgcga aatccggata cgtgcccctc 2160
gatcgccagc tcgaacggca aaacaacgac accttccctc gcctcatcga ggccgacgcc 2220
gttttcggcg gactcccgcc cgacgcctgg ctcgccaatc gtgtcggcct cgttcgccgc 2280
gccgatgaac agccggaaac gctcccgccg ccgccggcca gccagcaact cgcctggacc 2340
gccaccgatc ccgccaccgc ccacgtccgc tacacaggcg agggcgtcgc cggcctcgtc 2400
ggcttcgttt ccggccagac cctcgatctc ggctggctcc gtatcacccc cggagataca 2460
tcgctcggcg gtttttccgt cgtcatgctc aactccgtgg acggtcagcc cctcggcgca 2520
tccggccgct atctgctcac cacggcggtg cgcgccgcca accgcggcat gggctggaac 2580
gccgaccgca ccggcttcga caaaaaatgg ggatccggcc ccgcccaggc cgaatccgct 2640
ccggtcacgc tcgacttcgc ctccgcctcc ggcgtccgtg tgtatccgct gaatcccgac 2700
ggaacacgcc gcccggaact cccgcccgcc tccaccccgg gccgcttcga agccacaccc 2760
gccagcaaaa ccctctggtt tgaaatcaca ttcccgtaa 2799
<210> 16
<211> 932
<212> PRT
<213> 丰佑菌科细菌
<400> 16
Met Phe Pro Pro Ile Val Arg Ser Ser Phe Tyr Leu Leu Leu Ala Ala
1 5 10 15
Ala Leu Ile Pro Ala Ser Val Thr Thr Ala Pro Ala Ala Thr Pro Ala
20 25 30
Asp Asp Leu Pro Phe Ala Asn Gly Phe Pro Phe His Ile Pro Pro Thr
35 40 45
Gly Thr Val Ala Gly Thr Ala Pro Ala Ala Leu Ala Ile Pro Ala Arg
50 55 60
Pro Ala Gly Ala Asp Gly Arg Val Ile Val Arg Gly Asp Gln Phe Leu
65 70 75 80
Leu Ala Asp Thr Gly Thr Pro Ile Arg Phe Trp Gly Val Asn Leu Cys
85 90 95
Phe Ser Gly Ala Phe Pro Asp His Ala Thr Ala Asp Arg Ile Ala Ala
100 105 110
Arg Leu Ala Ser Leu Gly Val Asn Ile Val Arg Phe His His Ile Asp
115 120 125
Gln Arg Arg Phe Pro Gly Gly Leu Trp His Arg Asp Ser Pro Gly Ala
130 135 140
Thr Asn Asn Pro Arg Glu Asp Asn Ile Ala His Arg Thr Leu Asp Pro
145 150 155 160
Glu Ala Leu Asp Arg Leu Asp Tyr Leu Val Ala Arg Leu Lys Glu His
165 170 175
Gly Ile Tyr Thr Asn Leu Asn Leu Lys Val Ser Arg Ile Phe Ser Thr
180 185 190
Phe Asp Asp Pro Ala Phe Pro Ala Pro Ala Pro Gly Glu Ile Leu Pro
195 200 205
Lys Lys Gly Lys Gly Phe Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala
210 215 220
Gln Lys Ala Tyr Ala Arg Leu Leu Leu Thr Arg Arg Asn Ala Trp Thr
225 230 235 240
Gly Leu Thr Trp Ala Glu Asp Pro Ala Val Ala Gln Val Glu Ile Asn
245 250 255
Asn Glu Asn Gly Ile Leu Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg
260 265 270
Leu Pro Ala Pro Tyr Leu Ala Glu Leu Ala Ala Arg Trp Asn Thr Trp
275 280 285
Leu Arg Ala Arg Tyr Thr Asp Thr Ala Ala Leu Arg Thr Ala Trp Asp
290 295 300
Pro Ala Ser Gly Ala Gly Val Ser Pro Ala Ser Asp Val Ala Arg Ala
305 310 315 320
Ser Leu Pro Val Ser Val Ala Ser Arg Pro Thr Ser Ala Ala Gly Asn
325 330 335
Ala Asn Ala Ala Ala Ala Asp Ala Asp Leu Leu Ala Gly Ile Ser Pro
340 345 350
Ala Leu Phe Thr Ala Lys Lys Ala Arg Ala Thr Leu Ala Pro Leu Pro
355 360 365
Ala Pro Asp Thr Gly Asp Ala Asp Ala Ala Glu Ser Ala Gly Leu Arg
370 375 380
Leu Ala Val Asn Asn Val Pro Gly Asp Ala Thr Trp Asn Val Arg Cys
385 390 395 400
Ser Tyr Ser Leu Thr Leu Pro Ala Leu Ser Ser Gly Ala Pro Trp Thr
405 410 415
Val Thr Leu Arg Leu Arg Ala Asn Lys Pro Glu Lys Ile Arg Leu Arg
420 425 430
Leu Arg Ser Pro Glu Gln Asn Lys Asp Ile Ala Pro Pro Arg Thr Leu
435 440 445
Asn Leu Ala Thr Thr Trp Lys Thr His Thr Val Thr Phe Ala Ile Pro
450 455 460
Glu His Ala Ala Pro Leu Ala Ala Gln Leu Thr Leu Glu Ala Gly Leu
465 470 475 480
Pro Gly Leu Val Leu Asp Ile Ala Ser Ala Ser Leu Arg Ser His Thr
485 490 495
Arg Ser Gly Leu Pro Arg Gly Glu Gly Leu Ala Ser Asp Glu Arg Pro
500 505 510
Val Thr Trp Ile Pro Arg Arg Asp Leu Ser Gly Arg Thr Asp Ala Val
515 520 525
Val Arg Asp Val Met His Phe Leu Arg Asp Thr Glu Ile Ala Tyr Trp
530 535 540
Arg Glu Met His Ala Phe Leu Arg Asp Glu Leu Arg Val Ala Ala Pro
545 550 555 560
Ile Thr Thr Thr Ala Val Gly Tyr Thr Thr Ser Gln Ile Ala Ala Glu
565 570 575
Thr Ala Asp Phe Ile Asp Thr His Arg Tyr Trp Gly Ala Pro Arg Phe
580 585 590
Pro Gly Phe Asn Arg Ser Lys Pro Trp Thr Val Glu Gln Lys Ala Met
595 600 605
Val Ala Arg Pro Gly Glu Ser Ala Ile Glu Arg Met Ala Ala Arg Arg
610 615 620
Val Phe Gly Leu Pro Phe Thr Val Thr Glu Tyr Asn His Pro Pro Ser
625 630 635 640
Ser Asp His His Ala Glu Gly Phe Pro Leu Leu Ala Leu Trp Gly Ala
645 650 655
Ala Gln Asp Trp Asn Gly Leu Phe Glu Phe Ala Tyr Ser His Ser Asp
660 665 670
Ala Trp Glu Ser Asp Thr Met Thr Gly Phe Phe Asp Thr Ala Pro Asn
675 680 685
Pro Val His Thr Val Ala Ala Leu Ala Ala Ser Asp Leu Phe Arg Asn
690 695 700
Arg Arg Leu Ala Pro Leu Ala Pro Ala Lys Ser Gly Tyr Val Pro Leu
705 710 715 720
Asp Arg Gln Leu Glu Arg Gln Asn Asn Asp Thr Phe Pro Arg Leu Ile
725 730 735
Glu Ala Asp Ala Val Phe Gly Gly Leu Pro Pro Asp Ala Trp Leu Ala
740 745 750
Asn Arg Val Gly Leu Val Arg Arg Ala Asp Glu Gln Pro Glu Thr Leu
755 760 765
Pro Pro Pro Pro Ala Ser Gln Gln Leu Ala Trp Thr Ala Thr Asp Pro
770 775 780
Ala Thr Ala His Val Arg Tyr Thr Gly Glu Gly Val Ala Gly Leu Val
785 790 795 800
Gly Phe Val Ser Gly Gln Thr Leu Asp Leu Gly Trp Leu Arg Ile Thr
805 810 815
Pro Gly Asp Thr Ser Leu Gly Gly Phe Ser Val Val Met Leu Asn Ser
820 825 830
Val Asp Gly Gln Pro Leu Gly Ala Ser Gly Arg Tyr Leu Leu Thr Thr
835 840 845
Ala Val Arg Ala Ala Asn Arg Gly Met Gly Trp Asn Ala Asp Arg Thr
850 855 860
Gly Phe Asp Lys Lys Trp Gly Ser Gly Pro Ala Gln Ala Glu Ser Ala
865 870 875 880
Pro Val Thr Leu Asp Phe Ala Ser Ala Ser Gly Val Arg Val Tyr Pro
885 890 895
Leu Asn Pro Asp Gly Thr Arg Arg Pro Glu Leu Pro Pro Ala Ser Thr
900 905 910
Pro Gly Arg Phe Glu Ala Thr Pro Ala Ser Lys Thr Leu Trp Phe Glu
915 920 925
Ile Thr Phe Pro
930
<210> 17
<211> 2763
<212> DNA
<213> 丰佑菌科细菌
<400> 17
atgatcgccc atcgccccct gtttctcgtc tgtcgcctcc tgttcagcgg actggttgcc 60
tgttgcattt ccccaaacct cctgaacgcc gcctccccgc ccggcctctt tcccttcacc 120
atcgcctggg actctccgcc caccgccgtc acggacgcca gcgtcgctga tctcaccggc 180
tggctcgacg cccccgcagg caaacacggc tacatccgcg ccgaaggctc cgacttcatc 240
accaccgaca ccggccaacg catccgtttt ctcggcgtca acctcgcctt tgccgccaat 300
ttccccgagc acgccgacgc cgaaaaactc gccgcccgcc tcgcccgcct cggcgtcaac 360
tgcgtccgct tccaccacat ggacaggacc ggtctcctgc gcaacgccgc cggtcgccgc 420
tccagcatct ggagcgaaaa cgccgacggc cagaccctcg atcccgcgca actcgaccgc 480
ctcgactacc tcttcgccca actcaaggcg cgcggcattt acgccaacat caacctccac 540
gtctcccgca cctaccccgg tttccccgcc ggctccagat accacaaggc gctcgacatg 600
tttgtccccg gcatgatcgc cctccagaaa caatacgccc gcgacctcct gcatcacaaa 660
aacaactaca ccgggctccg ctacgccgac gaccccgccg tggccatcgt cgaaatcaac 720
aacgaaaacg gagtcgttgg acgctggtgg cgcggcaacc tcgacacgct cgatccgctt 780
tacgttggcg aactcaacac ccgctggaac gcttggctca cccgcaacca cggctcacct 840
gccgccgcgc tcgtcgcctg gaaaaacgcc gccgccgccg attccacgcc caccggcccc 900
gaactcctca aaaatcaccg tctcgccaat ctcgccaaaa actggacgct ccaaaactcc 960
tccccctccc ccctgctcgc cctcgaaccg cccgccagcc ccggccccgg catcgaaccg 1020
caaggcatcg tcctgcgcgt cctccccgac gctgccaaaa actcccgcgc ctcccttttg 1080
caacccgtct ccctcaagcc cggcgcgcgc cacaccttgc gcatcaccct cgaggccgat 1140
tctcccgccg aactcatcct cgacatcaag gacgcgcgtc cgccctggcg cacccacctc 1200
tccataaaaa ttcccgccac cgacaccctt cgtaccgtcg aaaacacctt cgtctataag 1260
gaaaacgccc cggcctccgg catccgcctc gccctcaacc tccgcgccac cgccagcccc 1320
gcctcgaaca atttccgcgt tcaggaaatc tcgctccgcg aaggcggctc ctccgcgaaa 1380
ctccccgcct tcgttgacgc ggaaaacgcc aacaattccg ccaacgccgc cgcttccgcc 1440
gccgctccca cttcggcgca ccgcgccctc gcctacctcc gtcgcgacgg ctttgaaacc 1500
ttctcgcccg ccgcctgcga cgactggctc cgcttcctct gggaaaccga ggacgactac 1560
tggaccgaca tgcgcgaata cctccgccgc gacctcggca tccgctccat actcgtcggc 1620
tcacaactcg gcgcctacag cctgctcccc ctccagcaga aattcgacgc ccttgaccac 1680
cacgcctact ggcagcaccc gcaaacccag gacaacgggc gcaggatcgt ccaaaacctc 1740
tccatggtca acgagcccgg cggagcctac gccgcctcgc ccgcgtttta ccgcgctgcc 1800
ggaaagccgt atctgctcac cgaatacaat cactcgtcgc ccaacacctt tggcgcggag 1860
gccttcccca tcatctccgc ctacggcgcg ttccaggact ggagcggcat cttcgtttac 1920
tcttacgcgc acggcaccgc gccgtgggac gccggatacc agcgcggcca gttcgacatt 1980
gaccagcatc ccctcaagct tgcgaccctt cccattgccg ccgccctttt cctgcgtggc 2040
gacaccgacg cccctgcggg tgtcaccacc aaaaccacca ccatcactcc ggaggaatac 2100
ctgcgccaga tgcgccgtgt cggccccaac gtttcggcga tcaccgccgg agccacccgc 2160
accgacgccc ttcgccaccg cgtcgccttc gccctcgccg aaaacaaaag tggcgcgggc 2220
gtcccgcccg caaccgttgc cactccgtct gccggaccca tcaccaccga gggcggcgca 2280
ctcacttggg acgccgcgcc caacgcgggc attttcacca ttcgctcacc tcgcaccaag 2340
gcagccatcg gcttcgcctg cggacgctcc tttgacctcg acggcctcgt cattacgccc 2400
ggccaaaccc tccaggactg gtcaaccatt gccgtctccc aaatgagcgg cgaccgcgtc 2460
ggctctcccg gacgcgccct gctcgtcgcc tgcggctaca tcgaaaacac cgggcaaatc 2520
tggcacgacc ccgtagccaa aaacagcgtc aaggaatcgg gtcgcgcccc aacgctcgtc 2580
gagggcattc ccgcgaaaat caccctcact cccgcccccg gcgtcaccgc cgtcgaagtc 2640
tggtcgctcg acgaacacgg acgccgcgcc cgctccgtcc ccgtcacccg cgatggcccc 2700
gccgccacct ttcacatcgg acccgattac cggaccatct ggtatgaagt catcactcaa 2760
taa 2763
<210> 18
<211> 920
<212> PRT
<213> 丰佑菌科细菌
<400> 18
Met Ile Ala His Arg Pro Leu Phe Leu Val Cys Arg Leu Leu Phe Ser
1 5 10 15
Gly Leu Val Ala Cys Cys Ile Ser Pro Asn Leu Leu Asn Ala Ala Ser
20 25 30
Pro Pro Gly Leu Phe Pro Phe Thr Ile Ala Trp Asp Ser Pro Pro Thr
35 40 45
Ala Val Thr Asp Ala Ser Val Ala Asp Leu Thr Gly Trp Leu Asp Ala
50 55 60
Pro Ala Gly Lys His Gly Tyr Ile Arg Ala Glu Gly Ser Asp Phe Ile
65 70 75 80
Thr Thr Asp Thr Gly Gln Arg Ile Arg Phe Leu Gly Val Asn Leu Ala
85 90 95
Phe Ala Ala Asn Phe Pro Glu His Ala Asp Ala Glu Lys Leu Ala Ala
100 105 110
Arg Leu Ala Arg Leu Gly Val Asn Cys Val Arg Phe His His Met Asp
115 120 125
Arg Thr Gly Leu Leu Arg Asn Ala Ala Gly Arg Arg Ser Ser Ile Trp
130 135 140
Ser Glu Asn Ala Asp Gly Gln Thr Leu Asp Pro Ala Gln Leu Asp Arg
145 150 155 160
Leu Asp Tyr Leu Phe Ala Gln Leu Lys Ala Arg Gly Ile Tyr Ala Asn
165 170 175
Ile Asn Leu His Val Ser Arg Thr Tyr Pro Gly Phe Pro Ala Gly Ser
180 185 190
Arg Tyr His Lys Ala Leu Asp Met Phe Val Pro Gly Met Ile Ala Leu
195 200 205
Gln Lys Gln Tyr Ala Arg Asp Leu Leu His His Lys Asn Asn Tyr Thr
210 215 220
Gly Leu Arg Tyr Ala Asp Asp Pro Ala Val Ala Ile Val Glu Ile Asn
225 230 235 240
Asn Glu Asn Gly Val Val Gly Arg Trp Trp Arg Gly Asn Leu Asp Thr
245 250 255
Leu Asp Pro Leu Tyr Val Gly Glu Leu Asn Thr Arg Trp Asn Ala Trp
260 265 270
Leu Thr Arg Asn His Gly Ser Pro Ala Ala Ala Leu Val Ala Trp Lys
275 280 285
Asn Ala Ala Ala Ala Asp Ser Thr Pro Thr Gly Pro Glu Leu Leu Lys
290 295 300
Asn His Arg Leu Ala Asn Leu Ala Lys Asn Trp Thr Leu Gln Asn Ser
305 310 315 320
Ser Pro Ser Pro Leu Leu Ala Leu Glu Pro Pro Ala Ser Pro Gly Pro
325 330 335
Gly Ile Glu Pro Gln Gly Ile Val Leu Arg Val Leu Pro Asp Ala Ala
340 345 350
Lys Asn Ser Arg Ala Ser Leu Leu Gln Pro Val Ser Leu Lys Pro Gly
355 360 365
Ala Arg His Thr Leu Arg Ile Thr Leu Glu Ala Asp Ser Pro Ala Glu
370 375 380
Leu Ile Leu Asp Ile Lys Asp Ala Arg Pro Pro Trp Arg Thr His Leu
385 390 395 400
Ser Ile Lys Ile Pro Ala Thr Asp Thr Leu Arg Thr Val Glu Asn Thr
405 410 415
Phe Val Tyr Lys Glu Asn Ala Pro Ala Ser Gly Ile Arg Leu Ala Leu
420 425 430
Asn Leu Arg Ala Thr Ala Ser Pro Ala Ser Asn Asn Phe Arg Val Gln
435 440 445
Glu Ile Ser Leu Arg Glu Gly Gly Ser Ser Ala Lys Leu Pro Ala Phe
450 455 460
Val Asp Ala Glu Asn Ala Asn Asn Ser Ala Asn Ala Ala Ala Ser Ala
465 470 475 480
Ala Ala Pro Thr Ser Ala His Arg Ala Leu Ala Tyr Leu Arg Arg Asp
485 490 495
Gly Phe Glu Thr Phe Ser Pro Ala Ala Cys Asp Asp Trp Leu Arg Phe
500 505 510
Leu Trp Glu Thr Glu Asp Asp Tyr Trp Thr Asp Met Arg Glu Tyr Leu
515 520 525
Arg Arg Asp Leu Gly Ile Arg Ser Ile Leu Val Gly Ser Gln Leu Gly
530 535 540
Ala Tyr Ser Leu Leu Pro Leu Gln Gln Lys Phe Asp Ala Leu Asp His
545 550 555 560
His Ala Tyr Trp Gln His Pro Gln Thr Gln Asp Asn Gly Arg Arg Ile
565 570 575
Val Gln Asn Leu Ser Met Val Asn Glu Pro Gly Gly Ala Tyr Ala Ala
580 585 590
Ser Pro Ala Phe Tyr Arg Ala Ala Gly Lys Pro Tyr Leu Leu Thr Glu
595 600 605
Tyr Asn His Ser Ser Pro Asn Thr Phe Gly Ala Glu Ala Phe Pro Ile
610 615 620
Ile Ser Ala Tyr Gly Ala Phe Gln Asp Trp Ser Gly Ile Phe Val Tyr
625 630 635 640
Ser Tyr Ala His Gly Thr Ala Pro Trp Asp Ala Gly Tyr Gln Arg Gly
645 650 655
Gln Phe Asp Ile Asp Gln His Pro Leu Lys Leu Ala Thr Leu Pro Ile
660 665 670
Ala Ala Ala Leu Phe Leu Arg Gly Asp Thr Asp Ala Pro Ala Gly Val
675 680 685
Thr Thr Lys Thr Thr Thr Ile Thr Pro Glu Glu Tyr Leu Arg Gln Met
690 695 700
Arg Arg Val Gly Pro Asn Val Ser Ala Ile Thr Ala Gly Ala Thr Arg
705 710 715 720
Thr Asp Ala Leu Arg His Arg Val Ala Phe Ala Leu Ala Glu Asn Lys
725 730 735
Ser Gly Ala Gly Val Pro Pro Ala Thr Val Ala Thr Pro Ser Ala Gly
740 745 750
Pro Ile Thr Thr Glu Gly Gly Ala Leu Thr Trp Asp Ala Ala Pro Asn
755 760 765
Ala Gly Ile Phe Thr Ile Arg Ser Pro Arg Thr Lys Ala Ala Ile Gly
770 775 780
Phe Ala Cys Gly Arg Ser Phe Asp Leu Asp Gly Leu Val Ile Thr Pro
785 790 795 800
Gly Gln Thr Leu Gln Asp Trp Ser Thr Ile Ala Val Ser Gln Met Ser
805 810 815
Gly Asp Arg Val Gly Ser Pro Gly Arg Ala Leu Leu Val Ala Cys Gly
820 825 830
Tyr Ile Glu Asn Thr Gly Gln Ile Trp His Asp Pro Val Ala Lys Asn
835 840 845
Ser Val Lys Glu Ser Gly Arg Ala Pro Thr Leu Val Glu Gly Ile Pro
850 855 860
Ala Lys Ile Thr Leu Thr Pro Ala Pro Gly Val Thr Ala Val Glu Val
865 870 875 880
Trp Ser Leu Asp Glu His Gly Arg Arg Ala Arg Ser Val Pro Val Thr
885 890 895
Arg Asp Gly Pro Ala Ala Thr Phe His Ile Gly Pro Asp Tyr Arg Thr
900 905 910
Ile Trp Tyr Glu Val Ile Thr Gln
915 920
<210> 19
<211> 2535
<212> DNA
<213> Paludibacterium yongneupense
<400> 19
atgacgctac gtttgcgcgt gctgctatgc ctgtttgcag cctgcggcgc gcatgccgcc 60
gacgcaccgc tgttccccta tcatttgccc tgggatgacg cttcgctgaa cctcagtaat 120
ctgcatgcct ggaatcctgc gcctgccggg cgttccggtt ttgtcggcgt ccgcaacggg 180
catctgtacg ccgagggccg ccgcctgcgc ttgctggggg tcaactgcgt attcggcggc 240
gcgctgcccg agcatgacgt cgccgagcgc atcgccgcgc gcatggcccg cttcggcatc 300
aatgccgtcc gcttccatca tatggacacc cggccggctc cggatggcct gctgctggcg 360
gaccgcctga ccttggatcc gaaagcactc gaccgtctcg actacttcat cgcggccctg 420
aaacgggtgg gcatttacag cgatctgaat ctgcatgtcg gtcgcagcta tccggggttc 480
gcaccctgga gcgacgcgca aggcaggccg cagcctcagt actggaaggg cgtcgacctg 540
ttctacccgc ccatgatcgc gatgcagcgc gattatgccc gcaccctgct gtcgcatcgc 600
aacccgtata ccgggcatca ataccgcgac gagcccgcgc tggcgctggt cgagatcaat 660
aatgaggacg gtttgatacg ggagtggcag gatggggcgc ttgaccgtat gagcgagccc 720
tatcgttccg aattaagaca gcgctggaat cgctggctgt cggcgcatta ccggtcgacc 780
gccgagctgg cccgcgcctg gagcgcacgt gacgacgtgc agggagacga gcgcttcgat 840
acgggtggca atggctggaa tctgcaggtg gtggagccgg cgcgtgcgcg ccagcagacg 900
gagggcgacg gctcgctgcg ggtgacggtc gaggcgacag acagcgagaa ctggcatgtg 960
cagctgcacc agctgcggca aagcttcgcg gccgggcaac cctacacctt gcgactgcgg 1020
ctgcgtgccg accgtccgct gcgggtgcgg ctggcggcga tgcaggcgca cccgccctgg 1080
cagtcgctgt ggcaaacggc ggtggatgtc gacacccgat ggcgcgacta tcgttttacc 1140
tttgcccccg tcgctgggga tggtgtggcg cgttttacgc tgggcggcct cggggaacag 1200
cgctccaccc tgtggttggg catggcgagc ctgaagacag gagggcgcct gggactgctg 1260
gctggcgagt cgctcgaggg gagcggagtc gacatctttg cgcgtggcga cgagggcgcc 1320
cgcagcgcgc aggggcagcg cgactggtta cagtttctat gggacacaga aacagaatac 1380
tgggatggca tgcgtaattt tctgcgccag accgtgggcc tgcgttcctt gctgattgga 1440
acgcaggtcg ggtatagccc ggccccgatc caggcgcgga tggatgtcgt ggatggccat 1500
gcttactggc agcatccgcg ctttcccggc cggccgtggg atcccgcaga ctggagtgtg 1560
gccaatacgc ccatggcggg catcgatggc ggcggcaccc tggccgacct ggctctgcgt 1620
cgcatggccg gcaagccttt tgtcgtcacc gagtacaatc atcccgcgcc gggtgagttc 1680
gtcgccgagg gactgccgct tctggccgcc tatgccgccc tgcaggactg ggatggcgta 1740
tttgttttcg attatggtgc cggcgatcac gatccgggtt tcattgcttc gtatttcgac 1800
attcaggccg atcccggcaa gatgagtgcg ctgccggccg cggccgcctt gttccggcgc 1860
ggtgacgttg cgacgcccgg gagcgcgggc ggcgccttac cttcgcccgc ggccatgatc 1920
gaggccatgc gtgccgggaa taccatgccg gcggcggatc agtttggcac cgcgcgcaac 1980
gaagcgctga ggcggccggt cgcgctcggc agcacgcctg ccggtccgcg gccgttaccg 2040
gtgcgtgcga tcggcgggca attggtatgg ggcgaggacg gccggaagac ggtcgtgatc 2100
gacactccgc gcagcaaggg attggtcggt gccggattgg gacgggacgt cgatgccggc 2160
ggcgtgggct tgcgtctgct gcaggcccgc cacaatagcg gcgtgctgct ggccacactg 2220
atggacgggc gtgacttttc gcacccgggc cgggttctgc tgacggcgat cggaagcgag 2280
gaaaacagcg ggcagcgctg gctggacgag gcgcacacca cgctcggacg gcaatggggg 2340
caggcgccgg tatgggtcga gggtattgcc gcccgcatcg tattgccggt cgcggcggcg 2400
cgggtcggcg cctgggcgct cgacgagcgc ggacaacggc ggcaggccct gccggtggct 2460
ggcgaccacg cgcatgcggt attcgaaacc agccccggct accgcgctct ttggtatgag 2520
cttgaaatcc gctga 2535
<210> 20
<211> 844
<212> PRT
<213> Paludibacterium yongneupense
<400> 20
Met Thr Leu Arg Leu Arg Val Leu Leu Cys Leu Phe Ala Ala Cys Gly
1 5 10 15
Ala His Ala Ala Asp Ala Pro Leu Phe Pro Tyr His Leu Pro Trp Asp
20 25 30
Asp Ala Ser Leu Asn Leu Ser Asn Leu His Ala Trp Asn Pro Ala Pro
35 40 45
Ala Gly Arg Ser Gly Phe Val Gly Val Arg Asn Gly His Leu Tyr Ala
50 55 60
Glu Gly Arg Arg Leu Arg Leu Leu Gly Val Asn Cys Val Phe Gly Gly
65 70 75 80
Ala Leu Pro Glu His Asp Val Ala Glu Arg Ile Ala Ala Arg Met Ala
85 90 95
Arg Phe Gly Ile Asn Ala Val Arg Phe His His Met Asp Thr Arg Pro
100 105 110
Ala Pro Asp Gly Leu Leu Leu Ala Asp Arg Leu Thr Leu Asp Pro Lys
115 120 125
Ala Leu Asp Arg Leu Asp Tyr Phe Ile Ala Ala Leu Lys Arg Val Gly
130 135 140
Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg Ser Tyr Pro Gly Phe
145 150 155 160
Ala Pro Trp Ser Asp Ala Gln Gly Arg Pro Gln Pro Gln Tyr Trp Lys
165 170 175
Gly Val Asp Leu Phe Tyr Pro Pro Met Ile Ala Met Gln Arg Asp Tyr
180 185 190
Ala Arg Thr Leu Leu Ser His Arg Asn Pro Tyr Thr Gly His Gln Tyr
195 200 205
Arg Asp Glu Pro Ala Leu Ala Leu Val Glu Ile Asn Asn Glu Asp Gly
210 215 220
Leu Ile Arg Glu Trp Gln Asp Gly Ala Leu Asp Arg Met Ser Glu Pro
225 230 235 240
Tyr Arg Ser Glu Leu Arg Gln Arg Trp Asn Arg Trp Leu Ser Ala His
245 250 255
Tyr Arg Ser Thr Ala Glu Leu Ala Arg Ala Trp Ser Ala Arg Asp Asp
260 265 270
Val Gln Gly Asp Glu Arg Phe Asp Thr Gly Gly Asn Gly Trp Asn Leu
275 280 285
Gln Val Val Glu Pro Ala Arg Ala Arg Gln Gln Thr Glu Gly Asp Gly
290 295 300
Ser Leu Arg Val Thr Val Glu Ala Thr Asp Ser Glu Asn Trp His Val
305 310 315 320
Gln Leu His Gln Leu Arg Gln Ser Phe Ala Ala Gly Gln Pro Tyr Thr
325 330 335
Leu Arg Leu Arg Leu Arg Ala Asp Arg Pro Leu Arg Val Arg Leu Ala
340 345 350
Ala Met Gln Ala His Pro Pro Trp Gln Ser Leu Trp Gln Thr Ala Val
355 360 365
Asp Val Asp Thr Arg Trp Arg Asp Tyr Arg Phe Thr Phe Ala Pro Val
370 375 380
Ala Gly Asp Gly Val Ala Arg Phe Thr Leu Gly Gly Leu Gly Glu Gln
385 390 395 400
Arg Ser Thr Leu Trp Leu Gly Met Ala Ser Leu Lys Thr Gly Gly Arg
405 410 415
Leu Gly Leu Leu Ala Gly Glu Ser Leu Glu Gly Ser Gly Val Asp Ile
420 425 430
Phe Ala Arg Gly Asp Glu Gly Ala Arg Ser Ala Gln Gly Gln Arg Asp
435 440 445
Trp Leu Gln Phe Leu Trp Asp Thr Glu Thr Glu Tyr Trp Asp Gly Met
450 455 460
Arg Asn Phe Leu Arg Gln Thr Val Gly Leu Arg Ser Leu Leu Ile Gly
465 470 475 480
Thr Gln Val Gly Tyr Ser Pro Ala Pro Ile Gln Ala Arg Met Asp Val
485 490 495
Val Asp Gly His Ala Tyr Trp Gln His Pro Arg Phe Pro Gly Arg Pro
500 505 510
Trp Asp Pro Ala Asp Trp Ser Val Ala Asn Thr Pro Met Ala Gly Ile
515 520 525
Asp Gly Gly Gly Thr Leu Ala Asp Leu Ala Leu Arg Arg Met Ala Gly
530 535 540
Lys Pro Phe Val Val Thr Glu Tyr Asn His Pro Ala Pro Gly Glu Phe
545 550 555 560
Val Ala Glu Gly Leu Pro Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp
565 570 575
Trp Asp Gly Val Phe Val Phe Asp Tyr Gly Ala Gly Asp His Asp Pro
580 585 590
Gly Phe Ile Ala Ser Tyr Phe Asp Ile Gln Ala Asp Pro Gly Lys Met
595 600 605
Ser Ala Leu Pro Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ala
610 615 620
Thr Pro Gly Ser Ala Gly Gly Ala Leu Pro Ser Pro Ala Ala Met Ile
625 630 635 640
Glu Ala Met Arg Ala Gly Asn Thr Met Pro Ala Ala Asp Gln Phe Gly
645 650 655
Thr Ala Arg Asn Glu Ala Leu Arg Arg Pro Val Ala Leu Gly Ser Thr
660 665 670
Pro Ala Gly Pro Arg Pro Leu Pro Val Arg Ala Ile Gly Gly Gln Leu
675 680 685
Val Trp Gly Glu Asp Gly Arg Lys Thr Val Val Ile Asp Thr Pro Arg
690 695 700
Ser Lys Gly Leu Val Gly Ala Gly Leu Gly Arg Asp Val Asp Ala Gly
705 710 715 720
Gly Val Gly Leu Arg Leu Leu Gln Ala Arg His Asn Ser Gly Val Leu
725 730 735
Leu Ala Thr Leu Met Asp Gly Arg Asp Phe Ser His Pro Gly Arg Val
740 745 750
Leu Leu Thr Ala Ile Gly Ser Glu Glu Asn Ser Gly Gln Arg Trp Leu
755 760 765
Asp Glu Ala His Thr Thr Leu Gly Arg Gln Trp Gly Gln Ala Pro Val
770 775 780
Trp Val Glu Gly Ile Ala Ala Arg Ile Val Leu Pro Val Ala Ala Ala
785 790 795 800
Arg Val Gly Ala Trp Ala Leu Asp Glu Arg Gly Gln Arg Arg Gln Ala
805 810 815
Leu Pro Val Ala Gly Asp His Ala His Ala Val Phe Glu Thr Ser Pro
820 825 830
Gly Tyr Arg Ala Leu Trp Tyr Glu Leu Glu Ile Arg
835 840
<210> 21
<211> 2550
<212> DNA
<213> 迪克亚杆菌属物种
<400> 21
atgatgcgaa tccgtagggt agtactggcg ctggcgttgt ctctgacctt ccccgctatc 60
gccggtgagc tgtttccctt tactttgccg ctggatgtcc gctccgacgg cagccttacc 120
gacctttcgt catggaacga caaaccggca ggcgcacgcg ggtttgtgac ggtcgacggc 180
agccacctga cagttggcgg caaacggctg cgattcctcg gcgttaatat cgtctttggt 240
tcgaccgcgc cgacacatgc cgacacagac gctatcgccc gccgcctggc acgcttcggc 300
atcaatctgg tgcgttttca tctgatggac gcccgccctg cgcccgacgg catcctgcag 360
cgcgatctgc gcacccttga cccagacacc ctcgaccgcg tcgattattt tatctcgacg 420
ctggcgcgag aaggcatcta cgccgatctc aacttgcacg tcggccgaca atatcccggc 480
atgggagaga gttgggcgga tgggcccaaa tactggaaag gcgtcgacct gttttatccg 540
ccgatgtttg tacagcagca ggagtatgcc cgcgccctgc tgacgcaccg caatccttac 600
accggtcatc gctatactga agaacccgcc gtggcgttcg tcgagatcaa taacgaagac 660
ggattgatcc gggaatggcg gtctggctcg ctcgacatga tgcccgcgcc gtttcgcact 720
gagctcgccc gccaatggcg tgtctggctc ggacatcgtt atgctggtga cgacgcgtta 780
cgcgcgggct ggggcgtgcg ggaagagcct tacggcgcgg aaatgctgtc agagcggatc 840
gggtcgaaaa gcagcgaccc aggctgggtg ctgcaaaccc ttggcggcgc caacgcgacg 900
ctcgccacaa cagattccgg actgatgctg tcgatgacga caccggggca gctcggctgg 960
catacgcagt tgcactacaa tcacctctcg ttccagaccc gccacgccta tacattgtcg 1020
ctccggttac gtgccgatca cccgctgacg ctgtccgtac aggcgatgca atcgcacgcc 1080
ccctggcaaa cgttgtggtc gcagaaaatc ccggtcggca ccgactggca ggatgtcacg 1140
gtgacattta tgccgcagca ggacgacgcg acggcacggc tcacactggg tggcctcggg 1200
ctggataccg gtcgtctgga tatcgcccat gcgcggcttc gtaccggcgg gttgctcgga 1260
ctacaacccg gcgaaagcct cacgcacggc acgctcgata tcattccgtt tgcctcccgg 1320
ttgaaccgaa ccgtcgcggc acagcgcgac tggctgagtt ttctgtggga caccgaagcg 1380
cagtattggc gaagcatgcg ggactttctg aaaggtgaac tgggcgtacg ctcgccagtc 1440
atcggaacgc aggtctccta cagcccggcg gccatccagc agacgctgga cgtggttgac 1500
ggccacgcct actggcagca cccgcgtttt ccgggcaaac cctgggatcg caacaactgg 1560
tttatcggca actcgccaat ggccggtatt cccggcggcg gcacgcttgc cgacctagca 1620
ttgcatcgtg tccccggcaa gccgtttatc gtcagcgagt acaaccatcc tgcgcccagc 1680
ctctggcaag gcgaggcgat gccgctggcc gccgcctatg gcgccctgca ggactgggat 1740
ggcatcgccg tttacaacta tggcgccagt aagcgtaact ggcaggccga ctttatcacc 1800
gactacttcg acagcgtcgc taacccggtc aagatgacca gtctggtggc tgccgccgcg 1860
ctgctgcggc gtgaggatgt gcgcgccgac aagccgcaac cacagccgat gccggatcgc 1920
accgtcttta tcgacgcgct gcgtcagggc ggccgcctgc cgggtgcgga cagcctgggc 1980
gcgccacgtg acgccgcgct ggcgggatgg gtcagcatcg ccacgccagc gggcgaaccg 2040
ccgtcatggc cggtacgtag ccgcaccggg caactgatct ggggtgtgga cggcatcggc 2100
ggcaaaaccg tggtggtcga tacgccgcgc agtaaagggc ttatcggcgc ccggctcggt 2160
caggtttatg acgcgcacgg cgtcgggctg gaagtgacgg cggcgcgcaa cgactgggga 2220
gtcctgctgg cgaccgtact ggacgggcag agtttcaccg cgccgagccg cattctgctg 2280
acgacgctgg ggcaggagga aaacaccggc cagcgctggc ttgatgccgc aaaaaccacc 2340
attggcagcc atttcggcac cggcccggtg ctggtcgaag gcatcggcgc ccgcatcacc 2400
ctgccggttg cgccgtcccg ggtcagcgcc tgggcgcttg acgcgcgcgg ccagcggcag 2460
acgccgatac cggtcggcgg cacgcaacat gccacactgg acgtcgatga gcgctatcgt 2520
actctgtggt atgaaatcga cattcgataa 2550
<210> 22
<211> 849
<212> PRT
<213> 迪克亚杆菌属物种
<400> 22
Met Met Arg Ile Arg Arg Val Val Leu Ala Leu Ala Leu Ser Leu Thr
1 5 10 15
Phe Pro Ala Ile Ala Gly Glu Leu Phe Pro Phe Thr Leu Pro Leu Asp
20 25 30
Val Arg Ser Asp Gly Ser Leu Thr Asp Leu Ser Ser Trp Asn Asp Lys
35 40 45
Pro Ala Gly Ala Arg Gly Phe Val Thr Val Asp Gly Ser His Leu Thr
50 55 60
Val Gly Gly Lys Arg Leu Arg Phe Leu Gly Val Asn Ile Val Phe Gly
65 70 75 80
Ser Thr Ala Pro Thr His Ala Asp Thr Asp Ala Ile Ala Arg Arg Leu
85 90 95
Ala Arg Phe Gly Ile Asn Leu Val Arg Phe His Leu Met Asp Ala Arg
100 105 110
Pro Ala Pro Asp Gly Ile Leu Gln Arg Asp Leu Arg Thr Leu Asp Pro
115 120 125
Asp Thr Leu Asp Arg Val Asp Tyr Phe Ile Ser Thr Leu Ala Arg Glu
130 135 140
Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Arg Gln Tyr Pro Gly
145 150 155 160
Met Gly Glu Ser Trp Ala Asp Gly Pro Lys Tyr Trp Lys Gly Val Asp
165 170 175
Leu Phe Tyr Pro Pro Met Phe Val Gln Gln Gln Glu Tyr Ala Arg Ala
180 185 190
Leu Leu Thr His Arg Asn Pro Tyr Thr Gly His Arg Tyr Thr Glu Glu
195 200 205
Pro Ala Val Ala Phe Val Glu Ile Asn Asn Glu Asp Gly Leu Ile Arg
210 215 220
Glu Trp Arg Ser Gly Ser Leu Asp Met Met Pro Ala Pro Phe Arg Thr
225 230 235 240
Glu Leu Ala Arg Gln Trp Arg Val Trp Leu Gly His Arg Tyr Ala Gly
245 250 255
Asp Asp Ala Leu Arg Ala Gly Trp Gly Val Arg Glu Glu Pro Tyr Gly
260 265 270
Ala Glu Met Leu Ser Glu Arg Ile Gly Ser Lys Ser Ser Asp Pro Gly
275 280 285
Trp Val Leu Gln Thr Leu Gly Gly Ala Asn Ala Thr Leu Ala Thr Thr
290 295 300
Asp Ser Gly Leu Met Leu Ser Met Thr Thr Pro Gly Gln Leu Gly Trp
305 310 315 320
His Thr Gln Leu His Tyr Asn His Leu Ser Phe Gln Thr Arg His Ala
325 330 335
Tyr Thr Leu Ser Leu Arg Leu Arg Ala Asp His Pro Leu Thr Leu Ser
340 345 350
Val Gln Ala Met Gln Ser His Ala Pro Trp Gln Thr Leu Trp Ser Gln
355 360 365
Lys Ile Pro Val Gly Thr Asp Trp Gln Asp Val Thr Val Thr Phe Met
370 375 380
Pro Gln Gln Asp Asp Ala Thr Ala Arg Leu Thr Leu Gly Gly Leu Gly
385 390 395 400
Leu Asp Thr Gly Arg Leu Asp Ile Ala His Ala Arg Leu Arg Thr Gly
405 410 415
Gly Leu Leu Gly Leu Gln Pro Gly Glu Ser Leu Thr His Gly Thr Leu
420 425 430
Asp Ile Ile Pro Phe Ala Ser Arg Leu Asn Arg Thr Val Ala Ala Gln
435 440 445
Arg Asp Trp Leu Ser Phe Leu Trp Asp Thr Glu Ala Gln Tyr Trp Arg
450 455 460
Ser Met Arg Asp Phe Leu Lys Gly Glu Leu Gly Val Arg Ser Pro Val
465 470 475 480
Ile Gly Thr Gln Val Ser Tyr Ser Pro Ala Ala Ile Gln Gln Thr Leu
485 490 495
Asp Val Val Asp Gly His Ala Tyr Trp Gln His Pro Arg Phe Pro Gly
500 505 510
Lys Pro Trp Asp Arg Asn Asn Trp Phe Ile Gly Asn Ser Pro Met Ala
515 520 525
Gly Ile Pro Gly Gly Gly Thr Leu Ala Asp Leu Ala Leu His Arg Val
530 535 540
Pro Gly Lys Pro Phe Ile Val Ser Glu Tyr Asn His Pro Ala Pro Ser
545 550 555 560
Leu Trp Gln Gly Glu Ala Met Pro Leu Ala Ala Ala Tyr Gly Ala Leu
565 570 575
Gln Asp Trp Asp Gly Ile Ala Val Tyr Asn Tyr Gly Ala Ser Lys Arg
580 585 590
Asn Trp Gln Ala Asp Phe Ile Thr Asp Tyr Phe Asp Ser Val Ala Asn
595 600 605
Pro Val Lys Met Thr Ser Leu Val Ala Ala Ala Ala Leu Leu Arg Arg
610 615 620
Glu Asp Val Arg Ala Asp Lys Pro Gln Pro Gln Pro Met Pro Asp Arg
625 630 635 640
Thr Val Phe Ile Asp Ala Leu Arg Gln Gly Gly Arg Leu Pro Gly Ala
645 650 655
Asp Ser Leu Gly Ala Pro Arg Asp Ala Ala Leu Ala Gly Trp Val Ser
660 665 670
Ile Ala Thr Pro Ala Gly Glu Pro Pro Ser Trp Pro Val Arg Ser Arg
675 680 685
Thr Gly Gln Leu Ile Trp Gly Val Asp Gly Ile Gly Gly Lys Thr Val
690 695 700
Val Val Asp Thr Pro Arg Ser Lys Gly Leu Ile Gly Ala Arg Leu Gly
705 710 715 720
Gln Val Tyr Asp Ala His Gly Val Gly Leu Glu Val Thr Ala Ala Arg
725 730 735
Asn Asp Trp Gly Val Leu Leu Ala Thr Val Leu Asp Gly Gln Ser Phe
740 745 750
Thr Ala Pro Ser Arg Ile Leu Leu Thr Thr Leu Gly Gln Glu Glu Asn
755 760 765
Thr Gly Gln Arg Trp Leu Asp Ala Ala Lys Thr Thr Ile Gly Ser His
770 775 780
Phe Gly Thr Gly Pro Val Leu Val Glu Gly Ile Gly Ala Arg Ile Thr
785 790 795 800
Leu Pro Val Ala Pro Ser Arg Val Ser Ala Trp Ala Leu Asp Ala Arg
805 810 815
Gly Gln Arg Gln Thr Pro Ile Pro Val Gly Gly Thr Gln His Ala Thr
820 825 830
Leu Asp Val Asp Glu Arg Tyr Arg Thr Leu Trp Tyr Glu Ile Asp Ile
835 840 845
Arg
<210> 23
<211> 2712
<212> DNA
<213> 闪烁杆菌属细菌
<400> 23
atgcggtggt ggatgttggt catcttggcg ttcatctctg gctttggggg ttggtggact 60
atgaggcaag ggttatcgca ggaaggcaaa caggatgcct tgcttttccc tttcgtttta 120
ccttgggacg atgcttctcc atcggtcacc aacatcagtc actggttgca caaacctgcg 180
ggcaagtttg ggcacatccg tatcggcgct gacggtcgcc tttacgctgg caagcagcga 240
attcgtttcc tgggcgtgaa cttgtgtttc ggggcatgtt tcccgcgcaa agaggactct 300
gaaaaaattg cggcaaggat ggcgaagttc ggcatcaaca ttgttcgctt ccaccacatg 360
gacatgcaag aatttcccaa tggcatccgc cgtcggggcg tcccccacac ccgcgacctt 420
gacccagaag cccttgacag acttgactac ctgattgccc aactgaaacg caacggcatc 480
tatgtcaact tgaacttgct cgtttctcgc cccttcaatg ctgccgacgg tttgcccaaa 540
gaaattgagc aactcggatg gaaggagcga cacatcgttg gcttcttcta cgagccatgt 600
cttgagttgc aaaaggaata tgctcgcaag ttgctgacgc accgcaatcc ttacacgggg 660
ctcacctatg ctgaagaccc tgtcgtcgct ttcgtggaaa tcaacaacga gaacggtctc 720
attcacgctt ggcttagtgg ctctattgac cggatgccaa aagtttttca ggatgagttg 780
caacggcagt ggcatgcttg gctgaaagcc cgatacggca caacggagaa gttgcgcaaa 840
gcgtggggtg tcaaggaaga gcccttgggc aatgaaatgc tgaggaacac gaactttgag 900
gcagggttgc aaaattgggt tttggagcga cacgcgggtg ctgaagcaac agcggaagtt 960
gtcgctgaac ccatccctga acttaaaggt cttcgcttcg tccgcattaa tgtcacaaaa 1020
ctgggacagg caggctggca tgtccaattc catcaaccga acttgaaagt tcaacctgat 1080
cgcccataca cactttcgtt ctgggcgcga gcggaacgac cttgcaccat ttcagtcgga 1140
atttcgcaag cccacgaacc ttggcagaac cttggcttca gtgccgaagt caaattgaca 1200
caggaatggc gtgaatatcg gttcaccttc attctcaaca ggggtgacga caacgctcgc 1260
gttatcttca gcaacttggg cgctcaaacg acaacttact ggttcgccgc cccctccctt 1320
cgccctggcg gaattgttgg cttggcagtc aacgagcgcc ttgaagatgg cactgtcccg 1380
attttccttc gcggtcgttt cggtgagcgc acacccgaag cacaacggga ctggatgcga 1440
tttttgtggg agacggaaga tcgctattgg caaacaatct accgctacct caaggacgag 1500
ttgaaagtca aggcattggt catcggcaca atcgtcggat gcagcacacc caacatgatg 1560
gcaaaacttg actgcgtgga cacacacgct tattggcaac atccgatgtt tccctcccga 1620
ccatgggacc ctgaggattg gattgtgcct aaccgaacga tggtcaacga acgaggcggg 1680
actttgcctg gcttagcatt gcgacgggtt ttgggcaaac cccattcttg caccgaatac 1740
aaccaccccg caccaaacac atacagcagc gaagccttcc ttttgctggc agcatatgca 1800
gccttgcagg attgggatgc catctatgcc ttcagttact cgcaccgacg agatggttgg 1860
gacttaaggc gcattcccaa cttctttgac attgaccaac atcccacgaa gatggttacc 1920
cttatccctg cagcagcgat gtttgttcgg ggcgatgtga aacctgccaa gcagcaagtg 1980
gttgtcaagt tgacgaaaga gcaagaagtt gacttgttgc ggcgcagttg ggcttggtta 2040
ctcgtccacg caggtcatgt cggagttcct aacgaagcag cactcgtcca tcgggttgca 2100
attgcgacag atgggaagcg agttccgcca actgctctca agcccgaaca agtgaaaatt 2160
gacggcaacc gatttgtgtc cgatactggc gaattgattt gggacttgac ggaaaaaggg 2220
cgcggggttg ttatcgttaa tgcccagaac agcaaagccg ttatcgggtt cgcaggtggc 2280
aagcggtttg agttgagcag cgtcgtgatt gaacctgggc aaactatgca agacggttgg 2340
tgcgccatca cactcaccgt catggacggc tccttgccaa ctcgcccctc gtcccgcgtc 2400
cctcgtcccg tccgtttgct catcacggca acaggctatg cggagaacac cgacatgggt 2460
tggaaggaag tgcctggtta cccacccaaa tcaagttgcg gtcgcaactg gggcaaacca 2520
ccttcgttgg tggaaggcat ctttgccagc atcaccttgc cgttacccgc caagcgagtg 2580
caagcgtggg ctttggacga acggggtcaa cggaaatccc aaatcccagt cactgccgac 2640
ccatcaggca acgccgtcat ccgcatcagt ccccaatggc aaacgctttg gtatgaagtt 2700
gaggcgcggt aa 2712
<210> 24
<211> 903
<212> PRT
<213> 闪烁杆菌属细菌
<400> 24
Met Arg Trp Trp Met Leu Val Ile Leu Ala Phe Ile Ser Gly Phe Gly
1 5 10 15
Gly Trp Trp Thr Met Arg Gln Gly Leu Ser Gln Glu Gly Lys Gln Asp
20 25 30
Ala Leu Leu Phe Pro Phe Val Leu Pro Trp Asp Asp Ala Ser Pro Ser
35 40 45
Val Thr Asn Ile Ser His Trp Leu His Lys Pro Ala Gly Lys Phe Gly
50 55 60
His Ile Arg Ile Gly Ala Asp Gly Arg Leu Tyr Ala Gly Lys Gln Arg
65 70 75 80
Ile Arg Phe Leu Gly Val Asn Leu Cys Phe Gly Ala Cys Phe Pro Arg
85 90 95
Lys Glu Asp Ser Glu Lys Ile Ala Ala Arg Met Ala Lys Phe Gly Ile
100 105 110
Asn Ile Val Arg Phe His His Met Asp Met Gln Glu Phe Pro Asn Gly
115 120 125
Ile Arg Arg Arg Gly Val Pro His Thr Arg Asp Leu Asp Pro Glu Ala
130 135 140
Leu Asp Arg Leu Asp Tyr Leu Ile Ala Gln Leu Lys Arg Asn Gly Ile
145 150 155 160
Tyr Val Asn Leu Asn Leu Leu Val Ser Arg Pro Phe Asn Ala Ala Asp
165 170 175
Gly Leu Pro Lys Glu Ile Glu Gln Leu Gly Trp Lys Glu Arg His Ile
180 185 190
Val Gly Phe Phe Tyr Glu Pro Cys Leu Glu Leu Gln Lys Glu Tyr Ala
195 200 205
Arg Lys Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr Tyr Ala
210 215 220
Glu Asp Pro Val Val Ala Phe Val Glu Ile Asn Asn Glu Asn Gly Leu
225 230 235 240
Ile His Ala Trp Leu Ser Gly Ser Ile Asp Arg Met Pro Lys Val Phe
245 250 255
Gln Asp Glu Leu Gln Arg Gln Trp His Ala Trp Leu Lys Ala Arg Tyr
260 265 270
Gly Thr Thr Glu Lys Leu Arg Lys Ala Trp Gly Val Lys Glu Glu Pro
275 280 285
Leu Gly Asn Glu Met Leu Arg Asn Thr Asn Phe Glu Ala Gly Leu Gln
290 295 300
Asn Trp Val Leu Glu Arg His Ala Gly Ala Glu Ala Thr Ala Glu Val
305 310 315 320
Val Ala Glu Pro Ile Pro Glu Leu Lys Gly Leu Arg Phe Val Arg Ile
325 330 335
Asn Val Thr Lys Leu Gly Gln Ala Gly Trp His Val Gln Phe His Gln
340 345 350
Pro Asn Leu Lys Val Gln Pro Asp Arg Pro Tyr Thr Leu Ser Phe Trp
355 360 365
Ala Arg Ala Glu Arg Pro Cys Thr Ile Ser Val Gly Ile Ser Gln Ala
370 375 380
His Glu Pro Trp Gln Asn Leu Gly Phe Ser Ala Glu Val Lys Leu Thr
385 390 395 400
Gln Glu Trp Arg Glu Tyr Arg Phe Thr Phe Ile Leu Asn Arg Gly Asp
405 410 415
Asp Asn Ala Arg Val Ile Phe Ser Asn Leu Gly Ala Gln Thr Thr Thr
420 425 430
Tyr Trp Phe Ala Ala Pro Ser Leu Arg Pro Gly Gly Ile Val Gly Leu
435 440 445
Ala Val Asn Glu Arg Leu Glu Asp Gly Thr Val Pro Ile Phe Leu Arg
450 455 460
Gly Arg Phe Gly Glu Arg Thr Pro Glu Ala Gln Arg Asp Trp Met Arg
465 470 475 480
Phe Leu Trp Glu Thr Glu Asp Arg Tyr Trp Gln Thr Ile Tyr Arg Tyr
485 490 495
Leu Lys Asp Glu Leu Lys Val Lys Ala Leu Val Ile Gly Thr Ile Val
500 505 510
Gly Cys Ser Thr Pro Asn Met Met Ala Lys Leu Asp Cys Val Asp Thr
515 520 525
His Ala Tyr Trp Gln His Pro Met Phe Pro Ser Arg Pro Trp Asp Pro
530 535 540
Glu Asp Trp Ile Val Pro Asn Arg Thr Met Val Asn Glu Arg Gly Gly
545 550 555 560
Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Leu Gly Lys Pro His Ser
565 570 575
Cys Thr Glu Tyr Asn His Pro Ala Pro Asn Thr Tyr Ser Ser Glu Ala
580 585 590
Phe Leu Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp Trp Asp Ala Ile
595 600 605
Tyr Ala Phe Ser Tyr Ser His Arg Arg Asp Gly Trp Asp Leu Arg Arg
610 615 620
Ile Pro Asn Phe Phe Asp Ile Asp Gln His Pro Thr Lys Met Val Thr
625 630 635 640
Leu Ile Pro Ala Ala Ala Met Phe Val Arg Gly Asp Val Lys Pro Ala
645 650 655
Lys Gln Gln Val Val Val Lys Leu Thr Lys Glu Gln Glu Val Asp Leu
660 665 670
Leu Arg Arg Ser Trp Ala Trp Leu Leu Val His Ala Gly His Val Gly
675 680 685
Val Pro Asn Glu Ala Ala Leu Val His Arg Val Ala Ile Ala Thr Asp
690 695 700
Gly Lys Arg Val Pro Pro Thr Ala Leu Lys Pro Glu Gln Val Lys Ile
705 710 715 720
Asp Gly Asn Arg Phe Val Ser Asp Thr Gly Glu Leu Ile Trp Asp Leu
725 730 735
Thr Glu Lys Gly Arg Gly Val Val Ile Val Asn Ala Gln Asn Ser Lys
740 745 750
Ala Val Ile Gly Phe Ala Gly Gly Lys Arg Phe Glu Leu Ser Ser Val
755 760 765
Val Ile Glu Pro Gly Gln Thr Met Gln Asp Gly Trp Cys Ala Ile Thr
770 775 780
Leu Thr Val Met Asp Gly Ser Leu Pro Thr Arg Pro Ser Ser Arg Val
785 790 795 800
Pro Arg Pro Val Arg Leu Leu Ile Thr Ala Thr Gly Tyr Ala Glu Asn
805 810 815
Thr Asp Met Gly Trp Lys Glu Val Pro Gly Tyr Pro Pro Lys Ser Ser
820 825 830
Cys Gly Arg Asn Trp Gly Lys Pro Pro Ser Leu Val Glu Gly Ile Phe
835 840 845
Ala Ser Ile Thr Leu Pro Leu Pro Ala Lys Arg Val Gln Ala Trp Ala
850 855 860
Leu Asp Glu Arg Gly Gln Arg Lys Ser Gln Ile Pro Val Thr Ala Asp
865 870 875 880
Pro Ser Gly Asn Ala Val Ile Arg Ile Ser Pro Gln Trp Gln Thr Leu
885 890 895
Trp Tyr Glu Val Glu Ala Arg
900
<210> 25
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 25
atgtttttgt ttatctcaac gcactcacca cgcctgtgcc tgtaccgggc acttctcttt 60
ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gctttgcgca atcaccgata 120
aagtctttca cgcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggaacg 180
ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240
atcgattccg atgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300
attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgctta 360
gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420
ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480
ctcgattact ttattgccgc tctaaaattg cgtggaatct acagcaatat aaacctgctt 540
accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600
aaggcgcggc agatgctcgg cgcgatttcg catgcggttc gcaatctgga aaaagcctac 660
gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc tggcataccg gacagacccg 720
gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780
aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840
ttgactcgca agtataaaga tcagaatgca ctcgagcgcg cttggcaggt gattgataaa 900
cctctgggta acaatctgtt aaaaaatgcg aattttgtgg ccgggttaca ggggtggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc tggtttgcgt 1020
attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaatttacct 1080
gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140
aaaattacac cgctggtgat gcagcgtgcg gaaccctggc tggtggttga atcgtttcct 1200
gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260
caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320
gatctgcgct tgcagcccgg cgggaccgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380
cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440
tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500
gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620
cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680
tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740
gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800
gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttctta cgaccagggg 1860
gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980
cagggcaaac gctggttgaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040
ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100
catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160
gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220
cagggcaggg tgacaataaa cacggcgaaa tctgctggcg tagtgggctt tattgcagat 2280
caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340
agttggatga tcactgcaca agagggaagt ttgcaggatc ttgccccagg cgcatcgctg 2400
ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gttggaacga cgcgcataat 2460
tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ctttagtctc 2520
acgctgccag ttgcttccag gcgggtaaat gcctggtgtc tggatgagcg tgggcagcga 2580
ttgcaggcgt tgaaggtcga gcaaacagcc acgggcagtc gtatcgacgt ggatagcaaa 2640
gcgcgaacat tgtggtatga gatagccatc gcccccaaaa tctaa 2685
<210> 26
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 26
Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Cys Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu
20 25 30
Glu Arg Phe Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu
35 40 45
Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Thr Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp
100 105 110
Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser His Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu
210 215 220
Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Thr Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln
275 280 285
Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Lys Ile Thr Pro
370 375 380
Leu Val Met Gln Arg Ala Glu Pro Trp Leu Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His
405 410 415
Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met
485 490 495
His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg
660 665 670
Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile
690 695 700
Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr
725 730 735
Ser Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu
755 760 765
Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg
835 840 845
Val Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu Gln Ala Leu
850 855 860
Lys Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile
885 890
<210> 27
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 27
atgttttggt ttacctctgc gtactcgcga agcttgtgtc tgtaccgggc acttctgttt 60
ccggtgttgc tcttctgtgt tgatgctccg gcagcagagc gtctttcgca accaccaaca 120
aaatcggtaa atcacacagg gttagcaccg ttcgtgcttc ccttcgacga tgatggtacg 180
ggtattaccg cttttaataa cggatcgcac cagcgagggg aggggcttgc tccgctcact 240
atcgattccg ccggacattt ctccgtcgcc gggaataggt ttaggctttg gggcgtaaat 300
ataacggggg actccgcctt cccctcacac aaggatgcgg aaaaagttgc cggacgttta 360
gcaaaattcg gcgtgaacat tgttcggttt catcatttgg acaataactg gggtggtgcg 420
ggcctaattg attatcgacg gggagactcc cgtcatttga gtaaggaaaa tctcgataag 480
ctcgattatt ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540
actgcgcgcg aatttttacc tgctgacgga ttgcctgcat cgattactca aatcgattgg 600
aaggcgcggc aaatgctcgg cgcgatttct ccctcggtcc gcaatttgga aaaagcctac 660
gcgaaacaaa ttctgaagca tgtaaatccg tacacgcgcc tggcgtaccg ggtagatccg 720
gccatcgcat ttgttgaaat aaacaatgaa aacagcctgt ttcaacagtt ttttgacggc 780
aatatagacc gctggccgga agcgtttagt cagccactgg cgcaagagtg gaatgcttgg 840
ttggctcgca agtataaaga tcacgctgca ctcgagcgtg cctggcaggt gattgataaa 900
cctctgggca acaatctgtt aaaaaatgcg gattttgtgg cgggcttaca gggttggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gccaatccgc tcgcatccgc tggtttgcgt 1020
atccaaatag ataccgtagg gcctgcgtta tggaacattc aactttccca aaacttacct 1080
gaactcaaag acggtgagat ttacacattg tcgtttgccg cacgctcgca gtcgcacagc 1140
agaattacac ctctgctgat gcagagtgtg gaaccctggc aggtggtcga atccttccct 1200
gtgaagctcg attctgaatg gcgggaattc aggtttcagt atgtgcatac tggatcagcg 1260
caaccgttgc gcttaacgtt gggtgaattg ggttcggtaa taggggcaat agatgttagg 1320
gatcttcgcc tgcagtctgg cggaactgtc ggtgaacttg ctaagaacca gactctcgaa 1380
cgccgttcta taggattaaa ccgtaacgat gaatcctatc tcgcgcagcg gcgggaagac 1440
tggtttgcat ttttgtacag ccttgagctg gcgtactggc aggatatgca cagctatttg 1500
gctgatgaac tcaaggttaa aaacaatatt tatgggacta tcgcgagctt gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttt 1620
cccgctggag cctgggatgc acagcagtgg agtgtcgata tgtcgtccat ggttaacgcc 1680
ttcccaaaca acacgttaag cgctctggcg cgccagcgcg tggccgggct gccttttgta 1740
gtctctgaat atcagcatgc tatgccaaat ccctattctg cagaaggccc gctgctggta 1800
gcggcctatg cgggtttgca ggattgggat ggcgtttatc tgttttcgta cgatcagggg 1860
gaactgggtt ggcaacagga atttatcgac ggattcttta aaactaattt gaacccagcg 1920
gcaatggtta attttgccgt cggcgggaat ctgtttcgac gtggagatgt gcagcctgcg 1980
cagggcaaac gctggttaaa tttttctcga tccggcgagc tcgcacaaat tacaaacgcc 2040
ggtgcatctt ggagtgtgag tccggcggac ttccctccgg aatggcgtgg ctacgctttt 2100
cacgagcaaa tgggcttgca gttgggtatg tcaacgacgg agtctaaacc gccggtgctt 2160
gatgttaaca aagtgactgc cgagacgggc gaactcagtt gggatacaac tagccaagcg 2220
cagggtaggg tgacaataaa cacagaaaaa tccgctggcg tagtgggctt tgttgcagat 2280
caacacttcc agctcggtgc gttggggttg accttgggcg atctacagat gggctgggcc 2340
agctggatgg tcactgcgca agagggtagt ttgcaggatc ttgcagcagg cgcttcgctg 2400
ttggcagttg cgaccgcaaa aattgaaaac agtaaaatgc gctggaacga cgctcataat 2460
tcgctcggcc gcaattgggg tgaagcgccg acgagggttg aagttgtgcc ttttagtctc 2520
tcgttgccaa ttgctgccag gcgggttagt gcctggtgtt tggatgagcg tggtcagcga 2580
atgcggtcgt tgaaggttgt gcaaacagcg acaggcagtc gtatcgatgt ggatagcaaa 2640
gcgcgaacat tatggtacga gatcgtcata accccgaaaa tataa 2685
<210> 28
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 28
Met Phe Trp Phe Thr Ser Ala Tyr Ser Arg Ser Leu Cys Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Val Leu Leu Phe Cys Val Asp Ala Pro Ala Ala
20 25 30
Glu Arg Leu Ser Gln Pro Pro Thr Lys Ser Val Asn His Thr Gly Leu
35 40 45
Ala Pro Phe Val Leu Pro Phe Asp Asp Asp Gly Thr Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Ala Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Lys Asp
100 105 110
Ala Glu Lys Val Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Glu Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Ser Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Gln Ile
210 215 220
Leu Lys His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Val Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Glu Ala Phe Ser Gln Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Ala Arg Lys Tyr Lys Asp His
275 280 285
Ala Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asp Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Asn Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Ile Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Gln Ser His Ser Arg Ile Thr Pro
370 375 380
Leu Leu Met Gln Ser Val Glu Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Glu Trp Arg Glu Phe Arg Phe Gln Tyr Val His
405 410 415
Thr Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Val Arg Asp Leu Arg Leu Gln Ser Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Lys Asn Gln Thr Leu Glu Arg Arg Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Ala Tyr Trp Gln Asp Met
485 490 495
His Ser Tyr Leu Ala Asp Glu Leu Lys Val Lys Asn Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Gly
660 665 670
Glu Leu Ala Gln Ile Thr Asn Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Pro Glu Trp Arg Gly Tyr Ala Phe His Glu Gln Met
690 695 700
Gly Leu Gln Leu Gly Met Ser Thr Thr Glu Ser Lys Pro Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Glu Thr Gly Glu Leu Ser Trp Asp Thr
725 730 735
Thr Ser Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Glu Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Val Ala Asp Gln His Phe Gln Leu Gly Ala Leu
755 760 765
Gly Leu Thr Leu Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Val
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Ala Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Ser Leu Pro Ile Ala Ala Arg Arg
835 840 845
Val Ser Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Met Arg Ser Leu
850 855 860
Lys Val Val Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Val Ile Thr Pro Lys Ile
885 890
<210> 29
<211> 2868
<212> DNA
<213> Diplosphaera colitermitum
<400> 29
atgtctcccc agattgcctc tttcgcacgt cgctgccgcc tcgtccacac actatctggt 60
gcactgcttg ccatcgcatt tgcgtccggc ccgctgacgg cgatcatcgc caacgctggc 120
gcatctgaac tcacggcggc cacggccaac caactcccct tcgccaacgg cttccccttt 180
cacatccccc ccaccggcac ccaaccgggc accgcgccct acgacctcgc gatcccgccg 240
tccgccaaca caaaaatcga cagccccatc agcattcgcg gcgaccaatt catcgttcgc 300
catttgacat caaacaccag ccccgacacc ggcgaaccca tccgcttctg gggcaccaac 360
ctttgctttt ccggcgtatt ccccgaacac gacatcgctg accgcatggc cgcgcgcatg 420
gccacactcg gcatcaacat cgtccgcctt caccacttcg accaacgccg tttccccggc 480
ggcatctggc atcgcgacgc ccccggcgcc tccaaatctc ccaacgaaga cgacatcgcc 540
caccaaacct tcgacccaga atcccttgac cgcctcgact acctcatcgc cgccctcaaa 600
aaacgcggca tctacaccaa cctaaacctc aaagtctccc gcatattcag tcccgaccac 660
gacggccccg acttcccgaa acccgatcct gccaaaaacg aaatcctgcc caaaaaaggc 720
aaaggctttg accaatttta cacccccgcc atcgccgcgc aaaaagacta cgcccgccgc 780
ctcctcaccc atcgcaaccc ctacaccggc ctcacctaca ccgaagaccc cgccgtcgcg 840
atggtggaga tcaacaacga aaacggcatc ctctgggcct ggaactaccg aatccttgac 900
cgcattccct cccgtttcat tgacgaactc gccgcccgct ggaacacctg gcttcgtaac 960
caatattcca ctaccgacgc actccgcgcc gcatggaatc cggcgagtgg cgcgggcgtc 1020
ccacccgcaa ccggaaccgt agcctcccgg tccgttccct ccaccggtgg caacctcttg 1080
gaaaacatcc cccccgccct cttcaccgcc aaaaaagccc gcgccaccct cgccccgctc 1140
accgccgccg ccgacgccga cgattccacc ccggcctccc gtcgcctcac cgttgccgaa 1200
gtccctgctg ccaccgcttg gaatgtccgc tgcaactggc ccctcccgac cgcgcttccc 1260
gccgacgcca cctacaccgc cacccttcgc ctccgcgcaa accaacccca caaaatcaaa 1320
ctccgcctcc gctccccgtc cgacaacaag gacctcgcgc ccgtccgcac cctcaacctc 1380
gccaccgagt ggaaaaacca cagcaccacc tttgccatcc cgccgggtga cgccgccgtc 1440
gccgcccaac tcaccctcga agcgggcatc cccggcctcg tcctcgacat cgactccgct 1500
tcccttcaac cgctcaccag caaaaacctc ctcggcctcc cagcgggcca aggtctcgtc 1560
tcccaaagtg gcgcgggcgg gacgcccgcg ccacgccccg tcgaatgggt attccgccgc 1620
gatctcccct cccgcacacc cgccgtcgtc accgacgtca tgcgcttcct ccgcgacacc 1680
gaaatcgcct actggcgcga aatgcacgct ttcttacgca acgacctccg cgtcgccgca 1740
cccataacca ccaccgccgt tggctacacc acgccgcaaa tcgccgccga aaccgccgac 1800
ttcatcgaca cccaccgcta ctggggatca ccccgctttc ccgcctttga ccggacaaaa 1860
ccctggaccg tgcaacaaaa acccatggtc tcccaccccg cccagtccac catcgaacgc 1920
atgtccgccc gacgtgtatt cggaaaacca ttcaccatca ccgaatacaa ccacccgccc 1980
tccaccgacc accacgccga ggccttcccc ctcgtcggcg tctggggcgc cgcgcaaggc 2040
tgggacggcc tcttccagtt cgcctactcc cacagccgcg cttgggaagc tgacatcatg 2100
accggcttct tcgacaccga gcccaacccc gcgcacaccg tcgccgccct cgccgcctcc 2160
gacatcttcc gtcaccgccg catcaccccc tttgcctcca caaaaaccgg ctacgtcacc 2220
ctagaccgcc aactcgaacg ccagaacaac tacgccttcc ctcgcgaaat cgaggccgac 2280
gccatctacg gaggactccc gcccgacgcc tggcttacca accgcgtcgg cctcgcgcca 2340
agtgacgcgg gcgtcccgcc cgcaaccctt gcccctccgc cctccgtctc ccaaagcctc 2400
gtctgggacg ccgccaaccc cgccaccgcc cacgtccgtt acacgggcga cggcgttgct 2460
ggcctcatcg gattcgtttc cggccagacc ctcgatctcg gatggctccg tatcacaccc 2520
ggcactacat cactcaacgg cttctcaatt gtcatgctca ataccgttga ccgccaagcc 2580
ctcggagccc ccggacgcta cctgctcact gtggccgtcc gagcctccaa cctcggcatg 2640
ggctggaacg ctgaccgcac cggcttcggc aaaaaatggg gcactggtcc cacccatgcc 2700
gaaaccgccc cgatcgcgct cgatttcgcc tctgccaccg gcgtccgggt gtatccgctc 2760
aatcccgacg gaacacgtcg cccggaactc ccgccggtct ccctcccggg tcgcttcgaa 2820
gccactcctg ccagcaaaac tctctggtac gaaatcatcc tcccgtaa 2868
<210> 30
<211> 955
<212> PRT
<213> Diplosphaera colitermitum
<400> 30
Met Ser Pro Gln Ile Ala Ser Phe Ala Arg Arg Cys Arg Leu Val His
1 5 10 15
Thr Leu Ser Gly Ala Leu Leu Ala Ile Ala Phe Ala Ser Gly Pro Leu
20 25 30
Thr Ala Ile Ile Ala Asn Ala Gly Ala Ser Glu Leu Thr Ala Ala Thr
35 40 45
Ala Asn Gln Leu Pro Phe Ala Asn Gly Phe Pro Phe His Ile Pro Pro
50 55 60
Thr Gly Thr Gln Pro Gly Thr Ala Pro Tyr Asp Leu Ala Ile Pro Pro
65 70 75 80
Ser Ala Asn Thr Lys Ile Asp Ser Pro Ile Ser Ile Arg Gly Asp Gln
85 90 95
Phe Ile Val Arg His Leu Thr Ser Asn Thr Ser Pro Asp Thr Gly Glu
100 105 110
Pro Ile Arg Phe Trp Gly Thr Asn Leu Cys Phe Ser Gly Val Phe Pro
115 120 125
Glu His Asp Ile Ala Asp Arg Met Ala Ala Arg Met Ala Thr Leu Gly
130 135 140
Ile Asn Ile Val Arg Leu His His Phe Asp Gln Arg Arg Phe Pro Gly
145 150 155 160
Gly Ile Trp His Arg Asp Ala Pro Gly Ala Ser Lys Ser Pro Asn Glu
165 170 175
Asp Asp Ile Ala His Gln Thr Phe Asp Pro Glu Ser Leu Asp Arg Leu
180 185 190
Asp Tyr Leu Ile Ala Ala Leu Lys Lys Arg Gly Ile Tyr Thr Asn Leu
195 200 205
Asn Leu Lys Val Ser Arg Ile Phe Ser Pro Asp His Asp Gly Pro Asp
210 215 220
Phe Pro Lys Pro Asp Pro Ala Lys Asn Glu Ile Leu Pro Lys Lys Gly
225 230 235 240
Lys Gly Phe Asp Gln Phe Tyr Thr Pro Ala Ile Ala Ala Gln Lys Asp
245 250 255
Tyr Ala Arg Arg Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr
260 265 270
Tyr Thr Glu Asp Pro Ala Val Ala Met Val Glu Ile Asn Asn Glu Asn
275 280 285
Gly Ile Leu Trp Ala Trp Asn Tyr Arg Ile Leu Asp Arg Ile Pro Ser
290 295 300
Arg Phe Ile Asp Glu Leu Ala Ala Arg Trp Asn Thr Trp Leu Arg Asn
305 310 315 320
Gln Tyr Ser Thr Thr Asp Ala Leu Arg Ala Ala Trp Asn Pro Ala Ser
325 330 335
Gly Ala Gly Val Pro Pro Ala Thr Gly Thr Val Ala Ser Arg Ser Val
340 345 350
Pro Ser Thr Gly Gly Asn Leu Leu Glu Asn Ile Pro Pro Ala Leu Phe
355 360 365
Thr Ala Lys Lys Ala Arg Ala Thr Leu Ala Pro Leu Thr Ala Ala Ala
370 375 380
Asp Ala Asp Asp Ser Thr Pro Ala Ser Arg Arg Leu Thr Val Ala Glu
385 390 395 400
Val Pro Ala Ala Thr Ala Trp Asn Val Arg Cys Asn Trp Pro Leu Pro
405 410 415
Thr Ala Leu Pro Ala Asp Ala Thr Tyr Thr Ala Thr Leu Arg Leu Arg
420 425 430
Ala Asn Gln Pro His Lys Ile Lys Leu Arg Leu Arg Ser Pro Ser Asp
435 440 445
Asn Lys Asp Leu Ala Pro Val Arg Thr Leu Asn Leu Ala Thr Glu Trp
450 455 460
Lys Asn His Ser Thr Thr Phe Ala Ile Pro Pro Gly Asp Ala Ala Val
465 470 475 480
Ala Ala Gln Leu Thr Leu Glu Ala Gly Ile Pro Gly Leu Val Leu Asp
485 490 495
Ile Asp Ser Ala Ser Leu Gln Pro Leu Thr Ser Lys Asn Leu Leu Gly
500 505 510
Leu Pro Ala Gly Gln Gly Leu Val Ser Gln Ser Gly Ala Gly Gly Thr
515 520 525
Pro Ala Pro Arg Pro Val Glu Trp Val Phe Arg Arg Asp Leu Pro Ser
530 535 540
Arg Thr Pro Ala Val Val Thr Asp Val Met Arg Phe Leu Arg Asp Thr
545 550 555 560
Glu Ile Ala Tyr Trp Arg Glu Met His Ala Phe Leu Arg Asn Asp Leu
565 570 575
Arg Val Ala Ala Pro Ile Thr Thr Thr Ala Val Gly Tyr Thr Thr Pro
580 585 590
Gln Ile Ala Ala Glu Thr Ala Asp Phe Ile Asp Thr His Arg Tyr Trp
595 600 605
Gly Ser Pro Arg Phe Pro Ala Phe Asp Arg Thr Lys Pro Trp Thr Val
610 615 620
Gln Gln Lys Pro Met Val Ser His Pro Ala Gln Ser Thr Ile Glu Arg
625 630 635 640
Met Ser Ala Arg Arg Val Phe Gly Lys Pro Phe Thr Ile Thr Glu Tyr
645 650 655
Asn His Pro Pro Ser Thr Asp His His Ala Glu Ala Phe Pro Leu Val
660 665 670
Gly Val Trp Gly Ala Ala Gln Gly Trp Asp Gly Leu Phe Gln Phe Ala
675 680 685
Tyr Ser His Ser Arg Ala Trp Glu Ala Asp Ile Met Thr Gly Phe Phe
690 695 700
Asp Thr Glu Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser
705 710 715 720
Asp Ile Phe Arg His Arg Arg Ile Thr Pro Phe Ala Ser Thr Lys Thr
725 730 735
Gly Tyr Val Thr Leu Asp Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala
740 745 750
Phe Pro Arg Glu Ile Glu Ala Asp Ala Ile Tyr Gly Gly Leu Pro Pro
755 760 765
Asp Ala Trp Leu Thr Asn Arg Val Gly Leu Ala Pro Ser Asp Ala Gly
770 775 780
Val Pro Pro Ala Thr Leu Ala Pro Pro Pro Ser Val Ser Gln Ser Leu
785 790 795 800
Val Trp Asp Ala Ala Asn Pro Ala Thr Ala His Val Arg Tyr Thr Gly
805 810 815
Asp Gly Val Ala Gly Leu Ile Gly Phe Val Ser Gly Gln Thr Leu Asp
820 825 830
Leu Gly Trp Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asn Gly Phe
835 840 845
Ser Ile Val Met Leu Asn Thr Val Asp Arg Gln Ala Leu Gly Ala Pro
850 855 860
Gly Arg Tyr Leu Leu Thr Val Ala Val Arg Ala Ser Asn Leu Gly Met
865 870 875 880
Gly Trp Asn Ala Asp Arg Thr Gly Phe Gly Lys Lys Trp Gly Thr Gly
885 890 895
Pro Thr His Ala Glu Thr Ala Pro Ile Ala Leu Asp Phe Ala Ser Ala
900 905 910
Thr Gly Val Arg Val Tyr Pro Leu Asn Pro Asp Gly Thr Arg Arg Pro
915 920 925
Glu Leu Pro Pro Val Ser Leu Pro Gly Arg Phe Glu Ala Thr Pro Ala
930 935 940
Ser Lys Thr Leu Trp Tyr Glu Ile Ile Leu Pro
945 950 955
<210> 31
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 31
atgttttggt ttacctatgc gtactcgcga agcttgtgtc tgtaccgggc actcctgttt 60
ccgttgttgc tcttctgtgt tgatgctccg gcagcagagc gtctttcgca atcaccgaca 120
aaatcggtaa atcacacagg gttagcaccg ttcgtgcttc ccttcgacga tgatggtacg 180
ggtattaccg cttttaataa cgggtcgcac cagcgagggg agaggcttgc tccgctcact 240
atcgattccg ccggacattt ctccgtcgcc gggaataggt ttaggctttg gggcgtaaat 300
ataacagggg attccgcctt cccctcacac aaggatgcgg aaaaagttgc cggacgttta 360
gcaaaatttg gcgtgaacat tgttcggttt catcatttgg acaataactg gggtggtgcg 420
ggcctaattg attatcgacg gggagactcc cgtcatttga gtaaggaaaa tctcgataag 480
ctcgattatt ttattgccgc tttaaaatcg cgtggaatct acagcaatat aaacctgctt 540
accgcgcgcg aatttttacc tgctgacgga ttgcctgcat cgattactca aatcgattgg 600
aaggcgcggc aaatgctcgg cgcgatttct cccgcggtcc gcaatttgga aaaagcctac 660
gcgaaacaaa ttctgcaaca tgtaaatccg tacacgcgct tggcgtatcg ggtagatccg 720
gccatcgctt ttgttgaaat aaacaatgaa aacagcctgt ttcaacagtt ttttgacggc 780
aatatagacc gctggccgga agcgtttagt cagccactgg cgcaagagtg gaatgcttgg 840
ttggctcgca agtataaaga tcacgctgca ctcgagcgtg cctggcaggt gattgataaa 900
cctctgggca acaatctgtt aaaaaatgcg gattttgtgg cgggcttaca gggttggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gccaatccgc tcgcatccgc tggtttgcgt 1020
atccaaataa ataccgtagg gcctgcgtta tggaacattc aactttctca aaacttacct 1080
gaactcaaag acggtgagat ttacacattg tcgtttgccg cacgctcgca gtcgcacagc 1140
agaattacac ctctgctgat gcagagtgtg gcaccctggc aggtggtcga atctttccct 1200
gtgaagctcg attccgaatg gcaggaattc aggtttcagt atgtgcatac tggatcagcg 1260
caaccgttgc gcctaacgtt gggtgaattg ggttcggtaa taggggcaat agatgttagg 1320
gatcttcgcc tgcagtctgg cggaactgtt ggtgaacttg ctaagaacca gactctcgaa 1380
cgccgttcta taggattaaa ccgtaacgat gaatcctatc tcgcgcagcg gcgggaagac 1440
tggtttgcat ttttgtacag ccttgagctg gcgtactggc aggatatgca cagctatttg 1500
gctgatgaac tcaaggttaa aaacaatatt tatgggacta tcgcgagctt gagtccgcct 1560
tcaatacagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttt 1620
cccgctggag cctgggatgc acagcagtgg agtgtcgata tgtcgtccat ggttaacgcc 1680
ttcccaaaca acacgttaag cgctctggcg cgccagcgcg tggccgggct gccttttgta 1740
gtctctgaat atcagcatgc tatgccaaat ccctattctg cagaaggccc gctgctggta 1800
gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttcgta cgatcagggg 1860
gaactgggtt ggcaacagga atttatcgat ggattcttta aaaccaattt gaacccagcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggagatgt gcagcctgcg 1980
catggcaaac gctggttaaa tttttcgcga tccggcgagc tcgcacgaat tacaaacgcc 2040
ggtgcatctt ggagtgtgag tccggcggac ttccctccgg aatggcgtgg ctacgctttt 2100
cacgagcaaa tgggcttgca gttggatatg tcagggaggg agtctaaacc gccggtgctt 2160
gatgttaaca aagtgactgc cgagacgggc gaactcagtt gggatacaac tatccaagcg 2220
cagggtaggg tgacaataaa cacagcgaaa tccgctggcg tagtgggctt tgttgcagat 2280
caacacttcc agctcggtgc gttggggttg accttgggcg atctacagat gggttgggcc 2340
agttggatgg tcactgcgca agagggtagt ttgcaggatc ttgcagcagg cgcttcgctg 2400
ttggcagttg cgaccgcaaa aattgaaaac agtaaaatgc gttggaacga cgctcataat 2460
tcgctcggcc gcaattgggg ggaagcgccg acgagagttg aagttgtgcc ttttagtctc 2520
tcgttgccaa ttgctgccag gcgggttagt gcctggtgtt tggatgagcg tggtcagcga 2580
atgcagtcgc tgagggttgt gcaaacagcg acaggcagtc gtatcgatgt ggatagcaaa 2640
gcgcgaacat tatggtacga gatcgtcata accccgaaaa tataa 2685
<210> 32
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 32
Met Phe Trp Phe Thr Tyr Ala Tyr Ser Arg Ser Leu Cys Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Pro Ala Ala
20 25 30
Glu Arg Leu Ser Gln Ser Pro Thr Lys Ser Val Asn His Thr Gly Leu
35 40 45
Ala Pro Phe Val Leu Pro Phe Asp Asp Asp Gly Thr Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Arg Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Ala Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Lys Asp
100 105 110
Ala Glu Lys Val Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Glu Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Ser Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Gln Ile
210 215 220
Leu Gln His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Val Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Glu Ala Phe Ser Gln Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Ala Arg Lys Tyr Lys Asp His
275 280 285
Ala Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asp Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Asn Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Ile Asn Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Gln Ser His Ser Arg Ile Thr Pro
370 375 380
Leu Leu Met Gln Ser Val Ala Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Glu Trp Gln Glu Phe Arg Phe Gln Tyr Val His
405 410 415
Thr Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Val Arg Asp Leu Arg Leu Gln Ser Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Lys Asn Gln Thr Leu Glu Arg Arg Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Ala Tyr Trp Gln Asp Met
485 490 495
His Ser Tyr Leu Ala Asp Glu Leu Lys Val Lys Asn Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala His Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Gly
660 665 670
Glu Leu Ala Arg Ile Thr Asn Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Pro Glu Trp Arg Gly Tyr Ala Phe His Glu Gln Met
690 695 700
Gly Leu Gln Leu Asp Met Ser Gly Arg Glu Ser Lys Pro Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Glu Thr Gly Glu Leu Ser Trp Asp Thr
725 730 735
Thr Ile Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Val Ala Asp Gln His Phe Gln Leu Gly Ala Leu
755 760 765
Gly Leu Thr Leu Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Val
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Ala Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Ser Leu Pro Ile Ala Ala Arg Arg
835 840 845
Val Ser Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Met Gln Ser Leu
850 855 860
Arg Val Val Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Val Ile Thr Pro Lys Ile
885 890
<210> 33
<211> 2682
<212> DNA
<213> Teredinibacter turnerae
<400> 33
atgtttttgt ttatctcaac gcactcacca agcctgtgcc tgtaccgggc acttctcttt 60
ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcaca atcaccgata 120
aagtctttca cgcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180
ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccgctcact 240
atcgattccg acgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300
attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgttta 360
gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420
ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480
ctcgattact ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540
accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600
aaggcgcggc agatgctcgg cgcgatttcg cctgcggttc gcaatctgga aaaagcctac 660
gcgaaaaaaa ttctgcatca tgtgaacccc tacacgcgcc tggcataccg ggcagacccg 720
gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780
aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840
ttgactcgaa agtataaaga tcagaatgca ctcgagcgcg cctggcaggt gattgataaa 900
cctctgggta acaatctgtt aaaaaatgcg aattttgtgg ccgggttaca ggggtggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020
attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080
gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140
caaattacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200
gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260
caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320
gatctgcgct tgcagcccgg cgggaccgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380
cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440
tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500
gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620
cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680
tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740
gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800
gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttctta cgaccagggg 1860
gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980
cagggcaaac gctggttaaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040
ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100
catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160
gataacaagg taactgcaga tacaggagcg ctcacctggg atacgtctgt ccaagcgcag 2220
ggcagggtga caataaacac ggcgaaatct gctggcgtag tgggctttat tgcagatcaa 2280
ggcttccagc tcggtgcgct cgaattgaga gtgggcgatt tgcagatggg ttgggccagt 2340
tggatgatca ctgcacaaga gggaagtttg caggatcttg ccccaggcgc atcgctgttg 2400
gcggttgcga cggcaaaaat tgagaacagt aaaatgcgtt ggaacgacgc gcataattcg 2460
cttggccgca attggggtga agcgccgacg agggttgagg ttgtgccctt tagtctcacg 2520
ctgccagttg cttccaggcg ggtaaatgcc tggtgtctgg atgagcgtgg gcagcgattg 2580
cacgcgttga aggtcgagca aacagccacg ggcagtcgta tcgacgtgga tagcaaagcg 2640
cgaacattgt ggtatgagat agccatcgcc cccaaaatct aa 2682
<210> 34
<211> 893
<212> PRT
<213> Teredinibacter turnerae
<400> 34
Met Phe Leu Phe Ile Ser Thr His Ser Pro Ser Leu Cys Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu
20 25 30
Glu Arg Leu Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu
35 40 45
Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp
100 105 110
Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Ile
210 215 220
Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Ala Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln
275 280 285
Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Ile Thr Pro
370 375 380
Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His
405 410 415
Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met
485 490 495
His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg
660 665 670
Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile
690 695 700
Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu
705 710 715 720
Asp Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr Ser
725 730 735
Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala Gly
740 745 750
Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu Glu
755 760 765
Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile Thr
770 775 780
Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu Leu
785 790 795 800
Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn Asp
805 810 815
Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg Val
820 825 830
Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg Val
835 840 845
Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu Lys
850 855 860
Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys Ala
865 870 875 880
Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile
885 890
<210> 35
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 35
atgtttttgt ttatctcaac gcactcacca cgcctgcgcc tgtaccgggc acttctcttt 60
ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcgca atcaccgata 120
aagtctttca ctcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180
ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240
atcgattccg atgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300
attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgttta 360
gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420
ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480
ctcgattact ttattgccgc tctaaaattg cgtggaatct acagcaatat aaacctgctt 540
accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600
aaggcgcggc agatgctcgg cgcgatttcg cctgcgattc gcaatctgga aaaagcctac 660
gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc tggcataccg gacagacccg 720
gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780
aatatagatc gctggccaaa ggagtttaaa cggcaactgg cgcaagagtg gaatgcttgg 840
ttgactcgca agtataaaga tcacaatgca ctcgagcgcg cctggcaggt gattgataaa 900
cctctgggta acaatctgtt aaaaaatgcg aactttgtgg ccgggttaca gggttggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020
attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080
gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140
caatttacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200
gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260
caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattatg 1320
gatctgcgct tgcagcccgg cgggagcgtc ggtgaacttg ccgctaacca aacgcttgaa 1380
cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcggaaagat 1440
tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgttatctg 1500
gctgaggaac tcaaggttaa aagcaatatt tatgggacta tcgcgagctt gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttc 1620
cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680
tttccaaaca atacgttgag cgcgctggcg cgccaacgag ttgccggcct gccttttgtt 1740
gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800
gcggcctatg cgggtttaca ggattgggac ggcgtttatc tgttttctta cgaccagggt 1860
gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980
cagggcaaac gctggttaaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040
ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100
catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160
gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220
cagggcaggg tgaaaataaa cacggcgaaa tccgctggcg tagtgggctt tattgcagat 2280
caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340
agttggatga tcactgcaca agagggaagt ttgcaggatc tcgcccaagg cgcatcgctg 2400
ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gctggaacgg cgcgcataat 2460
tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ttttagtctc 2520
acgctgccaa ttgcttccag gcgggtaaat gcttggtctc tggatgagcg tgggcagcga 2580
ttgcacgcgt tgaaggtcga gcaaatagcc acgggcagtc gtatcgacgt ggatagcaaa 2640
gcgcgaacat tgtggtatga gatagccatc gcccccaaaa tctaa 2685
<210> 36
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 36
Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Arg Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu
20 25 30
Glu Arg Leu Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu
35 40 45
Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp
100 105 110
Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Ala Ile Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu
210 215 220
Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Thr Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Gln
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp His
275 280 285
Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Phe Thr Pro
370 375 380
Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His
405 410 415
Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Ile Met Asp Leu Arg Leu Gln Pro Gly Gly
435 440 445
Ser Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Lys Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met
485 490 495
His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg
660 665 670
Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile
690 695 700
Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr
725 730 735
Ser Val Gln Ala Gln Gly Arg Val Lys Ile Asn Thr Ala Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu
755 760 765
Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Gln Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Gly Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Ile Ala Ser Arg Arg
835 840 845
Val Asn Ala Trp Ser Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu
850 855 860
Lys Val Glu Gln Ile Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile
885 890
<210> 37
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 37
atgtttttgt ttatctcaac gcactcacca cgcctgcgcc tgtaccgggc acttctcttt 60
ctgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcgga atcaccgata 120
aagtctttca ctcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180
ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240
atcgattccg acgggcattt ctccgtcgcc gggaataggt ttaggctttg gggcgtgaac 300
attacgggtg actcagcttt tccatcacac gaagacgccg aaaaaattgc cgggcgttta 360
gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420
ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggataa tctcgataag 480
ctcgattact ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540
accgcgcggg aatttttacc tgctgatgaa ttacccgcat cgattactca gattgactgg 600
aaggcgcggc agatgcttgg cgcgatttcg cctacggttc gcaatctgga aaaagcctac 660
gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc ttgcataccg ggcagacccg 720
gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780
aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840
ttgactcgca agtataaaga tcagaatgca ctcgagcgcg cctggcaggt gattgataaa 900
cctctgggta acaatctgtt aacaaatgcg aattttgtgg ccgggttaca ggggtggcac 960
ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020
attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080
gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140
caaattacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200
gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260
caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320
gatctgcgtt tgcagcccgg cgggactgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380
cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440
tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500
gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620
cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680
tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740
gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800
gcggcctatg cgggtttgca ggattgggac ggtgtttatc tgttttctta cgaccagggg 1860
gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980
cagggcaaac gctggttaaa tttttcgcca tcccgcgagc tcgcacaaat tgcaagcgcc 2040
ggtgcatcct ggagcgtgag tccggcgaac ttcccggcgg actggcgtgg ctacgcattt 2100
catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160
gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220
cagggcaggg tgacaataaa cacggcgaaa tctgctggcg tagtgggctt tattgcagat 2280
caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340
agttggatga tcactgcaca agagggaagt ttgcaggatc ttgccccagg cgcatcgctg 2400
ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gttggaacga cgcgcataat 2460
tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ctttagtctc 2520
acgctgccag ttgcttccag gcgggtaaat gcctggtgtc tggatgagcg tgggcagcga 2580
ttgcacgcgt tgaaggtcga gcaaacagcc acgggcagtc gtatcgacgt ggatagcaaa 2640
gcgcgaacat tgtggtatga gatagcgatc gcccccaaaa tctaa 2685
<210> 38
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 38
Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Arg Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Leu Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu
20 25 30
Glu Arg Leu Ala Glu Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu
35 40 45
Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp
100 105 110
Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Glu Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Thr Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu
210 215 220
Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Ala Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln
275 280 285
Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Thr Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Ile Thr Pro
370 375 380
Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His
405 410 415
Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met
485 490 495
His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Pro Ser Arg
660 665 670
Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asn Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile
690 695 700
Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr
725 730 735
Ser Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu
755 760 765
Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg
835 840 845
Val Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu
850 855 860
Lys Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile
885 890
<210> 39
<211> 2604
<212> DNA
<213> 牛肠宏基因组
<400> 39
atgatacgga attgtttttt gccggctgcg gcactaatga tcggttgcgc atttggggcg 60
gacgacgcca tgttcccctt cgtaccgtcg tacgacgcgc cgatgaacgt ggttaacatg 120
agccatctgc tggacgcgcc cgccggcagc catgggcgca tccgtgttaa agacggacac 180
ttcgtgaacg accagggccg ggtcagactg cacgcgacga atcttacggg accggcgaac 240
tttccgtcgc acgaagaggc ggagcgcctt gcggcgcgtc tggcccgttt cggcatcaac 300
tgcgtccgac tgcactattt cgacagttcc tacggcacgt tcatgcttcc ggccgagcag 360
ggtatcttta cggataaaac cggagaactc cgacgtctcg atcccaagca gcgcgaccgg 420
caggactatc tgatcgccca gttcaagaaa cgcggcattt atgtggatat caacctgcac 480
gtcgcccgta ccctggacgc aagcgacggt ttcgagccgg gaaccccatg ggccaacaag 540
ggcgtggacc agtttgaccc gcgggtgatc gcggcagaaa aagcgtatgc ccgcgaattg 600
ctttcgcacg tcaatcccta taccggactc agttacctga aagaccccgt tgtcgccatc 660
gtggaactca acaacgagga tgcgctgtgg aatcaatacc ttaggggcgg gattgaccag 720
cttggaaaac cgtacgcgaa agaattccaa cgccaatgga acgattggct gcgtaaaaaa 780
tacggcaacg acgaacgaat gcgcgcggct tggcgggtaa agacgcagcc gctgggcgac 840
gaaatgattc aggagggttc gtttgaagag aacgtggtgc cggacggatc gcggtggatt 900
ctcgaccttg agcgtacgaa agcgtctgcc gcttcccaaa acggctcgct ccgcatcacg 960
gtcgaaaaga agtcctccga ccgttttttc cccaagctct accgccgcgt atccgtaaaa 1020
aagaatgtcc catacacggt gtcgttccga atccgccaag cggagggaga gcctggcgaa 1080
gtgggtttcg ccgtggccga ccgcggcaag ggctgggaat cgctgggcat ccacaccgtc 1140
cttaagccta ccaaaaactg gacgaaacgg aagttcacgt tttatgccgc aaaggattgc 1200
cagcaagcgg aaatccagtt cacgcgcttc gaggttggcg cttacgagat tgacgacctt 1260
tcgttccgaa ccggcaacga accggaaaat ctttccaccc tttccgccga aaagggcgag 1320
gtggcaatcg tgaagacgaa agactccgta gtgccggaga tgaaacgcga cttctaccgg 1380
tttgtaatgg atacggaaca cgcctattgg acgggtatgc gcgattatct gcaaaaagag 1440
ctcggactgg aagcaccagt ctccgccacc cagctcgact attcgccgcc gcatctgcag 1500
gcggagatgg acttcgtgga caaccacgcc tactggtgcc acccgagcgt gcggaaagac 1560
tggtcgatcc gcaacaaggc gatggtaaac gcgcgcggcg ggtgcattct cggcctcgcg 1620
gggcaacgtg tggcgggcaa accctacacg gtaagcgagt acaaccaccc ctacccgatt 1680
tactacggcg cggaggggca acctatgcta cgcgcctacg gggcgttgca gggatgggac 1740
ggcgtattcg aatattccta caacaaccgg cagaacgccg agccggacca caacgagtat 1800
ttcttcagca tggcggcacg gaccgacgtg ctggcgcatt tcccggcatg cgcggcgatg 1860
tatctgcggg gcgatgtcaa agagagcgca acgcgtatcg tcgcgaatct tccgcttgag 1920
gaatatttcg aacggttggt gaaagccaac aaggtaagcc aaggcatcac cacggcaacc 1980
gacgggaaac tgtccgccga actgggattg gttcacagcg tggccgtgga tgtgacgggg 2040
caaaccccgc gcacaacgga taatattccg ccgcccggca agataatcgc tagcgacacg 2100
ggggaaatcg tttggaacaa cgatatcgac ggcgcgggcg tttggacggt ggacacgcca 2160
aacacgaaaa tcttctccgg tttcccgaag gggcgcgtgt tcaatctaag cggagtaaaa 2220
ctggcggttg gagagactaa actcggttgg gcgacggtgt cgctgacctc gcacgacgcg 2280
accgggtttg gcggggacgg aaagcccgcg cgtattctgc ttacggcgac cggactttct 2340
cacaacggcg gagcaaagtt cgtcgcaaag ggaaaagagg cgatttttgc ttccgagtgg 2400
ggcaacggta aaacggtgaa cgaaggtatt cccgcgacag tcaccctacc cgcgccgacg 2460
gcaaagacca gctgctgggc acttgacgaa cgcggtgaac ggaaagcgaa agtacccgtg 2520
acggccgacg ccgacggtca tgccgtcatc gcgatcggcc caacctggca aacggtgtgg 2580
tacgaaatca acgttgaggg atga 2604
<210> 40
<211> 867
<212> PRT
<213> 牛肠宏基因组
<400> 40
Met Ile Arg Asn Cys Phe Leu Pro Ala Ala Ala Leu Met Ile Gly Cys
1 5 10 15
Ala Phe Gly Ala Asp Asp Ala Met Phe Pro Phe Val Pro Ser Tyr Asp
20 25 30
Ala Pro Met Asn Val Val Asn Met Ser His Leu Leu Asp Ala Pro Ala
35 40 45
Gly Ser His Gly Arg Ile Arg Val Lys Asp Gly His Phe Val Asn Asp
50 55 60
Gln Gly Arg Val Arg Leu His Ala Thr Asn Leu Thr Gly Pro Ala Asn
65 70 75 80
Phe Pro Ser His Glu Glu Ala Glu Arg Leu Ala Ala Arg Leu Ala Arg
85 90 95
Phe Gly Ile Asn Cys Val Arg Leu His Tyr Phe Asp Ser Ser Tyr Gly
100 105 110
Thr Phe Met Leu Pro Ala Glu Gln Gly Ile Phe Thr Asp Lys Thr Gly
115 120 125
Glu Leu Arg Arg Leu Asp Pro Lys Gln Arg Asp Arg Gln Asp Tyr Leu
130 135 140
Ile Ala Gln Phe Lys Lys Arg Gly Ile Tyr Val Asp Ile Asn Leu His
145 150 155 160
Val Ala Arg Thr Leu Asp Ala Ser Asp Gly Phe Glu Pro Gly Thr Pro
165 170 175
Trp Ala Asn Lys Gly Val Asp Gln Phe Asp Pro Arg Val Ile Ala Ala
180 185 190
Glu Lys Ala Tyr Ala Arg Glu Leu Leu Ser His Val Asn Pro Tyr Thr
195 200 205
Gly Leu Ser Tyr Leu Lys Asp Pro Val Val Ala Ile Val Glu Leu Asn
210 215 220
Asn Glu Asp Ala Leu Trp Asn Gln Tyr Leu Arg Gly Gly Ile Asp Gln
225 230 235 240
Leu Gly Lys Pro Tyr Ala Lys Glu Phe Gln Arg Gln Trp Asn Asp Trp
245 250 255
Leu Arg Lys Lys Tyr Gly Asn Asp Glu Arg Met Arg Ala Ala Trp Arg
260 265 270
Val Lys Thr Gln Pro Leu Gly Asp Glu Met Ile Gln Glu Gly Ser Phe
275 280 285
Glu Glu Asn Val Val Pro Asp Gly Ser Arg Trp Ile Leu Asp Leu Glu
290 295 300
Arg Thr Lys Ala Ser Ala Ala Ser Gln Asn Gly Ser Leu Arg Ile Thr
305 310 315 320
Val Glu Lys Lys Ser Ser Asp Arg Phe Phe Pro Lys Leu Tyr Arg Arg
325 330 335
Val Ser Val Lys Lys Asn Val Pro Tyr Thr Val Ser Phe Arg Ile Arg
340 345 350
Gln Ala Glu Gly Glu Pro Gly Glu Val Gly Phe Ala Val Ala Asp Arg
355 360 365
Gly Lys Gly Trp Glu Ser Leu Gly Ile His Thr Val Leu Lys Pro Thr
370 375 380
Lys Asn Trp Thr Lys Arg Lys Phe Thr Phe Tyr Ala Ala Lys Asp Cys
385 390 395 400
Gln Gln Ala Glu Ile Gln Phe Thr Arg Phe Glu Val Gly Ala Tyr Glu
405 410 415
Ile Asp Asp Leu Ser Phe Arg Thr Gly Asn Glu Pro Glu Asn Leu Ser
420 425 430
Thr Leu Ser Ala Glu Lys Gly Glu Val Ala Ile Val Lys Thr Lys Asp
435 440 445
Ser Val Val Pro Glu Met Lys Arg Asp Phe Tyr Arg Phe Val Met Asp
450 455 460
Thr Glu His Ala Tyr Trp Thr Gly Met Arg Asp Tyr Leu Gln Lys Glu
465 470 475 480
Leu Gly Leu Glu Ala Pro Val Ser Ala Thr Gln Leu Asp Tyr Ser Pro
485 490 495
Pro His Leu Gln Ala Glu Met Asp Phe Val Asp Asn His Ala Tyr Trp
500 505 510
Cys His Pro Ser Val Arg Lys Asp Trp Ser Ile Arg Asn Lys Ala Met
515 520 525
Val Asn Ala Arg Gly Gly Cys Ile Leu Gly Leu Ala Gly Gln Arg Val
530 535 540
Ala Gly Lys Pro Tyr Thr Val Ser Glu Tyr Asn His Pro Tyr Pro Ile
545 550 555 560
Tyr Tyr Gly Ala Glu Gly Gln Pro Met Leu Arg Ala Tyr Gly Ala Leu
565 570 575
Gln Gly Trp Asp Gly Val Phe Glu Tyr Ser Tyr Asn Asn Arg Gln Asn
580 585 590
Ala Glu Pro Asp His Asn Glu Tyr Phe Phe Ser Met Ala Ala Arg Thr
595 600 605
Asp Val Leu Ala His Phe Pro Ala Cys Ala Ala Met Tyr Leu Arg Gly
610 615 620
Asp Val Lys Glu Ser Ala Thr Arg Ile Val Ala Asn Leu Pro Leu Glu
625 630 635 640
Glu Tyr Phe Glu Arg Leu Val Lys Ala Asn Lys Val Ser Gln Gly Ile
645 650 655
Thr Thr Ala Thr Asp Gly Lys Leu Ser Ala Glu Leu Gly Leu Val His
660 665 670
Ser Val Ala Val Asp Val Thr Gly Gln Thr Pro Arg Thr Thr Asp Asn
675 680 685
Ile Pro Pro Pro Gly Lys Ile Ile Ala Ser Asp Thr Gly Glu Ile Val
690 695 700
Trp Asn Asn Asp Ile Asp Gly Ala Gly Val Trp Thr Val Asp Thr Pro
705 710 715 720
Asn Thr Lys Ile Phe Ser Gly Phe Pro Lys Gly Arg Val Phe Asn Leu
725 730 735
Ser Gly Val Lys Leu Ala Val Gly Glu Thr Lys Leu Gly Trp Ala Thr
740 745 750
Val Ser Leu Thr Ser His Asp Ala Thr Gly Phe Gly Gly Asp Gly Lys
755 760 765
Pro Ala Arg Ile Leu Leu Thr Ala Thr Gly Leu Ser His Asn Gly Gly
770 775 780
Ala Lys Phe Val Ala Lys Gly Lys Glu Ala Ile Phe Ala Ser Glu Trp
785 790 795 800
Gly Asn Gly Lys Thr Val Asn Glu Gly Ile Pro Ala Thr Val Thr Leu
805 810 815
Pro Ala Pro Thr Ala Lys Thr Ser Cys Trp Ala Leu Asp Glu Arg Gly
820 825 830
Glu Arg Lys Ala Lys Val Pro Val Thr Ala Asp Ala Asp Gly His Ala
835 840 845
Val Ile Ala Ile Gly Pro Thr Trp Gln Thr Val Trp Tyr Glu Ile Asn
850 855 860
Val Glu Gly
865
<210> 41
<211> 2622
<212> DNA
<213> 浮霉状菌属
<220>
<221> CDS
<222> (1)..(2619)
<220>
<221> 信号肽
<222> (1)..(81)
<220>
<221> 成熟肽
<222> (82)..(2619)
<220>
<221> PF00150
<222> (277)..(687)
<220>
<221> PF02018
<222> (850)..(1239)
<400> 41
atg agg cga aac gtt gcg ttc gat tgc att ctg atc ctg cta ctt ggg 48
Met Arg Arg Asn Val Ala Phe Asp Cys Ile Leu Ile Leu Leu Leu Gly
-25 -20 -15
cta ctg tgc ttc gga gca aca ccc tct cgg gga gaa gaa acg gca act 96
Leu Leu Cys Phe Gly Ala Thr Pro Ser Arg Gly Glu Glu Thr Ala Thr
-10 -5 -1 1 5
cca ggc aag ctc ttt ccg ttt gtc ctg agc tac gaa cca acg gac agc 144
Pro Gly Lys Leu Phe Pro Phe Val Leu Ser Tyr Glu Pro Thr Asp Ser
10 15 20
atc aca aac atc tca gaa tgg ctt gac cgt ccc gct ggg aag cac ggg 192
Ile Thr Asn Ile Ser Glu Trp Leu Asp Arg Pro Ala Gly Lys His Gly
25 30 35
ttt att cgg gcg gaa aat ggg cac ttt gtg aca gat gcc ggg cgg atc 240
Phe Ile Arg Ala Glu Asn Gly His Phe Val Thr Asp Ala Gly Arg Ile
40 45 50
cgg ctg tgg gcc act aac ctc tgt ttt gaa gcc tgc ttc cca acc aag 288
Arg Leu Trp Ala Thr Asn Leu Cys Phe Glu Ala Cys Phe Pro Thr Lys
55 60 65
gaa gag gca gaa cgc ctt gcc agg cgt ctc gcc agc ctg ggg atc aat 336
Glu Glu Ala Glu Arg Leu Ala Arg Arg Leu Ala Ser Leu Gly Ile Asn
70 75 80 85
tgt gtg cga atg cat cac atg gac aat cgg cac atc tgg ggt aaa agc 384
Cys Val Arg Met His His Met Asp Asn Arg His Ile Trp Gly Lys Ser
90 95 100
ccc aat aag ctg acg att gat ccc gaa atg ctg gat aag ctg gat tac 432
Pro Asn Lys Leu Thr Ile Asp Pro Glu Met Leu Asp Lys Leu Asp Tyr
105 110 115
ctg att tat caa ttg aaa ttg cac ggg atc tat acc aac ctc aat ctg 480
Leu Ile Tyr Gln Leu Lys Leu His Gly Ile Tyr Thr Asn Leu Asn Leu
120 125 130
cat gtg tcc cgg gag ttt ggc ccg gcc gaa ggc ttt ccc gcg gtg gag 528
His Val Ser Arg Glu Phe Gly Pro Ala Glu Gly Phe Pro Ala Val Glu
135 140 145
ggc ctc ccc aac tac gat aaa ggg atc gac aac ttt gaa ccc cgg atg 576
Gly Leu Pro Asn Tyr Asp Lys Gly Ile Asp Asn Phe Glu Pro Arg Met
150 155 160 165
atc gag tac cag aaa aaa tat gcc cgc gat ttg ctc acg cac gtc aat 624
Ile Glu Tyr Gln Lys Lys Tyr Ala Arg Asp Leu Leu Thr His Val Asn
170 175 180
ccc tac acc ggc acg gcg tac atc aac gaa ccg gcc att gcg atg gtc 672
Pro Tyr Thr Gly Thr Ala Tyr Ile Asn Glu Pro Ala Ile Ala Met Val
185 190 195
gaa atc aat aac gaa aat gca gcg ttt gac gag tac cgc aag gga gcg 720
Glu Ile Asn Asn Glu Asn Ala Ala Phe Asp Glu Tyr Arg Lys Gly Ala
200 205 210
ttt gat cat ttg ccc gag ccg tac gcc agc caa ctc cgc aag ctg tgg 768
Phe Asp His Leu Pro Glu Pro Tyr Ala Ser Gln Leu Arg Lys Leu Trp
215 220 225
aat gcc tgg ctg aaa aag aaa tac ggc agt gac gac gcg ctt cgc aaa 816
Asn Ala Trp Leu Lys Lys Lys Tyr Gly Ser Asp Asp Ala Leu Arg Lys
230 235 240 245
gcg tgg aat gcc cag cgt caa ccc ctg ggc gag gaa atc ctg aaa aat 864
Ala Trp Asn Ala Gln Arg Gln Pro Leu Gly Glu Glu Ile Leu Lys Asn
250 255 260
cgt gac ttt tcc ggc cag tgg gaa aag gtg tgg aac ctc cag cgt gac 912
Arg Asp Phe Ser Gly Gln Trp Glu Lys Val Trp Asn Leu Gln Arg Asp
265 270 275
aat ctc tcg gag gtc gtc gcc gag gtc att ccg aat ggc ttt cag ggc 960
Asn Leu Ser Glu Val Val Ala Glu Val Ile Pro Asn Gly Phe Gln Gly
280 285 290
aaa ccc gcc ttg cgt ttg cgc gtc atc cgc aac gga caa gaa acc tgg 1008
Lys Pro Ala Leu Arg Leu Arg Val Ile Arg Asn Gly Gln Glu Thr Trp
295 300 305
atc ccc cag tta agc cag ggc ggt ttt tca gtt cag aaa ggt cag gtg 1056
Ile Pro Gln Leu Ser Gln Gly Gly Phe Ser Val Gln Lys Gly Gln Val
310 315 320 325
tac act ctc cga ttc tgg ctg aaa gcg gac aaa ccg ggc cgg atc gac 1104
Tyr Thr Leu Arg Phe Trp Leu Lys Ala Asp Lys Pro Gly Arg Ile Asp
330 335 340
gtg aac tgc atg atg aac cac gat ccc tgg cag cgt ctc ggc ctt tcc 1152
Val Asn Cys Met Met Asn His Asp Pro Trp Gln Arg Leu Gly Leu Ser
345 350 355
gcg gat gtt caa acc tcg gcc gag tgg aag gaa tat cgc ctc agc ttt 1200
Ala Asp Val Gln Thr Ser Ala Glu Trp Lys Glu Tyr Arg Leu Ser Phe
360 365 370
gtg gcg gat cgc gat gat cca aat gcc agg atc acg ttc agc caa ctc 1248
Val Ala Asp Arg Asp Asp Pro Asn Ala Arg Ile Thr Phe Ser Gln Leu
375 380 385
cgt ccc ggg acg tac gaa ctg gca gac gtg tca ctc cgg ccg ggt ggg 1296
Arg Pro Gly Thr Tyr Glu Leu Ala Asp Val Ser Leu Arg Pro Gly Gly
390 395 400 405
gtc atc ggc ctg gaa gag ggc caa tcc ctc gcc gat cag acg gtt ccc 1344
Val Ile Gly Leu Glu Glu Gly Gln Ser Leu Ala Asp Gln Thr Val Pro
410 415 420
att gtt cct gct cgc gga ccg caa atg acg gcc gcc gcc cgg gcc gac 1392
Ile Val Pro Ala Arg Gly Pro Gln Met Thr Ala Ala Ala Arg Ala Asp
425 430 435
ttc gca gat ttt ttg tgg gag ctc gaa cgc gac tac tgg tgg gga atg 1440
Phe Ala Asp Phe Leu Trp Glu Leu Glu Arg Asp Tyr Trp Trp Gly Met
440 445 450
tac cga ttt ctg aag gag gaa ctc aag ctg aag ccg ctg gtc gcg gga 1488
Tyr Arg Phe Leu Lys Glu Glu Leu Lys Leu Lys Pro Leu Val Ala Gly
455 460 465
acg caa ctc tcc tac agt cca gtt cac att caa gct ggg ctg gac tac 1536
Thr Gln Leu Ser Tyr Ser Pro Val His Ile Gln Ala Gly Leu Asp Tyr
470 475 480 485
atc gac tcg cat gcc tac tgg cag cat ccc gtt ttc ccc ggc agg cca 1584
Ile Asp Ser His Ala Tyr Trp Gln His Pro Val Phe Pro Gly Arg Pro
490 495 500
tgg gat ccg gaa aac tgg tat gtg cgt agt ctg gcc ctc gtg aat cag 1632
Trp Asp Pro Glu Asn Trp Tyr Val Arg Ser Leu Ala Leu Val Asn Gln
505 510 515
ccg gga ggc aca ctt tcc gga ctc gcc agt cgg cgt gtc gaa ggt ttg 1680
Pro Gly Gly Thr Leu Ser Gly Leu Ala Ser Arg Arg Val Glu Gly Leu
520 525 530
ccg ttc acc gtg agc gaa tac aac cac ccg gct ccc aac gaa tac gcc 1728
Pro Phe Thr Val Ser Glu Tyr Asn His Pro Ala Pro Asn Glu Tyr Ala
535 540 545
gcc gaa gga ttt ccg atg atc gcg gct ttt ggg gct ttt cag gat tgg 1776
Ala Glu Gly Phe Pro Met Ile Ala Ala Phe Gly Ala Phe Gln Asp Trp
550 555 560 565
gat gga atc ttc agc ttc act tac agc cac agt cga gat tac gag ccg 1824
Asp Gly Ile Phe Ser Phe Thr Tyr Ser His Ser Arg Asp Tyr Glu Pro
570 575 580
cga aaa atc acg ggt ttc ttc gac atc aaa agc gag gtg acc aaa ctc 1872
Arg Lys Ile Thr Gly Phe Phe Asp Ile Lys Ser Glu Val Thr Lys Leu
585 590 595
gtt cac atg ccc gcc tgc gtc gcc atg ttc tac cgg ggt gat gtg caa 1920
Val His Met Pro Ala Cys Val Ala Met Phe Tyr Arg Gly Asp Val Gln
600 605 610
ccc gcc acc cag gct gtg gtc gtg ggc atg acc cgt gaa aag gaa caa 1968
Pro Ala Thr Gln Ala Val Val Val Gly Met Thr Arg Glu Lys Glu Gln
615 620 625
tcc atc ctc cga gaa aca ctc aat ccc tgg gcg ctg acc gcc gac cgt 2016
Ser Ile Leu Arg Glu Thr Leu Asn Pro Trp Ala Leu Thr Ala Asp Arg
630 635 640 645
ttg ggt att ccc gcc aac ctg agc ttg ctc cat cgg gtg gcc atg gca 2064
Leu Gly Ile Pro Ala Asn Leu Ser Leu Leu His Arg Val Ala Met Ala
650 655 660
ctg aaa gaa ccc agc gat agt gtg cca cca ccc acg ctg tcc gcg gag 2112
Leu Lys Glu Pro Ser Asp Ser Val Pro Pro Pro Thr Leu Ser Ala Glu
665 670 675
cag aag gtt ttc ctg tcc gat acg caa caa atc tgc tgg gat gtc tct 2160
Gln Lys Val Phe Leu Ser Asp Thr Gln Gln Ile Cys Trp Asp Val Ser
680 685 690
cag ccc ggc gcc ggg gtg ttc ctg gtc aac tcg ccg aaa acg aaa ctc 2208
Gln Pro Gly Ala Gly Val Phe Leu Val Asn Ser Pro Lys Thr Lys Leu
695 700 705
gtg acc ggt ttc ccc gcc gga aga act ttc aat ctg aat gga atc cag 2256
Val Thr Gly Phe Pro Ala Gly Arg Thr Phe Asn Leu Asn Gly Ile Gln
710 715 720 725
att cag att gga gaa acg gag ctg ggt tgg gcg acc gtt tcg ctc acc 2304
Ile Gln Ile Gly Glu Thr Glu Leu Gly Trp Ala Thr Val Ser Leu Thr
730 735 740
gtt atc aaa ggg gac gga ttt gat cgg cct ggc cga atc ctc ctc gct 2352
Val Ile Lys Gly Asp Gly Phe Asp Arg Pro Gly Arg Ile Leu Leu Ala
745 750 755
gct acg gga aag gcc caa aat aca ggc tgg gac ttc cgt aaa gag ggc 2400
Ala Thr Gly Lys Ala Gln Asn Thr Gly Trp Asp Phe Arg Lys Glu Gly
760 765 770
gat cgg gtg acc gtg gga cgc cgc tgg ggc gac gag ccg atc ctc tgc 2448
Asp Arg Val Thr Val Gly Arg Arg Trp Gly Asp Glu Pro Ile Leu Cys
775 780 785
gaa gga gtg ccg gct cgc atc gtg ctg ccg gtt tcg tcc agc cgc gtg 2496
Glu Gly Val Pro Ala Arg Ile Val Leu Pro Val Ser Ser Ser Arg Val
790 795 800 805
aaa gtc tat gcc ctc gac gag gcg gga cgc cgc agg gac gcg gtg acg 2544
Lys Val Tyr Ala Leu Asp Glu Ala Gly Arg Arg Arg Asp Ala Val Thr
810 815 820
gtt tct ggt ggc gat cag gcc gtt gtc gaa ata ggg ccc caa ttc agg 2592
Val Ser Gly Gly Asp Gln Ala Val Val Glu Ile Gly Pro Gln Phe Arg
825 830 835
acg ctg tgg tac gaa atc gaa atc caa tga 2622
Thr Leu Trp Tyr Glu Ile Glu Ile Gln
840 845
<210> 42
<211> 873
<212> PRT
<213> 浮霉状菌属
<400> 42
Met Arg Arg Asn Val Ala Phe Asp Cys Ile Leu Ile Leu Leu Leu Gly
-25 -20 -15
Leu Leu Cys Phe Gly Ala Thr Pro Ser Arg Gly Glu Glu Thr Ala Thr
-10 -5 -1 1 5
Pro Gly Lys Leu Phe Pro Phe Val Leu Ser Tyr Glu Pro Thr Asp Ser
10 15 20
Ile Thr Asn Ile Ser Glu Trp Leu Asp Arg Pro Ala Gly Lys His Gly
25 30 35
Phe Ile Arg Ala Glu Asn Gly His Phe Val Thr Asp Ala Gly Arg Ile
40 45 50
Arg Leu Trp Ala Thr Asn Leu Cys Phe Glu Ala Cys Phe Pro Thr Lys
55 60 65
Glu Glu Ala Glu Arg Leu Ala Arg Arg Leu Ala Ser Leu Gly Ile Asn
70 75 80 85
Cys Val Arg Met His His Met Asp Asn Arg His Ile Trp Gly Lys Ser
90 95 100
Pro Asn Lys Leu Thr Ile Asp Pro Glu Met Leu Asp Lys Leu Asp Tyr
105 110 115
Leu Ile Tyr Gln Leu Lys Leu His Gly Ile Tyr Thr Asn Leu Asn Leu
120 125 130
His Val Ser Arg Glu Phe Gly Pro Ala Glu Gly Phe Pro Ala Val Glu
135 140 145
Gly Leu Pro Asn Tyr Asp Lys Gly Ile Asp Asn Phe Glu Pro Arg Met
150 155 160 165
Ile Glu Tyr Gln Lys Lys Tyr Ala Arg Asp Leu Leu Thr His Val Asn
170 175 180
Pro Tyr Thr Gly Thr Ala Tyr Ile Asn Glu Pro Ala Ile Ala Met Val
185 190 195
Glu Ile Asn Asn Glu Asn Ala Ala Phe Asp Glu Tyr Arg Lys Gly Ala
200 205 210
Phe Asp His Leu Pro Glu Pro Tyr Ala Ser Gln Leu Arg Lys Leu Trp
215 220 225
Asn Ala Trp Leu Lys Lys Lys Tyr Gly Ser Asp Asp Ala Leu Arg Lys
230 235 240 245
Ala Trp Asn Ala Gln Arg Gln Pro Leu Gly Glu Glu Ile Leu Lys Asn
250 255 260
Arg Asp Phe Ser Gly Gln Trp Glu Lys Val Trp Asn Leu Gln Arg Asp
265 270 275
Asn Leu Ser Glu Val Val Ala Glu Val Ile Pro Asn Gly Phe Gln Gly
280 285 290
Lys Pro Ala Leu Arg Leu Arg Val Ile Arg Asn Gly Gln Glu Thr Trp
295 300 305
Ile Pro Gln Leu Ser Gln Gly Gly Phe Ser Val Gln Lys Gly Gln Val
310 315 320 325
Tyr Thr Leu Arg Phe Trp Leu Lys Ala Asp Lys Pro Gly Arg Ile Asp
330 335 340
Val Asn Cys Met Met Asn His Asp Pro Trp Gln Arg Leu Gly Leu Ser
345 350 355
Ala Asp Val Gln Thr Ser Ala Glu Trp Lys Glu Tyr Arg Leu Ser Phe
360 365 370
Val Ala Asp Arg Asp Asp Pro Asn Ala Arg Ile Thr Phe Ser Gln Leu
375 380 385
Arg Pro Gly Thr Tyr Glu Leu Ala Asp Val Ser Leu Arg Pro Gly Gly
390 395 400 405
Val Ile Gly Leu Glu Glu Gly Gln Ser Leu Ala Asp Gln Thr Val Pro
410 415 420
Ile Val Pro Ala Arg Gly Pro Gln Met Thr Ala Ala Ala Arg Ala Asp
425 430 435
Phe Ala Asp Phe Leu Trp Glu Leu Glu Arg Asp Tyr Trp Trp Gly Met
440 445 450
Tyr Arg Phe Leu Lys Glu Glu Leu Lys Leu Lys Pro Leu Val Ala Gly
455 460 465
Thr Gln Leu Ser Tyr Ser Pro Val His Ile Gln Ala Gly Leu Asp Tyr
470 475 480 485
Ile Asp Ser His Ala Tyr Trp Gln His Pro Val Phe Pro Gly Arg Pro
490 495 500
Trp Asp Pro Glu Asn Trp Tyr Val Arg Ser Leu Ala Leu Val Asn Gln
505 510 515
Pro Gly Gly Thr Leu Ser Gly Leu Ala Ser Arg Arg Val Glu Gly Leu
520 525 530
Pro Phe Thr Val Ser Glu Tyr Asn His Pro Ala Pro Asn Glu Tyr Ala
535 540 545
Ala Glu Gly Phe Pro Met Ile Ala Ala Phe Gly Ala Phe Gln Asp Trp
550 555 560 565
Asp Gly Ile Phe Ser Phe Thr Tyr Ser His Ser Arg Asp Tyr Glu Pro
570 575 580
Arg Lys Ile Thr Gly Phe Phe Asp Ile Lys Ser Glu Val Thr Lys Leu
585 590 595
Val His Met Pro Ala Cys Val Ala Met Phe Tyr Arg Gly Asp Val Gln
600 605 610
Pro Ala Thr Gln Ala Val Val Val Gly Met Thr Arg Glu Lys Glu Gln
615 620 625
Ser Ile Leu Arg Glu Thr Leu Asn Pro Trp Ala Leu Thr Ala Asp Arg
630 635 640 645
Leu Gly Ile Pro Ala Asn Leu Ser Leu Leu His Arg Val Ala Met Ala
650 655 660
Leu Lys Glu Pro Ser Asp Ser Val Pro Pro Pro Thr Leu Ser Ala Glu
665 670 675
Gln Lys Val Phe Leu Ser Asp Thr Gln Gln Ile Cys Trp Asp Val Ser
680 685 690
Gln Pro Gly Ala Gly Val Phe Leu Val Asn Ser Pro Lys Thr Lys Leu
695 700 705
Val Thr Gly Phe Pro Ala Gly Arg Thr Phe Asn Leu Asn Gly Ile Gln
710 715 720 725
Ile Gln Ile Gly Glu Thr Glu Leu Gly Trp Ala Thr Val Ser Leu Thr
730 735 740
Val Ile Lys Gly Asp Gly Phe Asp Arg Pro Gly Arg Ile Leu Leu Ala
745 750 755
Ala Thr Gly Lys Ala Gln Asn Thr Gly Trp Asp Phe Arg Lys Glu Gly
760 765 770
Asp Arg Val Thr Val Gly Arg Arg Trp Gly Asp Glu Pro Ile Leu Cys
775 780 785
Glu Gly Val Pro Ala Arg Ile Val Leu Pro Val Ser Ser Ser Arg Val
790 795 800 805
Lys Val Tyr Ala Leu Asp Glu Ala Gly Arg Arg Arg Asp Ala Val Thr
810 815 820
Val Ser Gly Gly Asp Gln Ala Val Val Glu Ile Gly Pro Gln Phe Arg
825 830 835
Thr Leu Trp Tyr Glu Ile Glu Ile Gln
840 845

Claims (15)

1.一种组合物,该组合物包括具有内切葡聚糖酶活性和/或对用黄原胶裂解酶预处理的黄原胶具有活性的多肽,该多肽选自下组,该组由以下各项组成:
(a)与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽;
(b)由多核苷酸编码的多肽,该多核苷酸在中严格条件下与(i)SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQID NO:39中任一项的成熟多肽编码序列,(ii)(i)的全长补体杂交;
(c)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ IDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ IDNO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ IDNO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的变体,该变体在一个或多个位置包括取代、缺失、和/或插入;和
(e)(a)、(b)、(c)、或(d)的多肽的片段,该片段具有内切葡聚糖酶活性并且对用黄原胶裂解酶预处理的黄原胶具有活性。
2.如权利要求1所述的组合物,其中该多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一项的成熟多肽的变体,该变体在一个或多个位置,例如高达10个,例如,1、2、3、4、5、6、7、8、9、或10个位置包括取代、缺失、和/或插入。
3.如权利要求1或2中任一项所述的组合物,其中该成熟多肽是SEQ ID NO:2中位置1至813中所示的多肽,SEQ ID NO:4中位置1至836中所示的多肽,SEQ ID NO:6中位置1至949中所示的多肽,SEQ ID NO:8中位置1至830中所示的多肽,SEQ ID NO:10中位置1至866中所示的多肽,SEQ ID NO:12中位置1至827中所示的多肽,SEQ ID NO:14中位置1至903中所示的多肽,SEQ ID NO:16中位置1至932中所示的多肽,SEQ ID NO:18中位置1至920中所示的多肽,SEQ ID NO:20中位置1至844中所示的多肽,SEQ ID NO:22中位置1至849中所示的多肽,SEQ ID NO:24中位置1至903中所示的多肽,SEQ ID NO:26中位置1至894中所示的多肽,SEQID NO:28中位置1至894中所示的多肽,SEQ ID NO:30中位置1至955中所示的多肽,SEQ IDNO:32中位置1至894中所示的多肽,SEQ ID NO:34中位置1至893中所示的多肽,SEQ ID NO:36中位置1至894中所示的多肽,SEQ ID NO:38中位置1至894中所示的多肽,和SEQ ID NO:40中位置1至867中所示的多肽中的任一项。
4.如权利要求4所述的组合物,该组合物进一步包括具有黄原胶裂解酶活性的多肽。
5.如权利要求1至4中任一项所述的组合物,该组合物是洗涤剂组合物,该洗涤剂组合物包括一种或多种洗涤剂组分。
6.如权利要求1至5中任一项所述的组合物,其中这些洗涤剂组分选自下组,该组包括表面活性剂、助洗剂、助水溶剂、漂白系统、聚合物、织物调色剂、辅料、分散剂、染料转移抑制剂、荧光增白剂以及污垢释放聚合物,或其任何混合物。
7.如权利要求1至6中任一项所述的组合物,其中该洗涤剂组合物处于以下形式:棒,均匀的片剂,具有两个或更多个层的片剂,具有一个或多个室的袋,规则的或压缩的粉末,颗粒,膏,凝胶,或规则的、压缩的或浓缩的液体。
8.根据权利要求1至7中任一项所述的组合物用于降解黄原胶的用途。
9.如权利要求8所述的用途,用于控制钻井液的粘度。
10.如权利要求8所述的用途,用于洗涤或清洁纺织品和/或硬表面,例如餐具洗涤。
11.根据权利要求1至7中任一项所述的组合物用于降解纤维素材料的用途。
12.一种用于降解黄原胶的方法,该方法包括向黄原胶施用根据权利要求1至8中任一项所述的组合物。
13.如权利要求12所述的方法,其中该黄原胶在纺织品的表面上或硬表面上,例如餐具洗涤。
14.如权利要求12所述的方法,其中该黄原胶在由钻井孔穿透的地下地层的压裂中使用。
15.如权利要求12所述的方法,其中该黄原胶是钻孔滤饼中的组分。
CN201580027144.9A 2014-05-28 2015-05-28 具有内切葡聚糖酶活性的多肽 Pending CN106414731A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP14170309.0 2014-05-28
EP14170186 2014-05-28
EP14170186.2 2014-05-28
EP14170309 2014-05-28
EP14181370.9 2014-08-19
EP14181370 2014-08-19
PCT/EP2015/061837 WO2015181292A1 (en) 2014-05-28 2015-05-28 Polypeptides having endoglucanase activity

Publications (1)

Publication Number Publication Date
CN106414731A true CN106414731A (zh) 2017-02-15

Family

ID=54698142

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580027144.9A Pending CN106414731A (zh) 2014-05-28 2015-05-28 具有内切葡聚糖酶活性的多肽

Country Status (4)

Country Link
US (1) US20170175047A1 (zh)
EP (1) EP3149164A1 (zh)
CN (1) CN106414731A (zh)
WO (1) WO2015181292A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108559721A (zh) * 2018-05-15 2018-09-21 北京师范大学 一种净化空气的复合微生物菌剂及其应用

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023547843A (ja) 2020-10-29 2023-11-14 ザ プロクター アンド ギャンブル カンパニー アルギン酸リアーゼ酵素を含有するクリーニング組成物
CA3201033A1 (en) 2020-12-23 2022-06-30 Basf Se Amphiphilic alkoxylated polyamines and their uses
CA3199985A1 (en) 2021-03-15 2022-09-22 Lars Lehmann Hylling Christensen Cleaning compositions containing polypeptide variants
WO2022235720A1 (en) 2021-05-05 2022-11-10 The Procter & Gamble Company Methods for making cleaning compositions and detecting soils
EP4108767A1 (en) 2021-06-22 2022-12-28 The Procter & Gamble Company Cleaning or treatment compositions containing nuclease enzymes
WO2023064749A1 (en) 2021-10-14 2023-04-20 The Procter & Gamble Company A fabric and home care product comprising cationic soil release polymer and lipase enzyme
EP4273209A1 (en) 2022-05-04 2023-11-08 The Procter & Gamble Company Machine-cleaning compositions containing enzymes
EP4273210A1 (en) 2022-05-04 2023-11-08 The Procter & Gamble Company Detergent compositions containing enzymes

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009020459A2 (en) * 2006-08-04 2009-02-12 Verenium Corporation Glucanases, nucleic acids encoding them and methods for making and using them
WO2013167581A1 (en) * 2012-05-07 2013-11-14 Novozymes A/S Polypeptides having xanthan degrading activity and polynucleotides encoding same

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4690891A (en) * 1985-09-11 1987-09-01 Exxon Research And Engineering Company Method and the microorganism and enzyme used therein for degrading the xanthan molecule

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009020459A2 (en) * 2006-08-04 2009-02-12 Verenium Corporation Glucanases, nucleic acids encoding them and methods for making and using them
WO2013167581A1 (en) * 2012-05-07 2013-11-14 Novozymes A/S Polypeptides having xanthan degrading activity and polynucleotides encoding same

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
UIPROT: "B4D329", 《UIPROT》 *
UIPROT: "C5BRA3", 《UIPROT》 *
UIPROT: "W0J4V4", 《UIPROT》 *
UIPROT: "W0JCM7", 《UIPROT》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108559721A (zh) * 2018-05-15 2018-09-21 北京师范大学 一种净化空气的复合微生物菌剂及其应用

Also Published As

Publication number Publication date
EP3149164A1 (en) 2017-04-05
WO2015181292A1 (en) 2015-12-03
US20170175047A1 (en) 2017-06-22

Similar Documents

Publication Publication Date Title
US9988616B2 (en) Polypeptides having xanthan degrading activity and polynucleotides encoding same
CN106414730A (zh) 具有内切葡聚糖酶活性的多肽
CN106414731A (zh) 具有内切葡聚糖酶活性的多肽
US11549104B2 (en) Polypeptides having beta-glucanase activity, polynucleotides encoding same and uses thereof in cleaning and detergent compositions
CN105992820A (zh) 具有蛋白酶活性的多肽和编码它们的多核苷酸
CN105814200A (zh) 具有蛋白酶活性的多肽以及编码它们的多核苷酸
CN106414729A (zh) α‑淀粉酶变体以及对其进行编码的多核苷酸
CN105358670A (zh) 具有抗再沉积效果的具黄原胶裂解酶活性的多肽与编码它们的多核苷酸
CN106414698A (zh) 洗涤剂组合物
CN108350443A (zh) 具有黄原胶降解活性的多肽以及编码它们的多核苷酸
CN106133135A (zh) β‑葡聚糖酶变体以及编码它们的多核苷酸
CN109563451A (zh) 包含gh9内切葡聚糖酶变体i的洗涤剂组合物
CN109563498A (zh) 包含黄原胶裂解酶变体i的洗涤剂组合物
EP3947619A1 (en) Polypeptides having beta-glucanase activity, polynucleotides encoding same and uses thereof in cleaning and detergent compositions
CN109844110A (zh) 黄原胶裂解酶变体以及编码它们的多核苷酸
WO2022074037A2 (en) Alpha-amylase variants
AU2020242303A1 (en) Alpha-amylase variants and polynucleotides encoding same
EP4291646A2 (en) Alpha-amylase variants
CN108603187A (zh) 具有蛋白酶活性的多肽以及编码它们的多核苷酸
CN108473974A (zh) 具有蛋白酶活性的多肽以及编码其的多核苷酸
CN104837990A (zh) 具有叶绿素酶活性的多肽和对其进行编码的多核苷酸
CN105324482A (zh) 具有淀粉酶活性的多肽以及对其进行编码的多核苷酸
CN108779449A (zh) 具有蛋白酶活性的多肽以及编码其的多核苷酸
WO2018206535A1 (en) Carbohydrate-binding domain and polynucleotides encoding the same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170215

WD01 Invention patent application deemed withdrawn after publication