CN101243181A - 芽孢杆菌属菌种p203菌株的多肽 - Google Patents

芽孢杆菌属菌种p203菌株的多肽 Download PDF

Info

Publication number
CN101243181A
CN101243181A CNA2006800300118A CN200680030011A CN101243181A CN 101243181 A CN101243181 A CN 101243181A CN A2006800300118 A CNA2006800300118 A CN A2006800300118A CN 200680030011 A CN200680030011 A CN 200680030011A CN 101243181 A CN101243181 A CN 101243181A
Authority
CN
China
Prior art keywords
seq
glu
polypeptide
gly
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800300118A
Other languages
English (en)
Inventor
普雷本·尼尔森
马丁·博彻特
莱因哈德·威尔廷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN101243181A publication Critical patent/CN101243181A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • C12N9/54Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2468Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1) acting on beta-galactose-glycoside bonds, e.g. carrageenases (3.2.1.83; 3.2.1.157); beta-agarase (3.2.1.81)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01008Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/02Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amides (3.5.2)
    • C12Y305/02006Beta-lactamase (3.5.2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/01001Carbonate dehydratase (4.2.1.1), i.e. carbonic anhydrase

Abstract

本发明公开了新菌株芽孢杆菌属菌种P203(Bacillus plakortiensis);还公开了获得自以登录号DSM 17419保藏的细菌菌株芽孢杆菌属菌种P203的分离的成熟功能性多肽。

Description

芽孢杆菌属菌种P203菌株的多肽
发明领域
本发明涉及功能性多肽,所述多肽由新的芽孢杆菌属(Bacillus)菌种Bacillus plankortiensis的菌株基因组中包含的多核苷酸编码。该菌种的参考菌株是作为DSM 17419保藏的芽孢杆菌属菌种P203(Bacillus sp.P203)。本发明还涉及编码这些多肽或促进它们的表达的多核苷酸和这些多核苷酸的构建体,以及用于制备所述多肽的方法。本发明更进一步涉及包含所述多肽和多核苷酸的组合物,以及所述多肽的用途。本发明还进一步涉及以登录号DSM17419保藏的细菌芽孢杆菌属菌种P203。
发明背景
嗜碱芽孢杆菌属菌株(alkaliphilic Bacillus strains)是工业生物技术中的焦点。嗜碱菌株并且特别是这些菌种的酶,在生物技术方法需要高pH值下的酶活性(或甚至最大活性)的生物技术应用中有巨大的潜力(Horikoshi:Alkaliphiles:Some Applications of Their Products for Biotechnology;Microbiology and Molecular Biology Reviews,Vol.63,No.4,1999)。作为新催化剂来源的嗜碱芽孢杆菌属菌株的实例是克劳氏芽孢杆菌(B.clausii)、B.pseudofirmus、B.clarkii、B.gibsonii。在寻求新酶的过程中,还已知通过对可能的候选物进行特异性酶试验来筛选这些新酶。这种方法受到酶试验可用性的限制,并且无法鉴定活性还未知的功能性酶或多肽。
此外,全基因组测序是从给定微生物获得全部基因信息的一种已知方法,例如Fleischmann et al.;Whole genome sequences and assembly of Haemophilusinfluenzae Rd;Nature 269:496-512;(1995)中所述。
大多数用于工业用途的酶是由微生物分泌至介质(medium)的酶。然而,微生物基因组中只有小部分编码分泌性蛋白。例如,枯草芽孢杆菌基因组或其最近的亲缘菌株基因组中仅大约4%编码分泌性蛋白(Van Dijl et al.:Proteintransport pathways in Bacillus subtilis:a genome-based road map;in“Bacillussubtilis and its closest relatives-From genes to cells;p.337-355;A.L.Sonenshein(ed.);ASM Press 2002)。
基因组测序的一个缺点是获得的序列中绝大多数编码非分泌性蛋白。
基因组测序的另一个缺点(尤其对于真核生物如真菌)是,基因组大小较之细菌基因组大许多倍,使得用这种方法来发现基因的成本更高并且费时更久。
cDNA的随机测序(表达序列标签或EST)是能够发现分泌性蛋白的另一种方法。通常而言,EST方法具有两个与分泌性蛋白鉴定有关的缺点;1)依赖于测序cDNA文库所用的诱导条件,非常少的cDNA,通常是0.5%-15%或者甚至1-5%的cDNA编码分泌性蛋白。2)克隆全部来自由mRNA得到的cDNA汇集物(pool),所述mRNA存在于生物体中,与各个特定基因的诱导水平成比例。
还已知信号捕获(signal trapping),它是一种使用与自身缺乏信号的细胞外报告基因的翻译融合来鉴定基因(包括编码信号肽的核苷酸)的方法(WO01/77315)。
发明简述
本发明发现新的芽孢杆菌属菌种Bacillus plankortiensis的菌株。这种菌种的参考/模式菌株是以DSM 17419保藏的芽孢杆菌属菌种P203。所述菌株在pH(7-11)和低温(4-30℃)下生长。对这种菌株感兴趣的原因在于,公知菌株和菌株DSM17419之间的系统发生学距离(phylogenetic distance)显著,并且该菌株的生长条件与工业酶的多种应用中的条件相似。
微生物的基因组含有数千种不同的基因;某些基因编码多肽,某些基因编码RNA。微生物的基因组中仅有限数目的基因编码功能性多肽,所述功能性多肽由该微生物分泌至周围的介质,为微生物提供外部作用(externalpurpose)。这些多肽引起工业上兴趣的原因是,可在连续过程中以可观的量产生这些多肽而不破坏产生该多肽的细胞。
本发明的目的是鉴定和提供从芽孢杆菌属菌种P203菌株分泌的多肽,该菌种以登录号DSM 17419保藏,所述多肽对芽孢杆菌属菌种P203菌株具有功能性作用,因为这些多肽不但可用于工业目的,而且它们还可按工业上相关的方法和量来产生。
在第一个方面,本发明提供功能性多肽,所述多肽由芽孢杆菌属菌种Bacillus plankortiensis菌株的基因组中包含的多核苷酸编码,该菌株以登录号DSM 17419保藏;本发明还提供分离的成熟功能性多肽,其与可获得自细菌菌株芽孢杆菌属菌种P203的相应的分泌性多肽有至少70%同一性并且显示相同的功能。
在进一步的方面,本发明提供编码本发明所述多肽的多核苷酸;包含编码所述多肽的多核苷酸的核苷酸构建体,所述多核苷酸与指导多肽在宿主细胞中产生的一种或多种调控序列可操作地连接;包含本发明所述核苷酸构建体的重组表达载体和包含本发明所述核苷酸构建体的重组宿主细胞。
在更进一步的方面,本发明提供制备本发明所述多肽的方法,其包括:
(a)培养菌株,所述菌株包含编码本发明的多肽的核苷酸序列,并且能够表达和分泌所述多肽,和
(b)回收所述多肽。
在进一步的方面,本发明提供包含本发明的多肽的组合物;和用于制备这种组合物的方法,其包括将本发明所述多肽与赋形剂混合。
在进一步的方面,本发明提供包含本发明的多核苷酸的组合物;和用于制备这种组合物的方法,包括将本发明所述多核苷酸与赋形剂混合。
在进一步的方面,本发明提供本发明所述多肽或包含所述多肽的组合物在多种应用中的用途。
在最后的方面,本发明提供电子存储介质,其包含本发明的多肽的氨基酸序列信息或本发明的多核苷酸的核苷酸序列信息。
序列表
本申请含有附加在申请中的序列表形式的信息,并且还于数据载体上随本申请一同提交。将数据载体的内容完整并入本文以作参考。
SEQ ID NO:1编码SEQ ID NO:2中包含的丝氨酸蛋白酶;SEQ ID NO:3编码SEQ ID NO:4中包含的碳酸酐酶;SEQ ID NO:5编码SEQ ID NO:6中包含的碳酸酐酶;SEQ ID NO:7编码SEQ ID NO:8中包含的木聚糖酶;SEQID NO:9编码SEQ ID NO:10中包含的多聚鼠李半乳糖醛酸裂合酶(rhamnogalacturonan lyase);SEQ ID NO:11编码SEQ ID NO:12中包含的半乳聚糖酶。
附图简述
图1显示芽孢杆菌属菌种P203的生长特征。
图2显示来自芽孢杆菌属菌种P203的碳酸酐酶的稳定性。
图3显示乙酰唑胺(acetazolamide)对碳酸酐酶的抑制。
图4显示金属离子、叠氮化物和其它试剂对碳酸酐酶的抑制。
发明详述
定义
术语“同一性”用于本文中应理解为两个氨基酸序列之间或两个核苷酸序列之间的同源性。就本发明而言,通过使用Vector NTI 7.1版(Informax inc.,7600 Wisconsin Avenue,Suite#1100,Bethesda,MD 20814,USA)程序中的AlignX确定两个氨基酸序列之间的同一性程度。使用Clustal W算法(NucleicAcid Research,22(22):4673-4680,1994)产生氨基酸比对。使用以下的附加参数:缺口开启罚分(Gap opening penalty)为10,缺口延伸罚分(Gap extensionpenalty)为0.05,缺口分离罚分范围(Gap separation penalty range)为8。配对比对参数是K元组(Ktuple)=1,缺口罚分=3,缺口长度开启罚分(gap lengthopening penalty)=10,缺口延伸罚分=0.1,窗口大小(window size)=5和对角线(diagonals)=5。使用如上所述相同的算法和软件包确定两个核苷酸序列之间的同一性程度,例如采用以下设定:缺口罚分为10,并且缺口长度罚分为10。配对比对参数是K元组=3,缺口罚分=3和窗口=20。
术语“功能性多肽”用于本发明上下文中的意思是能够由细胞表达和分泌的多肽,并且所述多肽组成操作单元,其能够依据设计以通过细胞完成的功能来进行操作。任选地,所述多肽可能需要辅因子以具有预期的功能。功能性多肽的一个实例是催化活性多肽或酶,其辅助细胞催化细胞周围环境中的反应。另外的实例可以是作为信号物质发挥作用的多肽。进一步的实例是作为对环境参数(细胞周围环境中的化学物质)的感应物(sensor)(受体)而发挥功能的多肽,或对于其它生物体具有活性的多肽(抗微生物的(多)肽)或对细胞的结构完整性作出贡献的多肽。
术语“成熟区”用于本文涉及氨基酸序列或多肽的部分,意思是氨基酸序列或多肽中作为成熟功能性多肽的部分或区或结构域或片段。
术语“核苷酸序列中编码成熟多肽的区”用于本文的意思是核苷酸序列中,从编码成熟多肽第一个氨基酸的三联体算起,直至编码成熟多肽最后一个氨基酸的三联体的区。
术语“分泌性多肽”用于本文应理解为在细胞中表达之后,被转运或释放至周围的胞外介质中的多肽,或被结合/嵌入至细胞膜中而使该多肽的至少一部分曝露于周围的胞外介质的多肽。
本发明的多肽
本发明涉及多肽,其与可获得自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的分泌性多肽相似。具体而言,本发明提供分离的成熟功能性多肽,所述多肽与可获得自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的相应分泌性多肽是至少70%,优选80%或更高,例如90%、95%、96%、97%、98%或99%同一的,并且显示与其相同的功能。
具体而言,本发明的多肽由以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株分泌,目的是为所述的具体细胞提供功能。
在以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株基因组的数千种可能的基因中,测定这种基因组中编码SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的6种分泌性功能性成熟多肽的多核苷酸是功能性的,即所述多核苷酸由所选宿主细胞翻译成功能性多肽。
此外在具体的实施方式中,用包含SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区的多核苷酸转化大肠杆菌宿主,在培养所述大肠杆菌宿主时,编码成熟多肽的基因全部能够表达,并且它们对应的成熟多肽能够分泌。通过比较6种多肽序列与已知序列的同源性或同一性,对所述多肽的具体功能进行注释。确定全部6种分泌性功能性多肽均为酶。
具体而言,所述分离的多肽选自下组:
(a)具有氨基酸序列的多肽,所述氨基酸序列与选自下组的氨基酸序列有至少70%同一性:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟多肽,和
(b)由核苷酸序列编码的多肽,所述核苷酸序列在高严紧条件下与选自下组的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自下组:SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区,
(ii)核苷酸序列中包含的cDNA序列的互补链,所述核苷酸序列选自:SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区;
其中所述多肽显示SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10和SEQ ID NO:12中相应的成熟多肽的功能。
在一个具体实施方式中,本发明的多肽选自:由以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株分泌并且由本发明人分离的酶;即选自下组的酶:木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶。
本发明还提供选自下组的分离的酶:
(a)包含氨基酸序列的酶,所述氨基酸序列与选自下组的成熟酶的氨基酸序列有至少70%同一性:由以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株分泌的木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶,和
(b)由核苷酸序列编码的酶,所述核苷酸序列在高严紧条件下与选自下组的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列包含于以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株中,并编码选自下组的成熟酶:由该菌株分泌的木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶;
(ii)核苷酸序列中包含的cDNA序列的互补链,所述核苷酸序列包含于以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株中,并且编码选自下组的成熟酶:从该菌株分泌的木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶;并且
其中所述酶具有选自木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶的功能。
本发明的多肽是分离的多肽,优选本发明所述多肽的制备物含有按重量计至多90%的可能与其天然结合的(natively associated)其它多肽材料(更低百分比的其它多肽材料是优选的,例如按重量计至多80%,按重量计至多60%,按重量计至多50%,按重量计至多40%按重量计至多30%,按重量计至多20%,按重量计至多10%,按重量计至多9%,按重量计至多8%,按重量计至多6%,按重量计至多5%,按重量计至多4%,按重量计至多3%,按重量计至多2%,按重量计至多1%和按重量计至多0.5%)。因此,优选本发明所述分离的多肽是至少92%纯,即本发明所述多肽按重量计占制备物中存在的全部多肽材料的至少92%,并且更高的百分比是优选的,例如至少94%纯,至少95%纯,至少96%纯,至少96%纯,至少97%纯,至少98%纯,至少99%和至多99.5%纯。具体而言,优选本发明所述多肽是“基本上(essentially)纯的形式”,即所述多肽制备物基本上不含与其天然结合的其它多肽材料。这能够通过例如借助熟知的重组方法制备本发明所述多肽来实现。
本发明所述多肽可以是合成制备的、天然存在的或它们的组合。在具体的实施方式中,本发明的多肽可以从微生物获得,所述微生物例如原核细胞、古细菌细胞或真核细胞。可通过遗传工程对所述细胞进行进一步修饰。
在具体实施方式中,本发明所述多肽是在大约10℃至大约80℃范围内(特别在大约20℃至大约60℃的范围内)的温度显示最优酶活性的酶。
在具体实施方式中,本发明所述多肽是酶,其在高至100℃,特别是高至80℃,更特别是高至60℃的温度在功能上稳定。
在具体实施方式中,本发明所述多肽是酶,其显示出选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟酶的酶活性的至少20%,特别至少40%,例如至少50%,特别是至少60%,例如至少70%,更特别是至少80%,例如至少90%,最特别至少95%,例如大约或至少100%的酶活性。
具体而言,所述分离的成熟功能性多肽与可获得自以登录号DSM 17419保藏的细菌菌株芽孢杆菌属菌种P203的相应分泌性多肽是至少70%同一的并且显示与其相同的功能;特别地,本发明所述多肽包含、含有或由下述氨基酸序列组成,所述氨基酸序列与选自由SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟多肽组成的组中的多肽序列具有至少70%同一性。百分比同一性特别是至少95%,例如至少96%,例如至少97%,并且甚至更特别是至少98%,例如至少99%或甚至100%的同一性。
在另外的具体实施方式中,百分比同一性是至少50%;特别是至少60%,特别是至少65%,特别是至少70%,特别是至少75%,特别是至少80%,并且甚至更特别是至少85%的同一性。
在具体实施方式中,本发明所述多肽的氨基酸序列与SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟多肽有至多十个氨基酸(例如十个氨基酸),特别是至多五个氨基酸(例如五个氨基酸),例如至多四个氨基酸(例如四个氨基酸),例如至多三个氨基酸(例如三个氨基酸),特别是至多两个氨基酸(例如两个氨基酸),例如一个氨基酸的差异。
本发明的多肽可以是野生型多肽,其分离自天然来源例如登录号为DSM17419的芽孢杆菌属菌种P203菌株的菌株,或其它野生型菌株;然而本发明还包含人工变体,在所述人工变体中例如通过在所述多肽中添加、取代和/或缺失一个或多个氨基酸来对本发明的多肽进行突变,并且同时保持该多肽的功能和/或其它性质。因此,本发明的多肽可以是人工变体,在所述人工变体中,对包含成熟多肽或由成熟多肽组成的氨基酸序列进行氨基酸的至少一个取代、缺失和/或插入,所述成熟多肽是SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟多肽。
本发明的多肽还包括本发明所述氨基酸序列的功能性片段,和编码本发明所述氨基酸序列的功能性片段的核酸,包括如本文所述由以登录号DSM17419保藏的芽孢杆菌属菌种P203菌株的菌株分泌的成熟酶的片段,包括选自下组的酶的片段:由以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株分泌的木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶。
人工变体可通过本领域已知的标准技术构建,其后通常进行筛选和/或表征。标准技术包括经典诱变,例如通过UV照射细胞或用化学诱变剂处理细胞,如Gerhardt et al.(1994)所述;体内基因改组,如WO 97/07205中所述;体外改组,如Stemmer,(1994)或WO 95/17413所述,随机诱变,如EisenstadtE.et al.,(1994)所述;PCR技术,如Poulsen et al.(1991)所述;家族改组(familyshuffling),如J.E.Ness,et al,Nature Biotechnology,vol.17,pp.893-896(1999)所述;定点诱变,如Sambrook et al.(1989),Sambrook et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor,NY所述。对核苷酸取代的概述可见于例如Ford et al.,1991,Protein Expression and Purification 2,p.95-107。
也可以使用这些标准遗传工程方法,从编码一种或多种本发明的亲本酶的基因中制备变体核苷酸序列的各种文库,将酶变体在适当的宿主细胞中表达,并且选择优选的变体。通过本领域已知的一系列技术能够建立各种文库(Reetz MT;Jaeger KE,in Biocatalysis-from Discovery to Application edited byFessner WD,Vol.200,pp.31-57(1999);Stemmer,Nature,vol.370,p.389-391,1994;Zhao and Arnold,Proc.Natl.Acad.Sci.,USA,vol.94,pp.7997-8000,1997;或Yano et al.,Proc.Natl.Acad.Sci.,USA,vol.95,pp 5511-5515,1998)。
在本发明的具体实施方式中,(人工变体以及野生型酶中的)氨基酸改变是对性质较不重要的(of a minor nature),其为不显著影响蛋白质的折叠和/或活性的保守氨基酸取代;小缺失,通常是一至大约30个氨基酸;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,例如多组氨酸序列(poly-histidine tract)、抗原表位或结合域。
保守取代的实例在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸),酸性氨基酸组(谷氨酸和天冬氨酸),极性氨基酸组(谷氨酰胺和天冬酰胺),疏水性氨基酸组(亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸),芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸和苏氨酸)。大体上不改变和/或削弱蛋白质功能的氨基酸取代是本领域已知的,例如H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York所述。最常出现的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly以及这些反过来的交换。
在具体实施方式中,氨基酸改变具有这样的性质使得多肽的理化性质改变。例如,可进行改进酶热稳定性的氨基酸改变、改变底物特异性的氨基酸改变、改变最适pH的氨基酸改变等。
具体而言,在本发明的多肽中,尤其在选自由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟多肽组成的组的多肽中,用于产生人工变体的这些取代、缺失和/或插入的数目是至多10,如至多9,例如至多8,更优选至多7,例如至多6,如至多5,最优选至多4,例如最多3,如至多2,特别是至多1。
在具体实施方式中,人工变体是变体,其在动物包括人中,与亲本酶相比具有改变的,优选降低的免疫原性,特别是变应原性。术语“免疫原性”在本上下文中应理解为,在施用于动物时,包括静脉内、皮肤、皮下、口服和气管内施用时,人工变体产生改变的(特别是降低的)免疫应答的能力。术语“免疫应答”在本上下文中的意思是,人工变体的施用引起动物体内免疫球蛋白如IgE、IgG和IgM水平的改变,或引起动物体内细胞因子水平的改变。定位蛋白中的免疫原/抗原表位、制备免疫原性改变的变体的方法和测量免疫应答的方法是本领域熟知的,并且在例如WO 92/10755、WO 00/26230、WO00/26354和WO 01/31989中描述。术语“变应原性”在本上下文中应理解为,引起动物体内IgE产生改变(特别是降低)的人工变体能力,以及结合来自所述动物的IgE的能力。具体而言,将所述多肽变体气管内施用于动物所产生的变应原性是特别感兴趣的(也称作呼吸变应原性)。
在进一步的实施方式中,本发明的多肽是由核苷酸序列编码的多肽,所述核苷酸序列在至少高严紧条件下,特别是在非常高严紧条件下,与选自下组的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自下组:SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区,
(ii)核苷酸序列中包含的cDNA序列的互补链,所述核苷酸序列选自下组:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区,
(iii)(i)或(ii)的片段,其编码分泌性多肽,所述分泌性多肽具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ IDNO:12中包含的相应成熟多肽的功能(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,ALaboratory Manual,2d edition,Cold Spring Harbor,New York)。
具体而言,本发明的多肽由包含选自下组的核苷酸序列的多核苷酸编码:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区或由于遗传密码的简并性而与之有所不同的序列。更具体而言,本发明的多肽由下述多核苷酸编码,所述多核苷酸由选自下组的核苷酸序列组成:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区或由于遗传密码的简并性而与之有所不同的序列。
SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区的核苷酸序列或其亚序列,以及SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟多肽的氨基酸序列或其片段,可以用于设计多核苷酸探针,以根据本领域熟知的方法从不同属或种的菌株中鉴定和克隆编码本发明的酶的DNA。具体而言,依据标准的Southern印迹方法,能够使用这些探针与感兴趣的属或种的基因组或cDNA杂交,以在其中鉴定和分离相应的基因。这些探针可能远远短于完整的序列,但长度应为至少15,优选至少25,更优选至少35个核苷酸,如长度是至少70个核苷酸。然而,优选所述多核苷酸探针的长度是至少100个核苷酸。例如,所述多核苷酸探针的长度可以是至少200个核苷酸,至少300个核苷酸,至少400个核苷酸或至少500个核苷酸。甚至可以使用更长的探针,例如,长度是至少600个核苷酸,至少700个核苷酸,至少800个核苷酸或至少900个核苷酸的多核苷酸探针。DNA和RNA探针均可使用。通常对所述探针进行标记用来检测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白标记)。
因此,可以筛选从这些其它生物体制备的基因组DNA或cDNA文库中的DNA,所述DNA与上述探针杂交并且编码本发明的酶。可以通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术,来分离这些其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至或固定在硝酸纤维素或其它适合的载体材料上。为了鉴定与选自SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区的核苷酸具有所需同源性和/或同一性或与所述核苷酸同源和/或同一的克隆或DNA,将具有固定的DNA的载体材料用于Southern印迹。
就本发明而言,杂交表示在高至非常高严紧条件下,核苷酸序列与标记的多核苷酸探针杂交,所述多核苷酸探针又与选自SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区的核苷酸序列杂交。可以使用X射线片或通过本领域已知的任何其它方法检测在这些条件下与多核苷酸探针杂交的分子。只要在本上下文中使用术语“多核苷酸探针”,应将其理解为这样的探针含有至少15个核苷酸。
在感兴趣的实施方式中,多核苷酸探针是选自SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区的核苷酸序列的互补链。
在另一个感兴趣的实施方式中,多核苷酸探针是选自下组的编码酶的核苷酸序列的互补链:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11。在另外的感兴趣的实施方式中,多核苷酸探针是选自下组的核苷酸序列中的成熟多肽编码区的互补链:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区。
对于长度为至少100个核苷酸的长探针,将高至非常高严紧条件定义为在42℃,在5X SSPE、1.0%SDS、5X Denhardt溶液、100μg/ml剪切并且变性的鲑精DNA中,根据标准Southern印迹方法进行预杂交和杂交。优选地,至少100个核苷酸的长探针含有不多于1000个核苷酸。对于长度至少100个核苷酸的长探针,最终使用0.1x SSC、0.1%SDS,在60℃(高严紧性);优选使用0.1x SSC、0.1%SDS,在68℃(非常高严紧性),将载体材料洗涤三次,每次15分钟。
尽管不是特别优选,但是预期同样可以使用较短的探针,例如长度从大约15至99个核苷酸的探针,如长度从大约15至大约70个核苷酸的探针。对于这些短探针,将严紧条件定义为在比用根据Bolton和McCarthy计算法(1962,Proceedings of the National Academy of Sciences USA 48:1390)得出的Tm低5℃至10℃,在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1×Denhardt溶液、1mM焦磷酸钠(sodium pyrophosphate)、1mM磷酸二氢钠(sodium monobasic phosphate)、0.1mM ATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤。
对于长度大约15个核苷酸至99个核苷酸的短探针,将载体材料在比计算得出的Tm低5℃至10℃,在6X SCC加0.1%SDS中洗涤一次15分钟,再使用6X SSC洗涤两次,每次15分钟。
SEQ ID NO:2,丝氨酸蛋白酶
在具体的实施方式中,本发明的多肽是丝氨酸蛋白酶,其包含下述氨基酸序列或由下述氨基酸序列组成:所述氨基酸序列与可获得自芽孢杆菌属菌种P203菌株的丝氨酸蛋白酶,具体而言与可获得自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株的丝氨酸蛋白酶,更具体而言与SEQ IDNO:2中包含的成熟丝氨酸蛋白酶,具有至少70%,如至少80%或85%,特别是至少95%,更特别是至少96%,更特别是至少97%,更特别是至少98%,更特别是至少99%或最特别是100%同一性。在实施例4中将进一步描述本发明的丝氨酸蛋白酶。
SEQ ID NO:4,碳酸酐酶
在具体的实施方式中,本发明的多肽是碳酸酐酶,其包含下述氨基酸序列或由下述氨基酸序列组成:所述氨基酸序列与可获得自芽孢杆菌属菌种P203菌株的碳酸酐酶,具体而言与可获得自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株的碳酸酐酶,更具体而言与SEQ ID NO:4中包含的成熟碳酸酐酶,具有至少70%,如至少80%或85%,特别是至少95%,更特别是至少96%,更特别是至少97%,更特别是至少98%,更特别是至少99%或最特别是100%同一性。在实施例8中将进一步描述本发明的碳酸酐酶。
SEQ ID NO:6,碳酸酐酶
在具体的实施方式中,本发明的多肽是碳酸酐酶,其包含下述氨基酸序列或由下述氨基酸序列组成:所述氨基酸序列与可获得自芽孢杆菌属菌种P203菌株的碳酸酐酶,具体而言与可获得自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株的碳酸酐酶,更具体而言与SEQ ID NO:6中包含的成熟碳酸酐酶,具有至少70%,如至少80%或85%,特别是至少95%,更特别是至少96%,更特别是至少97%,更特别是至少98%,更特别是至少99%或最特别是100%同一性。
SEQ ID NO:8,木聚糖酶
在具体的实施方式中,本发明的多肽是木聚糖酶,其包含下述氨基酸序列或由下述氨基酸序列组成:所述氨基酸序列与可获得自芽孢杆菌属菌种P203菌株的木聚糖酶,具体而言与可获得自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株的木聚糖酶,更具体而言与SEQ ID NO:8中包含的成熟木聚糖酶,具有至少70%,如至少80%或85%,特别是至少95%,更特别是至少96%,更特别是至少97%,更特别是至少98%,更特别是至少99%或最特别是100%同一性。在实施例6中将进一步描述本发明的木聚糖酶。
SEQ ID NO:10多聚鼠李半乳糖醛酸裂合酶
在具体的实施方式中,本发明的多肽是多聚鼠李半乳糖醛酸裂合酶,其包含下述氨基酸序列或由下述氨基酸序列组成:所述氨基酸序列与可获得自芽孢杆菌属菌种P203菌株的多聚鼠李半乳糖醛酸裂合酶,具体而言与可获得自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株的多聚鼠李半乳糖醛酸裂合酶,更具体而言与SEQ ID NO:8中包含的成熟多聚鼠李半乳糖醛酸裂合酶,具有至少70%,如至少80%或85%,特别是至少95%,更特别是至少96%,更特别是至少97%,更特别是至少98%,更特别是至少99%或最特别是100%同一性。在实施例5中将进一步描述本发明的多聚鼠李半乳糖醛酸裂合酶。
SEQ ID NO:12,半乳聚糖酶
在具体的实施方式中,本发明的多肽是半乳聚糖酶,其包含下述氨基酸序列或由下述氨基酸序列组成:所述氨基酸序列与可获得自芽孢杆菌属菌种P203菌株的半乳聚糖酶,具体而言与可获得自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的菌株的半乳聚糖酶,更具体而言与SEQ ID NO:8中包含的成熟半乳聚糖酶,具有至少70%,如至少80%或85%,特别是至少95%,更特别是至少96%,更特别是至少97%,更特别是至少98%,更特别是至少99%或最特别是100%同一性。在实施例7中将进一步描述本发明的半乳聚糖酶。
多核苷酸
本发明还涉及多核苷酸,特别是分离的多核苷酸,其包含编码本发明的多肽的核苷酸序列或由编码本发明的多肽的核苷酸序列组成。在具体的实施方式中,核苷酸序列示于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9和SEQ ID NO:11中,包括由于遗传密码的简并性而与之有所不同的核苷酸序列。在进一步的实施方式中,本发明的多核苷酸序列是经修饰的核苷酸序列,其包含选自下组的核苷酸序列或由选自下组的核苷酸序列组成:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区,并且所述经修饰的核苷酸序列与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中包含的亲本核苷酸序列相比,包含至少一个修饰/突变。
用于分离和/或克隆编码酶的核苷酸序列的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。例如可通过使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选以检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的核苷酸序列。参见,例如,Innis et al.,1990,PCR:A Guide to Methods and Application,AcademicPress,New York。可以使用其它扩增方法,例如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。
可以通过遗传工程中使用的标准克隆方法获得核苷酸序列,所述方法将核苷酸序列从其天然位置重新定位到它将被复制的不同位点。克隆方法可以包括:切除和分离期望的片段,其包含编码多肽的核苷酸序列;将所述片段插入载体分子中;和将重组载体并入宿主细胞中,其中将对所述核苷酸序列的多个拷贝或克隆进行复制。所述核苷酸序列可以是基因组的、cDNA、RNA、半合成的、合成的来源,或它们的任何组合。
具体而言,所述多核苷酸包含下述核苷酸序列,优选由下述核苷酸序列组成,所述核苷酸序列与选自SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区的核苷酸序列具有至少50%同一性。特别地,所述核苷酸序列与选自SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区的核苷酸序列具有至少65%同一性,更特别是至少70%同一性,更特别是至少80%同一性,更特别是至少90%同一性,更特别是至少95%同一性,更特别是至少96%同一性,更特别是至少97%同一性,更特别是至少98%同一性,更特别是至少99%同一性或最特别是100%同一性。特别地,所述核苷酸序列包含选自SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区的核苷酸序列。在甚至更具体的实施方式中,所述核苷酸序列由选自SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQID NO:11中编码成熟多肽的区的核苷酸序列组成。
具体而言,所述多核苷酸包含下述核苷酸序列,优选由下述核苷酸序列组成,所述核苷酸序列编码选自木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶的成熟酶,并且所述核苷酸序列与编码选自下组的成熟酶的核苷酸序列具有至少50%同一性,特别是至少65%同一性,更特别是至少70%同一性,更特别是至少80%同一性,更特别是至少90%同一性,更特别是至少95%同一性,更特别是至少96%同一性,更特别是至少97%同一性,更特别是至少98%同一性,更特别是至少99%同一性或最特别是100%同一性:由以登录号17419保藏的芽孢杆菌属菌种P203菌株的菌株分泌的木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶。
SEQ ID NO:1
在具体实施方式中,本发明的多核苷酸编码丝氨酸蛋白酶,并且包含下述核苷酸序列或由下述核苷酸序列组成,所述核苷酸序列与SEQ ID NO:1中编码成熟丝氨酸蛋白酶的核苷酸序列具有至少70%同一性,更特别是至少80%同一性,更特别是至少90%同一性,更特别是至少95%同一性,更特别是至少96%同一性,更特别是至少97%同一性,更特别是至少98%同一性,更特别是至少99%同一性或最特别是100%同一性。
SEQ ID NO:3
在具体实施方式中,本发明的多核苷酸编码丝氨酸蛋白酶,并且包含下述核苷酸序列或由下述核苷酸序列组成,所述核苷酸序列与SEQ ID NO:3中编码成熟碳酸酐酶的核苷酸序列具有至少70%同一性,更特别是至少80%同一性,更特别是至少90%同一性,更特别是至少95%同一性,更特别是至少96%同一性,更特别是至少97%同一性,更特别是至少98%同一性,更特别是至少99%同一性或最特别是100%同一性。
SEQ ID NO:5
在具体实施方式中,本发明的多核苷酸编码丝氨酸蛋白酶,并且包含下述核苷酸序列或由下述核苷酸序列组成,所述核苷酸序列与SEQ ID NO:5中编码成熟碳酸酐酶的核苷酸序列具有至少70%同一性,更特别是至少80%同一性,更特别是至少90%同一性,更特别是至少95%同一性,更特别是至少96%同一性,更特别是至少97%同一性,更特别是至少98%同一性,更特别是至少99%同一性或最特别是100%同一性。
SEQ ID NO:7
在具体实施方式中,本发明的多核苷酸编码丝氨酸蛋白酶,并且包含下述核苷酸序列或由下述核苷酸序列组成,所述核苷酸序列与SEQ ID NO:7中编码成熟木聚糖酶的核苷酸序列具有至少70%同一性,更特别是至少80%同一性,更特别是至少90%同一性,更特别是至少95%同一性,更特别是至少96%同一性,更特别是至少97%同一性,更特别是至少98%同一性,更特别是至少99%同一性或最特别是100%同一性。
SEQ ID NO:9
在具体实施方式中,本发明的多核苷酸编码丝氨酸蛋白酶,并且包含下述核苷酸序列或由下述核苷酸序列组成,所述核苷酸序列与SEQ ID NO:9中编码成熟多聚鼠李半乳糖醛酸裂合酶的核苷酸序列具有至少70%同一性,更特别是至少80%同一性,更特别是至少90%同一性,更特别是至少95%同一性,更特别是至少96%同一性,更特别是至少97%同一性,更特别是至少98%同一性,更特别是至少99%同一性或最特别是100%同一性。
SEQ ID NO:11
在具体实施方式中,本发明的多核苷酸编码丝氨酸蛋白酶,并且包含下述核苷酸序列或由下述核苷酸序列组成,所述核苷酸序列与SEQ ID NO:11中编码成熟半乳聚糖酶的核苷酸序列具有至少70%同一性,更特别是至少80%同一性,更特别是至少90%同一性,更特别是至少95%同一性,更特别是至少96%同一性,更特别是至少97%同一性,更特别是至少98%同一性,更特别是至少99%同一性或最特别是100%同一性。
对编码本发明多肽的核苷酸序列的修饰对于多肽的合成可能是必需的,所述多肽包含的氨基酸序列与选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟多肽的氨基酸序列相比具有至少一个取代、缺失和/或插入。
对于本领域技术人员显而易见的是,这些修饰能够在保留酶功能的情况下进行,即在对于酶功能重要的区域之外进行。因此优选不修饰例如不取代对于功能关键的氨基酸残基。对于功能关键的氨基酸残基可以根据本领域已知的方法鉴定,例如定点诱变或丙氨酸分区诱变法(参见,例如,Cunninghamand Wells,1989,Science 244:1081-1085)。底物-酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术测定(参见,例如,de Vos et al.,1992,Science 255:306-312;Smith et al.,1992,Journal of Molecular Biology 224:899-904;Wlodaver et al.,1992,FEBS Letters309:59-64)。
此外,可以通过引入核苷酸取代来修饰编码本发明的酶的核苷酸序列,所述取代不产生由核苷酸序列编码的酶的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择。
可以使用本领域已知的任何方法,通过定点诱变来完成将突变引入核苷酸序列,从而将一个核苷酸交换成另一个核苷酸。特别有用的方法是使用带有感兴趣的插入的超螺旋、双链DNA载体和两个含有期望突变的合成引物的方法。各自与载体的相反链(opposite strand)互补的寡核苷酸引物在温度循环(temperature cycling)期间依靠Pfu DNA聚合酶延伸。并入引物之后,产生含有交错切口(staggered nicks)的突变质粒。温度循环之后,使用对甲基化和半甲基化的DNA有特异性的DpnI处理产物,以消化亲本DNA模板并且选择含有突变的合成DNA。也可以使用本领域已知的其它方法。关于核苷酸取代的概述,可以参阅例如Ford et al.,1991,Protein Expression and Purification 2:95-107。
本发明还涉及多核苷酸,其包含下述核苷酸序列,优选由下述核苷酸序列组成,所述核苷酸序列编码本发明的多肽,并且所述核苷酸序列在高严紧条件下,优选在非常高严紧条件下与选自下组的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区,
(ii)核苷酸序列中包含的cDNA序列的互补链,所述核苷酸序列选自SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区,和
(iii)(i)或(ii)的片段,其编码分泌性成熟多肽,所述分泌性成熟多肽具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的相应成熟多肽的功能。
应该理解的是,关于核苷酸序列杂交的详细资料和具体内容应与本发明题为“多肽”的部分中讨论的杂交方面相同或类似。
本发明还包含适合用于电子设备,优选数字设备的存储介质,其包含本发明所述多肽的氨基酸序列信息,或本发明所述多核苷酸的核苷酸序列信息,具体而言电子或数字形式的,如二进制编码或其它数字编码的任何本发明的多肽或多核苷酸。所述存储介质适合地可以是磁盘或光盘,电子设备可以是计算设备,具体而言可将信息以数字形式存储在所述存储介质上。
重组表达载体
本发明还涉及包含本发明所述核酸构建体的重组表达载体。上述的多种核苷酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入核苷酸序列或包含所述序列的核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。
载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
本发明的载体优选地含有一个或多个选择性标记,其允许简单选择转化的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌(Bacillus subtilis)或地衣芽孢杆菌(Bacillus licheniformis)的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞中的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等价物。
优选用在曲霉属(Aspergillus)细胞中的是构巢曲霉(Aspergillus nidulans)或米曲霉(Aspergillus oryzae)的amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。
本发明的载体优选含有元件,其允许载体稳定整合入宿主细胞基因组或允许载体在细胞中独立于基因组自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的核苷酸序列或用于通过同源或非同源重组将载体稳定整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组中。所述额外的核苷酸序列使载体能够整合到宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应该优选含有足够数量的核苷酸,如100至1,500碱基对,优选400至1,500碱基对,并且最优选800至1,500碱基对,其与相应的目标序列高度同源以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
复制起点可以具有突变,所述突变使复制起点在宿主细胞中的功能是温度敏感的(参见,例如,Ehrlich,1978,Proceedings of the National Academy ofSciences USA 75:1433)。
可以将多于一个拷贝的本发明的核苷酸序列插入宿主细胞以增加基因产物的产生。核苷酸序列拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或使所述核苷酸序列包括可扩增的选择性标记基因,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝的细胞,并且由此得到核酸序列的额外拷贝。
用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook et al.,1989,见上文)。
重组宿主细胞
本发明还涉及包含本发明所述核酸构建体的重组宿主细胞,将所述重组宿主细胞有利地用于多肽的重组产生中。将包含本发明核苷酸序列的载体引入宿主细胞中,从而将该载体保留作为染色体整合体(chromosomal integrant)或作为前述的自复制的染色体外载体。
宿主细胞可以是单细胞微生物,例如,原核生物,或非单细胞微生物,例如,真核生物。
有用的单细胞微生物是细菌细胞,如革兰氏阳性细菌,包括但不限于,芽孢杆菌属细胞,例如,嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌和苏云金芽孢杆菌(Bacillus thuringiensis);或链霉菌属(Streptomyces)细胞,例如,浅青紫链霉菌(Streptomyces lividans)和鼠灰链霉菌(Streptomyces murinus),或革兰氏阴性细菌如大肠杆菌和假单胞菌属菌种(Pseudomonas sp.)。在另外优选的实施方式中,芽孢杆菌属细胞是嗜碱的芽孢杆菌属。
可通过如下方法实现将载体引入到细菌宿主细胞:例如原生质体转化(参见,例如,Chang and Cohen,1979,Molecular General Genetics 168:111-115),使用感受态细胞(参见,例如,Young and Spizizin,1961,Journal of Bacteriology81:823-829或Dubnau and Davidoff-Abelson,1971,Journal of MolecularBiology 56:209-221),电穿孔(参见,例如,Shigekawa and Dower,1988,Biotechniques 6:742-751)或接合(参见,例如,Koehler and Thorne,1987,Journalof Bacteriology 169:5771-5278)。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
在优选的实施方式中,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth et al.,In,Ainsworth and Bisby’sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK所定义)以及卵菌门(Oomycota)(如Hawksworth et al.,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworthet al.,1995,见上)。在更优选的实施方式中,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(FungiImperfecti)(芽生菌类(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium SeriesNo.9,1980)中所述。
在更加优选的实施方式中,酵母宿主细胞是念珠菌属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)细胞。
在最优选的实施方式中,酵母宿主细胞是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)细胞。在另外最优选的实施方式中,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另外最优选的实施方式中,酵母宿主细胞是Yarrowia lipolytica细胞。
在另外更优选的实施方式中,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth et al.,1995,见上文,所定义)的所有丝状形式(filamentous form)。丝状真菌的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在甚至更优选的实施方式中,丝状真菌宿主细胞是(但不限于)以下种类的细胞:枝顶孢霉属(Acremonium)、曲霉属、镰孢属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)、青霉属(Penicillium)、梭孢壳属(Thielavia)、Tolypocladium或木霉属(Trichoderma)。
在最优选的实施方式中,丝状真菌宿主细胞是泡盛曲霉(Aspergillusawamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉、黑曲霉(Aspergillus niger)或米曲霉细胞。在另外最优选的实施方式中,丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)或镶片镰孢(Fusarium venenatum)细胞。在甚至最优选的实施方式中,丝状真菌亲本细胞是镶片镰孢(Nirenberg新种)细胞。在另外最优选的实施方式中,丝状真菌宿主细胞是特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicolalanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、土生梭孢霉(Thielavia terrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属宿主细胞的合适方法在EP 238023和Yelton et al.,1984,Proceedings of the National Academy of Sciences USA81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier et al.,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume194,pp 182-187,Academic Press,Inc.,New York;Ito et al.,1983,Journal ofBacteriology 153:163;和Hinnen et al.,1978,Proceedings of the NationalAcademy of Sciences USA 75:1920。
供体菌株
本发明还提供以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株,和包含这种微生物的组合物。
本发明还提供由新菌种(Bacillus plakortiensis)组成的芽孢杆菌属的菌株。所述新菌种包含耐碱和耐盐的(halo-tolerant)芽孢杆菌属菌株,所述菌株在4-30℃的温度,在pH 7-11和0-12%NaCl浓度的培养基中生长。最佳条件是4-20℃,在pH 7.5和10%NaCl中。新菌种的菌株与相关菌株可进一步具有以下参数上的不同:所述菌株能够利用甘油、葡萄糖、D-果糖、D-甘露糖、D-甘露醇、熊果苷(arbutin)、七叶苷(aesculin)、水杨苷(salicine)、明胶、柠檬酸(citrate)、甘油基三丁酸酯(glyceryl tributyrate)、D-麦芽糖、D-海藻糖、脱脂乳、AZCL-酪蛋白、AZCL-阿聚糖(AZCL-arabinan)和AZCL-半乳聚糖,而不能利用淀粉、Tween 20、AZCL-木葡聚糖、AZCL-支链淀粉(AZCL-pullulan)、AZCL-阿拉伯木聚糖、AZCL-糊精(AZCL-dextrain)、AZCL-纤维素、AZCL-β-葡聚糖、AZCL-木聚糖、还原型直链淀粉(red amylose)、还原型支链淀粉(redpullulan)和还原型淀粉(red starch)。观察到ONPG的水解。吲哚(indol)产生(使用Kovács试剂)为阴性,Voges Proskauer反应(乙偶姻(acetoin)产生)以及对过氧化氢酶和氧化酶活性的测试为阳性。
菌株P203与模式株Bacillus gibsonii(登录号DSM8722)就16S rDNA序列而言具有98%核苷酸同一性。菌株P203的生长特性示于图1。基于比较性16SrDNA分析,相较于与任何其它已知的芽孢杆菌属菌种,Bacillus plakortiensis与Bacillus gibsonii更具相关性。然而,在DSMZ,Braunschweig,Germany通过反相HPLC测定Bacillus plakortiensis菌株P203和最近缘的已知芽孢杆菌属菌种B.gibsonii模式株之间的DNA同源性是(25.8-29.5%)DNA-DNA杂交和G+C DNA含量。使用弗氏压碎器(French press)(Thermo SpectronicTM)分离DNA,并且通过层析在羟基磷灰石上纯化,如(Cashion,et al.,1977)所述。DNA-DNA杂交如Ley,J.D.,Cattoir,H.&Reynaerts,A.(1970):Thequantitative measurement of DNA hybridization from renaturation rates.Eur JBiochem 12,133-42中所述进行,如Huss,V.A.R.,Festl,H.&Schleifer,K.H.(1983):Studies on the spectrophotometric determination of DNA hybridizationfrom renaturation rates.Syst Appl Microbiol 4,184-192.中所述对该方法进行修改,使用Cary 100型Bio UV/VIS-分光光度计,其配有珀耳帖-恒温6×6多室交换器(Peltier-thermostated 6×6multi cell changer)和带有原位温度探测器的温度控制器(Varian)。
制备酶多肽的方法
本发明还涉及产生本发明的酶的方法,其包括(a)培养包含编码本发明的酶的核苷酸序列的菌株,所述菌株能够表达和分泌该酶,和(b)回收所述酶。在具体的实施方式中,所述菌株是野生型菌株如芽孢杆菌属菌种P203菌株DSM 17419,而在另外的实施方式中,所述菌株是如上文所述的重组宿主细胞。
在本发明的这些方法中,使用本领域已知的方法在适合于产生所述酶的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基可从商业供应商获得或可以根据公布的成分制备(例如,在美国典型培养物保藏中心的目录中)。如果酶分泌到营养培养基中,则能够从所述培养基中直接回收该酶。
可以使用本领域已知的方法回收所得酶。例如,可以通过常规方法从营养培养基中回收酶,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
可以通过本领域已知的多种方法纯化本发明的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,New York,1989)。
本发明的方法还包括WO 01/77315A1的TAST方法,将该方法用于以登录号17419保藏的芽孢杆菌属菌种P203菌株的样品,即:将来自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株基因组(例如来自基因文库)的基因,通过转座子标记,与编码无信号报告分子如β-内酰胺酶的基因融合;在显示报告分子存在的培养基中,如含有氨苄青霉素的培养基中,培养宿主细胞克隆,所述克隆包含与编码无信号报告分子如β-内酰胺酶的基因通过转座子标记融合的、芽孢杆菌属菌种P203菌株DSM 17419的基因;检出分泌报告分子的克隆;并分离该克隆中包含的、以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的基因和多肽。
宿主细胞克隆包含与编码无信号报告分子如β-内酰胺酶的基因通过转座子标记融合的、来自以登录号17419保藏的芽孢杆菌属菌种P203菌株的基因,在显示报告分子存在的培养基(如含有氨苄青霉素的培养基)中培养所述宿主细胞克隆时,将仅检出(例如存活)表达和分泌所述信号分子(例如β-内酰胺酶)的克隆。然而,只有在下述条件下才会分泌报告分子:与报告分子基因融合的基因具有宿主菌株中能够识别的完整启动子和核糖体结合位点(即在现实中(in real life)由细胞表达而产生多肽的基因);并且翻译报告分子以将合成多肽转运通过细胞质膜并且正确折叠。因此,将融合基因插入选择的宿主细胞中时,其中检出报告分子存在(例如氨苄青霉素抗性)的克隆将含有来自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株的基因,所述基因编码功能性分泌性多肽。
转基因植物
本发明还涉及转基因植物、植物部分或植物细胞,将其用编码本发明的酶的核苷酸序列转化,从而表达和产生所述酶。在一个实施方式中,能够将植物作为宿主,用于以可回收的量产生酶。可从植物或植物部分回收酶。或者,可以将含有该重组酶的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheological properties),或用于破坏抗营养因子。具体而言,可以将表达该酶的植物或植物部分用作改进的起始材料,用于燃料酒精(fuel-alcohol)或生物乙醇(bio-ethanol)的生产。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅(festuca)、黑麦草(lolium);寒地型牧草(temperate grass),如Agrostis;和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean),和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧密相关的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber)。具体的植物组织,如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。
表达本发明的酶的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码本发明的酶的一个或多个表达构建体并入植物宿主基因组,并且将所得的修饰植物或植物细胞繁殖成为转基因植物或植物细胞。
表达构建体便利地是包含编码本发明的酶的核苷酸序列的核酸构建体,所述核苷酸序列与在选择的植物或植物部分中表达该核苷酸序列所必需的适当的调节序列可操作地连接。此外,表达构建体可包含对于鉴定整合了表达构建体的宿主细胞有用的选择性标记,和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择,如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达酶而确定。例如,编码本发明酶的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分如种子或叶。调节序列由例如Tague et al.,1988,Plant Physiology 86:506所述。
对于组成性表达,可以使用35S-CaMV(Franck et al.,1980,Cell 21:285-294)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)如种子、马铃薯块茎和果实的启动子(Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)如分生组织的启动子(Itoet al.,1994,Plant Mol.Biol.24:863-878),种子特异性启动子如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu et al.,1998,Plant and Cell Physiology 39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知的种子蛋白基因的蚕豆启动子(Conrad et al.,1998,Journal of Plant Physiology 152:708-711),来自种子油体蛋白(oil body protein)的启动子(Chen et al.,1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本技术领域已知的任何其他种子特异性的启动子,例如,在WO 91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka et al.,1993,PlantPhysiology 102:991-1000),小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adenine methyltransferase)基因启动子(Mitra and Higgins,1994,PlantMolecular Biology 26:85-93),或来自稻的aldP基因启动子(Kagaya et al.,1995,Molecular and general genetics 248:668-674),或伤口诱导型启动子,如马铃薯pin2启动子(Xu et al.,1993,Plant Molecular Biology 22:573-588)。
启动子增强子元件也可以用于实现本发明的酶在植物中的较高表达。例如,启动子增强子元件可以是内含子,将其置于启动子和编码本发明的酶的核苷酸序列之间。例如Xu et al.,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser et al.,1990,Science244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto et al.,1989,Nature338:274)。
目前,根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(genetransfer)是产生转基因双子叶植物的优选方法(为了参考,见Hooykas andSchilperoort,1992,Plant Molecular Biology 19:15-38)。而这种方法也能够用于转化单子叶植物,虽然对于这些植物通常优选其它转化方法。目前,产生转基因单子叶植物的优选的方法是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developing embryos)(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current OpinionBiotechnology 5:158-162;Vasil et al.,1992,Bio/Technology 10:667-674)。转化单子叶植物的可供选择的方法,是基于原生质体转化,如由Omirulleh et al.,1993,Plant Molecular Biology 21:415-428所描述的。
转化之后,根据本领域熟知的方法选择已将表达构建体并入其中的转化体并且再生成为完整植物。
本发明还涉及用于产生本发明的酶的方法,其包括:(a)在有益于产生所述酶的条件下培养转基因植物或植物细胞,其包含编码本发明的酶的核苷酸序列;和(b)回收所述酶。
包含多肽的组合物及其制备
本发明提供包含本发明多肽和优选的赋形剂的组合物;和用于制备这种组合物的方法,其包括将本发明的多肽与赋形剂混合。具体而言,所述组合物包含至少两种不同的本发明多肽,优选至少3种,更优选至少4种,更优选至少5种,更优选至少6种不同的本发明多肽。大多数组合物包含将菌株样品发酵时分泌的全部多肽,所述菌株是以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株,或其突变体,其中缺失或添加了一个或多个基因。
在具体实施方式中,本发明的多肽是组合物(例如单组分组合物)中的主要(多肽)成分。赋形剂在本上下文中应理解为用于配制组合物的任何助剂(auxilliary agent)或化合物,包括溶剂、载体、稳定剂等。
所述组合物可以进一步包含一种或多种额外的酶,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
所述组合物可以依照本领域已知的方法制备,并且可为液体或固体组合物的形式。例如,可以使用本领域已知的配制多肽和/或药物产品的方法配制所述酶组合物,例如配制成包覆或未包覆的颗粒(granule)或微颗粒(micro-granule)。因此可以将本发明的多肽以下述形式提供:颗粒,优选无粉尘(non-dusting)颗粒,液体,尤其是稳定的液体,浆液或保护多肽(protectedpolypeptide)。对于一些应用,可能优选将多肽固定在固体基质上。
可以依照本领域已知的方法使包括在组合物中的多肽稳定,例如通过添加限制多肽氧化的抗氧化剂或还原剂使组合物中的多肽稳定,或通过添加聚合物如PVP、PVA、PEG或其它有益于固体或液体组合物中多肽稳定性的合适聚合物使其稳定。
在进一步的实施方式中,本发明的组合物是洗涤剂组合物,除本发明的多肽之外,所述组合物还包含表面活性剂和任选的选自下组的化合物:增清剂(builders)如沸石,漂白剂如过碳酸盐,漂白增强剂(bleach enhancers)如TAED或NOBS,抑泡剂,芳香剂(fragrants)等。
在进一步的实施方式中,本发明的组合物是饲料组合物,除本发明的多肽之外,所述组合物包含谷类(cereal)或谷物(grain)产品。
在进一步的实施方式中,本发明的组合物是包含本发明多肽的食品组合物,如烘烤用面粉组合物(baker’s flour composition)、酿造产品(brewedproduct)、果汁、油或猪油(lard product)产品。
在进一步的实施方式中,本发明的组合物是制浆组合物(pulpingcomposition),除本发明的多肽之外,所述组合物还包含浆状物(pulp)。
多肽或包含它们的组合物的用途
在更进一步的方面,本发明提供本发明的多肽或多核苷酸或包含所述多肽或多核苷酸的组合物在本文用于商业研究目的的多种应用中的用途,特别是在(技术)处理如工业上或家庭中进行的处理中的用途。因此,本发明包含方法,其包括将本发明的多肽或本发明的多核苷酸用于(技术)工业、研究或家庭处理(household process)中。
在一个实施方式中,将本发明的多肽或组合物用于清洁纤维素织物。
在另一个实施方式中,将本发明的多肽或组合物用于制备食品或饲料添加剂。
而在另一个实施方式中,将本发明的多肽或组合物用于处理木素分解(lignolitic)材料和浆状物。
具体而言,可以使用碳酸酐酶从CO2排放流中固定碳,例如在使用碳酸酐酶从气流分离CO2的膜反应器中,将其用于例如发电烟气排出管(electricalgeneration flue gas stack)、温室气体中的应用,也可用于非常规应用如驾驶员座舱(pilot cockpit)和宇航员太空服,以保持呼吸气体中CO2不在毒性水平。
在另一个实施方式中,碳酸酐酶通过产生能够与溶于含水介质的离子(特别是二价离子如钙)复合的碳酸氢根(bicarbonate),并且辅助这些离子从含水介质中絮凝或沉淀,从而对于促进水从含水介质中的纯化或矿化是有用的。在一些应用中,能够使用这种沉淀作用来降低水硬度,而在其它应用中,如在造纸方法中,或在土壤和岩石的修复(remediation)中,这种沉淀作用可以具有增加某些产品的重量、体积或不透明性(opacity)的额外益处。
此外,也可以使用碳酸酐酶作为药物开发的靶,所述药物如碳酸酐酶抑制剂(例如磺胺类(sulphonamide)衍生物)。
洗涤剂公开
可以将本发明所述多肽添加至洗涤剂组合物,并且由此成为洗涤剂组合物的成分。
可以将本发明的洗涤剂组合物例如配制为手洗或机洗的洗涤剂组合物,包括适合于预处理沾污织物的洗衣添加剂组合物和添加了漂洗剂的织物柔软剂组合物,或将其配制为用于通常家庭硬表面清理操作的洗涤剂组合物,或配制用于手洗或机洗的餐具洗涤(dishwashing)操作。
在具体的方面,本发明提供包含本发明的酶的洗涤剂添加剂。所述洗涤剂添加剂以及洗涤剂组合物可以包含一种或多种其它酶,如蛋白酶、脂肪酶、角质酶、淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶(arabinase)、半乳聚糖酶、木聚糖酶、氧化酶,例如漆酶,和/或过氧化物酶。
通常所选酶的性质应该与选择的洗涤剂相容(即,最适pH,与其它酶和非酶成分的相容性等),并且所述酶应该以有效量存在。
蛋白酶:合适的蛋白酶包括动物、植物或微生物来源的那些蛋白酶。微生物来源是优选的。其中包括化学修饰或蛋白质工程的突变体。所述蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的实例是枯草杆菌蛋白酶(subtilisin),特别是源自芽孢杆菌属的那些,例如,枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(在WO 89/06279中描述)。胰蛋白酶样蛋白酶的实例是胰蛋白酶(例如,猪或牛来源)和镰孢属蛋白酶,在WO 89/06270和WO 94/25583中描述。
有用的蛋白酶的实例是在WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中描述的变体,特别是在一个或多个以下位置具有取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
优选的商业上能够获得的蛋白酶包括Alcalase
Figure A20068003001100371
、Savinase
Figure A20068003001100372
、Primase
Figure A20068003001100373
、Duralase
Figure A20068003001100374
、Esperase
Figure A20068003001100375
和Kannase
Figure A20068003001100376
(Novozymes A/S),Maxatase
Figure A20068003001100377
、Maxacal
Figure A20068003001100378
、Maxapem
Figure A20068003001100379
、Properase
Figure A200680030011003710
、Purafect
Figure A200680030011003711
、Purafect OxP
Figure A200680030011003712
、FN2
Figure A200680030011003713
和FN3
Figure A200680030011003714
(GenencorInternational Inc.)。
脂肪酶:合适的脂肪酶包括细菌或真菌来源的那些。包括化学修饰或蛋白质工程的突变体。有用的脂肪酶的实例包括来自如下的脂肪酶:腐质霉属(同物异名嗜热霉属(Thermomyces)),例如,来自疏棉状腐质霉(H.lanuginosa)(细毛嗜热霉(T.lanuginosus))如EP 258 068和EP 305 216中所述,或来自特异腐质霉如WO 96/13580中所述,假单胞菌属(Pseudomonas)脂肪酶,例如,来自产碱假单胞菌(P.alcaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP218 272)、洋葱假单胞菌(P.cepacia)(EP 331 376)、施氏假单胞菌(P.stutzeri)(GB 1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌属菌种菌株SD 705(WO 95/06720和WO 96/27002)、P.wisconsinensis(WO 96/12012)、芽孢杆菌属脂肪酶,例如,来自枯草芽孢杆菌(Dartois et al.,1993,Biochemica etBiophysica Acta,1131:253-360)、嗜热脂肪芽孢杆菌(JP 64/744992)或短小芽孢杆菌(B.pumilus)(WO 91/16422)的脂肪酶。
其它实例是例如在WO 92/05249、WO 94/01541、EP 407 225、EP 260 105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202中描述的那些脂肪酶变体。
优选的商业上能够获得的脂肪酶包括LipolaseTM、Lipolase UltraTM和Lipex(Novozymes A/S)。
淀粉酶:合适的淀粉酶(α和/或β)包括细菌和真菌来源的那些。包括化学修饰的或蛋白质工程化的变体。淀粉酶包括例如从芽孢杆菌属获得的α-淀粉酶,例如,地衣芽孢杆菌的特殊菌株,在GB 1,296,839中有更详细的描述。
有用的淀粉酶的实例是在WO 94/02597、WO 94/18314、WO 96/23873和WO 97/43424中描述的变体,特别在一个或多个以下位置具有取代的变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
商业上能够获得的淀粉酶是DuramylTM、TermamylTM、FungamylTM和BANTM(Novozymes A/S)、RapidaseTM和PurastarTM(Genencor InternationalInc.)。
纤维素酶:合适的纤维素酶包括细菌或真菌来源的那些。包括化学修饰或蛋白质工程的突变体。合适的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属菌属的纤维素酶,例如,产生自特异腐质霉、嗜热毁丝霉和尖镰孢的真菌纤维素酶,其公开于US 4,435,307、US 5,648,263、US 5,691,178、US 5,776,757和WO 89/09259。
特别合适的纤维素酶是碱性或中性纤维素酶,其具有保护颜色的益处(colour care benefits)。这种纤维素酶的实例是在EP 0 495 257、EP 0 531 372、WO 96/11262、WO 96/29397、WO 98/08940中描述的纤维素酶。其它实例是纤维素酶变体,例如在WO 94/07998、EP 0 531 315、US 5,457,046、US5,686,593、US 5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299中描述的那些。
商业上能够获得的纤维素酶包括Celluzyme和Carezyme
Figure A20068003001100382
(Novozymes)、Clazinase
Figure A20068003001100383
和Puradax HA
Figure A20068003001100384
(Genencor International Inc.)和KAC-500(B)
Figure A20068003001100385
(Kao Corporation)。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌来源的那些。包括化学修饰或蛋白质工程的突变体。有用的过氧化物酶的实例包括来自鬼伞属(Coprinus)(例如,来自灰盖鬼伞(C.cinereus))的过氧化物酶,及其变体,如在WO 93/24618、WO 95/10602和WO 98/15257中描述的那些。商业上能够获得的过氧化物酶包括Guardzyme
Figure A20068003001100386
(Novozymes A/S)。
通过添加含有一种或多种酶的单独的添加剂,或通过添加包含所有这些酶的组合添加剂可将洗涤剂酶包括在洗涤剂组合物中。可将本发明的洗涤剂添加剂(即单独的添加剂或组合的添加剂)配制成例如,颗粒(granulate)、液体、浆等。优选的洗涤剂添加剂剂型是颗粒,具体为无粉尘(non-dusting)颗粒,液体,具体为稳定的液体,或浆。
例如,可以如美国专利号4,106,991和4,661,452中所公开的产生无粉尘颗粒,并且可以任选地通过本领域已知的方法包覆。蜡制包覆材料(waxy coatingmaterial)的实例是具有1000至20000的平均摩尔质量的聚(环氧乙烷)产品(聚乙二醇,PEG);具有从16至50个的环氧乙烷单元的乙氧基化壬基酚;乙氧基化脂肪醇,其中醇含有从12至20个碳原子,并且其中具有15至80个环氧乙烷单元;脂肪醇;脂肪酸;和脂肪酸的单酸甘油酯和甘油二酯和甘油三酯。适用于流化床技术的成膜涂覆材料的实例提供于GB 1483591。例如,可根据已经建立的方法通过添加多元醇如丙二醇、糖或糖醇、乳酸或硼酸来稳定液体酶制剂。可以根据公开于EP 238,216中的方法来制备保护酶。
本发明的洗涤剂组合物可以是任何方便的形式,例如,条、片剂、粉剂、颗粒、糊剂或液体。液体洗涤剂可以是含水的,通常含有多至70%的水和0-30%的有机溶剂,或是非水的(non-aqueous)。
洗涤剂组合物包含一种或多种表面活性剂,其可以是非离子的,包括半极性的和/或阴离子的和/或阳离子的和/或两性离子的。所述表面活性剂通常以按重量计0.1%至60%的水平存在。
当包括于此时,所述洗涤剂将通常含有大约1%至大约40%的阴离子表面活性剂,如线性烷基苯磺酸酯(alkylbenzenesulfonate)、α-烯烃磺酸酯(olefinsulfonate)、烷基硫酸酯(alkyl sulfate)(脂肪醇硫酸酯(fatty alcoholsulfate))、醇乙氧基硫酸酯(alcohol ethoxysulfate)、仲链烷磺酸酯(secondaryalkanesulfonate)、α-磺基脂肪酸甲酯、烷基-或烯基琥珀酸,或肥皂(soap)。
当包括于此时,洗涤剂将通常含有大约0.2%至大约40%的非离子表面活性剂,如醇乙氧基化物、壬基苯酚乙氧基化物、烷基聚糖苷(alkylpolyglycoside)、烷基二甲基氧化胺(alkyldimethylamineoxide)、乙氧基化脂肪酸单乙醇酰胺(ethoxylated fatty acid monoethanolamide)、脂肪酸单乙醇酰胺、多羟基烷基脂肪酸酰胺或葡糖胺的N-酰基N-烷基衍生物(“葡糖酰胺(glucamide)”)。
洗涤剂可以含有0-65%的洗涤剂增清剂或复合剂例如沸石、二磷酸盐、三磷酸盐、膦酸酯(phosphonate)、碳酸盐(carbonate)、柠檬酸盐、氮川三乙酸(nitrilotriacetic acid)、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶硅酸盐或分层硅酸盐(例如来自Hoechst的SKS-6)。
洗涤剂可以包含一种或多种聚合物。实例是羧甲基纤维素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯咪唑)、聚羧酸酯(polycarboxylates)如聚丙烯酸酯(polyacrylates)、马来酸/丙烯酸共聚物和甲基丙烯酸月桂酯/丙烯酸共聚物。
洗涤剂可以含有漂白体系,其可以包含H2O2源如过硼酸盐或过碳酸盐,其可以与形成过酸的漂白激活剂如四乙酰乙二胺或壬酰氧苯磺酸(nonanoyloxybenzenesulfonate)组合。或者,漂白体系可以包含过氧酸,例如,酰胺、二酰亚胺(imide)或砜类型的过氧酸。
可以使用常规稳定剂稳定本发明的洗涤剂组合物的酶,所述常规稳定剂例如,多元醇如丙二醇或甘油、糖或糖醇、乳酸、硼酸或硼酸衍生物,例如,芳香硼酸酯,或苯基硼酸(phenyl boronic acid)衍生物如4-甲酰苯基硼酸(4-formylphenyl boronic acid),并且可以例如WO 92/19709和WO 92/19708中所述配制所述组合物。
洗涤剂还可以含有其它常规洗涤剂成分,例如,织物整理剂(fabricconditioner)包括粘土、泡沫促进剂、抑泡剂、防腐蚀剂、悬污剂、防污物再沉积剂、染料、杀菌剂、光学增亮剂(optical brightener)、水溶助剂(hydrotrope)、晦暗抑制剂(tarnish inhibitors)或香料。
目前预期的是,可将任何酶(特别是本发明的酶)以相当于每升洗涤液0.01-100mg酶蛋白,优选每升洗涤液0.05-5mg酶蛋白,特别是每升洗涤液0.1-1mg酶蛋白的量添加到洗涤剂组合物中。
本发明的酶可以额外地并入公开于WO 97/07202的洗涤剂配制物,WO97/07202并入本文作为参考。
保藏的微生物
本发明的申请人根据关于用于专利程序的国际认可的微生物保藏的布达佩斯条约将以下微生物保藏在德意志微生物和细胞培养物保藏中心(DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH,Mascheroder Weg 1b,D-38124 Braunschweig,Germany):
2005年6月23日;芽孢杆菌属菌种P203菌株;DSM登录号DSM 17419。
实施例
实施例1:鉴定由芽孢杆菌属菌种P203菌株,DSM 17419分泌的功能性多肽
A.基因组文库构建
使用标准分子生物学技术(Ausuble et al.1995“Current protocols inmolecular biology Publ:John Wiley and sons)从芽孢杆菌属菌种P203菌株(DSM 17419)中制备染色体DNA。将制备的DNA用MboI部分切割,并且通过超速离心按蔗糖梯度分离。提取3-10千碱基(kilobase)的片段,使其沉淀并在适当的缓冲液中重悬。
使用Stratagene ZAP Express TM预消化载体试剂盒和Stratagene ZAPExpress TM预消化Gigapack
Figure A20068003001100411
克隆试剂盒(BamH I预消化的)(Stratagene Inc.,USA),根据经销商的指导/建议制备基因组文库。所得lambdaZAP文库包含1.25×106个蚀斑形成单位(pfu),收集其中的40,000个用于大量切除(massexcision)。汇集(pool)所得的10,000个大肠杆菌菌落,并且使用Qiagen SpinMini prep试剂盒(Qiagen,Germany)制备质粒。将含有质粒DNA的大约1ml洗脱物用1体积份的乙酸钠pH 5和2体积份的96%乙醇在离心机中以20000rpm在4℃沉淀,用70%(体积/体积)乙醇洗涤,在室温干燥,并且在200微升TE缓冲液中重悬。芽孢杆菌属菌种P203菌株的质粒汇集物(plasmid pool)DNA的DNA浓度为0.7微克/微升。
B.转座子构建和制备
Transposon Assisted Signal Trapping(转座子辅助的信号捕获;TAST)方法学中的基本原理,如WO 01/77315A1中所述,是将所选基因组内的全部基因通过转座子标记与编码无信号β-内酰胺酶的基因融合。因此,宿主细胞克隆包含与编码无信号β-内酰胺酶的基因通过转座子标记融合的基因组基因,将所述宿主细胞克隆在含有氨苄青霉素的培养基中培养时,只有那些表达和分泌β-内酰胺酶的克隆存活。然而,只有在下述条件才会分泌β-内酰胺酶:与β-内酰胺酶基因融合的基因具有宿主菌株能够识别的完整启动子和核糖体结合位点(即在现实中由细胞表达而产生多肽的基因);并且翻译β-内酰胺酶,从而将合成多肽转运通过细胞质膜并且正确折叠。因此,将融合基因插入选择的宿主细胞中时,那些氨苄青霉素抗性的克隆含有编码功能性分泌性多肽的基因。
通常在使用TAST方法学时,甚至不需要表达完整的基因。用转座子标记基因时,基因N末端部分表达为蛋白融合体(protein fusion)显示该基因含有完整的转录、翻译和分泌序列。因此,通常认为基因N末端部分表达为蛋白融合体足以确保完整基因的表达和分泌。
由此可得出以下结论,通过TAST方法获得的基因实际上确实编码分泌性功能性多肽。
含有β-内酰胺酶报告基因的SigA4转座子的构建:
根据WO 01/77315A1的指导,使用标准分子生物学技术构建含有无信号β-内酰胺酶基因的转座子。首先使用较读聚合酶(proofreading polymerase)(PfuTurbo,Stratagene,USA)从载体pUC19)中PCR扩增出无信号β-内酰胺酶基因。所得PCR片段含有辅助克隆的限制位点NotI和EcoRI。质粒pEntranceposon(Camr)含有Entranceposon和抗生素抗性标记CAT(在转座子中编码氯霉素抗性),该质粒获得自Finnzymes,OY(Espoo Finland)。将所述质粒用限制酶NotI和EcoRI消化,凝胶纯化,并且与含有无信号β-内酰胺酶的片段连接。将连接物(ligation)转化到电感受态的(electro-competent)DH10B细胞中,并且通过限制分析鉴定了含有重组质粒的大肠杆菌克隆,所述重组质粒具有无信号β-内酰胺酶,将这种大肠杆菌克隆命名为SigA2。
对于转座子制备,如下构建出较小的SigA2衍生物,其缺乏编码β-内酰胺酶的bla基因:使用两个寡核苷酸引物SigA2NotU-P 5’-TCG CGA TCC GTTTTC GCA TTT ATC GTG AAA CGC T-3’(SEQ ID NO:15)和SigA2NotD-P5’-CCG CAA ACG CTG GTG AAA GTA AAA GAT GCT GAA-3’(SEQ ID NO:16),其向外(directing outward)结合至SigA2中bla基因的起始和终止处,PCR扩增无bla基因的SigA2。将这种PCR反应中产生的大约3,6kb的扩增物重新连接(relegate)并且转化至合适的大肠杆菌菌株中。从能够在LB氯霉素上生长而不能在LB氨苄青霉素上生长的转化体中分离3,6kb的质粒。这种质粒保留了两个BglII位点,并且缺乏活性bla基因,将该质粒称为pSig4(参见专利申请PA 2004000010)。
用BglII消化60微升浓度为0.3微克/微升的pSigA4质粒DNA制备物,并在琼脂糖凝胶上分离。洗脱2kb的SigA2转座子DNA条带,使用″GFXTMPCR,DNA and Gel Band Purification Kit″(Amersham PharmaciaBiotech Inc,USA)根据经销商的说明纯化并且在200微升EB缓冲液中洗脱。
C.转座子标记
从pSigA4制备的转座子携带编码β-内酰胺酶的5’-截断的bla基因,其中已将分泌信号去除。β-内酰胺酶仅在蛋白被分泌至周质时赋予大肠杆菌氨苄青霉素抗性,而细胞质表达β-内酰胺酶不赋予氨苄青霉素抗性。没有信号序列,β-内酰胺酶将不被转运至周质,因此克隆不会在含有氨苄青霉素的培养基上生长。将无信号β-内酰胺酶基因包含在转座子内时,使转座子边缘(border)和β-内酰胺酶编码区之间是连续的开读框。以这种方式,将修饰的转座子转座至编码分泌性蛋白的基因中时,能够引发与靶基因以符合读框的方式(in frame)融合。其产生分泌至大肠杆菌周质的融合基因产物,并且赋予对氨苄青霉素的抗性。如果将转座子即使以符合读框的方式整合入编码非分泌性蛋白的基因,相应的宿主也不会成为氨苄青霉素抗性。
对于芽孢杆菌属菌种P203菌株基因组文库的体外转座子标记,将250纳克的SigA2转座子与2.5微克芽孢杆菌属菌种P203菌株基因组文库质粒汇集物DNA的DNA浓缩物、2.5微升的Finnzymes MuA Transposase(0,22microgram/microliter)和10微升来自Finnzymes OY(Espoo,Finland)的5x缓冲液混合成总体积50微升,并且在30℃温育3小时,之后在75℃热失活10分钟。如下将DNA沉淀:添加5微升3M乙酸钠pH 5和110微升96%乙醇,在-20℃温育20小时,并在20000rpm离心30分钟。将粒状沉淀用70%乙醇洗涤、干燥并在10微升TE缓冲液中重悬。
D.转化和选择
将电感受态的大肠杆菌DH10B细胞通过在Biorad Gene Pulse设备上根据制造商的说明进行电穿孔转化(50uF、25mAmp、1.8kV,使用5微升经转座子标记的质粒汇集物,将其与1ml SOC培养基混合,在37℃预温育1小时并且铺于含25微升/毫升氨苄青霉素、50微升/毫升卡那霉素、10微升/毫升氯霉素的LB上,并在30℃温育2-3天。从抗性转化体中选择1152个菌落。使用Templyphi 500试剂盒(Amersham Biosciences)根据制造商的说明通过滚环扩增(rolling circle amplication)从信号捕获文库中制备用于DNA测序的模板)。
E.质粒制备和测序
对大约500个经转化子标记的质粒用A2up引物AGCGTTTGCGGCCGCGATCC(SEQ ID NO:13)测序,所述引物向上游读码至转座子标记的基因中;并且,在第二反应中,用B引物TTATTCGGTCGAAAAGGATCC(SEQ ID NO:14)测序,所述引物向下游读码至转座子标记的基因中。
F.序列装配和注释
使用程序PhredPhrap将获得的序列装配成重叠群(contig)(Brent Ewing,LaDeana Hillier,Michael C.Wendl,and Phil Green,Base-calling of automatedsequencer traces using phred I.Accuracy assessment(1998)Genome Research8:175-185;Brent Ewing and Phil Green,B ase-calling of automated sequencertraces using phred II.Error probabilities(1998)Genome Research 8:186-194)。其后将获得的重叠群与标准公开的DNA和蛋白质序列数据库中的可用序列进行比较,所述比较使用程序BLASTX 2.0a19MP-WashU [14-Jul-1998][Buildlinux-x86 18:51:4430-Jul-1998](Gish,Warren(1994-1997).Unpublished;Gish,Warren and David J.States(1993).Identification of protein coding regions bydatabase similarity search.Nat.Genet.3:266-72)。
获得的序列是功能性基因,其编码完整的并且是功能性的多肽,因为它们是作为氨苄青霉素抗性克隆获得的,如上文中所说明。
实施例2:通过同源性确定功能
通过与已知功能的基因或多肽的序列比对来注释多肽SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12的功能。将本发明的多肽与重叠群公开数据库和内部数据库中一系列紧密关联(closest related)序列进行比较。随后使用程序BLASTX 2.0a19MP-WashU[14-Jul-1998]将重叠群与能够在标准公开DNA和蛋白序列数据库中获得的序列比较。将SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12与其它数据库中同它们最紧密关联的、具有已知功能的序列进行序列比对,对所述序列比对的仔细分析使得基于氨基酸同一性程度来预测这些多肽的功能成为可能。即使当整体氨基酸同一性在40%以下,通常难以做出良好的预测时,我们能够通过仔细分析和理解(interpret)多肽序列的催化位点或重要区域的氨基酸残基,来预测SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ IDNO:12的功能。如果已知序列中催化位点的氨基酸同样存在于本发明的多肽中,与充分的整体氨基酸同一性结合,得出以下结论:来自芽孢杆菌属菌种P203(DSM 17419)的多肽与已知序列具有相同的功能。
实施例3:制备SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12的多肽
为了制备SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12的多肽,通过如下方法表达SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中包含的编码这些多肽的基因:将编码开读框的DNA与在适当宿主菌株中适合于基因表达的启动子、核糖体结合位点和终止子DNA融合,所述适当宿主菌株例如大肠杆菌、枯草芽孢杆菌、地衣芽孢杆菌或克劳氏芽孢杆菌或芽孢杆菌属菌种P203菌株的衍生物。所述启动子可以是诱导型启动子或组成型启动子。可以将任何信号序列与其它细菌的合适信号肽交换。表达构建体可以是质粒或线性DNA的一部分。其能够通过重组整合到宿主菌株的基因组中,或能够存在于宿主细胞中的质粒上。然后,将携带目标基因的转化细胞以期望的体积在合适培养基中培养。如果使用的是诱导型启动子,基因表达通过添加诱导物来起始。否则不需要诱导物,而培养细胞直至合适量的蛋白从目标基因产生。然后收获培养物并且通过标准方法回收蛋白。
实施例4:蛋白酶
可以分析合成并且分泌丝氨酸蛋白酶的宿主菌株培养液或细胞溶解产物在合适的缓冲液中的所述活性。将合适体积的这种样品点样(spot on)至琼脂糖平板上,所述平板含有不溶性显色底物AZCL-酪蛋白(Megazyme TM)和适当pH的适当缓冲剂。将所述平板在适当的温度,例如55℃温育适当的时间,例如一天。活性可以作为样点周围的蓝色晕圈(halo)观察到。作为AZCL-酪蛋白的替代物,可以使用未标记的酪蛋白。在未标记的酪蛋白点样的琼脂糖平板上,在丝氨酸蛋白酶存在时形成澄清区域。
实施例5:多聚鼠李半乳糖醛酸裂合酶
多聚鼠李半乳糖醛酸是果胶的毛状区(hairy region)中存在的主要多糖。多聚鼠李半乳糖醛酸裂合酶(PL4和PL11)和多聚鼠李半乳糖醛酸酶(rhamnogalacturonase)(GH28)是能够降解果胶的多聚鼠李半乳糖醛酸主链的酶,但对于均聚半乳糖醛酸(homogalacturonan)不具特异性。在合适温度,例如30℃,在适当的缓冲液中,使用适当体积的合成并且分泌多聚鼠李半乳糖醛酸裂合酶的宿主菌株培养液或细胞溶解产物用于测量活性。将适当体积的这种样品点样至琼脂糖平板上,所述平板含有不溶性显色底物AZCL-多聚鼠李半乳糖醛酸I(Megazyme)。将平板在适当的温度,例如30℃,温育合适的时间,例如一天。活性可以作为样点周围的蓝色晕圈观察到。作为替代物,可将AZCL-半乳聚糖或AZCL-脱支阿聚糖(AZCL-debranched arabinan)或未标记的马铃薯果胶半乳聚糖或多聚鼠李半乳糖醛酸添加至琼脂平板或作为底物溶液添加到酶试验。酶活性能够作为样点澄清区域周围的蓝色晕圈检出,或通过Mutter,M.et al.,Characterization of Recombinant Rhamnogalacturonanalpha-L-Rhamnopyranosyl-(1,4)-alpha-D-Galactopyranosyluronide Lyase fromAspergillus aculeatus,Plant Physiol.(1998)117:141-152和McKie,V.et al.,Anew family of Rhamnogalacturonan lyases contains an enzyme that binds tocellulose,Biochem.J.(2001)355,167-177公开的方法检出。
实施例6:木聚糖酶
木聚糖酶是内作用的(endo-acting)酶,其切割β-1,4-木糖聚合物。对于酶制备物中内-1,4-木糖聚酶的测量可以使用Xylanase Assay Kit(Megazyme)。或者,在合适的温度,例如30℃,在适当的缓冲液中,使用适当体积的合成并且分泌木聚糖酶的宿主菌株培养液或细胞溶解产物用于测量活性。将适当体积的这种样品点样至琼脂糖平板上,所述平板含有不溶性显色底物AZCL-木聚糖或AZCL-阿拉伯木聚糖(Megazyme)。将所述平板在适当的温度,例如30℃,温育适当的时间,例如一天。活性可以作为样点周围的蓝色晕圈观察到。
实施例7:半乳聚糖酶
这种类型的蛋白是半纤维素酶,其能够水解短的木-寡糖(shortxylo-oligosaccharide),例如阿聚糖。可以测试适当缓冲液中合成或分泌木糖苷酶的宿主菌株培养液或细胞溶解产物的所述活性。在合适的温度,例如30℃,在适当的缓冲液中,使用适当体积的合成并且分泌木聚糖酶的宿主菌株培养液或细胞溶解产物用于测量活性。将适当体积的这种样品点样到琼脂糖平板上,所述平板含有不溶性显色底物AZCL-阿聚糖(Megazyme)。将所述平板在适当的温度,例如30℃,温育适当的时间,例如一天。活性可以作为样点周围的蓝色晕圈观察到。
实施例8:在枯草芽孢杆菌中表达芽孢杆菌属菌种P203菌株的碳酸酐酶
将地衣芽孢杆菌α-淀粉酶(AmyL)的信号肽通过PCR以符合读框的方式融合于编码碳酸酐酶的基因(SEQ ID NO:3)。将编码所得编码序列的DNA通过同源重组整合在枯草芽孢杆菌宿主细胞基因组上。在三启动子系统(triplepromoter system)的调控下表达所述基因构建体(如WO 99/43835中所述),所述系统由包括稳定序列的苏云金芽孢杆菌cryIIIA启动子、地衣芽孢杆菌α-淀粉酶基因(amyL)和解淀粉芽孢杆菌α-淀粉酶基因(amyQ)的启动子组成。使用编码氯霉素乙酰转移酶的基因作为标记(例如Diderichsen et al.,A usefulcloning vector for Bacillus subtilis.Plasmid,30,p.312,1993中所述)。
通过DNA测序分析氯霉素抗性转化体以验证正确的构建体DNA序列。选择了一个这样的克隆。
碳酸酐酶(SEQ ID NO:4)表达克隆的发酵在旋转摇床(rotary shaking table)上的1L带挡板的Erlenmeyer摇瓶中进行,所述摇瓶每个含有400ml补充以34mg/l氯霉素的LB培养基。将克隆在25-30℃发酵3天。根据Wilbur,K.M.and Anderson,N.G.,Electrometric and colorimetric determination of carbonicanhydrase,J Biol Chem,1948,176,p.147-154测定碳酸酐酶活性。或者,以对-硝基苯酚乙酸酯(para-nitrophenolacetate)作为底物,根据Chirica,L.C.et al.,Cloning,expression and some properties of alpha-carbonic anhydrase fromHelicobacter pylori,Biochim.Biophys.Acta,2001,1544,p.55-63可将碳酸酐酶活性测量为酯酶活性。标准试验含有900微升PNPA、10微升300mM Tris pH7.5和90微升碳酸酐酶蛋白溶液。预温育5分钟之后,将酶添加至PNPA缓冲混合物,并且在10分钟的时间内,以分光光度法监测石英比色皿(quartzcuvette)中在348nm吸光度的增加(由于底物的水解和对硝基苯酚的释放)。作为两个活性试验中的阳性对照,可以使用牛碳酸酐酶的溶液(Calbiochem,1mg每mL)。
实施例9:在大肠杆菌中表达芽孢杆菌属菌种P203菌株的碳酸酐酶
作为实施例8的替换方法,可以将碳酸酐酶在大肠杆菌中表达。使用基因特异性引物BOCAfwd(5’TAGTCCGTACATATGAGAAAAACAA 3’)(SEQID NO:17)和BOCArev(5’TTCAAAGCTTATAGTGAAATCCAACT 3’)(SEQID NO:18)从芽孢杆菌属菌种P203基因组DNA(用Qiagen Genomic DNA Kit,19060提取)扩增了碳酸酐酶PCR产物(SEQ NO.3),通过将pGEM-T载体(Promega)和所述碳酸酐酶PCR产物(SEQ NO.3)连接来产生质粒pEG131377-9。将所述质粒用作模板来产生质粒pETBlueCA。通过如下方法构建用于在大肠杆菌中表达碳酸酐酶的质粒pETBlueCA:用基因特异性引物pQECAfwd(5′ATCCGCATGCTGAGAAAAACAAA 3′)(SEQ ID NO:19)和pQECArev(5′AATTAAGCTTAATAGTGAAATCCAACT 3′)(SEQ ID NO:20)从质粒模板pEG131377-9进行PCR扩增,之后将所述PCR产物与线性pETBlue-1 AccepTorTM载体系统(Novagen)根据制造商的说明连接。将质粒转化到化学感受态大肠杆菌NovaBlue SinglesTM细胞(Novagen)中,用于蓝白筛选。三种质粒的插入通过DNA测序来验证,所述测序使用引物pETBlueUP、pETBlueDOWN(Novagen,在插入区侧翼的引物)和引物CAmitSEQrev(5′CACTTGGTGAATGGAAATG 3′)(SEQ ID NO:21)。发现质粒pETBlueCA克隆8号(pETBlueCA8)是正确的,并且将其转化至化学感受态大肠杆菌Tuner(DE3)pLacI细胞中,用于在lac启动子(IPTG诱导型)的调控下过量表达来自芽孢杆菌属菌种P203的碳酸酐酶。
实施例10:芽孢杆菌属菌种P203菌株的碳酸酐酶(SEQ ID NO:4)的纯化和表征
纯化
将培养液离心(10000g,15分钟),将上清小心地从沉淀物倾析。将汇集的培养物上清通过错流过滤(crossflow filtration)(MW截留(cut-off)10,000Da)浓缩至体积的1/10,并且在碳酸酐酶特异性层析柱上纯化。对于来自Bacillusplankortiensis的重组碳酸酐酶的纯化,制备高选择性亲和柱。原则上,如前所述制备亲和柱(Khalifah,R.G.et al.,Carbon-13 nuclear magnetic resonanceprobe of active-site ionizations in human carbonic anhydrase B,Biochem.1977,16,p.2241-7),但进行以下改变:将磺胺(sulfonamide)配体4-氨基甲基苯磺酰胺(4-aminomethylbenzenesulfonamide)(0.2g,Sigma)溶解在12mL偶联缓冲液中(0.1M NaHCO3,pH 8,0.5M NaCl)。将1g活化的CH Sepharose 4BTM(Amersham Biosciences)溶解在大约20ml 1mM HCl中,并且用250mL 1mMHCl在烧结玻璃(sintered glass)滤器上充分洗涤。用6mL 1mM HCl从所述滤器洗脱凝胶,将其加至50mL Falcon管内溶解的配体中。将混合物在室温颠倒地(end-over-end)轻柔旋转1小时。为了去除过量的配体,用250mL偶联缓冲液洗涤凝胶。通过用0.1M Tris-HCl,pH 8洗涤凝胶并且在该缓冲液中温育1小时来进行任何剩余活性基团的封闭。封闭之后,使用三个循环的a)250mL0.1M Tris,pH 8,0.5M NaCl和b)0.1M乙酸钠,pH 4,0.5M NaCl来洗涤凝胶。将凝胶转移至烧杯,使用之前用加样缓冲液D(0.25M Na2SO4,25mM Tris pH8.3)充分(extensively)洗涤。
将5mL亲和介质(affinity media)添加至50mL浓缩的实施例8的培养液中,或添加至实施例9的无细胞粗蛋白提取物。将悬液在室温平稳地搅拌1小时,随后倒入柱中,依靠重力将柱填实。用加样体积10倍体积的缓冲液D彻底洗涤柱直至不再检测到蛋白。通过关闭出口并且添加10ml洗脱缓冲液E(0.4M KSCN,25mM Tris pH 8.3)来开始碳酸酐酶的洗脱。将柱以适度摇动温育10分钟之后,收集500微升级分。在第一活性级分之后,汇集含有碳酸酐酶活性的级分(通常为级分4--10)。将汇集的级分在具有MW 10,000Da截留的Centricon装置中(Millipore,于4000xg)使用10倍体积碳酸酐酶贮存缓冲液(storage buffer)F(100mM Tris-HCl pH 8.0,50μM硫酸锌)彻底地进行再缓冲(re-buffered intensively)。将纯化的碳酸酐酶的等分试样贮藏在-20℃,直到进一步使用。纯化的重组碳酸酐酶在SDS聚丙烯酰胺凝胶上显示单一的蛋白条带。
表征
根据K.M.and Anderson,N.G.,Electrometric and colorimetric determinationof carbonic anhydrase,J Biol Chem,1948,176,p.147-154来测定碳酸酐酶活性。测试纯化的重组碳酸酐酶在4-60℃、1和17小时的温度稳定性。发现蛋白在缓冲液F中在4℃、1周是稳定的,活性损失最小(原始活性的97±4%),并且在室温(20℃,原始活性的95±4%)是稳定的。蛋白在缓冲液F中在-20℃贮存一周之后,未检测到活性损失(原始活性的99±4%)。碳酸酐酶的稳定性在超过37℃的温度迅速降低(参见图2)。发现将重组碳酸酐酶贮存在补充以1mM二硫苏糖醇(DTT)的缓冲液F中使该酶稳定。
重组碳酸酐酶的抑制研究使用叠氮离子和特异性碳酸酐酶抑制剂乙酰唑胺(acetazolamide)(Sigma)来进行。用于叠氮化物的IC50值是500μM,用于乙酰唑胺的IC50值是0.09μM,在7.5μM乙酰唑胺存在时观察到完全抑制(参见图3)。
通过二价和三价金属离子、叠氮化物和其它试剂来抑制碳酸酐酶通常用于蛋白质科学中(参见图4):
使用以下抑制剂:
  0:   对照
  1:   CaCl2
  2:   MnCl2
  3:   EDTA
  4:   NaWO4
  5*   CrCl3
  6:   胍-HCl
  7:   β-巯基乙醇
  8:   SDS
  9*   FeCl3
  10:   尿素
  11:   MgCl2
  12:   DTT
  13:   Na2SeO3
  14:   ZnSO4
  15:   (NH4)Fe(SO4)2
  16:   CoCl2
  17*   Triton X 100
  18:   CuSO4
  19:   NiSO4
  20:   NaN3
表1:抑制剂
将酶与1mM所述物质以总体积50微升在冰上预温育1小时,之后用10微升的所述混合物按Wilbur and Anderson,1948方法测试活性。将无添加剂(水)的对照设置为100%活性。在总试验体积中,当给定的浓度为1mM时,对于洗涤剂Triton X 100和离子Fe3+及Cr2+(表1中用星号标记)的试验有所不同。改为提供25μM浓度的化学品时的活性。
实施例11:半乳聚糖酶的表达
将地衣芽孢杆菌α-淀粉酶(AmyL)的信号肽通过PCR以符合读框的方式融合于编码半乳聚糖酶的基因(SEQ ID NO:12)。将编码所得编码序列的DNA通过同源重组整合在枯草芽孢杆菌宿主细胞基因组上。在三启动子系统的调控下表达所述基因构建体(如WO 99/43835中所述),所述系统由包括稳定序列的苏云金芽孢杆菌cryIIIA启动子、地衣芽孢杆菌α-淀粉酶基因(amyL)和解淀粉芽孢杆菌α-淀粉酶基因(amyQ)的启动子组成。使用编码氯霉素乙酰转移酶的基因作为标记(例如Diderichsen et al.,A useful cloning vector for Bacillussubtilis.Plasmid,30,p.312,1993中所述)。
通过DNA测序分析氯霉素抗性转化体以验证正确的构建体DNA序列。选择了一个这样的克隆。半乳聚糖酶(SEQ ID NO:12)表达克隆的发酵在旋转摇床上的500ml带挡板的Erlenmeyer摇瓶中进行,所述摇瓶每个含有100ml补充以34mg/l氯霉素的LB培养基。将克隆在30℃发酵3天。用OPNG作为底物测定活性。
实施例12:芽孢杆菌属菌种P203菌株半乳聚糖酶活性的验证
试验:
将50微升实施例17的无细胞上清添加至750微升的溶于50mM磷酸缓冲液pH7.6中的4.5mM邻-硝基苯基半乳吡喃糖苷(ortho-nitrophenylgalactopyranoside)(ONPG)溶液中。将混合物在40℃温育15分钟,通过添加300微升1M碳酸钠终止反应。在光谱测量之前将溶液在13,000rpm离心1分钟,如有必要用水稀释。用光学法在420nm测量邻-硝基酚盐(o-nitrophenolate)的吸光度。
序列表
<110>诺维信公司(Novozymes A/S)
<120>菌株芽孢杆菌属菌种P203的多肽
<130>10807.204-WO
<160>21
<170>PatentIn version 3.3
<210>1
<211>1953
<212>DNA
<213>芽孢杆菌属菌种P 203
<220>
<221>CDS
<222>(1)..(1953)
<223>丝氨酸蛋白酶
<220>
<221>信号肽
<222>(1)..(111)
<220>
<221>成熟肽
<222>(112)..(1953)
<400>1
atg aat aaa caa aat aca caa tat ttt gag agg agc gct gcg atg aat       48
Met Asn Lys Gln Asn Thr Gln Tyr Phe Glu Arg Ser Ala Ala Met Asn
        -35                 -30                 -25
atc gat aaa aag aaa caa aaa ccg tgg aac gta atg gta tta acc gca       96
Ile Asp Lys Lys Lys Gln Lys Pro Trp Asn Val Met Val Leu Thr Ala
    -20                 -15                 -10
ctg tca aca agt ttg gta ttc gga ggg ttt ggc tat tct cca caa caa      144
Leu Ser Thr Ser Leu Val Phe Gly Gly Phe Gly Tyr Ser Pro Gln Gln
-5              -1  1               5                   10
gta tca gct gaa aca aaa act ggt tca ctc aat cta tca gat gac atc      192
Val Ser Ala Glu Thr Lys Thr Gly Ser Leu Asn Leu Ser Asp Asp Ile
            15                  20                  25
aaa tta gat agt act gag acg gtc tct gtc atc gtt gag cta gaa gaa      240
Lys Leu Asp Ser Thr Glu Thr Val Ser Val Ile Val Glu Leu Glu Glu
        30                  35                  40
tct ccc gag cat tta gcg att gca gaa gca ctt gaa aaa ggt gag gat      288
Ser Pro Glu His Leu Ala Ile Ala Glu Ala Leu Glu Lys Gly Glu Asp
    45                  50                  55
cta aca gaa tcg caa gca aaa gca aag gta gaa gcg tct cag gat tca      336
Leu Thr Glu Ser Gln Ala Lys Ala Lys Val Glu Ala Ser Gln Asp Ser
60                  65                  70                  75
ttt gag gaa gac tta tct act aaa caa tca tct tat aca att aca cat      384
Phe Glu Glu Asp Leu Ser Thr Lys Gln Ser Ser Tyr Thr Ile Thr His
                80                  85                  90
acg tat caa tcc gtt ttt aat ggt ttt acc att gaa tta cct gca aat      432
Thr Tyr Gln Ser Val Phe Asn Gly Phe Thr Ile Glu Leu Pro Ala Asn
            95                  100                 105
caa tta gaa gca ctt tca gag att gac ggt gtt aaa acc gtc tgg gaa      480
Gln Leu Glu Ala Leu Ser Glu Ile Asp Gly Val Lys Thr Val Trp Glu
        110                 115                 120
aac gaa gag gtt caa ctc att gat cct gta tta gaa gaa agt gtt cta      528
Asn Glu Glu Val Gln Leu Ile Asp Pro Val Leu Glu Glu Ser Val Leu
    125                 130                 135
gaa gaa gcg att gaa ccc tat atg gca gat agt gtg cct tat cta ggt      576
Glu Glu Ala Ile Glu Pro Tyr Met Ala Asp Ser Val Pro Tyr Leu Gly
140                 145                 150                 155
gtt gat cga ctc cat att gat ggg atc act ggt gaa ggg gta aaa gtc      624
Val Asp Arg Leu His Ile Asp Gly Ile Thr Gly Glu Gly Val Lys Val
                160                 165                 170
gga gtc att gat act ggt gtt gat tac aca cac cct gac ctt aca gca      672
Gly Val Ile Asp Thr Gly Val Asp Tyr Thr His Pro Asp Leu Thr Ala
            175                 180                 185
gcc tac aaa ggt gga tat gac ttt gtc gat aat gat gat gat gca caa      720
Ala Tyr Lys Gly Gly Tyr Asp Phe Val Asp Asn Asp Asp Asp Ala Gln
        190                 195                 200
gaa aca acc tac gat gat tgg tta gca tca gga atg ccg gaa ttt aat      768
Glu Thr Thr Tyr Asp Asp Trp Leu Ala Ser Gly Met Pro Glu Phe Asn
    205                 210                 215
atc aat gga agt tcg tat tat aca tca cat ggt aca cat gtt gct ggc      816
Ile Asn Gly Ser Ser Tyr Tyr Thr Ser His Gly Thr His Val Ala Gly
220                 225                 230                 235
acc att gct gga caa ggt gat aac gaa tct gat ttt gcc aca aca ggt      864
Thr Ile Ala Gly Gln Gly Asp Asn Glu Ser Asp Phe Ala Thr Thr Gly
                240                 245                 250
att gca cct gac gct gac att tat tcc tat cga gta tta ggt cct tat      912
Ile Ala Pro Asp Ala Asp Ile Tyr Ser Tyr Arg Val Leu Gly Pro Tyr
            255                 260                 265
gga tca ggt aca aca gca aat gta ctt ggt ggt att gaa ctt tct gtt      960
Gly Ser Gly Thr Thr Ala Asn Val Leu Gly Gly Ile Glu Leu Ser Val
        270                 275                 280
gaa gat gga atg gat gtt att aat cta tct ctt ggg gct aat gtt aac     1008
Glu Asp Gly Met Asp Val Ile Asn Leu Ser Leu Gly Ala Asn Val Asn
    285                 290                 295
gat cca cta tac cct act agt gtt gca gta aat aat gct gtt tta gct     1056
Asp Pro Leu Tyr Pro Thr Ser Val Ala Val Asn Asn Ala Val Leu Ala
300                 305                 310                 315
ggc gtt acg gct gtt gtt tca gca ggt aac agt ggt aga gat ggt ctt     1104
Gly Val Thr Ala Val Val Ser Ala Gly Asn Ser Gly Arg Asp Gly Leu
                320                 325                 330
tat aca ctt ggt tca cca ggt acc tct cca ctt gcc att acg gtt ggt     1152
Tyr Thr Leu Gly Ser Pro Gly Thr Ser Pro Leu Ala Ile Thr Val Gly
            335                 340                 345
gcc aac gat gtg ccg tta gtg ttc act gac ttt act ggc tat ctt gat     1200
Ala Asn Asp Val Pro Leu Val Phe Thr Asp Phe Thr Gly Tyr Leu Asp
        350                 355                 360
gaa tca ttc tca gct ggc ctt gtg aat atc tca agc ggg ttt gat act     1248
Glu Ser Phe Ser Ala Gly Leu Val Asn Ile Ser Ser Gly Phe Asp Thr
    365                 370                 375
gat ttt gat gaa tta gaa gcg ggt gaa tat ggc att gtt tat gcc ggc     1296
Asp Phe Asp Glu Leu Glu Ala Gly Glu Tyr Gly Ile Val Tyr Ala Gly
380                 385                 390                 395
ctt ggt tca gtt gca gag ttt aat cag gtt gat gca gaa gga aaa gtt    1344
Leu Gly Ser Val Ala Glu Phe Asn Gln Val Asp Ala Glu Gly Lys Val
                400                 405                 410
gct ctt gtt gct cgt gga gaa ttg gcg ttt gta gat aaa att gca aat    1392
Ala Leu Val Ala Arg Gly Glu Leu Ala Phe Val Asp Lys Ile Ala Asn
            415                 420                 425
gct aaa gcc gct ggt gca gaa gcg att att atc tat aac aac ata ccg    1440
Ala Lys Ala Ala Gly Ala Glu Ala Ile Ile Ile Tyr Asn Asn Ile Pro
        430                 435                 440
gga gct gga cac atc cct aac tac ttt gga gaa ggc gtg aat ttt gtc    1488
Gly Ala Gly His Ile Pro Asn Tyr Phe Gly Glu Gly Val Asn Phe Val
    445                 450                 455
gct ggt ttc tct tta acc tat gag gat ggt att gct cta aga gat gcg    1536
Ala Gly Phe Ser Leu Thr Tyr Glu Asp Gly Ile Ala Leu Arg Asp Ala
460                 465                 470                 475
att acc gat gaa agc tca ttc tcg ttt ggt gac cga agc gaa tca caa    1584
Ile Thr Asp Glu Ser Ser Phe Ser Phe Gly Asp Arg Ser Glu Ser Gln
                480                 485                 490
act cca ggt ggt gta cta gct gat ttc agt tct cgt ggt cca gtt aat    1632
Thr Pro Gly Gly Val Leu Ala Asp Phe Ser Ser Arg Gly Pro Val Asn
            495                 500                 505
gaa tca ttt gca att aaa cct gaa gta agt gca cca ggt gtc aat acg    1680
Glu Ser Phe Ala Ile Lys Pro Glu Val Ser Ala Pro Gly Val Asn Thr
        510                 515                 520
tta tca cct gtt cct act tat atg aac ggt cct gac tat att ggc gat    1728
Leu Ser Pro Val Pro Thr Tyr Met Asn Gly Pro Asp Tyr Ile Gly Asp
    525                 530                 535
tac gag tac gcg tat ggg cgt aaa tca ggt aca tca atg tca gca cca    1776
Tyr Glu Tyr Ala Tyr Gly Arg Lys Ser Gly Thr Ser Met Ser Ala Pro
540                 545                 550                 555
cat gtt gca ggt aca gcg gcc ctt ctt ctt gaa gtg aag ccg gac tta    1824
His Val Ala Gly Thr Ala Ala Leu Leu Leu Glu Val Lys Pro Asp Leu
                560                 565                 570
tcg cca gca gac att aaa aca acg tta atg aat acg gct aat cca atg    1872
Ser Pro Ala Asp Ile Lys Thr Thr Leu Met Asn Thr Ala Asn Pro Met
            575                 580                 585
aca cta gat tat agt gtg ttt gaa att ggt gct ggg caa att gat caa    1920
Thr Leu Asp Tyr Ser Val Phe Glu Ile Gly Ala Gly Gln Ile Asp Gln
        590                 595                 600
cgg ctc tta ctc tta agt ttt gat cac gta agc                        1953
Arg Leu Leu Leu Leu Ser Phe Asp His Val Ser
    605                 610
<210>2
<211>651
<212>PRT
<213>芽孢杆菌属菌种P 203
<400>2
Met Asn Lys Gln Asn Thr Gln Tyr Phe Glu Arg Ser Ala Ala Met Asn
        -35                 -30                 -25
Ile Asp Lys Lys Lys Gln Lys Pro Trp Asn Val Met Val Leu Thr Ala
    -20                 -15                 -10
Leu Ser Thr Ser Leu Val Phe Gly Gly Phe Gly Tyr Ser Pro Gln Gln
-5              -1  1                   5                   10
Val Ser Ala Glu Thr Lys Thr Gly Ser Leu Asn Leu Ser Asp Asp Ile
            15                  20                  25
Lys Leu Asp Ser Thr Glu Thr Val Ser Val Ile Val Glu Leu Glu Glu
        30                  35                  40
Ser Pro Glu His Leu Ala Ile Ala Glu Ala Leu Glu Lys Gly Glu Asp
    45                  50                  55
Leu Thr Glu Ser Gln Ala Lys Ala Lys Val Glu Ala Ser Gln Asp Ser
60                  65                  70                  75
Phe Glu Glu Asp Leu Ser Thr Lys Gln Ser Ser Tyr Thr Ile Thr His
                80                  85                  90
Thr Tyr Gln Ser Val Phe Asn Gly Phe Thr Ile Glu Leu Pro Ala Asn
            95                  100                 105
Gln Leu Glu Ala Leu Ser Glu Ile Asp Gly Val Lys Thr Val Trp Glu
        110                 115                 120
Asn Glu Glu Val Gln Leu Ile Asp Pro Val Leu Glu Glu Ser Val Leu
    125                 130                 135
Glu Glu Ala Ile Glu Pro Tyr Met Ala Asp Ser Val Pro Tyr Leu Gly
140                 145                 150                 155
Val Asp Arg Leu His Ile Asp Gly Ile Thr Gly Glu Gly Val Lys Val
                160                 165                 170
Gly Val Ile Asp Thr Gly Val Asp Tyr Thr His Pro Asp Leu Thr Ala
            175                 180                 185
Ala Tyr Lys Gly Gly Tyr Asp Phe Val Asp Asn Asp Asp Asp Ala Gln
        190                 195                 200
Glu Thr Thr Tyr Asp Asp Trp Leu Ala Ser Gly Met Pro Glu Phe Asn
    205                 210                 215
Ile Asn Gly Ser Ser Tyr Tyr Thr Ser His Gly Thr His Val Ala Gly
220                 225                 230                 235
Thr Ile Ala Gly Gln Gly Asp Asn Glu Ser Asp Phe Ala Thr Thr Gly
                240                 245                 250
Ile Ala Pro Asp Ala Asp Ile Tyr Ser Tyr Arg Val Leu Gly Pro Tyr
            255                 260                 265
Gly Ser Gly Thr Thr Ala Asn Val Leu Gly Gly Ile Glu Leu Ser Val
        270                 275                 280
Glu Asp Gly Met Asp Val Ile Asn Leu Ser Leu Gly Ala Asn Val Asn
    285                 290                 295
Asp Pro Leu Tyr Pro Thr Ser Val Ala Val Asn Asn Ala Val Leu Ala
300                 305                 310                 315
Gly Val Thr Ala Val Val Ser Ala Gly Asn Ser Gly Arg Asp Gly Leu
                320                 325                 330
Tyr Thr Leu Gly Ser Pro Gly Thr Ser Pro Leu Ala Ile Thr Val Gly
            335                 340                 345
Ala Asn Asp Val Pro Leu Val Phe Thr Asp Phe Thr Gly Tyr Leu Asp
        350                 355                 360
Glu Ser Phe Ser Ala Gly Leu Val Asn Ile Ser Ser Gly Phe Asp Thr
    365                 370                 375
Asp Phe Asp Glu Leu Glu Ala Gly Glu Tyr Gly Ile Val Tyr Ala Gly
380                 385                 390                 395
Leu Gly Ser Val Ala Glu Phe Asn Gln Val Asp Ala Glu Gly Lys Val
                400                 405                 410
Ala Leu Val Ala Arg Gly Glu Leu Ala Phe Val Asp Lys Ile Ala Asn
            415                 420                 425
Ala Lys Ala Ala Gly Ala Glu Ala Ile Ile Ile Tyr Asn Asn Ile Pro
        430                 435                 440
Gly Ala Gly His Ile Pro Asn Tyr Phe Gly Glu Gly Val Asn Phe Val
    445                 450                 455
Ala Gly Phe Ser Leu Thr Tyr Glu Asp Gly Ile Ala Leu Arg Asp Ala
460                 465                 470                 475
Ile Thr Asp Glu Ser Ser Phe Ser Phe Gly Asp Arg Ser Glu Ser Gln
                480                 485                 490
Thr Pro Gly Gly Val Leu Ala Asp Phe Ser Ser Arg Gly Pro Val Asn
            495                 500                 505
Glu Ser Phe Ala Ile Lys Pro Glu Val Ser Ala Pro Gly Val Asn Thr
        510                 515                 520
Leu Ser Pro Val Pro Thr Tyr Met Asn Gly Pro Asp Tyr Ile Gly Asp
    525                 530                 535
Tyr Glu Tyr Ala Tyr Gly Arg Lys Ser Gly Thr Ser Met Ser Ala Pro
540                 545                 550                 555
His Val Ala Gly Thr Ala Ala Leu Leu Leu Glu Val Lys Pro Asp Leu
                560                 565                 570
Ser Pro Ala Asp Ile Lys Thr Thr Leu Met Asn Thr Ala Asn Pro Met
            575                 580                 585
Thr Leu Asp Tyr Ser Val Phe Glu Ile Gly Ala Gly Gln Ile Asp Gln
        590                 595                 600
Arg Leu Leu Leu Leu Ser Phe Asp His Val Ser
    605                 610
<210>3
<211>828
<212>DNA
<213>芽孢杆菌属菌种P 203
<220>
<221>CDS
<222>(1)..(828)
<223>碳酸酐酶
<220>
<221>信号肽
<222>(1)..(87)
<220>
<221>成熟肽
<222>(88)..(828)
<400>3
atg aga aaa aca aac gtt cta ctg aaa tca act atg att aca aca cta       48
Met Arg Lys Thr Asn Val Leu Leu Lys Ser Thr Met Ile Thr Thr Leu
                -25                 -20                 -15
tta cta tca agt acg cta cta gta acc act ccg atc tat gca cac act       96
Leu Leu Ser Ser Thr Leu Leu Val Thr Thr Pro Ile Tyr Ala His Thr
            -10                 -5              -1  1
gaa acc cag caa ctt tcc tac aag act ctt aat gat ttg cta acg gaa      144
Glu Thr Gln Gln Leu Ser Tyr Lys Thr Leu Asn Asp Leu Leu Thr Glu
    5                   10                  15
gat gga cac agt ggt tgg tct tat tcc ggt cta act ggt cct gag tat      192
Asp Gly His Ser Gly Trp Ser Tyr Ser Gly Leu Thr Gly Pro Glu Tyr
20                  25                  30                  35
tgg gga gag tta aat gaa gac tac aag gcc tgc tct aaa ggg gag gaa      240
Trp Gly Glu Leu Asn Glu Asp Tyr Lys Ala Cys Ser Lys Gly Glu Glu
                40                  45                  50
caa tca cct atc gct tta caa aat gaa gat atc gat aat gaa aag tgg      288
Gln Ser Pro Ile Ala Leu Gln Asn Glu Asp Ile Asp Asn Glu Lys Trp
            55                  60                  65
tct ttc gat cta gac tat gaa gaa act gag ttt tca att gaa aac aat      336
Ser Phe Asp Leu Asp Tyr Glu Glu Thr Glu Phe Ser Ile Glu Asn Asn
        70                  75                  80
ggc cat aca atc caa gcg aat gta gaa ggt tca tca tct aat acg tta      384
Gly His Thr Ile Gln Ala Asn Val Glu Gly Ser Ser Ser Asn Thr Leu
    85                  90                  95
ctt tta aat gat act gaa tat aac ctt gtc caa ttt cat ttc cat tca      432
Leu Leu Asn Asp Thr Glu Tyr Asn Leu Val Gln Phe His Phe His Ser
100                 105                 110                 115
cca agt gag cac acc tta gat gac gaa tac ttt gag atg gaa gta cat      480
Pro Ser Glu His Thr Leu Asp Asp Glu Tyr Phe Glu Met Glu Val His
                120                 125                 130
ttg gtg cat caa gat gaa cat gca aat tta gct gtt cta ggt gtc tta      528
Leu Val His Gln Asp Glu His Ala Asn Leu Ala Val Leu Gly Val Leu
            135                 140                 145
att gaa gaa ggc gaa cag aat gag acg ctt aca gat atg tgg gaa cta      576
Ile Glu Glu Gly Glu Gln Asn Glu Thr Leu Thr Asp Met Trp Glu Leu
        150                 155                 160
atg cct ggg cag caa ggt gaa gct gct gaa aga att act ctt aac cca      624
Met Pro Gly Gln Gln Gly Glu Ala Ala Glu Arg Ile Thr Leu Asn Pro
    165                 170                 175
tct gaa tta gtg cct agt gat cta tca aca ttc caa tat gat ggt tcc      672
Ser Glu Leu Val Pro Ser Asp Leu Ser Thr Phe Gln Tyr Asp Gly Ser
180                 185                 190                 195
ctt act act cca cct tgc tca gaa gat gtg aaa tgg agt gtg agt gat      720
Leu Thr Thr Pro Pro Cys Ser Glu Asp Val Lys Trp Ser Val Ser Asp
                200                 205                 210
tcg aca att agc cta tct cct gaa cag ctc gag gca ttt caa gac cta      768
Ser Thr Ile Ser Leu Ser Pro Glu Gln Leu Glu Ala Phe Gln Asp Leu
            215                 220                 225
tac cca aat aac tat cgc cct att caa gac tta ggt aat aga gaa gtt      816
Tyr Pro Asn Asn Tyr Arg Pro Ile Gln Asp Leu Gly Asn Arg Glu Val
        230                 235                 240
gga ttt cac tat                                                 828
Gly Phe His Tyr
    245
<210>4
<211>276
<212>PRT
<213>芽孢杆菌属菌种P 203
<400>4
Met Arg Lys Thr Asn Val Leu Leu Lys Ser Thr Met Ile Thr Thr Leu
                -25                 -20                 -15
Leu Leu Ser Ser Thr Leu Leu Val Thr Thr Pro Ile Tyr Ala His Thr
            -10                 -5              -1  1
Glu Thr Gln Gln Leu Ser Tyr Lys Thr Leu Asn Asp Leu Leu Thr Glu
    5                   10                  15
Asp Gly His Ser Gly Trp Ser Tyr Ser Gly Leu Thr Gly Pro Glu Tyr
20                  25                  30
Trp Gly Glu Leu Asn Glu Asp Tyr Lys Ala Cys Ser Lys Gly Glu Glu
                40                  45                  50
Gln Ser Pro Ile Ala Leu Gln Asn Glu Asp Ile Asp Asn Glu Lys Trp
            55                  60                  65
Ser Phe Asp Leu Asp Tyr Glu Glu Thr Glu Phe Ser Ile Glu Asn Asn
        70                  75                  80
Gly His Thr Ile Gln Ala Asn Val Glu Gly Ser Ser Ser Asn Thr Leu
    85                  90                  95
Leu Leu Asn Asp Thr Glu Tyr Asn Leu Val Gln Phe His Phe His Ser
100                 105                 110                 115
Pro Ser Glu His Thr Leu Asp Asp Glu Tyr Phe Glu Met Glu Val His
                120                 125                 130
Leu Val His Gln Asp Glu His Ala Asn Leu Ala Val Leu Gly Val Leu
            135                 140                 145
Ile Glu Glu Gly Glu Gln Asn Glu Thr Leu Thr Asp Met Trp Glu Leu
        150                 155                 160
Met Pro Gly Gln Gln Gly Glu Ala Ala Glu Arg Ile Thr Leu Asn Pro
    165                 170                 175
Ser Glu Leu Val Pro Ser Asp Leu Ser Thr Phe Gln Tyr Asp Gly Ser
180                 185                 190                 195
Leu Thr Thr Pro Pro Cys Ser Glu Asp Val Lys Trp Ser Val Ser Asp
                200                 205                 210
Ser Thr Ile Ser Leu Ser Pro Glu Gln Leu Glu Ala Phe Gln Asp Leu
            215                 220                 225
Tyr Pro Asn Asn Tyr Arg Pro Ile Gln Asp Leu Gly Asn Arg Glu Val
        230                 235                 240
Gly Phe His Tyr
    245
<210>5
<211>702
<212>DNA
<213>芽孢杆菌属菌种P203
<220>
<221>CDS
<222>(1)..(702)
<223>碳酸酐酶
<220>
<221>信号肽
<222>(1)..(90)
<220>
<221>成熟肽
<222>(91)..(702)
<400>5
ttg tca aaa atg aag aca ctt aga aaa ttg tca ttg tat gct gca ttt       48
Leu Ser Lys Met Lys Thr Leu Arg Lys Leu Ser Leu Tyr Ala Ala Phe
-30                 -25                 -20                 -15
aca ctt tca agc agc tcg atg gtc acc gct cct ctc ttt gca cag aca       96
Thr Leu Ser Ser Ser Ser Met Val Thr Ala Pro Leu Phe Ala Gln Thr
                -10                 -5              -1  1
gat aca cat caa cca ctt atc ccg tat cac tca ctc cac ctc ttg cta      144
Asp Thr His Gln Pro Leu Ile Pro Tyr His Ser Leu His Leu Leu Leu
        5                   10                  15
cat tct aat gag aaa gaa ggc tgg tct tat tct ggc tca act ggc ccg      192
His Ser Asn Glu Lys Glu Gly Trp Ser Tyr Ser Gly Ser Thr Gly Pro
    20                  25                  30
cag ttc tgg gca gac cta cat gat gaa tac ata gca tgc tca caa gga      240
Gln Phe Trp Ala Asp Leu His Asp Glu Tyr Ile Ala Cys Ser Gln Gly
35                  40                  45                  50
aaa gaa caa tcg cct gta gcc tta cat aat gaa gac gca tca gat gaa      288
Lys Glu Gln Ser Pro Val Ala Leu His Asn Glu Asp Ala Ser Asp Glu
                55                  60                  65
gga aaa tgg tca tta gat ctt gac tat aac gaa aca gat ttc tcc att      336
Gly Lys Trp Ser Leu Asp Leu Asp Tyr Asn Glu Thr Asp Phe Ser Ile
            70                  75                  80
gag aat aac ggt cat acc att caa gca aat gta ggt gat cat tca tca      384
Glu Asn Asn Gly His Thr Ile Gln Ala Asn Val Gly Asp His Ser Ser
        85                  90                  95
aat aaa ttg att gta aat gga acc gat tac aag ttg gcg cag ttc cat      432
Asn Lys Leu Ile Val Asn Gly Thr Asp Tyr Lys Leu Ala Gln Phe His
    100                 105                 110
ttc cat tct caa agt gag cat acc tta gac gat gat tat tac gag atg      480
Phe His Ser Gln Ser Glu His Thr Leu Asp Asp Asp Tyr Tyr Glu Met
115                 120                 125                 130
gaa ctt cat tta gtt cat cag gat gag gaa gat aac ttg gcc gtc tta      528
Glu Leu His Leu Val His Gln Asp Glu Glu Asp Asn Leu Ala Val Leu
                135                 140                 145
gga gtt cta att gag gaa gga gaa aag aac gag act cta gca aac atg      576
Gly Val Leu Ile Glu Glu Gly Glu Lys Asn Glu Thr Leu Ala Asn Met
            150                 155                 160
tgg gat gtg ata ccc gaa act gaa gga gaa gcc gat gaa acc att tct      624
Trp Asp Val Ile Pro Glu Thr Glu Gly Glu Ala Asp Glu Thr Ile Ser
        165                 170                 175
ctt aat ccc tca gaa cta gta cct aaa gat cca cta gtg tcg acc tgc    672
Leu Asn Pro Ser Glu Leu Val Pro Lys Asp Pro Leu Val Ser Thr Cys
    180                 185                 190
agg cgc gcg agc tcc agc ttt tgt tcc ctt                            702
Arg Arg Ala Ser Ser Ser Phe Cys Ser Leu
195                 200
<210>6
<211>234
<212>PRT
<213>芽孢杆菌属菌种P203
<400>6
Leu Ser Lys Met Lys Thr Leu Arg Lys Leu Ser Leu Tyr Ala Ala Phe
-30                 -25                 -20                 -15
Thr Leu Ser Ser Ser Ser Met Val Thr Ala Pro Leu Phe Ala Gln Thr
                -10                 -5              -1  1
Asp Thr His Gln Pro Leu Ile Pro Tyr His Ser Leu His Leu Leu Leu
        5                   10                  15
His Ser Asn Glu Lys Glu Gly Trp Ser Tyr Ser Gly Ser Thr Gly Pro
    20                  25                  30
Gln Phe Trp Ala Asp Leu His Asp Glu Tyr Ile Ala Cys Ser Gln Gly
35                  40                  45                  50
Lys Glu Gln Ser Pro Val Ala Leu His Asn Glu Asp Ala Ser Asp Glu
                55                  60                  65
Gly Lys Trp Ser Leu Asp Leu Asp Tyr Asn Glu Thr Asp Phe Ser Ile
            70                  75                  80
Glu Asn Asn Gly His Thr Ile Gln Ala Asn Val Gly Asp His Ser Ser
        85                  90                  95
Asn Lys Leu Ile Val Asn Gly Thr Asp Tyr Lys Leu Ala Gln Phe His
    100                 105                 110
Phe His Ser Gln Ser Glu His Thr Leu Asp Asp Asp Tyr Tyr Glu Met
115                 120                 125                 130
Glu Leu His Leu Val His Gln Asp Glu Glu Asp Asn Leu Ala Val Leu
                135                 140                 145
Gly Val Leu Ile Glu Glu Gly Glu Lys Asn Glu Thr Leu Ala Asn Met
            150                 155                 160
Trp Asp Val Ile Pro Glu Thr Glu Gly Glu Ala Asp Glu Thr Ile Ser
        165                 170                 175
Leu Asn Pro Ser Glu Leu Val Pro Lys Asp Pro Leu Val Ser Thr Cys
    180                 185                 190
Arg Arg Ala Ser Ser Ser Phe Cys Ser Leu
195                 200
<210>7
<211>1080
<212>DNA
<213>芽孢杆菌属菌种P203
<220>
<221>CDS
<222>(1)..(1080)
<223>木聚糖酶
<220>
<221>信号肽
<222>(1)..(72)
<220>
<221>成熟肽
<222>(73)..(1080)
<400>7
atg att atc agg agg cat atg ttg aat aga aaa ttg ttc aag gtt tta    48
Met Ile Ile Arg Arg His Met Leu Asn Arg Lys Leu Phe Lys Val Leu
                -20                 -15                 -10
ggt agt ata ctt atc att tct gct ggg gtg tat ggt tgg atg aag ata    96
Gly Ser Ile Leu Ile Ile Ser Ala Gly Val Tyr Gly Trp Met Lys Ile
            -5              -1  1               5
cag gat caa cat aca ata cga tca atg gct gaa gat gaa cag atg ttg    144
Gln Asp Gln His Thr Ile Arg Ser Met Ala Glu Asp Glu Gln Met Leu
    10                  15                  20
ttt ggc aca gct atg cgc tat cag cca ttt tca gat gat tcg ggc tat    192
Phe Gly Thr Ala Met Arg Tyr Gln Pro Phe Ser Asp Asp Ser Gly Tyr
25                  30                  35                  40
cga gag ttg att aaa aat gag ttt aat gca gtg acc att gaa aat gaa    240
Arg Glu Leu Ile Lys Asn Glu Phe Asn Ala Val Thr Ile Glu Asn Glu
                45                  50                  55
atg aaa atg gaa cta gtt atg cct gaa cga ggc aag tat gat ttc agt    288
Met Lys Met Glu Leu Val Met Pro Glu Arg Gly Lys Tyr Asp Phe Ser
            60                  65                  70
caa gca gat gag atg gtg caa ttt gct gat gaa aat gga ctt caa gta    336
Gln Ala Asp Glu Met Val Gln Phe Ala Asp Glu Asn Gly Leu Gln Val
        75                  80                  85
aga ggc cac act ctc gta tgg gaa cgt atc cct tgg tgg ctc gat cag    384
Arg Gly His Thr Leu Val Trp Glu Arg Ile Pro Trp Trp Leu Asp Gln
    90                  95                  100
ggc aat ttt acc aga gat gaa ata acc aac cta tta aaa gag tat gtc    432
Gly Asn Phe Thr Arg Asp Glu Ile Thr Asn Leu Leu Lys Glu Tyr Val
105                 110                 115                 120
caa aca acg gta aag caa tac caa ggt cga atc tat gcc tgg gat gta    480
Gln Thr Thr Val Lys Gln Tyr Gln Gly Arg Ile Tyr Ala Trp Asp Val
                125                 130                 135
gta aat gaa gcg ttt gat aac aaa gga aat ctg aaa gag aac ttc tgg    528
Val Asn Glu Ala Phe Asp Asn Lys Gly Asn Leu Lys Glu Asn Phe Trp
            140                 145                 150
ctg cag cat atc ggt tca gat tac att gaa ctt gct ttt cga tgg gca    576
Leu Gln His Ile Gly Ser Asp Tyr Ile Glu Leu Ala Phe Arg Trp Ala
        155                 160                 165
aaa gaa gca gat cca gat gct tta ctg ttt tat aac gat tat gag aac    624
Lys Glu Ala Asp Pro Asp Ala Leu Leu Phe Tyr Asn Asp Tyr Glu Asn
    170                 175                 180
gaa gta ccc tct gct aaa act gaa gca acg ata aaa tgg ttg tca gag    672
Glu Val Pro Ser Ala Lys Thr Glu Ala Thr Ile Lys Trp Leu Ser Glu
185                 190                 195                 200
ctg cgc caa aag gga gta cca ata gat ggc atc ggc atg caa atg cat    720
Leu Arg Gln Lys Gly Val Pro Ile Asp Gly Ile Gly Met Gln Met His
                205                 210                 215
tta gat att gca aat gat ttt cat gtt gat cag gta caa aat gta atg    768
Leu Asp Ile Ala Asn Asp Phe His Val Asp Gln Val Gln Asn Val Met
            220                 225                 230
aat caa atg gag cag gaa gga ttt tta gta cat att aca gaa cta gac    816
Asn Gln Met Glu Gln Glu Gly Phe Leu Val His Ile Thr Glu Leu Asp
        235                 240                 245
ata aag ctc caa cat agt ggg gag gat ctg gag acg aaa caa cag cta    864
Ile Lys Leu Gln His Ser Gly Glu Asp Leu Glu Thr Lys Gln Gln Leu
    250                 255                 260
cag gca gaa cga tat gca gaa ata atg aag gtc tgt tta cag caa gca    912
Gln Ala Glu Arg Tyr Ala Glu Ile Met Lys Val Cys Leu Gln Gln Ala
265                 270                 275                 280
aca tgc gac tcc ttc acg gtg tgg ggt gcg gct gat cca tat agt tgg    960
Thr Cys Asp Ser Phe Thr Val Trp Gly Ala Ala Asp Pro Tyr Ser Trp
                285                 290                 295
att ggg ttt aca gag gag cca gga gcg agt gtt gcc tac cca ctt ctt   1008
Ile Gly Phe Thr Glu Glu Pro Gly Ala Ser Val Ala Tyr Pro Leu Leu
            300                 305                 310
ttt gat gat aaa ttg aaa cgg aag ccg gca tat aag gcg att aaa gct   1056
Phe Asp Asp Lys Leu Lys Arg Lys Pro Ala Tyr Lys Ala Ile Lys Ala
        315                 320                 325
ata ttt aaa gaa gat att cgt aaa                                   1080
Ile Phe Lys Glu Asp Ile Arg Lys
    330                 335
<210>8
<211>360
<212>PRT
<213>芽孢杆菌属菌种P203
<400>8
Met Ile Ile Arg Arg His Met Leu Asn Arg Lys Leu Phe Lys Val Leu
                -20                 -15                 -10
Gly Ser Ile Leu Ile Ile Ser Ala Gly Val Tyr Gly Trp Met Lys Ile
            -5              -1  1               5
Gln Asp Gln His Thr Ile Arg Ser Met Ala Glu Asp Glu Gln Met Leu
    10                  15                  20
Phe Gly Thr Ala Met Arg Tyr Gln Pro Phe Ser Asp Asp Ser Gly Tyr
25                  30                  35                  40
Arg Glu Leu Ile Lys Asn Glu Phe Asn Ala Val Thr Ile Glu Asn Glu
                45                  50                  55
Met Lys Met Glu Leu Val Met Pro Glu Arg Gly Lys Tyr Asp Phe Ser
            60                  65                  70
Gln Ala Asp Glu Met Val Gln Phe Ala Asp Glu Asn Gly Leu Gln Val
        75                  80                  85
Arg Gly His Thr Leu Val Trp Glu Arg Ile Pro Trp Trp Leu Asp Gln
    90                  95                  100
Gly Asn Phe Thr Arg Asp Glu Ile Thr Asn Leu Leu Lys Glu Tyr Val
105                 110                 115                 120
Gln Thr Thr Val Lys Gln Tyr Gln Gly Arg Ile Tyr Ala Trp Asp Val
                125                 130                 135
Val Asn Glu Ala Phe Asp Asn Lys Gly Asn Leu Lys Glu Asn Phe Trp
            140                 145                 150
Leu Gln His Ile Gly Ser Asp Tyr Ile Glu Leu Ala Phe Arg Trp Ala
        155                  160                  165
Lys Glu Ala Asp Pro Asp Ala Leu Leu Phe Tyr Asn Asp Tyr Glu Asn
    170                 175                 180
Glu Val Pro Ser Ala Lys Thr Glu Ala Thr Ile Lys Trp Leu Ser Glu
185                 190                 195                 200
Leu Arg Gln Lys Gly Val Pro Ile Asp Gly Ile Gly Met Gln Met His
                205                 210                 215
Leu Asp Ile Ala Asn Asp Phe His Val Asp Gln Val Gln Asn Val Met
            220                 225                 230
Asn Gln Met Glu Gln Glu Gly Phe Leu Val His Ile Thr Glu Leu Asp
        235                 240                 245
Ile Lys Leu Gln His Ser Gly Glu Asp Leu Glu Thr Lys Gln Gln Leu
    250                 255                 260
Gln Ala Glu Arg Tyr Ala Glu Ile Met Lys Val Cys Leu Gln Gln Ala
265                 270                 275                 280
Thr Cys Asp Ser Phe Thr Val Trp Gly Ala Ala Asp Pro Tyr Ser Trp
                285                 290                 295
Ile Gly Phe Thr Glu Glu Pro Gly Ala Ser Val Ala Tyr Pro Leu Leu
            300                 305                 310
Phe Asp Asp Lys Leu Lys Arg Lys Pro Ala Tyr Lys Ala Ile Lys Ala
        315                 320                 325
Ile Phe Lys Glu Asp Ile Arg Lys
    330                 335
<210>9
<211>2712
<212>DNA
<213>芽孢杆菌属菌种P203
<220>
<221>CDS
<222>(1)..(2712)
<223>鼠李糖半乳糖醛酸聚糖裂合酶
<220>
<221>信号肽
<222>(1)..(87)
<220>
<221>成熟肽
<222>(88)..(2712)
<400>9
atg ttc aaa agg cag ggg aaa gga att ctt ttt ggg tta ctt gtt gtg    48
Met Phe Lys Arg Gln Gly Lys Gly Ile Leu Phe Gly Leu Leu Val Val
                -25                 -20                 -15
gtt ttg gtc tgt gct aac atg tcc gga caa gct att gct aaa aaa caa    96
Val Leu Val Cys Ala Asn Met Ser Gly Gln Ala Ile Ala Lys Lys Gln
            -10                 -5              -1  1
gaa aag aaa gat ctc act gta act gaa gtg act gat tca agt gtg tca      144
Glu Lys Lys Asp Leu Thr Val Thr Glu Val Thr Asp Ser Ser Val Ser
    5                   10                  15
ttg tct tgg aag cag gta aaa ggg gca gat tcg tat aac gtg tat tgg      192
Leu Ser Trp Lys Gln Val Lys Gly Ala Asp Ser Tyr Asn Val Tyr Trp
20                  25                  30                  35
gca gat aaa gat acg gag aat atg gaa tat cga cta ctt gat aac gtt      240
Ala Asp Lys Asp Thr Glu Asn Met Glu Tyr Arg Leu Leu Asp Asn Val
                40                  45                  50
tca gag act acc tac acc tac gaa cgt tca acg cat atc cct cat tat      288
Ser Glu Thr Thr Tyr Thr Tyr Glu Arg Ser Thr His Ile Pro His Tyr
            55                  60                  65
ttt aag att gtt cca gta aca aat gga gaa gaa ggt gaa ttt tca aat      336
Phe Lys Ile Val Pro Val Thr Asn Gly Glu Glu Gly Glu Phe Ser Asn
        70                  75                  80
act gtt caa act gat att aaa aaa ata ttt gac caa cag ctt gag gat      384
Thr Val Gln Thr Asp Ile Lys Lys Ile Phe Asp Gln Gln Leu Glu Asp
    85                  90                  95
ttg gac cgt gga gtg gtc gct gtc tca aca tct gaa ggt gta ttt tta      432
Leu Asp Arg Gly Val Val Ala Val Ser Thr Ser Glu Gly Val Phe Leu
100                 105                 110                 115
agc tgg agg ctg tta aag cag gaa gta gat ggt cat tct gag aca ggc      480
Ser Trp Arg Leu Leu Lys Gln Glu Val Asp Gly His Ser Glu Thr Gly
                120                 125                 130
tta acc ggt gtt gat ttt tat gtt tac cga gat gga agc aaa att gca      528
Leu Thr Gly Val Asp Phe Tyr Val Tyr Arg Asp Gly Ser Lys Ile Ala
            135                 140                 145
gaa gtg aca gac agc aca aat tac ttg gac gaa gaa gga aca gcc agt      576
Glu Val Thr Asp Ser Thr Asn Tyr Leu Asp Glu Glu Gly Thr Ala Ser
        150                 155                 160
ttt gaa tat acg att aga gcc gtg gat cat ggt aag gag ctg gat gaa      624
Phe Glu Tyr Thr Ile Arg Ala Val Asp His Gly Lys Glu Leu Asp Glu
    165                 170                 175
agt gag cca gta agt ccg tgg gca gac ggt tat tat gat ttg ccg ttg      672
Ser Glu Pro Val Ser Pro Trp Ala Asp Gly Tyr Tyr Asp Leu Pro Leu
180                 185                 190                 195
caa aaa cca gcg gat ggg gta act cca gct ggc gag tcc tat acg tac      720
Gln Lys Pro Ala Asp Gly Val Thr Pro Ala Gly Glu Ser Tyr Thr Tyr
                200                 205                 210
cat gca aat gat atg agt gta ggg gat gtt gat ggc gat gga caa tac      768
His Ala Asn Asp Met Ser Val Gly Asp Val Asp Gly Asp Gly Gln Tyr
            215                 220                 225
gaa ttt atc gtt aaa tgg gat cca tca aat tca aag gac gtc tct caa      816
Glu Phe Ile Val Lys Trp Asp Pro Ser Asn Ser Lys Asp Val Ser Gln
        230                 235                 240
aaa ggc tac aca gga aat acg tat att gac acg tat acg ttt gaa gga      864
Lys Gly Tyr Thr Gly Asn Thr Tyr Ile Asp Thr Tyr Thr Phe Glu Gly
    245                 250                 255
gag tta ctt tat cga att gat tta ggt gta aat gtt cgc tct gga gca      912
Glu Leu Leu Tyr Arg Ile Asp Leu Gly Val Asn Val Arg Ser Gly Ala
260                 265                 270                 275
cat tat act caa ttt tta gtc tat gac ttt gat gga gat gga aaa gcg      960
His Tyr Thr Gln Phe Leu Val Tyr Asp Phe Asp Gly Asp Gly Lys Ala
                280                 285                 290
gaa atc atg ttt aag aca gca cct gga aca aag ata cta aca ttt aat     1008
Glu Ile Met Phe Lys Thr Ala Pro Gly Thr Lys Ile Leu Thr Phe Asn
            295                 300                 305
ggt aat gga gag att gaa acc gaa gag tac atc acg atg cca gaa gag     1056
Gly Asn Gly Glu Ile Glu Thr Glu Glu Tyr Ile Thr Met Pro Glu Glu
        310                 315                 320
gat cta tct aaa ggc tat agt cat gaa gat gac tac cga atg agt tca     1104
Asp Leu Ser Lys Gly Tyr Ser His Glu Asp Asp Tyr Arg Met Ser Ser
    325                 330                 335
gag gat tat tat cag cat atc gtt cag atg ttt atg gaa tgg cat gaa     1152
Glu Asp Tyr Tyr Gln His Ile Val Gln Met Phe Met Glu Trp His Glu
340                 345                 350                 355
cat gag gag gta gtg gat ggt aat tgg cca gca aca ctt gaa gag agt     1200
His Glu Glu Val Val Asp Gly Asn Trp Pro Ala Thr Leu Glu Glu Ser
                360                 365                 370
ttt ggt att gac gtt caa tat gaa tat cca ctt tct aaa gag gat gct     1248
Phe Gly Ile Asp Val Gln Tyr Glu Tyr Pro Leu Ser Lys Glu Asp Ala
            375                 380                 385
gag tcg tta gct gat tat ttt atg gac gag tat gcg cct tct cgc agc     1296
Glu Ser Leu Ala Asp Tyr Phe Met Asp Glu Tyr Ala Pro Ser Arg Ser
        390                 395                 400
ggg cgt aat gac cta cga gac ttt gaa ggc ttt att gtt gaa gga cca     1344
Gly Arg Asn Asp Leu Arg Asp Phe Glu Gly Phe Ile Val Glu Gly Pro
    405                 410                 415
gaa tat tta acc gta ttt gaa gga gag aca ggc aag gag tta gaa acc     1392
Glu Tyr Leu Thr Val Phe Glu Gly Glu Thr Gly Lys Glu Leu Glu Thr
420                 425                 430                 435
att cat tat aag cct gga aga agc gat gat gga ttg atg tgg gga gat     1440
Ile His Tyr Lys Pro Gly Arg Ser Asp Asp Gly Leu Met Trp Gly Asp
                440                 445                 450
tat gcg atg gct cgc att gag cct gga aac cgc gtt gat cgt ttt cta     1488
Tyr Ala Met Ala Arg Ile Glu Pro Gly Asn Arg Val Asp Arg Phe Leu
            455                 460                 465
gca ggg gtc gcc tac cta gat ggt gag aat cca tac gct gta ttt gct     1536
Ala Gly Val Ala Tyr Leu Asp Gly Glu Asn Pro Tyr Ala Val Phe Ala
        470                 475                 480
aga gga tac tac aca aga aca aca ctt gtt tca tat gat tgg gac gga     1584
Arg Gly Tyr Tyr Thr Arg Thr Thr Leu Val Ser Tyr Asp Trp Asp Gly
    485                 490                 495
cag agc tta aat gaa cac tgg tac gta gat agt ggt tgg aca cca atg     1632
Gln Ser Leu Asn Glu His Trp Tyr Val Asp Ser Gly Trp Thr Pro Met
500                 505                 510                 515
tct aat cca ttt aat gat ggt cca cat gga gta gat ggg act gac gaa     1680
Ser Asn Pro Phe Asn Asp Gly Pro His Gly Val Asp Gly Thr Asp Glu
                520                 525                 530
gaa ttt gga aca att aca aca caa ggt gct cac tct ttg agt gtt gct     1728
Glu Phe Gly Thr Ile Thr Thr Gln Gly Ala His Ser Leu Ser Val Ala
            535                 540                 545
gat gtt gat ggt gat ggg aag cac gaa att atc tac ggt gga gct acg     1776
Asp Val Asp Gly Asp Gly Lys His Glu Ile Ile Tyr Gly Gly Ala Thr
        550                 555                 560
att gac cac gat ggc tcc ttg tta tat agc tcc ttt gac aca atg cca     1824
Ile Asp His Asp Gly Ser Leu Leu Tyr Ser Ser Phe Asp Thr Met Pro
    565                 570                 575
cca gga agt gct aac cct gga gaa gaa gca aga ctt gga cac ggg gat     1872
Pro Gly Ser Ala Asn Pro Gly Glu Glu Ala Arg Leu Gly His Gly Asp
580                 585                 590                 595
gcg ctt cat gta gcc gat gtg atc ctg ata gac cag gtt tgg aga gct     1920
Ala Leu His Val Ala Asp Val Ile Leu Ile Asp Gln Val Trp Arg Ala
                600                 605                 610
tta tgg tat ttg aag gcg gtc aat ggg cgc ctt atg gat atg cct tac     1968
Leu Trp Tyr Leu Lys Ala Val Asn Gly Arg Leu Met Asp Met Pro Tyr
            615                 620                 625
gtg atg ctg aat ctg gag atg tgt tat atg gcg gga tac ggt cga gat     2016
Val Met Leu Asn Leu Glu Met Cys Tyr Met Ala Gly Tyr Gly Arg Asp
        630                 635                 640
act ggt cgc ggt atg gtt ggt gat gtg aat cca gac aag cga ggc ctt     2064
Thr Gly Arg Gly Met Val Gly Asp Val Asn Pro Asp Lys Arg Gly Leu
    645                 650                 655
gaa aca tgg gct gta gga cta tgg aca gct gac gga gag aaa ctc agt     2112
Glu Thr Trp Ala Val Gly Leu Trp Thr Ala Asp Gly Glu Lys Leu Ser
660                 665                 670                 675
gac agc atg ccg ggt aca aat ttt aat att aaa tgg tct gga gat tta     2160
Asp Ser Met Pro Gly Thr Asn Phe Asn Ile Lys Trp Ser Gly Asp Leu
                680                 685                 690
acc aca caa ata gtg aat ggt tcc att gat caa acg cct tcc att gat     2208
Thr Thr Gln Ile Val Asn Gly Ser Ile Asp Gln Thr Pro Ser Ile Asp
            695                 700                 705
gat tgg cag aaa gga cga tta ctt acg gca gaa ggc act aga acc aac     2256
Asp Trp Gln Lys Gly Arg Leu Leu Thr Ala Glu Gly Thr Arg Thr Asn
        710                 715                 720
aat tac aca aaa ggt aca cct tca ctc gtt gca gat gtg ttt ggg gat     2304
Asn Tyr Thr Lys Gly Thr Pro Ser Leu Val Ala Asp Val Phe Gly Asp
    725                 730                 735
ttt aga gaa gag ttg cta gtt aga aca aca gat agc tca gcc ata cgt     2352
Phe Arg Glu Glu Leu Leu Val Arg Thr Thr Asp Ser Ser Ala Ile Arg
740                 745                 750                 755
atc tac aca agt aca gag gtc acg gag cat aag ctt tac aca ttg atg     2400
Ile Tyr Thr Ser Thr Glu Val Thr Glu His Lys Leu Tyr Thr Leu Met
                760                 765                 770
cat gat act caa tat cga aca ggc atc gca tgg caa aat gta acc tac     2448
His Asp Thr Gln Tyr Arg Thr Gly Ile Ala Trp Gln Asn Val Thr Tyr
            775                 780                 785
aac caa cca tcc tat ccg ggc ttt tat tat gca tct gat atg gat tgg     2496
Asn Gln Pro Ser Tyr Pro Gly Phe Tyr Tyr Ala Ser Asp Met Asp Trp
        790                 795                 800
gag tat gta cct gtt cca gtt gat caa cag aaa gat tct att aac tca     2544
Glu Tyr Val Pro Val Pro Val Asp Gln Gln Lys Asp Ser Ile Asn Ser
    805                 810                 815
act aga aga tcc act agt gtc gac ctg cag gcg cgc gag ctc cag ctt    2592
Thr Arg Arg Ser Thr Ser Val Asp Leu Gln Ala Arg Glu Leu Gln Leu
820                 825                 830                 835
ttg ttc cct tta gtg agg gtt aat ttc gag ctt ggc gta atc aag gtc    2640
Leu Phe Pro Leu Val Arg Val Asn Phe Glu Leu Gly Val Ile Lys Val
                840                 845                 850
ata gct gtt tcc tgt gtg aaa ttg tta tcc gct cac aat tcc aca caa    2688
Ile Ala Val Ser Cys Val Lys Leu Leu Ser Ala His Asn Ser Thr Gln
            855                 860                 865
tat acg agc cgg aag tat aaa gtg                                    2712
Tyr Thr Ser Arg Lys Tyr Lys Val
        870                 875
<210>10
<211>904
<212>PRT
<213>芽孢杆菌属菌种P203
<400>10
Met Phe Lys Arg Gln Gly Lys Gly Ile Leu Phe Gly Leu Leu Val Val
                -25                 -20                 -15
Val Leu Val Cys Ala Asn Met Ser Gly Gln Ala Ile Ala Lys Lys Gln
            -10                 -5              -1  1
Glu Lys Lys Asp Leu Thr Val Thr Glu Val Thr Asp Ser Ser Val Ser
    5                   10                  15
Leu Ser Trp Lys Gln Val Lys Gly Ala Asp Ser Tyr Asn Val Tyr Trp
20                  25                  30                  35
Ala Asp Lys Asp Thr Glu Asn Met Glu Tyr Arg Leu Leu Asp Asn Val
                40                  45                  50
Ser Glu Thr Thr Tyr Thr Tyr Glu Arg Ser Thr His Ile Pro His Tyr
            55                  60                  65
Phe Lys Ile Val Pro Val Thr Asn Gly Glu Glu Gly Glu Phe Ser Asn
        70                  75                  80
Thr Val Gln Thr Asp Ile Lys Lys Ile Phe Asp Gln Gln Leu Glu Asp
    85                  90                  95
Leu Asp Arg Gly Val Val Ala Val Ser Thr Ser Glu Gly Val Phe Leu
100                 105                 110                 115
Ser Trp Arg Leu Leu Lys Gln Glu Val Asp Gly His Ser Glu Thr Gly
                120                 125                 130
Leu Thr Gly Val Asp Phe Tyr Val Tyr Arg Asp Gly Ser Lys Ile Ala
            135                 140                 145
Glu Val Thr Asp Ser Thr Asn Tyr Leu Asp Glu Glu Gly Thr Ala Ser
        150                 155                 160
Phe Glu Tyr Thr Ile Arg Ala Val Asp His Gly Lys Glu Leu Asp Glu
    165                 170                 175
Ser Glu Pro Val Ser Pro Trp Ala Asp Gly Tyr Tyr Asp Leu Pro Leu
180                 185                 190                 195
Gln Lys Pro Ala Asp Gly Val Thr Pro Ala Gly Glu Ser Tyr Thr Tyr
                200                 205                 210
His Ala Asn Asp Met Ser Val Gly Asp Val Asp Gly Asp Gly Gln Tyr
            215                 220                 225
Glu Phe Ile Val Lys Trp Asp Pro Ser Asn Ser Lys Asp Val Ser Gln
        230                 235                 240
Lys Gly Tyr Thr Gly Asn Thr Tyr Ile Asp Thr Tyr Thr Phe Glu Gly
    245                 250                 255
Glu Leu Leu Tyr Arg Ile Asp Leu Gly Val Asn Val Arg Ser Gly Ala
260                 265                 270                 275
His Tyr Thr Gln Phe Leu Val Tyr Asp Phe Asp Gly Asp Gly Lys Ala
                280                 285                 290
Glu Ile Met Phe Lys Thr Ala Pro Gly Thr Lys Ile Leu Thr Phe Asn
            295                 300                 305
Gly Asn Gly Glu Ile Glu Thr Glu Glu Tyr Ile Thr Met Pro Glu Glu
        310                 315                 320
Asp Leu Ser Lys Gly Tyr Ser His Glu Asp Asp Tyr Arg Met Ser Ser
    325                 330                 335
Glu Asp Tyr Tyr Gln His Ile Val Gln Met Phe Met Glu Trp His Glu
340                 345                 350                 355
His Glu Glu Val Val Asp Gly Asn Trp Pro Ala Thr Leu Glu Glu Ser
                360                 365                 370
Phe Gly Ile Asp Val Gln Tyr Glu Tyr Pro Leu Ser Lys Glu Asp Ala
            375                 380                 385
Glu Ser Leu Ala Asp Tyr Phe Met Asp Glu Tyr Ala Pro Ser Arg Ser
        390                 395                 400
Gly Arg Asn Asp Leu Arg Asp Phe Glu Gly Phe Ile Val Glu Gly Pro
    405                 410                 415
Glu Tyr Leu Thr Val Phe Glu Gly Glu Thr Gly Lys Glu Leu Glu Thr
420                 425                 430                 435
Ile His Tyr Lys Pro Gly Arg Ser Asp Asp Gly Leu Met Trp Gly Asp
                440                 445                 450
Tyr Ala Met Ala Arg Ile Glu Pro Gly Asn Arg Val Asp Arg Phe Leu
            455                 460                 465
Ala Gly Val Ala Tyr Leu Asp Gly Glu Asn Pro Tyr Ala Val Phe Ala
        470                 475                 480
Arg Gly Tyr Tyr Thr Arg Thr Thr Leu Val Ser Tyr Asp Trp Asp Gly
    485                 490                 495
Gln Ser Leu Asn Glu His Trp Tyr Val Asp Ser Gly Trp Thr Pro Met
500                 505                 510                 515
Ser Asn Pro Phe Asn Asp Gly Pro His Gly Val Asp Gly Thr Asp Glu
                520                 525                 530
Glu Phe Gly Thr Ile Thr Thr Gln Gly Ala His Ser Leu Ser Val Ala
            535                 540                 545
Asp Val Asp Gly Asp Gly Lys His Glu Ile Ile Tyr Gly Gly Ala Thr
        550                 555                 560
Ile Asp His Asp Gly Ser Leu Leu Tyr Ser Ser Phe Asp Thr Met Pro
    565                 570                 575
Pro Gly Ser Ala Asn Pro Gly Glu Glu Ala Arg Leu Gly His Gly Asp
580                 585                 590                 595
Ala Leu His Val Ala Asp Val Ile Leu Ile Asp Gln Val Trp Arg Ala
                600                 605                 610
Leu Trp Tyr Leu Lys Ala Val Asn Gly Arg Leu Met Asp Met Pro Tyr
            615                 620                 625
Val Met Leu Asn Leu Glu Met Cys Tyr Met Ala Gly Tyr Gly Arg Asp
        630                 635                 640
Thr Gly Arg Gly Met Val Gly Asp Val Asn Pro Asp Lys Arg Gly Leu
    645                 650                 655
Glu Thr Trp Ala Val Gly Leu Trp Thr Ala Asp Gly Glu Lys Leu Ser
660                 665                 670                 675
Asp Ser Met Pro Gly Thr Asn Phe Asn Ile Lys Trp Ser Gly Asp Leu
                680                 685                 690
Thr Thr Gln Ile Val Asn Gly Ser Ile Asp Gln Thr Pro Ser Ile Asp
            695                 700                 705
Asp Trp Gln Lys Gly Arg Leu Leu Thr Ala Glu Gly Thr Arg Thr Asn
        710                 715                 720
Asn Tyr Thr Lys Gly Thr Pro Ser Leu Val Ala Asp Val Phe Gly Asp
    725                 730                 735
Phe Arg Glu Glu Leu Leu Val Arg Thr Thr Asp Ser Ser Ala Ile Arg
740                 745                 750                 755
Ile Tyr Thr Ser Thr Glu Val Thr Glu His Lys Leu Tyr Thr Leu Met
                760                 765                 770
His Asp Thr Gln Tyr Arg Thr Gly Ile Ala Trp Gln Asn Val Thr Tyr
            775                 780                 785
Asn Gln Pro Ser Tyr Pro Gly Phe Tyr Tyr Ala Ser Asp Met Asp Trp
        790                 795                 800
Glu Tyr Val Pro Val Pro Val Asp Gln Gln Lys Asp Ser Ile Asn Ser
    805                 810                 815
Thr Arg Arg Ser Thr Ser Val Asp Leu Gln Ala Arg Glu Leu Gln Leu
820                 825                 830                 835
Leu Phe Pro Leu Val Arg Val Asn Phe Glu Leu Gly Val Ile Lys Val
                840                 845                 850
Ile Ala Val Ser Cys Val Lys Leu Leu Ser Ala His Asn Ser Thr Gln
            855                 860                 865
Tyr Thr Ser Arg Lys Tyr Lys Val
        870                 875
<210>11
<211>1602
<212>DNA
<213>芽孢杆菌属菌种P203
<220>
<221>CDS
<222>(1)..(1602)
<223>阿拉伯半乳糖苷酶
<220>
<221>信号肽
<222>(1)..(93)
<220>
<221>成熟肽
<222>(94)..(1602)
<400>11
atg att caa atg aaa aga atg ttt ggt act tgt tta gct gtt gct gtc    48
Met Ile Gln Met Lys Arg Met Phe Gly Thr Cys Leu Ala Val Ala Val
    -30                 -25                 -20
tta ggt ata ccg act ata ggt gga cag gct ggc gta gca aac gca gcc    96
Leu Gly Ile Pro Thr Ile Gly Gly Gln Ala Gly Val Ala Asn Ala Ala
-15                 -10                 -5              -1  1
tct gaa ccg gta caa tcc gaa cta ttc gta gag aag gta gag gga cta   144
Ser Glu Pro Val Gln Ser Glu Leu Phe Val Glu Lys Val Glu Gly Leu
            5                   10                  15
gat gaa gat ttt att aga ggg gta gat ata tcg agt gtg att gct atg   192
Asp Glu Asp Phe Ile Arg Gly Val Asp Ile Ser Ser Val Ile Ala Met
        20                  25                  30
gaa aat agc gga acg gtc tat tac aac gaa gaa ggg gaa gag caa gat   240
Glu Asn Ser Gly Thr Val Tyr Tyr Asn Glu Glu Gly Glu Glu Gln Asp
    35                  40                  45
gtg ttt cag act ttt aag gag gca gga gcc aat tac gtg cga gtg cgt   288
Val Phe Gln Thr Phe Lys Glu Ala Gly Ala Asn Tyr Val Arg Val Arg
50                  55                  60                  65
gta tgg aat gat cca tac gat gct gaa ggg aac agc tat ggc gga gga   336
Val Trp Asn Asp Pro Tyr Asp Ala Glu Gly Asn Ser Tyr Gly Gly Gly
                70                  75                  80
aat aat gat cta gaa acg gcg att gaa att gga aaa cga gcc aca gaa   384
Asn Asn Asp Leu Glu Thr Ala Ile Glu Ile Gly Lys Arg Ala Thr Glu
            85                  90                  95
aat ggg atg aaa cta tta gta gac ttc cat tac tcc gac ttt tgg gcg   432
Asn Gly Met Lys Leu Leu Val Asp Phe His Tyr Ser Asp Phe Trp Ala
        100                 105                 110
gac cca ggg aaa cag ttc ccc cct aaa gca tgg gag aat tta agt ctt   480
Asp Pro Gly Lys Gln Phe Pro Pro Lys Ala Trp Glu Asn Leu Ser Leu
    115                 120                 125
gaa gag aaa aaa gct gag cta tat gac ttt acg aag gat agt tta gaa   528
Glu Glu Lys Lys Ala Glu Leu Tyr Asp Phe Thr Lys Asp Ser Leu Glu
130                 135                 140                 145
gaa atg ctt gct gaa gga ata cac att ggg atg gtt cag atc ggt aat   576
Glu Met Leu Ala Glu Gly Ile His Ile Gly Met Val Gln Ile Gly Asn
                150                 155                 160
gaa aca aca aat ggg ctg gcc ggt gaa tat gat tgg tct aat atc acg   624
Glu Thr Thr Asn Gly Leu Ala Gly Glu Tyr Asp Trp Ser Asn Ile Thr
            165                 170                 175
tcg ttg atc aat gaa gga agt aag gcg gta agg gaa gtg gac gag gat   672
Ser Leu Ile Asn Glu Gly Ser Lys Ala Val Arg Glu Val Asp Glu Asp
        180                 185                 190
att ctc atc gct tta cac ttt aca aac cct gaa aga gaa ggg aga tac   720
Ile Leu Ile Ala Leu His Phe Thr Asn Pro Glu Arg Glu Gly Arg Tyr
    195                 200                 205
gca ttc ttt gct caa aca tta gac gag cag aat gta gat tat gat gtc   768
Ala Phe Phe Ala Gln Thr Leu Asp Glu Gln Asn Val Asp Tyr Asp Val
210                 215                 220                 225
ttt gca agc tca tgg tac ccg aat tgg cac gga aca tta gag aat ctg    816
Phe Ala Ser Ser Trp Tyr Pro Asn Trp His Gly Thr Leu Glu Asn Leu
                230                 235                 240
acg act att ttt aac gag ata gcg gag acc tac gat aaa aaa gta atg    864
Thr Thr Ile Phe Asn Glu Ile Ala Glu Thr Tyr Asp Lys Lys Val Met
            245                 250                 255
atg gca gaa gtc tcg tat tcg tat aca aat gaa gac cgg aat gga gat    912
Met Ala Glu Val Ser Tyr Ser Tyr Thr Asn Glu Asp Arg Asn Gly Asp
        260                 265                 270
ccg att ggt acg gag gaa gtt ccg ggt tat tca atc tcc gta caa ggt    960
Pro Ile Gly Thr Glu Glu Val Pro Gly Tyr Ser Ile Ser Val Gln Gly
    275                 280                 285
caa gct cac gta att aga gat gca att gat gcg gtg gcg agt att ggg   1008
Gln Ala His Val Ile Arg Asp Ala Ile Asp Ala Val Ala Ser Ile Gly
290                 295                 300                 305
gat gcg agt att ggg gat gcg ggt ata ggt gtg ttt tac tgg gag cca   1056
Asp Ala Ser Ile Gly Asp Ala Gly Ile Gly Val Phe Tyr Trp Glu Pro
                310                 315                 320
gct tgg att gat cca gct gga tat acg gag gac gag cta tac gat att   1104
Ala Trp Ile Asp Pro Ala Gly Tyr Thr Glu Asp Glu Leu Tyr Asp Ile
            325                 330                 335
agg gaa aca cat ggc tct ggt tgg gca tca agc tac gca gct acc tac   1152
Arg Glu Thr His Gly Ser Gly Trp Ala Ser Ser Tyr Ala Ala Thr Tyr
        340                 345                 350
gat cca gag gat gca ggc aaa tat tac ggt gga acg tca gct gat gac   1200
Asp Pro Glu Asp Ala Gly Lys Tyr Tyr Gly Gly Thr Ser Ala Asp Asp
    355                 360                 365
gaa gga ttg ttt gat tat cat ggc cat cca tta cca tca atc aat gtg   1248
Glu Gly Leu Phe Asp Tyr His Gly His Pro Leu Pro Ser Ile Asn Val
370                 375                 380                 385
ttc aaa gat gtc tac act gga gct gtg aca gaa tta aag gtt gat cga   1296
Phe Lys Asp Val Tyr Thr Gly Ala Val Thr Glu Leu Lys Val Asp Arg
                390                 395                 400
ata cat gat gtt cat ctc cag att agc ctt ggt caa aca gca aag tta   1344
Ile His Asp Val His Leu Gln Ile Ser Leu Gly Gln Thr Ala Lys Leu
            405                 410                 415
cct gaa acg gta aca gtc agc ttt aat gac cga agt act cag gag gta   1392
Pro Glu Thr Val Thr Val Ser Phe Asn Asp Arg Ser Thr Gln Glu Val
        420                 425                 430
cca gta agc tgg gac gag gaa gca ttc cag caa gct cta gaa agt gga   1440
Pro Val Ser Trp Asp Glu Glu Ala Phe Gln Gln Ala Leu Glu Ser Gly
    435                 440                 445
ctg gga tca tat gtg att aac gga aca gta gaa gat gga caa caa gta   1488
Leu Gly Ser Tyr Val Ile Asn Gly Thr Val Glu Asp Gly Gln Gln Val
450                 455                 460                 465
aaa gca cat ctc gaa atc act caa gaa aat gtt gtg aag aat cct agt   1536
Lys Ala His Leu Glu Ile Thr Gln Glu Asn Val Val Lys Asn Pro Ser
                470                 475                 480
ttt gaa gat agt gag aga gcg atg tgg gag atc caa aga att caa aaa   1584
Phe Glu Asp Ser Glu Arg Ala Met Trp Glu Ile Gln Arg Ile Gln Lys
            485                 490                 495
gct tct cga gag tac ttc                                          1602
Ala Ser Arg Glu Tyr Phe
        500
<210>12
<211>534
<212>PRT
<213>芽孢杆菌属菌种P203
<400>12
Met Ile Gln Met Lys Arg Met Phe Gly Thr Cys Leu Ala Val Ala Val
    -30                 -25                 -20
Leu Gly Ile Pro Thr Ile Gly Gly Gln Ala Gly Val Ala Asn Ala Ala
-15                 -10                 -5              -1  1
Ser Glu Pro Val Gln Ser Glu Leu Phe Val Glu Lys Val Glu Gly Leu
            5                   10                  15
Asp Glu Asp Phe Ile Arg Gly Val Asp Ile Ser Ser Val Ile Ala Met
        20                  25                  30
Glu Asn Ser Gly Thr Val Tyr Tyr Asn Glu Glu Gly Glu Glu Gln Asp
    35                  40                  45
Val Phe Gln Thr Phe Lys Glu Ala Gly Ala Asn Tyr Val Arg Val Arg
50                  55                  60                  65
Val Trp Asn Asp Pro Tyr Asp Ala Glu Gly Asn Ser Tyr Gly Gly Gly
                70                  75                  80
Asn Asn Asp Leu Glu Thr Ala Ile Glu Ile Gly Lys Arg Ala Thr Glu
            85                  90                  95
Asn Gly Met Lys Leu Leu Val Asp Phe His Tyr Ser Asp Phe Trp Ala
        100                 105                 110
Asp Pro Gly Lys Gln Phe Pro Pro Lys Ala Trp Glu Asn Leu Ser Leu
    115                 120                 125
Glu Glu Lys Lys Ala Glu Leu Tyr Asp Phe Thr Lys Asp Ser Leu Glu
130                 135                 140                 145
Glu Met Leu Ala Glu Gly Ile His Ile Gly Met Val Gln Ile Gly Asn
                150                 155                 160
Glu Thr Thr Asn Gly Leu Ala Gly Glu Tyr Asp Trp Ser Asn Ile Thr
            165                 170                 175
Ser Leu Ile Asn Glu Gly Ser Lys Ala Val Arg Glu Val Asp Glu Asp
        180                 185                 190
Ile Leu Ile Ala Leu His Phe Thr Asn Pro Glu Arg Glu Gly Arg Tyr
    195                 200                 205
Ala Phe Phe Ala Gln Thr Leu Asp Glu Gln Asn Val Asp Tyr Asp Val
210                 215                 220                 225
Phe Ala Ser Ser Trp Tyr Pro Asn Trp His Gly Thr Leu Glu Asn Leu
                230                 235                 240
Thr Thr Ile Phe Asn Glu Ile Ala Glu Thr Tyr Asp Lys Lys Val Met
            245                 250                 255
Met Ala Glu Val Ser Tyr Ser Tyr Thr Asn Glu Asp Arg Asn Gly Asp
        260                 265                 270
Pro Ile Gly Thr Glu Glu Val Pro Gly Tyr Ser Ile Ser Val Gln Gly
    275                 280                 285
Gln Ala His Val Ile Arg Asp Ala Ile Asp Ala Val Ala Ser Ile Gly
290                 295                 300                 305
Asp Ala Ser Ile Gly Asp Ala Gly Ile Gly Val Phe Tyr Trp Glu Pro
                310                 315                 320
Ala Trp Ile Asp Pro Ala Gly Tyr Thr Glu Asp Glu Leu Tyr Asp Ile
            325                 330                 335
Arg Glu Thr His Gly Ser Gly Trp Ala Ser Ser Tyr Ala Ala Thr Tyr
        340                 345                 350
Asp Pro Glu Asp Ala Gly Lys Tyr Tyr Gly Gly Thr Ser Ala Asp Asp
    355                 360                 365
Glu Gly Leu Phe Asp Tyr His Gly His Pro Leu Pro Ser Ile Asn Val
370                 375                 380                 385
Phe Lys Asp Val Tyr Thr Gly Ala Val Thr Glu Leu Lys Val Asp Arg
                390                 395                 400
Ile His Asp Val His Leu Gln Ile Ser Leu Gly Gln Thr Ala Lys Leu
            405                 410                 415
Pro Glu Thr Val Thr Val Ser Phe Asn Asp Arg Ser Thr Gln Glu Val
        420                 425                 430
Pro Val Ser Trp Asp Glu Glu Ala Phe Gln Gln Ala Leu Glu Ser Gly
    435                 440                 445
Leu Gly Ser Tyr Val Ile Asn Gly Thr Val Glu Asp Gly Gln Gln Val
450                 455                 460                 465
Lys Ala His Leu Glu Ile Thr Gln Glu Asn Val Val Lys Asn Pro Ser
                470                 475                 480
Phe Glu Asp Ser Glu Arg Ala Met Trp Glu Ile Gln Arg Ile Gln Lys
            485                 490                 495
Ala Ser Arg Glu Tyr Phe
        500
<210>13
<211>20
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(20)
<223>引物A2up
<400>13
agcgtttgcg gccgcgatcc                                                           20
<210>14
<211>21
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(21)
<223>引物B
<400>14
ttattcggtc gaaaaggatc c                                                         21
<210>15
<211>34
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(34)
<220>
<221>引物
<222>(1)..(34)
<223>SigA2NotU-P
<400>15
tcgcgatccg ttttcgcatt tatcgtgaaa cgct                                           34
<210>16
<211>33
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(33)
<220>
<221>引物
<222>(1)..(33)
<223>SigA2NotD-P
<400>16
ccgcaaacgc tggtgaaagt aaaagatgct gaa                                            33
<210>17
<211>25
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(25)
<220>
<221>引物
<222>(1)..(25)
<223>BOCAfwd
<400>17
tagtccgtac atatgagaaa aacaa                                                     25
<210>18
<211>26
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(26)
<220>
<221>引物
<222>(1)..(26)
<223>BOCArev
<400>18
ttcaaagctt atagtgaaat ccaact                                                    26
<210>19
<211>23
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(23)
<220>
<221>引物
<222>(1)..(23)
<223>pQECAfwd
<400>19
atccgcatgc tgagaaaaac aaa                                                       23
<210>20
<211>27
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(27)
<220>
<221>引物
<222>(1)..(27)
<223>pQECArev
<400>20
aattaagctt aatagtgaaa tccaact                                                   27
<210>21
<211>19
<212>DNA
<213>人工的
<220>
<223>引物
<220>
<221>引物
<222>(1)..(19)
<220>
<221>引物
<222>(1)..(19)
<223>CAmitSEQrev
<400>21
cacttggtga atggaaatg                                                            19

Claims (26)

1. 功能性多肽,其由芽孢杆菌属菌种Bacillus plakortiensis的菌株基因组中包含的多核苷酸编码,所述菌种以登录号DSM 17419保藏。
2. 分离的成熟功能性多肽,其可获得自以登录号DSM 17419保藏的细菌菌株芽孢杆菌属菌种P203。
3. 权利要求2的多肽,其选自下组:
(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟多肽的序列具有至少70%同一性;
(b)由核苷酸序列编码的多肽,所述核苷酸序列在高严紧条件下与选自下组的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自下组:SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区,
(ii)核苷酸序列中包含的cDNA序列的互补链,所述核苷酸序列选自下组:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区;
(c)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10和SEQ ID NO:12中包含的成熟多肽的片段;
其中所述多肽具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10和SEQ ID NO:12中包含的相应成熟多肽的功能。
4. 权利要求2的多肽,其中所述多肽是具有选自下组的功能的酶:木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶。
5. 权利要求4的酶,其选自下组:
(a)具有氨基酸序列的酶,所述氨基酸序列与选自SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10和SEQ ID NO:12中包含的成熟酶的氨基酸序列具有至少70%同一性;
(b)由核苷酸序列编码的酶,所述核苷酸序列在高严紧条件下与选自下组的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自下组:SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟酶的区;
(ii)核苷酸序列中包含的cDNA序列的互补链,所述核苷酸序列选自下组:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区;
(c)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10和SEQ ID NO:12中包含的成熟酶的片段,并且
其中所述酶具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8、SEQ ID NO:10和SEQ ID NO:12中包含的相应成熟多肽的功能。
6. 权利要求2的多肽,其中编码所述多肽的多核苷酸由选自下组的核苷酸序列组成:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11中编码成熟多肽的区或由于遗传密码的简并性而与之有所不同的序列。
7. 分离的酶,其选自下组:
(a)包含氨基酸序列的酶,所述氨基酸序列与选自木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶的成熟酶的氨基酸序列具有至少70%同一性,所述酶由以登录号DSM 17419保藏的菌株芽孢杆菌属菌种P203的菌株分泌;
(b)由核苷酸序列编码的多肽,所述核苷酸序列在高严紧条件下与选自下组的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列包含于以登录号DSM 17419保藏的菌株芽孢杆菌属菌种P203的菌株中,并编码选自下组由所述菌株分泌的成熟酶:木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶;
(ii)核苷酸序列中包含的cDNA序列的互补链,所述核苷酸序列包含于以登录号DSM 17419保藏的菌株芽孢杆菌属菌种P203的菌株中,并编码选自下组由所述菌株分泌的成熟酶:木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶;
(c)成熟酶的片段,所述成熟酶选自下组:木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶,所述酶由以登录号DSM17419保藏的菌株芽孢杆菌属菌种P203的菌株分泌;
其中所述酶具有选自下组的功能:木聚糖酶、丝氨酸蛋白酶、碳酸酐酶、多聚鼠李半乳糖醛酸裂合酶和半乳聚糖酶。
8. 包含权利要求1-7的多肽的组合物。
9. 权利要求8的组合物,包含至少两种不同的权利要求1-7的多肽,优选至少3种,更优选至少5种,更优选至少10种,更优选至少15种,更优选至少20种不同的权利要求1-7的多肽。
10. 权利要求8的组合物,包含将芽孢杆菌属菌种P203菌株DSM 17419或其突变体的样品发酵时分泌的全部多肽,所述突变体中缺失或添加了一个或多个基因。
11. 权利要求8的组合物,进一步包含一种或多种额外的酶。
12. 权利要求8的组合物,其特征在于是洗涤剂组合物,其除所述多肽之外,还包含表面活性剂。
13. 权利要求8的组合物,其特征在于是饲料组合物,其除所述多肽之外,还包含谷类或谷物产品。
14. 权利要求8的组合物,其特征在于是食品组合物。
15. 权利要求8的组合物,进一步包含多糖或多糖的混合物。
16. 用于制备权利要求8的组合物的方法,包括将权利要求1-7的多肽与赋形剂混合。
17. 多核苷酸,其具有编码权利要求1-7的任一项中限定的多肽的核苷酸序列。
18. 包含权利要求17的多核苷酸的组合物。
19. 核酸构建体,其包含权利要求17中限定的核苷酸序列,所述核苷酸序列与一个或多个在宿主细胞中指导所述多肽产生的调控序列可操作地连接。
20. 包含权利要求19的核酸构建体的重组表达载体。
21. 包含权利要求19的核酸构建体的重组宿主细胞。
22. 用于产生权利要求1-7的多肽的方法,其包括:
(a)培养菌株以产生多肽,所述菌株以其野生型形式能够产生所述多肽;和
(b)回收所述多肽。
23. 用于产生权利要求1-7的多肽的方法,其包括:
(a)在有益于产生多肽的条件下培养如权利要求22中限定的重组宿主细胞;和
(b)回收所述多肽。
24. 权利要求23的方法,其包括(i)将来自以登录号DSM 17419保藏的芽孢杆菌属菌种P203菌株基因组的基因,经由转座子标记,与编码无信号报告分子的基因融合,(ii)在显示所述报告分子存在的培养基中培养宿主细胞克隆,所述克隆包含芽孢杆菌属菌种P203菌株(DSM 17419)的经融合的基因,(iii)检出分泌报告分子的克隆,和(iv)分离该克隆中包含的芽孢杆菌属菌种P203菌株(DSM 17419)的基因和多肽。
25. 适合用于电子设备的存储介质,其包含权利要求1-7的多肽的氨基酸序列信息或权利要求17的多核苷酸的核苷酸序列信息。
26. 一种方法,其包括在工业或家庭技术方法中使用权利要求1-7的多肽或权利要求17的多核苷酸。
CNA2006800300118A 2005-08-16 2006-08-15 芽孢杆菌属菌种p203菌株的多肽 Pending CN101243181A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200501156 2005-08-16
DKPA200501156 2005-08-16

Publications (1)

Publication Number Publication Date
CN101243181A true CN101243181A (zh) 2008-08-13

Family

ID=37398972

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800300118A Pending CN101243181A (zh) 2005-08-16 2006-08-15 芽孢杆菌属菌种p203菌株的多肽

Country Status (7)

Country Link
US (2) US8119387B2 (zh)
EP (3) EP1967584B1 (zh)
CN (1) CN101243181A (zh)
AT (1) ATE503010T1 (zh)
BR (1) BRPI0614869A2 (zh)
DE (1) DE602006020923D1 (zh)
WO (1) WO2007019859A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103547672A (zh) * 2011-05-10 2014-01-29 丹尼斯科美国公司 热稳定性碳酸酐酶及其使用方法
CN110295133A (zh) * 2019-08-02 2019-10-01 长春理工大学 一种细菌纤维素合成菌的筛选方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2126090B1 (en) 2007-01-31 2015-04-01 Novozymes A/S Heat-stable carbonic anhydrases and their use
US7674608B2 (en) 2007-02-23 2010-03-09 The University Of Toledo Saccharifying cellulose
CA2680790C (en) * 2007-03-14 2018-09-11 The University Of Toledo Biomass pretreatment
US7999355B2 (en) * 2008-07-11 2011-08-16 Air Products And Chemicals, Inc. Aminosilanes for shallow trench isolation films
EP2379729A2 (en) * 2008-12-19 2011-10-26 Novozymes A/S Use of enzymes having silicase activity
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1296839A (zh) 1969-05-29 1972-11-22
GB1372034A (en) 1970-12-31 1974-10-30 Unilever Ltd Detergent compositions
GB1483591A (en) 1973-07-23 1977-08-24 Novo Industri As Process for coating water soluble or water dispersible particles by means of the fluid bed technique
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
EP0218272B1 (en) 1985-08-09 1992-03-18 Gist-Brocades N.V. Novel lipolytic enzymes and their use in detergent compositions
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US4810414A (en) 1986-08-29 1989-03-07 Novo Industri A/S Enzymatic detergent additive
NZ221627A (en) 1986-09-09 1993-04-28 Genencor Inc Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios
DE3854249T2 (de) 1987-08-28 1996-02-29 Novo Nordisk As Rekombinante Humicola-Lipase und Verfahren zur Herstellung von rekombinanten Humicola-Lipasen.
JPS6474992A (en) 1987-09-16 1989-03-20 Fuji Oil Co Ltd Dna sequence, plasmid and production of lipase
ATE129523T1 (de) 1988-01-07 1995-11-15 Novo Nordisk As Spezifische protease.
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
JP3079276B2 (ja) 1988-02-28 2000-08-21 天野製薬株式会社 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法
WO1989009259A1 (en) 1988-03-24 1989-10-05 Novo-Nordisk A/S A cellulase preparation
US5776757A (en) 1988-03-24 1998-07-07 Novo Nordisk A/S Fungal cellulase composition containing alkaline CMC-endoglucanase and essentially no cellobiohydrolase and method of making thereof
GB8915658D0 (en) 1989-07-07 1989-08-23 Unilever Plc Enzymes,their production and use
IL97645A (en) 1990-03-23 1997-03-18 Gist Brocades Nv Production of enzymes in seeds and their use
JP3112937B2 (ja) 1990-04-14 2000-11-27 カリ―ヒエミー アクチエンゲゼルシヤフト アルカリ性バチルスーリパーゼ、これをコード化するdna配列およびこのリパーゼを生産するバチルス
BR9106435A (pt) 1990-05-09 1993-05-04 Novo Nordisk As Preparado de celulase,enzima demonstrando atividade de andoglucanase,enzima de endoglucanase,construcao de dna,vetor de expressao celula,processo para produzir uma enzima de endoglucanase,aditivo composicao detergente,e processo para reduzir a taxa em que os tecidos contendo celulose,se tornam asperos,prover clareamento da cor de tecidos contendo celulose colorida,prover uma variacao localizada da cor de tecidos contendo colorida,e melhorar as propriedades de drenagem de polpa
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
DK0548228T3 (da) 1990-09-13 1999-05-10 Novo Nordisk As Lipasevarianter
CA2331936C (en) 1990-12-05 2007-07-31 Novozymes A/S Proteins with changed epitopes and methods for the production thereof
EP0495257B1 (en) 1991-01-16 2002-06-12 The Procter & Gamble Company Compact detergent compositions with high activity cellulase
EP0511456A1 (en) 1991-04-30 1992-11-04 The Procter & Gamble Company Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme
ES2085024T3 (es) 1991-04-30 1996-05-16 Procter & Gamble Detergentes liquidos reforzados con complejo de acido borico-poliol para inhibir la enzima proteolitica.
ATE168130T1 (de) 1991-05-01 1998-07-15 Novo Nordisk As Stabilisierte enzyme und waschmittelzusammensetzungen
DK72992D0 (da) 1992-06-01 1992-06-01 Novo Nordisk As Enzym
DK88892D0 (da) 1992-07-06 1992-07-06 Novo Nordisk As Forbindelse
EP0651794B1 (en) 1992-07-23 2009-09-30 Novozymes A/S MUTANT $g(a)-AMYLASE, DETERGENT AND DISH WASHING AGENT
EP0663950B1 (en) 1992-10-06 2004-03-17 Novozymes A/S Cellulase variants
DK0867504T4 (da) 1993-02-11 2011-08-29 Genencor Int Oxidativ stabil alfa-amylase
EP0652946B1 (en) 1993-04-27 2005-01-26 Genencor International, Inc. New lipase variants for use in detergent applications
DK52393D0 (zh) 1993-05-05 1993-05-05 Novo Nordisk As
JP2859520B2 (ja) 1993-08-30 1999-02-17 ノボ ノルディスク アクティーゼルスカブ リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物
AU7853194A (en) 1993-10-13 1995-05-04 Novo Nordisk A/S H2o2-stable peroxidase variants
JPH07143883A (ja) 1993-11-24 1995-06-06 Showa Denko Kk リパーゼ遺伝子及び変異体リパーゼ
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
ATE222604T1 (de) 1994-02-22 2002-09-15 Novozymes As Methode zur herstellung einer variante eines lipolytischen enzymes
EP1632557B1 (en) 1994-03-08 2011-02-23 Novozymes A/S Novel alkaline cellulases
JP3851656B2 (ja) 1994-05-04 2006-11-29 ジェネンコア インターナショナル インコーポレーテッド 改善された界面活性剤耐性を有するリパーゼ
WO1995035381A1 (en) 1994-06-20 1995-12-28 Unilever N.V. Modified pseudomonas lipases and their use
AU2884695A (en) 1994-06-23 1996-01-19 Unilever Plc Modified pseudomonas lipases and their use
EP0777737B1 (en) 1994-06-30 2005-05-04 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
JPH10507073A (ja) 1994-10-06 1998-07-14 ノボ ノルディスク アクティーゼルスカブ エンドグルカナーゼ活性を有する酵素及び酵素調製品
BE1008998A3 (fr) 1994-10-14 1996-10-01 Solvay Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci.
CN1167503A (zh) 1994-10-26 1997-12-10 诺沃挪第克公司 一种具有脂解活性的酶
AR000862A1 (es) 1995-02-03 1997-08-06 Novozymes As Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del
JPH08228778A (ja) 1995-02-27 1996-09-10 Showa Denko Kk 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法
CN101173263A (zh) 1995-03-17 2008-05-07 诺沃奇梅兹有限公司 新的内切葡聚糖酶
WO1997007202A1 (en) 1995-08-11 1997-02-27 Novo Nordisk A/S Novel lipolytic enzymes
EP0839186B1 (en) 1995-07-14 2004-11-10 Novozymes A/S A modified enzyme with lipolytic activity
DE69620766T2 (de) 1995-08-11 2004-11-18 Novozymes A/S Verfahren zur herstellung von polypeptidabkömmlingen
US5763385A (en) 1996-05-14 1998-06-09 Genencor International, Inc. Modified α-amylases having altered calcium binding properties
WO1998008940A1 (en) 1996-08-26 1998-03-05 Novo Nordisk A/S A novel endoglucanase
BR9711479B1 (pt) 1996-09-17 2009-08-11 variante de celulase tendo uma resistência aumentada a tensìdeo de ánion.
JP2001502369A (ja) 1996-10-08 2001-02-20 ノボ ノルディスク アクティーゼルスカブ 染料前駆体としてのジアミノ安息香酸誘導体
ATE510910T1 (de) 1996-11-04 2011-06-15 Novozymes As Subtilase-varianten und verbindungen
WO1998020116A1 (en) 1996-11-04 1998-05-14 Novo Nordisk A/S Subtilase variants and compositions
US6159731A (en) 1997-02-12 2000-12-12 Massachusetts Institute Of Technology Daxx, a Fas-binding protein that activates JNK and apoptosis
AU7908898A (en) 1997-07-04 1999-01-25 Novo Nordisk A/S Family 6 endo-1,4-beta-glucanase variants and cleaning composit ions containing them
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
DK1490386T3 (da) 1998-03-10 2008-12-15 Genentech Inc Nyt polypeptid og nukleinsyrer kodende for dette
ATE390441T1 (de) 1998-10-30 2008-04-15 Novozymes As Niedrigallergene proteinvarianten
CN1325443A (zh) 1998-10-30 2001-12-05 诺沃奇梅兹有限公司 具有减弱的变应原性的糖基化蛋白
WO2001031989A2 (en) 1999-12-09 2001-05-10 Novozymes A/S High throughput screening (hts) assays for protein variants with reduced antibody binding capacity
DE60134400D1 (de) 2000-04-07 2008-07-24 Novozymes As Einfangen von signalsequenzen
AU2003243748A1 (en) 2002-06-21 2004-01-06 The Regents Of The University Of California Animal models of prostate cancer and methods for their use
EP1578935A2 (en) 2002-10-10 2005-09-28 Diversa Corporation Proteases, nucleic acids encoding them and methods for making and using them
JP4324365B2 (ja) 2002-11-01 2009-09-02 花王株式会社 アルカリプロテアーゼ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103547672A (zh) * 2011-05-10 2014-01-29 丹尼斯科美国公司 热稳定性碳酸酐酶及其使用方法
CN110295133A (zh) * 2019-08-02 2019-10-01 长春理工大学 一种细菌纤维素合成菌的筛选方法

Also Published As

Publication number Publication date
WO2007019859A3 (en) 2007-05-18
US8119387B2 (en) 2012-02-21
DE602006020923D1 (de) 2011-05-05
BRPI0614869A2 (pt) 2012-12-04
EP1967584B1 (en) 2011-03-23
US20120122184A1 (en) 2012-05-17
WO2007019859A2 (en) 2007-02-22
ATE503010T1 (de) 2011-04-15
US20100151111A1 (en) 2010-06-17
EP1967584A1 (en) 2008-09-10
EP2360246A1 (en) 2011-08-24
EP1920052A2 (en) 2008-05-14

Similar Documents

Publication Publication Date Title
EP1709165B1 (en) Polypeptides of alicyclobacillus
US8415130B2 (en) Polypeptides of Alicyclobacillus sp. having acid endoglucanase or acid cellulase activity
CN101374947B (zh) 具有脂肪酶活性的多肽和编码该多肽的多核苷酸
US8377675B2 (en) Polypeptides having lipase activity and polynucleotides encoding same
US8263824B2 (en) Polypeptides having lipase activity and polynucleotides encoding same
CN101243181A (zh) 芽孢杆菌属菌种p203菌株的多肽
EP1715736A2 (en) Polypeptides having xylanase activity and polynucleotides encoding same
CN101942428A (zh) Botryosphaeria Rhodina的多肽
CN103827298A (zh) 脂肪酶变体及其编码多核苷酸
CN1930285B (zh) 脂环酸芽孢杆菌的多肽
CN101883848A (zh) 具有蛋白酶活性的多肽和编码该多肽的多核苷酸
JP2003512016A (ja) コリン・オキシダーゼ活性を有するポリペプチド及び当該ポリペプチドをコードする核酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20080813