CN101160396A - 具有脂肪酶活性的多肽以及编码该多肽的多核苷酸 - Google Patents

具有脂肪酶活性的多肽以及编码该多肽的多核苷酸 Download PDF

Info

Publication number
CN101160396A
CN101160396A CNA2005800439709A CN200580043970A CN101160396A CN 101160396 A CN101160396 A CN 101160396A CN A2005800439709 A CNA2005800439709 A CN A2005800439709A CN 200580043970 A CN200580043970 A CN 200580043970A CN 101160396 A CN101160396 A CN 101160396A
Authority
CN
China
Prior art keywords
seq
polypeptide
sequence
nucleotide
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800439709A
Other languages
English (en)
Inventor
戴比·亚弗
贾宁·林
苏珊娜·奥塔尼
克里斯托弗·阿莫罗
芭芭拉·彻里
金·博尔奇
沙姆坎特·帕特卡
迈克尔·拉姆萨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Novozymes Inc
Original Assignee
Novo Nordisk AS
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS, Novozymes Biotech Inc filed Critical Novo Nordisk AS
Publication of CN101160396A publication Critical patent/CN101160396A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • C12N9/20Triglyceride splitting, e.g. by means of lipase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Detergent Compositions (AREA)

Abstract

本发明涉及具有脂肪酶活性的分离多肽和编码所述多肽的分离多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及生产和使用所述多肽的方法。

Description

具有脂肪酶活性的多肽以及编码该多肽的多核苷酸
发明背景
发明领域
本发明涉及具有脂肪酶活性的分离多肽以及编码该多肽的分离多核苷酸。本发明也涉及包含该多核苷酸的核酸构建体、载体、宿主细胞以及生产和使用该多肽的方法。
相关技术描述
三酰基甘油水解酶(triacylglycerol hydrolyzing enzymes)是催化甘油三酯的水解或形成的酶。三酰基甘油水解酶是一组多活性的酶,其经常具有一种以上的活性,诸如:脂肪酶、磷脂酶、溶血磷脂酶、胆固醇酯酶、角质酶、酰胺酶、半乳糖脂酶以及具有其他酯酶类型的活性。哪一种活性是主导活性取决于酶的应用和其条件。
三酰基甘油水解酶属于国际生物化学与分子生物学联合会命名法(IUBMB Enzyme Nomenclature)3.1.1。EC3指水解酶,EC3.1指作用于酯键,EC3.1.1指羧酸酯水解酶。相关的酶被归类于EC3.1.4,EC3.1.4指磷酸二酯水解酶。
脂肪酶(EC3.1.1.3)是催化多种羧酸酯(carboxy esters),例如甘油三酯的水解而释放脂肪酸的酶的。酯酶(EC3.1.1.1)是催化水溶性羧酸酯,包括短链脂肪酸甘油三酯的水解,而产生醇和羧酸阴离子的酶。
一些脂肪酶也具有磷脂酶活性和/或半乳糖脂酶活性(参看,例如US号6,103,505和US号6,852,346),而且可能还具有甾醇酯酶活性(3.1.1.13)。
磷脂酶是催化磷脂水解的酶,所述磷脂由sn1和sn2位上具有两个脂肪酸、在sn3位上被磷酸酯化的甘油骨架构成,所述磷酸可以进一步被酯化为氨基醇。
有很多种类的磷脂酶是催化脂肪酰部分水解的。这些磷脂酶包括磷脂酶A1(EC3.1.1.32),磷脂酶A2(EC3.1.1.4)和溶血磷脂酶(EC3.1.1.5)。磷脂酶C(EC3.1.4.3)和磷脂酶D(EC3.1.4.4)从磷脂中水解水解磷酸基团,但是与磷脂酶A1、磷脂酶A2和磷脂酶B不同,它们不水解脂肪酸。
磷脂酶A1(EC3.1.1.32)催化二酰基甘油磷脂中sn1位上的一个脂肪酰基脱酰产生溶血磷脂和脂肪酸。磷脂酶A2(EC3.1.1.4)催化二酰基甘油磷脂中sn2位上的一个脂肪酰基其脱酰产生溶血磷脂和脂肪酸。溶血磷脂酶(EC3.1.1.5),也被称为磷脂酶B,催化溶血磷脂中脂肪酰基的水解。磷脂酶C(EC3.1.4.3)催化磷脂酰胆碱水解为1,2-二酰基甘油和磷酸胆碱。磷脂酶D(EC3.1.4.4)催化磷脂酰胆碱的终端磷酸二酯键的水解,以产生胆碱和磷脂酸。
半乳糖脂酶(EC3.1.1.26)以去除一个或两个脂肪酸的方式催化半乳糖脂的水解。
甾醇酯酶(EC3.1.1.13)催化甾醇酯水解为甾醇和脂肪酸。
人们知道配制有脂解酶(lipolytic enzyme)的去污剂具有改善的去除脂肪污渍的性能。例如,LIPOLASETM(Novozymes A/S,
Figure A20058004397000081
Denmark),一种获自真菌细毛嗜热霉(thermomyces lanuginosus)(也被称为Humicolalanuginosa)的微生物脂肪酶,已被用于许多的商业去污剂品牌。脂肪酶也被用于脱胶和烘焙。
E1-Shahed et al.,1988,Eqypt.J.Microbiol.23:537-547和Mohawed et al.,1988,Eqypt.J.Microbiol.23:357-372两种烟曲霉(Aspergillus fumigatus)脂肪酶。
WO03/12071披露了一种编码来自烟曲霉的脂肪酶的基因。
Mayordomo等,2000,J.Agric.Chem.,48:105-109披露了一种来自构巢曲霉(Aspergillus nidulans)的冷活性脂肪酶的分离、纯化和鉴定。
Kundu等,1987,Journal of General Microbiology,133:149-154,披露了一种来自粗糙脉孢菌(Neurospora crassa)的分生孢子的胞外脂肪酶的分离和鉴定。
脂肪酶具有很多商业用途,但是只有极少的在应用条件下可工作且可被微生物发酵高产量生产的脂肪酶被确定。本领域需要性能更好的可供选择的脂肪酶。
本发明的目的是提供具有脂肪酶活性的多肽和编码该多肽的多核苷酸。
发明概述
本发明涉及选自下列的具有脂肪酶活性的分离多肽:
(a)具有如下氨基酸序列的多肽,该氨基酸序列与SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少60%的同一性;
(b)由如下核苷酸序列编码的多肽,该核苷酸序列在至少中等严紧条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQID NO:9的成熟多肽编码序列,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链发生杂交;和
(c)在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽中包含一个或多个氨基酸的保守取代、缺失、和/或插入的变体。
本发明也涉及选自下列的编码具有脂肪酶活性的多肽的分离多核苷酸:
(a)编码具有如下氨基酸序列的多肽的多核苷酸,所述氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8或SEQ IDNO:10的成熟多肽具有至少60%同一性;
(b)与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7或SEQID NO:9的成熟多肽编码序列具有至少60%同一性的多核苷酸;以及
(c)在至少中等严紧条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链杂交的多核苷酸。
在一个优选的方面中,成熟多肽是SEQ ID NO:2第21至562位氨基酸,SEQ ID NO:4第25至588位氨基酸,SEQ ID NO:6第21至598位氨基酸,SEQ ID NO:8第19至534位氨基酸或SEQ ID NO:10第22至578位氨基酸。在另一优选方面,成熟多肽编码序列是SEQ ID NO:1第61至1686位核苷酸,SEQ ID NO:3第73至1764位核苷酸,SEQ ID NO:5第61至1922位核苷酸,SEQ ID NO:7第55至1602位核苷酸或SEQ ID NO:9第64至1789位核苷酸。
本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体和重组宿主细胞。
本发明还涉及生产所述具有脂肪酶活性的多肽的方法,其包括:(a)在易于生产该多肽的条件下培养包含核酸构建体的重组宿主细胞,该核酸构建体包含编码所述多肽的多核苷酸;并(b)回收所述多肽。
本发明还涉及在去污剂、脱胶(degumming)及烘焙中使用具有脂肪酶活性的多肽的方法。
本发明进一步涉及包含有编码蛋白质的基因的核酸构建体,其中该基因可操作连接于编码信号肽的核苷酸序列,且所述核苷酸序列包含下述核苷酸或由下述核苷酸组成:SEQ ID NO:1第1至60位核苷酸,SEQ ID NO:3第1至72位核苷酸,SEQ ID NO:5第1至60位核苷酸,SEQ ID NO:7第1至54位核苷酸,SEQ ID NO:9第1至63位核苷酸,其中该基因对于该核苷酸序列是外来的。
附图简述
图1显示了pJLin173的限制性图谱;
图2A和图2B为一种烟曲霉脂肪酶(lip1)的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO:1和2);
图3显示了pAlLo1的限制性图谱;
图4显示了pBM121b的限制性图谱;
图5显示了pBM120a的限制性图谱;
图6显示了pJLin172的限制性图谱;
图7显示了pSMO230的限制性图谱;
图8A和图8B为禾本科镰孢(Fusarium graminearum)NRRL 31084脂肪酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO:3和4);
图9显示了pEJG61的限制性图谱;
图10显示了pSMO232的限制性图谱;
图11显示了pJLin175的限制性图谱;
图12A和图12B为一种Magnaporthe grisea脂肪酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO:5和6);
图13显示了pCrAm140的限制性图谱;
图14A和图14B为一种Magnaporthe grisea脂肪酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:7和8);
图15显示了pBM134b的限制性图谱;
图16A和图16B为粗糙脉孢菌FGSC 2489脂肪酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:9和10)。
定义
脂肪酶活性(Lipase activity:):本文中术语“脂肪酶活性”被定义为三酰基甘油酰基水解酶(triacylglycerol acylhydrolase)活性(EC3.1.1.3),其催化三酰基甘油的水解为脂肪酸。脂肪酶的底物谱包括甘油三酯、甘油二酯和甘油单酯,但为了本发明的目的,使用丁酸对硝基苯酯(p-nitrophenylbutyrate)作为底物来测定脂肪酶活性。一个脂肪酶活性单位等于在pH7.5,25℃条件下每分钟释放1μmol丁酸的酶量。术语“脂肪酶”还涵盖具有本文定义的磷脂酶活性、甾醇酯酯酶活性和/或半乳糖脂酶活性的多肽。
本发明的多肽具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8或SEQ ID NO:10的成熟多肽的至少20%、优选至少40%、更优选至少50%、更优选至少60%、更优选至少70%、更优选至少80%、甚至更优选至少90%、最优选至少95%、且甚至最优选至少100%的脂肪酶活性。
磷脂酶活性(Phospholipase activity):本文中术语“磷脂酶活性”定义为磷脂酰基水解酶(phosphatidyl acylhydrolase)(EC3.1.1.4,EC3.1.1.5和EC3.1.1.32),其催化磷脂的脂肪酸的水解。所述磷脂由sn1和sn2位上带有两个脂肪酸、在sn3位上用磷酸酯化的甘油骨架构成,且所述磷酸可以进一步用氨基醇酯化。
磷脂酶A1(EC3.1.1.32)催化二酰基甘油磷脂中sn1位上的一个脂肪酰基团脱酰,以产生溶血磷脂和脂肪酸。
磷脂酶A2(EC3.1.1.4)催化二酰基甘油磷脂中sn2位上的一个脂肪酰基团脱酰,以产生溶血磷脂和脂肪酸。
溶血磷脂酶(EC3.1.1.5),也被称为溶血磷脂酶B,催化溶血磷脂中脂肪酰基团的水解。
为了本发明的目的,根据WO 2005/040410测定磷脂酶A1,磷脂酶A2和溶血磷脂酶活性,使用来源于大豆的磷脂酰胆碱(Avanti Polar Lipids Inc.,AL,USA)或烷基化磷脂酰乙醇胺(alkylated phosphatidylethanolamines)作为底物。
半乳糖脂酶活性(Galactolipase activity):本文中术语“半乳糖脂酶活性”定义为1,2-二酰基-3-β-D-半乳糖基-sn-甘油酰基水解酶(EC3.1.1.26),其通过去除一个或两个脂肪酸催化半乳糖脂的水解。根据WO 2005/040410,使用提取自小麦粉的双半乳糖甘油二酯(digalactosyldiglyceride,DGDG)或单半乳糖甘油二酯(monogalactosyldiglyceride,MGDG)作为底物测定半乳糖脂酶活性。DGDG是由两个脂肪酸和一个二半乳糖(digalactose)组成的半乳糖脂。MGDG是由两个脂肪酸和一个半乳糖组成的半乳糖脂。
甾醇酯酶活性(Sterol esterase activity):本文中术语“甾醇脂酶活性”定义为甾醇脂酰基水解酶(sterol ester acylhydrolase)(EC3.1.1.13),其催化甾醇脂水解为甾醇和脂肪酸,例如胆固醇酯水解为胆固醇和脂肪酸。根据WO 2005/040410,使用胆固醇亚油酸作为底物来确定甾醇酯酶活性。
为了本发明的目的,甾醇酯酶活性被如何确定?
分离多肽(Isolated polypeptide):术语“分离多肽”在用于本文时指如SDS-PAGE所测定的,至少20%纯、优选至少40%纯、更优选至少60%纯、还更优选至少80%纯、最优选至少90%纯、且甚至最优选至少95%纯的多肽。
基本上纯的多肽(substantially pure polypeptide):术语“基本上纯的多肽”在本文中指以重量计含有至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、甚至更优选至多2%、最优选至多1%、且甚至最优选至多0.5%与该多肽天然相伴随的其它多肽物质的多肽制备物。因此,优选的是,基本上纯的多肽以重量计制备物中存在的全部多肽物质计为至少92%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%的纯、更优选至少97%纯、更优选至少98%纯、甚至更优选至少99%纯、最优选至少99.5%纯、且甚至最优选100%纯的。
本发明的多肽优选是基本上纯的形式。尤其是,优选的是多肽是“实质上(essentially)纯的形式”,即多肽制备物实质上不含与该多肽天然相伴随的其它多肽物质。例如,这可通过采用众所周知的重组方法或采用经典的纯化方法制备多肽来实现。
在本文中,术语“基本上纯的多肽”与术语“分离多肽”和“分离形式的多肽”含义相同。
成熟多肽(Mature polypeptide):术语“成熟多肽”在本文中指具有脂肪酶活性的多肽,其以经过翻译和任何翻译后修饰,例如N末端加工、C基末端截短、糖基化等的最终形态存在。
同一性(identity):本文用参数“同一性”来描述两种氨基酸序列之间或两种核苷酸序列之间的相关性(relatedness)。
为了本发明的目的,两种氨基酸序列之间的同一性程度可使用Clustal方法(Higgins,1989,CABIOS 5:151-153)来确定,使用具有同一性表(identitytable)的LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)和下述多个比对参数:缺口罚分10;缺口长度罚分10。配对比对参数:Ktuple=1,缺口罚分=3,窗口数(windows)=5,对角线数(diagonals)=5。
为了本发明的目的,两种核苷酸序列之间的同一性程度可使用Wilbur-Lipman算法(Wilbur and Lipman,1983,Proceedings of the NationalAcademy of Science USA 80:726-730)来确定,使用具有同一性表的LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)和下述多个比对参数:缺口罚分10;缺口长度罚分10。配对比对参数:Ktuple=3,缺口罚分=3,窗口数=20。
同源序列(Homologous sequence):术语“同源序列”在本文中指在用细毛嗜热霉脂肪酶(登录号O59952)进行的tfasty(Pearson,W.R.,1999,inBioinformatics Methods and Protocols,S.Misener and S.A.Krawetz,ed.,pp.185-219)搜索中,给出小于0.001的E值(或期望分数)的预测蛋白质。
多肽片段(Polypeptide fragment):术语“多肽片段”在本文中定义为从SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8或SEQ ID NO:10的成熟多肽的氨基末端和/或羧基末端缺失了一个或多个氨基酸的多肽,或其同源序列;其中所述片段具有脂肪酶活性。在一个优选的方面中,该片段含有SEQ ID NO:2的成熟多肽或其同源序列的至少467个氨基酸残基,更优选至少492个氨基酸残基,且最优选至少517个氨基酸残基。在另一个优选的方面中,该片段含有SEQ ID NO:4的成熟多肽或其同源序列的至少485个氨基酸残基,更优选至少510个氨基酸残基,且最优选至少535个氨基酸残基。在另一个优选的方面中,该片段含有SEQ ID NO:6的成熟多肽或其同源序列的至少500个氨基酸残基,更优选至少525个氨基酸残基,且最优选至少550个氨基酸残基。在另一个优选的方面中,该片段含有SEQ ID NO:8的成熟多肽或其同源序列的至少440个氨基酸残基,更优选至少465个氨基酸残基,且最优选至少490个氨基酸残基。在另一个优选的方面中,该片段含有SEQ ID NO:10或其同源序列的至少460个氨基酸残基,更优选至少485个氨基酸残基,且最优选至少530个氨基酸残基。
子序列(Subsequence):术语“子序列”在本文中定义为从SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列5′和/或3′末端缺失了一个或多个核苷酸的核苷酸序列,或其同源序列;其中子序列编码具有脂肪酶活性的多肽片段。在一个优选的方面中,该子序列含有SEQ ID NO:1的成熟多肽编码序列或其同源序列的至少1401个核苷酸、更优选至少1476个核苷酸、且最优选至少1551个核苷酸。在另一个优选的方面中,该子序列含有SEQ ID NO:3的成熟多肽编码序列或其同源序列的至少1455个核苷酸、更优选至少1530个核苷酸、且最优选至少1605个核苷酸。在另一个优选的方面中,该子序列至少含有SEQ ID NO:5的成熟多肽编码序列或其同源序列的1500个核苷酸、更优选至少1575个核苷酸、且最优选至少1650个核苷酸。在另一个优选的方面中,该子序列至少含有SEQ ID NO:7的成熟多肽编码序列或其同源序列的1320个核苷酸、更优选至少1395个核苷酸、且最优选至少1470个核苷酸。在另一个优选的方面中,该子序列至少含有SEQ ID NO:9的成熟多肽编码序列或其同源序列的1380个核苷酸、更优选至少1455个核苷酸、且最优选至少1590个核苷酸。
等位变体(Allelic variant):术语“等位变体”在本文中指占据同一染色体基因座的基因的两种或多种可选形式中的任一种。等位变异由于突变而天然发生,并可导致种群内多态性。基因突变可以是沉默的(所编码多肽没有变化),或者可编码氨基酸序列改变的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离多核苷酸(Isolated polynucleotide):术语“分离多核苷酸”在用于本文时指根据琼脂糖电泳的测定,至少20%纯的、优选至少40%纯的、更优选至少60%纯的、甚至更优选至少80%纯的、最优选至少90%纯的、且甚至最优选至少95%纯的多核苷酸。
基本上纯的多核苷酸(Substantially pure polynucleotide):术语“基本上纯的多核苷酸”在用于本文时指不含其它外来(extraneous)或不需要的核苷酸且以适于在经基因工程改造的蛋白质生产系统内使用的形式存在的多核苷酸制备物。因此,基本上纯的多核苷酸以重量计含有至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、甚至更优选至多2%、最优选至多1%、且甚至最优选至多0.5%的与该多核苷酸天然相伴随的其它多核苷酸物质。然而,基本上纯的多核苷酸可包括天然存在的5′和3′非翻译区,诸如启动子和终止子。优选的是,基本上纯的多核苷酸以重量计是至少90%纯的、优选至少92%纯的、更优选至少94%纯的、更优选至少95%纯的、更优选至少96%纯的、更优选至少97%纯的、甚至更优选至少98%纯的、最优选至少99%纯的、且甚至最优选至少99.5%纯的。优选的是,本发明的多核苷酸是基本上纯的形式。具体而言,优选的是,本文公开的多核苷酸是“实质上纯的形式”,即多核苷酸制备物实质上不含与该多核苷酸天然相伴随的其它多核苷酸物质。在本文中,术语“基本上纯的多核苷酸”与术语“分离多核苷酸”和“分离形式的多核苷酸”同义。多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源或其任意组合。
成熟多肽编码序列(Mature polypeptide coding sequence):术语成熟多肽编码序列被定义编码具有脂肪酶活性的成熟多肽的核苷酸序列。
cDNA:术语“cDNA”在本文中定义为可以从获自真核细胞的成熟的、经过剪接的mRNA分子通过逆转录制备的DNA分子。cDNA缺乏通常在相应基因组DNA中存在的内含子序列。最初的初级RNA转录本是mRNA的前体,它在作为成熟的、经过剪接的mRNA出现之前要经过一系列步骤的加工。这些步骤包括通过称为剪接的过程除去内含子序列。因此,来源于mRNA的cDNA缺乏任何内含子序列。
核酸构建体(Nucleic acid construct):术语“核酸构建体”在用于本文时指单链或双链的核酸分子,它是由天然存在的基因分离的,或是经过修饰而以自然界中不存在的方式含有核酸区段。当核酸构建体含有表达本发明编码序列所需要的控制序列时,术语核酸构建体与术语“表达盒”含义相同。
控制序列(Control sequence):术语“控制序列”在本文中定义为包括对表达编码本发明多肽的多核苷酸而言必需的或有利的所有成分。每种控制序列对编码多肽的核苷酸序列来说可以是天然的或外来的,或者每种控制序列相对彼此也可以是天然的或外来的。这些控制序列包括,但不限于,前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子以及转录和翻译终止信号。为了引入特异的限制性位点以便于控制序列与编码多肽的核苷酸序列编码区连接,控制序列可以带有接头(linkers)。
可操作连接(Operably linked):术语“可操作连接”在本文中指这样的构造,其中控制序列置于相对于多核苷酸序列的编码序列的适当位置,使得控制序列可指导多肽编码序列的表达。
编码序列(Coding sequence):在用于本文时,术语“编码序列”意指直接规定其蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界一般由开放阅读框确定,它通常起始于ATG起始密码子或备选起始密码子诸如GTG和TTG,并终止于终止密码子诸如TAA、TAG和TGA。编码序列可以是DNA、cDNA或重组核苷酸序列。
表达(Expression):术语“表达”包括多肽产生涉及的任一步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰,和分泌。
表达载体(Expression vector):术语“表达载体”在本文中定义为这样的线状或环状DNA分子,它包含编码本发明多肽的多核苷酸,且与有助于其表达的其它核苷酸可操作连接。
宿主细胞(Host cell):术语“宿主细胞”在用于本文时包括易于被包含本发明多核苷酸的核酸构建体或表达载体转化、转染、转导等等的任何细胞类型。
修饰(Modification):术语“修饰”在本文中意指对由SEQ ID NO:2,SEQID NO:4,SEQ ID NO:6,SEQ ID NO:8或SEQ ID NO:10的成熟多肽或其同源序列组成的多肽的任何化学修饰,以及对编码该多肽的DNA的基因操作,修饰可以是一个或多个氨基酸的取代、缺失和/或插入,以及一个或多个氨基酸侧链的替换。
人工变体(Artificial variant):在用于本文时,术语“人工变体”意指由表达SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7或SEQ IDNO:9的成熟多肽编码序列的经修饰的核苷酸序列或其同源序列的生物体产生的、具有脂肪酶活性的多肽。经修饰的核苷酸序列可通过人工干预,对SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7或SEQ ID NO:9中所公开的核苷酸序列或其同源序列进行修饰来获得。
发明详述
具有脂肪酶活性的多肽
在第一个方面,本发明涉及这样的分离多肽,其具有与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少60%、优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、且甚至最优选至少97%、98%或99%的同一性程度的氨基酸序列,且具有具有脂肪酶活性(下文称“同源多肽”)。在一个优选的方面,同源多肽的氨基酸序列与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,或SEQ IDNO:10的成熟多肽相差10个氨基酸、优选5个氨基酸、更优选4个氨基酸、甚至更优选3个氨基酸、最优选2个氨基酸、且甚至最优选1个氨基酸。
本发明的多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体;或其具有脂肪酶活性的片段。在一个优选的方面,多肽包含SEQ ID NO:2的氨基酸序列。在另一个优选的方面,多肽包含SEQ ID NO:2的成熟多肽。在另一个优选的方面,多肽包含SEQ ID NO:2第21至562位氨基酸或其等位变体;或其具有脂肪酶活性的片段。在另一个优选的方面,多肽包含SEQID NO:2第21至562位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:2的氨基酸序列或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ ID NO:2的氨基酸序列组成。在另一个优选的方面,多肽由SEQ ID NO:2的成熟多肽组成。在另一个优选的方面,多肽由SEQ ID NO:2第21至562位氨基酸或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ ID NO:2的第21至562位氨基酸组成。
本发明的多肽优选包含SEQ ID NO:4的氨基酸序列,或其等位变体;或其具有脂肪酶活性的片段。在一个优选的方面,多肽包含SEQ ID NO:4的氨基酸序列。在另一个优选的方面,该多肽包含SEQ ID NO:4的成熟多肽。在另一个优选的方面,多肽包含SEQ ID NO:4第25至588位氨基酸,或其等位变体;或其具有脂肪酶活性的片段。在另一个优选的方面,多肽包含SEQ ID NO:4的第25至588位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:4的氨基酸序列或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ ID NO:4的氨基酸序列组成。在另一个优选的方面,多肽由SEQ ID NO:4第25至588位氨基酸或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ IDNO:4第25至588位氨基酸组成。
本发明的多肽优选包含SEQ ID NO:6的氨基酸序列或其等位变体;或其具有脂肪酶活性的片段。在一个优选的方面,多肽包含SEQ ID NO:6的氨基酸序列。在另一个优选的方面,该多肽包含SEQ ID NO:6的成熟多肽。在另一个优选的方面,多肽包含SEQ ID NO:6的第21至598位氨基酸,或其等位变体;或其具有脂肪酶活性的片段。在另一个优选的方面,多肽包含SEQ ID NO:6的第21至598位氨基酸。在另一个优选的方面,多肽由SEQID NO:6的氨基酸序列或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由氨基酸序列SEQ ID NO:6组成。在另一个优选的方面,多肽由SEQ ID NO:6的第21至598位氨基酸或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ ID NO:6的第21至598位氨基酸组成。
本发明的多肽优选包含SEQ ID NO:8的氨基酸序列,或其等位变体;或其具有脂肪酶活性的片段。在一个优选的方面,多肽包含SEQ ID NO:8的氨基酸序列。在另一个优选的方面,该多肽包含SEQ ID NO:8的成熟多肽。在另一个优选的方面,多肽包含SEQ ID NO:8的第19至534位氨基酸,或其等位变体;或其具有脂肪酶活性的片段。在另一个优选的方面,多肽包含SEQ ID NO:8的第19至534位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:8的氨基酸序列或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ ID NO:8的氨基酸序列组成。在另一个优选的方面,多肽由SEQ ID NO:8的第19至534位氨基酸或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ IDNO:8的第19至534位氨基酸组成。
本发明的多肽优选包含SEQ ID NO:10的氨基酸序列,或其等位变体;或其具有脂肪酶活性的片段。在一个优选的方面,多肽包含SEQ ID NO:10的氨基酸序列。在另一个优选的方面,该多肽包含SEQ ID NO:10的成熟多肽。在另一个优选的方面,多肽包含SEQ ID NO:10的第22至578位氨基酸,或其等位变体;或其具有脂肪酶活性的片段。在另一个优选的方面,多肽包含SEQ ID NO:10的第22至578位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:10的氨基酸序列或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ ID NO:10的氨基酸序列组成。在另一个优选的方面,多肽由SEQ ID NO:10的第22至578位氨基酸或其等位变体;或其具有脂肪酶活性的片段组成。在另一个优选的方面,多肽由SEQ ID NO:10的第22至578位氨基酸组成。
在第二个方面,本发明涉及由如下多核苷酸编码的具有脂肪酶活性的分离多肽,该多核苷酸在很低严紧条件、优选低严紧条件、更优选中等严紧条件、更优选中等-高严紧条件、甚至更优选高严紧度条件、且最优选很高严紧条件下与(i)SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,或SEQ ID NO:9的成熟多肽编码序列;(ii)SEQ ID NO:1,SEQ ID NO:3,SEQID NO:5,SEQ ID NO:7,或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列;(iii),(i)或(ii)的子序列,或(iv),(i)、(ii)或(iii)的互补链发生杂交(J.Sambrook、E.F.Fritsch和T.Maniatus,1989,《Molecular Cloning,ALaboratory Manual》,第2版,Cold Spring Harbor,New York)。SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,或SEQ ID NO:9的成熟多肽编码序列的子序列含有至少100个连续核苷酸或优选至少200个连续的核苷酸。另外,子序列可编码具有脂肪酶活性的多肽片段。在一个优选的方面,成熟多肽编码序列是SEQ ID NO:1的第61至1686位核苷酸,SEQ ID NO:3的第73至1764位核苷酸,SEQ ID NO:5的第61至1922位核苷酸,SEQ IDNO:7的第55至1602位核苷酸,或SEQ ID NO:9的第64至1789位核苷酸。
根据本领域众所周知的方法,可使用SEQ ID NO:1,SEQ ID NO:3,SEQID NO:5,SEQ ID NO:7或SEQ ID NO:9的核苷酸序列或其子序列,以及SEQID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,或SEQ ID NO:10的氨基酸序列或其片段来设计核酸探针,用于从不同属或种的菌株鉴定和克隆编码具有脂肪酶活性的多肽的DNA。具体而言,遵循标准Southern印迹程序,可将这些探针用于与目的属或种的基因组或cDNA进行杂交,以鉴定和分离其中的相应基因。这些探针可以比完整序列短得多,但是长度应当是至少14个、优选至少25个、更优选至少35个、且最优选至少70个核苷酸。然而,优选的是,核酸探针的长度是至少100个核苷酸。例如,核酸探针的长度可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可使用更长的探针,例如长度是至少600核苷酸、至少优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸的核酸探针。DNA和RNA探针都可使用。通常将探针进行标记,用于检测相应的基因(例如用32P、3H、35S、生物素、或亲和素)。本发明涵盖这些探针。
因此,可从由这样的其它生物体制备的基因组DNA或cDNA文库中筛选与上述探针发生杂交且编码具有脂肪酶活性的多肽的DNA。来自这样的其它生物体的基因组或其它DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术来分离。可将来自文库的DNA或分离DNA转移并固定在硝酸纤维素或其它适宜载体材料上。为了鉴定与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7或SEQ ID NO:9或其子序列同源的克隆或DNA,将载体材料用于Southern印迹。
对本发明而言,杂交是指在很低至很高的严紧条件下核苷酸序列与经标记的核酸探针发生杂交,其中核酸探针对应于:SEQ ID NO:1,SEQ IDNO:3,SEQ ID NO:5,SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列;SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列;其互补链;或其子序列。在这些条件下与核酸探针发生杂交的分子可用X射线胶片检测。
在一个优选的方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一个优选的方面,核酸探针是SEQ ID NO:1的第61至1686位核苷酸。在另一个优选的方面,核酸探针是编码SEQ ID NO:2的多肽或其子序列的多核苷酸序列。在另一个优选的方面,核酸探针是SEQ ID NO:1。在另一个优选的方面,核酸探针是包含在质粒pJLin173中的多核苷酸序列,所述质粒包含在大肠杆菌(E.coli)NRRL B-30782中,其中其多核苷酸序列编码具有脂肪酶活性的多肽。在另一个优选的方面,核酸探针是包含在质粒pJLin173中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30782中。
在另一个优选的方面,核酸探针是SEQ ID NO:3的成熟多肽编码序列。在另一个优选的方面,核酸探针是SEQ ID NO:3的第73至1764位核苷酸。在另一个优选的方面,核酸探针是编码SEQ ID NO:4的多肽或其子序列的多核苷酸序列。在一个优选的方面,核酸探针是SEQ ID NO:3。在另一个优选的方面,核酸探针是包含在质粒pSMO230中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30803中,其中所述多核苷酸序列编码具有脂肪酶活性的多肽。在另一个优选的方面,核酸探针是包含在质粒pSMO230中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30803中。
在另一个优选的方面,核酸探针是SEQ ID NO:5的成熟多肽编码序列。在另一个优选的方面,核酸探针是SEQ ID NO:5的第61至1922位核苷酸。在另一个优选的方面,核酸探针是编码SEQ ID NO:6的多肽或其子序列的多核苷酸序列。在另一个优选的方面,核酸探针是SEQ ID NO:5。在另一个优选的方面,核酸探针是包含在质粒pJLin175中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30783中,其中其多核苷酸序列编码具有脂肪酶活性的多肽。在另一个优选的方面,核酸探针是包含在质粒pJLin175中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30783中。
在另一个优选的方面,核酸探针是SEQ ID NO:7的成熟多肽编码序列。在另一个优选的方面,核酸探针是SEQ ID NO:7第55至1602位核苷酸。在另一个优选的方面,核酸探针是编码SEQ ID NO:8的多肽或其子序列的多核苷酸序列。在一个优选的方面,核酸探针是SEQ ID NO:7。在另一个优选的方面,核酸探针是包含在质粒pCrAm140中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30788中,其中其多核苷酸序列编码具有脂肪酶活性的多肽。在另一个优选的方面,核酸探针是包含在质粒pCrAm140中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30788中。
在另一个优选的方面,核酸探针是SEQ ID NO:9的成熟多肽编码序列。在另一个优选的方面,核酸探针是SEQ ID NO:9第64至1789位核苷酸。在另一个优选的方面,核酸探针是编码SEQ ID NO:10的多肽或其子序列的多核苷酸序列。在一个优选的方面,核酸探针是SEQ ID NO:9。在另一个优选的方面,核酸探针是包含在质粒pBM134b中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30786中,其中其多核苷酸序列编码具有脂肪酶活性的多肽。在另一个优选的方面,核酸探针是包含在质粒pBM134b中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30786中。
对于长度为至少100个核苷酸的长探针来说,很低至很高的严紧条件定义为遵循标准Southern印迹程序,于42℃,在5X SSPE、0.3%SDS、200μg/ml经剪切且变性的鲑精DNA、和25%甲酰胺(用于很低和低严紧度)、35%甲酰胺(用于中等和中等-高严紧度)、或50%甲酰胺(用于高和很高严紧度)中以最优方式进行12-24小时的预杂交和杂交。
对于长度为至少100个核苷酸的长探针来说,最后优选于至少45℃(很低严紧度)、更优选于至少50℃(低严紧度)、更优选于至少55℃(中等严紧度)、更优选于至少60℃(中等-高严紧度)、更优选于至少65℃(高严紧度)、且最优选于至少70℃(很高严紧度)将载体材料用2×SSC、0.2%SDS清洗3次,每次15分钟。
对于长度为大约15个核苷酸至大约70个核苷酸的短探针来说,严紧条件定义为遵循标准Southern印迹程序,并在根据Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 48:1390)的计算方法计算得到的Tm值低大约5℃至大约10℃的温度条件下,在0.9MNaCl、0.09M Tris-HCl、pH7.6、6mM EDTA、0.5% NP-40、1X Denhardt氏溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP、和0.2mg/ml酵母RNA中以最佳方式进行12至24小时的预杂交、杂交、和杂交后清洗。
对于长度为大约15个核苷酸至大约70个核苷酸的短探针来说,于比Tm计算值低大约5℃至10℃的温度将载体材料用6X SCC加0.1%SDS清洗1次15分钟,然后用6X SSC清洗两次,每次15分钟。
在第三个方面,本发明涉及在SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽或其同源序列中包含一个或多个氨基酸的保守取代、缺失、和/或插入的人工变体。优选的是,氨基酸改变是次要性的,也就是:不会明显影响蛋白质折叠和/或活性的保守氨基酸取代或插入;小段缺失,一般是1个至大约30个氨基酸的缺失;小段氨基或羧基末端延伸,诸如氨基末端的甲硫氨酸残基;可达大约20-25个残基的小段接头肽;或通过改变净电荷或另一功能而易于纯化的小段延伸,诸如多组氨酸序列段(poly-histidine tract)、抗原性表位、或结合域。
保守取代的例子在以下各组内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、和小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特异活性的氨基酸取代是本领域已知的,例如H.Neurath和R.L.Hill在《The Proteins》中所述(1979,Academic Press,NewYork)。最常发生的取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
除20种标准氨基酸之外,也可用非标准氨基酸(诸如4-羟基脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸、和α-甲基丝氨酸)来取代野生型多肽的氨基酸残基。可用有限数目的非保守氨基酸、非由遗传密码编码的氨基酸、和非天然氨基酸来取代氨基酸残基。“非天然氨基酸”在蛋白质合成后受到修饰,和/或在它们的侧链上具有与标准氨基酸不同的化学结构。可化学合成非天然氨基酸,优选的是可通过商业途径购买,非天然氨基酸包括哌啶酸、噻唑烷羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸、和3,3-二甲基脯氨酸。
或者,氨基酸改变具有这样的性质,使得多肽的物理化学特性被改变。例如,氨基酸改变可提高多肽的热稳定性、改变底物特异性、改变最佳pH等等。
亲本多肽中的关键氨基酸可根据本领域已知程序来确定,诸如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science 244:1081-1085)。在后一种技术中,在分子中的每个残基处引入单个丙氨酸突变,并测试所得到的突变分子的生物学活性(即脂肪酶活性)以鉴定对分子活性至关重要的氨基酸残基。也可参见Hilton等人,1996,J.Biol.Chem.271:4699-4708。也可以结合假定的接触位点氨基酸的突变通过诸如核磁共振、结晶学、电子衍射、或光亲和标记等技术的测定结构,对结构进行物理学分析,从而确定酶的活性位点或其他生物学相互作用。例如参见de Vos等人,1992,Science 255:306-312;Smith等人,1992,J.Mol.Biol.224:899-904;Wlodaver等人,1992,FEBS Lett.309:59-64。也可从与本发明多肽相关的多肽的同一性分析来推断关键氨基酸的身份。
单一或多个氨基酸取代可以下面的方法来产生和测试:使用已知的诱变、重组、和/或改组(shuffling)方法,随后进行相关筛选程序,诸如Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625所公开的。可使用的其它方法包括易错PCR、噬菌体展示(例如Lowman等人,199l,Biochem.30:10832-10837;US号5,223,409;WO 92/06204)、和定区诱变(region-directed mutagenesis)(Derbyshire等人,1986,Gene 46:145;Ner等人,1988,DNA 7:127)。
可将诱变/改组方法与高通量自动筛选方法相结合,用于检测由宿主细胞表达的、经过克隆和诱变的多肽的活性(Ness等人,1999,NatureBiotechnology 17:893-896)。可使用本领域的标准方法从宿主细胞回收编码活性多肽的经诱变DNA分子并快速测序。这些方法可快速确定目的多肽中单个氨基酸残基的重要性,并可应用于结构未知的多肽。
SEQ ID NO:2的成熟多肽,例如SEQ ID NO:2第21至562位氨基酸的氨基酸取代、缺失、和/或插入的总数,为10个、优选9个、更优选8个、更优选7个、更优选至多6个、更优选5个、更优选4个、甚至更优选3个、最优选2个、且甚至最优选1个。
SEQ ID NO:4的成熟多肽,例如SEQ ID NO:4第25至588位氨基酸的氨基酸取代、缺失、和/或插入的总数为10个、优选9个、更优选8个、更优选7个、更优选至多6个、更优选5个、更优选4个、甚至更优选3个、最优选2个、且甚至最优选1个。
SEQ ID NO:6的成熟多肽,例如SEQ ID NO:6第21至598位氨基酸的氨基酸取代、缺失、和/或插入的总数为10个、优选9个、更优选8个、更优选7个、更优选至多6个、更优选5个、更优选4个、甚至更优选3个、最优选2个、且甚至最优选1个。
SEQ ID NO:8的成熟多肽,例如SEQ ID NO:8第19至534位氨基酸的氨基酸取代、缺失、和/或插入的总数为10个、优选9个、更优选8个、更优选7个、更优选至多6个、更优选5个、更优选4个、甚至更优选3个、最优选2个、且甚至最优选1个。
SEQ ID NO:10的成熟多肽,例如SEQ ID NO:10第22至578位氨基酸的氨基酸取代、缺失、和/或插入的总数为10个、优选9个、更优选8个、更优选7个、更优选至多6个、更优选5个、更优选4个、甚至更优选3个、最优选2个、且甚至最优选1个。
具有脂肪酶活性的多肽的来源
可从任何来自属的微生物获得本发明的多肽。对本发明来说,术语“从...获得”在本文与指定的来源联用时,应当意指由核苷酸序列编码的多肽是由该来源产生的,或是由已经插入了来自于该来源的核苷酸序列的菌株产生的。在一个优选的方面,从指定来源获得的多肽分泌到细胞外。
本发明的多肽可以是细菌多肽。例如,多肽可以是革兰氏阳性细菌的多肽,诸如芽孢杆菌属(Bacillus)的具有脂肪酶活性的多肽,例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillus thuringiensis)的具有脂肪酶活性的多肽;或链霉菌属(Streptomyces)的具有脂肪酶活性的多肽,例如浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)的具有脂肪酶活性的多肽;或革兰氏阴性细菌的具有脂肪酶活性的多肽,例如大肠杆菌或某种假单胞菌(Pseudomonas sp.)的具有脂肪酶活性的多肽。
本发明的多肽还可以是真菌多肽,且更优选酵母多肽,诸如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或Yarrowia属的多肽;或更优选丝状真菌的多肽,诸如枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短柄霉属(Aureobasidium)、隐球酵母属(Cryptocoecus)、Filibasidium属、镰孢属(Fusarium)、腐质霉属(Humicola)、Magnaporthe属、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix属、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、Piromyces属、裂褶菌属(Schizophyllum)、Talaromyces属、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、Tolypocladium属或木霉属(Trichoderma)的具有脂肪酶活性的多肽。
在一个优选的方面,多肽是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、克鲁弗酵母(Saccharomyces kiuyveri)、诺地酵母(Saccharomyces norbensis)、或Saccharomyces oviformis的具有脂肪酶活性的多肽。
在另一个优选的方面,多肽是棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、杆孢状镰孢(Fusarium bactridioides)、Fusarium cerealis、Fusariumcrookwellense、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporium)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、Fusarium sulphureum、Fusariumtorulosum、Fusarium trichothecioides、Fusarium venenatum、Humicolainsolens、Humicola lanuginosa、曼赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichodermareesei、或绿色木霉(Trichoderma viride)的具有脂肪酶活性的多肽。
在另一个优选的方面,多肽是Thielavia achromatica、Thielaviaalbomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、小孢子梭孢壳(Thielavia microspora)、Thielavia ovispora、Thielavia peruviana、瘤孢梭孢壳(Thielavia spededonium)、毛梭孢壳(Thielavia setosa)、Thielaviasubthermophila、土生梭孢壳(Thielavia terrestris)、Thielavia terricola、Thielavia thermophila、Thielavia variospora或Thielavia wareingii的具有脂肪酶活性的多肽。
在一个更优选的方面,多肽是烟曲霉的多肽,例如SEQ ID NO:2的多肽,或其成熟多肽。
在另一个更优选的方面,多肽是禾本科镰孢的多肽,最优选的是禾本科镰孢NRRL 31084的多肽,例如SEQ ID NO:4的多肽;或其成熟多肽。
在另一个更优选的方面,多肽是Magnaporthe grisea的多肽,最优选的是Magnaporthe grisea FGSC 8958(Fungal Genetics Stock Center,Kansas City,MO)的多肽,例如SEQ ID NO:6或SEQ ID NO:8的多肽;或其成熟多肽。
在另一个更优选的方面,多肽是构巢曲霉的多肽,最优选的是构巢曲霉FGSC 2489(Fungal Genetics Stock Center,Kansas City,MO)的多肽,例如SEQ ID NO:10的多肽;或其成熟多肽。
应当理解,对于上述物种,不管已知的种名是什么,本发明均涵盖完全状态(perfect state)和不完全状态(imperfect state),还包括其它分类学等价物(taxonomic equivalents),例如无性型。本领域技术人员能容易的识别适当等价物的身份。
这些物种的菌株可容易的在许多培养物保藏机构为公众所得到,诸如美国典型培养物保藏中心(American Type Culture Collection,ATCC)、德国微生物和培养物保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH,DSM)、荷兰培养物保藏中心(Centraalbureau VoorSchimmelcultures,CBS)、和美国农业研究机构专利培养物保藏中心北部研究中心(Agricultural Research Service Patent Culture Collection NorthernRegional Research Center,NRRL)。
此外,利用上述探针,可从其它来源,包括从自然界(例如土壤、堆肥、水等)分离的微生物中鉴定和获得这些多肽。从自然生境中分离微生物的技术在本领域是众所周知的。然后可通过类似地筛选这样的微生物的基因组或cDNA文库来获得多核苷酸。一旦用探针检测出编码多肽的多核苷酸序列,就可通过本领域普通技术人员所熟知的技术(例如参见Sambrook等人,1989,同上)分离或克隆此多核苷酸。
本发明的多肽还包括融合多肽或可切割(cleavable)的融合多肽,其中另一多肽融合在所述多肽或其片段的N-末端或C-末端。通过将编码另一多肽的核苷酸序列(或其部分)与本发明的核苷酸序列(或其部分)融合来产生融合的多肽。用于产生融合多肽的技术在本领域是已知的,包括连接编码多肽的编码序列,使得它们处于同一阅读框中且融合多肽的表达受相同启动子和终止子的控制。
多核苷酸
本发明还涉及具有编码本发明多肽的核苷酸序列的分离多核苷酸。
在一个优选的方面,所述核苷酸序列为SEQ ID NO:1所示。在另一个更优选的方面,所述核苷酸序列是质粒pJLin173中所含的序列,所述质粒包含在大肠杆菌NRRL B-30782中。在另一个优选的方面,所述核苷酸序列是SEQ ID NO:1的成熟多肽编码区。在另一个优选的方面,所述核苷酸序列是SEQ ID NO:1的第61至1686位核苷酸。在另一个更优选的方面,所述核苷酸序列是质粒pJLin173中所含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30782中。本发明还涵盖编码具有SEQ ID NO:2的氨基酸序列的多肽或其成熟多肽的核苷酸序列,它与SEQ ID NO:1或其成熟多肽编码序列因遗传密码的简并性而不同。本发明还涉及SEQ ID NO:1的子序列,其编码SEQ ID NO:2的具有脂肪酶活性的片段
在另一个优选的方面,所述核苷酸序列为SEQ ID NO:3所示。在另一个更优选的方面,所述核苷酸序列是质粒pSMO230中所含的序列,所述质粒包含在大肠杆菌NRRL B-30803中。在另一个优选的方面,所述核苷酸序列是SEQ ID NO:3的成熟多肽编码区。在另一个优选的方面,核苷酸序列是SEQ ID NO:3的第73至1764位核苷酸。在另一个更优选的方面,所述核苷酸序列是质粒pSMO230中所含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30803中。本发明还涵盖编码具有SEQ ID NO:4的氨基酸序列的多肽或其成熟多肽的核苷酸序列,它与SEQ ID NO:3或其成熟多肽编码序列因遗传密码的简并性而不同。本发明还涉及SEQ ID NO:3的子序列,其编码SEQ ID NO:4的具有脂肪酶活性的片段。
在另一个优选的方面,所述核苷酸序列为SEQ ID NO:5所示。在另一个更优选的方面,所述核苷酸序列是质粒pJLin175中所含的序列,所述质粒包含在大肠杆菌NRRL B-30783中。在另一个优选的方面,所述核苷酸序列是SEQ ID NO:5的成熟多肽编码区。在另一个优选的方面,所述核苷酸序列是SEQ ID NO:5的第61至1922位核苷酸。在另一个更优选的方面,核苷酸序列是质粒pJLin175中所含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30783中。本发明还涵盖编码具有SEQ ID NO:6的氨基酸序列的多肽或其成熟多肽的核苷酸序列,它与SEQ ID NO:5或其成熟多肽编码序列因遗传密码的简并性而不同。本发明还涉及SEQ ID NO:5的子序列,其编码SEQ ID NO:6的具有脂肪酶活性的片段
在另一个优选的方面,所述核苷酸序列为SEQ ID NO:7所示。在另一个更优选的方面,所述核苷酸序列是质粒pCrAm140中所含的序列,所述质粒包含在大肠杆菌NRRL B-30788中。在另一个优选的方面,所述核苷酸序列是SEQ ID NO:7的成熟多肽编码区。在另一个优选的方面,核苷酸序列是SEQ ID NO:7的第55至1602位核苷酸。在另一个更优选的方面,核苷酸序列是质粒pCrAm140中所含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30788中。本发明还涵盖编码具有SEQ ID NO:8的氨基酸序列的多肽或其成熟多肽的核苷酸序列,它与SEQ ID NO:7或其成熟多肽编码序列因遗传密码的简并性而不同。本发明还涉及SEQ ID NO:7的子序列,其编码SEQ ID NO:8的具有脂肪酶活性的片段。
在另一个优选的方面,所述核苷酸序列为SEQ ID NO:9所示。在另一个更优选的方面,所述核苷酸序列是质粒pBM134b中所含的序列,所述质粒包含在大肠杆菌NRRL B-30786中。在另一个优选的方面,所述核苷酸序列是SEQ ID NO:9的成熟多肽编码区。在另一个优选的方面,所述核苷酸序列是SEQ ID NO:9的第64至1789位核苷酸。在另一个更优选的方面,所述核苷酸序列是质粒pBM134b中所含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30786中。本发明还涵盖编码具有SEQ ID NO:10的氨基酸序列的多肽或其成熟多肽的核苷酸序列,它与SEQ ID NO:9或其成熟多肽编码序列因遗传密码的简并性而不同。本发明还涉及SEQ ID NO:9的子序列,其编码SEQ ID NO:10的具有脂肪酶活性的片段。
本发明还涉及在SEQ ID NO:1的成熟多肽编码序列中包含至少一处突变的突变多核苷酸,其中突变核苷酸序列编码SEQ ID NO:2的成熟多肽。在优选的方面中,成熟多肽是由SEQ ID NO:2第21至562位氨基酸。
本发明还涉及在SEQ ID NO:3的成熟多肽编码序列中包含至少一处突变的突变多核苷酸,其中突变核苷酸序列编码SEQ ID NO:4的成熟多肽。在优选的方面中,成熟多肽是由SEQ ID NO:4第25至588位氨基酸。
本发明还涉及在SEQ ID NO:5的成熟多肽编码序列中包含至少一处突变的突变多核苷酸,其中突变核苷酸序列编码SEQ ID NO:6的成熟多肽。在优选的方面中,成熟多肽是由SEQ ID NO:6第21至598位氨基酸。
本发明还涉及在SEQ ID NO:7的成熟多肽编码序列中包含至少一处突变的突变多核苷酸,其中突变核苷酸序列编码SEQ ID NO:8的成熟多肽。在优选的方面中,成熟多肽是由SEQ ID NO:8第19至534位氨基酸。
本发明还涉及在SEQ ID NO:9的成熟多肽编码序列中包含至少一处突变的突变多核苷酸,其中突变核苷酸序列编码SEQ ID NO:10的成熟多肽。在优选的方面中,成熟多肽是由SEQ ID NO:10第22至578位氨基酸。
用于分离或克隆编码多肽的多核苷酸的技术在本领域是已知的,包括从基因组DNA分离,从cDNA制备,或者两者的组合。例如,通过利用众所周知的聚合酶链式反应(PCR)或用抗体筛选表达文库以检测出具有共同结构特征的克隆DNA片段,可以实现从这些基因组DNA克隆本发明的多核苷酸序列。例如参见Innis等人,1990,《PCR:A Guide to Methods andApplication》,Academic Press,New York。还可以使用其它核酸扩增程序,诸如连接酶链式反应(LCR)、连接激活转录(LAT)、和基于核苷酸序列的扩增(NASBA)。可从梭孢壳属菌株或者另外的或相关的生物体克隆多核苷酸,因此它可以是例如核苷酸序列中多肽编码区的等位变体或种间变体。
本发明还涉及具有如下核苷酸序列的编码活性多肽的多核苷酸,该核苷酸序列与SEQ ID NO:1的成熟多肽编码序列具有至少60%、优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、甚至更优选至少95%、且最优选至少97%的同一性程度。在一个优选的方面,成熟多肽编码序列是SEQ ID NO:1第61至1686位核苷酸。
本发明还涉及具有如下核苷酸序列的编码活性多肽的多核苷酸,该核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有至少70%、优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、甚至更优选至少95%、且最优选至少97%的同一性程度。在一个优选的方面,成熟多肽编码序列是SEQ ID NO:3第73至1764位核苷酸。
本发明还涉及具有如下核苷酸序列的编码活性多肽的多核苷酸,该核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有至少70%、优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、甚至更优选至少95%、且最优选至少97%的同一性程度。在一个优选的方面,成熟多肽编码序列是SEQ ID NO:5第61至1922位核苷酸。
本发明还涉及具有如下核苷酸序列的编码活性多肽的多核苷酸,该核苷酸序列与SEQ ID NO:7的成熟多肽编码序列具有至少70%、优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、甚至更优选至少95%、且最优选至少97%的同一性程度。在一个优选的方面,成熟多肽编码序列是SEQ ID NO:7第55至1602位核苷酸。
本发明还涉及具有如下核苷酸序列的编码活性多肽的多核苷酸,该核苷酸序列与SEQ ID NO:9的成熟多肽编码序列具有至少70%、优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、甚至更优选至少95%、且最优选至少97%的同一性程度。在一个优选的方面,成熟多肽编码序列是SEQ ID NO:9第64至1789位核苷酸。
为了合成与本发明多肽基本上类似的多肽,可能必须修饰编码该多肽的核苷酸序列。术语与多肽“基本上类似”是指所述多肽的非天然存在形式。这些多肽可能因某些工程改造而区别于从其天然来源分离的多肽,例如在比活、热稳定性、最佳pH等方面不同的人工变体。可以在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的多肽编码区所呈现的核苷酸序列基础上构建变体序列,例如其子序列,和/或通过引入不会导致由核苷酸序列编码的多肽具有另一种氨基酸序列、而是使之符合要用来生产酶的宿主生物体的密码子使用方式的核苷酸取代,或通过引入可导致不同氨基酸序列的核苷酸取代。对于核苷酸取代的一般说明可参见例如Ford等人,1991,Protein Expression and Purification 2:95-107。
对本领域技术人员而言,显而易见的是这样的取代可在分子功能的关键区域之外进行,并且结果仍然可得到活性多肽。可根据本领域的已知程序来鉴别对于由本发明的分离多核苷酸所编码的多肽的活性来说至关重要的、因此优选不进行取代的氨基酸残基,诸如定点诱变或丙氨酸扫描诱变(例如参见Cunningham和Wells,1989,Science 244:1081-1085)。在后一种技术中,在分子中每一带正电荷残基处引入突变,然后对由此得到的突变分子测试脂肪酶活性以鉴定对分子活性至关重要的氨基酸残基。底物-酶相互作用位点也可通过三维结构分析来确定,其中三维结构可由诸如核磁共振分析、晶体学、或光亲和标记等技术来测定(例如参见de Vos等人,1992,Science 255:306-312;Smith等人,1992,Journal of Molecular Biology224:899-904;Wlodaver等人,1992,FEBS Letters 309:59-64)。
本发明还涉及编码本发明多肽的分离多核苷酸,它在很低严紧条件、优选低严紧条件、更优选中等严紧条件、更优选中等-高严紧条件、甚至更优选高严紧度条件、且最优选很高严紧条件下与(i)SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列;ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含的cDNA序列;或(iii),(i)或(ii)的互补链;或其等位变体和子序列发生杂交(Sambrook等人,1989,同上),正如本文所定义的。在一个优选的方面,SEQ ID NO:1的成熟多肽编码序列是第61至1686位核苷酸。在另一个优选的方面,SEQ ID NO:3的成熟多肽编码序列是第73至1764位核苷酸。在另一个优选的方面,SEQ ID NO:5的成熟多肽编码序列是第61至1922位核苷酸。在另一个优选的方面,SEQ ID NO:7的成熟多肽编码序列是第55至1602位核苷酸。在另一个优选的方面,SEQ ID NO:9的成熟多肽编码序列是第64至1789位核苷酸。
本发明还涉及通过如下获得的编码具有脂肪酶活性的多肽的分离多核苷酸,即(a)在很低、低、中等、中等-高、高、或很高严紧条件下将DNA群体与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQID NO:9的成熟多肽编码序列;ii)SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含的cDNA序列;或(iii),(i)或(ii)的互补链进行杂交;并(b)分离发生杂交的多核苷酸。在一个优选的方面,SEQ ID NO:1的成熟多肽编码序列是第61至1686位核苷酸。在另一个优选的方面,SEQ ID NO:3的成熟多肽编码序列是第73至1764位核苷酸。在另一个优选的方面,SEQ ID NO:5的成熟多肽编码序列是第61至1922位核苷酸。在另一个优选的方面,SEQ ID NO:7的成熟多肽编码序列是第55至1602位核苷酸。在另一个优选的方面,SEQ ID NO:9的成熟多肽编码序列是第64至1789位核苷酸。
核酸构建体
本发明还涉及包含与一种或多种控制序列可操作连接的本发明的分离多核苷酸的核酸构建体,所述控制序列在适当宿主细胞中在与控制序列相容的条件下指导编码序列的表达。
可利用多种方法操作编码本发明多肽的分离多核苷酸以便于多肽的表达。根据表达载体的不同,可能希望或必须在将多核苷酸的序列插入载体之前对其进行操作。利用重组DNA方法修饰多核苷酸序列的技术是为本领域众所周知的。
控制序列可以是适当的启动子序列,即受到宿主细胞识别来表达编码本发明多肽的多核苷酸的核苷酸序列。启动子序列包含调节多肽表达的转录控制序列。启动子可以是在所选宿主细胞中表现出转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,而且可从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因中获得。
用于指导本发明核酸构建体转录的适当启动子的实例,尤其是在细菌宿主细胞中,是从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomycescoelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核生物的β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proceedings of the National Academy of SciencesUSA 75:3727-3731)中获得的启动子,以及tac启动子(DeBoer等人,1983,Proceedings of the National Academy of Sciences USA 80:21-25)。还有“Usefulproteins from recombinant bacteria”,Scientific American,1980,242:74-94及Sambrook等人,1989,同上中描述的其它启动子。
用于在丝状真菌宿主细胞中指导本发明核酸构建体转录的适当启动子的实例是从米曲霉TAKA淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、Fusarium venenatum淀粉葡糖苷酶(WO 00/56900)、Fusariumvenenatum Daria(WO 00/56900)、Fusarium venenatum Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、Trichoderma reesei β-葡糖苷酶、Trichoderma reesei纤维二糖水解酶I、Trichoderma reesei纤维二糖水解酶II、Trichoderma reesei内切葡聚糖酶I、Trichoderma reesei内切葡聚糖酶II、Trichoderma reesei内切葡聚糖酶III、Trichoderma reesei内切葡聚糖酶IV、Trichoderma reesei内切葡聚糖酶V、Trichoderma reesei木聚糖酶I、Trichoderma reesei木聚糖酶II、Trichoderma reeseiβ-木糖苷酶基因中获得的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶基因的杂合启动子);及其突变的、截短的和杂合的启动子。
在酵母宿主中,有用的启动子是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶基因中所获得的。还有Romanos等人,1992,Yeast 8:423-488中描述了用于酵母宿主细胞的其它有用启动子。
控制序列也可以是适当的转录终止子序列,即由宿主细胞识别来终止转录的序列。终止子序列可操作连接于编码多肽的核苷酸序列的3′端。在所选择的宿主细胞中起作用的任何终止子都可用于本发明。
对于丝状真菌宿主细胞优选的终止子是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖镰孢胰蛋白酶样蛋白酶的基因中获得的。
对于酵母宿主细胞优选的终止子是从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得的。还有Romanos等人,1992,同上中描述的用于酵母宿主细胞的其它有用终止子。
控制序列还可以是适当的前导序列,即对宿主细胞翻译很重要的mRNA非翻译区。前导序列可操作连接于编码多肽的核苷酸序列的5′端。在所选择的宿主细胞中起作用的任何前导序列都可用于本发明。
对于丝状真菌宿主细胞优选的前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶基因获得的。
对于酵母宿主细胞合适的前导序列是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因中得的。
控制序列还可以是聚腺苷酸化序列,即可操作连接于核苷酸序列3′端,当转录时可作为将聚腺苷残基添加到转录的mRNA上的信号由宿主细胞识别的序列。在所选择的宿主细胞中起作用的任何聚腺苷酸化序列都可用于本发明。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶、和黑曲霉α-葡糖苷酶的基因获得的。
Guo和Sherman等人,1995,Molecular Cellular Biology 15:5983-5990中描述了对酵母宿主细胞有用的聚腺苷酸化序列。
控制序列还可以是信号肽编码区,它编码连接于多肽的氨基末端并指导编码的多肽进入细胞分泌途径的氨基酸序列。核苷酸序列的编码序列的5′端可固有地包含信号肽编码区,它在翻译阅读框中与编码分泌多肽的编码区段天然连接。或者,编码序列的5′端可以包含对编码序列是外来的信号肽编码区。如果编码序列天然不含信号肽编码区,则可能需要外来的信号肽编码区。或者,外来的信号肽编码区可仅仅替换天然信号肽编码区以便增强多肽的分泌。然而,指导表达的多肽进入所选择宿主细胞的分泌途径(即分泌至培养基中)的任何信号肽编码区均可用于本发明。
用于细菌宿主细胞有效的信号肽编码区是从芽孢杆菌NCIB 11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶类(nprT、nprS、nprM)、和枯草芽孢杆菌的prsA基因获得的信号肽编码区。还有Simonen和Palva,1993,Microbiological Reviews 57:109-137中描述的其它信号肽。
对于丝状真菌宿主细胞有效的信号肽编码区是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、Humicola insolens纤维素酶、Humicola insolens内切葡聚糖酶V和Humicolalanuginosa脂肪酶的基因获得的信号肽编码区。
在一个优选的方面,信号肽编码区是编码SEQ ID NO:2第1至20位氨基酸的SEQ ID NO:1第1至60位核苷酸。
在另一个优选的方面,信号肽编码区是编码SEQ ID NO:4第1至24位氨基酸的SEQ ID NO:3第1至72位核苷酸。
在另一个优选的方面,信号肽编码区是编码SEQ ID NO:6第1至20位氨基酸的SEQ ID NO:5第1至60位核苷酸。
在另一个优选的方面,信号肽编码区是编码SEQ ID NO:8第1至18位氨基酸的SEQ ID NO:7第1至54位核苷酸。
在另一个优选的方面,信号肽编码区是编码SEQ ID NO:10第1至21位氨基酸的SEQ ID NO:9第1至63位核苷酸。
对于酵母宿主细胞有用的信号肽是从酿酒酵母α-因子和酿酒酵母转化酶的基因获得的。还有Romanos等人,1992,同上中描述了的其它有用的信号肽编码区。
控制序列还可以是前肽(propeptide)编码区,它编码位于多肽氨基末端的氨基酸序列。所得的多肽称为酶原(proenzyme)或多肽原(propolypeptide)(或有时候称作酶原(zymogen))。多肽原一般是没有活性的,且可通过前肽的催化或自催化切割从多肽原转变成成熟有活性的多肽。前肽编码区可从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、曼赫根毛霉天冬氨酸蛋白酶、和Myceliophthora thermophila漆酶(WO 95/33836)的基因获得。
当信号肽和前肽区都存在于多肽的氨基末端时,前肽区位于与多肽氨基末端相邻的位置,而信号肽区位于与前肽区的氨基末端相邻的位置。
还可能需要加上调节序列以使多肽的表达可以相对于宿主细胞的生长进行调节。调节系统的实例是能响应化学或物理刺激(包括调节化合物的存在)而引起基因表达的开启或关闭。在原核系统中,调节系统包括lac、tac、和trp操纵子系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是为基因扩增提供条件的那些序列。在真核系统中,这些包括在氨甲喋呤(methotrexate)存在时扩增的二氢叶酸还原酶基因,以及有重金属存在时扩增的金属硫蛋白基因。在这些情况中,编码多肽的核苷酸序列将与调节序列可操作连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、及转录和翻译终止信号的重组表达载体。可以将本文所述的各种核酸和控制序列连接起来以产生重组表达载体,此重组表达载体可包括一个或多个适宜的限制性位点使得在这些位点可插入或替换编码多肽的核苷酸序列。或者,本发明的核苷酸序列可通过将核苷酸序列或含有该序列的核酸构建体插入适当的表达载体进行表达。构建表达载体时,将编码序列置于载体中以使编码序列与适当的表达控制序列可操作连接。
重组表达载体可以是可适宜地接受重组DNA操作并能引起核苷酸序列表达的任何载体(例如质粒或病毒)。载体的选择一般取决于载体与要引入此载体的宿主细胞之间的相容性。载体可以是线性的或闭合环状的质粒。
载体可以是自主复制载体,即载体可以染色体外实体的形式存在,其复制独立于染色体的复制,例如质粒、染色体外元件、微型染色体、或人工染色体。载体可包含任何用于确保自我复制的手段。或者,载体可以是这样的一种载体,它在导入宿主细胞后,整合到基因组中并与其整合进入的染色体一起复制。此外,可使用单一载体或质粒,或是一起含有待引入宿主细胞基因组的全部DNA的两种或多种载体或质粒,或者转座子。
本发明载体优选包含一种或多种选择标记,所述选择标记允许容易地选择转化的、转染的、转导等等的细胞。选择标记是这样的基因,其产物有助于产生抗微生物剂或病毒抗性、重金属抗性、营养缺陷型变成原养型等等。
细菌选择标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。适于酵母宿主细胞的标记有ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。在丝状真菌宿主细胞中使用的选择标记包括但不限于:amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfate adenyltransferase))、和trpC(邻氨基苯甲酸合酶)及其等价物。优选用于曲霉属细胞的是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选包含允许载体整合到宿主细胞基因组中或者允许载体在细胞中不依赖于基因组自主复制的元件。
为了整合进入宿主细胞基因组,载体可依赖编码多肽的多核苷酸序列或任何其它载体元件通过同源或非同源重组整合到基因组中。或者,载体可包含附加的核苷酸序列用于指导通过同源重组在染色体中的特定位置整合进入宿主细胞基因组中。为了提高在特定位置整合的可能性,整合元件应优选包含足够数目的与相应目标序列具有高度同一性的核酸,诸如100-10,000个碱基对、优选400-10,000个碱基对、且最优选800-10,000个碱基对,从而提高同源重组的几率。整合元件可以是与宿主细胞基因组中的目标序列同源的任何序列。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,载体可通过非同源重组整合到宿主细胞的基因组中。
对自主复制来说,载体还可包含能使载体在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的调节自主复制的任何质粒复制因子。术语“复制起点”或“质粒复制子”在本文中定义为能使质粒或载体在体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及允许在芽孢杆菌中复制的pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞的复制起点的实例是2μm复制起点、ARS1、ARS4、ARS1和CEN3的组合、及ARS4和CEN6的组合。
可用于丝状真菌细胞的复制起点的实例有AMA1和ANS1(Gems等人,1991,Gene 98:61-67;Cullen等人,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。AMA1基因的分离和包含该基因的质粒或载体的构建可根据WO 00/24883中所公开的方法来完成。
可将本发明多核苷酸的一个以上的拷贝插入宿主细胞中以提高基因产物的产量。提高多核苷酸拷贝数可通过下面的手段实现:将序列的至少一个附加拷贝整合进宿主细胞基因组中;或使多核苷酸中包含可扩增的选择标记基因,并在合适的选择剂存在下培养此细胞,以筛选出包含所述选择标记基因的扩增拷贝—因此也包含所述多核苷酸的更多拷贝—的细胞。
用于连接上述元件以构建本发明重组表达载体的程序是本领域技术人员所熟知的(例如参见Sambrook等人,1989,同上)。
宿主细胞
本发明还涉及包含本发明多核苷酸的重组宿主细胞,它们可有利地用于多肽的重组生产。可将包含本发明多核苷酸的载体引入宿主细胞以使载体保持为染色体的整合体或作为自主复制的染色体外载体,如前所述。术语“宿主细胞”包括所有那些由于在复制期间出现的突变而不与亲本细胞相同的亲本细胞的后代。宿主细胞的选择在很大程度上依赖于编码多肽的基因和它的来源。
宿主细胞可以是单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。
有用的单细胞微生物是细菌细胞,诸如革兰氏阳性细菌,包括但不限于芽孢杆菌属细胞,例如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、Bacillus clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、和苏云金芽孢杆菌;或链霉菌属细胞,例如浅青紫链霉菌和鼠灰链霉菌,或者革兰氏阴性细菌,诸如大肠杆菌和一种假单胞菌。在一个优选的方面,细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌、或枯草杆菌细胞。在另一个优选的方面,芽孢杆菌属细胞是嗜碱的芽孢杆菌。
将载体导入细菌宿主细胞可通过例如原生质体转化(参见例如Chang和Cohen,1979,Molecular General Genetics 168:111-115)、利用感受态细胞(参见例如Young和Spizizen,1961,Journal of Bacteriology 81:823-829;或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology 56:209-221)、电穿孔(参见例如Shigekawa和Dower,1988,Biotechniques 6:742-751)、或接合(参见例如Koehler和Thorne,1987,Journal of Bacteriology169:5771-5278)来实现。
宿主细胞还可以是真核细胞,诸如哺乳动物、昆虫、植物、或真菌细胞。
在一个优选的方面,宿主细胞是真菌细胞。“真菌”在用于本文时包括子囊菌门(Acomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如Hawksworth等人,在《Ainsworth and Bisby’sDictionary of The Fungi》,第八版,1995,CAB International,University Press,Cambridge,UK中所定义的),以及卵菌门(Oomycota)(如Hawksworth等人,1995,同上第171页中所引用的)和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等人,1995,同上)。
在一个更优选的方面,真菌宿主细胞是酵母细胞。“酵母”在用于本文时包括产子囊酵母(内孢霉目Endomycetales)、产担孢子酵母、和属于半知菌类的酵母(芽孢纲Blastomycetes)。由于酵母的分类今后还会变化,对于本发明来说,酵母应该是如在《Biology and Activities of Yeast》(Skinner,F.A.、Passmore,S.M.和Davenport,R.R.编,Soc.App.Bacteriol.Symposium SeriesNo.9,1980)中所定义的。
在一个更优选的方面,酵母宿主细胞是假丝酵母属、汉逊氏酵母属(Hansenula)、克鲁维氏酵母属、毕赤氏酵母属、酵母属、裂殖酵母属、或Yarrowia属细胞。
在一个最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、Saccharomyces douglasii、克鲁弗酵母、诺第酵母、或Saccharomycesoviformis细胞。在另一个最优选的方面,酵母宿主细胞是乳克鲁维氏酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门亚门的所有丝状体(如Hawksworth等人,1995,同上中所定义的)。丝状真菌通常是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖、及其他复合多糖组成的菌丝壁为特征。营养生长是通过菌丝伸长,碳代谢是专性需氧的。相反,酵母诸如酿酒酵母的营养生长是通过单细胞菌体的出芽,而碳代谢可以是发酵性的。
在一个更优选的方面,丝状真菌宿主细胞是枝顶孢属(Acremonium)、曲霉属、短柄霉属(Aureobasidium)、烟管菌属(Bjerkandera)、Ceriporiopsis属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球酵母属、Filibasidium属、镰孢属、腐质霉属、Magnaporthe属、毛霉属、毁丝霉属、Neocallimastix属、脉孢霉菌、拟青霉属、青霉属、Phanerochaete属、射脉菌属(Phlebia)、Piromyces属、侧耳属(Pleurotus)、裂褶菌属、Talaromyces属、嗜热子囊菌属、梭孢壳属、Tolypocladium属、栓菌属(Trametes)、或木霉属的细胞。
在一个最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉细胞。在另一个最优选的方面,丝状真菌宿主细胞是杆孢状镰孢、Fusarium cerealis、Fusariumcrookwellense、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、或Fusarium venenatum细胞。在另一个最优选的方面,丝状真菌宿主细胞是无烟管菌(Bjerkandera adusta)、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、灰色鬼伞、毛革盖菌(Coriolus hirsutus)、Humicola insolens、Humicola lanuginosa、曼赫毛霉、Myceliophthora thermophila、粗糙脉孢菌、产紫青霉、Phanerochaetechrysosporium、辐射射脉菌(Phlebia radiata)、Pleurotus eryngii、土生梭孢壳(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、Trametes versicolor、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei、或绿色木霉(Trichodermaviride)细胞。
真菌细胞可以本身已知的方式通过涉及原生质体形成、原生质体转化、和细胞壁再生的过程进行转化。EP 238,023和Yelton等人,1984,Proceedingsof the National Academy of Sciences USA 81:1470-1474中描述了适合曲霉属和木霉属宿主细胞转化的过程。Malardier等人,1989,Gene 78:147-159和WO96/00787中描述了适合转化镰孢属物种的方法。可利用Becker和Guarente在Abelson,J.N.和Simon,M.I.编的Guide to Yeast Genetics andMolecular Biology,Methods in Enzymology,Vol.194,pp 182-187,AcademicPress公司,New York;Ito等人,1983,Journal of Bacteriology 153:163;及Hinnen等人,1978,Proceedings of the National Academy of Sciences USA75:1920中所描述的程序转化酵母。
生产方法
本发明还涉及生产本发明多肽的方法,包括:(a)在有助于产生所述多肽的条件下培养细胞,所述细胞的野生型形式能够产生多肽;并(b)回收所述多肽。在一个优选的方面,所述细胞属于曲霉属。在一个更优选的方面,所述细胞是烟曲霉。在另一个更优选的方面,所述细胞是构巢曲霉。在另一个优选的方面,所述细胞属于Magnaporthe属。在另一个更优选的方面,所述细胞是Magnaporthe grisea。
本发明还涉及生产本发明多肽的方法,包括:(a)在有助于产生所述多肽的条件下培养宿主细胞;并(b)回收所述多肽。
本发明还涉及生产本发明多肽的方法,包括:(a)在有助于产生所述多肽的条件下培养宿主细胞,该宿主细胞包含突变核苷酸序列,所述突变核苷酸序列在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列中具有至少一处突变,其中突变核苷酸序列编码包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽的多肽或由所述成熟多肽组成的多肽,并(b)回收所述多肽。
在一个优选的方面,SEQ ID NO:2的成熟多肽是第21至562位氨基酸。在另一个优选的方面,SEQ ID NO:4的成熟多肽是第25至588位氨基酸。在另一个优选的方面,SEQ ID NO:6的成熟多肽是第21至598位氨基酸。在另一个优选的方面,SEQ ID NO:8的成熟多肽是第19至534位氨基酸。在另一个优选的方面,SEQ ID NO:10的成熟多肽是第22至578位氨基酸。
在本发明的生产方法中,利用本领域众所周知的方法在适于产生所述多肽的营养培养基中培养细胞。例如,细胞培养可在实验室或工业发酵罐中在适当的培养基中和允许所述多肽被表达和/或分离的条件下,通过摇瓶培养、小规模或大规模发酵(包括连续的、分批的、补料-分批、或固态发酵)来进行。培养可使用本领域已知的程序在含有碳源、氮源以及无机盐的合适营养培养基中进行。适宜的培养基可从商业供应商获得,或者可根据已公开的配方来制备(例如美国典型培养物保藏中心的目录中公开的)。如果多肽分泌到营养培养基中,那么可直接从培养基回收多肽。如果多肽不分泌到培养基中,其可从细胞裂解物回收。
所述多肽可以通过本领域已知的对多肽特异性的方法来检测。这些检测方法可包括特异性抗体的使用,酶产物的生成,或者酶底物的消失。例如,可使用如本文所述的酶测定来确定酶的活性。
所得多肽可通过本领域已知的方法回收。例如,所述多肽可通过常规程序从营养培养基中回收,所述程序包括但不限于:离心、过滤、萃取、喷雾干燥、蒸发或沉淀。
本发明的多肽可通过本领域已知的多种程序纯化,包括但不限于下述程序:层析(例如离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳(例如制备性等电聚焦)、差异溶解度(例如硫酸铵沉淀)、SDS-PAGE、或萃取(例如参见《Protein Purification》,J.-C.Janson和Lars Ryden编,VCHPublishers,New York,1989),以获得基本上纯的多肽。
植物
本发明还涉及已被编码本发明具有脂肪酶活性的多肽的核苷酸序列转化,从而以可回收量表达和产生该多肽的转基因植物、植物部分或植物细胞。所述多肽可从植物或植物部分回收。或者,将含有重组多肽的植物或植物部分本身用于改善食物或饲料的质量,例如提高营养价值、可口性(palatability)和流变性、或破坏抗营养因子(antinutritive factor)。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例有禾草(grasses),例如草地草(meadow grass)(蓝草(bluegrass),早熟禾属(Poa));草料草(forage grass),诸如羊矛属(Festuca)、黑麦草属(Lolium);温带草(temperate grass),例如剪股颖属(Agrostis);和谷类(cereals),例如小麦(wheat)、燕麦(oat)、黑麦(rye)、大麦(barley)、稻(rice)、高粱(sorghum)、和玉蜀黍(maize)(玉米(corn))。
双子叶植物的例子有:烟草;豆类(legumes),例如羽扇豆(lupins);马铃薯;甜菜;豌豆;莱豆(bean)和大豆,和十字花科(Brassicaceae)植物,例如花椰菜(cauliflower)、油菜籽(rape seed)和与之亲缘关系紧密的模式生物拟南芥(Arabidopsis thaliana)。
植物部分的实例有茎、愈伤组织、叶、根、果实、种子、和块茎,以及构成这些部分的单独组织,例如表皮、叶肉、薄壁组织、维管组织、分生组织。特殊的植物细胞区室(compartments),诸如叶绿体、质外体、线粒体、液泡、过氧化物酶体和细胞质也认为是植物部分。此外,任何植物细胞,无论什么组织来源,也认为是植物部分。类似的,植物部分,诸如被分离用来帮助本发明的应用的特定组织和细胞也认为是植物部分,例如胚、胚乳、糊粉和种皮。
这些植物、植物部分和植物细胞的后代也被包括在本发明的范围之内。
可根据本领域已知的方法构建表达本发明多肽的转基因植物或植物细胞。简而言之,植物或植物细胞的构建可通过:将一种或多种编码本发明多肽的表达构建体整合到植物宿主基因组或叶绿体基因组中,并使所得的修饰植物或植物细胞增殖形成转基因植物或植物细胞。
所述表达构建体合适地为核酸构建体,其包含编码本发明多肽、且可操作地与在所选植物或植物部分中表达该核苷酸序列所需的合适调控序列连接的多核苷酸。另外,该表达构建体还可以包括:可用于鉴定已整合所述表达构建体的宿主细胞的选择标记;以及将该构建体导入所述植物所需的DNA序列(后者取决于使用的DNA导入方法)。
调节序列(例如启动子和终止子序列,以及可选的信号或转运(transit)序列)的选择,是根据例如想要在何时、何处、怎样表达该多肽而决定的。例如,编码本发明多肽的基因的表达可以是组成型或诱导型的,或者可为发育特异性、阶段特异性或组织特异性的,而且基因产物可以被靶向于具体的组织或者植物部分例如种子或叶。对调节序列的描述有例如Tague等,1988,Plant Physiology 86:506。
对于组成性表达,可以使用35S-CaMV、玉米泛素1和水稻肌动蛋白启动子(Franck等.,1980.Cell 21:285-294,Christensen AH,Sharrock RA和Quail,1992,Plant Mo.Biol.18:675-689;Zhang W,McElroy D.和Wu R.,1991,PlantCell 3:1155-1165)。器官特异性的启动子可以是,例如,来自存储性贮藏组织(storage sink tissues)例如种子、马铃薯的块茎及果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或者来自代谢性贮藏组织(metabolic sink tissues),例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878);或者是种子特异性的启动子,例如来自稻的谷蛋白、谷醇溶蛋白、球蛋白或白蛋白启动子(Wu等,1998,Plant and Cell Physiology 39:885-889),来自蚕豆(Vicia faba)的豆球蛋白B4和未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology 152:708-711),来自一种种子油体(seed oil body)蛋白的启动子(Chen等,1998,Plant and CellPhysiology 39:935-941),来自欧洲油菜(Brassica napus)的贮存蛋白napA启动子,或任何其他本领域已知的种子特异性的启动子,例如WO 91/14772所描述的。另外,该启动子可以是叶特异性的启动子,例如来自稻或西红柿的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000);小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins,1994,PlantMolecular Biology 26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular and General Genetics 248:668-674);或为创伤诱导性(woundinducible)的启动子,例如马铃薯pin2启动子(Xu等,1993,Plant MolecularBiology 22:573-588)。类似地,该启动子也可以被非生物性的处理例如温度、干旱或盐度变化所诱导,或者被外加的活化启动子的物质,例如乙醇、雌激素、植物激素如乙烯、脱落酸和赤霉酸、及重金属所诱导。
还可使用启动子增强子元件以实现本发明多肽在植物中的更高表达。例如,启动子增强子元件可以是位于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如Xu等人,1993,同上中公开了利用水稻肌动蛋白1基因的第一个内含子来增强表达。
选择标记基因和表达构建体的任何其他部分都可以从本领域可用的那些进行选择。
根据本领域已知的常规技术将核酸构建体整合到植物基因组中,包括土壤杆菌(Agrobacterium)介导的转化、病毒介导的转化、显微注射、粒子轰击、生物射弹转化(biolistic transformation)、和电穿孔(Gasser等人,1990,Science 244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto等人,1989,Nature 338:274)。
目前,根瘤土壤杆菌(Agrobacterium tumefaciens)介导的基因转移是产生转基因双子叶植物的首选方法(其综述可参见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15-38),而且也可用于转化单子叶植物,尽管这些植物常使用其它转化方法。目前,优选用于产生转基因单子叶植物的方法是粒子轰击(极小金或钨粒子,被用于转化的DNA所包被)胚愈伤组织或发育中的胚(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current Opinion Biotechnology 5:158-162;Vasil等人,1992,Bio/Technology 10:667-674)。另外一种可选的转化单子叶植物的方法是基于原生质体转化,如Omirulleh等,1993,Plant Molecular Biology 21:415-428所述。
在转化后,根据本领域熟知的方法选出已整合入表达构建体的转化体,并使其再生成为完整植物。通常设计转化方法以在再生过程或后续的世代中选择性地除去选择基因,例如通过用两个单独的T-DNA构建体共转化,或通过特异性的重组酶位点特异性地切下选择基因。
本发明还涉及生产本发明多肽的方法,包括(a)在有助于产生所述多肽的条件下,培养含有多核苷酸的转基因植物或植物细胞,所述多核苷酸编码具有脂肪酶活性的本发明的多肽;并(b)回收所述多肽。
脂肪酶活性的消除或降低
本发明还涉及生产亲本细胞突变体的方法,包括破坏或缺失编码本发明多肽的多核苷酸序列或其部分,这导致在相同条件下培养时突变体细胞产生的所述多肽比亲本细胞少。
可使用本技术领域众所周知的方法降低或消除编码本发明多肽的核苷酸序列的表达来构建突变体细胞,例如使用插入、破坏、替代或缺失。在一个优选的方面,将核苷酸序列失活。要修饰或失活的核苷酸序列可以是,例如,编码区或对活性而言必需的编码区部分,或编码区表达所需要的调控元件。这种调控或控制序列的实例可以是启动子序列或其功能部分,即足以影响所述核苷酸序列表达的部分。其它可供修饰的控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子、和转录激活因子。
核苷酸序列的修饰或失活可这样进行:使亲本细胞接受诱变,并选择所述核苷酸序列的表达已降低或消除的突变体细胞。所述诱变可以是特异的或随机的,可以通过,例如,使用适宜的物理或化学诱变剂、通过使用适宜的寡核苷酸、或者使DNA序列接受PCR产生的诱变来进行。此外,诱变可通过使用这些诱变剂的任意组合来进行。
适用于本发明的目的的物理或化学诱变剂的例子包括紫外(UV)辐射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、甲磺酸乙酯(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。
当使用这些诱变剂时,诱变通常是这样进行的:在合适的条件下,在优选的诱变剂存在下温育待诱变的亲代细胞,然后筛选和/或选择那些显示该基因表达降低或没有表达的突变体细胞。
核苷酸序列的修饰和失活可以通过在所述基因或其转录或翻译所需的调节元件中导入、取代或除去一个或多个核苷酸来实现。例如,可以通过插入或除去核苷酸来导入终止密码子、去除起始密码子或改变开放阅读框。这样的修饰或失活可以按照本领域已知的方法通过定点诱变或PCR产生的诱变来实现。尽管在理论上,修饰可以在体内,针对直接在表达将被修饰的核苷酸序列的细胞进行,仍优选在体外进行诱变,如以下面的例子所示。
对于消除或降低细胞对核苷酸序列的表达,适宜方式的一个例子是基于基因取代、基因缺失或基因破坏的技术。例如,在基因破坏方法中,在体外诱变与内源核苷酸序列相应的核酸序列而产生缺陷的核酸序列,然后把它转化到亲代细胞中产生缺陷的基因。通过同源重组,该缺陷的核酸序列取代内源的核苷酸序列。可能理想的是,该缺陷的核苷酸序列也编码一个标记,该标记可以用来选择所述核苷酸序列已经被修饰或者破坏的转化子。在一个特别优选的方面中,用可选择的标记,例如本文中描述的那些,来破坏所述核苷酸序列。
或者,可以使用与所述核苷酸序列互补的序列,通过已建立的反义或RNAi技术来进行所述核苷酸序列的修饰或失活。更具体地,可以通过导入与基因的核酸序列互补的序列,该序列在细胞中可被转录并能与细胞中产生的mRNA杂交,从而降低或消除细胞对于所述核苷酸序列的表达。在允许互补的反义核苷酸序列与mRNA杂交的条件下,翻译的蛋白质的量也被相应地减少或消除。
本发明进一步涉及亲本细胞的突变体细胞,其包含编码所述多肽的核苷酸序列或其调控序列的破坏或缺失,使得该突变体细胞产生比亲本细胞少的所述多肽或没有多肽产生。
这样构建的多肽缺陷的突变体细胞作为宿主细胞用于同源和/或异源多肽的表达特别有用。因此,本发明进一步涉及生产同源或异源多肽的方法,其包括(a)在有利于生产所述多肽的条件下培养突变体细胞;和(b)回收该多肽。术语“异源多肽”在本文中定义为:对宿主细胞而言非天然的多肽;被修饰而改变了其天然序列的天然蛋白质;或由于使用重组DNA技术操作宿主细胞而使其表达发生了量变的天然蛋白质。
在另一个方面,本发明涉及通过发酵同时产生本发明的多肽以及目的蛋白质产物二者的细胞,来生产实质上不含脂肪酶活性的蛋白质产物的方法,该方法通过在发酵之前、发酵过程中和发酵完成后向发酵物中添加有效量的能够抑制脂肪酶活性的剂,从发酵液中回收目标产物,和可选地对回收的产物进行进一步纯化。
在另一个方面,本发明涉及通过下列步骤来生产实质上不含脂肪酶活性的蛋白质产物的方法:在允许产物表达的条件下培养细胞,并使所得培养液接受pH和温度联合处理以显著地降低脂肪酶活性,并从培养液回收产物。或者,pH和温度联合处理可针对从培养液中回收的酶制备物进行。任选地,pH和温度联合处理可与脂肪酶抑制剂处理结合。
根据本发明的这个方面,可能消除至少60%、优选至少75%、更优选至少85%、更优选至少95%、且最优选至少99%的脂肪酶活性。通过使用这种方法可实现完全消除脂肪酶活性。
pH和温度联合处理优选在pH为2-4或9-11和温度为至少60-70℃进行足够的一段时间以达到预期的效果,其中典型地,30-60分钟已经足够了。
可使用本领域已知的方法进行培养和目的产物的纯化。
本发明用于生产实质上不含脂肪酶的产物的方法在真核多肽,特别是真菌蛋白质,诸如酶的生产中特别有意义。酶可选自,例如,淀粉分解酶(amylolytic enzyme)、脂肪分解酶(lipolytic enzyme)、蛋白水解酶(proteolytic enzyme)、纤维素分解酶(cellulytic enzyme)、氧化还原酶、或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡萄糖氧化酶、葡萄糖苷酶、卤代过氧化物酶(haloperoxidase)、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶、或木聚糖酶。脂肪酶缺陷的细胞还可用于表达具有药学价值的异源蛋白质,诸如激素、生长因子、受体等等。
应当理解,术语“真核多肽”不但包括天然的多肽,还包括那些多肽,例如酶,它们被通过氨基酸取代、缺失或添加或其他所述修饰以增加活性、热稳定性、pH耐受性等等。
在另一个方面,本发明还涉及实质上不含有本发明的脂肪酶活性的蛋白质产物,其由本发明的方法所生产。
组合物
本发明还涉及包含本发明多肽的组合物。优选地,所述组合物富集了该多肽。术语“富集”表示该组合物的脂肪酶活性已经被增加,例如以至少为1.1的富集因子(enrichment factor)增加。
所述组合物可包含本发明的多肽作为主要酶组分,例如单一组分组合物。或者,该组合物可以含有多种酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡萄糖淀粉酶、α-葡萄糖苷酶、β-葡萄糖苷酶、卤代过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。更多的酶可由,例如,属于下列属的微生物产生:曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、Fusarium sulphureum、Fusariumtorulosum、Fusarium trichothecioides或Fusarium venenatum;腐质霉属,优选Humicola insolens或Humicola lanuginosa;或木霉属,优选哈茨木霉、康宁木霉、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉。
所述多肽组合物可以根据本领域已知的方法制备,并可以呈液体或干组合物的形式。例如,该多肽组合物可以是颗粒或者微粒(microgranulate)的形式。可以用本领域已知的方法稳定化组合物中要包含的多肽。
下文给出了本发明的多肽组合物的优选用途的例子。本发明多肽组合物的剂量和使用该组合物的其它条件可根据本领域已知的方法来确定。
用途
本发明还涉及具有脂肪酶活性的多肽或其组合物的使用方法。
脱胶中的用途
本发明的多肽可用于对碳水化合物水溶液或浆液脱胶,以改善其滤过性,特别是对于淀粉水解产物,尤其是难于滤过和产生云雾状(cloudy)滤出液的小麦淀粉水解产物。该处理可以使用本领域中熟知的方法。例如,EP 219,269、EP 808,903和US 6,103,505。
在烘焙中的用途
本发明的多肽可根据US 6,558,715用于烘焙。
在去污剂中的用途
本发明的多肽可被添加而形成去污剂组合物的组分。
可以将本发明的去污剂组合物配制成,例如,手洗或机洗去污剂组合物,包括适用于预处理污染织物的洗衣添加剂组合物和漂洗时添加(rinseadded)的织物柔软剂组合物,或配制成用于普通家庭硬表面清洗操作的去污剂组合物,或配制成用于手洗或机洗洗碗碟操作的去污剂组合物。
在一个具体的方面,本发明提供了包含如本文所述的本发明的具有脂肪酶活性多肽的去污剂添加剂。所述去污剂添加剂和去污剂组合物中可包含一种或多种酶,诸如蛋白酶、脂肪酶、角质酶、淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶(如漆酶)、和/或过氧化物酶。
通常,所选酶的性质应该与所选去污剂相容(即最佳pH、与其它酶和非酶组分的相容性等等),并且所述酶应该以有效量存在。
纤维素酶:适宜的纤维素酶包括细菌或真菌来源的那些。包括经化学修饰的或蛋白质工程改造的突变体。适宜的纤维素酶包括来自下列属的纤维素酶:芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢属,例如在US 4,435,307、US 5,648,263、US 5,691,178、US 5,776,757、和WO 89/09259中公开的由Humicola insolens、Myceliophthora thermophila、和尖镰孢产生的真菌纤维素酶。
尤其适宜的纤维素酶是有护色效益的碱性或中性纤维素酶。这些纤维素酶的实例有EP 0,495,257、EP 0,531,372、WO 96/11262、WO 96/29397、WO 98/08940中描述的纤维素酶。其它实例有诸如在WO 94/07998、EP0,531,315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO98/12307、和PCT/DK98/00299中描述的纤维素酶变体。
市场上可购买到的纤维素酶包括CelluzymeTM和CarezymeTM(Novozymes A/S)、ClazinaseTM和Puradax HATM(Genencor InternationalInc.)、及KAC-500(B)TM(Kao Corporation)。
蛋白酶:适宜的蛋白酶包括那些动物、植物或微生物来源的。优选微生物来源的。包括经化学修饰或蛋白质工程改造的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的实例有枯草杆菌蛋白酶,尤其是来源于芽孢杆菌属的那些枯草杆菌蛋白酶,例如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147、和枯草杆菌蛋白酶168(描述在WO 89/06279中)。胰蛋白酶样蛋白酶的实例有胰蛋白酶(例如源于猪或牛的)和镰孢属蛋白酶(描述于WO 89/06270和WO 94/25583中)。
有用的蛋白酶的实例有WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中所描述的变体,尤其是在一个或多个如下位置发生取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
优选的市场上可买到的蛋白酶包括AlcalaseTM、SavinaseTM、PrimaseTM、DuralaseTM、EsperaseTM和KannaseTM(Novozymes A/S)、MaxataseTM、MaxacalTM、MaxapemTM、ProperaseTM、PurafectTM、Purafect OxPTM、FN2TM和FN3TM(Genencor International Inc.)。
脂肪酶:适宜的脂肪酶包括细菌或真菌来源的那些。包括经化学修饰的或经蛋白质工程改造的突变体。有用的脂肪酶的实例包括来自腐质霉属(同义词嗜热霉属)的脂肪酶,例如EP 258068和EP 305216中所描述的来自细毛嗜热霉或来自WO 96/13580中所描述的Humicola insolens的脂肪酶;假单胞菌属脂肪酶,例如来自产碱假单胞菌(P.alkaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP 218 272)、葱头假单胞菌(P.cepacia)(EP331 376)、施氏假单胞菌(P.stutzeri)(GB 1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌菌株SD 705(WO 95/06720和WO 96/27002)、P.wisconsinensis(WO 96/12012);芽孢杆菌脂肪酶,例如枯草芽孢杆菌(Dartois等人,1993,Biochemica et Biophysics Acta,1131,253-360)、嗜热脂肪芽孢杆菌(JP 64/744992)、或短小芽孢杆菌(WO 91/16422)。
其它实例有诸如在WO 92/05249、WO 94/01541、EP 407225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO95/14783、WO 95/22615、WO 97/04079、和WO 97/07202中所描述的脂肪酶变体。
优选的市场上可买到的脂肪酶包括LipolaseTM、Lipolase UltraTM和LipexTM(Novozymes A/S)。
淀粉酶:适宜的淀粉酶(α和/或β)包括细菌或真菌来源的淀粉酶。包括经化学修饰的或蛋白质工程改造的突变体。淀粉酶包括例如得自芽孢杆菌属例如地衣芽孢杆菌特定菌株的α-淀粉酶,详细说明描述在GB 1,296,839中。
有用的淀粉酶的实例是在WO 94/02597、WO 94/18314、WO 96/23873和WO 97/43424中所描述的变体,尤其是在一个或多个如下位置发生取代的变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
市场上可买到的淀粉酶有DuramylTM、TermamylTM、FungamylTM和BANTM(Novozymes A/S)、RapidaseTM和PurastarTM(Genencor InternationalInc.)。
过氧化物酶/氧化酶:适宜的过氧化物酶/氧化酶包括源自植物、细菌、或真菌的那些酶。包括经化学修饰或蛋白质工程改造的突变体。有用的过氧化物酶的实例包括例如来源于鬼伞属如灰盖鬼伞的过氧化物酶及其变体,如在WO 93/24618、WO 95/10602、和WO 98/15257中所描述的那些。
市场上可买到的过氧化物酶包括GuardzymeTM(Novozymes A/S)。
去污剂酶可通过添加含一种或多种酶的多个单独的添加剂或包含所有这些酶的组合添加剂而包含在去污剂组合物中。本发明的去污剂添加剂,即单独的添加剂或组合添加剂,可配制成例如颗粒、液体、浆体等形式。优选的去污剂添加剂制剂为颗粒剂,特别是非粉化(non-dusting)的颗粒;液体,特别是稳定化液体;或浆液。
非粉化颗粒例如可如在US 4,106,991和4,661,452中所公开的方式制备,并可任选使用本领域已知的方法进行包衣。蜡质包衣材料的实例有平均摩尔质量为1000-20000的聚(环氧乙烷)产物(聚乙二醇,PEG);具有16-50个环氧乙烷单元的乙氧基化壬基酚;具有15-80个环氧乙烷单元的乙氧基化脂肪醇,其中醇含12-20个碳原子;脂肪醇;脂肪酸;以及脂肪酸的单-、双-和三甘油酯。GB 1483591中给出了适于通过流化床技术施加的成膜包衣材料的实例。例如,液体酶制备物可根据已建立的方法通过加入多元醇诸如丙二醇、糖或糖醇、乳酸或硼酸来稳定。受保护的酶可根据EP 238,216中所公开的方法制备。
本发明的去污剂组合物可采用任一种适宜的形式,例如条(bar)、片(tablet)、粉末(powder)、颗粒(granule)、膏(paste)、或液体。液体去污剂可以是水性的,通常可含达70%的水和0-30%的有机溶剂,或者是非水性的。
去污剂组合物包含一种或多种表面活性剂,它们可以是非离子性,包括半极性,和/或阴离子性和/或阳离子性和/或两性离子性。表面活性剂的水平一般为以重量计0.1%-60%。
当其中包含阴离子表面活性剂时,它通常含有大约1%到大约40%的阴离子表面活性剂,诸如线性烷基苯磺酸盐(酯)、α-烯烃磺酸盐(酯)(alpha-olefinsulfonate)、烷基硫酸盐(酯)(脂肪醇硫酸盐(酯))、脂肪醇乙氧基硫酸盐(酯)(alcohol ethoxysulfae)、次级烷基磺酸盐(酯)、α-磺基脂肪酸甲酯、烷基-或烯基琥珀酸、或皂。
当其中包含非离子型表面活性剂时,它通常含有大约0.2%到大约40%的非离子型表面活性剂,诸如脂肪醇乙氧基化物(alcohol ethoxylate)、壬基苯酚乙氧基化物(nonylphenol ethoxylate)、烷基多苷(alkylpolyglycoside)、烷基二甲基胺氧化物(alkyldimethylamineoxide)、乙氧基化脂肪酸单乙醇胺(ethoxylated fatty acid monoethanolamide)、脂肪酸单乙醇胺(fatty acidmonoethanolamide)、多羟基烷基脂肪酸酰胺(polyhydroxy alkyl fatty acidamide)、或葡糖胺的N-酰基N-烷基衍生物(“葡糖酰胺”(“glucamides”))。
去污剂可包含0-65%的去污剂增效助剂(detergent builder)或络合剂,诸如沸石、二磷酸盐(酯)、三磷酸盐(酯)、膦酸盐(酯)、碳酸盐(酯)、柠檬酸盐(酯)、氨三乙酸、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶性硅酸盐、或层状硅酸盐(layered silicates)(例如购自Hoechst的SKS-6)。
去污剂可包含一种或多种聚合物。实例有羧甲基纤维素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯咪唑)、聚羧酸酯诸如聚丙烯酸酯、马来酸/丙烯酸共聚物,和甲基丙烯酸月桂酯/丙烯酸共聚物。
去污剂可含有漂白系统,该系统可包含H2O2源,诸如过硼酸盐或过碳酸盐,H2O2源可与形成过酸的漂白活化剂,诸如四乙酰基乙二胺或壬酰氧基苯磺酸酯(盐)(nonanoyloxybenzenesulfonate)相组合。或者,漂白系统可包含过氧酸,例如酰胺、酰亚胺、或砜型的过氧酸。
可使用常规稳定剂稳定本发明去污剂组合物的酶,常规稳定剂的例子有:多元醇,诸如丙二醇或丙三醇;糖或糖醇;乳酸;硼酸,或硼酸衍生物,例如芳香族硼酸酯,或苯基硼酸衍生物诸如4-甲酰苯基硼酸;且所述的组合物可如WO 92/19709和WO 92/19708中所描述的方式来配制。
去污剂还可含有其它的常规去污剂成分,诸如织物调理剂(fabricconditioners)包括粘土、杀菌剂、光漂白剂、水溶助长剂(hydrotropes)、晦暗抑制剂或芳香剂。
在去污剂组合物中,任何酶都可以相当于每升洗涤液0.01-100mg酶蛋白质的量加入,优选每升洗涤液0.05-5mg酶蛋白质,特别是每升洗涤液0.1-1mg酶蛋白质。
在去污剂组合物中,本发明的多肽可以相当于每升洗涤液0.001-100mg蛋白质、优选0.005-50mg蛋白质、更优选0.01-25mg蛋白质、甚至更优选0.05-10mg蛋白质、最优选0.05-5mg蛋白质、且甚至最优选0.01-1mg蛋白质的量加入。
还可将本发明的多肽掺入如WO 97/07202所公开的去污剂制剂中,本文并入所述文献作为参考。
信号肽
本发明还涉及包含编码蛋白质的基因且该基因与如下核苷酸序列可操作连接的核酸构建体,所述核苷酸序列包含下述核苷酸或由下述核苷酸组成:SEQ ID NO:1第1至60位核苷酸,SEQ ID NO:3第1至72位核苷酸,SEQ ID NO:5第1至60位核苷酸,SEQ ID NO:7第1至54位核苷酸或SEQID NO:9第1至63位核苷酸,且所述核苷酸序列分别编码包含下述氨基酸或由下述氨基酸组成的信号肽:SEQ ID NO:2第1至20位氨基酸,SEQ IDNO:4第1至24位氨基酸,SEQ ID NO:6第1至20位氨基酸,SEQ ID NO:8第1至18位氨基酸或SEQ ID NO:10第1至21位氨基酸,其中所述基因对于所述核酸序列而言是外来的。
本发明还涉及包含这种核酸构建体的重组表达载体和重组宿主细胞。
本发明还涉及生产蛋白质的方法,包括(a)在适合于产生所述蛋白质的条件下培养所述重组宿主细胞;并(b)回收所述蛋白质。
对宿主细胞而言,所述蛋白质可以是天然的或异源的。术语“蛋白质”在本文中不意图指规定长度的编码产物,因此涵盖肽、寡肽、和蛋白质。术语“蛋白质”还涵盖组合形成编码产物的两种或多种多肽。蛋白质还包括杂合多肽,它包括获自至少两种不同蛋白质的部分或完整多肽序列的组合,其中所述一种或多种对宿主细胞可以是异源的或天然的。蛋白质还进一步包括上述蛋白质和杂合蛋白的天然存在的等位变异和工程化(engineered)变异。
优选的是,蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分、或报道分子。在一个更优选的方面,蛋白质是氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在一个甚至更优选的方面,蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、其他脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
所述基因可从任何原核的、真核的、或其它来源获得。
本发明可通过下列实施例进一步说明,这些实施例不应视为对本发明范围的限制。
实施例
材料
用作缓冲液和底物的化学品是至少为试剂级的商品。
菌株
烟曲霉PaHa34,禾本科镰孢NRRL 31084,Magnaporthe grisea FGSC8958(Fungal Genetics Stock Center),和构巢曲霉FGSC 2489(FungalGenetics Stock Center)被用作脂肪酶基因的来源。
培养基
SOC培养基的组成是每升20g胰蛋白胨、5g酵母提取物、2ml的5M NaCl和2.5ml的1M KCl。
NZY+培养基的组成是每升10g NZ胺(NZ amine)、5g酵母提取物、5g NaCl、12.5mM MgCl2、12.5mM MgSO4和10ml的2M葡萄糖。
LB培养基的组成是每升10g胰蛋白胨、5g酵母提取物和5g NaCl。
MY25培养基的组成是每升25g麦芽糖糊精、2g MgSO4·7H2O、10gKH2PO4、2g柠檬酸、2g K2SO4、2g尿素、10g酵母提取物、1.5ml AMG痕量金属溶液,并调节到pH 6。
AMG痕量金属溶液的组成是每升14.3g ZnSO4·7H2O、2.5gCuSO4·5H2O、0.5g NiCl2·6H2O、13.8g FeSO4·7H2O、8.5g MnSO4·H2O和3g柠檬酸。
COVE选择平板的组成是每升342.3g蔗糖、20ml COVE盐溶液、10mM乙酰胺、15mM CsCl2和25g纯净琼脂。
COVE盐溶液的组成是每升26g KCl、26g MgSO4·7H2O、76g KH2PO4和50ml COVE痕量金属溶液。
COVE痕量金属溶液的组成是每升0.04g NaB4O7·10H20、0.4gCuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O。
2X YT平板的组成是每升16g胰蛋白胨、10g酵母提取物、5g NaCl和15g细菌培养用琼脂(Bacto agar)。
M400培养基的组成是每升50g麦芽糖糊精、2g MgSO4·7H2O、2gKH2PO4,、4g柠檬酸、8g酵母提取物、2g尿素、0.5g CaCl2和0.5ml AMG痕量金属溶液。
AMG痕量金属溶液的组成是每升14.3g ZnSO4·7H2O、2.5gCuSO4·5H2O、0.5g NiCl2·6H2O、13.8g FeSO4·7H2O、8.5g MnSO4·H2O和3g柠檬酸。
NZY+培养基的组成是每升10g NZ胺、5g酵母提取物、5g NaCl、12.5mMMgCl2、12.5mM MgSO4和10ml的2M葡萄糖。
RA孢子形成培养基的组成是每升1g葡萄糖、50g琥珀酸、12.1g NaNO3和20ml 50X Vogel’s盐(无C,无N)。
50X Vogel’s盐(无C,无N)的组成是每升250g KH2PO4、10gMgSO4.7H2O、5g CaCl2.2H2O、2.5ml生物素溶液和5ml Vogel’s痕量元素。
50X Vogel’s痕量元素溶液的组成是每升50g柠檬酸、50g ZnSO4·7H2O、10g Fe(NH4)2(SO4)2·6H2O、2.5g CuSO4·5H2O、0.5g MnSO4·H2O、0.5g H3BO3和0.5g Na2MoO4·2H2O。
YPG培养基的组成是每升1%酵母提取物、2%细菌用蛋白胨(bactopeptone)和5%葡萄糖。
Vogel’s NO3再生低熔点培养基的组成是每升20ml含25mM NaNO3的50X Vogel’s溶液储备液、0.8M蔗糖和1.5%低熔点琼脂糖(Sigma ChemicalCompany,St.Louis,MO)。当培养基添加BASTATM时,BASTATM从AgrEvo(Hoechst Schering,Rodovre,Denmark)获得,且在使用前用苯酚∶氯仿∶异戊醇(25∶24∶1)抽提两次,再用氯仿∶异戊醇(24∶1)抽提一次。
含25mM NaNO3的50X Vogel’s溶液储备液的组成是每升125g柠檬酸钠、250g KH2PO4、106.25g NaNO3、10g MgSO4.7H2O、5g CaCl2.2H2O、2.5g生物素溶液和5ml Vogels痕量元素溶液。
生物素储备溶液的组成是在100ml 50%的乙醇中有5mg生物素。
200X AMG痕量金属溶液的组成是每升3g柠檬酸、14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、13.8g FeSO4·7H2O和8.5g MnSO4·H2O。
STC的组成是0.8M山梨糖醇、50mM CaCl2和25mM Tris-Cl,pH 8。
SPTC的组成是0.8M山梨糖醇、25mM Tris-HCl,pH 8、50mM CaCl2和40%聚乙二醇4000。
CM培养基的组成是每升6g酵母提取物、6g酪蛋白酸水解产物(caseinacid hydrolysate)和10g蔗糖。
实施例1:烟曲霉的部分基因组序列中脂肪酶基因的鉴定
使用来自白地霉(Geotrichum candidum)(SWALL P17577)的脂肪酶序列作为查询,对烟曲霉部分基因组序列(The Institute for Genomic Research,Rockville,MD)进行tfasty搜索(Pearson,W.R.,1999,《BioinformaticsMethods and Protocols》,S.Misener和S.A.Krawetz编,pp.185-219)。基于氨基酸水平上与查询序列的高度相似性,数个基因被鉴定为推定脂肪酶。选择与查询序列在氨基酸水平上有超过39%的同一性的1562bp左右的基因组区域作进一步的研究。基于与白地霉脂肪酶的同源性和真菌内含子5’和3’端存在的保守序列,预测了该推定脂肪酶基因的基因模型。
实施例2:烟曲霉基因组DNA的提取
在带挡板的摇瓶中的250ml的马铃薯葡萄糖培养基中,37℃和240rpm的条件下培养烟曲霉。过滤收获菌丝体,用10mM Tris-1mM EDTA(TE)洗涤两次并在液氮下冷冻。用研钵和杵将冷冻的菌丝体研磨成细粉末,将其重悬浮于含10mM Tris,100mM EDTA,1% Triton X-100,0.5M胍-HCl和200mM NaCl的pH 8.0的缓冲液中。加入不含DNA酶的RNA酶A(DNase-free RNase A)至浓度为20mg/l,并将该裂解物在37℃温育30分钟。通过离心去除细胞碎片,用QIAGEN Maxi 500柱(QIAGEN Inc.,Valencia,CA)分离DNA。将该柱在10ml QBT中平衡,以30ml QC清洗,并以15ml QF(所有缓冲液来自QIAGEN Inc.,Valencia,CA)洗脱。在异丙醇中沉淀DNA,以70%乙醇洗涤,通过离心回收。将该DNA重悬在TE缓冲液中。
实施例3:烟曲霉脂肪酶基因的克隆
基于预测的开放阅读框的起始和终止密码子设计下面所示的两个合成寡核苷酸引物,以从实施例2制备的基因组DNA中PCR扩增出编码脂肪酶的烟曲霉基因。
正向引物:
5’-ACACAACTGGCCATGCATCTCCTCCGGGTTGTTCTG-3’(SEQID NO:11)
反向引物:
5’-AGTCACCTCTAGTTAATTAACTAGATATGGAACGAATCCA-3’(SEQ ID NO:12)
粗体字母代表编码序列。其余的序列与pBM120的插入位点(见实施例6)同源。
使用Expand高保真PCR系统(Expand High Fidelity PCR System)(RocheDiagnostics,Mannheim,Germany)通过PCR扩增了目标片段。PCR反应物中使用1μM的上述每种引物,该反应物在50μl的最终体积中含有200ng烟曲霉基因组DNA、含1.5mM MgCl2的1X PCR缓冲液(Roche Diagnostics,Mannheim,Germany)、1μl的dNTP混合液(每种10mM)和0.75μl的DNA聚合酶混合物(3.5U/μl;Roche Diagnostics,Mannheim,Germany)。为扩增片段,将Eppendorf Mastercycler热循环仪(Hamburg,Germany)编程为:1个循环,94℃ 2分钟;10个循环,每个为94℃ 15秒、61℃ 30秒以及72℃ 1.25分钟;15个循环,每个为94℃ 15秒、61℃ 30秒以及72℃ 1.25分钟,且每循环顺次延长5秒;1个循环,72℃ 7分钟,以及保持在10℃。
使用44mM Tris Base、44mM硼酸和0.5mM EDTA(TBE)的缓冲液在0.7%琼脂糖凝胶上显现反应产物,并使用QIAquick PCR纯化试剂盒(QIAGEN Inc.,Valencia,CA)根据制造商的说明对1.7kb的产物条带进行纯化。使用制造商指定的条件将PCR片段和pCR2.1-TOPO(Invitrogen,Carlsbad,CA)进行连接,由此产生质粒pJLin173(图1)。
根据制造商的说明,用2μl的反应物转化大肠杆菌TOP10 One Shot感受态细胞(Invitrogen,Carlsbad,CA)。将2μl体积的连接混合物加入至大肠杆菌细胞,并在冰上保温5分钟。随后,在42℃热激细胞30秒,然后将其放于冰上2分钟。将250μl体积的SOC培养基加入细胞,并将混合物在37℃、250rpm条件下温育1小时。温育后,将菌落涂布到添加了100μg/ml氨苄青霉素的2X YT平板上,并在37℃下过夜温育以选择质粒。用无菌牙签挑出生长在平板上的12个菌落,且在37℃、250rpm条件下,在含添加了100μg/ml氨苄青霉素的3ml LB培养基的15ml Falcon试管内生长过夜。通过限制消化检测出含pJLin173的大肠杆菌转化体,并使用BioRobot 9600(QIAGEN Inc.,Valencia,CA)制备质粒DNA。
含质粒pJLin173的大肠杆菌TOP10 One Shot细胞保藏于农业研究机构专利培养物保藏中心,北方区域研究中心(Agricultural Research ServicePatent Culture Collection,Northern Regional Research Center,1815 UniversityStreet,Peoria,Illinois,61604),保藏编号NRRL B-30782,保藏日期2004年10月12日。
实施例4:编码脂肪酶的烟曲霉基因组序列的定性
使用Applied Biosystems 377 XL型DNA测序仪(Perkin-Elmer/AppliedBiosystems,Inc.,Foster City,CA),利用染料终止化学法(Dye-termitnatorchemistry)(Giesecke等1992,Journal of Virology Methods 38:47-60)和引物步移策略,对来自pJLin173的烟曲霉脂肪酶基因进行DNA测序。借助PHRED/PHRAP软件(University of Washington,Seattle,WA)检查核苷酸序列数据的质量且对所有序列进行互相比较。
基于与白地霉脂肪酶的同源性以及和真菌内含子的5’和3’端出现的保守序列,预测了脂肪酶基因的基因模型。使用具有迭代细化(iterativerefinement)和缺省参数的MAFFT方法(Katoh等,2002,Nucleic AcidsResearch 30:3059)对氨基酸序列进行比较性比对(comparative alignment)。核苷酸序列(SEQ ID NO:1)和推导的氨基酸序列(SEQ ID NO:2)示于图2A和2B。基因组片段编码562个氨基酸的多肽。该基因的G+C的百分含量是59.7%,而成熟蛋白编码区(SEQ ID NO:1的第61至1686位核苷酸)的G+C的百分含量是59.6%。利用SignalP软件程序(Nielsen等人,1997,ProteinEngineering 10:1-6),预测了一种20个氨基酸残基的信号肽。预测的成熟蛋白质含有542个氨基酸,其分子量是58.7kDa。
利用Clustal W方法(Higgins,1989,CABIOS 5:151-153),使用LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)对脂肪酶序列进行比较性比对,其中使用同一性表和下列多个比对参数:缺口罚分(gap penalty)为10,缺口长度罚分(gap length penalty)为10。成对比对(pairwise alignment)参数为:Ktuple=1,缺口罚分=3,窗口数(windows)=5和对角线数(diagonals)=5。所述比对显示,烟曲霉脂肪酶基因的推导氨基酸序列与白地霉脂肪酶基因(SWALL P17573)的推导氨基酸序列有35%的同一性。
实施例5:pAILo1表达载体的构建
表达载体pAILo1是通过修饰pBANe6(美国专利6,461,837)而构建的,pBANe6包含黑曲霉中性α淀粉酶基因的启动子与米曲霉丙糖磷酸异构酶基因的启动子的杂合体(NA2-tpi启动子)、黑曲霉淀粉葡糖苷酶终止子序列(AMG终止子)和构巢曲霉乙酰胺酶基因(amdS)。pBANe6的修饰是如下进行的:首先通过定点诱变从amdS选择标记除去位于2051、2722、和3397bp处的三个NcoI限制位点。所有改变都被设计为“沉默的”,使得amdS基因产物的实际蛋白质序列不改变。所述三个位点的清除是利用GeneEditor定点诱变试剂盒(Promega,Madison,WI)根据制造商的说明使用下面的引物(标有下划线的核苷酸代表改变的碱基)同时进行的:
AMDS3NcoMut(2050):
5’-GTGCCCCATGATACGCCTCCGG-3’(SEQ ID NO:13)AMDS2NcoMut(2721):
5’-GAGTCGTATTTCCAAGGCTCCTGACC-3’(SEQ ID NO:14)AMDS1NcoMut(3396):
5’-GGAGGCCATGAAGTGGACCAACGG-3’(SEQ ID NO:15)
然后利用QuickChange诱变试剂盒(Stratagene,La Jolla,CA)对包含所有三种期望的序列改变的质粒进行定点诱变,以消除第1643位处AMG终止子末端的NcoI限制位点。诱变使用下列引物(标有下划线的核苷酸代表改变的碱基):
用于诱变AMG终止子序列的上游引物:
5’-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3’(SEQ ID NO:16)
用于诱变AMG终止子序列的下游引物:
5’-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3’(SEQ ID NO:17)
修饰pBANe6的最后一步是利用QuickChange诱变试剂盒和下列引物(标有下划线的核苷酸代表改变的碱基)在多接头开始处插入新的NcoI限制位点,从而产生pAILo1(图3)。
用于诱变NA2-tpi启动子的上游引物:
5’-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3’(SEQ ID NO:18)
用于诱变NA2-tpi启动子的下游引物:
5’-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3’(SEQ ID NO:19)
实施例6:pBM120a表达载体的构建
构建质粒pBM120a以得到含有如下成分的质粒:用于在曲霉属物种中驱动基因表达的双NA2启动子(NA2-NA2-tpi);以及用于在大肠杆菌中选择的氨苄青霉素抗性基因。
设计引物以从pJaL721(WO 03/008575)PCR扩增双NA2启动子。添加限制性酶位点Sal I和Nco I(标有下划线的)用于将所述双启动子克隆至曲霉表达质粒pAlLo1中。
5’-GTCGACATGGTGTTTTGATCATTTTA-3’(SEQ ID NO:20)
5’-CCATGGCCAGTTGTGTATATAGAGGA-3’(SEQ ID NO:21)
使用Expand高保真PCR系统,对目标片段进行PCR扩增。PCR扩增反应混合物包含有1μl 0.09μg/μl的pJaL721、1μl的每种引物(50pmol/μl)、5μl的含15mM MgCl2的10X PCR缓冲液、1μl的dATP、dTTP、dGTP和dCTP混合物(每种10mM)、37.25μl的水和0.75μl的DNA聚合酶混合物(3.5U/μl)。为扩增片段,对Eppendorf Mastercycler热循环仪如下编程:1个循环,94℃2分钟;10个循环,每个为94℃ 15秒、55℃ 30秒以及72℃ 1.25分钟;15个循环,每个为94℃ 15秒、55℃ 30秒、72℃ 1.25分钟以及每循环顺次加5秒的延长;1个循环,72℃ 7分钟;以及在10℃保持。将10微升的该PCR反应物与1μl的10X DNA上样染色液(loading dye)(25%甘油,10mM TrispH 7.0,10mM EDTA,0.025%溴酚蓝和0.025%二甲苯蓝)相混合,并使用TBE缓冲液在1.0%(w/v)的琼脂糖凝胶上泳动。在Nucleotech凝胶显现系统(gel visualization system)(Nucleotech,San Mateo,CA)上使用紫外光发现了1128bp的PCR产物。根据制造商的说明,将PCR产物直接连接于pPC2.1-TOPO中。用移液器将1μl体积新鲜的PCR产物、3μl的重蒸馏水和1μl的TOPO克隆载体混合,并在室温孵育5分钟。
孵育后,用2μl的混合物转化OneShot感受态大肠杆菌细胞。将2μl体积的连接混合物加入该大肠杆菌细胞,并在冰上孵育5分钟。随后,将细胞在42℃热激30秒,然后放于冰上2分钟。将250μl体积的SOC培养基加入细胞,并在37℃、250rpm条件下孵育该混合物1小时。孵育后,将菌落涂布在添加了100μg/ml氨苄青霉素的2X YT平板上,并在37℃条件下过夜孵育以选择质粒。用无菌牙签挑出平板上长出的8个菌落,且在37℃、250rpm条件下,在15ml Falcon试管内培育过夜,所述试管包含添加了100μg/ml氨苄青霉素的3ml LB培养基。使用QIAGEN BioRobot 9600分离该质粒。
用Eco RI消化4μl体积的所得质粒小量制备产物(minipreps)。如前面对PCR反应物所述那样,用琼脂糖凝胶色谱和紫外分析来分析该消化反应物。对含插入片段的分离质粒测序,测序使用1μl质粒模板、1.6ng的M13引物(正向或反向)(MWG Biotech;High Point;NC),加水至6μl。用AppliedBiosystems377XL型测序仪(Applied Biosystems,Inc.,Foster City,CA)利用染料终止化学法对该DNA测序。所得质粒命名为pBM121b(图4)。
用Sal I和Nco I消化5μl体积的pBM121b。如上所述用琼脂糖凝胶电泳分析该消化反应物,并将其连接到与先已用Sal I和Nco I消化的载体pAlLo1上。所得表达质粒命名为pBM120a(图5)。
实施例7:表达烟曲霉脂肪酶基因的米曲霉表达载体的构建
使用InFusion克隆试剂盒(BD Biosciences,Palo Alto,CA),将含烟曲霉脂肪酶基因的1.7kb PCR片段(实施例3)克隆入pBM120a,其中该载体被Nco I和Pac I消化。使用TBE缓冲液和0.7%琼脂糖凝胶通过凝胶电泳纯化经消化的载体,使用QIAquick凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA)提取PCR片段并使用QIAquick PCR纯化试剂盒将其纯化。基因片段和消化载体在反应中被连接在一起,由此产生了表达质粒pJLin172(图6)。连接反应物(50μl)由1X InFusion缓冲液(BD Biosciences,Palo Alto,CA),1XBSA(BD Biosciences,Palo Alto,CA),1μl的Infusion酶(1∶10稀释)(BDBiosciences,Palo Alto,CA),100ng的被Nco I和Pac I消化的pBM120a,和50ng的烟曲霉脂肪酶基因纯化PCR产物组成。将反应物在室温下孵育30分钟。根据制造商的说明,将2μl的反应物用于转化大肠杆菌SoloPack Gold超感受态(super competent)细胞(Stratagene,La Jolla,CA)。向所述感受态细胞中加入1μl的β-巯基乙醇,且在冰上孵育10分钟。2μl的连接混合物被加入至大肠杆菌中且在冰上孵育30分钟。随后,将细胞在54℃热激60秒,再放于冰上2分钟。向细胞中加入150μl体积的42℃的NZY+培养基,并将该混合物在37℃、250rpm条件下孵育1小时。孵育后,将菌落涂布在添加了100μg/ml氨苄青霉素的2X YT平板上,并在37℃下过夜孵育以选择质粒。用无菌牙签挑出生长在平板上的12个菌落,且37℃、250rpm条件下,在含添加了100μg/ml氨苄青霉素的3ml LB培养基的15ml Falcon试管内培育过夜。通过限制消化检测出含质粒pJLin172的大肠杆菌转化体,并使用QIAGEN BioRobot 9600制备质粒DNA。
实施例8:烟曲霉脂肪酶基因在米曲霉BECh2中的表达
根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉BECh2(Δalp,Δamy,CPA-,KA-,Δnp1)的原生质体。用5μg的pJLin172转化米曲霉BECh2。
用pJLin172转化米曲霉BECh2,产生49个转化体。将转化体分离到单独的Cove板上。用4ml 0.01%吐温20洗涤35个转化体的铺满的Cove板。用200μl孢子悬浮液分别接种125ml塑料摇瓶中的25ml MY25培养基,并于34℃、250rpm进行孵育。孵育3和5天后,取出培养上清液进行脂肪酶测定和SDS-PAGE分析。
脂肪酶活性按下述步骤测定:将100μl的底物(3.92ml的100mM的MOPS pH7.5,4mM的CaCl2,990μl的DMSO,80μl的1%AOS,和20μl的丁酸对硝基苯酯)加入100μl稀释的样品中。将样品相应地稀释在100mMMOPS pH 7.5和4mM CaCl2中。在96孔微量滴定板中,使用Spectra MAX读板器(plate reader)(Molecular Devices,Sunnyvale,CA),在室温(25℃)监测405nm处的吸光度,监测3分钟。
脂肪酶分析结果显示,3和5天后,35个转化体中的34个产生了远高于未转化对照的脂肪酶活性。
用10μl上清液进行SDS-PAGE(BioRad Criterion 10-20% SDS-PAGE)分析,在大约59kDa处显示了一个主条带。
实施例9:重组烟曲霉脂肪酶底物特异性的测定
使用由4-硝基苯酚(PNP)脂肪酶底物组成的组筛选(panel screen),测定烟曲霉脂肪酶的底物特异性。
如表1所示,准备由一组使用多种4-硝基苯酚(PNP)脂肪酶底物的12个测定构成的组筛选。
表1  PNP底物和缓冲液条件下的组筛选
1mM带PNP标签的底物 简称   50mMMOPSpH7.0   50mMCHESpH9.5   50mMMOPSpH7.5 10mMCaCl2 TritonX-100 PNP换算因子
1   棕榈酸盐(或酯) 16:0 x x 1.2% 4.466
2   棕榈酸盐(或酯) 16:0 x x 1.2% 1.1
3   棕榈酸盐(或酯) 16:0 x x 1.2% 2.037
4   棕榈酸盐(或酯) 16:0 x x 0.2% 1.0
5   棕榈酸盐(或酯) 16:0 x x 0.2% 1.495
6   癸酸盐(或酯) 10:0 x x 1.2% 4.466
7   癸酸盐(或酯) 10:0 x x 1.2% 1.1
8   癸酸盐(或酯) 10:0 x x 1.2% 2.037
9   癸酸盐(或酯) 10:0 x x 0.2% 1.0
10   戊酸盐(或酯) 5:0 x x 0.40% 1.630
11   戊酸盐(或酯) 5:0 x x 0% 1.370
12   丁酸盐(或酯) 4:0 x x 0.40% 1.630
使用8个不同稀释度的每个待测样品(7μl)和80μl底物,在384孔板内进行所述测定。将这些测定物在环境温度下孵育达24小时。在约1、2、3、5和24小时的时间点读取测定物在405nm的读数。对每次单独测定以OD/小时计算结果。为了准确地评价释放的PNP量,有必要使用换算因子对原始OD值进行数学归一化。换算因子是针对PNP在低pH和去污剂(Triton X100)存在下的OD读数相对于pH9.5的条件下要低这一情况进行补偿所需要的、由经验确定的值。该因子将数据归一化为下述假设条件下获得的OD读数:假设能够将反应终止而产生每个条件下的最大OD,同时也在该时间点终止反应;即,PNP-脂肪酸底物在高pH时不稳定,在高pH时,标签在没有脂肪酶存在下脱去,而且在高于pH 9的条件下以及对于链长度较短的脂肪酸底物而言,带标签的底物特别不稳定。
表1的最上面2行(1和2)是用于比较pH比(9.5/7.0)的测定。行3和10是用于比较长链(Slu)/短链(Lu)的测定。
LIPEXTM,一种来自Novozymes A/S,
Figure A20058004397000661
Denmark的细毛嗜热霉脂肪酶,被用于比较。
组筛选的结果如表2所示。
表2
Figure A20058004397000662
Figure A20058004397000671
烟曲霉脂肪酶的数据以96孔板的规格生成,使用如表1所示的大约3倍的样品和底物体积。烟曲霉脂肪酶检测数据由2个测定结果的平均值组成;而LIPEXTM数据由最少80个测定结果的平均值组成。
将LIPEXTM和烟曲霉脂肪酶组筛选的结果相比较,得出下述结论:
1.烟曲霉脂肪酶在pH 9.5条件下与在pH 7条件下对PNP-棕榈酸盐(或酯)的活性的比值,比LIPEXTM的相应比值低6倍,提示烟曲霉脂肪酶在pH9.5的活性比LIPEXTM要低,或者说其在pH7的活性比LIPEXTM要高,或两者兼有。
2.烟曲霉脂肪酶的P/V,D/V和D/B比值也与LIPEXTM相当不同,提示这两种脂肪酶之间有某些酰基变化长度特异性的差别。
实施例10:重组烟曲霉脂肪酶的纯化和定性
将一个产生烟曲霉脂肪酶产率最高的米曲霉转化体(实施例8)在500ml的MY25培养基中30℃、250rpm培育4天,用于纯化。使用SEITZ-EKS过滤器(PALL Corporation,Waldstetten,Germany)对上清液加压无菌过滤。用蒸馏水稀释无菌过滤后的上清液,使得电导率为4mSi abd以下,然后将pH调节至7。
将Source QTM(Pharmacia Amersham,Uppsala,Sweden)装填到50ml柱中,并用50mM硼酸盐、pH 7的缓冲液清洗和平衡。然后用Akta Explorer系统(Pharmacia Amersham,Uppsala,Sweden)将过滤后的发酵上清液施加到柱上。用50mM硼酸盐、pH 9的缓冲液洗去未结合的物质。用含0.5M氯化钠的50mM硼酸盐、pH 9的缓冲液作为洗脱剂洗脱结合的蛋白质。梯度的总长度为大约20柱体积。
收集10ml的级分并按照Svendsen等,Methods in Enzymology,LipasesPart a Biotechnology 284卷317-340页,Byron Rubin和Edward A.Dennis编辑,Academic Press,1997,New York描述的测定法分析脂肪酶活性。使用Novex 4-20%Tris-甘氨酸凝胶(Invitrogen Life Technologies,Carlsbad.CA),用标准SDS-PAGE程序分析等份级分的纯度。将基于LU活性的最纯的级分合并,并用SDS-PAGE分析纯度。合并的级分通过SDS-PAGE测定的纯度为超过95%,其分子量大约为68kDa。
根据WO 2005/040410,在pH 7评定烟曲霉脂肪酶的底物特异性。结果显示烟曲霉脂肪酶高效地降解甘油三亚油酸酯(trilinolein)和亚油酸胆固醇酯(cholesterol linoleate),然而对磷脂如卵磷脂(和烷基化磷脂酰乙醇胺)的活性低很多。
实施例11重组烟曲霉脂肪酶的热稳定性的测定
用差示扫描量热法(Differential Scanning Calorimetry,DSC)测定纯化的重组烟曲霉脂肪酶(实施例10)的热稳定性。将以恒定的程序化加热速率加热酶溶液后得到的热分析图(Cp对T)中,变性峰顶端(主吸热峰)的顶端作为热变性温度,即Td。Cp指热容量(恒压下)。T指温度。
根据制造商的说明,用VP-DSC差示扫描量热计(Differential ScanningCalorimeter)(MicroCal Inc.,Northampton,MA)测定热稳定性。小心地将酶样品和参比溶液排气,然后立即将样品加载至热量计中(参比:无酶缓冲液)。将酶样品(大约1mg/ml)和参比溶液(大约0.5ml)在5℃热预平衡20分钟。以大约90K/hr的扫描速率,在5-95℃进行DSC扫描。测得的变性温度的大致准确度为+/-1℃。
表3所示结果表明,烟曲霉脂肪酶在50mM乙酸盐、pH5.0缓冲液中的热变性温度为60℃,在50mM HEPES、pH 7.0缓冲液中为54℃,在50mM甘氨酸、pH 10.0缓冲液中为44℃。
表3热稳定性测定
缓冲液             pH    Td(℃)
50mM乙酸盐         5.0   60
50mM HEPES         7.0   54
50mM甘氨酸         10.0  44
实施例12:禾本科镰孢部分基因组序列中的脂肪酶基因的测定
将从禾本科镰孢部分基因组序列(Broad Institute,MIT)推导的组装体1(assembly 1)蛋白质序列下载为Microsoft Word文件。搜索含有GESAG基序的序列,其中GESAG基序是白地霉脂肪酶(EMBL登录号U02622和U02541)及其同源物中活性位点丝氨酸残基周围的保守序列。发现多个含有GESAG基序的序列,将其中具有适当的大小且在邻近GESAG基序处具有其它保守残基的序列与白地霉脂肪酶和其同系物进行全长比对。发现长度为591个氨基酸的假定蛋白质FG01603.01是明显最匹配的。然而在相应的DNA被翻译时,发现℃端序列更有可能是GALVV,而不像FG01603.01中那样为GALVDTNG。
实施例13:禾本科镰孢基因组DNA提取
将禾本科镰孢在带挡板的摇瓶中的100ml的M400培养基中,24℃、200rpm的条件下培养。过滤收获菌丝体,在TE中洗涤两次并在液氮下冷冻。用研钵和杵将冷冻的菌丝体研磨成细粉末,并将其重悬浮于包含10mMTris,100mM EDTA,1% Triton X-100,0.5M胍-HCl及200mM NaCl的pH 8.0的缓冲液中。加入不含DNA酶的RNA酶A至浓度为20mg/l,并于37℃孵育该裂解产物30分钟。通过离心去除细胞碎片,使用QIAGEN Maxi 500柱分离DNA。该柱在10ml QBT中平衡,以30ml QC冲洗,以15ml QF洗脱。在异丙醇中沉淀DNA,以70%乙醇洗涤,通过离心回收。将所述DNA重悬在TE缓冲液中。
实施例14:禾本科镰孢脂肪酶基因的克隆
根据开放阅读框的预测的起始和终止密码子设计下列两个合成寡核苷酸引物,以从实施例13制备的基因组DNA中PCR扩增禾本科镰孢脂肪酶基因。
正向引物:
5’-CACTGCTATCACCAACATGAGATTCTCTGG-3’(SEQ ID NO:22)
反向引物:
5’-CCAACAAGGTATTTAATTAATCATACCACCAAAGC-3’(SEQ IDNO:23)
粗体字母代表编码序列。
使用Expand高保真PCR系统对目标片段进行PCR扩增。在PCR反应物中使用1μM的上述每种引物,该反应物在50μl的最终体积中含有200ng的pSMO232(实施例6)、含1.5mM MgCl2的1X PCR缓冲液、1μl的dNTP混合液(每种10mM)和0.75μl的DNA聚合酶混合物(3.5U/μl)。为扩增片段,将Eppendorf Mastercycler热循环仪编程为:1个循环,94℃2分钟;10个循环,每个为94℃ 15秒、60℃ 30秒以及72℃ 1.25分钟;15个循环,每个为94℃ 15秒、60℃ 30秒以及72℃ 1.25分钟,且每个循环顺次加5秒的延长;1个循环,72℃ 7分钟;以及在10℃保持。
使用TE缓冲液在0.8%琼脂糖凝胶上显现反应产物,并使用QIAquickPCR纯化试剂盒根据制造商的说明对1.8kb产物条带进行纯化。
使用制造商指定的条件将PCR片段和pCR2.1-TOPO载体连接以产生pSMO230(图7)。根据制造商的指示,用2μl的反应物转化大肠杆菌TOP10One Shot感受态细胞。将2μl体积的连接混合物加入至大肠杆菌细胞,并在冰上保温20分钟。随后,在42℃热激细胞30秒,然后将其放于冰上2分钟。将250μl体积的SOC培养基加入细胞,并将混合物在37℃、250rpm条件下温育1小时。温育后,将菌落涂布到添加了100μg/ml氨苄青霉素的2XYT平板上,并在37℃下过夜温育以选择质粒。用无菌牙签挑出生长在平板上的16个菌落,且在37℃、250rpm条件下,在含添加了100μg/ml氨苄青霉素的3ml LB培养基的15ml Falcon试管内生长过夜。通过限制消化检测出含有称为pSMO230的质粒的大肠杆菌转化体,并使用BioRobot 9600制备质粒DNA。
含有pSMO230的大肠杆菌TOP10 One Shot细胞保藏于农业研究机构专利培养物保藏中心,北方区域研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center,1815 University Street,Peoria,Illinois,61604),保藏编号NRRL B-30803,保藏日期2004年12月17日。
实施例15:编码脂肪酶的禾本科镰孢基因组序列的测定
使用Applied Biosystems 377 XL型DNA测序仪(Perkin-Elmer/AppliedBiosystems,Inc.,Foster City,CA),利用染料终止化学法(Giesecke等,同上)和引物步移策略,对来自pSMO230的禾本科镰孢脂肪酶基因进行DNA测序。借助PHRED/PHRAP软件(University of Washington,Seattle,WA)检查核苷酸序列数据的质量且对所有序列进行互相比较。
基于Tfasty输出和与来自白地霉的同源脂肪酶基因(SWALL P17577)的比对,构建所述序列的基因模型。使用具有迭代细化和缺省参数的MAFFT方法(Katoh等,2002,同上)对氨基酸序列进行比较性比对。核苷酸序列(SEQ ID NO:3)和推导的氨基酸序列(SEQ ID NO:4)示于图8A和8B。基因组片段编码588个氨基酸的多肽。该基因的G+C的百分含量是52.5%,而成熟蛋白编码区(第73至1764位核苷酸)的G+C的百分含量是52.4%。利用SignalP软件程序(Nielsen等人,1997,同上),预测了一种24个残基的信号肽。预测的成熟蛋白质含有564个氨基酸,其分子量是63kDa。
利用Clustal W方法(Higgins,1989,同上),使用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)对脂肪酶序列进行比较性比对,其中使用同一性表和下列多个比对参数:缺口罚分10;缺口长度罚分10。成对比对参数为:Ktuple=1,缺口罚分=3,窗口数=5和对角线数=5。所述比对显示,所述禾本科镰孢脂肪酶基因的推导氨基酸序列与白地霉脂肪酶基因(SWALL P17577)的推导氨基酸序列有23%的同一性。
实施例16:pEJG61的构建
Fusarium venenatum表达载体pEJG61是通过修饰pSheB1而生成的(美国专利No.6,090,604)。所述修饰包括:(a)通过定点诱变改变pSheB1中的单个Bsp LU11I位点;(b)用Fusarium venenatum葡糖淀粉酶启动子的2.1k碱基替换尖镰孢胰蛋白酶启动子的930bp,和(c)在Fusarium venenatum葡糖淀粉酶启动子之后引入Bsp LU11I位点。
根据制造商的说明,使用QuikChangeTM定点诱变试剂盒(QuikChangeTMSite-Directed Mutagenesis Kit)(Stratagene Cloning Systems,La Jolla,CA)实现pSheB1序列内Bsp LU11I位点的去除,使用下述一对诱变引物:
5′-GCAGGAAAGAACAAGTGAGCAAAAGGC-3′(SEQ ID NO:24)
5′-GCCTTTTGCTCACTTGTTCTTTCCTGC-3′(SEQ ID NO:25)
由此产生了pSheB1中间体1。
用Stu I和Pac I消化pSheB1中间体1(6,971bp)来去除尖镰孢胰蛋白酶启动子的930bp,将消化物在1%琼脂糖凝胶上、100伏特条件下,使用TBE缓冲液电泳1小时,切下6,040bp的载体片段,并用Qiaquick凝胶纯化试剂盒(QIAGEN Inc.,Valencia,CA)纯化该切下的片段。为了引入新BspLU11I位点,使用下述引物生成接头:
5′-dCCTACATGTTTAAT-3’(SEQ ID NO:26)
Bsp Lu11I
5′-dTAAACATGTAGG-3′(SEQ ID NO:27)
将每个引物(分别为2μg)加热至70℃10分钟,随后经过1小时冷却至室温。将该接头连接于Stu I-Pac I消化的pSheB1中间体1载体片段上,产生SheB1中间体2。
通过PCR从质粒pFMAG(WO 00/56900)分离位于葡糖淀粉酶编码区5’侧的一个2.1千碱基的Fusarium venenatum基因组DNA片段(葡糖淀粉酶启动子),其中质粒pFMAG含有编码整个Fusarium venenatum葡糖淀粉酶编码区的基因组DNA以及3,950bp的上游序列。用于PCR的引物如下:
5’-AGGCCTCACCCATCTCAACAC-3’(SEQ ID NO:28)
5’-ACATGTTGGTGATAGCAGTGA-3’(SEQ ID NO:29)
PCR反应物(50μl)由200ng的pFAMG、200μM的dNTPs、1μM的上述引物、1X反应缓冲液和2.6单位的Expand高保真酶混合物组成。使用MJ Research热循环仪(MJ Research,Inc.,Boston,MA)孵育该反应物,该热循环仪编程为:1个循环,94℃ 2分钟;10个循环,每个为94℃ 15秒、60℃30秒、以及72℃ 2分15秒;15个循环,每个为94℃ 15秒、60℃ 30秒以及72℃ 2分15秒,且每个循环依次加5秒的延长;和1个循环,72℃ 7分钟。
将PCR产物在1%琼脂糖凝胶上使用TBE缓冲液、100伏特电泳1小时,产生预期的2,108bp条带。自琼脂糖凝胶切下该2,108bp的PCR产物并用Qiaquick凝胶纯化试剂盒(QIAGEN Inc.,Valencia,CA)纯化。将上述片段用Stu I和Bsp LU11I消化并用Qiaquic纯化试剂盒(QIAGEN Inc.,Valencia,CA)纯化,再连接到用Stu I-Bsp LU11I消化的pSheB1中间体2中,从而产生pEJG61(图9)。
实施例17:表达禾本科镰孢脂肪酶的基因的Fusarium venenatum表达载体的构建
设计如实施例14所述的两个合成的寡核苷酸引物,以从实施例13制备的基因组DNA中PCR扩增禾本科镰孢脂肪酶基因。
使用HerculaseTM Hotstart PCR系统(Stratagene,La Jolla,CA)通过PCR扩增目标片段。将1μM的上述每个引物用于PCR反应物中,所述PCR反应物在50μl的最终体积中含有20ng禾本科镰孢基因组DNA、1X PCR缓冲液(Stratagene,La Jolla,CA)、1μl的dNTP混合液(每种10mM)和1.0μl的DNA聚合酶混合物(5U/μl;Stratagene,La Jolla,CA)。为扩增片段,将Eppendorf Mastercycler热循环仪编程为:1个循环,94℃ 2分钟;10个循环,每个为94℃ 15秒、60℃ 30秒以及72℃ 1.25分钟;15个循环,每个为94℃15秒、60℃ 30秒以及72℃ 1.25分钟,且每个循环依次加5秒的延长;1个循环,72℃ 7分钟;以及在10℃保持。
在0.8%的琼脂糖凝胶上使用TBE缓冲液显现反应产物,且使用QIAquick PCR纯化试剂盒根据制造商的指示纯化了1.8kb的产物条带。
使用InFusion克隆试剂盒,将含有禾本科镰孢脂肪酶基因的1.8kb PCR片段克隆入pEJG61,其中该载体用Bsp LU11I和Pac I消化。使用0.7%琼脂糖凝胶和TBE缓冲液,通过凝胶电泳纯化该经消化的载体,使用QIAquick凝胶提取试剂盒提取PCR片段,并使用QIAquick PCR纯化试剂盒纯化该PCR片段。将该基因片段和被消化的载体在反应物中连接在一起而产生表达质粒pSMO232(图10)。连接反应物(50μl)由1X InFusion缓冲液、1X BSA、1μl的Infusion酶(1∶10稀释)、100ng的用Bsp LU11I和Pac I消化的pEJG61,和50ng的禾本科镰孢脂肪酶基因纯化PCR产物组成。将反应物在室温下孵育30分钟。根据制造商的指示,用2μl的反应物转化大肠杆菌SoloPackGold超感受态细胞。将1μl的β-巯基乙醇加入感受态细胞中,并在冰上孵育10分钟。然后将2μl体积的连接混合物加入大肠杆菌细胞中并在冰上孵育30分钟。随后,将细胞在54℃热激60秒,然后放于冰上2分钟。将150μl体积的42℃的NZY+培养基加入细胞中,并将该混合物在37℃、250rpm条件下孵育1小时。孵育后,将菌落涂布在添加了100μg/ml氨苄青霉素的2XYT平板上,并在37℃条件下过夜孵育以选择质粒。用无菌牙签挑出生长在平板上的9个菌落,且在37℃、250rpm条件下,在包含添加了100μg/ml氨苄青霉素的3ml LB培养基的15ml Falcon试管内培育过夜。用限制消化检测出含质粒pSMO232的大肠杆菌转化体,并使用QIAGEN BioRobot 9600制备质粒DNA。
实施例18:禾本科镰孢脂肪酶的基因在Fusarium venenatumWTY842-1-11中的表达
Fusarium venenatum WTY842-1-11菌株(Δtrichodiene合成酶基因,amdS+)是镰孢属菌株A3/5(NRRL 30747或ATCC 20334)的突变体(Wiebe等,1992,Mycological Research 96:555-562;Wie等,1991,Mycological Research95:1284-1288;Wiebe等,1991,Mycological Research 96:555-562);通过下列步骤产生了Fusarium venenatum WTY842-1-11的孢子:从琼脂平板取8个琼脂块(plugs)接种到含有100ml RA孢子形成培养基的烧瓶内,在27℃、150rpm条件下孵育24小时;随后在22℃、150rpm条件下孵育24小时。使培养物滤过MIRACLOTHTM(Calbiochem,La Jolla,CA),将孢子过滤到Nalgene 0.2μm滤器上收集。用无菌蒸馏水洗涤孢子两次,在小体积水中重悬浮,且随后用血细胞计数器计数。
用Fusarium venenatum WTY842-1-11的2×108个孢子接种100ml的YPG培养基,并在150rpm、18℃孵育15小时,来制备原生质体。将培养物经MIRACLOTHTM过滤,用无菌蒸馏水洗涤一次并用1M MgSO4洗涤一次,并重悬于40ml含5mg/ml的NOVOZYME 234TM(Novozymes A/S,Denmark)的1M MgSO4中。在90rpm、29℃条件下孵育培养物直至原生质体形成。将30ml体积的1M山梨醇加入原生质体消化物中,并将该混合物以1500rpm离心10分钟。将沉淀重悬,用1M山梨醇洗涤两次,并以1500rpm离心10分钟以沉降原生质体。用血细胞计数器对原生质体计数,并将原生质体重悬于8∶2∶0.1的STC∶SPTC∶DMSO溶液中至终浓度5X107原生质体/ml。在Nalgene Cryo 1℃冷却容器(Freezing Container)内以受控的速率将原生质体冷却之后,保存于-80℃。
在50ml的Falcon试管中,将2ml的原生质体悬液加入20μg的pSMO232和250μg的肝素中,混合并在冰上孵育30分钟。将200μl的SPTC温和地混合到原生质体悬液中,并在室温下继续孵育10分钟。将20ml的SPTC温和地混合到原生质体悬液中,并在室温下继续孵育10分钟。将350ml体积的熔化Vogel’s NO3再生低熔点(low-melt)培养基(冷却至50℃)与原生质体混合,随后将35ml铺在100mm培养平板上,平板上含有35ml相同培养基,并添加了12mg/ml的BASTATM。在室温下继续孵育6天。6天后,出现29个转化体。从每个转化体的边缘取菌丝体片段,转移到含有Vogel’s NO3再生低熔点培养基并加有BASTATM(6mg/ml)培养基的平板。将该平板密封在塑料袋中以保持湿度,在室温下孵育约一周。
将1cm2的孢子生长物分别接种于125ml塑料摇瓶内的25ml MY400培养基中,并在28℃、250rpm条件下孵育。孵育3和5天后,取出培养上清液进行脂肪酶测定和SDS-PAGE分析。
脂肪酶活性的测定如实施例12所述。脂肪酶测定结果显示,在3天时,一些转化体产生了比未转化对照更高的脂肪酶活性。10μl上清液的SDS-PAGE(BioRad Criterion 10-20% SDS-PAGE)分析在大约61kDa处显示了一个条带。
实施例19:重组禾本科镰孢脂肪酶的底物特异性的测定
如实施例9所述,使用由4-硝基苯酚(PNP)脂肪酶底物组成的组筛选,测定禾本科镰孢脂肪酶的底物特异性。
组筛选的结果如表4所示。
表4
Figure A20058004397000761
禾本科镰孢脂肪酶(表达禾本科镰孢脂肪酶1的Fusarium venenatum WTY-842-1-11)检测数据由2个测定结果的均值组成;而LIPEXTM数据由最少80个测定结果的均值组成。
将LIPEXTM和禾本科镰孢脂肪酶组筛选的结果相比,得出下述结论:
1.禾本科镰孢脂肪酶在pH 9.5条件下与在pH 7条件下对PNP-棕榈酸盐(或酯)的活性的比值,比LIPEXTM的相应比值要低6倍,提示禾本科镰孢脂肪酶在pH 9.5的活性比LIPEXTM要低得多,或者说其在pH7的活性比LIPEXTM要高得多,或二者兼有。
2.禾本科镰孢脂肪酶的P/V,D/V和D/B比值也与LIPEXTM相当不同,提示这两种脂肪酶之间有某些酰基变化长度特异性的差别。
实施例20:Magnaporthe grisea部分基因组序列中的脂肪酶基因的鉴定
使用来自白地霉(SWALL P17573)的脂肪酶序列作为查询,对Magnaporthe grisea部分基因组序列(The Institute for Genomic Research,Rockville,MD)进行tfasty搜索(Pearson,W.R.,1999,同上)。基于氨基酸水平上与查询序列的高度相似性,数个基因被鉴定为推定脂肪酶。选择与查询序列在氨基酸水平上有超过33%的同一性的约1400bp和110bp的两个基因组区域作进一步的研究。基于与白地霉脂肪酶的同源性和存在于真菌内含子5’和3’端的保守序列,预测了该推定脂肪酶基因的基因模型。
实施例21:Magnaporthe grisea基因组DNA提取
将400μl的Magnaporthe grisea(FGSC 8958,Fungal Genetics StockCenter)孢子在带挡板的摇瓶中的50ml CM培养基中,在25℃、250rpm条件下生长4天。然后根据制造商的说明,使用DNeasy Plant Mini试剂盒(QIAGEN Inc.,Valencia,CA),从菌丝体提取基因组DNA。
实施例22:Magnaporthe grisea脂肪酶1基因的克隆
根据开放阅读框的预测的起始和终止密码子设计下列两个合成寡核苷酸引物,以从实施例21制备的基因组DNA中PCR扩增编码脂肪酶1的Magnaporthe grisea基因。
正向引物:
5’-ACACAACTGGCCATGAAAGCCTCCATTCTTTCGGCT-3’(SEQID NO:30)
反向引物:
5’-AGTCACCTCTAGTTAATTAATTAAATGTAAAAGCTGAGGA-3’(SEQ ID NO:31)
粗体字母代表编码序列。其余序列与pBM120a的插入位点(见实施例6)同源。
使用Expand高保真PCR扩增系统对目标片段进行PCR扩增。将1μM的上述每个引物用于PCR反应物中,所述反应物在50μl的最终体积中含有300ng的Magnaporthe grisea基因组DNA、含1.5mM MgCl2的1X PCR缓冲液、1μl的dNTP混合液(每种10mM)和0.75μl的DNA聚合酶混合物(3.5U/μl)。为扩增片段,将Eppendorf Mastercycler热循环仪编程为:1个循环,94℃ 2分钟;10个循环,每个为94℃ 15秒、59.2℃ 30秒以及72℃ 1.25分钟;15个循环,每个为94℃ 15秒、59.2℃ 30秒以及72℃ 1.25分钟,且每个循环依次加5秒的延长;1个循环,72℃7分钟以及在10℃保持。
在0.7%琼脂糖凝胶上使用TE缓冲液显现反应产物,并使用QIAquickPCR纯化试剂盒(QIAGEN Inc.,Valencia,CA)根据制造商的指导对2kb产物条带进行纯化。使用制造商指定的条件将PCR片段和pCR2.1-TOPO进行连接,由此产生质粒pJLin175(图11)。
根据制造商的指示,用2μl的反应物转化大肠杆菌TOP10 One Shot感受态细胞。将2μl体积的连接混合物加入至大肠杆菌细胞,并在冰上保温5分钟。随后,在42℃热激细胞30秒,然后将其放于冰上2分钟。将250μl体积的SOC培养基加入细胞,并将混合物在37℃、250rpm条件下温育1小时。温育后,将菌落涂布到添加了100μg/ml氨苄青霉素的2X YT平板上,并在37℃下过夜温育以选择质粒。用无菌牙签挑出生长在平板上的12个菌落,且在37℃、250rpm条件下,在含添加了100μg/ml氨苄青霉素的3ml LB培养基的15ml Falcon试管内生长过夜。通过限制消化检测出含有pJLin175质粒的大肠杆菌转化体,并使用BioRobot 9600制备质粒DNA。
含pJLin175的大肠杆菌TOP10 One Shot细胞保藏于农业研究机构专利培养物保藏中心,北方区域研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center,1815 University Street,Peoria,Illinois,61604),保藏编号NRRL B-30783,保藏日期2004年10月12日。
实施例23:编码脂肪酶1的Magnaporthe grisea基因组序列的测定
使用Applied Biosystems 377 XL型DNA测序仪(Perkin-Elmer/AppliedBiosystems,Inc.,Foster City,CA),利用染料终止化学法(Giesecke等,同上)和引物步移策略,对来自pJLin175的Magnaporthe grisea脂肪酶1基因进行DNA测序。借助PHRED/PHRAP软件(University of Washington,Seattle,WA)检查核苷酸序列数据的质量且对所有序列进行互相比较。
基于与白地霉脂肪酶的同源性和真菌内含子5’端和3’端存在的保守序列,预测所述脂肪酶基因的基因模型。使用具有迭代细化和缺省参数的MAFFT方法(Katoh等,2002,同上)对氨基酸序列进行比较性比对。核苷酸序列(SEQ ID NO:5)和推导的氨基酸序列(SEQ ID NO:6)示于图12A和12B。基因组片段编码598个氨基酸的多肽。该基因的G+C的百分含量是55.5%,而成熟蛋白编码区(SEQ ID NO:5的第61至1922位核苷酸)的G+C的百分含量是55.5%。利用SignalP软件程序(Nielsen等人,1997,同上),预测了一种20个残基的信号肽。预测的成熟蛋白质含有578个氨基酸,其分子量是64.3kDa。
利用Clustal W方法(Higgins,1989,同上),使用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)对脂肪酶序列进行比较性比对,其中使用同一性表和下列多个比对参数:缺口罚分10;缺口长度罚分10。成对比对参数为:Ktuple=1,缺口罚分=3,窗口数=5和对角线数=5。所述比对显示,所述Magnaporthe grisea脂肪酶1基因的推导氨基酸序列与白地霉脂肪酶基因(SWALL P17573)的推导氨基酸序列有33%的同一性。
实施例24:Magnaporthe grisea脂肪酶2基因的克隆
基于预测的序列设计了下列几个合成的寡核苷酸引物,以从基因组DNA中PCR扩增另一编码脂肪酶2的Magnaporthe grisea基因。
正向引物:
5’-ATTTTCCCGGCTCGACGCTTCTGT-3’(SEQ ID NO:32)
5’-TCATGATGCGTCAATCCATCTTCCAGT-3’(SEQ ID NO:33)
5’-GGACGAGTTCGTCGCCATGGTGCAGC-3’(SEQ ID NO:34)
反向引物:
5’-GCTGCACCATGGCGACGAACTCGTCC-3’(SEQ ID NO:35)
5’-TTTAATTAATTAGTACCCGCAAATCCATAACAACAAC-3’(SEQID NO:36)
粗体字母代表编码序列。其余序列与pBM120a的酶限制插入位点同源。
使用HerculaseTM Hotstart DNA聚合酶系统对目标片段进行PCR扩增。在含有300ng Magnaporthe grisea基因组DNA、1X Herculase PCR缓冲液(Stratagene,La Jolla,CA)、1μl的dNTP混合液(每种10mM)、2μl的DMSO和2.5单位的HerculaseTM Hotstart DNA聚合酶(Stratagene,La Jolla,CA)的PCR反应物(50μl)中使用50ng SEQ ID NO:32引物和50ng SEQ ID NO:36引物从而产生第一片段(片段1)。使用5μl的片段1(PCR反应物)作为模板,以及50ng SEQ ID NO:32引物和50ng SEQ ID NO:35引物扩增片段2。使用5μl的片段1(PCR反应物)作为模板,以及SEQ ID NO:34引物和SEQID NO:36引物各50ng扩增片段3。Peltien热循环仪(MJ Research Inc.,Watertown,MA)编程为:1个循环,92℃ 2分钟;30个循环,每个为92℃ 1分钟、51℃ 1分钟、72℃ 1分钟;1个循环,72℃ 10分钟;以及在4℃保持。
于1%琼脂糖凝胶上使用TE缓冲液显现反应产物,并使用QIAquickPCR纯化试剂盒根据制造商的指示纯化产物条带。使用制造商指定的条件连接PCR片段1和pCR2.1-TOPO,产生质粒pCrAm140(图13)。
根据制造商的指示,用2μl的反应物转化大肠杆菌TOP10 One Shot感受态细胞。将2μl体积的连接混合物加入大肠杆菌细胞,并在冰上保温5分钟。随后,在42℃热激细胞30秒,然后将其放于冰上2分钟。将250μl体积的SOC培养基加入细胞,并将混合物在37℃、250rpm条件下温育1小时。温育后,将菌落涂布到添加了100μg/ml氨苄青霉素的2X YT平板上,并在37℃下过夜温育以选择质粒。用无菌牙签挑出生长在平板上的20个菌落,且在37℃、250rpm条件下,在含添加了100μg/ml氨苄青霉素的3ml LB培养基的15ml Falcon试管内生长过夜。通过限制消化检测出含有pCrAm140的大肠杆菌转化体,并使用BioRobot 9600制备质粒DNA。
含有pCrAm140的大肠杆菌TOP10 One Shot细胞保藏于农业研究机构专利培养物保藏中心,北方区域研究中心(Agricultural Research ServicePatent Culture Collection,Northern Regional Research Center,1815 UniversityStreet,Peoria,Illinois,61604),保藏编号NRRL B-30788,保藏日期2004年12月1日。
实施例25:编码脂肪酶2的Magnaporthe grisea基因组序列的定性
使用Applied Biosystems 377 XL型DNA测序仪(Perkin-Elmer/AppliedBiosystems,Inc.,Foster City,CA),利用染料终止化学法(Giesecke等,同上)和引物步移策略,对来自pCrAm140的Magnaporthe grisea脂肪酶2基因进行DNA测序。借助PHRED/PHRAP软件(University of Washington,Seattle,WA)检查核苷酸序列数据的质量且对所有序列进行互相比较。
基于与白地霉脂肪酶的同源性和真菌内含子5’端和3’端存在的保守序列,预测所述脂肪酶基因的基因模型。使用具有迭代细化和缺省参数的MAFFT方法(Katoh等,2002,同上)对氨基酸序列进行比较性比对。核苷酸序列(SEQ ID NO:7)和推导的氨基酸序列(SEQ ID NO:8)示于图14A和14B。基因组片段编码534个氨基酸的多肽。该基因的G+C的百分含量是66.1%,而成熟蛋白编码区(SEQ ID NO:7的第55至1602位核苷酸)的G+C的百分含量是66.1%。利用SignalP软件程序(Nielsen等人,1997,同上),预测了一种18个残基的信号肽。预测的成熟蛋白质含有516个氨基酸,其分子量是55.5kDa。
利用Clustal W方法(Higgins,1989,同上),使用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)对脂肪酶序列进行比较性比对,其中使用同一性表和下列多个比对参数:缺口罚分10;缺口长度罚分10。成对比对参数为:Ktuple=1,缺口罚分=3,窗口数=5和对角线数=5。所述比对显示,所述Magnaporthe grisea脂肪酶2基因的推导氨基酸序列与白地霉脂肪酶基因(SWALL P17573)的推导氨基酸序列有33%的同一性。
实施例26:粗糙脉孢菌的部分基因组序列中的的脂肪酶基因的鉴定
使用来自白地霉(SWALL P17577)的脂肪酶序列作为查询,对粗糙脉孢菌部分基因组序列(Broad Institute,MIT)进行tfasty搜索(Pearson,W.R.,1999,同上)。基于氨基酸水平上与查询序列的高度相似性,一个基因被鉴定为推定脂肪酶。选择与查询序列在氨基酸水平上具有超过38%的同一性的一个1200bp左右的基因组区域作进一步的研究。基于与白地霉脂肪酶基因的同源性和真菌内含子5’和3’端存在的保守序列,预测了该推定脂肪酶基因的基因模型。
实施例27:粗糙脉孢菌基因组DNA的提取
将400μl的粗糙脉孢菌(FGSC 2489,Fungal Genetics Stock Center)孢子在带挡板的摇瓶中的50ml的CM培养基中25℃、250rpm条件下培养4天。然后使用下述方法从菌丝体提取基因组DNA。从PDA平板接种补充了1%的添加葡萄糖的YEG培养基(100ml),并在34℃孵育2天。通过在Whatmann#1滤纸上过滤收集菌丝体,在液氮中冷冻,并在干冰上用研钵和杵研磨成粉末。将该物料的四分之一与20ml含20mM CAPS-NaOH pH 11.0缓冲液和1%的十二烷基硫酸锂的TE在60℃条件下孵育60分钟。在回转轮上,37℃条件下用等体积的苯酚∶氯仿∶异戊醇(25∶24∶1)抽提60分钟,2500rpm离心5分钟,取其水相以同样方式再次抽提。调节水相至含有2.5M醋酸铵并冷冻。将其解冻,用0.7体积的异丙醇沉淀核酸,以15,000×g离心20分钟以收集沉淀物。用70%乙醇洗涤离心沉淀两次,风干,并溶解于1.0ml的0.1X TE中。加入RNA酶至100μg/ml,并将试管在室温下孵育30分钟。调节溶液至含有2M醋酸铵,加入2倍体积的乙醇以沉淀DNA,在室温下以13,000×g离心20分钟收集DNA。用70%乙醇洗涤离心沉淀两次,风干,并溶解于0.75ml的0.1X TE中。
实施例28:粗糙脉孢菌脂肪酶基因的克隆
根据开放阅读框的预测的起始和终止密码子设计下列两个合成寡核苷酸引物,以从实施例27制备的基因组DNA中PCR扩增粗糙脉孢菌脂肪酶基因。
正向引物:
5’-ACACAACTGGCCATGAAGGGCTTTTCCAACGCTCTCCTCG-3’(SEQ ID NO:37)
反向引物:
5’-AGTCACCTCTAGTTAATTAATTAGATGTGAAGAGCATCAAGATTAG-3’(SEQ ID NO:38)
粗体字母代表编码序列。其余序列与pBM120a的插入位点同源。
使用Expand高保真PCR系统(Roche Diagnostics,Mannheim,Germany)对目标片段进行PCR扩增。将50皮摩尔的上述每个引物用于含有550ng粗糙脉孢菌基因组DNA的PCR反应物中。所述PCR扩增反应混合物在50μl终体积中还含有:含1.5mM MgCl2的1X PCR缓冲液、1μl的dNTP混合液(每种10mM)和0.75μl的DNA聚合酶混合物(3.5U/μl)。使用EppendorfMastercycler热循环仪扩增片段,其编程为:1个循环,94℃ 2分钟;10个循环,每个为94℃ 15秒、62℃ 30秒以及72℃ 2分钟;15个循环,每个为94℃ 15秒、62℃ 30秒以及72℃ 2分钟,且每个循环依次加5秒的延长;1个循环,72℃ 7分钟以及在10℃保持。
使用TE缓冲液在1.0%琼脂糖凝胶上显现反应产物,并使用QIAquickPCR纯化试剂盒根据制造商的指示纯化1.8kb的产物条带。
然后,根据制造商的指示,将1.8kb的PCR产物克隆到pCR2.1-TOPO(Invitrogen,Carlsbad,CA)中,产生了pBM134b(图15)。用2μl的反应物转化大肠杆菌TOP10 One Shot感受态细胞。用限制消化检测出含有pBM134b的大肠杆菌转化体,并使用QIAGEN BioRobot 9600制备质粒DNA。
将包含质粒pBM134b的大肠杆菌TOP10 One Shot细胞保藏于农业研究机构专利培养物保藏中心,北方区域研究中心(Agricultural Research ServicePatent Culture Collection,Northern Regional Research Center,1815 UniversityStreet,Peoria,Illinois,61604),保藏编号NRRL B-30786,保藏日期2004年11月17日。
实施例29:编码脂肪酶的粗糙脉孢菌基因组序列的定性
使用Applied Biosystems 377 XL型自动DNA测序仪(Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA),利用染料终止化学法(Giesecke等,1992,Journal of Virology Methods 38:47-60)和引物步移策略,对来自pBM134b的粗糙脉孢菌脂肪酶基因进行DNA测序。借助ContigExpress软件(Informax,Inc.,Bethesda,MD)检查核苷酸序列数据的质量并分析所有序列。
基于与白地霉脂肪酶基因1的同源性和真菌内含子5’端和3’端存在的保守序列,预测所述脂肪酶基因的基因模型。使用具有迭代细化和缺省参数的MAFFT方法(Katoh等,2002,Nucleic Acids Research 30:3059)对氨基酸序列进行比较性比对。基因组编码序列(SEQ ID NO:9)和推导的氨基酸序列(SEQ ID NO:10)示于图16A和16B。基因组片段编码578个氨基酸的多肽,其被一个55bp的内含子隔断。该基因的G+C的百分含量是56.19%,而成熟蛋白编码区(SEQ ID NO:9的第64至1789位核苷酸)的G+C的百分含量是56.88%。利用SignalP软件程序(Nielsen等人,1997,ProteinEngineering 10:1-6),预测了一种21个残基的信号肽。预测的成熟蛋白质含有557个氨基酸,其分子量是59.97kDa。
利用Clustal W方法(Higgins,1989,同上),使用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)对脂肪酶序列进行比较性比对,其中使用同一性表和下列多个比对参数:缺口罚分10;缺口长度罚分10。成对比对参数为:Ktuple=1,缺口罚分=3,窗口数=5和对角线数=5。所述比对显示,所述粗糙脉孢菌脂肪酶基因的推导氨基酸序列与白地霉脂肪酶1基因(SWALL P17577)的推导氨基酸序列有31%的同一性。
生物材料的保藏
下列生物材料已按照布达佩斯条约的规定保藏于农业研究机构专利培养物保藏中心,北方区域研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center,1815 University Street,Peoria,Illinois,61604),并被给予下列登记号:
保藏物                 保藏号                  保藏日期
大肠杆菌pJLin173       NRRL B-3078             22004-10-12
大肠杆菌pSMO230        NRRL B-30803            2004-12-17
大肠杆菌pJLin175       NRRL B-30783            2004-09-13
大肠杆菌pCrAm140       NRRL B-30788            2004-12-01
大肠杆菌pBM134b          NRRL B-30786            2004-11-17
该菌株已经在如下条件下进行保藏:保证在本专利申请待审过程中,对于由美国专利商标局局长根据37C.F.R.§1.14和35U.S.C§122确定的有权获取这些培养物的任何人员,培养物均为可获取状态。所述保藏物是所述保藏菌株的基本上纯的培养物。在外国提交与本主申请相应的申请或其子申请的,所述保藏物按照该国专利法的要求处于可获取状态。但是应该理解,保藏物处于可获取状态,并不构成对于实施本发明的许可从而损害通过政府行为授予的专利权。
本文描述并要求的发明并不限于本文所公开的具体实施方案的范围,因为这些实施方案意图在于举例说明本发明的几个方面。本发明的范围意图包括任何等同的实施方案。事实上,根据上文描述,除本文所显示和描述的之外,对本发明的各种修改对本领域技术人员而言应是显而易见的。这些修改也应包括在所附权利要求的范围内。一旦出现冲突,将以包括定义在内的本公开为准。
本文引用了多份参考文献,引入其全部公开内容作为参考。
申请人或代理人档案号  10717.504-WO 国际申请号  PCT/US2005/038291
关于微生物保藏的说明
(细则13之二)
Figure A20058004397000851
申请人或代理人档案号  10717.504-WO 国际申请号  PCT/US2005/038291
关于微生物保藏的说明
(细则13之二)
Figure A20058004397000861
申请人或代理人档案号  10717.504-WO 国际申请号  PCT/US2005/038291
关于微生物保藏的说明
(细则13之二)
Figure A20058004397000871
申请人或代理人档案号  10717.504-WO 国际申请号  PCT/US2005/038291
关于微生物保藏的说明
(细则13之二)
申请人或代理人档案号  10717.504-WO 国际申请号  PCT/US2005/038291
关于微生物保藏的说明
(细则13之二)
Figure A20058004397000891
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
     诺维信公司(Novozymes A/S)
<120>具有脂肪酶活性的多肽以及编码该多肽的多核苷酸
<130>10717.504-WO
<150>60/621,282
<151>2004-10-21
<150>60/643,338
<151>2005-01-12
<150>60/633,741
<151>2004-12-06
<150>60/629,806
<151>2004-11-18
<160>38
<170>PatentIn version 3.2
<210>1
<211>1689
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>1
atgcatctcc tccgggttgt tctgccgctt ctgtcccttt cacccgctgg cctggcagct   60
ccggcctcgc cagctgcgcc taccgtcacg atcgcatctc ccgctgccac cattgttggg  120
tcgtccggga aggtagagaa gttcaacgcc atccccttcg cccagccacc cacgggcccc  180
ctgcgtctga agcctcccca gccaatacag aagcccctgg gcactattga cggcacgggt  240
agcgccaagt cgtgtcctca gttctttttt tcgacggaca acagcgagtt tccggggtcc  300
gtcgccggtc tcttggccaa ccttcccctc ttccagaccg tgacaaatgc tggagaggat  360
tgcctgaccc tgaatgtggc gcgtccgtcc ggcacagctc caggcgcgaa gctgcccgtc  420
ctcgtgtgga tctacggcgg cggcttcgag ctgggcgcca cggccacgta cgatgcgacc  480
tcgctagtgg caagctcgat cgacctgggt atgccaattg tctttgtcgc gatgaactat  540
cgaacggggg gatttggctt cctgccgggg aaggagatcc tggcggatgg ggcggccaac  600
ctggggctct tggaccaacg cctggccctg cagtgggtgg cggacaacat tgcggccttt  660
ggcggcgacc cagacaaggt caccatctgg ggtgagtccg cgggatccat ctcggtcttc  720
gatcacatga tcctgtatga tggcgacaat acctacaaag ggaagccgct gttccggggc  780
ggcatcatga actcgggtag cgtgatcccg gcggatcccg tagacggggt caaggggcag  840
caggtatatg atgcggttgt ggactatgcc ggctgctcat cggccgcgga cacgctggaa   900
tgtctgcgcg gattggacta taccgacttt ctgaatgcgg ccaacgcggt gccaggcatc   960
ctaagctacc attccgtggc cctgtcatac ctgcctcgac ccgacggcaa ggcgatcacg  1020
gccagcccag acattttggt caaaaccggc aaatacgccg ccgtgcccat cattatcggc  1080
gaccaggagg atgaagggac tttattcgcg ctcttccagt ccaacatcac caccaccaaa  1140
caagtggtgg actatctggc caagtattac ttctttgagg cgacgcgcga ccagctcgag  1200
gagctggtgg cgacgtatcc ggacgtcacc accgacggct cacccttccg cacgggcatt  1260
ttcaacaact ggtatccgca gttcaaacgg ttggcagccc tgctgggcga tctcaccttc  1320
acgctgacgc gccgagccta cctcaaatac gtgacggagc ttcaccccag cctgccctgc  1380
tggtcatacc tgtcatcgta cgactacggg acgcccatta tgggcacctt ccacggcagt  1440
gatattctgc aggtgtttta tggcattctg cccaattacg cgtcgcgcgc gttccacacc  1500
tactatttca gcttcgtata cgatctcgat ccgaactctc gccggggtag tcttatggaa  1560
tggccgcggt ggaacgacga ccagcagctg atgcaggtct tcaacaatcg gggggccttg  1620
ctggccgatg atttccgcaa tgacacgtac aactttattc tggagaacgt ggattcgttc  1680
catatctag                                                          1689
<210>2
<211>562
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<400>2
Met His Leu Leu Arg Val Val Leu Pro Leu Leu Ser Leu Ser Pro Ala
1               5                   10                  15
Gly Leu Ala Ala Pro Ala Ser Pro Ala Ala Pro Thr Val Thr Ile Ala
            20                  25                  30
Ser Pro Ala Ala Thr Ile Val Gly Ser Ser Gly Lys Val Glu Lys Phe
        35                  40                  45
Asn Ala Ile Pro Phe Ala Gln Pro Pro Thr Gly Pro Leu Arg Leu Lys
    50                  55                  60
Pro Pro Gln Pro Ile Gln Lys Pro Leu Gly Thr Ile Asp Gly Thr Gly
65                  70                  75                  80
Ser Ala Lys Ser Cys Pro Gln Phe Phe Phe Ser Thr Asp Asn Ser Glu
                85                  90                  95
Phe Pro Gly Ser Val Ala Gly Leu Leu Ala Asn Leu Pro Leu Phe Gln
            100                 105                 110
Thr Val Thr Asn Ala Gly Glu Asp Cys Leu Thr Leu Asn Val Ala Arg
        115                 120                 125
Pro Ser Gly Thr Ala Pro Gly Ala Lys Leu Pro Val Leu Val Trp Ile
    130                 135                 140
Tyr Gly Gly Gly Phe Glu Leu Gly Ala Thr Ala Thr Tyr Asp Ala Thr
145                 150                 155                 160
Ser Leu Val Ala Ser Ser Ile Asp Leu Gly Met Pro Ile Val Phe Val
                165                 170                 175
Ala Met Asn Tyr Arg Thr Gly Gly Phe Gly Phe Leu Pro Gly Lys Glu
            180                 185                 190
Ile Leu Ala Asp Gly Ala Ala Asn Leu Gly Leu Leu Asp Gln Arg Leu
        195                 200                 205
Ala Leu Gln Trp Val Ala Asp Asn Ile Ala Ala Phe Gly Gly Asp Pro
    210                 215                 220
Asp Lys Val Thr Ile Trp Gly Glu Ser Ala Gly Ser Ile Ser Val Phe
225                 230                 235                 240
Asp His Met Ile Leu Tyr Asp Gly Asp Asn Thr Tyr Lys Gly Lys Pro
                245                 250                 255
Leu Phe Arg Gly Gly Ile Met Asn Ser Gly Ser Val Ile Pro Ala Asp
            260                 265                 270
Pro Val Asp Gly Val Lys Gly Gln Gln Val Tyr Asp Ala Val Val Asp
        275                 280                 285
Tyr Ala Gly Cys Ser Ser Ala Ala Asp Thr Leu Glu Cys Leu Arg Gly
    290                 295                 300
Leu Asp Tyr Thr Asp Phe Leu Asn Ala Ala Asn Ala Val Pro Gly Ile
305                 310                 315                 320
Leu Ser Tyr His Ser Val Ala Leu Ser Tyr Leu Pro Arg Pro Asp Gly
                325                 330                 335
Lys Ala Ile Thr Ala Ser Pro Asp Ile Leu Val Lys Thr Gly Lys Tyr
            340                 345                 350
Ala Ala Val Pro Ile Ile Ile Gly Asp Gln Glu Asp Glu Gly Thr Leu
        355                 360                 365
Phe Ala Leu Phe Gln Ser Asn Ile Thr Thr Thr Lys Gln Val Val Asp
    370                 375                 380
Tyr Leu Ala Lys Tyr Tyr Phe Phe Glu Ala Thr Arg Asp Gln Leu Glu
385                 390                 395                 400
Glu Leu Val Ala Thr Tyr Pro Asp Val Thr Thr Asp Gly Ser Pro Phe
                405                 410                 415
Arg Thr Gly Ile Phe Asn Asn Trp Tyr Pro Gln Phe Lys Arg Leu Ala
            420                 425                 430
Ala Leu Leu Gly Asp Leu Thr Phe Thr Leu Thr Arg Arg Ala Tyr Leu
        435                 440                 445
Lys Tyr Val Thr Glu Leu His Pro Ser Leu Pro Cys Trp Ser Tyr Leu
    450                 455                 460
Ser Ser Tyr Asp Tyr Gly Thr Pro Ile Met Gly Thr Phe His Gly Ser
465                 470                 475                 480
Asp Ile Leu Gln Val Phe Tyr Gly Ile Leu Pro Asn Tyr Ala Ser Arg
                485                 490                 495
Ala Phe His Thr Tyr Tyr Phe Ser Phe Val Tyr Asp Leu Asp Pro Asn
            500                 505                 510
Ser Arg Arg Gly Ser Leu Met Glu Trp Pro Arg Trp Asn Asp Asp Gln
        515                 520                 525
Gln Leu Met Gln Val Phe Asn Asn Arg Gly Ala Leu Leu Ala Asp Asp
    530                 535                 540
Phe Arg Asn Asp Thr Tyr Asn Phe Ile Leu Glu Asn Val Asp Ser Phe
545                 550                 555                 560
His Ile
<210>3
<211>1767
<212>DNA
<213>禾本科镰孢(Fusarium graminearum)
<400>3
atgagattct ctggtttcgt ctctggcctc ggccttggtc tcttgactgc tgtatctgcc   60
agtccagctg cctttcctgc tccggcctcg atccctgacc ctatacctgc acctgtcgca  120
cctgcttcac cagctattga agaacgagca gccaaagtca cagttgctgt tccttccggt  180
acagtcgttg gatctagctc tggaaaggtt gattccttca gaggcattcc tttcgccgat  240
ccaccaactg gctctctgcg cctcagacct cccaagagac tatccaagtc tctaggaact  300
ttcgatgcct cgggtctcag tgctgcagca tgtcctcaga tgttcatctc gagtggaggt  360
caaagtgtta tcacagagtt cctctctgac tttctggctg tccctttcct cacgcccatc  420
actggccaag aggactgcct caccataaca gtccagcgtc ctgctggtac caaagctggt  480
gacaagctcc ccgttctctt ctggatcttt ggcggcggct tcgaattagg ctcaagtgct  540
atgtatgacg gcacaagcct cttgtctact gccatagatc aaagtcagcc ttttatctac  600
gttgctgtca actaccgagt cgccggcttc ggattcatgc ccggtgctga gatcaagaag  660
gacggaagct ccaacctggg tctgctcgac cagcgcatgg gtctcgagtg ggtggctgac  720
aatattgctt cctttggtgg tgatcctgaa aaggtcacta tctggggaga gtctgctggc  780
tccatctccg tgcttgatca gatggttctc tacggtggtg atgccagtta taagggcaag   840
tctcttttcc gaggtgccat catgaactct ggcactattg tcccagctga gcctgtggat   900
agtgacaagg cacagtctat ctatgacact gttgtcaaga ctggaggctg ctctggtgct   960
tctgatactc tggagtgtct gcgtggtctg agctatgaca agttcctgaa cgctgcaaac  1020
tcggtcccag gattgctgtc gtacaactca ctggctttgt cctatcttcc tcggccagat  1080
ggcaaggtcc tacccaaaag ccccgacgtg cttgttgcaa cgggacaata ccacgcagtg  1140
cccatgatca ccggatgcca ggaggacgaa ggaaccctct ttgcactatt ccaacccaac  1200
gtgaccacta catccagatt ggtcgaatac ttgcagaacc tgtactttac acaggccaca  1260
aagcaacagg tgactgctct agtaaacaca tatcccacca ccctcagcac aggcagtccc  1320
tatcgaacag gcctgctcaa cgaggtcttt cccggtttca agcgccgtgc agccattcta  1380
ggcgatctag tcgtctccct tacacgtcgc atcttcctcc aggccgccgc caacagcaac  1440
ccagacgttc catcatggtc atacctcgca agctacgatt acggcacacc cattctggga  1500
acattccacg ggtctgacct tttacaagtc ttttatggtc tgttgcccaa taacgctatg  1560
cggagtgtcc gaacgtacta cttcaacttt gtatacaacc ttgatcccaa caagggcgtt  1620
accaagtacg ccaagtggcc cgagtggaag gagagcaaga agctcatgtg gtttgagacg  1680
gcgaataaga acagcattat aaacgatgac tttagacagg attcgtatga gtttattgcg  1740
gcgaatgccg gtgctttggt ggtatga                                      1767
<210>4
<211>588
<212>PRT
<213>禾本科镰孢(Fusarium graminearum)
<400>4
Met Arg Phe Ser Gly Phe Val Ser Gly Leu Gly Leu Gly Leu Leu Thr
1               5                   10                  15
Ala Val Ser Ala Ser Pro Ala Ala Phe Pro Ala Pro Ala Ser Ile Pro
            20                  25                  30
Asp Pro Ile Pro Ala Pro Val Ala Pro Ala Ser Pro Ala Ile Glu Glu
        35                  40                  45
Arg Ala Ala Lys Val Thr Val Ala Val Pro Ser Gly Thr Val Val Gly
    50                  55                  60
Ser Ser Ser Gly Lys Val Asp Ser Phe Arg Gly Ile Pro Phe Ala Asp
65                  70                  75                  80
Pro Pro Thr Gly Ser Leu Arg Leu Arg Pro Pro Lys Arg Leu Ser Lys
                85                  90                  95
Ser Leu Gly Thr Phe Asp Ala Ser Gly Leu Ser Ala Ala Ala Cys Pro
            100                 105                 110
Gln Met Phe Ile Ser Ser Gly Gly Gln Ser Val Ile Thr Glu Phe Leu
        115                 120                 125
Ser Asp Phe Leu Ala Val Pro Phe Leu Thr Pro Ile Thr Gly Gln Glu
    130                 135                 140
Asp Cys Leu Thr Ile Thr Val Gln Arg Pro Ala Gly Thr Lys Ala Gly
145                 150                 155                 160
Asp Lys Leu Pro Val Leu Phe Trp Ile Phe Gly Gly Gly Phe Glu Leu
                165                 170                 175
Gly Ser Ser Ala Met Tyr Asp Gly Thr Ser Leu Leu Ser Thr Ala Ile
            180                 185                 190
Asp Gln Ser Gln Pro Phe Ile Tyr Val Ala Val Asn Tyr Arg Val Ala
        195                 200                 205
Gly Phe Gly Phe Met Pro Gly Ala Glu Ile Lys Lys Asp Gly Ser Ser
    210                 215                 220
Asn Leu Gly Leu Leu Asp Gln Arg Met Gly Leu Glu Trp Val Ala Asp
225                 230                 235                 240
Asn Ile Ala Ser Phe Gly Gly Asp Pro Glu Lys Val Thr Ile Trp Gly
                245                 250                 255
Glu Ser Ala Gly Ser Ile Ser Val Leu Asp Gln Met Val Leu Tyr Gly
            260                 265                 270
Gly Asp Ala Ser Tyr Lys Gly Lys Ser Leu Phe Arg Gly Ala Ile Met
        275                 280                 285
Asn Ser Gly Thr Ile Val Pro Ala Glu Pro Val Asp Ser Asp Lys Ala
    290                 295                 300
Gln Ser Ile Tyr Asp Thr Val Val Lys Thr Gly Gly Cys Ser Gly Ala
305                 310                 315                 320
Ser Asp Thr Leu Glu Cys Leu Arg Gly Leu Ser Tyr Asp Lys Phe Leu
                325                 330                 335
Asn Ala Ala Asn Ser Val Pro Gly Leu Leu Ser Tyr Asn Ser Leu Ala
            340                 345                 350
Leu Ser Tyr Leu Pro Arg Pro Asp Gly Lys Val Leu Pro Lys Ser Pro
        355                 360                 365
Asp Val Leu Val Ala Thr Gly Gln Tyr His Ala Val Pro Met Ile Thr
    370                 375                 380
Gly Cys Gln Glu Asp Glu Gly Thr Leu Phe Ala Leu Phe Gln Pro Asn
385                 390                 395                 400
Val Thr Thr Thr Ser Arg Leu Val Glu Tyr Leu Gln Asn Leu Tyr Phe
                405                 410                 415
Thr Gln Ala Thr Lys Gln Gln Val Thr Ala Leu Val Asn Thr Tyr Pro
            420                 425                 430
Thr Thr Leu Ser Thr Gly Ser Pro Tyr Arg Thr Gly Leu Leu Asn Glu
        435                 440                 445
Val Phe Pro Gly Phe Lys Arg Arg Ala Ala Ile Leu Gly Asp Leu Val
    450                 455                 460
Val Ser Leu Thr Arg Arg Ile Phe Leu Gln Ala Ala Ala Asn Ser Asn
465                 470                 475                 480
Pro Asp Val Pro Ser Trp Ser Tyr Leu Ala Ser Tyr Asp Tyr Gly Thr
                485                 490                 495
Pro Ile Leu Gly Thr Phe His Gly Ser Asp Leu Leu Gln Val Phe Tyr
            500                 505                 510
Gly Leu Leu Pro Asn Asn Ala Met Arg Ser Val Arg Thr Tyr Tyr Phe
        515                 520                 525
Asn Phe Val Tyr Asn Leu Asp Pro Asn Lys Gly Val Thr Lys Tyr Ala
    530                 535                 540
Lys Trp Pro Glu Trp Lys Glu Ser Lys Lys Leu Met Trp Phe Glu Thr
545                 550                 555                 560
Ala Asn Lys Asn Ser Ile Ile Asn Asp Asp Phe Arg Gln Asp Ser Tyr
                565                 570                 575
Glu Phe Ile Ala Ala Asn Ala Gly Ala Leu Val Val
            580                 585
<210>5
<211>1925
<212>DNA
<213>Magnaporthe grisea
<400>5
atgaaagcct ccattctttc ggctttctcg gccgtctttc tgacggtagc cggttcccag     60
gtaatacgac aacagctgcc accggtggac ccgcggctcc cacaactgga tctctctcgc    120
ttcgaggttc caattgatct gagagaacca gaagatggct tgaagctcga ggcacgtaag    180
gatgcaccta cagtaaagct ggaagatggg tccataatca caggctcagt tcttgccgac    240
gtcgaatctt ttaagggcat cccctttgcg gaacccccac tgggtgacct gcgcatgagg    300
ccacccgtac gacttgaaaa gccgctcggc aaattcgatg cctcgatgcg catttcaccg    360
caatgcccac agatgttctt ctcctcctca accggccgta tgttgacgca ggtcattggg    420
aatctgctca acaaggggct tttccaaaag atcctggatt ctaccgagga ctgcttaaac    480
atcaacgtgc aaaggcctaa aggtgtcaag gctggtgaca aactgcccgt actgttctgg    540
atttttggcg gtggtttcga ggtacgtcgt tctctagtgt gatgtcatgt tctaggcagg    600
cgcgcttgtt gcggagcgcg gctcccgaga cgttgcatat ccgtgctacc taccgtacca     660
tgccgctaac agtatacctt tgtaaacagc ttggtagcaa tgcaatgtac tctggcacgc     720
cgatccttac gagggcaatg gaacaaggcc agcccttcat tttcgtcggg gtcaactacc     780
gcgtaggagg ctttggcttc atgccaggcg aggagatcca ggccgagggc tctggaaacg     840
ctgggctgct ggaccagcgc atgggcatgg aatgggttgc cgacaatatc gaggctttcg     900
gtggcgatcc cgacaaggtc accatctggg gcgaatctgc cggcgccatc tcggtatttg     960
accagatggc cctgtacgac ggcaacgcta cctacaaagg caagccgctc ttccgcgccg    1020
ccatcatgaa ctctggcagc attatccctg ctgatcccgt cgattgtccc aagggcaggg    1080
aggtttacaa ccaagtcgtc aaagcgggtg gttgctcggg tcgatccgat acgctgaaat    1140
gtctccgcga actcccctac gagaagttcc ttaaggcagc caacgcgcct cctggcctcc    1200
tgagttacaa ctcggtcgcg ctatcatacc tccccaggcc cgacggcaaa gttctcaggg    1260
ccagccctga cgttctactg cttgggcaga gatactatcc cgtccccatg attatcggcg    1320
accaggagga tgagggtagc atttttgccc tcttccagca caacctcacc aacactgaga    1380
tgctcgtcgg ctatctcaaa gaaatcttct tcccagcaac cgatattcaa aaaatcaagg    1440
atctggtaaa atcatacccc gacgacccgc gcgagggctc gcccttccgc accggtaaat    1500
tgaaccaggt gtaccctcaa ttcaagcgtc tcgccgccat ccttggtgac atcaccttta    1560
ccctgacgcg ccggctgttc ctcttcgcct cggcgaccct gcacccagac gtcccgtcgt    1620
ggtcctacct gtccagctac gactacggca cccccatcgc gggaaccttt cacggcagcg    1680
atctcctgca ggtcttttac ggaatcctgc ccaactacgc cagcaggacc accgtctcgt    1740
actacacaaa cttcctgtac aacctggacc ccaacgaggg catcaaggtc cagcactggc    1800
ccaagtggat ggagaaccag gagctgctga acatgaatgc caacgatgcc aagttgatcc    1860
cggacaactt tagaaacgag agttacaact acctgctggc caacttcctc agcttttaca    1920
tttaa                                                                1925
<210>6
<211>598
<212>PRT
<213>Magnaporthe grisea
<400>6
Met Lys Ala Ser Ile Leu Ser Ala Phe Ser Ala Val Phe Leu Thr Val
1               5                   10                  15
Ala Gly Ser Gln Val Ile Arg Gln Gln Leu Pro Pro Val Asp Pro Arg
            20                  25                  30
Leu Pro Gln Leu Asp Leu Ser Arg Phe Glu Val Pro Ile Asp Leu Arg
        35                  40                  45
Glu Pro Glu Asp Gly Leu Lys Leu Glu Ala Arg Lys Asp Ala Pro Thr
    50                  55                  60
Val Lys Leu Glu Asp Gly Ser Ile Ile Thr Gly Ser Val Leu Ala Asp
65                  70                  75                  80
Val Glu Ser Phe Lys Gly Ile Pro Phe Ala Glu Pro Pro Leu Gly Asp
                85                  90                  95
Leu Arg Met Arg Pro Pro Val Arg Leu Glu Lys Pro Leu Gly Lys Phe
            100                 105                 110
Asp Ala Ser Met Arg Ile Ser Pro Gln Cys Pro Gln Met Phe Phe Ser
        115                 120                 125
Ser Ser Thr Gly Arg Met Leu Thr Gln Val Ile Gly Asn Leu Leu Asn
    130                 135                 140
Lys Gly Leu Phe Gln Lys Ile Leu Asp Ser Thr Glu Asp Cys Leu Asn
145                 150                 155                 160
Ile Asn Val Gln Arg Pro Lys Gly Val Lys Ala Gly Asp Lys Leu Pro
                165                 170                 175
Val Leu Phe Trp Ile Phe Gly Gly Gly Phe Glu Leu Gly Ser Asn Ala
            180                 185                 190
Met Tyr Ser Gly Thr Pro Ile Leu Thr Arg Ala Met Glu Gln Gly Gln
        195                 200                 205
Pro Phe Ile Phe Val Gly Val Asn Tyr Arg Val Gly Gly Phe Gly Phe
    210                 215                 220
Met Pro Gly Glu Glu Ile Gln Ala Glu Gly Ser Gly Asn Ala Gly Leu
225                 230                 235                 240
Leu Asp Gln Arg Met Gly Met Glu Trp Val Ala Asp Asn Ile Glu Ala
                245                 250                 255
Phe Gly Gly Asp Pro Asp Lys Val Thr Ile Trp Gly Glu Ser Ala Gly
            260                 265                 270
Ala Ile Ser Val Phe Asp Gln Met Ala Leu Tyr Asp Gly Asn Ala Thr
        275                 280                 285
Tyr Lys Gly Lys Pro Leu Phe Arg Ala Ala Ile Met Asn Ser Gly Ser
    290                 295                 300
Ile Ile Pro Ala Asp Pro Val Asp Cys Pro Lys Gly Arg Glu Val Tyr
305                 310                 315                 320
Asn Gln Val Val Lys Ala Gly Gly Cys Ser Gly Arg Ser Asp Thr Leu
                325                 330                 335
Lys Cys Leu Arg Glu Leu Pro Tyr Glu Lys Phe Leu Lys Ala Ala Asn
            340                 345                 350
Ala Pro Pro Gly Leu Leu Ser Tyr Asn Ser Val Ala Leu Ser Tyr Leu
        355                 360                 365
Pro Arg Pro Asp Gly Lys Val Leu Arg Ala Ser Pro Asp Val Leu Leu
    370                 375                 380
Leu Gly Gln Arg Tyr Tyr Pro Val Pro Met Ile Ile Gly Asp Gln Glu
385                 390                 395                 400
Asp Glu Gly Ser Ile Phe Ala Leu Phe Gln His Asn Leu Thr Asn Thr
                405                 410                 415
Glu Met Leu Val Gly Tyr Leu Lys Glu Ile Phe Phe Pro Ala Thr Asp
            420                 425                 430
Ile Gln Lys Ile Lys Asp Leu Val Lys Ser Tyr Pro Asp Asp Pro Arg
        435                 440                 445
Glu Gly Ser Pro Phe Arg Thr Gly Lys Leu Asn Gln Val Tyr Pro Gln
    450                 455                 460
Phe Lys Arg Leu Ala Ala Ile Leu Gly Asp Ile Thr Phe Thr Leu Thr
465                 470                 475                 480
Arg Arg Leu Phe Leu Phe Ala Ser Ala Thr Leu His Pro Asp Val Pro
                485                 490                 495
Ser Trp Ser Tyr Leu Ser Ser Tyr Asp Tyr Gly Thr Pro Ile Ala Gly
            500                 505                 510
Thr Phe His Gly Ser Asp Leu Leu Gln Val Phe Tyr Gly Ile Leu Pro
        515                 520                 525
Asn Tyr Ala Ser Arg Thr Thr Val Ser Tyr Tyr Thr Asn Phe Leu Tyr
    530                 535                 540
Asn Leu Asp Pro Asn Glu Gly Ile Lys Val Gln His Trp Pro Lys Trp
545                 550                 555                 560
Met Glu Asn Gln Glu Leu Leu Asn Met Asn Ala Asn Asp Ala Lys Leu
                565                 570                 575
Ile Pro Asp Asn Phe Arg Asn Glu Ser Tyr Asn Tyr Leu Leu Ala Asn
            580                 585                 590
Phe Leu Ser Phe Tyr Ile
        595
<210>7
<211>1605
<212>DNA
<213>Magnaporthe grisea
<400>7
atgcgtcaat ccatcttcca gtcactgatg ctggccgccg gcgcctcggc ggccgtcctg     60
ccccgggcca gccaaggccc gaccgtgcag gtcgccaacg gctcctacta tggcgtgcac    120
aactcttttt acgaccaaga cctgttcctc ggcatgccct acgcccagcc gcccgtcggc    180
aacctccgct tccgcgttcc ggagcccctg aactcgacct gggacggcgt gcggaacgcg    240
accgagtacg gctacgcgtg tatcggctac ggttcggacc agtgggtgct gggcaactat    300
gtcaacgagg actgcttgac tgtcaacgtc gtccgtcccg cgggcgtccc ggctaatgcc    360
aagctccccg ttgccgtctg gattcatggc ggtggttact tcatgggcag cggcagtgat    420
cccaggtaca acacctcgtt cctcgtcaag gagtccgtgg agatgggcac cccgatggtg    480
gccgtgaccc tcaactaccg cctgtccgcc tggggcttca tcttcggcaa ggaggtgcag    540
gcggccggcc agaccaacat cggcatgcgc gaccagcgcc tggccctgca ctggatccag    600
gagaacatcg acgcctttgg cggcgacaag agcaaggtga ccatctttgg cgagtcggcg    660
ggcggcaact cggtcggcac gcagctcatc gcttacggcg gacgcgacga cggactcttc    720
cgcgccgcca tctcccagtc cggcgcgccc tcggggctgg gccgcatgac cacgcccgag    780
tcgtggcagc ccgcctacga cgccctggtc agcaaggccg ggtgcgccga cgccgccgac    840
tcgctcgact gcctgcgcgg cgtccccgcc gacgccctca acgcctttat caactcgacc    900
gacgtgctcg ccggccccgc gcgccccgtc atcgacggcg acttgctgac cgaggtcggc    960
accacctcgc tccgcgccgg ccgcttcgtc cacgtcccct acctgatcgg cgccaacgcc   1020
gacgagggcg tgtcctttgg cgtccgcggc atcaacaccg aggacgagtt cgtcgccatg   1080
gtgcagcgca gcaacgccgg gctcacgcgc gacgacgccc tcgccatcgc ggccctctac   1140
cccgacgacc cggaccaggg catcccctcc acgctcaagg gccgtcctgg accggacctg   1200
cagcccctgc tgggctcgat gtggaagcgc agcgcggcct acggcggaga ccccatcatg   1260
cacgcccccc gccgcatcgc gaacgaggag tgggccaggc acggcgtgcc gtcttacagc   1320
taccactttg acgttctgac aaacggcatt ccggactatg ctgggtcgac ccacttccag   1380
gaggttgcct tcatgttcaa caacaccggc ggtctgggct acggcaacgc cgtgtcggtg   1440
aacccgtttg gcggcatgcc cgagtccttg aagagcttgt cgcacatgat ggcgaggatg   1500
tggatcagct tcgtggtcaa cctggacccg aaccacattg gtattggtag gtggatccct   1560
tccgtcatga gaatgatgtt gttgttatgg atttgcgggt actaa                   1605
<210>8
<211>534
<212>PRT
<213>Magnaporthe grisea
<400>8
Met Arg Gln Ser Ile Phe Gln Ser Leu Met Leu Ala Ala Gly Ala Ser
1               5                   10                  15
Ala Ala Val Leu Pro Arg Ala Ser Gln Gly Pro Thr Val Gln Val Ala
            20                  25                  30
Asn Gly Ser Tyr Tyr Gly Val His Asn Ser Phe Tyr Asp Gln Asp Leu
        35                  40                  45
Phe Leu Gly Met Pro Tyr Ala Gln Pro Pro Val Gly Asn Leu Arg Phe
    50                  55                  60
Arg Val Pro Glu Pro Leu Asn Ser Thr Trp Asp Gly Val Arg Asn Ala
65                  70                  75                  80
Thr Glu Tyr Gly Tyr Ala Cys Ile Gly Tyr Gly Ser Asp Gln Trp Val
                85                  90                  95
Leu Gly Asn Tyr Val Asn Glu Asp Cys Leu Thr Val Asn Val Val Arg
            100                 105                 110
Pro Ala Gly Val Pro Ala Asn Ala Lys Leu Pro Val Ala Val Trp Ile
        115                 120                 125
His Gly Gly Gly Tyr Phe Met Gly Ser Gly Ser Asp Pro Arg Tyr Asn
    130                 135                 140
Thr Ser Phe Leu Val Lys Glu Ser Val Glu Met Gly Thr Pro Met Val
145                 150                 155                 160
Ala Val Thr Leu Asn Tyr Arg Leu Ser Ala Trp Gly Phe Ile Phe Gly
                165                 170                 175
Lys Glu Val Gln Ala Ala Gly Gln Thr Asn Ile Gly Met Arg Asp Gln
            180                 185                 190
Arg Leu Ala Leu His Trp Ile Gln Glu Asn Ile Asp Ala Phe Gly Gly
        195                  200                 205
Asp Lys Ser Lys Val Thr Ile Phe Gly Glu Ser Ala Gly Gly Asn Ser
    210                 215                 220
Val Gly Thr Gln Leu Ile Ala Tyr Gly Gly Arg Asp Asp Gly Leu Phe
225                 230                 235                 240
Arg Ala Ala Ile Ser Gln Ser Gly Ala Pro Ser Gly Leu Gly Arg Met
                245                 250                 255
Thr Thr Pro Glu Ser Trp Gln Pro Ala Tyr Asp Ala Leu Val Ser Lys
            260                 265                 270
Ala Gly Cys Ala Asp Ala Ala Asp Ser Leu Asp Cys Leu Arg Gly Val
        275                 280                 285
Pro Ala Asp Ala Leu Asn Ala Phe Ile Asn Ser Thr Asp Val Leu Ala
    290                 295                 300
Gly Pro Ala Arg Pro Val Ile Asp Gly Asp Leu Leu Thr Glu Val Gly
305                 310                 315                 320
Thr Thr Ser Leu Arg Ala Gly Arg Phe Val His Val Pro Tyr Leu Ile
                325                 330                 335
Gly Ala Asn Ala Asp Glu Gly Val Ser Phe Gly Val Arg Gly Ile Asn
            340                 345                 350
Thr Glu Asp Glu Phe Val Ala Met Val Gin Arg Ser Asn Ala Gly Leu
        355                 360                 365
Thr Arg Asp Asp Ala Leu Ala Ile Ala Ala Leu Tyr Pro Asp Asp Pro
    370                 375                 380
Asp Gln Gly Ile Pro Ser Thr Leu Lys Gly Arg Pro Gly Pro Asp Leu
385                 390                 395                 400
Gln Pro Leu Leu Gly Ser Met Trp Lys Arg Ser Ala Ala Tyr Gly Gly
                405                 410                 415
Asp Pro Ile Met His Ala Pro Arg Arg Ile Ala Asn Glu Glu Trp Ala
            420                 425                 430
Arg His Gly Val Pro Ser Tyr Ser Tyr His Phe Asp Val Leu Thr Asn
        435                 440                 445
Gly Ile Pro Asp Tyr Ala Gly Ser Thr His Phe Gin Glu Val Ala Phe
    450                 455                 460
Met Phe Asn Asn Thr Gly Gly Leu Gly Tyr Gly Asn Ala Val Ser Val
465                 470                 475                 480
Asn Pro Phe Gly Gly Met Pro Glu Ser Leu Lys Ser Leu Ser His Met
                485                 490                 495
Met Ala Arg Met Trp Ile Ser Phe Val Val Asn Leu Asp Pro Asn His
            500                 505                 510
Ile Gly Ile Gly Arg Trp Ile Pro Ser Val Met Arg Met Met Leu Leu
        515                 520                 525
Leu Trp Ile Cys Gly Tyr
    530
<210>9
<211>1792
<212>DNA
<213>粗糙脉孢菌(Neurospora crassa)
<400>9
atgaagggct tttccaacgc tctcctcgct acctccctgg ccctccttgg ccgggtctct   60
gctgccccag ctgagccccc tacccaggtg ttgcacaagc gagccgcccc gactgtcacc  120
atttccaccg gtacgattgt gggtgctaac ggcatcctca ctgaggcctt caacggaatc  180
ccctacgccc ttcctccgac cggcaacctt cgcctcaagc ctcccgtgag acttaagtcg  240
tctctgggtg tctttgatgc gtctggcatc ggccctgctt gcccccagtt ccttgctgac  300
acctcgtcga acgagtttct gcctcaggtt atcgataaga tcgttaacac gcagcttttc  360
aagactatac tcaacgtcaa ggaggactgc ttgaccatct cggtcactcg tcccaagggc   420
accaaggctg gtgataagct ccccgtcctt ttctggatct ttggtggtgg tttcgaagtg   480
agaaatccag cttatatacg cgatgtaatg aacaagtgct aaaacttcac agctcggatc   540
ggcgtccatg tacgatggcg ctcccctagt caccaacgct atcaacatgg gtaagccgta   600
cgtctacgtt gccgtcaact accgtgtcgg tggctttggt ttcatgcccg gaaaggagat   660
ccttaaggac ggctcttcca acttgggtca ccttgaccag cgcatgggcc tccagtgggt   720
tgccgacaac attgctgcct tcggcggtga cccagacaag gtcactatct ggggcgagtc   780
cgccggtgcc atgtccgttt tcaaccagat gtctctctat gacggtgaca acacgtacaa   840
cggcaagccc cttttccgtg gcgccatcat gaactctggt tccatcgtcc ccgccggccc   900
cgtcgactgc cccaagggcc agaaagtcta cgacaccgtc gtcaagaacg ccggctgctc   960
tggtgctgct gacacccttg cttgcctgcg cgctcttccc tacgagactt ttctcaaggc  1020
cgctaactcc gtgcctggga ttctgtcgta caactccgtt gctctttctt acctcccgcg  1080
acccgatggc aaggctttga ctcagagcgc cgataagctc atgctcgcta agaagtacgc  1140
cgccgtcccc atgatcatcg gcgatcaaga ggatgagggc actctcttct ccctcttcca  1200
gagcaacatc accaccacca gcaagctggt cagctacctc aacgatatct tcttcaacga  1260
cgccaccgag tcgcagatta agtctctcgt ctcgacctac agtaccctta tctccgccgg  1320
ctcgcccttt ggcaccggcc tcttcaacga gatttacccc ggcttcaagc gcctggccgc  1380
cattcttggc gatctcatct tcaccctcag ccgccgcatc tttctcgacg ccgccaccac  1440
tctcaacccc tcggtgcccg cctggtcgta tcttgcgtct tacaactttg gcacacccat  1500
ccttggaacc tttcacgcct ccgatatcct gcaggtgttc tacggcatcc tgcccaacta  1560
cgccagcaaa agcatccagt cttactacgc caactttgtt tacaaccttg accccaacga  1620
cgcctccggt ggcacttcct ctaagagcaa ggtcagccag gattggccgc aatggcagaa  1680
ggagagaaag ctggtccagt tcttttcgga ctatgccgga tatcttgcgg atgatttccg  1740
ctctgattcg tgtaactgga ttaaggctaa tcttgatgct cttcacatct aa          1792
<210>10
<211>578
<212>PRT
<213>粗糙脉孢菌(Neurospora crassa)
<400>10
Met Lys Gly Phe Ser Asn Ala Leu Leu Ala Thr Ser Leu Ala Leu Leu
1               5                   10                  15
Gly Arg Val Ser Ala Ala Pro Ala Glu Pro Pro Thr Gln Val Leu His
            20                  25                  30
Lys Arg Ala Ala Pro Thr Val Thr Ile Ser Thr Gly Thr Ile Val Gly
        35                  40                  45
Ala Asn Gly Ile Leu Thr Glu Ala Phe Asn Gly Ile Pro Tyr Ala Leu
    50                  55                  60
Pro Pro Thr Gly Asn Leu Arg Leu Lys Pro Pro Val Arg Leu Lys Ser
65                  70                  75                  80
Ser Leu Gly Val Phe Asp Ala Ser Gly Ile Gly Pro Ala Cys Pro Gln
                85                  90                  95
Phe Leu Ala Asp Thr Ser Ser Asn Glu Phe Leu Pro Gln Val Ile Asp
            100                 105                 110
Lys Ile Val Asn Thr Gln Leu Phe Lys Thr Ile Leu Asn Val Lys Glu
        115                 120                 125
Asp Cys Leu Thr Ile Ser Val Thr Arg Pro Lys Gly Thr Lys Ala Gly
    130                 135                 140
Asp Lys Leu Pro Val Leu Phe Trp Ile Phe Gly Gly Gly Phe Glu Leu
145                 150                 155                 160
Gly Ser Ala Ser Met Tyr Asp Gly Ala Pro Leu Val Thr Asn Ala Ile
                165                 170                 175
Asn Met Gly Lys Pro Tyr Val Tyr Val Ala Val Asn Tyr Arg Val Gly
            180                 185                 190
Gly Phe Gly Phe Met Pro Gly Lys Glu Ile Leu Lys Asp Gly Ser Ser
        195                 200                 205
Asn Leu Gly His Leu Asp Gln Arg Met Gly Leu Gln Trp Val Ala Asp
    210                 215                 220
Asn Ile Ala Ala Phe Gly Gly Asp Pro Asp Lys Val Thr Ile Trp Gly
225                 230                 235                 240
Glu Ser Ala Gly Ala Met Ser Val Phe Asn Gln Met Ser Leu Tyr Asp
                245                 250                 255
Gly Asp Asn Thr Tyr Asn Gly Lys Pro Leu Phe Arg Gly Ala Ile Met
            260                 265                 270
Asn Ser Gly Ser Ile Val Pro Ala Gly Pro Val Asp Cys Pro Lys Gly
        275                 280                 285
Gln Lys Val Tyr Asp Thr Val Val Lys Asn Ala Gly Cys Ser Gly Ala
    290                 295                 300
Ala Asp Thr Leu Ala Cys Leu Arg Ala Leu Pro Tyr Glu Thr Phe Leu
305                 310                 315                 320
Lys Ala Ala Asn Ser Val Pro Gly Ile Leu Ser Tyr Asn Ser Val Ala
                325                 330                 335
Leu Ser Tyr Leu Pro Arg Pro Asp Gly Lys Ala Leu Thr Gln Ser Ala
            340                 345                 350
Asp Lys Leu Met Leu Ala Lys Lys Tyr Ala Ala Val Pro Met Ile Ile
        355                 360                 365
Gly Asp Gln Glu Asp Glu Gly Thr Leu Phe Ser Leu Phe Gln Ser Asn
    370                 375                 380
Ile Thr Thr Thr Ser Lys Leu Val Ser Tyr Leu Asn Asp Ile Phe Phe
385                 390                 395                 400
Asn Asp Ala Thr Glu Ser Gln Ile Lys Ser Leu Val Ser Thr Tyr Ser
                405                 410                 415
Thr Leu Ile Ser Ala Gly Ser Pro Phe Gly Thr Gly Leu Phe Asn Glu
            420                 425                 430
Ile Tyr Pro Gly Phe Lys Arg Leu Ala Ala Ile Leu Gly Asp Leu Ile
        435                 440                 445
Phe Thr Leu Ser Arg Arg Ile Phe Leu Asp Ala Ala Thr Thr Leu Asn
    450                 455                 460
Pro Ser Val Pro Ala Trp Ser Tyr Leu Ala Ser Tyr Asn Phe Gly Thr
465                 470                 475                 480
Pro Ile Leu Gly Thr Phe His Ala Ser Asp Ile Leu Gln Val Phe Tyr
                485                 490                 495
Gly Ile Leu Pro Asn Tyr Ala Ser Lys Ser Ile Gln Ser Tyr Tyr Ala
            500                 505                 510
Asn Phe Val Tyr Asn Leu Asp Pro Asn Asp Ala Ser Gly Gly Thr Ser
        515                 520                 525
Ser Lys Ser Lys Val Ser Gln Asp Trp Pro Gln Trp Gln Lys Glu Arg
    530                 535                 540
Lys Leu Val Gln Phe Phe Ser Asp Tyr Ala Gly Tyr Leu Ala Asp Asp
545                 550                 555                 560
Phe Arg Ser Asp Ser Cys Asn Trp Ile Lys Ala Asn Leu Asp Ala Leu
                565                 570                 575
His Ile
<210>11
<211>36
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>11
acacaactgg ccatgcatct cctccgggtt gttctg                        36
<210>12
<211>40
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>12
agtcacctct agttaattaa ctagatatgg aacgaatcca          40
<210>13
<211>22
<212>DNA
<213>构巢曲霉(Aspergillus nidulens)
<400>13
gtgccccatg atacgcctcc gg                             22
<210>14
<211>26
<212>DNA
<213>构巢曲霉(Aspergillus nidulens)
<400>14
gagtcgtatt tccaaggctc ctgacc                         26
<210>15
<211>24
<212>DNA
<213>构巢曲霉(Aspergillus nidulens)
<400>15
ggaggccatg aagtggacca acgg                           24
<210>16
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>16
caccgtgaaa gccatgctct ttccttcgtg tagaagacca gacag    45
<210>17
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>17
ctggtcttct acacgaagga aagagcatgg ctttcacggt gtctg    45
<210>18
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>18
ctatatacac aactggattt accatgggcc cgcggccgca gatc     44
<210>19
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>19
gatctgcggc cgcgggccca tggtaaatcc agttgtgtat atag 44
<210>20
<211>26
<212>DNA
<213>构巢曲霉(Aspergillus nidulens)
<400>20
gtcgacatgg tgttttgatc atttta                     26
<210>21
<211>26
<212>DNA
<213>构巢曲霉(Aspergillus nidulens)
<400>21
ccatggccag ttgtgtatat agagga                     26
<210>22
<211>30
<212>DNA
<213>禾本科镰孢(Fusarium graminearum)
<400>22
cactgctatc accaacatga gattctctgg                 30
<210>23
<211>35
<212>DNA
<213>禾本科镰孢(Fusarium graminearum)
<400>23
ccaacaaggt atttaattaa tcataccacc aaagc           35
<210>24
<211>27
<212>DNA
<213>Fusarium venenatum
<400>24
gcaggaaaga acaagtgagc aaaaggc                    27
<210>25
<211>27
<212>DNA
<213>Fusarium venenatum
<400>25
gccttttgct cacttgttct ttcctgc                    27
<210>26
<211>15
<212>DNA
<213>Fusarium venenatum
<400>26
dcctacatgt ttaat                                 15
<210>27
<211>13
<212>DNA
<213>Fusarium venenatum
<400>27
dtaaacatgt agg                                          13
<210>28
<211>21
<212>DNA
<213>Fusarium venenatum
<400>28
aggcctcacc catctcaaca c                                 21
<210>29
<211>21
<212>DNA
<213>Fusarium venenatum
<400>29
acatgttggt gatagcagtg a                                 21
<210>30
<211>36
<212>DNA
<213>Magnaporthe grisea
<400>30
acacaactgg ccatgaaagc ctccattctt tcggct                 36
<210>31
<211>40
<212>DNA
<213>Magnaporthe grisea
<400>31
agtcacctct agttaattaa ttaaatgtaa aagctgagga             40
<210>32
<211>24
<212>DNA
<213>Magnaporthe grisea
<400>32
attttcccgg ctcgacgctt ctgt                             24
<210>33
<211>27
<212>DNA
<213>Magnaporthe grisea
<400>33
tcatgatgcg tcaatccatc ttccagt                          27
<210>34
<211>26
<212>DNA
<213>Magnaporthe grisea
<400>34
ggacgagttc gtcgccatgg tgcagc                          26
<210>35
<211>26
<212>DNA
<213>Magnaporthe grisea
<400>35
gctgcaccat ggcgacgaac tcgtcc                          26
<210>36
<211>37
<212>DNA
<213>Magnaporthe grisea
<400>36
tttaattaat tagtacccgc aaatccataa caacaac              37
<210>37
<211>40
<212>DNA
<213>粗糙脉孢菌(Neurospora crassa)
<400>37
acacaactgg ccatgaaggg cttttccaac gctctcctcg           40
<210>38
<211>46
<212>DNA
<213>粗糙脉孢菌(Neurospora crassa)
<400>38
agtcacctct agttaattaa ttagatgtga agagcatcaa gattag    46

Claims (48)

1.具有脂肪酶活性的分离多肽,选自下面的组:
(a)具有如下氨基酸序列的多肽,该氨基酸序列与SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少60%的同一性;
(b)由如下多核苷酸编码的多肽,该多核苷酸在至少中等严紧条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ IDNO:9的成熟多肽编码序列,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链发生杂交;和
(c)在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽中包含一个或多个氨基酸的保守替代、缺失和/或插入的变体。
2.权利要求1的多肽,具有与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少60%同一性的氨基酸序列。
3.权利要求2的多肽,具有与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少65%同一性的氨基酸序列。
4.权利要求3的多肽,具有与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少70%同一性的氨基酸序列。
5.权利要求4的多肽,具有与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少75%同一性的氨基酸序列。
6.权利要求5的多肽,具有与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少80%同一性的氨基酸序列。
7.权利要求6的多肽,具有与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少85%同一性的氨基酸序列。
8.权利要求7的多肽,具有与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少90%同一性的氨基酸序列。
9.权利要求8的多肽,具有与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少95%同一性的氨基酸序列。
10.权利要求1-9任一项的多肽,其中所述多肽包含SEQ ID NO:2、SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的氨基酸序列或其具有脂肪酶活性的片段。
11.权利要求10的多肽,其中所述多肽包含SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的氨基酸序列。
12.权利要求10或11的多肽,其中所述多肽包含SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。
13.权利要求1-9任一项的多肽,其中所述多肽由SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10,或其具有脂肪酶活性的片段组成。
14.权利要求13的多肽,其中所述多肽由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10组成。
15.权利要求13或14的多肽,其中所述多肽由SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽组成。
16.权利要求1的多肽,其中所述多肽由在至少中等严紧条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链发生杂交的多核苷酸编码。
17.权利要求16的多肽,其中所述多肽由在至少中等-高严紧条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链发生杂交的多核苷酸编码。
18.权利要求17的多肽,其中所述多肽由在至少高严紧条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链发生杂交的多核苷酸编码。
19.权利要求1的多肽,其中所述多肽是在SEQ ID NO:2中第21至562位氨基酸、SEQ ID NO:4中第25至588位氨基酸、SEQ ID NO:6中第21至598位氨基酸、SEQ ID NO:8中第19至534位氨基酸或SEQ ID NO:10中第22至578位氨基酸中包含一个或多个氨基酸的保守取代、缺失、和/或插入的变体。
20.权利要求1的多肽,其中所述多肽由包含在下列质粒中的多核苷酸编码:包含在大肠杆菌NRRL B-30803中的质粒pSMO230、包含在大肠杆菌NRRL B-30782中的质粒pJLin173、包含在大肠杆菌NRRL B-30783中的质粒pJLin175或包含在大肠杆菌NRRL B-30788中的质粒pCrAm140。
21.权利要求1-20任一项的多肽,其中所述多肽还具有磷脂酶活性、甾醇酯酯酶活性和/或半乳糖脂酶活性。
22.权利要求1-9、12和15中任一项的多肽,其中所述成熟多肽是SEQID NO:2中第21至562位氨基酸、SEQ ID NO:4中第25至588位氨基酸、SEQ ID NO:6中第21至598位氨基酸、SEQ ID NO:8中第19至534位氨基酸或SEQ ID NO:10中第22至578位氨基酸。
23.权利要求1和16-18中任一项的多肽,其中所述成熟多肽编码序列是SEQ ID NO:1中第61至1686位核苷酸,SEQ ID NO:3中第73至1764位核苷酸,SEQ ID NO:5中第61至1922位核苷酸,SEQ ID NO:7中第55至1602位核苷酸或SEQ ID NO:9中第64至1789位核苷酸。
24.分离多核苷酸,包含编码权利要求1-23任一项的多肽的核苷酸序列的。
25.权利要求24的分离多核苷酸,在SEQ ID NO:1、SEQ ID NO:3、SEQID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列中具有至少一个突变,其中突变的核苷酸序列分别编码SEQ ID NO:2、SEQ ID NO:4、SEQID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。
26.核酸构建体,包含权利要求24或25的多核苷酸,所述多核苷酸与指导多肽在表达宿主中产生的一种或多种控制序列可操作连接。
27.包含权利要求26的核酸构建体的重组表达载体。
28.包含权利要求26的核酸构建体的重组宿主细胞。
29.产生权利要求1-23任一项的多肽的方法,包括:(a)在有利于多肽产生的条件下培养细胞,其中该细胞的野生型形式能够产生所述多肽;并(b)回收所述多肽。
30.产生权利要求1-23任一项的多肽的方法,包括:(a)在有利于多肽产生的条件下培养包含核酸构建体的宿主细胞,该核酸构建体包含编码所述多肽的核苷酸序列;并(b)回收所述多肽。
31.产生亲本细胞突变体的方法,包括破坏或缺失编码权利要求1-23任一项的多肽的核苷酸序列,导致该突变体产生比亲本细胞少的所述多肽。
32.通过权利要求31的方法产生的突变体细胞。
33.权利要求32的突变体细胞,其中所述突变体细胞还包含编码天然或异源蛋白的基因。
34.产生蛋白质的方法,包括:(a)在有利于蛋白质产生的条件下培养权利要求33的突变体细胞;并(b)回收所述蛋白质。
35.一种分离多核苷酸,其通过下述方法获得:(a)在中等严紧条件下使DNA群体与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链进行杂交;并(b)分离发生杂交的多核苷酸,其编码具有脂肪酶活性的多肽。
36.权利要求35的分离多核苷酸,其通过下述方法获得:(a)在中等-高严紧条件下使DNA群体与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链进行杂交;并(b)分离发生杂交的多核苷酸,其编码具有脂肪酶活性的多肽。
37.权利要求36的分离多核苷酸,其通过下述方法获得:(a)在高严紧条件下使DNA群体与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列所含cDNA序列,或(iii),(i)或(ii)的互补链进行杂交;并(b)分离发生杂交的多核苷酸,其编码具有脂肪酶活性的多肽。
38.权利要求35的分离多核苷酸,其中所述成熟多肽编码序列是SEQID NO:1中第61至1686位核苷酸,SEQ ID NO:3中第73至1764位核苷酸,SEQ ID NO:5中第61至1922位核苷酸,SEQ ID NO:7中第55至1602位核苷酸或SEQ ID NO:9中第64至1789位核苷酸。
39.产生具有突变核苷酸序列的多核苷酸的方法,包括:(a)在SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列中引入至少一个突变,其中突变的核苷酸序列分别编码由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽组成的多肽;并(b)回收包含突变核苷酸序列的多核苷酸。
40.通过权利要求39的方法产生的突变多核苷酸。
41.产生多肽的方法,包括:(a)在有利于多肽产生的条件下,培养包含编码所述多肽的权利要求40的突变多核苷酸的细胞;并(b)回收所述多肽。
42.核酸构建体,包含编码蛋白质的基因,其中该基因可操作地连接于编码信号肽的核苷酸序列,所述核苷酸序列包含下述核苷酸或由下述核苷酸组成:SEQ ID NO:1中第1至60位核苷酸,SEQ ID NO:3中第1至72位核苷酸,SEQ ID NO:5中第1至60位核苷酸,SEQ ID NO:7中第1至54位核苷酸,或SEQ ID NO:9中第1至63位核苷酸,其中所述基因对于所述核苷酸序列是外源的。
43.包含权利要求42的核酸构建体的重组表达载体。
44.包含权利要求42的核酸构建体的重组宿主细胞。
45.产生蛋白质的方法,包括:(a)在有利于蛋白质产生的条件下培养权利要求44的重组宿主细胞;并(b)回收所述蛋白质。
46.产生权利要求1-23任一项的多肽的方法,包括:(a)在有利于多肽产生的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码具有脂肪酶活性的多肽;并(b)回收所述多肽。
47.转基因植物、植株部分或植物细胞,其被编码权利要求1-23任一项的多肽的多核苷酸转化。
48.去污剂组合物,包含权利要求1-23任一项的多肽和表面活性剂。
CNA2005800439709A 2004-10-21 2005-10-21 具有脂肪酶活性的多肽以及编码该多肽的多核苷酸 Pending CN101160396A (zh)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US62128204P 2004-10-21 2004-10-21
US60/621,282 2004-10-21
US62980604P 2004-11-18 2004-11-18
US60/629,806 2004-11-18
US63374104P 2004-12-06 2004-12-06
US60/633,741 2004-12-06
US64333805P 2005-01-12 2005-01-12
US60/643,338 2005-01-12
US11/255,553 US7662602B2 (en) 2004-10-21 2005-10-21 Polypeptides having lipase activity and polynucleotides encoding same
US12/687,696 US7855172B2 (en) 2004-10-21 2010-01-14 Polypeptides having lipase activity and polynucleotides encoding same
US12/944,557 US7955830B2 (en) 2004-10-21 2010-11-11 Polypeptides having lipase activity and polynucleotides encoding same
US13/114,258 US8067218B2 (en) 2004-10-21 2011-05-24 Polypeptides having lipase activity and polynucleotides encoding same
US13/294,047 US8158400B2 (en) 2004-10-21 2011-11-10 Polypeptides having lipase activity and polynucleotides encoding same
US13/440,626 US8263824B2 (en) 2004-10-21 2012-04-05 Polypeptides having lipase activity and polynucleotides encoding same
US13/599,199 US8383383B2 (en) 2004-10-21 2012-08-30 Polypeptides having lipase activity and polynucleotides encoding same

Publications (1)

Publication Number Publication Date
CN101160396A true CN101160396A (zh) 2008-04-09

Family

ID=35717538

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800439709A Pending CN101160396A (zh) 2004-10-21 2005-10-21 具有脂肪酶活性的多肽以及编码该多肽的多核苷酸

Country Status (4)

Country Link
US (8) US7662602B2 (zh)
EP (1) EP1812566A2 (zh)
CN (1) CN101160396A (zh)
WO (1) WO2006047469A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102933699A (zh) * 2010-06-10 2013-02-13 宝洁公司 包含细菌来源的脂肪酶的固体洗涤剂组合物
WO2014082513A1 (zh) * 2012-11-30 2014-06-05 青岛蔚蓝生物集团有限公司 脂肪酶及其用途
CN111500474A (zh) * 2009-12-18 2020-08-07 诺维信股份有限公司 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
CN111718946A (zh) * 2019-03-04 2020-09-29 中国科学院天津工业生物技术研究所 一种密码子优化的脂肪酶基因、工程菌及其纺织应用
CN112654708A (zh) * 2018-07-06 2021-04-13 国立大学法人东海国立大学机构 分解含反式脂肪酸油脂的新型脂肪酶
CN113122521A (zh) * 2019-12-31 2021-07-16 丰益国际有限公司 具有脂肪酶活性的多肽及其用途

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080242570A1 (en) * 2007-03-26 2008-10-02 John David Carter Liquid composition system having a visual indication change
BR112013032861A2 (pt) 2011-07-22 2017-01-24 Novozymes North America Inc métodos para aumentar a atividade da enzima celulolítica durante a hidrólise do material celulósico, para hidrolisar um material celulósico pré-tratado, para a produção de um produto da fermentação, e para a fermentação de um material celulósico pré-tratado
WO2014140165A1 (en) 2013-03-14 2014-09-18 Dsm Ip Assets B.V. Cell wall deconstruction enzymes of paecilomyces byssochlamydoides and uses thereof
WO2014140167A1 (en) 2013-03-14 2014-09-18 Dsm Ip Assets B.V. Cell wall deconstruction enzymes of malbranchea cinnamomea and uses thereof
WO2015087833A1 (ja) * 2013-12-10 2015-06-18 天野エンザイム株式会社 改変型リパーゼ及びその用途
CN106062276B (zh) 2014-03-05 2019-06-11 诺维信公司 用于将材料功能化并且进行连接的组合物和方法
WO2015134691A1 (en) 2014-03-05 2015-09-11 Novozymes A/S Formulations comprising polymeric xyloglucan as a carrier for agriculturally beneficial agents
US10123535B2 (en) 2014-03-05 2018-11-13 Novozymes A/S Compositions and methods for improving post-harvest properties of agricultural crops
US20160348035A1 (en) 2014-03-05 2016-12-01 Novozymes A/S Compositions and Methods for Improving Properties of Non-Cellulosic Textile Materials with Xyloglucan Endotransglycosylase
US20160333292A1 (en) 2014-03-05 2016-11-17 Novozymes A/S Compositions and Methods for Improving Properties of Cellulosic Textile Materials with Xyloglucan Endotransglycosylase
WO2016028999A1 (en) 2014-08-20 2016-02-25 Novozymes A/S Xyloglucan endotransglycosylase variants and polynucleotides encoding same
US10781428B2 (en) 2014-12-02 2020-09-22 Novozymes A/S Laccase variants and polynucleotides encoding same
EP3230442B1 (en) * 2014-12-09 2019-05-22 Novozymes A/S Lipase variants and polynucleotides encoding same
EP3677682A4 (en) * 2017-09-01 2021-05-05 Amano Enzyme Inc. MODIFIED LIPASE AND USE OF IT
CN108359654B (zh) * 2018-03-02 2021-11-05 江苏中酶生物科技有限公司 一种具有磷脂酶b活性的多肽或蛋白质及其应用
WO2023203080A1 (en) 2022-04-20 2023-10-26 Novozymes A/S Process for producing free fatty acids

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6103505A (en) * 1996-12-09 2000-08-15 Novo Nordisk A/S Method for reducing phosphorus content of edible oils
DE69825263T3 (de) * 1997-04-09 2009-03-12 Danisco A/S Lipase und verwendung davon zur verbesserung von teigen und backwaren
US20030082595A1 (en) 2001-08-03 2003-05-01 Bo Jiang Nucleic acids of aspergillus fumigatus encoding industrial enzymes and methods of use
CN1675355A (zh) * 2002-08-19 2005-09-28 帝斯曼知识产权资产管理有限公司 新颖的脂肪酶及其用途

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111500474A (zh) * 2009-12-18 2020-08-07 诺维信股份有限公司 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
CN111500474B (zh) * 2009-12-18 2023-10-03 诺维信股份有限公司 用于在木霉属的蛋白酶缺陷突变体中产生多肽的方法
CN102933699A (zh) * 2010-06-10 2013-02-13 宝洁公司 包含细菌来源的脂肪酶的固体洗涤剂组合物
WO2014082513A1 (zh) * 2012-11-30 2014-06-05 青岛蔚蓝生物集团有限公司 脂肪酶及其用途
CN112654708A (zh) * 2018-07-06 2021-04-13 国立大学法人东海国立大学机构 分解含反式脂肪酸油脂的新型脂肪酶
CN111718946A (zh) * 2019-03-04 2020-09-29 中国科学院天津工业生物技术研究所 一种密码子优化的脂肪酶基因、工程菌及其纺织应用
CN111718946B (zh) * 2019-03-04 2022-04-15 中国科学院天津工业生物技术研究所 一种密码子优化的脂肪酶基因、工程菌及其纺织应用
CN113122521A (zh) * 2019-12-31 2021-07-16 丰益国际有限公司 具有脂肪酶活性的多肽及其用途
CN113122521B (zh) * 2019-12-31 2024-05-14 丰益国际有限公司 具有脂肪酶活性的多肽及其用途

Also Published As

Publication number Publication date
WO2006047469A2 (en) 2006-05-04
US20120058930A1 (en) 2012-03-08
US8158400B2 (en) 2012-04-17
US8067218B2 (en) 2011-11-29
EP1812566A2 (en) 2007-08-01
US8563286B2 (en) 2013-10-22
US20110224123A1 (en) 2011-09-15
US20080020425A1 (en) 2008-01-24
US8383383B2 (en) 2013-02-26
US20130152234A1 (en) 2013-06-13
US7855172B2 (en) 2010-12-21
WO2006047469A8 (en) 2007-09-20
US20100120654A1 (en) 2010-05-13
US20110053822A1 (en) 2011-03-03
US7662602B2 (en) 2010-02-16
US7955830B2 (en) 2011-06-07
WO2006047469A3 (en) 2006-11-30
US20130025005A1 (en) 2013-01-24
US20120192316A1 (en) 2012-07-26
US8263824B2 (en) 2012-09-11

Similar Documents

Publication Publication Date Title
CN101084307B (zh) 具有脂肪酶活性的多肽和编码其的多核苷酸
CN101160396A (zh) 具有脂肪酶活性的多肽以及编码该多肽的多核苷酸
CN1902310B (zh) 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸
CN101137750B (zh) 具有纤维二糖水解酶活性的多肽和编码它的多核苷酸
CN101253263B (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CA2707847A1 (en) Polypeptides having acetylxylan esterase activity and polynucleotides encoding same
CN103314091A (zh) 具有磷脂酶c活性的多肽及其编码多核苷酸
CN101374947A (zh) 具有脂肪酶活性的多肽和编码该多肽的多核苷酸
CN104471048A (zh) 具有脂肪酶活性的多肽及编码它的多核苷酸
CN105051174B (zh) 具有脂肪酶活性的多肽和编码它们的多核苷酸
CN101883848A (zh) 具有蛋白酶活性的多肽和编码该多肽的多核苷酸
US20110296557A1 (en) Polypeptides Having Lipase Activity And Polynucleotides Encoding Same
CN104204199A (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20080409