CN116529375A - 用于提高蛋白质产量的糖基转移酶变体 - Google Patents

用于提高蛋白质产量的糖基转移酶变体 Download PDF

Info

Publication number
CN116529375A
CN116529375A CN202180069556.4A CN202180069556A CN116529375A CN 116529375 A CN116529375 A CN 116529375A CN 202180069556 A CN202180069556 A CN 202180069556A CN 116529375 A CN116529375 A CN 116529375A
Authority
CN
China
Prior art keywords
seq
polypeptide
substitution
host cell
fusarium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180069556.4A
Other languages
English (en)
Inventor
井原美智子
仲西隆志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes AS filed Critical Novozymes AS
Publication of CN116529375A publication Critical patent/CN116529375A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2428Glucan 1,4-alpha-glucosidase (3.2.1.3), i.e. glucoamylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2462Lysozyme (3.2.1.17)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/66Aspergillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/885Trichoderma

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种编码糖基转移酶变体的多核苷酸变体,以及包含所述多核苷酸变体的核酸构建体、载体和宿主细胞。本发明还涉及在包含所述多核苷酸和/或糖基转移酶变体的宿主细胞中产生目的多肽的方法。

Description

用于提高蛋白质产量的糖基转移酶变体
序列表的引用
本申请含有计算机可读形式的序列表,其通过援引并入本文。
发明背景
技术领域
本发明涉及编码糖基转移酶变体的多核苷酸变体,并且涉及包含所述多核苷酸变体的核酸构建体、载体和宿主细胞,且涉及包含所述糖基转移酶变体的宿主细胞,以及在包含所述多核苷酸和/或糖基转移酶变体的宿主细胞中产生目的多肽的方法。
背景技术
在真菌宿主中表达重组基因是生产重组蛋白的常用方法。在此类真菌系统中产生的重组蛋白是酶和其他有价值的蛋白质。在工业和商业目的中,所用细胞系统的生产率,即每个发酵单位的总蛋白质产量,是生产成本的一个重要因素。传统上,产率的增加是通过诱变和筛选增加目的蛋白质的产量来实现的。然而,这种方法主要仅适用于在含有目的酶的分离物中过量生产内源蛋白。因此,对于每种新的蛋白质或酶产品,都需要一个漫长的菌株和工艺开发计划来实现生产率提高。
对于异源蛋白在真菌系统中的过量表达,生产过程被认为是复杂的多阶段和多组分过程。细胞生长和产物形成由多种参数决定,包括培养基的组成、发酵pH、发酵温度、溶解氧张力、剪应力和真菌形态。
在真菌中已经使用了各种方法来改善转录。对于异源基因的表达,密码子优化的合成基因可以提高转录率。为了获得特定基因的高水平表达,一个成熟的程序是将重组基因构建体的多个拷贝靶向高表达内源基因的基因座。此外,对于异种蛋白的分泌,融合策略用于促进分泌途径中的易位,并保护异源蛋白不被降解。WO 2011/075677(Novozymes A/S)中描述了通过破坏天然蛋白酶来减少重组蛋白的蛋白水解降解并由此提高蛋白质产率的进一步策略。尽管提出了这些方法,但进一步提高真菌宿主细胞中的重组蛋白产量仍是持续感兴趣的。
本发明的目的是提供一种经修饰的真菌宿主菌株和一种具有增加的重组蛋白生产率的蛋白生产方法。
发明内容
本发明基于以下令人惊讶和创造性的发现:与具有天然alg3基因的真菌宿主细胞中相同异源蛋白的表达相比,真菌宿主细胞中alg3基因中的某些单核苷酸多态性(SNP)提供了异源蛋白的改善的表达、活性和/或产率。令人惊讶的是,本发明人已经发现了Alg3氨基酸取代来产生宿主细胞变体,其显示出提高的产物产率,而没有使Alg3糖基化活性失活。
alg3基因编码Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶,称为Alg3,其参与蛋白质的N-糖基化。Alg3催化第一个dol-P-Man衍生的甘露糖以α1,3-键添加到Man5GlcNAc2-PP-Dol,从而产生Man6GlcNAc2-PP-Dol。在人类中,alg3基因的缺陷与以异常N-糖基化为特征的先天性糖基化Id型障碍(CDG-Id)相关。令人惊讶的是,通过真菌宿主细胞中alg3基因的突变,本发明导致重组蛋白的生产力和/或活性(例如葡糖淀粉酶和溶菌酶的生产力和/或活性)增加。如可以从以下实例中看出,携带表达Alg3的R15*、T17I和/或L137F突变体的alg3基因变体的黑曲霉(Aspergillus niger)宿主细胞提供了深褐褶菌(Gloeophyllumsepiarium)葡糖淀粉酶变体(SEQ ID NO:9,也参见WO 2018/191215中的实例1)的提高的活性和/或产率。如可以从以下实例中进一步看出,携带表达Alg3的S19I和/或L139F突变体的alg3基因变体的里氏木霉(Trichoderma reesei)宿主细胞提供了嗜碱枝顶孢(Acremoniumalcalophilum)溶菌酶变体的提高的活性和/或产率。因此,我们预计这一发现也适用于其他蛋白质,例如其他糖蛋白,并且特别是其他葡糖淀粉酶和溶菌酶。
因此,在第一方面,本发明涉及一种真菌宿主细胞,该真菌宿主细胞在其基因组中包含编码目的多肽的第一多核苷酸;以及第二多核苷酸,该第二多核苷酸编码与SEQ IDNO:7具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15、17和/或137的位置处包含至少一个改变的多肽。
本发明还涉及一种真菌宿主细胞,该真菌宿主细胞在其基因组中包含编码目的多肽的第一多核苷酸;以及第二多核苷酸,该第二多核苷酸编码与SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:21的位置19和/或139的位置处包含至少一个改变的多肽。
在第二方面,本发明涉及一种用于生产目的多肽的方法,该方法包括:
i)提供根据第一方面的真菌宿主细胞;
ii)在有助于目的多肽表达的条件下培养所述宿主细胞;以及,任选地iii)回收该目的多肽。
在第三方面,本发明涉及一种包含异源启动子的核酸构建体,该异源启动子可操作地连接至编码如下多肽的多核苷酸,该多肽与SEQ ID NO:7或SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15、17和/或137或对应于SEQ ID NO:21的位置19和/或139的位置处包含至少一个改变。
在最后和第四方面,本发明涉及一种表达载体,该表达载体包含根据本发明第三方面的核酸构建体。
附图说明
图1示出了质粒plhar531的示意图。
图2示出了GSA202蛋白的MS分析,用于研究以(m/z)为单位的MS峰表示的完整分子量。
图3示出了黑曲霉和里氏木霉的Alg3野生型之间的多肽序列比对。
图4示出了质粒pGMEr280的示意图。
定义
根据此详细描述,以下定义适用。注意,单数形式“一种/个(a/an)”以及“该/这些(the)”包括复数个指示物,除非上下文中另外明确指明。
本文提及“约”值或参数包括针对该值或参数本身的方面。例如,提及“约X”的描述包括方面“X”。
除非另外定义或由上下文明确指示,否则本文所用的全部技术与科学术语具有如本发明所属领域的普通技术人员通常理解的相同含义。
Alg3:术语“Alg3”意指具有Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性(EC编号2.4.1.258)的蛋白质,其催化第一个dol-P-Man衍生的甘露糖以α1,3-键添加到Man5GlcNAc2-PP-Dol,从而产生Man6GlcNAc2-PP-Dol。Alg3蛋白由alg3基因编码。根据本发明,与天然Alg3蛋白相比,在对应于SEQ ID NO:7的位置15、17和/或137,或对应于SEQ IDNO:21的位置19和/或139的位置处具有改变的Alg3蛋白显示出改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性。
cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体,通过一系列步骤(包括剪接)对前体进行加工,然后呈现为成熟的剪接的mRNA。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框确定,该开放阅读框以起始密码子(例如ATG、GTG或TTG)开始并且以终止密码子(例如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于表达编码本发明的多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码多肽的多核苷酸而言可以是天然的(即,来自相同基因)或异源的(即,来自不同基因),或者相对于彼此是天然的或异源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。最少,这些控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制位点的目的,这些控制序列可以提供有多个接头。
表达:术语“表达”意指涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意指直链或环状DNA分子,其包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
融合多肽:术语“融合多肽”是其中一种多肽在本发明多肽的N-末端或C-末端融合的多肽。通过将编码另一种多肽的多核苷酸与本发明的多核苷酸融合来生产融合多肽。用于产生融合多肽的技术是本领域已知的,且包括连接编码多肽的编码序列使得它们符合读框,而且融合多肽的表达处于一个或多个相同的启动子和终止子的控制之下。还可以使用内含肽技术构建融合多肽,其中在翻译后产生融合多肽(Cooper等人,1993,EMBO J.[欧洲分子生物学学会杂志]12:2575-2583;Dawson等人,1994,Science[科学]266:776-779)。融合多肽可进一步包含两个多肽之间的切割位点。在融合蛋白分泌之时,位点被切割,从而释放出这两种多肽。切割位点的实例包括但不限于在以下文献中披露的位点:Martin等人,2003,J.Ind.Microbiol.Biotechnol.[工业微生物生物技术杂志]3:568-576;Svetina等人,2000,J.Biotechnol.[生物技术杂志]76:245-251;Rasmussen-Wilson等人,1997,Appl.Environ.Microbiol.[应用与环境微生物学]63:3488-3493;Ward等人,1995,Biotechnology[生物技术]13:498-503;和Contreras等人,1991,Biotechnology[生物技术]9:378-381;Eaton等人,1986,Biochemistry[生物化学]25:505-512;Collins-Racie等人,1995,Biotechnology[生物技术]13:982-987;Carter等人,1989,Proteins:Structure,Function,and Genetics[蛋白质:结构、功能以及遗传学]6:240-248;以及Stevens,2003,Drug Discovery World[药物发现世界]4:35-48。
葡糖淀粉酶:术语“葡糖淀粉酶”意指具有葡糖淀粉酶活性(EC编号3.2.1.3)的蛋白质,其催化末端(1->4)-连接的α-D-葡萄糖残基依次从链的非还原端水解并释放β-D-葡萄糖。出于本发明的目的,根据实例中所描述的程序确定葡糖淀粉酶活性。在一方面,本发明的多肽具有至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的SEQ ID NO:9或SEQ ID NO:11的成熟多肽的葡糖淀粉酶活性。术语“葡糖淀粉酶”可与术语“淀粉葡糖苷酶”、“葡聚糖1,4-α-葡糖苷酶”和/或“γ-淀粉酶”互换。
糖蛋白:术语“糖蛋白”意指其中非蛋白基团是碳水化合物的缀合蛋白。糖蛋白含有共价附接至多肽侧链的寡糖链/聚糖。碳水化合物在共翻译修饰和/或翻译后修饰过程中附接至蛋白质。糖蛋白可以含有N-连接和/或O-连接的寡糖残基。糖蛋白的非限制性实例是α-葡糖苷酶,例如SEQ ID NO:9或SEQ ID NO:11的葡糖淀粉酶。
异源:对于宿主细胞,术语“异源的”意指多肽或核酸不是宿主细胞中天然存在的。对于多肽或核酸,术语“异源的”意指控制序列(例如多肽或核酸的启动子或结构域)不与该多肽或核酸天然地相关联,即,控制序列是来自编码SEQ ID NO:7或SEQ ID NO:21的成熟多肽的基因以外的基因。
宿主细胞:术语“宿主细胞”意指其中引入了包含本发明多核苷酸的核酸构建体或表达载体的任何微生物或植物细胞。引入方法包括但不限于原生质体融合、转染、转化、电穿孔、接合和转导。在一些实施例中,宿主细胞是分离的重组宿主细胞,其与至少一种其他组分(包括但不限于蛋白质、核酸、细胞等)部分或完全分离。
杂交:术语“杂交”意指使用标准DNA印迹程序将核酸的基本上互补的链配对。杂交可以在中、中-高、高或非常高严格条件下进行。中严格条件意指在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切和变性鲑鱼精子DNA和35%甲酰胺中进行12至24小时的预杂交和杂交,随后在55℃下使用0.2X SSC、0.2% SDS洗涤3次,每次15分钟。中-高严格条件意指在42℃下在5X SSPE、0.3% SDS、200微克/ml剪切和变性鲑鱼精子DNA和35%甲酰胺中进行12至24小时的预杂交和杂交,随后在60℃下使用0.2X SSC、0.2% SDS洗涤3次,每次15分钟。高严格条件意指在42℃下在5X SSPE、0.3% SDS、200微克/ml剪切和变性鲑鱼精子DNA和50%甲酰胺中进行12至24小时的预杂交和杂交,随后在65℃下使用0.2X SSC、0.2% SDS洗涤3次,每次15分钟。非常高严格条件意指在42℃下在5X SSPE、0.3% SDS、200微克/ml剪切和变性鲑鱼精子DNA和50%甲酰胺中进行12至24小时的预杂交和杂交,随后在70℃下使用0.2X SSC、0.2% SDS洗涤3次,每次15分钟。
分离的:术语“分离的”是指多肽、核酸、细胞或其他特定材料或组分,其与在自然界中发现的与其天然相关联的至少一种其他材料或组分(包括但不限于,例如,其他蛋白质,核酸,细胞等)分离。分离的多肽包括但不限于含有分泌的多肽的培养液。
溶菌酶:术语“溶菌酶”意指具有溶菌酶活性(EC编号3.2.1.17)的蛋白质,其催化O-和S-糖基化合物的水解。出于本发明的目的,根据实例中所描述的程序确定溶菌酶活性。在一方面,本发明的这些多肽具有SEQ ID NO:33的成熟多肽的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少100%的溶菌酶活性。术语“溶菌酶”可与术语“自溶素”、“球蛋白G”、“胞壁质酶”、“1,4-β-N-乙酰胞壁质酶”和/或“N-乙酰胞壁质聚糖水解酶”互换。
成熟多肽:术语“成熟多肽”意指在N-末端加工(例如,信号肽的去除)后处于其成熟形式的多肽。在一个实施例中,成熟Alg3多肽是SEQ ID NO:7。在优选实施例中,成熟Alg3多肽是SEQ ID NO:8。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有生物活性的成熟多肽的多核苷酸。
天然的:术语“天然的”意指天然存在于宿主细胞中的核酸或多肽。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以原本不存在于自然界中的方式被修饰成含有核酸的区段,或者是合成的,该核酸分子包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下构型,在该构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得该控制序列指导该编码序列的表达。
纯化的:术语“纯化的”意指基本上不含其他组分的核酸或多肽,如通过本领域熟知的分析技术(例如,在电泳凝胶、色谱洗脱液和/或经过密度梯度离心的培养基中,纯化的多肽或核酸可形成离散的条带)所确定。纯化的核酸或多肽是至少约50%纯的,通常是至少约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、约99.5%、约99.6%、约99.7%、约99.8%或更加纯的(例如,以摩尔计的重量百分比)。在相关意义上,当在应用纯化或富集技术之后存在分子的浓度的大幅度增加时,组合物富集了分子。术语“富集”是指化合物、多肽、细胞、核酸、氨基酸或其他指定材料或组分以高于起始组合物的相对或绝对浓度存在于组合物中。
重组:当用于提及细胞、核酸、蛋白质或载体时,术语“重组”意指已经从其天然状态经修饰。因此,例如,重组细胞表达在天然(非重组)形式的细胞内未发现的基因,或与在自然界中发现的相比,以不同水平表达或在不同条件下表达天然基因。重组核酸与天然序列的差异在于一个或多个核苷酸和/或与异源序列(例如,表达载体中的异源启动子)可操作地连接。重组蛋白与天然序列的差异可以在于一个或多个氨基酸和/或与异源序列融合。包含编码多肽的核酸的载体是重组载体。术语“重组”与“遗传修饰的”和“转基因的”同义。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”来描述。
出于本发明的目的,使用尼德曼-翁施算法(Needleman-Wunsch algorithm)(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性作为“最长同一性”的输出,该算法如EMBOSS软件包(EMBOSS:TheEuropean Molecular Biology Open Software Suite[欧洲分子生物学开放软件套件],Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选6.6.0版本或更新版本)的尼德尔程序中所实施的。使用的参数是空位开放罚分10、空位延伸罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。为了使尼德尔程序报告最长同一性,必须在命令行中指定非简化(nobrief)选项。尼德尔标记的“最长同一性”的输出计算如下:
(相同的残基x100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用尼德曼-翁施算法(Needleman和Wunsch,1970,同上)来确定两个多核苷酸序列之间的序列同一性作为“最长同一性”的输出,该算法如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite[欧洲分子生物学开放软件套件],Rice等人,2000,同上)(优选6.6.0版本或更新版本)的尼德尔程序所实施的。使用的参数是空位开放罚分10、空位延伸罚分0.5以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。为了使尼德尔程序报告最长同一性,必须在命令行中指定非简化选项。尼德尔标记的“最长同一性”的输出计算如下:
(相同的脱氧核糖核苷酸x100)/(比对长度-比对中的空位总数)
SNP:术语“SNP”意指“单核苷酸多态性”,其是核苷酸序列中单个位置处的变异。SNP可能导致由含有一个或多个SNP的核苷酸编码的多肽的氨基酸序列中的变异。SNP可以出现在DNA的编码区(外显子)和非编码区(内含子)两者中。
在本发明的优选实施例中,真菌宿主细胞在其基因组中包含:编码目的多肽的第一多核苷酸;以及第二多核苷酸,该第二多核苷酸编码与SEQ ID NO:7或SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置137或对应于SEQ ID NO:21的位置139的位置处包含改变的多肽,所述改变由第二多核苷酸内的SNP导致,优选地第二多核苷酸内的SNP是对应于具有SEQ ID NO:3的第二多核苷酸的位置495、496和/或497,或对应于具有SEQ ID NO:28的第二多核苷酸的位置656、657和/或658的位置处的改变,其中第二多核苷酸是与SEQ ID NO:3或SEQ ID NO:28具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性的多核苷酸变体。
在本发明的另一个优选实施例中,真菌宿主细胞在其基因组中包含:编码目的多肽的第一多核苷酸;以及第二多核苷酸,该第二多核苷酸编码与SEQ ID NO:7或SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置17或对应于SEQ ID NO:21的位置19的位置处包含改变的多肽,所述改变由第二多核苷酸内的SNP导致,优选地第二多核苷酸内的SNP是对应于具有SEQ ID NO:16的第二多核苷酸的位置49、50和/或51,或对应于SEQ ID NO:34的位置55、56和/或57的位置处的改变,其中第二多核苷酸是与SEQ ID NO:3或SEQ ID NO:28具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性的多核苷酸变体。
在本发明的另一个优选实施例中,真菌宿主细胞在其基因组中包含:编码目的多肽的第一多核苷酸;以及第二多核苷酸,该第二多核苷酸编码与SEQ ID NO:7具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15的位置处包含改变的多肽,所述改变是由第二多核苷酸内的SNP导致的提前多肽终止,优选地第二多核苷酸内的SNP是对应于具有SEQ ID NO:13的第二多核苷酸的位置43、44和/或45的位置处的改变,其中第二多核苷酸是与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性的多核苷酸变体。
变体:就多肽而言,术语“变体”意指具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的多肽,该多肽在一个或多个(例如,若干个)位置处包含人工突变,即取代、插入、提前终止密码子、提前多肽终止和/或缺失(例如,截短)。取代意指用不同的氨基酸替代占据某一位置的氨基酸;缺失意指去除占据某一位置的一个或多个氨基酸;并且插入意指邻近于并且紧跟着占据一个位置的氨基酸之后添加一个或多个氨基酸。提前终止密码子或提前多肽终止意指相应的氨基酸缺失,以及多肽以对应于提前终止密码子或多肽终止的直接上游密码子的氨基酸结束。
就多核苷酸而言,术语“变体”意指编码具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的多肽的多核苷酸,该多肽在一个或多个(例如,若干个)位置处包含人工突变,即取代、插入、和/或缺失(例如,截短)。与野生型蛋白质相比,该突变可以导致改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性。取代意指用不同的核苷酸替代占据某一位置的核苷酸;缺失意指去除占据某一位置的一个或多个核苷酸;并且插入意指邻近于并且紧跟着占据一个位置的核苷酸之后添加一个或多个核苷酸。
野生型:提及氨基酸序列或核酸序列时术语“野生型”意指该氨基酸序列或核酸序列是天然或天然存在的序列。如本文所用,术语“天然存在的”是指在自然界中发现的任何物质(例如蛋白质、氨基酸或核酸序列)。相反,术语“非天然存在的”是指在自然界中未发现的任何物质(例如,在实验室中产生的重组核酸和蛋白质序列、或野生型序列的修饰)。
具体实施方式
宿主细胞
本发明还涉及重组宿主细胞,这些重组宿主细胞包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,该一个或多个控制序列指导本发明的多肽的生产。将包含多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。宿主细胞的选择将在很大程度上取决于编码多肽的基因及其来源。
在一些实施例中,多肽与重组宿主细胞是异源的。
在一些实施例中,一个或多个控制序列中的至少一个与编码多肽的多核苷酸是异源的。
在一些实施例中,重组宿主细胞包含本发明的多核苷酸的至少两个拷贝,例如三个、四个或五个。
宿主细胞可以是有用于重组产生本发明的多肽的任何微生物细胞,例如真菌细胞。
宿主细胞可以是真菌细胞。如本文所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人在以下文献中所定义:Ainsworth and Bisby’sDictionary of The Fungi[安斯沃思和拜斯比真菌字典],第8版,1995,CAB International[国际应用生物科学中心],University Press[大学出版社],Cambridge,UK[英国剑桥])。
真菌宿主细胞可以是酵母细胞。如本文所用的“酵母”包括子囊孢子酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于不完全菌(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类可能在将来变化,出于本发明的目的,酵母应当如Biology and Activities of Yeast[酵母的生物学与活性](Skinner,Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium SeriesNo.9[应用细菌学学会专题论文集系列9],1980)中所述的那样定义。
该酵母宿主细胞可以是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或耶氏酵母属(Yarrowia)细胞,例如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门细分的所有丝状形式(如由Hawksworth等人,1995,同上所定义)。丝状真菌一般的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、和其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸来进行的,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)来进行的,而碳分解代谢可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉菌科(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)、或木霉属(Trichoderma)细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉、米曲霉(Aspergillus oryzae)、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporium keratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌(Chrysosporium pannicola)、女王杜香金孢子菌(Chrysosporiumqueenslandicum)、热带金孢子菌(Chrysosporium tropicum)、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢(Fusariumcerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusariumculmorum)、禾谷镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtorulosum)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicola insolens)、柔毛腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicilliumpurpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、埃默森篮状菌(Talaromyces emersonii)、土生梭孢壳霉(Thielavia terrestris)、长域毛栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉或绿色木霉(Trichoderma viride)细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的工艺以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适程序在EP 238023和Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国科学院院刊]81:1470-1474、以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422中描述。用于转化镰孢属物种的合适方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。可以使用由以下文献描述的程序转化酵母:Becker和Guarente,在Abelson,J.N.和Simon,M.I.编辑,Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,Academic Press,Inc.[学术出版社有限公司],纽约;Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:1920。
在第一方面,本发明涉及一种真菌宿主细胞,该真菌宿主细胞在其基因组中包含:
a)编码目的多肽的第一多核苷酸;以及
b)第二多核苷酸,该第二多核苷酸编码与SEQ ID NO:7或SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15、17和/或137或对应于SEQ ID NO:21的位置19和/或139的位置处包含改变的多肽。
在一个实施例中,该改变是氨基酸取代。
在优选实施例中,所述多肽的改变是在对应于SEQ ID NO:7的位置137的位置处的氨基酸取代,L137F。
在另一个优选实施例中,所述多肽的改变是在对应于SEQ ID NO:21的位置139的位置处的氨基酸取代,L139F。
在第一方面的优选实施例中,所述多肽在对应于SEQ ID NO:7的位置15、17和/或137的位置处的改变彼此独立地选自氨基酸取代、氨基酸插入、氨基酸缺失或提前多肽终止。
在另一个优选实施例中,所述多肽在对应于SEQ ID NO:7的位置17和/或137的位置处的改变是氨基酸取代,优选在对应于SEQ ID NO:7的位置137的位置处由苯丙氨酸对亮氨酸的取代L137F,如SEQ ID NO:8中所示;和/或在对应于SEQ ID NO:7的位置17的位置处由异亮氨酸对苏氨酸的氨基酸取代T17I,如SEQ ID NO:18中所示。
在另一个优选实施例中,所述多肽在对应于SEQ ID NO:7的位置15的位置处的改变是提前多肽终止R15*,如SEQ ID NO:15中所示。
如整个实例所示,本发明人惊奇地发现,当在携带所述工程化alg13基因的真菌宿主细胞中产生重组酶时,SEQ ID NO:7的所述取代L137F和/或T17I以及提前多肽终止R15*导致重组酶生产率和/或重组酶活性增加。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置137的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、苯丙氨酸谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对亮氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置17的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸、苯丙氨酸或酪氨酸对苏氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置17和/或137的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸。该氨基酸插入可以是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
在第一方面的优选实施例中,所述多肽在对应于SEQ ID NO:21的位置19和/或139的位置处的改变彼此独立地选自氨基酸取代、氨基酸插入、氨基酸缺失或提前多肽终止。
在另一个优选实施例中,所述多肽在对应于SEQ ID NO:21的位置19和/或139的位置处的改变是氨基酸取代,优选在对应于SEQ ID NO:21的位置139的位置处由苯丙氨酸对亮氨酸的取代L139F,如SEQ ID NO:39中所示;和/或在对应于SEQ ID NO:21的位置19的位置处由异亮氨酸对丝氨酸的氨基酸取代S19I,如SEQ ID NO:36中所示。
如整个实例所示,本发明人惊奇地发现,当在携带所述工程化alg13基因的真菌宿主细胞中产生重组酶时,SEQ ID NO:21的所述取代L139F和/或S19I导致重组酶生产率和/或重组酶活性增加。
在另一个实施例中,所述多肽在对应于SEQ ID NO:21的位置139的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、苯丙氨酸谷氨酸/谷氨酸、甘氨酸、脯氨酸、丝氨酸或酪氨酸对亮氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:21的位置19的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、苏氨酸、苯丙氨酸或酪氨酸对丝氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:21的位置19和/或139的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸。该氨基酸插入可以是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
在又另一个优选实施例中,该真菌宿主细胞是酵母宿主细胞;优选地,该酵母宿主细胞选自由以下组成的组:假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属(驹形氏酵母属(Komagataella))、酵母属、裂殖酵母属、和耶氏酵母属细胞;更优选地,该酵母宿主细胞选自由以下组成的组:乳酸克鲁维酵母、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、和解脂耶氏酵母细胞,最优选毕赤酵母(Pichiapastoris)(巴斯德毕赤酵母(Komagataella phaffii))。
在又另一个优选实施例中,该真菌宿主细胞是丝状真菌宿主细胞;优选地,该丝状真菌宿主细胞选自由以下组成的组:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、和木霉属细胞;更优选地,该丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢原毛平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞;甚至更优选地,该丝状宿主细胞选自由以下组成的组:米曲霉、镶片镰孢和里氏木霉细胞;最优选地,该丝状真菌宿主细胞是黑曲霉细胞。
在一个优选实施例中,该真菌宿主细胞是米曲霉细胞。
在又另一个优选实施例中,该真菌宿主细胞是里氏木霉细胞。
在另一个优选实施例中,目的多肽包含酶;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
在优选实施例中,目的多肽是糖蛋白。
在另一个优选实施例中,目的多肽是α-葡糖苷酶,优选1,4-α-葡糖苷酶,最优选葡糖淀粉酶。
在一个优选实施例中,目的多肽包含SEQ ID NO:9、基本上由其组成或由其组成。
在另一个实施例中,目的多肽包含SEQ ID NO:11、基本上由其组成或由其组成。
在另一个实施例中,目的多肽是水解酶,优选糖苷水解酶。
在又另一个实施例中,目的多肽是溶菌酶,优选包含SEQ ID NO:33、基本上由其组成或由其组成的溶菌酶。
产生方法
在第二方面,本发明还涉及产生一种或多种目的多肽,所述方法包括以下步骤:
i)提供第一方面的真菌宿主细胞;
ii)在有助于目的多肽表达的条件下培养所述宿主细胞;以及,任选地iii)回收该目的多肽。
在第二方面的优选实施例中,所述多肽在对应于SEQ ID NO:7的位置15、17和/或137,或对应于SEQ ID NO:21的位置19和/或139的位置处的改变彼此独立地选自氨基酸取代、氨基酸插入、提前多肽终止或氨基酸缺失。
在另一个优选实施例中,所述多肽在对应于SEQ ID NO:7的位置17和/或137或对应于SEQ ID NO:21的位置19和/或139的位置处的改变是氨基酸取代,优选在对应于SEQ IDNO:7的位置137的位置处由苯丙氨酸对亮氨酸的取代L137F,如SEQ ID NO:8中所示,或者在对应于SEQ ID NO:21的位置139的位置处由苯丙氨酸对亮氨酸的取代L139F,如SEQ ID NO:39中所示,和/或在对应于SEQ ID NO:7的位置17的位置处由异亮氨酸对苏氨酸的氨基酸取代T17I,如SEQ ID NO:18中所示,和/或在对应于SEQ ID NO:21的位置19的位置处由异亮氨酸对丝氨酸的氨基酸取代S19I,如SEQ ID NO:36中所示。
在另一个优选实施例中,所述多肽在对应于SEQ ID NO:7的位置15的位置处的改变是提前多肽终止R15*,如SEQ ID NO:15中所示,从而导致多肽长度为14个氨基酸,对应于SEQ ID NO:7的氨基酸1-14。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置137或对应于SEQ IDNO:21的位置139的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸、苯丙氨酸或酪氨酸对亮氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置17的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸、苯丙氨酸或酪氨酸对苏氨酸的取代。
在一个实施例中,所述多肽在对应于SEQ ID NO:7的位置17和/或137的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸。该氨基酸插入可以是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
在另一个实施例中,所述多肽在对应于SEQ ID NO:21的位置19的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、苏氨酸、苯丙氨酸或酪氨酸对丝氨酸的取代。
在一个实施例中,所述多肽在对应于SEQ ID NO:21的位置19和/或139的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸。该氨基酸插入可以是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
在优选实施例中,该真菌宿主细胞是酵母宿主细胞;优选地,该酵母宿主细胞选自由以下组成的组:假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属(驹形氏酵母属)、酵母属、裂殖酵母属、和耶氏酵母属细胞;更优选地,该酵母宿主细胞选自由以下组成的组:乳酸克鲁维酵母、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、和解脂耶氏酵母细胞,最优选毕赤酵母(巴斯德毕赤酵母)。
在另一个优选实施例中,该真菌宿主细胞是丝状真菌宿主细胞;优选地,该丝状真菌宿主细胞选自由以下组成的组:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、和木霉属细胞;更优选地,该丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢原毛平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞;甚至更优选地,该丝状宿主细胞选自由以下组成的组:米曲霉、镶片镰孢和里氏木霉细胞;最优选地,该丝状真菌宿主细胞是黑曲霉细胞。
在优选实施例中,该真菌宿主细胞是米曲霉细胞。
在又另一个实施例中,该真菌宿主细胞是里氏木霉细胞。
在另一个优选实施例中,目的多肽包含酶;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
在又另一个优选实施例中,目的多肽是葡糖淀粉酶。
在另一个优选实施例中,目的多肽是溶菌酶。
本发明的宿主细胞是在适合于使用本领域中已知的方法产生该多肽的营养培养基中培养的。例如,可以通过摇瓶培养、或在实验室或工业发酵罐中小规模或大规模发酵(包括连续、分批、补料分批、或固态发酵)培养细胞,该培养在合适的培养基中并且在允许表达和/或分离多肽的条件下进行。使用本领域中已知的程序,培养发生在包含碳和氮来源及无机盐的合适的营养培养基中。合适的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽被分泌到该营养培养基中,那么可以直接从该培养基中回收该多肽。如果多肽不进行分泌,那么其可以从细胞裂解液中进行回收。
可以使用本领域已知的对于多肽是特异性的方法来检测多肽。这些检测方法包括但不限于:特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定多肽的活性。
可以使用本领域已知的方法来回收多肽。例如,可通过常规方法,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从发酵培养基回收多肽。在一方面,回收包含多肽的全发酵液。
可以通过本领域已知的多种程序纯化多肽,包括但不限于色谱法(例如,离子交换色谱法、亲和色谱法、疏水色谱法、聚焦色谱法、和尺寸排阻色谱法)、电泳程序(例如,制备型等电聚焦电泳)、差异性溶解(例如,硫酸铵沉淀)、SDS-PAGE、或提取(参见例如,ProteinPurification[蛋白质纯化],Janson和Ryden编辑,VCH Publishers[VCH出版公司],纽约,1989),以便获得基本上纯的多肽。
核酸构建体
在第三方面,本发明还涉及一种包含异源启动子的核酸构建体,该异源启动子可操作地连接至编码如下多肽的多核苷酸,该多肽与SEQ ID NO:7具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15、17和/或137或对应于SEQ IDNO:21的位置19和/或139的位置处包含改变。
在优选实施例中,对应于SEQ ID NO:7的位置17和/或137或对应于SEQ ID NO:21的位置19和/或139的位置处的改变是取代;优选地,在对应于SEQ ID NO:7的位置137的位置处由苯丙氨酸对亮氨酸的取代,根据SEQ ID NO 8的L137F,或在对应于SEQ ID NO:139的位置139的位置处由苯丙氨酸对亮氨酸的取代,根据SEQ ID NO:39的L139F;和/或在对应于SEQ ID NO:7的位置17的位置处由异亮氨酸对苏氨酸的氨基酸取代,根据SEQ ID NO:18的T17I,和/或在对应于SEQ ID NO:21的位置19的位置处由异亮氨酸对丝氨酸的氨基酸取代,根据SEQ ID NO:36的S19I。
在一个优选实施例中,对应于SEQ ID NO:7的位置15的位置处的改变是提前多肽终止R15*。这种改变产生了长度为14个氨基酸的多肽,对应于SEQ ID NO:7的氨基酸1-14。
在另一个实施例中,对应于SEQ ID NO:7的位置17和/或137或对应于SEQ ID NO:21的位置19和/或139的位置处的改变包含改变(优选地取代)或由改变(优选地取代)组成,其中该变体与SEQ ID NO:7或SEQ ID NO:21的氨基酸序列具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%但小于100%的序列同一性。对应于SEQ ID NO:7的位置137或对应于SEQ ID NO:21的位置139的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Phe取代。可替代地或另外地,对应于SEQ ID NO:7的位置17或对应于SEQ ID NO:21的位置19的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Phe、Leu、Lys、Met、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ile取代。在优选实施例中,该变体包含如SEQ ID NO:8中所示的取代L137F或由其组成。在优选实施例中,该变体包含如SEQ ID NO:39中所示的取代L139F或由其组成。在另一个优选实施例中,该变体另外或可替代地包含如SEQ ID NO:18中所示的取代T17I或如SEQ ID NO:36中所示的取代S17I或由其组成。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置137或对应于SEQ IDNO:21的位置139的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对亮氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置17的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对苏氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:21的位置19的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、苏氨酸或酪氨酸对丝氨酸的取代。
在一个实施例中,所述多肽在对应于SEQ ID NO:7的位置17和/或137的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸。在另一个实施例中,所述多肽在对应于SEQ ID NO:21的位置19和/或139的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸。该氨基酸插入可以是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
在第三方面的优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:3、SEQ ID NO:4、或SEQ ID NO:28具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:3的位置495、496和/或497的位置处包含至少一个核苷酸改变。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:28具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:28的位置656、657和/或658的位置处包含至少一个核苷酸改变。
在优选实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:3的位置495、496和/或497或对应于SEQ ID NO:28的位置656、657和/或658的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在另一个优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C495T,如SEQ ID NO:5中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C495T,以及在对应于SEQ ID NO:3的位置497的位置处由胞嘧啶对胸腺嘧啶的取代,或由其组成。
在一个实施例中,对应于SEQ ID NO:3的位置495、496和/或497或对应于SEQ IDNO:28的位置656、657和/或658的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:3的位置495、496和/或497或对应于SEQ IDNO:28的位置656、657和/或658的核苷酸中的一个、两个或三个彼此独立地缺失。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:4具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:4的位置409、410和/或411的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:4的位置409、410和/或411的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置409的位置处由胸腺嘧啶对胞嘧啶的取代C409T,如SEQ ID NO:6中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C409T,以及在对应于SEQ ID NO:4的位置411的位置处由胞嘧啶对胸腺嘧啶的取代,或由其组成。
在一个实施例中,对应于SEQ ID NO:4的位置409、410和/或411的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:4的位置409、410和/或411的核苷酸中的一个、两个或三个彼此独立地缺失。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:3或SEQ ID NO:28具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:3的位置49、50和/或51或对应于SEQ ID NO:28的位置55、56和/或57的位置处包含至少一个核苷酸改变。
在优选实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:3的位置49、50和/或51或对应于SEQ ID NO:28的位置55、56和/或57的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在另一个优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,如SEQ ID NO:16中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,以及在对应于SEQ ID NO:3的位置51的位置处由胸腺嘧啶对腺嘌呤的取代,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,以及在对应于SEQ IDNO:3的位置51的位置处由胞嘧啶对腺嘌呤的取代,或由其组成。
在一个实施例中,对应于SEQ ID NO:3的位置49、50和/或51或对应于SEQ ID NO:28的位置55、56和/或57的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:3的位置49、50和/或51或对应于SEQ IDNO:28的位置55、56和/或57的核苷酸中的一个、两个或三个彼此独立地缺失。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:4具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:4的位置49、50和/或51的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:4的位置49、50和/或51的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,如SEQ ID NO:17中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,以及在对应于SEQ ID NO:4的位置51的位置处由胸腺嘧啶对腺嘌呤的取代,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,以及在对应于SEQ ID NO:4的位置51的位置处由胞嘧啶对腺嘌呤的取代,或由其组成。
在一个实施例中,对应于SEQ ID NO:4的位置49、50和/或51的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:4的位置49、50和/或51的核苷酸中的一个、两个或三个彼此独立地缺失。
在优选实施例中,具有T17I突变的多肽是具有SEQ ID NO:18的多肽。
在另一个优选实施例中,该至少一个核苷酸改变导致错义突变和/或提前终止密码子,其中编码该多肽的多核苷酸与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:3的位置43、44和/或45的位置处包含至少一个核苷酸改变。
在优选实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:3的位置43、44和/或45的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在另一个优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,如SEQ ID NO:13中所示,或由其组成,从而导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,以及在对应于SEQ ID NO:3的位置44的位置处由腺嘌呤对鸟嘌呤的取代G44A,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,和在对应于SEQ ID NO:3的位置44的位置处由腺嘌呤对鸟嘌呤的取代G44A,以及在对应于SEQ ID NO:3的位置45的位置处由鸟嘌呤对腺嘌呤的取代A45G,或由其组成。
在一个实施例中,对应于SEQ ID NO:3的位置43、44和/或45的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:3的位置43、44和/或45的核苷酸中的一个、两个或三个彼此独立地缺失。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:4具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:4的位置43、44和/或45的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:4的位置43、44和/或45的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,如SEQ ID NO:14中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,以及在对应于SEQ ID NO:4的位置44的位置处由腺嘌呤对鸟嘌呤的取代G44A,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,和在对应于SEQ ID NO:4的位置44的位置处由腺嘌呤对鸟嘌呤的取代G44A,以及在对应于SEQ ID NO:4的位置45的位置处由鸟嘌呤对腺嘌呤的取代A45G,或由其组成。
在一个实施例中,对应于SEQ ID NO:4的位置43、44和/或45的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:4的位置43、44和/或45的核苷酸中的一个、两个或三个彼此独立地缺失。
在优选实施例中,具有提前多肽终止的多肽是具有SEQ ID NO:15的多肽。
可用多种方式操纵多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操纵可能是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明的多肽的多核苷酸的多核苷酸。启动子包含介导多肽的表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变启动子、截短启动子和杂合启动子,并且可以获得自编码与宿主细胞同源或异源的胞外或胞内多肽的基因。
用于在丝状真菌宿主细胞中指导本发明多核苷酸的转录的适合的启动子的实例是从以下基因中获得的启动子:构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子,其中已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替代未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的经修饰的启动子,其中已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代未翻译的前导序列);及其突变启动子、截短启动子和杂合启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,有用的启动子从以下的基因中获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由Romanos等人,1992,Yeast[酵母]8:423-488描述。
控制序列也可为由宿主细胞识别以终止转录的转录终止子。终止子可操作地连接至编码多肽的多核苷酸的3'末端。在宿主细胞中有功能的任何终止子可用于本发明中。
丝状真菌宿主细胞的优选终止子从以下的基因中获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子。
酵母宿主细胞的优选终止子从以下的基因中获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用的终止子由Romanos等人(1992,同上)描述。
控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区域,其增加该基因的表达。
适合的mRNA稳定子区域的实例是从以下获得的:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等人,1995,J.Bacteriol.[细菌学杂志]177:3465-3471)。
控制序列也可以是前导序列,该前导序列是对宿主细胞翻译而言重要的mRNA的非翻译区。前导序列可操作地连接至编码该多肽的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导序列。
丝状真菌宿主细胞的优选前导序列从以下的基因中获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
酵母宿主细胞的合适的前导序列从以下的基因中获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是多腺苷酸化序列,一种可操作地连接至该多核苷酸的3’末端并且当转录时由宿主细胞识别为将多腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中有功能的任何多腺苷酸化序列。
用于丝状真菌宿主细胞的优选多腺苷酸化序列从以下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰孢胰蛋白酶样蛋白酶。
酵母宿主细胞的有用的多腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.[分子细胞生物学]15:5983-5990描述。
控制序列还可以是编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’端本身可以含有在翻译阅读框中天然与编码多肽的编码序列区段相连接的信号肽编码序列。可替代地,编码序列的5’端可以含有对于该编码序列是异源的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下,可能需要异源信号肽编码序列。可替代地,异源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
丝状真菌宿主细胞的有效信号肽编码序列是从以下的基因中获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因中获得。其他的有用的信号肽编码序列由Romanos等人(1992,同上)描述。
控制序列还可以是编码位于多肽的N-末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因中获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻前肽序列的N-末端。
还可能希望的是添加调节序列,这些调节序列相对于宿主细胞的生长调节多肽的表达。调节序列的实例是响应于化学或物理刺激而引起基因的表达开启或关闭的那些,包括调节化合物的存在。原核系统中的调节序列包括lac、tac、和trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子和里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是使基因扩增的那些序列。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸会与调节序列可操作地连接。
表达载体
在第四方面,本发明还涉及一种表达载体,该表达载体包含根据本发明第三方面的核酸构建体。
在优选实施例中,所述核酸构建体包含异源启动子,该异源启动子可操作地连接至编码如下多肽的多核苷酸,该多肽与SEQ ID NO:7或SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15、17和/或137或对应于SEQID NO:21的位置19和/或139的位置处包含改变。
在优选实施例中,对应于SEQ ID NO:7的位置137的位置处的改变是取代;优选苯丙氨酸对亮氨酸的取代,根据SEQ ID NO 8的L137F。
在另一个优选实施例中,对应于SEQ ID NO:7的位置17的位置处的改变是取代;优选异亮氨酸对苏氨酸的取代,根据SEQ ID NO 18的T17I。
在另一个优选实施例中,对应于SEQ ID NO:7的位置15的位置处的改变是根据SEQID NO:15的提前多肽终止R15*。
在优选实施例中,对应于SEQ ID NO:21的位置139的位置处的改变是取代;优选苯丙氨酸对亮氨酸的取代,根据SEQ ID NO 39的L139F。
在另一个优选实施例中,对应于SEQ ID NO:21的位置19的位置处的改变是取代;优选异亮氨酸对丝氨酸的取代,根据SEQ ID NO 36的S19I。
在另一个实施例中,对应于SEQ ID NO:7的位置17和/或137的位置处的改变包含改变(优选地取代)或由改变(优选地取代)组成,其中该变体与SEQ ID NO:7的氨基酸序列具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%但小于100%的序列同一性。在一个实施例中,对应于SEQ ID NO:7的位置137的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Ser、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Phe取代。在另一个优选实施例中,该改变包含SEQ ID NO:8的取代L137F或由其组成。在另一个实施例中,对应于SEQ ID NO:7的位置17的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Phe、Leu、Lys、Met、Ser、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ile取代。在另一个优选实施例中,该改变包含SEQID NO:18的取代T17I或由其组成。
在另一个实施例中,对应于SEQ ID NO:21的位置19和/或139的位置处的改变包含改变(优选地取代)或由改变(优选地取代)组成,其中该变体与SEQ ID NO:21的氨基酸序列具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%但小于100%的序列同一性。在一个实施例中,对应于SEQ ID NO:21的位置139的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Ser、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Phe取代。在另一个优选实施例中,该改变包含SEQ ID NO:39的取代L139F或由其组成。在另一个实施例中,对应于SEQ ID NO:21的位置19的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Phe、Leu、Lys、Met、Ser、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ile取代。在另一个优选实施例中,该改变包含SEQ ID NO:36的取代S19I或由其组成。
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以生产重组表达载体,该重组表达载体可包括一个或多个便利的限制位点以使编码该多肽的多核苷酸在此类位点处的插入或取代。可替代地,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生表达载体时,编码序列如此位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。
重组表达载体可以是可以方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。
该载体可以是一种自主复制的载体,即,以染色体外实体形式存在的一种载体,其复制与染色体复制无关,例如质粒、染色体外元件、微型染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。而且,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标记。酵母宿主细胞的合适的标记包括但不限于:ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)以及trpC(邻氨基苯甲酸合酶)连同其等同物。优选的用于在曲霉属细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选的用于在木霉属细胞中使用的是adeA、adeB、amdS、hph和pyrG基因。
选择性标记可以是如WO 2010/039889中描述的双选择性标记系统。在一方面,双选择性标记是hph-tk双选择性标记系统。
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到宿主细胞基因组中,载体可以依靠编码该多肽的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,载体可以含有用于指导通过同源重组而整合入宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了提高在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,例如100至10,000个碱基对、400至10,000个碱基对、和800至10,000个碱基对,这些核酸与相对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,该复制起点使得载体在讨论中的宿主细胞中自主复制成为可能。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、及ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可根据WO 00/24883中披露的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
可将本发明多核苷酸的多于一个拷贝插入宿主细胞以提高多肽的生产。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数量,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝以及由此该多核苷酸的另外的拷贝的细胞。
用于连接上述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,Sambrook等人,1989,同上)。
具有Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的多肽
在一些实施例中,本发明涉及分离的或纯化的多肽,这些分离的或纯化的多肽与SEQ ID NO:7或SEQ ID NO:21的成熟多肽具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性。SEQ IDNO:7或SEQ ID NO:21的多肽具有Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性。在一个实施例中,这些多肽与SEQ ID NO:7或SEQ ID NO:21的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个氨基酸。更优选地,该多肽与SEQ ID NO:7或SEQ ID NO:21的成熟多肽相差1个氨基酸。
该成熟多肽优选地包含SEQ ID NO:7或SEQ ID NO:21或其成熟多肽的氨基酸序列,基本上由其组成或由其组成;或者是其具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的片段。在另一个实施例中,成熟多肽是SEQ ID NO:8或SEQ IDNO:39,并且分别与SEQ ID NO:7或SEQ ID NO:21相比,具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性。在又另一个实施例中,成熟多肽是SEQ IDNO:8或SEQ ID NO:39,当分别与SEQ ID NO:7或SEQ ID NO:21的多肽相比时,具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性,例如当分别与SEQ ID NO:7或SEQ ID NO:21的活性相比时,活性降低90%、80%、70%、60%、50%、40%、30%、20%,10%、5%、1%、0,1%或0,01%或更低,或基本上为0%。在另一个实施例中,成熟多肽是SEQID NO:8或SEQ ID NO:39,当与SEQ ID NO:7的多肽的活性相比时,具有降低的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性,例如活性降低95%、97%、98%或99%。
在另一个实施例中,成熟多肽是SEQ ID NO:15,当与SEQ ID NO:7相比时,具有降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性。在又另一个实施例中,成熟多肽是SEQ ID NO:15,当与SEQ ID NO:7的多肽相比时,具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性,例如当与SEQ ID NO:7的活性相比时,活性降低90%、80%、70%、60%、50%、40%、30%、20%,10%、5%、1%、0,1%或0,01%或更低,或基本上为0%。
在另一个实施例中,成熟多肽是SEQ ID NO:18或SEQ ID NO:36,当分别与SEQ IDNO:7或SEQ ID NO:21相比时,具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性。在又另一个实施例中,成熟多肽是SEQ ID NO:18或SEQ ID NO:36,当分别与SEQ ID NO:7或SEQ ID NO:21的多肽相比时,具有降低的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性,例如当分别与SEQ ID NO:7或SEQ ID NO:21的活性相比时,活性降低90%、80%、70%、60%、50%、40%、30%、20%或10%或低于10%。在另一个实施例中,成熟多肽是SEQ ID NO:18或SEQ ID NO:36,当分别与SEQ ID NO:7或SEQ ID NO:21的多肽的活性相比时,具有降低的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性,例如活性降低95%、97%、98%或99%。
在一些实施例中,本发明涉及由多核苷酸编码的具有Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的分离或纯化的多肽,这些多核苷酸在中严格条件、中-高严格条件、高严格条件或非常高严格条件下与以下各项的全长互补体杂交:SEQ ID NO:3的成熟多肽编码序列或其cDNA(SEQ ID NO:4)、或SEQ ID NO:5的成熟多肽编码序列或其cDNA(SEQ IDNO:6)、或SEQ ID NO:13的成熟多肽编码序列或其cDNA(SEQ ID NO:14)、或SEQ ID NO:16的成熟多肽编码序列或其cDNA(SEQ ID NO:17)、或SEQ ID NO:28的成熟多肽编码序列或其cDNA(SEQ ID NO:40)、或SEQ ID NO:34的成熟多肽编码序列或其cDNA(SEQ ID NO:35)、或SEQ ID NO:37的成熟多肽编码序列或其cDNA(SEQ ID NO:38)(Sambrook等人,1989,Molecular Cloning,A Laboratory Manual[分子克隆:实验室手册],第2版,Cold SpringHarbor[冷泉港实验室],纽约州)。
可以使用SEQ ID NO:3或SEQ ID NO:28的多核苷酸或其子序列,以及SEQ ID NO:7或SEQ ID NO:21的成熟多肽或其片段来设计核酸探针,以根据本领域熟知的方法来鉴别并克隆编码来自不同属或物种的菌株的具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的多肽的DNA。此类探针可以用于遵循标准DNA印迹程序与目的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中相应的基因。此类探针可明显短于完整序列,但是长度应为至少15个,例如至少25个、至少35个或至少70个核苷酸。优选地,核酸探针长度为至少100个核苷酸,例如,长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),用于检测相应基因。此类探针涵盖于本发明中。
可以筛选由此类其他菌株制备的基因组DNA或cDNA文库的与上述探针杂交并编码具有Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的多肽的DNA。来自此类其他菌株的基因组DNA或其他DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来分离。可将来自文库的DNA或分离的DNA转移到并固定在硝化纤维素或另一个合适的运载体材料上。为了鉴定与SEQ ID NO:3、4、5、6、13、14、16,17、28、34、35、37、38或40或其子序列杂交的克隆或DNA,将运载体材料用于DNA印迹中。
出于本发明的目的,杂交表明多核苷酸杂交到对应于以下的标记的核酸探针上:(i)SEQ ID NO:3、5、13、16、28、34或37;(ii)SEQ ID NO:3、5、13、16、28、34或37的成熟多肽编码序列;(iii)其cDNA序列;(iv)其全长互补体;或(v)其子序列;该杂交是在非常高严格条件下进行。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下与核酸探针杂交的分子。
在一些实施例中,核酸探针是SEQ ID NO:3、5、13、16、28、34或37的核苷酸1至400、核苷酸400至800、核苷酸800至1200、或核苷酸1000至1400。在另一方面,核酸探针是编码SEQ ID NO:7、8、15、18、21、36或39的成熟多肽的多核苷酸;或其片段。在另一方面,核酸探针是SEQ ID NO:3或其cDNA序列、或SEQ ID NO:5或其cDNA序列、或SEQ ID NO:28或其cDNA序列、或SEQ ID NO:34或其cDNA序列、或SEQ ID NO:37或其cDNA序列。在另一方面,核酸探针是包含在质粒pIhar531中的多核苷酸,其中该多核苷酸编码具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的多肽或多肽片段。
在一些实施例中,本发明涉及由多核苷酸编码的分离的多肽,这些多核苷酸与以下具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列同一性:SEQ ID NO:3的成熟多肽编码序列或其cDNA序列(SEQ ID NO:4)、或SEQ ID NO:5的成熟多肽编码序列或其cDNA序列(SEQ ID NO:6)、或SEQID NO:13的成熟多肽编码序列或其cDNA序列(SEQ ID NO:14)、或SEQ ID NO:16的成熟多肽编码序列或其cDNA序列(SEQ ID NO:17)、或SEQ ID NO:28的成熟多肽编码序列或其cDNA序列(SEQ ID NO:40)、或SEQ ID NO:34的成熟多肽编码序列或其cDNA序列(SEQ ID NO:35)、或SEQ ID NO:37的成熟多肽编码序列或其cDNA序列(SEQ ID NO:38)。
在优选实施例中,该多肽与SEQ ID NO:7或SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且该多肽在对应于SEQ ID NO:7的位置15、17和/或137或对应于SEQID NO:21的位置19和/或139的位置处包含氨基酸的改变,优选取代、缺失或插入。
在另一个优选实施例中,该多肽与SEQ ID NO:7具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且该多肽在对应于SEQ ID NO:7的位置17和/或137的位置处包含氨基酸取代,优选地由苯丙氨酸对亮氨酸的取代L137F(SEQ ID NO:8)和/或由异亮氨酸对苏氨酸的取代T17I(SEQ ID NO:18)。
在另一个优选实施例中,该多肽与SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且该多肽在对应于SEQ ID NO:21的位置19和/或139的位置处包含氨基酸取代,优选地由苯丙氨酸对亮氨酸的取代L139F(SEQ ID NO:39)和/或由异亮氨酸对苏氨酸的取代S19I(SEQ ID NO:36)。
编码该多肽的多核苷酸优选地包含SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:34、SEQ ID NO:35、SEQ ID NO:37或SEQ ID NO:38的核苷酸1至1400,基本上由其组成或由其组成。
在一个实施例中,编码该多肽的多核苷酸包含提前多肽终止R15*,并且包含SEQID NO:13或SEQ ID NO:14的核苷酸43-45、基本上由其组成或由其组成。
在一些实施例中,本发明涉及一种通过在SEQ ID NO:7或SEQ ID NO:21的成熟多肽中取代、缺失或添加一个或若干个氨基酸而衍生自SEQ ID NO:7或SEQ ID NO:21的成熟多肽的多肽。在一些实施例中,本发明涉及SEQ ID NO:7或SEQ ID NO:21的成熟多肽的变体,所述变体在一个或多个(例如,若干个)位置处包含取代、缺失和/或插入。在一方面,引入SEQ ID NO:7或SEQ ID NO:21的成熟多肽中的氨基酸取代、缺失和/或插入的数目多达10个,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个。在一个实施例中,该多肽具有1-10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个氨基酸的N-末端延伸和/或C-末端延伸。氨基酸改变可以具有微小性质,即,不会显著地影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;典型地为1-30个氨基酸的小缺失;小的氨基末端或羧基末端延伸,诸如氨基末端的甲硫氨酸残基;多达20-25个残基的小接头肽;或小的延伸,其通过改变净电荷或另一功能(例如聚组氨酸段、抗原表位或结合模块)来促进纯化。
可以根据本领域中已知的程序,诸如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且测试所得分子的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性以鉴别对于该分子的活性关键的氨基酸残基。还参见,Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定,如由诸如以下技术确定:核磁共振、晶体学(crystallography)、电子衍射、或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见例如,de Vos等人,1992,Science[科学]255:306-312;Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904;Wlodaver等人,1992,FEBS Lett.[欧洲生化学会联合会快报]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。SEQID NO:7的氨基酸1至413的序列中的必需氨基酸位于位置61-63(R61、D62和Y63)处,例如位置62-63(D62和Y63)处,和SEQ ID NO:7的位置62(D62)处。
可以使用已知的诱变、重组和/或混编方法,随后进行相关的筛选程序做出单氨基酸或多氨基酸取代、缺失和/或插入并对其进行测试,该相关的筛选程序例如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可从宿主细胞回收编码活性多肽的诱变的DNA分子,并使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。
在一些实施例中,该多肽是含有至少250个氨基酸残基(例如,SEQ ID NO:8的成熟多肽的氨基酸100至350)、至少150个氨基酸残基(例如,SEQ ID NO:8的成熟多肽的氨基酸150至300)、或至少100个氨基酸残基(例如,SEQ ID NO:8的成熟多肽的氨基酸300至400)的片段。
在一些实施例中,该多肽是含有至少250个氨基酸残基(例如,SEQ ID NO:18的成熟多肽的氨基酸100至350)、至少150个氨基酸残基(例如,SEQ ID NO:18的成熟多肽的氨基酸150至300)、或至少100个氨基酸残基(例如,SEQ ID NO:18的成熟多肽的氨基酸300至400)的片段。
在一些实施例中,该多肽是含有至少250个氨基酸残基(例如,SEQ ID NO:36的成熟多肽的氨基酸100至350)、至少150个氨基酸残基(例如,SEQ ID NO:36的成熟多肽的氨基酸150至300)、或至少100个氨基酸残基(例如,SEQ ID NO:36的成熟多肽的氨基酸300至400)的片段。
在一些实施例中,该多肽是含有至少250个氨基酸残基(例如,SEQ ID NO:39的成熟多肽的氨基酸100至350)、至少150个氨基酸残基(例如,SEQ ID NO:39的成熟多肽的氨基酸150至300)、或至少100个氨基酸残基(例如,SEQ ID NO:39的成熟多肽的氨基酸300至400)的片段。
具有Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的多肽的来源
本发明的具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的多肽可以从任何属的微生物获得。出于本发明的目的,如本文结合给定来源使用的术语“获得自”应当意指由多核苷酸编码的多肽是由该来源或由已经插入了来自该来源的多核苷酸的菌株生产的。
在一方面,该多肽是从曲霉属获得的多肽,例如从黑曲霉获得的多肽。
在另一方面,该多肽是从木霉属获得的多肽,例如从里氏木霉获得的多肽。
应理解的是,对于前述物种,本发明涵盖完全和不完全阶段以及其他分类学等同物,例如无性型,而与它们已知的物种名无关。本领域的技术人员会容易地识别适当等同物的身份。
这些物种的菌株可容易地在许多培养物保藏中心为公众所获得,比如美国典型培养物保藏中心(American Type Culture Collection,ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)、和美国农业研究服务专利培养物保藏中心北方地区研究中心(Agricultural Research Service Patent CultureCollection,Northern Regional Research Center,NRRL)。
可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水等)获得的DNA样品鉴定和获得多肽。用于从天然生境中直接分离微生物和DNA的技术是本领域熟知的。然后可以通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用一种或多种探针检测到编码多肽的多核苷酸,则可以通过利用本领域普通技术人员已知的技术(参见例如,Sambrook等人,1989,同上)分离或克隆多核苷酸。
多核苷酸
本发明还涉及编码本发明的多肽的分离的多核苷酸,如本文所述。
用于分离或克隆多核苷酸的技术是本领域已知的且包括从基因组DNA或cDNA或其组合进行分离。来自基因组DNA的多核苷酸的克隆可以例如通过使用聚合酶链式反应(PCR)或用以对具有共有的结构特征的克隆的DNA片段进行检测的表达库抗体筛选来实现。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[PCR:方法和应用指南],Academic Press[学术出版社],纽约。可以使用其他核酸扩增程序如连接酶链式反应(LCR)、连接激活的转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以克隆自曲霉菌属的菌株或相关生物,并且因此,例如可以是该多核苷酸的多肽编码区的物种变体。
编码本发明的多肽的多核苷酸的修饰对于合成基本上类似于该多肽的多肽可以是必需的。术语“基本上类似”于该多肽是指多肽的非天然存在的形式。这些多肽可以因某种工程化方式而与从其天然来源分离的多肽不同,例如在比活性、热稳定性、最适pH等方面不同的变体。这些变体可以基于以SEQ ID NO:3或SEQ ID NO:28的成熟多肽编码序列、或其cDNA序列(分别为SEQ ID NO:4或SEQ ID NO:40)(例如其子序列)形式呈现的多核苷酸,和/或通过引入不会改变该多肽的氨基酸序列,但对应于预定用于产生该酶的宿主有机体的密码子用法的核苷酸取代,或通过引入可以产生不同氨基酸序列的核苷酸取代来构建。对于核苷酸取代的一般描述,参见例如Ford等人,1991,Protein Expression andPurification[蛋白质表达与纯化]2:95-107。
在第五方面,本发明还涉及一种多核苷酸,该多核苷酸编码与SEQ ID NO:7或SEQID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15、17和/或137或对应于SEQ ID NO:21的位置19和/或139的位置处包含改变的多肽。
在优选实施例中,对应于SEQ ID NO:7的位置137的位置处的改变是取代;优选苯丙氨酸对亮氨酸的取代,根据SEQ ID NO 8的L137F。
在优选实施例中,对应于SEQ ID NO:7的位置17的位置处的改变是取代;优选异亮氨酸对苏氨酸的取代,根据SEQ ID NO 18的T17I。
在优选实施例中,对应于SEQ ID NO:21的位置139的位置处的改变是取代;优选苯丙氨酸对亮氨酸的取代,根据SEQ ID NO 39的L139F。
在优选实施例中,对应于SEQ ID NO:21的位置19的位置处的改变是取代;优选异亮氨酸对丝氨酸的取代,根据SEQ ID NO 36的S19I。
在另一个优选实施例中,对应于SEQ ID NO:7的位置15的位置处的改变是根据SEQID NO 15的提前多肽终止R15*。
在另一个实施例中,对应于SEQ ID NO:7的位置17和/或137或对应于SEQ ID NO:21的位置19和/或139的位置处的改变包含改变(优选地取代)或由改变(优选地取代)组成,其中该变体与SEQ ID NO:7或SEQ ID NO:21的氨基酸序列具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%但小于100%的序列同一性。对应于SEQ ID NO:7的位置137或对应于SEQ ID NO:21的位置139的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Phe取代。在另一个实施例中,该变体包含如SEQ ID NO:8中所示的取代L137F或由其组成。在另一个实施例中,该变体包含如SEQ ID NO:39中所示的取代L139F或由其组成。
对应于SEQ ID NO:7的位置17或对应于SEQ ID NO:21的位置19的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Phe、Leu、Lys、Met、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ile取代。在另一个实施例中,该变体包含如SEQ ID NO:18中所示的取代T17I或由其组成。在另一个实施例中,该变体包含如SEQ ID NO:36中所示的取代S19I或由其组成。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置137或对应于SEQ IDNO:21的位置139的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对亮氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:7的位置17的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、苯丙氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对苏氨酸的取代。
在另一个实施例中,所述多肽在对应于SEQ ID NO:21的位置19的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、苯丙氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、苏氨酸或酪氨酸对丝氨酸的取代。
在一个实施例中,所述多肽在对应于SEQ ID NO:7的位置17和/或137或对应于SEQID NO:21的位置19和/或139的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸。该氨基酸插入可以是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
在第五方面的优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:28、或SEQ ID NO:40具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:3的位置495、496和/或497的位置处包含至少一个核苷酸改变。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:28具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:28的位置656、657和/或658的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:3的位置495、496和/或497或对应于SEQ ID NO:28的位置656、657和/或658的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C495T,如SEQ ID NO:5中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C495T,以及在对应于SEQ ID NO:3的位置497的位置处由胞嘧啶对胸腺嘧啶的取代,或由其组成。
在一个实施例中,对应于SEQ ID NO:3的位置495、496和/或497或对应于SEQ IDNO:28的位置656、657和/或658的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:3的位置495、496和/或497或对应于SEQ IDNO:28的位置656、657和/或658的核苷酸中的一个、两个或三个彼此独立地缺失。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:4具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:4的位置409、410和/或411的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:4的位置409、410和/或411的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置409的位置处由胸腺嘧啶对胞嘧啶的取代C409T,如SEQ ID NO:6中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C409T,以及在对应于SEQ ID NO:4的位置411的位置处由胞嘧啶对胸腺嘧啶的取代,或由其组成。
在一个实施例中,对应于SEQ ID NO:4的位置409、410和/或411的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:4的位置409、410和/或411的核苷酸中的一个、两个或三个彼此独立地缺失。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:3的位置49、50和/或51的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:3的位置49、50和/或51的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:28具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:28的位置55、56和/或57的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:28的位置55、56和/或57的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,如SEQ ID NO:16中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,以及在对应于SEQ ID NO:3的位置51的位置处由胸腺嘧啶对腺嘌呤的取代,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ IDNO:3的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,以及在对应于SEQ ID NO:3的位置51的位置处由胞嘧啶对腺嘌呤的取代,或由其组成。
在一个实施例中,对应于SEQ ID NO:3的位置49、50和/或51的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:3的位置49、50和/或51的核苷酸中的一个、两个或三个彼此独立地缺失。
在一个实施例中,对应于SEQ ID NO:28的位置55、56和/或57的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:28的位置55、56和/或57的核苷酸中的一个、两个或三个彼此独立地缺失。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:4具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:4的位置49、50和/或51的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:4的位置49、50和/或51的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,如SEQ ID NO:17中所示,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,以及在对应于SEQ ID NO:4的位置51的位置处由胸腺嘧啶对腺嘌呤的取代,或由其组成。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置50的位置处由胸腺嘧啶对胞嘧啶的取代C50T,以及在对应于SEQ ID NO:4的位置51的位置处由胞嘧啶对腺嘌呤的取代,或由其组成。
在一个实施例中,对应于SEQ ID NO:4的位置49、50和/或51的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
在另一个实施例中,对应于SEQ ID NO:4的位置49、50和/或51的核苷酸中的一个、两个或三个彼此独立地缺失。
在另一个优选实施例中,该至少一个核苷酸改变导致错义突变和/或提前终止密码子,其中编码该多肽的多核苷酸与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:3的位置43、44和/或45的位置处包含至少一个核苷酸改变。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:3的位置43、44和/或45的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代,并且导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子。
在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,如SEQ ID NO:13中所示,或由其组成,从而导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,以及在对应于SEQ ID NO:3的位置44的位置处由腺嘌呤对鸟嘌呤的取代G44A,或由其组成,从而导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:3的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,和在对应于SEQ ID NO:3的位置44的位置处由腺嘌呤对鸟嘌呤的取代G44A,以及在对应于SEQ ID NO:3的位置45的位置处由鸟嘌呤对腺嘌呤的取代A45G,或由其组成,从而导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子。
在一个实施例中,对应于SEQ ID NO:3的位置43、44和/或45的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代,从而导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子。
在另一个实施例中,对应于SEQ ID NO:3的位置43、44和/或45的核苷酸中的一个、两个或三个彼此独立地缺失,从而导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子,或对应于位置15或除SEQ ID NO:7以外的位置的氨基酸位置处的提前终止密码子。
在另一个优选实施例中,编码该多肽的多核苷酸与SEQ ID NO:4具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:4的位置43、44和/或45的位置处包含至少一个核苷酸改变,从而导致对应于SEQ ID NO:7的位置15或其下游的氨基酸位置处的提前终止密码子。
在一个实施例中,该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:4的位置43、44和/或45的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代,从而导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子。
在优选实施例中,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,如SEQ ID NO:14中所示,或由其组成,从而导致对应于SEQ ID NO:7的位置15的氨基酸位置处的提前终止密码子。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,以及在对应于SEQ ID NO:4的位置44的位置处由腺嘌呤对鸟嘌呤的取代G44A,或由其组成,从而导致对应于SEQ ID NO:7的位置15或其下游的氨基酸位置处的提前终止密码子。可替代地,该至少一个核苷酸改变包括在对应于SEQ ID NO:4的位置43的位置处由胸腺嘧啶对胞嘧啶的取代C43T,和在对应于SEQ ID NO:4的位置44的位置处由腺嘌呤对鸟嘌呤的取代G44A,以及在对应于SEQ ID NO:4的位置45的位置处由鸟嘌呤对腺嘌呤的取代A45G,或由其组成,从而导致对应于SEQ ID NO:7的位置15或其下游的氨基酸位置处的提前终止密码子。
在一个实施例中,对应于SEQ ID NO:4的位置43、44和/或45的核苷酸中的一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代,从而导致对应于SEQ ID NO:7的位置15或其下游的氨基酸位置处的提前终止密码子。
在另一个实施例中,对应于SEQ ID NO:4的位置43、43和/或45的核苷酸中的一个、两个或三个彼此独立地缺失,从而导致对应于SEQ ID NO:7的位置15或除位置15以外的氨基酸位置处的提前终止密码子。
可用多种方式操纵多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操纵可能是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
改变、降低或消除Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性
本发明还涉及产生亲本细胞的突变体的方法,这些方法包括破坏或缺失编码本发明的多肽的多核苷酸或其部分,这导致在相同条件下培养时,与亲本细胞相比,该突变体细胞产生的功能性多肽更少或不产生功能性多肽。
可以使用本领域熟知的方法通过降低或消除该多核苷酸的表达来构建突变体细胞,例如插入、破坏、替代、或缺失。在一些实施例中,多核苷酸被减少或失活。例如,待修饰、还原或灭活的多核苷酸可以是活性必需的编码区或其一部分,或编码区的表达所需的调节元件。这种调节或控制序列的实例可以是启动子序列或其功能部分,即足以影响该多核苷酸的表达的部分。可修饰的其他控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、信号肽序列、转录终止子、和转录激活因子。
该多核苷酸的修饰、还原或灭活可以通过使亲本细胞经受诱变,并且选择该多核苷酸的表达被降低或消除的突变体细胞来进行。该诱变可以是特异的或随机的,例如通过使用适合的物理或化学诱变剂、通过使用适合的寡核苷酸、或通过对DNA序列进行PCR产生的诱变来进行。此外,诱变可通过使用这些诱变剂的任何组合来进行。
适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、邻甲基羟胺、亚硝酸、乙基甲磺酸(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。
当使用这些试剂时,诱变一般是在适合条件下在所选的诱变剂的存在下通过孵育有待诱变的亲本细胞并筛选和/或选择展示基因表达降低或不表达的突变体细胞来进行的。
该多核苷酸的修饰、还原或失活可以通过在基因中或在其转录或翻译所需的调控元件中插入、取代、或缺失一个或多个核苷酸来完成。例如,可插入或去除核苷酸从而导致提前终止密码子的引入、起始密码子的去除、或可读框的变化。此类修饰或灭活可根据本领域已知的方法通过定点诱变或PCR产生的诱变来完成。尽管原则上,修饰可以在体内进行,即直接在表达待修饰的多核苷酸的细胞上进行,但是优选的是如下所示例地在体外进行修饰。
改变、消除或降低多核苷酸的表达的便利的方法的实例是基于基因替代、基因缺失、或基因破坏技术。例如,在基因破坏方法中,将对应于内源多核苷酸的核酸序列在体外进行诱变以产生缺陷的核酸序列,然后将其转化到亲本细胞中以产生缺陷基因。通过同源重组,该缺陷的核酸序列替代内源多核苷酸。令人希望的是,缺陷的多核苷酸还编码可用于选择其中该多核苷酸已经被修饰或破坏的转化体的标记。在一个方面,用选择性标记,如本文描述的那些来破坏该多核苷酸。
本发明进一步涉及一种在编码该多肽的多核苷酸或其控制序列或编码该多肽的沉默基因中包含破坏或缺失的亲本细胞的突变体细胞,这导致与亲本细胞相比,该突变体细胞产生的功能性多肽更少或不产生功能性多肽。
多肽缺陷型突变体细胞作为用于天然和异源多肽的表达的宿主细胞是有用的。因此,本发明进一步涉及产生天然或异源多肽的方法,这些方法包括(a)在有助于产生该多肽的条件下培养突变体细胞;以及(b)回收该多肽。术语“异源多肽”意指对宿主细胞而言不是天然的多肽,例如天然蛋白质的变体。宿主细胞可以包含多于一个拷贝的编码天然或异源多肽的多核苷酸。
用于培养和纯化目的产物的方法可以通过本领域已知的方法进行。
用于在基本上不含或具有降低的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的宿主细胞中生产的本发明方法在多肽(例如真菌蛋白,例如酶)的生产中是令人感兴趣的。Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶降低/缺陷的细胞还可以用于表达药学感兴趣的异源蛋白,例如激素、生长因子、受体等。
通过以下实例进一步描述本发明,这些实例不应理解为对本发明的范围进行限制。
实例
材料与方法
除非另外说明,否则使用如以下所述的分子生物学标准方法来进行DNA操作和转化:Sambrook等人(1989)Molecular cloning:A laboratory manual[分子克隆:实验室手册],冷泉港实验室[Cold Spring Harbor lab.],冷泉港,纽约州;Ausubel,F.M.等人(编辑)“Current protocols in Molecular Biology[分子生物学现代方法]”,John Wileyand Sons[约翰威利父子出版公司],1995;Harwood,C.R.和Cutting,S.M.(编辑)“Molecular Biological Methods for Bacillus[用于芽孢杆菌的分子生物学方法]”.John Wiley and Sons[约翰威利父子出版公司],1990。
购买的材料(大肠杆菌和试剂盒)
使用大肠杆菌DH5α(东洋公司(Toyobo))用于质粒构建和扩增。使用QiagenPlasmid试剂盒(凯杰公司)来回收扩增的质粒。根据制造商的说明书,用Rapid DNADephos&Ligation试剂盒(罗氏公司(Roche))或In-Fusion试剂盒(克隆技术实验室公司(Clontech Laboratories,Inc.))进行连接。用KOD-Plus系统(东洋公司)来进行聚合酶链式反应(PCR)。通过使用Plant Direct PCR试剂盒(新英格兰生物实验室公司(NewEngland Biolabs))进行真菌孢子PCR。QIAquickTM凝胶提取试剂盒(凯杰公司)被用于纯化PCR片段并从琼脂糖凝胶中提取DNA片段。
用于DNA操作的酶(例如限制性内切核酸酶,连接酶等)可获得自新英格兰生物实验室公司,并且根据制造商的说明书使用。
质粒
pBluescript II SK-(斯特拉塔吉恩(Stratagene)#212206)
由构巢曲霉甘油醛-3-磷酸脱氢酶启动子(Pgpd)、构巢曲霉色氨酸合酶终止子(TtrpC)和黑曲霉葡糖淀粉酶终止子(Tamg)驱使的包含构巢曲霉pyrG基因和单纯性疱疹病毒(HSV)胸苷激酶基因(tk)的pHUda801描述于WO 2012/160093中的实例4和实例5中。
含有来自深褐褶菌的淀粉葡糖苷酶的Gs AMG的氨基酸序列被鉴定为SEQ ID NO:11。来自深褐褶菌的葡糖淀粉酶的PE变体的氨基酸序列被鉴定为SEQ ID NO:9。
微生物菌株
如在WO 2012/160093中的实例14中描述,表达宿主菌株黑曲霉C5644由申请人分离并且为从土壤分离的黑曲霉NN049184的衍生物。C5644是产生具有SEQ ID NO:9的葡糖淀粉酶的菌株。
里氏木霉BTR213描述于WO 2013/086633中。
里氏木霉菌株6Q-M1002是ku70被破坏且副胞菌素合成酶(parS)缺失的菌株,衍生自里氏木霉BTR213。在该菌株中缺失了纤维二糖水解酶I(cbh1)、纤维二糖水解酶II(cbh2)、内切葡聚糖酶I(eg1)、内切葡聚糖酶II(eg2)和内切葡聚糖酶III(eg3)基因。cbh2和eg2基因座之间存在由FRT-F/FRT-F3重组引起的约20kb缺失。此外,TF92949(在WO 2020/123845中披露)在该菌株中也缺失。侧接FRT-F和FRT-F3位点的四个拷贝的嗜碱枝顶孢CBS114.92溶菌酶(SEQ ID NO:20)表达盒(由cbh1启动子驱动)已经整合入该菌株中。
培养基
COVE痕量金属溶液由以下构成:0.04g NaB4O7·10H2O、0.4gCuSO4·5H2O、1.2gFeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H20、10g ZnSO4·7H2O、以及补足至1升的去离子水。
50X COVE盐溶液由以下构成:26g KCl、26g MgSO4·7H2O、76gKH2PO4、50ml COVE痕量金属溶液、以及补足至1升的去离子水。
COVE培养基由以下构成:342.3g蔗糖、20ml 50X COVE盐溶液、10ml1M乙酰胺、10ml1.5M CsCl2、25g纯净琼脂、以及补足至1升的去离子水。
COVE-N-Gly板由以下构成:218g山梨醇、10g甘油、2.02g KNO3、50ml COVE盐溶液、25g纯净琼脂、以及补足至1升的去离子水。
COVE-N(tf)由以下构成:342.3g蔗糖、3g NaNO3、20ml COVE盐溶液、30g纯净琼脂、以及补足至1升的去离子水。
COVE-N顶层琼脂糖由以下构成:342.3g蔗糖、3g NaNO3、20ml COVE盐溶液、10g低熔点琼脂糖、以及补足至1升的去离子水。
COVE-N由以下构成:30g蔗糖、3g NaNO3、20ml COVE盐溶液、30g纯净琼脂、以及补足至1升的去离子水。
STC缓冲液由以下构成:0.8M山梨醇、25mM Tris pH 8、以及25mM CaCl2。
STPC缓冲液由以下构成:在STC缓冲液中的40% PEG 4000。
LB培养基由以下构成:10g胰蛋白胨、5g酵母提取物、5g氯化钠、以及补足至1升的去离子水。
LB加氨比西林板由以下构成:10g胰蛋白胨、5g酵母提取物、5g氯化钠、15g细菌培养用琼脂、以100μg/ml氨比西林、以及补足至1升的去离子水。
YPG培养基由以下构成:10g酵母提取物、20g细菌培养用蛋白胨、20g葡萄糖、以及补足至1升的去离子水。
SOC培养基由以下构成:20g胰蛋白胨、5g酵母提取物、0.5g NaCl、10ml 250mMKCl、以及补足至1升的去离子水。
TAE缓冲液由以下构成:4.84g Tris碱、1.14ml冰乙酸、2ml 0.5M EDTA pH 8.0、以及补足至1升的去离子水。
-MSS由以下构成:72g甘油、92g大豆粉(pH 6.0)、水补足至1升。
-MU-1由以下构成:260g的麦芽糊精、3g的MgSO4·7H2O、5g的KH2PO4、6g的K2SO4、淀粉葡糖苷酶痕量金属溶液0.5ml和尿素2g(pH4.5)、水补足至1升。
用于里氏木霉的发酵分批培养基(Fermentation batch medium)由以下构成:24g右旋糖、40g大豆粉、8g(NH4)2SO4、3g K2HPO4、8g K2SO4、3gCaCO3、8g MgSO4·7H2O、1g柠檬酸、8.8ml 85%磷酸、1ml消泡剂、14.7ml痕量金属溶液、以及补足至1升的去离子水。
用于里氏木霉发酵的痕量金属溶液由以下构成:26.1g FeSO4·7H2O、5.5gZnSO4·7H2O、6.6g MnSO4·H2O、2.6g CuSO4·5H2O、2g柠檬酸、以及补足至1升的去离子水。通过高压灭菌来为溶液灭菌。
用于里氏木霉的发酵补料培养基由1190g葡萄糖、14.2ml 85% H3PO4和486g H2O构成。通过高压灭菌来为溶液灭菌。
样品缓冲液(pH 7.5)由0.1M Tris-HCl、0.1M NaCl和0.01% Triton X-100构成。将溶液过滤灭菌。
摇瓶培养基由以下构成:20g甘油、10g大豆粉、1.5g(NH4)2SO4、2gKH2PO4、0.2gCaCl2、0.4g MgSO4·7H2O、0.2ml痕量金属溶液、以及补足至1升的去离子水。
COVE2板由以下构成:30g蔗糖、20ml COVE盐溶液、10ml 1M乙酰胺、25g DifcoTM纯净琼脂、以及补足至1升的去离子。通过高压灭菌来为溶液灭菌。
PDA+1M蔗糖板由以下构成:39g DifcoTM马铃薯右旋糖琼脂、342.30g蔗糖、以及补足至1升的去离子水。通过高压灭菌来为溶液灭菌。
PEG缓冲液由去离子水中的50%聚乙二醇(PEG)4000、10mM Tris-HCl(pH 7.5)和10mM CaCl2构成。将溶液过滤灭菌。
样品缓冲液(pH 7.5)由0.1M Tris-HCl、0.1M NaCl和0.01% Triton X-100构成。将溶液过滤灭菌。摇瓶培养基由以下构成:20g甘油、10g大豆粉、1.5g(NH4)2SO4、2g KH2PO4、0.2g CaCl2、0.4g MgSO4·7H2O、0.2ml痕量金属溶液、以及补足至1升的去离子水。
1.2M山梨醇由218.4g山梨醇和补足至1升的去离子水构成。通过高压灭菌来为溶液灭菌。
Tr-STC由以下构成:去离子水中的1M山梨醇、10mM Tris-HCl pH 7.5和50mMCaCl2。将溶液过滤灭菌。
TBE缓冲液由以下构成:10.8g Tris碱、5g硼酸、4ml 0.5M EDTA(pH8)、以及补足至1升的去离子水。
TE缓冲液由1M Tris-HCl(pH 8.0)和0.5M EDTA(pH 8.0)构成。
黑曲霉的转化
曲霉属物种的转化可以使用用于酵母转化的一般方法实现。以下描述了用于本发明的优选程序。
将黑曲霉宿主菌株接种至100ml的补充有10mM尿苷的YPG培养基上,并且在32℃在80rpm下孵育16小时。将球粒进行收集并且用0.6M KCl洗涤,并且将其重悬浮于含有商业β-葡聚糖酶产品(GLUCANEXTM,诺维信公司,鲍斯韦,丹麦)的20ml 0.6M KCl(最终浓度为20mg/ml)中。将悬浮液在32℃在80rpm下孵育直到形成原生质体,并且然后用STC缓冲液洗涤两次。将这些原生质体用血红蛋白计计数,并且在8:2:0.1的STC:STPC:DMSO溶液中重新悬浮并调节至最终浓度为2.5x107个原生质体/ml。将大约4μg的质粒DNA添加到100μl原生质体悬浮液中,轻轻混合,并且在冰上孵育30分钟。添加1ml的SPTC,并且将该原生质体悬浮液在37℃下孵育20分钟。在添加10ml的50℃Cove或Cove-N顶层琼脂糖之后,将反应倾倒于Cove或Cove-N(tf)琼脂板上,并且将该板于32℃下孵育5天。
实例中的PCR扩增
用KOD-Plus系统(东洋公司)来进行聚合酶链式反应(PCR)。
3步循环:
DNA杂交
将每个孢子纯化的转化体在3ml的YPG培养基中进行培养,并且在30℃以200rpm摇动孵育2天。使用衬有的漏斗来收集生物质。遵循制造商的说明书,将研磨的菌丝体经受使用土壤用FastDNA SPIN试剂盒(MP生物医疗)的基因组DNA制备。遵循制造商的说明书,使用PCR DIG探针合成试剂盒(罗氏应用科学公司(Roche Applied Science),印第安纳波利斯(Indianapolis),印第安纳州(IN))合成非放射性探针。遵循制造商的说明书,使用QIAquick TM凝胶提取试剂盒(凯杰公司(QIAGEN Inc.),巴伦西亚,加利福尼亚州)将DIG标记的探针进行凝胶纯化。
将5微克的基因组DNA用适当的限制性内切酶完全消化16小时(40μl总体积、4U酶/μl DNA)并且在0.8%琼脂糖凝胶上运行。将该DNA在凝胶中通过用0.2M HCl处理进行片段化、变性(0.5M NaOH,1.5M NaCl)并且进行中和(1M Tris,pH 7.5;1.5M NaCl)用于随后在20X SSC中转移到Hybond N+膜(安玛西亚公司(Amersham))上。将该DNA进行UV交联到该膜上并且在42℃在20ml DIG Easy Hyb(罗氏诊断产品有限公司(Roche DiagnosticsCorporation),曼海姆(Mannheim),德国)中预杂交1小时。将变性的探针直接添加至DIGEasy Hyb缓冲液中并且在42℃进行过夜杂交。在杂交后洗涤(在2X SSC中、室温、5分钟洗涤两次;并且在0.1X SSC中、68℃洗涤两次,每次15分钟)后,遵循制造商的方案,使用DIG检测系统和CPD-Star(罗氏公司)进行化学发光检测。将DIG-标记的DNA分子量标记II(罗氏公司)用于标准标记。
用于葡糖淀粉酶生产的摇瓶培养
将选择的转化体的孢子接种进100ml的MSG培养基,并且伴随振荡(220rpm)在30℃下培养3天。将10%的种子培养物转移到MU-1培养基中并在32℃下伴随振荡(220rpm)培养7天。通过离心获得上清液,并将其用于随后的测定。
葡糖淀粉酶活性
葡糖淀粉酶活性用RAG测定法(相对AG测定,pNPG法)测定。pNPG底物由以下构成:0.1g对硝基苯-α-D-吡喃葡萄糖苷(Nacalai Tesque公司)、10ml 1M乙酸盐缓冲液(pH4.3)、以及补足至100ml的去离子水。从每个稀释的样品溶液中,一式两份地向孔中添加40ul作为“样品”。并向孔中添加40ul去离子水作为“空白”。并添加40ul的AG标准溶液作为“参考”。使用Multidrop(雷勃公司(Labsystem)),向每个孔中添加80ul的pNPG底物。在室温20分钟后,通过添加120ul的停止试剂(0.1M硼砂溶液)来停止该反应。通过酶标仪在400nm处(Power Wave X)或在405nm处(ELx808)测量OD值。
如下进行计算:
S=样品值 F=稀释因子
B=空白值 AG=AG标准的AG/ml。
S=AG标准的值
S=AG标准的空白
GSA202蛋白的纯化:
首先,如下制备α-环糊精亲和柱。使十克环氧基活化的琼脂糖6B(英国查尔方特圣吉尔斯的通用电气医疗集团(GE Healthcare,Chalfont St.Giles,U.K))粉末悬浮在蒸馏水中并在烧结玻璃过滤器上用蒸馏水进行洗涤。使凝胶悬浮于偶合溶液(100ml的12.5mg/mlα-环糊精,0.5M NaOH)并在室温孵育一天,同时轻轻振荡。在烧结玻璃过滤器上使用蒸馏水洗涤该凝胶,并使其悬浮在pH 10的100ml 1M乙醇胺中,并在50℃下孵育4小时以进行封闭。然后使用pH 8的50mM Tris-HCI和可替代地pH 4.0的50mM NaOAc洗涤该凝胶若干次。最后使用平衡缓冲液(50mM NaOAc,150mM NaCI,pH 4.5)将该凝胶装填在柱中。
接下来,如下进行GSA202蛋白的纯化。使用配备有0.22μm过滤器(密理博公司(Millipore))的过滤装置过滤发酵样品的上清液。将过滤的上清液应用于15mlα-环糊精亲和柱(用5倍柱体积(CV)的缓冲液1(20mM NaOAc pH 5,1mM CaCl2)预平衡)。通过用3CV的缓冲液1洗涤该柱来洗脱未结合的蛋白质。用20mM NaOAc pH 5、10mMβ-环糊精、1mM CaCl2以5ml/分钟的流速洗脱靶酶,并通过280nm处的吸光度监测洗脱。将洗脱的酶应用于用3CV缓冲液1预平衡的HiLoadTM26/60Superdex 200 prep grad柱(通用电气医疗集团生命科学部(GE Healthcare Life Sciences))。使用缓冲液1,以2.6ml/分钟的流速从该柱洗脱酶。使用12% Mini-PROTEAN TGX无染色凝胶(BIO-RAD公司),基于色谱图和SDS-PAGE分析,选择并合并相关级分。通过在280nm处的吸光度确定纯化的酶的浓度。
分子量的确定:
使用MAXIS II电喷雾质谱仪(德国不来梅的布鲁克-达尔托尼克公司(BrukerDaltonik GmbH,Bremen,DE))进行整体分子量分析。首先将样品在50mM NH4Ac pH 5.5中稀释至0.2mg/ml。将稀释的样品应用于AdvanceBio Desalting-RP柱(安捷伦科技公司(Agilent Technologies)),随后洗涤并从运行乙腈线性梯度的柱洗脱,并且通过Ultimate3000LC系统(戴安公司(Dionex))以400ml/min的流速引入电喷雾源。用DataAnalysis版本4.3(德国不来梅的布鲁克-达尔托尼克公司)进行数据分析。通过原始数据的解卷积计算样品的分子量,其范围为30.000至80.000Da。
纯化的GSA202的比活性:
葡糖淀粉酶单位(AGU)被定义为在标准条件下每分钟水解1微摩尔麦芽糖从而产生葡萄糖的酶量。通过3个反应步骤描述分析原理:步骤1是一个酶反应:淀粉葡糖苷酶(AMG)和外切-α-1,4-葡聚糖-葡糖淀粉酶水解麦芽糖以形成α-D-葡萄糖。孵育之后,用NaOH来停止该反应。步骤2和3引起终点反应:在由己糖激酶催化的反应中,葡萄糖被ATP磷酸化。形成的葡萄糖-6-磷酸被葡萄糖-6-磷酸脱氢酶氧化成6-磷酸葡萄糖酸。在这个相同的反应中,随着340nm处的吸光度增加,等摩尔量的NAD+被还原成NADH。可以使用自动分析仪系统例如Konelab 30分析仪(赛默飞世尔科技公司(Thermo Fisher Scientific)),反应条件如下(表1)。
表1.比活性测量的反应条件
实例1构建质粒用于整合alg3基因中的突变。
该实验的目的是制备质粒,用于将单核苷酸突变整合到天然alg3基因中,以引起黑曲霉菌株中的氨基酸改变(Leu137Phe)。
单RNA指导的DNA核酸内切酶质粒pIhar531的构建
如表2中所看出,设计了一种原型间隔子以靶向alg3基因。
表2
质粒 原型间隔子(PS)
pIhar531 gccgtacttgcttccgctgc(SEQ ID NO:1)
寡聚DNA描述于表3中。将寡聚DNA插入由BglII消化的pSMai290中。将pSMai290用BglII消化,并且通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,将其中的16,531bp片段从该凝胶切离,并使用凝胶提取试剂盒进行提取。根据制造商的说明,通过使用In-Fusion试剂盒(克隆技术实验室公司)将该片段连接到60-mer寡聚DNA。将反应在50℃下进行15分钟。将1μl反应混合物转化到DH5α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将该质粒命名为pIhar531(图1)。
表3用于构建pIhar531的引物
实例2用pIhar531和IH164M转化黑曲霉菌株C5644以整合alg3基因中的突变以及整合alg3基因中的突变对酶生产的影响。
该实验的目的是产生用单核苷酸取代代替野生型alg3基因来表达alg3基因的转化体。将pIhar531和IH164M设计成将一个氨基酸改变的单核苷酸取代(Leu137Phe)整合到alg3基因中。
进行序列分析,以确认转化后pIhar531和IH164M在alg3基因中的突变整合。
将来自C5644的三个转化体(531-C5644-4、531-C5644-8、531-C5644-10)在5升发酵罐中发酵,并且按照上述材料与方法测量其培养液的酶活性(淀粉葡糖苷酶单位活性=AGU活性);结果在表4中示出。这三个表达突变的alg3基因(Leu137Phe)的转化体(531-C5644-4、531-C5644-8和531-C5644-10)显示出比具有野生型alg3基因的参照菌株C5644平均高约8.9%的AGU活性,表明alg3基因中的突变可以增加真菌宿主菌株的酶生产率和/或产率。如表4所描述,在突变体和对照菌株中表达的SEQ ID NO:9的葡糖淀粉酶多肽显示AGU活性。
表4
菌株 AGU相对活性
531-C5644-4 1.075
531-C5644-8 1.085
531-C5644-10 1.107
C5644 1.00
从每个宿主菌株中选择的三个菌株的平均AGU活性,其中将来自C5644的平均葡糖淀粉酶产率归一化为1.00。
实例3在黑曲霉菌株C5644中向alg3基因引入另一种类型的单核苷酸取代及其对酶产量和活性的影响。
该实验的目的是产生表达具有除Leu137Phe之外的单核苷酸取代的alg3基因的转化体。如实例2中所述,使用基因组编辑工具将单氨基酸改变的单核苷酸取代(Arg15*(终止)或Thr17Ile)整合到alg3基因中。Arg15*和Thr17Ile两种突变的原型间隔子(SEQ IDNO:19)是相同的。转化后通过sanger测序证实了此类取代的引入。
由C5644产生C5644-469-17(Thr17Ile)和C5644-469-34(Arg15*)。将这两个菌株和参照菌株在摇瓶中发酵,并且如材料与方法中所述测量培养上清液的AGU活性。结果在表5中示出。C5644-469-17(Thr17Ile)和C5644-469-34(Arg15*)分别显示出比具有野生型alg3基因的参照菌株C5644高7.7%和6.1%的AGU活性。这表明葡糖淀粉酶的蛋白质产率和/或比活性因alg3基因中引入的那些氨基酸变化而增加。
表5.
/>
经测试的菌株的平均AGU活性,其中将来自C5644的平均葡糖淀粉酶产率归一化为1.00。
表6.序列ID概述
/>
实例4由alg3突变体表达的蛋白质产物的表征。
该实验的目的是评价由alg3野生型菌株、alg3突变体L137F和T17I,以及alg3缺失菌株R15*表达的蛋白质产物。由于alg3基因参与蛋白质的N-糖基化,因此当与野生型alg3菌株或alg3缺失菌株R15*的GSA202糖基化相比时,从alg3突变菌株L137F或T17I获得的葡糖淀粉酶产物(GSA202)可能具有改变的糖基化。为了分析来自alg3突变菌株的GSA202的糖基化模式,从罐发酵液中纯化产物并进行MS分析。此外,还研究了各产物的比活性。
如图2所示,MS分析揭示GSA202产物被不同地糖基化,这取决于alg3基因型。来自alg3野生型和T17I突变体的GSA202的主峰和次峰非常一致,从而导致假设T17I取代不会通过产物糖基化影响alg3功能。然而,由于T17位于ALG3蛋白的N-末端位置,因此T17I取代可能对其他作用(例如信号识别)有影响。所述影响导致GSA202产率/相对活性增加大约7.7%,而alg3缺失突变体R15*仅实现了产物产率/相对活性增加大约6.1%(参见实例3的表5)。R15*突变体的另一个缺点是,与野生型alg3相比,R15*突变体产生了糖基化模式改变的GSA202,如可以在图2中看出。因此,表明alg3调节,例如T17I取代,对蛋白质生产率和蛋白质质量具有比由R15*突变体所代表的alg3缺失更积极的影响,而不损害相对产物活性(表5)或比产物活性(表7)或细胞生长的增加,这已经被Dai Z.等人讨论为受到alg3缺失的负面影响(Impact of alg3 gene deletion on growth,development,pigmentproduction,protein secretion,and functions of recombinant Trichoderma reeseicellobiohydrolases in Aspergillus niger[alg3基因缺失对黑曲霉中重组里氏木霉纤维二糖水解酶生长、发育、色素产生、蛋白质分泌和功能的影响”]”,Fungal Genetics andBiology[真菌遗传学与生物学],2013,第61卷,第120-132页)。
同样如图2所示,来自L137F突变体和R15*突变体的GSA202产物显示出分子量改变,这意味着这些产物比来自野生型菌株的产物更少地被糖基化。来自L137F突变体和R15*突变体的GSA202的主峰非常一致,其中来自野生型的GSA202与来自L137F突变体和R15*突变体的GSA202之间的差异大概相当于12个己糖单位。
然而,与来自R15*突变体的GSA202不同,来自L137F突变体的GSA202产物显示出对应于另外的甘露糖单位的另外的亚峰(由图2中的双箭头指示)。连同实例3的表5中所示的L137F突变体的相对GSA202活性增加8.6%,图2的MS数据表明L137F突变不破坏alg3功能,如R15*突变体的情况,而是改变alg3功能,这可能有利于更高的GSA202产量。进一步注意到,如表7所示,从不同alg3突变体获得的不同糖基化模式不影响GSA202的比活性。
完全令人惊讶和意外的是,alg3突变体T17I和L137F未导致如R15*突变体所示的破坏的alg3功能和活性,而是实现了增加的产物产率/相对活性,以及未改变的alg3功能(T17I=与WT相同的产物糖基化)和改变的alg3功能(具有另外的甘露糖单元的L137F产物)。此外令人惊讶的是,alg3缺失不是获得增加的产物产率所必需的,并且增加的产物产率还可以通过位置T17和/或L137处的AA取代来实现。特别地,L137F突变体在旨在产生具有轻微修饰的N-聚糖分布图(即N-聚糖分布图包含较不复杂和较小的N-聚糖,还具有如图2所示的添加的甘露糖结构)的目的蛋白质时是有利的。
Alg3功能包括在N-聚糖加工过程中在N-聚糖上添加甘露糖结构。因此,减少的alg3功能与较低丰度的高甘露糖N-聚糖结构(众所周知其导致人类免疫原性)相关。有利的是,分别由L137F突变引起的产物向较低高甘露糖N-聚糖的糖基化改变,同时并行导致产物产率增加,被认为有助于降低可能由高甘露糖N-聚糖引起的蛋白质产物的免疫原性。另一方面,并且与alg3敲除突变体R15*的相对较小的N-聚糖相比,突变体L137F和T17I的较大N-聚糖部分可能增加蛋白质产物的稳定性和/或溶解性,同时还显示出与野生型相比增加的产物产率。
表7.来自黑曲霉alg3突变体的GSA202的归一化比活性
实例5:从里氏木霉提取基因组DNA
使里氏木霉在250ml带挡板的摇瓶中的50ml YPG培养基中在28℃下伴随200rpm搅拌生长2天。使用衬有(EMD化学品公司(EMD Chemicals Inc.))的漏斗收集来自培养物的菌丝体,挤压干燥,然后转移至预冷的研钵和研杵中。每个菌丝体制剂磨成细粉,并且用液氮保持冷冻。将共1-2g的粉末转移到50ml管中,并且使用/>植物Maxi试剂盒(凯杰公司)从研磨的菌丝体粉末中提取基因组DNA。将预热至65℃的5ml缓冲液AP1(凯杰公司)添加到50ml管中,随后添加10μl的RNA酶A100mg/ml储备溶液(凯杰公司),并且在65℃下孵育2-3小时。添加总共1.8ml AP2缓冲液(凯杰公司),并以3000-5000xg离心5分钟。将上清液倾析到置于50ml收集管中的QIAshredder大核酸纯化柱(凯杰公司)中,并且在室温(15℃-25℃)下在甩平式转子中以3000-5000xg离心5分钟。将收集管中的流过液体转移到新50ml管中,同时不干扰沉淀。将1.5ml体积的缓冲液AP3/E(凯杰公司)添加到澄清的裂解液中,并且通过涡旋振荡立即混合。将包括可能形成的任何沉淀的样品(最多15ml)吸移到置于50ml收集管中的/>大核酸纯化柱(凯杰公司)中,并且在室温(15℃-25℃)下在甩平式转子中以3000-5000xg离心5分钟。弃去流过液体。将12ml的缓冲液AW(凯杰公司)添加到/>大核酸纯化柱中,并以3000-5000xg离心10分钟,以干燥该膜。弃去流过液体和收集管。将/>大核酸纯化柱转移到新50ml管中。将预热至65℃的0.5ml缓冲液AE(凯杰公司)直接吸移到/>大核酸纯化柱膜中,在室温(15℃-25℃)下孵育5分钟,然后以3000-5000xg离心5分钟以洗脱基因组DNA。基因组DNA的浓度和纯度通过在260nm和280nm处测量吸光度确定。
实例6:里氏木霉原生质体产生
使用与Penttila等人,1987,Gene[基因]61:155-164类似的方案进行里氏木霉的原生质体制备与转化。简而言之,将里氏木霉在各自含有25ml YPG培养基的两个摇瓶中在30℃下伴随90rpm的轻轻搅拌培养16小时。将菌丝体通过使用真空驱动一次性过滤系统(密理博公司)过滤来收集,并且用去离子水洗涤两次并用1.2M山梨醇洗涤两次。通过在34℃下伴随90rpm的轻轻振荡使洗涤的菌丝体悬浮于30ml含有5mg/ml YatalaseTM(美国宝生物工程株式会社(Takara Bio USA,Inc.))和0.5mg/ml几丁质酶(西格玛化工有限公司)的1.2M山梨醇中15-25分钟(或直到存在原生质体)来产生原生质体。将原生质体通过以834xg离心7分钟来收集,并且用冷的1.2M山梨醇洗涤两次。使用血细胞计数器对原生质体计数,并且使其重新悬浮至最终浓度为1x108个原生质体/ml的Tr-STC。
实例7:黑曲霉Alg3与里氏木霉Alg3的比对
进行里氏木霉Alg3蛋白(SEQ ID.NO:21)与黑曲霉Alg3蛋白(SEQ ID.NO:7)的比对,以鉴定里氏木霉Alg3蛋白中与S17和L137位置相对应的位置,在这些位置发现突变有利于黑曲霉中的酶表达。使用MUSCLE算法版本3.8.31和默认参数来比对蛋白质(Edgar,R.C.(2004).Nucleic Acids Research[核酸研究],32(5),1792-1797)。
这一序列比对的结果示于图3中。里氏木霉(SEQ ID NO:21)和黑曲霉(SEQ ID NO:3)的野生型Alg3多肽之间的序列同一性已被证明是52.4%。基于以下实例的发现,Alg3多肽似乎在不同的丝状真菌宿主细胞中表现出高度保守和相似的功能。基于该比对,结论是黑曲霉中的L137F突变对应于里氏木霉中的L139F。T17I黑曲霉突变不明显,因为分子的N-末端部分不如L137F突变周围的区域保守。然而,结论是T17I黑曲霉突变将对应于里氏木霉中的S19I。因此,决定测试里氏木霉Alg3中的S19I或L139F突变将如何影响里氏木霉中的酶产物产率。
实例8:核酸酶骨架载体pGMEr280
质粒pGMEr280(图4)是单RNA指导的DNA核酸内切酶表达质粒,用于使用HiFi DNA组装克隆试剂盒(新英格兰生物实验室公司)将原型间隔子克隆到BglII消化的pGMEr280中。质粒pGMEr280含有单RNA指导的DNA核酸内切酶蛋白编码序列(密码子优化用于米曲霉),具有N-末端核质蛋白核定位信号和C-末端SV40核定位信号,以确保核酸酶将定位于细胞核。
核酸酶的表达在来自pFC330-333的构巢曲霉tef1启动子和终止子的控制之下(等人,2015,PLoS One[公共科学图书馆·综合]10(7):1-18)。质粒pGMEr280还具有用于单指导RNA(sgRNA)表达的所有元件,其由以下组成:稻瘟病菌(Magnaporthe oryzae)U6-2启动子、结构tRNA下游区域被去除的烟曲霉tRNAgly(GCC)1-6序列、单指导RNA序列、BglII限制酶识别序列和稻瘟病菌U6-2终止子。为了在里氏木霉中进行选择,质粒pGMEr280含有来自pHT1的潮霉素磷酸转移酶基因(Cummings等人,1999,Curr.Genet.[当代遗传学]36:371),从而赋予潮霉素B抗性,并在曲霉属(AMA1)序列(Gems等人,1991,Gene[基因]98:61-67)中自主维持pGMEr280在里氏木霉中的染色体外复制。通过在NEXTSEQTM500系统(因美纳公司(Illumina Inc.))上使用2X 150bp化学进行DNA测序来确认pGMEr280中的单指导RNA和核质蛋白-核酸酶-SV40 NLS表达元件。
实例9:里氏木霉中靶向alg3的pAgJg341和pAgJg342核酸酶质粒的构建
质粒载体制备。用限制酶BglII(AnzaTM 19BglII,赛默飞世尔科技公司)消化质粒pGMEr280。该限制反应含有:15μg的pGMEr280质粒DNA、1XAnzaTM缓冲液、100个单位的BglII和最终体积直到200μl的无菌Milli-Q水。将反应物在37℃下孵育3小时。在限制酶消化后,在TBE缓冲液中对消化物进行0.8%琼脂糖凝胶电泳,并且从凝胶上切除代表消化的pGMEr280的条带并根据制造商的说明使用凝胶和PCR清理试剂盒(马歇雷-纳格尔公司)进行纯化。
原型间隔子设计。设计了两个原型间隔子将核酸酶导向靶位点并在alg3基因中产生双链断裂,一个针对Alg3蛋白中的位置S17,一个针对Alg3中的位置L139(SEQ ID NO:22和SEQ ID NO:23)。通过寻找具有序列TTTV的适当原型间隔子相邻基序(PAM)来选择原型间隔子,其中V代表核苷酸A、C或G。一旦鉴定了适当的PAM位点,则将紧邻PAM位点3'侧的21个碱基对选作原型间隔子。拒绝含有多于三个连续T核苷酸的原型间隔子,以避免RNA聚合酶的可能卡壳。
用于克隆(1238937,1238938)的每个原型间隔子及其延伸序列由赛默飞世尔科技公司合成为单链寡核苷酸。将所有原型间隔子寡核苷酸稀释至5pmol/μl的最终工作浓度。
原型间隔子的组装。使用总体积为10μl的HiFi DNA Assembly MasterMix试剂盒(新英格兰生物实验室公司)将原型间隔子克隆到pGMEr280中,该试剂盒由以下构成:1x/>HiFi Assembly Master Mix、50-100ng BglII消化的pGMEr280、1.0μl原型间隔子寡核苷酸(5pmol)和至最终体积为10μl的无菌Milli-Q H2O。将反应物在50℃下孵育15分钟,然后置于冰上。根据制造商的说明,将2μL每种反应物用于转化50μLStellarTM感受态细胞(克隆技术实验室公司)。将每种转化反应物涂布到两个LB+Amp板上,并且在37℃下孵育过夜。从选择板中分离推定的转化体菌落,并使用带有KingFisher纯质粒试剂盒(赛默飞世尔科技公司)的KingFisher Duo平台从每个菌落制备质粒DNA。将质粒DNA在Oxford Nanopore ONT测序平台上测序。将具有正确原型间隔子序列的质粒标记为pAgJg341(以针对Alg3 S19I突变进行切割)和pAgJg342(以针对Alg3 L139F突变进行切割)。存在于pAgJg341和pAgJg342中的原型间隔子可以分别被发现为SEQ ID NO:24和SEQID NO:25。
实例10:里氏木霉Alg3 S19I突变体的构建
如实例6所述产生里氏木霉6Q-M1002原生质体。在转化之前,通过将互补寡核苷酸1238939和1238940退火在一起,制备含有所希望突变的双链寡核苷酸,该突变包括旨在改变核酸酶PAM位点以防止修复时再切割的突变。
将寡核苷酸重构至50pmol/μl的浓度。将等量的每种寡核苷酸(每种100μl)一起添加,并在95℃下加热5分钟。然后将试管移至室温,使试管的温度缓慢下降。
将大约12.5μg pAgJg341核酸酶质粒+3000pmol(60μl)dsDNA寡核苷酸(如上所述)作为修复模板添加到500μl原生质体溶液中并轻轻混合。添加PEG缓冲液(1250μl),并且将反应物混合并在37℃下孵育30分钟。然后添加Tr-STC(5ml),并且将内容物铺在PDA+1M蔗糖板上,并在32℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖层,使潮霉素B的最终浓度为10μg/ml,并将板在30℃下孵育7天。接下来,将潮霉素抗性转化体转移至COVE2板上并在30℃下孵育5-7天。通过孢子PCR和Oxford Nanopore ONT测序筛选转化体的alg3基因座的正确修饰。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRETMPlant Direct PCR试剂盒,赛默科技公司)中。将每种孢子悬浮液用作PCR反应中的模板,以筛选alg3基因座(SEQ ID NO:28)的正确修饰。将引物1238985(SEQ ID NO:29)和1238986(SEQ ID NO:30)用于扩增alg3基因座含有预期突变的部分。
每种PCR反应由以下构成:1μl孢子悬浮液、20pmol的各引物、10μl2X PHIRETM植物PCR缓冲液(PHIRETM植物直接PCR试剂盒,赛默科技公司)、0.4μl PHIRETM热启动II DNA聚合酶(PHIRETM植物直接PCR试剂盒,赛默科技公司)、以及H2O至最终体积为20μl。根据制造商的说明书进行热循环。使用TBE缓冲液通过1%琼脂糖凝胶电泳分析PCR产物。用ExoSapIt清理PCR。向2μl ExoSapIt中添加5μl PCR反应。将反应在37℃下孵育15分钟,然后在80℃下孵育15分钟。将DNA在Qubit荧光计上定量,并提交进行Oxford Nanopore ONT测序。分析结果,并且从COVE2板上从两个含有所希望突变的转化体(M1002-S19I-1和M1002-S19I-5)中挑选孢子,并通过在PDA+1M蔗糖板上涂布稀释液进行孢子分离。将这些板在30℃下孵育3天。将孢子分离物M1002-S19I-1A和M1002-S19I-5A在COVE2板上传代培养,并在30℃下孵育。接下来,通过将稀释液涂布到PDA+1M蔗糖板上并在30℃下孵育3天,对来自的孢子分离物进行第二轮孢子分离。将孢子分离物M1002-S19I-1A1和M1002-S19I-5A1在PDA+1M蔗糖板上传代培养。根据实例5从每个样品制备基因组DNA,并送去进行Oxford Nanopore ONT测序。分离物含有所希望的修饰,并保存为M1002-S19I-1A1和M1002-S19I-5A1用于进一步研究。
实例11:里氏木霉Alg3 L139F突变体的构建
如实例6所述产生里氏木霉6Q-M1002原生质体。在转化之前,通过将互补寡核苷酸1238941(SEQ ID NO:31)和1238942(SEQ ID NO:32)退火在一起,制备含有所希望突变的双链寡核苷酸,该突变包括旨在改变核酸酶PAM位点以防止修复时再切割的突变。
将寡核苷酸重构至50pmol/μl的浓度。将等量的每种寡核苷酸(每种100μl)一起添加,并在95℃下加热5分钟。然后将试管移至室温,使试管的温度缓慢下降。
将大约12.5μg pAgJg342核酸酶质粒+3000pmol(60μl)dsDNA寡核苷酸(如上所述)作为修复模板添加到500μl原生质体溶液中并轻轻混合。添加PEG缓冲液(1250μl),并且将反应物混合并在37℃下孵育30分钟。然后添加Tr-STC(5ml),并且将内容物铺在PDA+1M蔗糖板上,并在32℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖层,使潮霉素B的最终浓度为10μg/ml,并将板在30℃下孵育7天。接下来,将潮霉素抗性转化体转移至COVE2板上并在30℃下孵育5-7天。通过孢子PCR和Oxford Nanopore ONT测序筛选转化体的alg3基因座的正确修饰。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRETMPlant Direct PCR试剂盒,赛默科技公司)中。将每种孢子悬浮液用作PCR反应中的模板,以筛选alg3基因座的正确修饰。将引物1238985(SEQ ID NO:29)和1238986(SEQ ID NO:30)用于扩增alg3基因座含有预期突变的部分。每种PCR反应由以下构成:1μl孢子悬浮液、20pmol的各引物、10μl 2X PHIRETM植物PCR缓冲液(PHIRETM植物直接PCR试剂盒,赛默科技公司)、0.4μl PHIRETM热启动II DNA聚合酶(PHIRETM植物直接PCR试剂盒,赛默科技公司)、以及H2O至最终体积为20μl。根据制造商的说明书进行热循环。使用TBE缓冲液通过1%琼脂糖凝胶电泳分析PCR产物。用ExoSapIt清理PCR。向2μl ExoSapIt中添加5μl PCR反应。将反应在37℃下孵育15分钟,然后在80℃下孵育15分钟。将DNA在Qubit荧光计上定量,并提交进行Oxford Nanopore ONT测序。分析结果,并且从COVE2板上从两个含有所希望突变的转化体(M1002-L139F-1和M1002-L139F-3)中挑选孢子,并通过在PDA+1M蔗糖板上涂布稀释液进行孢子分离。将这些板在30℃下孵育3天。将孢子分离物M1002-L139F-1A和M1002-L139F-3C在COVE2板上传代培养,并在30℃下孵育。接下来,通过将稀释液涂布到PDA+1M蔗糖板上并在30℃下孵育3天,对来自的孢子分离物进行第二轮孢子分离。将孢子分离物M1002-L139F-1A1和M1002-L139F-3C1在PDA+1M蔗糖板上传代培养。根据实例5从每个样品制备基因组DNA,并送去进行Oxford Nanopore ONT测序。分离物含有所希望的修饰,并保存为M1002-L139F-1A1和M1002-L139F-3C1用于进一步研究。
实例12:溶菌酶活性测定(LSU(F)/ml)
在30℃下,将来自发酵的全发酵液在rotisserie混合器中混合约2小时。在全发酵液混合后,将所有样品在预稀释缓冲液中稀释100倍,然后再次使用rotisserie混合器混合约2小时。接下来,将100倍预稀释样品在0.1MTris-HCl、0.1M NaCl、0.01% Triton X-100缓冲液pH 7.5(样品缓冲液)中通过10倍系列稀释而稀释10000倍,随后是3倍系列稀释直至稀释样品的1/27。该方法与贝克曼库尔特公司的Biomek FX和来自分子仪器公司的SpectraMax板读数仪联合使用。在样品缓冲液中,以0.05LSU(F)/ml浓度稀释溶菌酶标准品,并以0.002LSU(F)/ml浓度结束。将包括标准品的每个稀释的共50μl转移至96孔平底板中。向各孔中添加50μl的25ug/ml荧光素缀合的细胞壁底物溶液,然后在环境温度下孵育45分钟。孵育期间,以15分钟的间隔监测96孔板在485nm(激发)/528nm(发射)处的反应速率。通过从生成的标准曲线外推来确定样品浓度。
实例13:实验室规模发酵表明,里氏木霉Alg3中的突变S19I和L139F导致溶菌酶生产率/产率的增加
根据WO 2020/123845的实例12中提到的方案,在2升发酵中与对照菌株6Q-M1002一起评价alg3突变菌株M1002-S19I-1A1和M1002-L139F-1A1菌株。在第7天取等份全培养液,并在5℃至10℃下储存,直到对其进行处理用于溶菌酶活性测定。
如实例12中所述测定溶菌酶表达水平。如表8中所看出,与表达未修饰的Alg3蛋白的6Q-M1002菌株相比,里氏木霉Alg3中的S19I和L139F突变导致溶菌酶滴度增加7%-8%。
总之,上述结果证实了位置S19(与黑曲霉中的T17相关)和位置L139(与黑曲霉中的L137相关)处的Alg3突变有助于在不同种类的酶(例如溶菌酶和葡糖淀粉酶)的生产过程中增加酶产率。如整个实例所示,所述突变的积极效果不仅仅限于一类酶或一种类型的真菌物种,并且因此预期对包含Alg3途径的其他真菌宿主细胞也有效。
表8.野生型alg3里氏木霉菌株和alg3突变体的溶菌酶活性/产率。
菌株 Alg3突变 LSU(F)相对活性
6Q-M1002 1.00
M1002-S19I-1A1 S19I 1.07
M1002-L139F-1A1 L139F 1.08
本文描述和要求保护的本发明不限于本文披露的特定方面的范围,因为这些方面旨在作为本发明几个方面的说明。任何等同方面旨在处于本发明的范围之内。实际上,除本文所示和描述的那些之外,本发明的各种修改因前述说明而对本领域的技术人员变得清楚。此类修改也旨在落入所附权利要求的范围内。在冲突的情况下,以包括定义的本披露为准。
通过以下编号的段落进一步定义本发明:
1.一种真菌宿主细胞,在该真菌宿主细胞基因组中包含:
编码目的多肽的第一多核苷酸;以及
第二多核苷酸,该第二多核苷酸编码与SEQ ID NO:7具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15、17和/或137的位置处包含改变的多肽。
2.根据段落1所述的真菌宿主细胞,其中所述多肽在对应于SEQ ID NO:7的位置15、17和/或137的位置处的改变彼此独立地选自氨基酸取代、氨基酸插入、氨基酸缺失或提前多肽终止。
3.根据段落1-2中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:7的位置137的位置处的改变是氨基酸取代,优选由苯丙氨酸对亮氨酸的取代L137F,如SEQ ID NO:8中所示。
4.根据段落1-2中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:7的位置17的位置处的改变是氨基酸取代,优选由异亮氨酸对苏氨酸的取代T17I,如SEQID NO:18中所示。
5.根据段落1-2中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:7的位置15的位置处的改变是提前多肽终止R15*,如SEQ ID NO:15中所示。
6.根据段落1-2中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:7的位置137的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对亮氨酸的取代。
7.根据段落1-2中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:7的位置17的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对苏氨酸的取代。
8.根据段落1-2中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:7的位置15、17和/或137的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸,其中该氨基酸插入可以是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
9.一种真菌宿主细胞,在该真菌宿主细胞基因组中包含:
编码目的多肽的第一多核苷酸;以及
第二多核苷酸,该第二多核苷酸编码与SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:21的位置19和/或139的位置处包含改变的多肽。
10.根据段落9所述的真菌宿主细胞,其中所述多肽在对应于SEQ ID NO:21的位置19和/或139的位置处的改变彼此独立地选自氨基酸取代、氨基酸插入、氨基酸缺失或提前多肽终止。
11.根据段落9-10中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:21的位置139的位置处的改变是氨基酸取代,优选由苯丙氨酸对亮氨酸的取代L139F,如SEQ ID NO:39中所示。
12.根据段落9-10中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:21的位置19的位置处的改变是氨基酸取代,优选由异亮氨酸对丝氨酸的取代S19I,如SEQ ID NO:36中所示。
13.根据段落9-10中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:21的位置139的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对亮氨酸的取代。
14.根据段落9-10中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:21的位置19的位置处的改变是氨基酸取代,例如由异亮氨酸、缬氨酸、组氨酸、赖氨酸、蛋氨酸、亮氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸对苏氨酸的取代。
15.根据段落9-10中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:21的位置19和/或139的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸,其中该氨基酸插入可以是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
16.根据段落1-15中任一项所述的真菌宿主细胞,其中该真菌宿主细胞是酵母宿主细胞;优选地,该酵母宿主细胞选自由以下组成的组:假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属(驹形氏酵母属)、酵母属、裂殖酵母属、和耶氏酵母属细胞;更优选地,该酵母宿主细胞选自由以下组成的组:乳酸克鲁维酵母、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、和解脂耶氏酵母细胞,最优选毕赤酵母(巴斯德毕赤酵母)。
17.根据段落1-15中任一项所述的真菌宿主细胞,其中该真菌宿主细胞是丝状真菌宿主细胞;优选地,该丝状真菌宿主细胞选自由以下组成的组:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、和木霉属细胞;更优选地,该丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢原毛平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞;甚至更优选地,该丝状宿主细胞选自由以下组成的组:米曲霉、镶片镰孢和里氏木霉细胞;最优选地,该丝状真菌宿主细胞是黑曲霉细胞。
18.根据段落1-15中任一项所述的真菌宿主细胞,其中该真菌宿主细胞是米曲霉细胞。
19.根据段落1-15中任一项所述的真菌宿主细胞,其中该真菌宿主细胞是里氏木霉细胞。
20.根据段落1-19中任一项所述的真菌宿主细胞,其中该目的多肽包含酶;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
21.根据段落1-19中任一项所述的真菌宿主细胞,其中该目的多肽是糖蛋白。
22.根据段落1-20中任一项所述的真菌宿主细胞,其中该目的多肽是α-葡糖苷酶,优选1,4-α-葡糖苷酶,最优选葡糖淀粉酶。
23.根据段落1-22中任一项所述的真菌宿主细胞,其中该目的多肽包含SEQ IDNO:9、基本上由其组成或由其组成。
24.根据段落1-22中任一项所述的真菌宿主细胞,其中该目的多肽包含SEQ IDNO:11、基本上由其组成或由其组成。
25.根据段落1-19中任一项所述的真菌宿主细胞,其中该目的多肽是水解酶,优选糖苷水解酶。
26.根据段落25所述的真菌宿主细胞,其中该目的多肽是溶菌酶,优选包含SEQ IDNO:33、基本上由其组成或由其组成的溶菌酶。
27.根据段落1-26中任一项所述的真菌宿主细胞,其中该宿主细胞包含该第一多核苷酸的两个或更多个拷贝。
28.根据段落1-27中任一项所述的真菌宿主细胞,其中该多肽在对应于SEQ IDNO:7的位置137的位置处的改变是由该第二多核苷酸内的单核苷酸多态性(SNP)引起的,优选地该第二多核苷酸内的SNP是对应于具有SEQ ID NO:3的第二多核苷酸的位置496、496和/或497的位置处的改变,其中该第二多核苷酸是与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性的多核苷酸变体。
29.根据段落1-27中任一项所述的真菌宿主细胞,其中该多肽在对应于SEQ IDNO:7的位置17的位置处的改变是由该第二多核苷酸内的单核苷酸多态性(SNP)引起的,优选地该第二多核苷酸内的SNP是对应于具有SEQ ID NO:3的第二多核苷酸的位置49、50和/或51的位置处的改变,其中该第二多核苷酸是与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性的多核苷酸变体。
30.根据段落1-27中任一项所述的真菌宿主细胞,其中该多肽在对应于SEQ IDNO:7的位置15的位置处的改变是由第二多核苷酸内的单核苷酸多态性(SNP)引起的,优选地该第二多核苷酸内的SNP是对应于具有SEQ ID NO:3的第二多核苷酸的位置43、44和/或45的位置处的改变,其中该第二多核苷酸是与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性的多核苷酸变体,该SNP导致提前终止密码子。
31.一种产生一种或多种目的多肽的方法,该方法包括在有助于产生该一种或多种目的多肽的条件下培养根据段落1-30中任一项所述的细胞。
32.根据段落31所述的方法,其中任选地回收该目的多肽。
33.一种核酸构建体,该核酸构建体包含异源启动子,该异源启动子可操作地连接至编码如下多肽的多核苷酸,该多肽与SEQ ID NO:7具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置15、17或137的位置处包含改变。
34.根据段落33所述的核酸构建体,其中对应于SEQ ID NO:7的位置137的位置处的改变是取代;优选苯丙氨酸对亮氨酸的取代,根据SEQ ID NO 8的L137F。
35.根据段落33所述的核酸构建体,其中在对应于SEQ ID NO:7的位置17的位置处的改变是氨基酸取代,优选由异亮氨酸对苏氨酸的取代T17I,如SEQ ID NO:18中所示。
36.根据段落33所述的核酸构建体,其中在对应于SEQ ID NO:7的位置15的位置处的改变是提前多肽终止R15*,如SEQ ID NO:15中所示。
37.根据段落33所述的核酸构建体,其中对应于SEQ ID NO:7的位置15或137的位置处的改变包含改变(优选地取代)或由改变(优选地取代)组成,其中该变体与SEQ ID NO:7的氨基酸序列具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%但小于100%的序列同一性。
38.根据段落34所述的核酸构建体,其中对应于SEQ ID NO:7的位置137的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Phe取代。
39.根据段落35所述的核酸构建体,其中对应于SEQ ID NO:7的位置17的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Phe、Leu、Lys、Met、、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ile取代。
40.根据段落36所述的核酸构建体,其中该多肽具有14个氨基酸或更少的长度,所述具有14个氨基酸或更少的多肽与SEQ ID NO:15的氨基酸序列具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%、优选100%的序列同一性。
41.根据段落33所述的核酸构建体,其中所述多肽在对应于SEQ ID NO:7的位置13、15或137的位置处的改变是氨基酸插入,例如选自以下列表的至少一种氨基酸的氨基酸插入:亮氨酸、苯丙氨酸、异亮氨酸、缬氨酸、组氨酸、赖氨酸、甲硫氨酸、苏氨酸、色氨酸、天冬酰胺、天冬氨酸/天冬氨酸、丙氨酸、精氨酸、半胱氨酸/胱氨酸、谷氨酰胺、谷氨酸/谷氨酸盐、甘氨酸、脯氨酸、丝氨酸或酪氨酸。
42.根据段落41所述的核酸构建体,其中该氨基酸插入是一个、两个、三个、四个、五个或多于五个氨基酸的插入,其中这些氨基酸彼此独立地选择。
43.根据段落33-42中任一项所述的核酸构建体,其中编码该多肽的多核苷酸与SEQ ID NO:3或SEQ ID NO:4具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性。
44.根据段落33-43中任一项所述的核酸构建体,其中编码该多肽的多核苷酸与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:3的位置43、44、45、49、50、51、495、496和/或497的位置处包含至少一个核苷酸改变。
45.根据段落33-43中任一项所述的核酸构建体,其中编码该多肽的多核苷酸与SEQ ID NO:3具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:4的位置43、44、45、49、50和/或51的位置处包含至少一个核苷酸改变。
46.根据段落43所述的核酸构建体,其中该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:3的位置495、496和/或497的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
47.根据段落46所述的核酸构建体,其中该至少一个核苷酸改变包括在对应于SEQID NO:3的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C495T,如SEQ ID NO:5中所示,或由其组成。
48.根据段落46所述的核酸构建体,其中该至少一个核苷酸改变包括在对应于SEQID NO:3的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C495T,以及在对应于SEQ ID NO:3的位置497的位置处由胞嘧啶对胸腺嘧啶的取代,或由其组成。
49.根据段落46所述的核酸构建体,其中对应于SEQ ID NO:3的位置495、496和/或497的核苷酸中的其中一个、两个或三个彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)或胞嘧啶(C)取代。
50.根据段落46所述的核酸构建体,其中对应于SEQ ID NO:3的位置495、496和/或497的核苷酸中的其中一个、两个或三个彼此独立地缺失。
51.根据段落33-43中任一项所述的核酸构建体,其中编码该多肽的多核苷酸与SEQ ID NO:4具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:4的位置409、410和/或411的位置处包含至少一个核苷酸改变。
52.根据段落51所述的核酸构建体,其中该至少一个核苷酸改变是取代;优选地,对应于SEQ ID NO:4的位置409、410和/或411的位置处的一个或多个核苷酸彼此独立地被腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和/或胞嘧啶(C)取代。
53.根据段落51所述的核酸构建体,其中该至少一个核苷酸改变包括在对应于SEQID NO:4的位置409的位置处由胸腺嘧啶对胞嘧啶的取代C409T,如SEQ ID NO:6中所示,或由其组成。
54.根据段落51所述的核酸构建体,其中该至少一个核苷酸改变包括在对应于SEQID NO:4的位置495的位置处由胸腺嘧啶对胞嘧啶的取代C409T,以及在对应于SEQ ID NO:4的位置411的位置处由胞嘧啶对胸腺嘧啶的取代,或由其组成。
55.根据段落51所述的核酸构建体,其中对应于SEQ ID NO:4的位置409、410和/或411的核苷酸中的其中一个、两个或三个彼此独立地缺失。
56.根据段落33-55中任一项所述的核酸构建体,其中该至少一个核苷酸改变导致错义突变和/或提前终止密码子。
57.根据段落56所述的核酸构建体,其中该提前终止密码子由以下引起:在对应于SEQ ID NO:3的位置43的位置处由胸腺嘧啶对胞嘧啶的取代,如SEQ ID NO:13中所示的C43T。
58.一种表达载体,该表达载体包含根据段落33-57中任一项所述的核酸构建体。
59.一种真菌宿主细胞,该真菌宿主细胞包含根据段落33-58中任一项所述的表达载体或核酸构建体。
60.根据段落59所述的真菌宿主细胞,其中该宿主细胞具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性。
61.一种具有改变、降低或消除的Man5GlcNAc2-PP-Dolα-1,3-甘露糖基转移酶活性的分离或纯化的多肽,该多肽选自由以下组成的组:
(a)与SEQ ID NO:7具有至少50%序列同一性并且在对应于SEQ ID NO:7的位置15、17或137的位置处包含改变的多肽;
(b)与SEQ ID NO:7具有至少50%序列同一性并且在对应于SEQ ID NO:7的位置15、17、137的位置处包含改变的多肽,其中该改变是R15*、T17I和L137F中的一个或多个;
(c)包含SEQ ID NO:8、SEQ ID NO:15或SEQ ID NO:18、基本上由其组成或由其组成的多肽;
(d)由以下多核苷酸编码的多肽,该多核苷酸在中严格条件下与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列(SEQ ID NO:6)的全长互补体杂交;
(e)由以下多核苷酸编码的多肽,该多核苷酸在中严格条件下与SEQ ID NO:13的成熟多肽编码序列或其cDNA序列(SEQ ID NO:14)的全长互补体杂交;
(f)由以下多核苷酸编码的多肽,该多核苷酸在中严格条件下与SEQ ID NO:16的成熟多肽编码序列或其cDNA序列(SEQ ID NO:17)的全长互补体杂交;
(g)由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列(SEQ ID NO:6)具有至少50%的序列同一性;
(h)由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列或其cDNA序列(SEQ ID NO:14)具有至少50%的序列同一性;
(i)由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:16的成熟多肽编码序列或其cDNA序列(SEQ ID NO:17)具有至少50%的序列同一性;以及
(j)通过在SEQ ID NO:7的成熟多肽中取代、缺失或添加一个或若干个氨基酸而衍生自SEQ ID NO:7的成熟多肽的多肽。
62.一种全培养液配制品或细胞培养组合物,该全培养液配制品或细胞培养组合物包含如段落61所述的多肽或如段落1-30和59-60中任一项所述的细胞。
63.一种产生具有葡糖淀粉酶活性的多肽的方法,该方法包括在有助于产生该多肽的条件下培养如段落1-30和59-60中任一项所述的重组宿主细胞。
64.如段落63所述的方法,该方法进一步包括回收该多肽。
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 用于提高蛋白质产量的糖基转移酶变体
<130> 15114-WO-PCT
<160> 40
<170> PatentIn 3.5版
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> pIhar531原型间隔子
<400> 1
gccgtacttg cttccgctgc 20
<210> 2
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> pIhar531引物IH160M-GT58
<400> 2
ttcgattcac ggatgatgca gccgtacttg cttccgctgc gttttagagc tagaaatagc 60
<210> 3
<211> 1400
<212> DNA
<213> 黑曲霉(Aspergillus niger)
<400> 3
atggactgga tgcgcctaat tcgcgatttg tgtttcaatc cccgacacac aaaatggatg 60
gctccgctcc tggtcctggg tgacgctttc ctctgcgcgc tgatcatctg gaaagtgccc 120
tgtaaggcta cagctaagct ccgttcacac ccttttgcga caagtgaagc aatgccacta 180
acctagcccc gttgctattg tccacagata ccgagattga ctgggccacg tacatgcaac 240
aaatatcgct ttatttgtca ggagaacgcg attatactct catcagagga tcaaccggtc 300
cccttgtcta cccggccgcc catgtataca gttatacggc cctctaccat ctcaccgatg 360
aggggcgcga tattttcttc ggtcagatac tatttgctgt gctctacttg atcacgctgg 420
tggttgtgct gtgctgttat agacagtcgg gtgctccgcc gtacttgctt ccgctgctgg 480
tcctttccaa gagacttcac agcgtttatg tcctgcgtct gttcaatgat ggcttggcgg 540
cgctggcgat gtgggttgcc attctgttat tcatgaatcg gaagtggacg gctgcggtcg 600
cagtgtggtc tactggtgtt gcgattaaga tgacactgtt gctgctggcc ccggctattg 660
ctgtggtcac ggtgcttagt ctgtcgcttg gtcctagcgt ggggctgggg gttctggcgg 720
tgcttgtcca ggtaggttcc catgaggctg tagggttggc caaaggcaat ttgtgtgaag 780
acttgtctga cattgaacta caggttttac tcgcgatacc gttcctacaa aacaacccgg 840
cggggtatct ctcgcgggcg ttcgagctaa ccagacagtt catgtttaaa tggacagtca 900
attggagatt tgttggcgaa gaagtattct tatctaagag cttttccctg gcattgctgg 960
ccgtccacat tgtgctgcta ggcgcttttg ccgtcactgg ttggctgaga tactccaggt 1020
ctagcttgcc tgcgttcatt cggaatctgc tagcgggtcg acatcgcaca gtgtccctcc 1080
ccaaacccta catcatgagc gtgatgctct cgtctctgac agttggcttg ttgtgcgcaa 1140
ggtcccttca ttaccaattc ttcgcctacc tctcctgggc gacacccttc ctcctctggc 1200
gcgcagggtt tcatccaatc ttgctgtacc ttatctgggc tatgcaagag tgggcttgga 1260
acacattccc cagcaccaac ctcagttcca tcattgttgt cctctcactt gctacccaga 1320
gtttcggcgt ccttgcgaat agtgccagcg ccttttatac catgcgttcg aaccctagcg 1380
gtaaagagca taaccaatag 1400
<210> 4
<211> 1242
<212> DNA
<213> 人工序列
<220>
<223> Alg3野生型cDNA
<400> 4
atggactgga tgcgcctaat tcgcgatttg tgtttcaatc cccgacacac aaaatggatg 60
gctccgctcc tggtcctggg tgacgctttc ctctgcgcgc tgatcatctg gaaagtgccc 120
tataccgaga ttgactgggc cacgtacatg caacaaatat cgctttattt gtcaggagaa 180
cgcgattata ctctcatcag aggatcaacc ggtccccttg tctacccggc cgcccatgta 240
tacagttata cggccctcta ccatctcacc gatgaggggc gcgatatttt cttcggtcag 300
atactatttg ctgtgctcta cttgatcacg ctggtggttg tgctgtgctg ttatagacag 360
tcgggtgctc cgccgtactt gcttccgctg ctggtccttt ccaagagact tcacagcgtt 420
tatgtcctgc gtctgttcaa tgatggcttg gcggcgctgg cgatgtgggt tgccattctg 480
ttattcatga atcggaagtg gacggctgcg gtcgcagtgt ggtctactgg tgttgcgatt 540
aagatgacac tgttgctgct ggccccggct attgctgtgg tcacggtgct tagtctgtcg 600
cttggtccta gcgtggggct gggggttctg gcggtgcttg tccaggtttt actcgcgata 660
ccgttcctac aaaacaaccc ggcggggtat ctctcgcggg cgttcgagct aaccagacag 720
ttcatgttta aatggacagt caattggaga tttgttggcg aagaagtatt cttatctaag 780
agcttttccc tggcattgct ggccgtccac attgtgctgc taggcgcttt tgccgtcact 840
ggttggctga gatactccag gtctagcttg cctgcgttca ttcggaatct gctagcgggt 900
cgacatcgca cagtgtccct ccccaaaccc tacatcatga gcgtgatgct ctcgtctctg 960
acagttggct tgttgtgcgc aaggtccctt cattaccaat tcttcgccta cctctcctgg 1020
gcgacaccct tcctcctctg gcgcgcaggg tttcatccaa tcttgctgta ccttatctgg 1080
gctatgcaag agtgggcttg gaacacattc cccagcacca acctcagttc catcattgtt 1140
gtcctctcac ttgctaccca gagtttcggc gtccttgcga atagtgccag cgccttttat 1200
accatgcgtt cgaaccctag cggtaaagag cataaccaat ag 1242
<210> 5
<211> 1400
<212> DNA
<213> 人工序列
<220>
<223> Alg3变体L137F gDNA
<400> 5
atggactgga tgcgcctaat tcgcgatttg tgtttcaatc cccgacacac aaaatggatg 60
gctccgctcc tggtcctggg tgacgctttc ctctgcgcgc tgatcatctg gaaagtgccc 120
tgtaaggcta cagctaagct ccgttcacac ccttttgcga caagtgaagc aatgccacta 180
acctagcccc gttgctattg tccacagata ccgagattga ctgggccacg tacatgcaac 240
aaatatcgct ttatttgtca ggagaacgcg attatactct catcagagga tcaaccggtc 300
cccttgtcta cccggccgcc catgtataca gttatacggc cctctaccat ctcaccgatg 360
aggggcgcga tattttcttc ggtcagatac tatttgctgt gctctacttg atcacgctgg 420
tggttgtgct gtgctgttat agacagtcgg gtgctccgcc gtacttgctt ccgctgctcg 480
tcctttccaa gagatttcac agcgtttatg tcctgcgtct gttcaatgat ggcttggcgg 540
cgctggcgat gtgggttgcc attctgttat tcatgaatcg gaagtggacg gctgcggtcg 600
cagtgtggtc tactggtgtt gcgattaaga tgacactgtt gctgctggcc ccggctattg 660
ctgtggtcac ggtgcttagt ctgtcgcttg gtcctagcgt ggggctgggg gttctggcgg 720
tgcttgtcca ggtaggttcc catgaggctg tagggttggc caaaggcaat ttgtgtgaag 780
acttgtctga cattgaacta caggttttac tcgcgatacc gttcctacaa aacaacccgg 840
cggggtatct ctcgcgggcg ttcgagctaa ccagacagtt catgtttaaa tggacagtca 900
attggagatt tgttggcgaa gaagtattct tatctaagag cttttccctg gcattgctgg 960
ccgtccacat tgtgctgcta ggcgcttttg ccgtcactgg ttggctgaga tactccaggt 1020
ctagcttgcc tgcgttcatt cggaatctgc tagcgggtcg acatcgcaca gtgtccctcc 1080
ccaaacccta catcatgagc gtgatgctct cgtctctgac agttggcttg ttgtgcgcaa 1140
ggtcccttca ttaccaattc ttcgcctacc tctcctgggc gacacccttc ctcctctggc 1200
gcgcagggtt tcatccaatc ttgctgtacc ttatctgggc tatgcaagag tgggcttgga 1260
acacattccc cagcaccaac ctcagttcca tcattgttgt cctctcactt gctacccaga 1320
gtttcggcgt ccttgcgaat agtgccagcg ccttttatac catgcgttcg aaccctagcg 1380
gtaaagagca taaccaatag 1400
<210> 6
<211> 1242
<212> DNA
<213> 人工序列
<220>
<223> Alg3变体L137F cDNA
<400> 6
atggactgga tgcgcctaat tcgcgatttg tgtttcaatc cccgacacac aaaatggatg 60
gctccgctcc tggtcctggg tgacgctttc ctctgcgcgc tgatcatctg gaaagtgccc 120
tataccgaga ttgactgggc cacgtacatg caacaaatat cgctttattt gtcaggagaa 180
cgcgattata ctctcatcag aggatcaacc ggtccccttg tctacccggc cgcccatgta 240
tacagttata cggccctcta ccatctcacc gatgaggggc gcgatatttt cttcggtcag 300
atactatttg ctgtgctcta cttgatcacg ctggtggttg tgctgtgctg ttatagacag 360
tcgggtgctc cgccgtactt gcttccgctg ctcgtccttt ccaagagatt tcacagcgtt 420
tatgtcctgc gtctgttcaa tgatggcttg gcggcgctgg cgatgtgggt tgccattctg 480
ttattcatga atcggaagtg gacggctgcg gtcgcagtgt ggtctactgg tgttgcgatt 540
aagatgacac tgttgctgct ggccccggct attgctgtgg tcacggtgct tagtctgtcg 600
cttggtccta gcgtggggct gggggttctg gcggtgcttg tccaggtttt actcgcgata 660
ccgttcctac aaaacaaccc ggcggggtat ctctcgcggg cgttcgagct aaccagacag 720
ttcatgttta aatggacagt caattggaga tttgttggcg aagaagtatt cttatctaag 780
agcttttccc tggcattgct ggccgtccac attgtgctgc taggcgcttt tgccgtcact 840
ggttggctga gatactccag gtctagcttg cctgcgttca ttcggaatct gctagcgggt 900
cgacatcgca cagtgtccct ccccaaaccc tacatcatga gcgtgatgct ctcgtctctg 960
acagttggct tgttgtgcgc aaggtccctt cattaccaat tcttcgccta cctctcctgg 1020
gcgacaccct tcctcctctg gcgcgcaggg tttcatccaa tcttgctgta ccttatctgg 1080
gctatgcaag agtgggcttg gaacacattc cccagcacca acctcagttc catcattgtt 1140
gtcctctcac ttgctaccca gagtttcggc gtccttgcga atagtgccag cgccttttat 1200
accatgcgtt cgaaccctag cggtaaagag cataaccaat ag 1242
<210> 7
<211> 413
<212> PRT
<213> 黑曲霉(Aspergillus niger)
<400> 7
Met Asp Trp Met Arg Leu Ile Arg Asp Leu Cys Phe Asn Pro Arg His
1 5 10 15
Thr Lys Trp Met Ala Pro Leu Leu Val Leu Gly Asp Ala Phe Leu Cys
20 25 30
Ala Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp Ala Thr
35 40 45
Tyr Met Gln Gln Ile Ser Leu Tyr Leu Ser Gly Glu Arg Asp Tyr Thr
50 55 60
Leu Ile Arg Gly Ser Thr Gly Pro Leu Val Tyr Pro Ala Ala His Val
65 70 75 80
Tyr Ser Tyr Thr Ala Leu Tyr His Leu Thr Asp Glu Gly Arg Asp Ile
85 90 95
Phe Phe Gly Gln Ile Leu Phe Ala Val Leu Tyr Leu Ile Thr Leu Val
100 105 110
Val Val Leu Cys Cys Tyr Arg Gln Ser Gly Ala Pro Pro Tyr Leu Leu
115 120 125
Pro Leu Leu Val Leu Ser Lys Arg Leu His Ser Val Tyr Val Leu Arg
130 135 140
Leu Phe Asn Asp Gly Leu Ala Ala Leu Ala Met Trp Val Ala Ile Leu
145 150 155 160
Leu Phe Met Asn Arg Lys Trp Thr Ala Ala Val Ala Val Trp Ser Thr
165 170 175
Gly Val Ala Ile Lys Met Thr Leu Leu Leu Leu Ala Pro Ala Ile Ala
180 185 190
Val Val Thr Val Leu Ser Leu Ser Leu Gly Pro Ser Val Gly Leu Gly
195 200 205
Val Leu Ala Val Leu Val Gln Val Leu Leu Ala Ile Pro Phe Leu Gln
210 215 220
Asn Asn Pro Ala Gly Tyr Leu Ser Arg Ala Phe Glu Leu Thr Arg Gln
225 230 235 240
Phe Met Phe Lys Trp Thr Val Asn Trp Arg Phe Val Gly Glu Glu Val
245 250 255
Phe Leu Ser Lys Ser Phe Ser Leu Ala Leu Leu Ala Val His Ile Val
260 265 270
Leu Leu Gly Ala Phe Ala Val Thr Gly Trp Leu Arg Tyr Ser Arg Ser
275 280 285
Ser Leu Pro Ala Phe Ile Arg Asn Leu Leu Ala Gly Arg His Arg Thr
290 295 300
Val Ser Leu Pro Lys Pro Tyr Ile Met Ser Val Met Leu Ser Ser Leu
305 310 315 320
Thr Val Gly Leu Leu Cys Ala Arg Ser Leu His Tyr Gln Phe Phe Ala
325 330 335
Tyr Leu Ser Trp Ala Thr Pro Phe Leu Leu Trp Arg Ala Gly Phe His
340 345 350
Pro Ile Leu Leu Tyr Leu Ile Trp Ala Met Gln Glu Trp Ala Trp Asn
355 360 365
Thr Phe Pro Ser Thr Asn Leu Ser Ser Ile Ile Val Val Leu Ser Leu
370 375 380
Ala Thr Gln Ser Phe Gly Val Leu Ala Asn Ser Ala Ser Ala Phe Tyr
385 390 395 400
Thr Met Arg Ser Asn Pro Ser Gly Lys Glu His Asn Gln
405 410
<210> 8
<211> 413
<212> PRT
<213> 人工序列
<220>
<223> Alg3变体L137F多肽
<400> 8
Met Asp Trp Met Arg Leu Ile Arg Asp Leu Cys Phe Asn Pro Arg His
1 5 10 15
Thr Lys Trp Met Ala Pro Leu Leu Val Leu Gly Asp Ala Phe Leu Cys
20 25 30
Ala Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp Ala Thr
35 40 45
Tyr Met Gln Gln Ile Ser Leu Tyr Leu Ser Gly Glu Arg Asp Tyr Thr
50 55 60
Leu Ile Arg Gly Ser Thr Gly Pro Leu Val Tyr Pro Ala Ala His Val
65 70 75 80
Tyr Ser Tyr Thr Ala Leu Tyr His Leu Thr Asp Glu Gly Arg Asp Ile
85 90 95
Phe Phe Gly Gln Ile Leu Phe Ala Val Leu Tyr Leu Ile Thr Leu Val
100 105 110
Val Val Leu Cys Cys Tyr Arg Gln Ser Gly Ala Pro Pro Tyr Leu Leu
115 120 125
Pro Leu Leu Val Leu Ser Lys Arg Phe His Ser Val Tyr Val Leu Arg
130 135 140
Leu Phe Asn Asp Gly Leu Ala Ala Leu Ala Met Trp Val Ala Ile Leu
145 150 155 160
Leu Phe Met Asn Arg Lys Trp Thr Ala Ala Val Ala Val Trp Ser Thr
165 170 175
Gly Val Ala Ile Lys Met Thr Leu Leu Leu Leu Ala Pro Ala Ile Ala
180 185 190
Val Val Thr Val Leu Ser Leu Ser Leu Gly Pro Ser Val Gly Leu Gly
195 200 205
Val Leu Ala Val Leu Val Gln Val Leu Leu Ala Ile Pro Phe Leu Gln
210 215 220
Asn Asn Pro Ala Gly Tyr Leu Ser Arg Ala Phe Glu Leu Thr Arg Gln
225 230 235 240
Phe Met Phe Lys Trp Thr Val Asn Trp Arg Phe Val Gly Glu Glu Val
245 250 255
Phe Leu Ser Lys Ser Phe Ser Leu Ala Leu Leu Ala Val His Ile Val
260 265 270
Leu Leu Gly Ala Phe Ala Val Thr Gly Trp Leu Arg Tyr Ser Arg Ser
275 280 285
Ser Leu Pro Ala Phe Ile Arg Asn Leu Leu Ala Gly Arg His Arg Thr
290 295 300
Val Ser Leu Pro Lys Pro Tyr Ile Met Ser Val Met Leu Ser Ser Leu
305 310 315 320
Thr Val Gly Leu Leu Cys Ala Arg Ser Leu His Tyr Gln Phe Phe Ala
325 330 335
Tyr Leu Ser Trp Ala Thr Pro Phe Leu Leu Trp Arg Ala Gly Phe His
340 345 350
Pro Ile Leu Leu Tyr Leu Ile Trp Ala Met Gln Glu Trp Ala Trp Asn
355 360 365
Thr Phe Pro Ser Thr Asn Leu Ser Ser Ile Ile Val Val Leu Ser Leu
370 375 380
Ala Thr Gln Ser Phe Gly Val Leu Ala Asn Ser Ala Ser Ala Phe Tyr
385 390 395 400
Thr Met Arg Ser Asn Pro Ser Gly Lys Glu His Asn Gln
405 410
<210> 9
<211> 573
<212> PRT
<213> 人工序列
<220>
<223> 葡糖淀粉酶PE变体多肽
<400> 9
Met Tyr Arg Phe Leu Val Cys Ala Leu Gly Leu Ala Ala Ser Val Leu
1 5 10 15
Ala Gln Ser Val Asp Ser Tyr Val Ser Ser Glu Gly Pro Ile Ala Lys
20 25 30
Ala Gly Met Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly
35 40 45
Ala Ser Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp
50 55 60
Tyr Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu
65 70 75 80
Ile Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Thr
85 90 95
Leu Ile Asp Asp Phe Val Thr Ala Glu Ala Asn Leu Gln Gln Val Pro
100 105 110
Asn Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe
115 120 125
Asn Val Asp Glu Thr Ala Phe Thr Gly Pro Trp Gly Arg Pro Gln Arg
130 135 140
Asp Gly Pro Ala Leu Arg Ser Thr Ala Leu Ile Thr Tyr Gly Asn Trp
145 150 155 160
Leu Leu Ser Asn Gly Asn Thr Ser Tyr Val Thr Ser Asn Leu Trp Pro
165 170 175
Ile Ile Gln Asn Asp Leu Gly Tyr Val Val Ser Tyr Trp Asn Gln Ser
180 185 190
Thr Tyr Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr Thr
195 200 205
Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Ala
210 215 220
Ile Gly Gln Thr Ser Gln Val Ser Ser Tyr Thr Thr Gln Ala Asp Asn
225 230 235 240
Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr Ile
245 250 255
Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu
260 265 270
Leu Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Ala
275 280 285
Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr
290 295 300
Val Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Val Ala Ser
305 310 315 320
Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Tyr Gly
325 330 335
Gly Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr
340 345 350
Asp Ala Leu Asn Val Trp Glu Ser Gln Gly Ser Leu Glu Val Thr Ser
355 360 365
Thr Ser Leu Ala Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Ala Gly
370 375 380
Thr Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Thr Leu Thr Ser Ala Ile
385 390 395 400
Lys Asn Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Lys Tyr Thr Pro
405 410 415
Ser Asn Gly Gly Leu Ala Glu Gln Tyr Ser Lys Ser Asp Gly Ser Pro
420 425 430
Leu Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala
435 440 445
Phe Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Ala Gly
450 455 460
Leu Thr Val Pro Ser Ser Cys Ser Gly Asn Ser Gly Gly Pro Thr Val
465 470 475 480
Ala Val Thr Phe Asn Val Asn Ala Glu Thr Val Trp Gly Glu Asn Ile
485 490 495
Tyr Leu Thr Gly Ser Val Asp Ala Leu Glu Asn Trp Ser Ala Asp Asn
500 505 510
Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val
515 520 525
Asn Leu Pro Ala Ser Thr Lys Ile Glu Tyr Lys Tyr Ile Arg Lys Met
530 535 540
Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr
545 550 555 560
Pro Ala Ser Gly Ser Trp Thr Glu Asn Asp Thr Trp Arg
565 570
<210> 10
<211> 1722
<212> DNA
<213> 人工序列
<220>
<223> 葡糖淀粉酶PE变体cDNA
<400> 10
atgtaccgct tccttgtctg tgcgctgggg cttgcggcat cagttctcgc ccagtcggtc 60
gacagctatg ttagcagcga aggtcccata gccaaggcgg gcatgcttgc taacattggg 120
ccgaacggct ccaaggcctc tggcgcatcc gctggtgttg tggtcgcgag ccctagcaag 180
tcggaccccg actattggta cacttggacg cgtgactcgt ccctcgtatt caagtcactt 240
attgaccagt acaccaccgg catcgacagc acgagctctc tgaggactct catcgacgat 300
ttcgtaactg ccgaggctaa tctccagcaa gtccccaacc ctagtggtac cctcaccacc 360
ggtggcttgg gagagcccaa gttcaacgtc gacgaaactg catttactgg tccctggggt 420
cgaccccaac gcgacggacc tgccctccgc tcgactgcat tgatcacgta cggtaactgg 480
ctgttgtcca acggaaatac gagctatgtt acgagcaatc tgtggccgat catccagaac 540
gaccttggtt atgtcgtgtc atactggaac cagtctacct acgacctctg ggaggaagta 600
gactcgtcat cgttcttcac tactgcagta cagcaccgtg ctctccgtga aggtgcggcc 660
ttcgctaccg ccatcggtca gacttcgcag gtcagcagct atacgactca ggcggacaat 720
cttctgtgct tcttgcagtc ttactggaac ccgagcggtg gttacatcac tgctaacact 780
ggcggcggcc gttccggcaa ggatgccaac acacttctgg catccattca cacgtacgac 840
cccagcgcgg gctgcgacgc tgcgactttc cagccctgct ctgacaaggc actgtcgaac 900
ctgaaggtct acgtcgactc tttccgctcg gtctactcca tcaacagtgg tgtcgcctct 960
aacgctgccg tcgccacggg tcgttatccc gaggatagct actacggtgg aaacccttgg 1020
tacctcacca catttgcggt cgccgagcaa ctctatgatg ctctcaatgt ctgggagtcg 1080
cagggttccc tcgaggtcac ctccacctcc cttgccttct tccagcagtt ctcatccggc 1140
gtcactgctg gcacctactc ttctagctcc agcacataca gcaccctcac gtctgccatc 1200
aagaactttg ccgatggatt tgtcgctatc aatgctaagt acacgccatc caacggtggc 1260
ctggcggaac aatacagcaa gagcgacggt tctcccctta gcgcggtgga cttgacgtgg 1320
agctacgctt cggctttgac ggcgtttgaa gcaaggaaca atactcagtt cgccggctgg 1380
ggcgctgcag gcctgactgt gccttcctct tgctccggca actctggtgg gccgaccgtt 1440
gctgtcacat tcaacgtgaa cgccgagact gtgtggggag agaacatcta tcttactggt 1500
tccgtcgatg ctctggagaa ctggtcggcc gacaatgccc tcctgctctc atcggctaat 1560
tacccgacct ggagtatcac cgtcaacttg ccggcgagca ctaagattga gtacaagtac 1620
atccgcaaaa tgaatggggc cgttacctgg gagtcagacc ccaacaatag catcactact 1680
ccggccagcg gctcgtggac cgagaatgac acttggcgtt ga 1722
<210> 11
<211> 573
<212> PRT
<213> 深褐褶菌(Gloeophyllum sepiarium)
<400> 11
Met Tyr Arg Phe Leu Val Cys Ala Leu Gly Leu Ala Ala Ser Val Leu
1 5 10 15
Ala Gln Ser Val Asp Ser Tyr Val Ser Ser Glu Gly Pro Ile Ala Lys
20 25 30
Ala Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly
35 40 45
Ala Ser Ala Gly Val Val Val Ala Ser Pro Ser Thr Ser Asp Pro Asp
50 55 60
Tyr Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu
65 70 75 80
Ile Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Thr
85 90 95
Leu Ile Asp Asp Phe Val Thr Ala Glu Ala Asn Leu Gln Gln Val Ser
100 105 110
Asn Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe
115 120 125
Asn Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg
130 135 140
Asp Gly Pro Ala Leu Arg Ser Thr Ala Leu Ile Thr Tyr Gly Asn Trp
145 150 155 160
Leu Leu Ser Asn Gly Asn Thr Ser Tyr Val Thr Ser Asn Leu Trp Pro
165 170 175
Ile Ile Gln Asn Asp Leu Gly Tyr Val Val Ser Tyr Trp Asn Gln Ser
180 185 190
Thr Tyr Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr Thr
195 200 205
Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Ala
210 215 220
Ile Gly Gln Thr Ser Gln Val Ser Ser Tyr Thr Thr Gln Ala Asp Asn
225 230 235 240
Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr Ile
245 250 255
Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu
260 265 270
Leu Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Ala
275 280 285
Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr
290 295 300
Val Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Val Ala Ser
305 310 315 320
Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly
325 330 335
Gly Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr
340 345 350
Asp Ala Leu Asn Val Trp Glu Ser Gln Gly Ser Leu Glu Val Thr Ser
355 360 365
Thr Ser Leu Ala Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Ala Gly
370 375 380
Thr Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Thr Leu Thr Ser Ala Ile
385 390 395 400
Lys Asn Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Lys Tyr Thr Pro
405 410 415
Ser Asn Gly Gly Leu Ala Glu Gln Tyr Ser Lys Ser Asp Gly Ser Pro
420 425 430
Leu Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala
435 440 445
Phe Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Ala Gly
450 455 460
Leu Thr Val Pro Ser Ser Cys Ser Gly Asn Ser Gly Gly Pro Thr Val
465 470 475 480
Ala Val Thr Phe Asn Val Asn Ala Glu Thr Val Trp Gly Glu Asn Ile
485 490 495
Tyr Leu Thr Gly Ser Val Asp Ala Leu Glu Asn Trp Ser Ala Asp Asn
500 505 510
Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val
515 520 525
Asn Leu Pro Ala Ser Thr Ala Ile Glu Tyr Lys Tyr Ile Arg Lys Asn
530 535 540
Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr
545 550 555 560
Pro Ala Ser Gly Ser Thr Thr Glu Asn Asp Thr Trp Arg
565 570
<210> 12
<211> 1722
<212> DNA
<213> 深褐褶菌(Gloeophyllum sepiarium)
<400> 12
atgtaccgct tccttgtctg tgcgctgggg cttgcggcat cagttctcgc ccagtcggtc 60
gacagctatg ttagcagcga aggtcccata gccaaggcgg gcgtccttgc taacattggg 120
ccgaacggct ccaaggcctc tggcgcatcc gctggtgttg tggtcgcgag ccctagcacg 180
tcggaccccg actattggta cacttggacg cgtgactcgt ccctcgtatt caagtcactt 240
attgaccagt acaccaccgg catcgacagc acgagctctc tgaggactct catcgacgat 300
ttcgtaactg ccgaggctaa tctccagcaa gtctctaacc ctagtggtac cctcaccacc 360
ggtggcttgg gagagcccaa gttcaacgtc gacgaaactg catttactgg tgcatggggt 420
cgaccccaac gcgacggacc tgccctccgc tcgactgcat tgatcacgta cggtaactgg 480
ctgttgtcca acggaaatac gagctatgtt acgagcaatc tgtggccgat catccagaac 540
gaccttggtt atgtcgtgtc atactggaac cagtctacct acgacctctg ggaggaagta 600
gactcgtcat cgttcttcac tactgcagta cagcaccgtg ctctccgtga aggtgcggcc 660
ttcgctaccg ccatcggtca gacttcgcag gtcagcagct atacgactca ggcggacaat 720
cttctgtgct tcttgcagtc ttactggaac ccgagcggtg gttacatcac tgctaacact 780
ggcggcggcc gttccggcaa ggatgccaac acacttctgg catccattca cacgtacgac 840
cccagcgcgg gctgcgacgc tgcgactttc cagccctgct ctgacaaggc actgtcgaac 900
ctgaaggtct acgtcgactc tttccgctcg gtctactcca tcaacagtgg tgtcgcctct 960
aacgctgccg tcgccacggg tcgttatccc gaggatagct accagggtgg aaacccttgg 1020
tacctcacca catttgcggt cgccgagcaa ctctatgatg ctctcaatgt ctgggagtcg 1080
cagggttccc tcgaggtcac ctccacctcc cttgccttct tccagcagtt ctcatccggc 1140
gtcactgctg gcacctactc ttctagctcc agcacataca gcaccctcac gtctgccatc 1200
aagaactttg ccgatggatt tgtcgctatc aatgctaagt acacgccatc caacggtggc 1260
ctggcggaac aatacagcaa gagcgacggt tctcccctta gcgcggtgga cttgacgtgg 1320
agctacgctt cggctttgac ggcgtttgaa gcaaggaaca atactcagtt cgccggctgg 1380
ggcgctgcag gcctgactgt gccttcctct tgctccggca actctggtgg gccgaccgtt 1440
gctgtcacat tcaacgtgaa cgccgagact gtgtggggag agaacatcta tcttactggt 1500
tccgtcgatg ctctggagaa ctggtcggcc gacaatgccc tcctgctctc atcggctaat 1560
tacccgacct ggagtatcac cgtcaacttg ccggcgagca ctgctattga gtacaagtac 1620
atccgcaaaa ataatggggc cgttacctgg gagtcagacc ccaacaatag catcactact 1680
ccggccagcg gctcgacgac cgagaatgac acttggcgtt ga 1722
<210> 13
<211> 1400
<212> DNA
<213> 人工序列
<220>
<223> Alg3变体R15* gDNA
<400> 13
atggactgga tgcgcctaat tcgcgatttg tgtttcaatc cctgacacac aaaatggatg 60
gctccgctcc tggtcctggg tgacgctttc ctctgcgcgc tgatcatctg gaaagtgccc 120
tgtaaggcta cagctaagct ccgttcacac ccttttgcga caagtgaagc aatgccacta 180
acctagcccc gttgctattg tccacagata ccgagattga ctgggccacg tacatgcaac 240
aaatatcgct ttatttgtca ggagaacgcg attatactct catcagagga tcaaccggtc 300
cccttgtcta cccggccgcc catgtataca gttatacggc cctctaccat ctcaccgatg 360
aggggcgcga tattttcttc ggtcagatac tatttgctgt gctctacttg atcacgctgg 420
tggttgtgct gtgctgttat agacagtcgg gtgctccgcc gtacttgctt ccgctgctgg 480
tcctttccaa gagacttcac agcgtttatg tcctgcgtct gttcaatgat ggcttggcgg 540
cgctggcgat gtgggttgcc attctgttat tcatgaatcg gaagtggacg gctgcggtcg 600
cagtgtggtc tactggtgtt gcgattaaga tgacactgtt gctgctggcc ccggctattg 660
ctgtggtcac ggtgcttagt ctgtcgcttg gtcctagcgt ggggctgggg gttctggcgg 720
tgcttgtcca ggtaggttcc catgaggctg tagggttggc caaaggcaat ttgtgtgaag 780
acttgtctga cattgaacta caggttttac tcgcgatacc gttcctacaa aacaacccgg 840
cggggtatct ctcgcgggcg ttcgagctaa ccagacagtt catgtttaaa tggacagtca 900
attggagatt tgttggcgaa gaagtattct tatctaagag cttttccctg gcattgctgg 960
ccgtccacat tgtgctgcta ggcgcttttg ccgtcactgg ttggctgaga tactccaggt 1020
ctagcttgcc tgcgttcatt cggaatctgc tagcgggtcg acatcgcaca gtgtccctcc 1080
ccaaacccta catcatgagc gtgatgctct cgtctctgac agttggcttg ttgtgcgcaa 1140
ggtcccttca ttaccaattc ttcgcctacc tctcctgggc gacacccttc ctcctctggc 1200
gcgcagggtt tcatccaatc ttgctgtacc ttatctgggc tatgcaagag tgggcttgga 1260
acacattccc cagcaccaac ctcagttcca tcattgttgt cctctcactt gctacccaga 1320
gtttcggcgt ccttgcgaat agtgccagcg ccttttatac catgcgttcg aaccctagcg 1380
gtaaagagca taaccaatag 1400
<210> 14
<211> 1242
<212> DNA
<213> 人工序列
<220>
<223> Alg3变体R15* cDNA
<400> 14
atggactgga tgcgcctaat tcgcgatttg tgtttcaatc cctgacacac aaaatggatg 60
gctccgctcc tggtcctggg tgacgctttc ctctgcgcgc tgatcatctg gaaagtgccc 120
tataccgaga ttgactgggc cacgtacatg caacaaatat cgctttattt gtcaggagaa 180
cgcgattata ctctcatcag aggatcaacc ggtccccttg tctacccggc cgcccatgta 240
tacagttata cggccctcta ccatctcacc gatgaggggc gcgatatttt cttcggtcag 300
atactatttg ctgtgctcta cttgatcacg ctggtggttg tgctgtgctg ttatagacag 360
tcgggtgctc cgccgtactt gcttccgctg ctggtccttt ccaagagact tcacagcgtt 420
tatgtcctgc gtctgttcaa tgatggcttg gcggcgctgg cgatgtgggt tgccattctg 480
ttattcatga atcggaagtg gacggctgcg gtcgcagtgt ggtctactgg tgttgcgatt 540
aagatgacac tgttgctgct ggccccggct attgctgtgg tcacggtgct tagtctgtcg 600
cttggtccta gcgtggggct gggggttctg gcggtgcttg tccaggtttt actcgcgata 660
ccgttcctac aaaacaaccc ggcggggtat ctctcgcggg cgttcgagct aaccagacag 720
ttcatgttta aatggacagt caattggaga tttgttggcg aagaagtatt cttatctaag 780
agcttttccc tggcattgct ggccgtccac attgtgctgc taggcgcttt tgccgtcact 840
ggttggctga gatactccag gtctagcttg cctgcgttca ttcggaatct gctagcgggt 900
cgacatcgca cagtgtccct ccccaaaccc tacatcatga gcgtgatgct ctcgtctctg 960
acagttggct tgttgtgcgc aaggtccctt cattaccaat tcttcgccta cctctcctgg 1020
gcgacaccct tcctcctctg gcgcgcaggg tttcatccaa tcttgctgta ccttatctgg 1080
gctatgcaag agtgggcttg gaacacattc cccagcacca acctcagttc catcattgtt 1140
gtcctctcac ttgctaccca gagtttcggc gtccttgcga atagtgccag cgccttttat 1200
accatgcgtt cgaaccctag cggtaaagag cataaccaat ag 1242
<210> 15
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> Alg3变体R15*多肽
<400> 15
Met Asp Trp Met Arg Leu Ile Arg Asp Leu Cys Phe Asn Pro
1 5 10
<210> 16
<211> 1400
<212> DNA
<213> 人工序列
<220>
<223> Alg3变体T17I gDNA
<400> 16
atggactgga tgcgcctaat tcgcgatttg tgtttcaatc cccgacacat aaaatggatg 60
gctccgctcc tggtcctggg tgacgctttc ctctgcgcgc tgatcatctg gaaagtgccc 120
tgtaaggcta cagctaagct ccgttcacac ccttttgcga caagtgaagc aatgccacta 180
acctagcccc gttgctattg tccacagata ccgagattga ctgggccacg tacatgcaac 240
aaatatcgct ttatttgtca ggagaacgcg attatactct catcagagga tcaaccggtc 300
cccttgtcta cccggccgcc catgtataca gttatacggc cctctaccat ctcaccgatg 360
aggggcgcga tattttcttc ggtcagatac tatttgctgt gctctacttg atcacgctgg 420
tggttgtgct gtgctgttat agacagtcgg gtgctccgcc gtacttgctt ccgctgctgg 480
tcctttccaa gagacttcac agcgtttatg tcctgcgtct gttcaatgat ggcttggcgg 540
cgctggcgat gtgggttgcc attctgttat tcatgaatcg gaagtggacg gctgcggtcg 600
cagtgtggtc tactggtgtt gcgattaaga tgacactgtt gctgctggcc ccggctattg 660
ctgtggtcac ggtgcttagt ctgtcgcttg gtcctagcgt ggggctgggg gttctggcgg 720
tgcttgtcca ggtaggttcc catgaggctg tagggttggc caaaggcaat ttgtgtgaag 780
acttgtctga cattgaacta caggttttac tcgcgatacc gttcctacaa aacaacccgg 840
cggggtatct ctcgcgggcg ttcgagctaa ccagacagtt catgtttaaa tggacagtca 900
attggagatt tgttggcgaa gaagtattct tatctaagag cttttccctg gcattgctgg 960
ccgtccacat tgtgctgcta ggcgcttttg ccgtcactgg ttggctgaga tactccaggt 1020
ctagcttgcc tgcgttcatt cggaatctgc tagcgggtcg acatcgcaca gtgtccctcc 1080
ccaaacccta catcatgagc gtgatgctct cgtctctgac agttggcttg ttgtgcgcaa 1140
ggtcccttca ttaccaattc ttcgcctacc tctcctgggc gacacccttc ctcctctggc 1200
gcgcagggtt tcatccaatc ttgctgtacc ttatctgggc tatgcaagag tgggcttgga 1260
acacattccc cagcaccaac ctcagttcca tcattgttgt cctctcactt gctacccaga 1320
gtttcggcgt ccttgcgaat agtgccagcg ccttttatac catgcgttcg aaccctagcg 1380
gtaaagagca taaccaatag 1400
<210> 17
<211> 1242
<212> DNA
<213> 人工序列
<220>
<223> Alg3变体T17I cDNA
<400> 17
atggactgga tgcgcctaat tcgcgatttg tgtttcaatc cccgacacat aaaatggatg 60
gctccgctcc tggtcctggg tgacgctttc ctctgcgcgc tgatcatctg gaaagtgccc 120
tataccgaga ttgactgggc cacgtacatg caacaaatat cgctttattt gtcaggagaa 180
cgcgattata ctctcatcag aggatcaacc ggtccccttg tctacccggc cgcccatgta 240
tacagttata cggccctcta ccatctcacc gatgaggggc gcgatatttt cttcggtcag 300
atactatttg ctgtgctcta cttgatcacg ctggtggttg tgctgtgctg ttatagacag 360
tcgggtgctc cgccgtactt gcttccgctg ctggtccttt ccaagagact tcacagcgtt 420
tatgtcctgc gtctgttcaa tgatggcttg gcggcgctgg cgatgtgggt tgccattctg 480
ttattcatga atcggaagtg gacggctgcg gtcgcagtgt ggtctactgg tgttgcgatt 540
aagatgacac tgttgctgct ggccccggct attgctgtgg tcacggtgct tagtctgtcg 600
cttggtccta gcgtggggct gggggttctg gcggtgcttg tccaggtttt actcgcgata 660
ccgttcctac aaaacaaccc ggcggggtat ctctcgcggg cgttcgagct aaccagacag 720
ttcatgttta aatggacagt caattggaga tttgttggcg aagaagtatt cttatctaag 780
agcttttccc tggcattgct ggccgtccac attgtgctgc taggcgcttt tgccgtcact 840
ggttggctga gatactccag gtctagcttg cctgcgttca ttcggaatct gctagcgggt 900
cgacatcgca cagtgtccct ccccaaaccc tacatcatga gcgtgatgct ctcgtctctg 960
acagttggct tgttgtgcgc aaggtccctt cattaccaat tcttcgccta cctctcctgg 1020
gcgacaccct tcctcctctg gcgcgcaggg tttcatccaa tcttgctgta ccttatctgg 1080
gctatgcaag agtgggcttg gaacacattc cccagcacca acctcagttc catcattgtt 1140
gtcctctcac ttgctaccca gagtttcggc gtccttgcga atagtgccag cgccttttat 1200
accatgcgtt cgaaccctag cggtaaagag cataaccaat ag 1242
<210> 18
<211> 413
<212> PRT
<213> 人工序列
<220>
<223> Alg3变体T17I多肽
<400> 18
Met Asp Trp Met Arg Leu Ile Arg Asp Leu Cys Phe Asn Pro Arg His
1 5 10 15
Ile Lys Trp Met Ala Pro Leu Leu Val Leu Gly Asp Ala Phe Leu Cys
20 25 30
Ala Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp Ala Thr
35 40 45
Tyr Met Gln Gln Ile Ser Leu Tyr Leu Ser Gly Glu Arg Asp Tyr Thr
50 55 60
Leu Ile Arg Gly Ser Thr Gly Pro Leu Val Tyr Pro Ala Ala His Val
65 70 75 80
Tyr Ser Tyr Thr Ala Leu Tyr His Leu Thr Asp Glu Gly Arg Asp Ile
85 90 95
Phe Phe Gly Gln Ile Leu Phe Ala Val Leu Tyr Leu Ile Thr Leu Val
100 105 110
Val Val Leu Cys Cys Tyr Arg Gln Ser Gly Ala Pro Pro Tyr Leu Leu
115 120 125
Pro Leu Leu Val Leu Ser Lys Arg Leu His Ser Val Tyr Val Leu Arg
130 135 140
Leu Phe Asn Asp Gly Leu Ala Ala Leu Ala Met Trp Val Ala Ile Leu
145 150 155 160
Leu Phe Met Asn Arg Lys Trp Thr Ala Ala Val Ala Val Trp Ser Thr
165 170 175
Gly Val Ala Ile Lys Met Thr Leu Leu Leu Leu Ala Pro Ala Ile Ala
180 185 190
Val Val Thr Val Leu Ser Leu Ser Leu Gly Pro Ser Val Gly Leu Gly
195 200 205
Val Leu Ala Val Leu Val Gln Val Leu Leu Ala Ile Pro Phe Leu Gln
210 215 220
Asn Asn Pro Ala Gly Tyr Leu Ser Arg Ala Phe Glu Leu Thr Arg Gln
225 230 235 240
Phe Met Phe Lys Trp Thr Val Asn Trp Arg Phe Val Gly Glu Glu Val
245 250 255
Phe Leu Ser Lys Ser Phe Ser Leu Ala Leu Leu Ala Val His Ile Val
260 265 270
Leu Leu Gly Ala Phe Ala Val Thr Gly Trp Leu Arg Tyr Ser Arg Ser
275 280 285
Ser Leu Pro Ala Phe Ile Arg Asn Leu Leu Ala Gly Arg His Arg Thr
290 295 300
Val Ser Leu Pro Lys Pro Tyr Ile Met Ser Val Met Leu Ser Ser Leu
305 310 315 320
Thr Val Gly Leu Leu Cys Ala Arg Ser Leu His Tyr Gln Phe Phe Ala
325 330 335
Tyr Leu Ser Trp Ala Thr Pro Phe Leu Leu Trp Arg Ala Gly Phe His
340 345 350
Pro Ile Leu Leu Tyr Leu Ile Trp Ala Met Gln Glu Trp Ala Trp Asn
355 360 365
Thr Phe Pro Ser Thr Asn Leu Ser Ser Ile Ile Val Val Leu Ser Leu
370 375 380
Ala Thr Gln Ser Phe Gly Val Leu Ala Asn Ser Ala Ser Ala Phe Tyr
385 390 395 400
Thr Met Arg Ser Asn Pro Ser Gly Lys Glu His Asn Gln
405 410
<210> 19
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> pTNA469原型间隔子
<400> 19
aatccccgac acacaaaatg g 21
<210> 20
<211> 838
<212> DNA
<213> 嗜碱枝顶孢(Acremonium alcalophilum)
<400> 20
atgaagcttc ttccctcctt gattggcctg gccagtctgg cgtccctcgc cgtcgcccgg 60
atccccggct ttgacatttc gggctggcaa ccgaccaccg actttgcaag ggcgtatgct 120
aatggagatc gtttcgtcta catcaaggta cgttcaacct tgccaccaag ttgcgaaccc 180
gagacaagac tgtgaccgcc tcctttgccc tggggcagct cacgcaccca gcagcatccc 240
atcccccggc cccccacgta ccaccggaaa gctaacatca accccctacc actgctacca 300
ggccaccgag ggcaccacat tcaagagctc cgcattcagc cgccagtaca ccggcgcaac 360
gcaaaacggc ttcatccgcg gcgcctacca cttcgcccag cccgccgcgt cctcgggcgc 420
cgcgcaggcg agatacttcg ccagcaacgg cggcggctgg tccaaggacg gcatcaccct 480
gcccggggcg ctggacatcg agtacaaccc caacggcgcc acctgctacg gcctctcgca 540
atcggccatg gtgaactgga tcgaggactt tgtcaccacc taccacggca tcacctcccg 600
ctggcccgtc atctacacca ccaccgactg gtggacccag tgcaccggca actccaaccg 660
cttcgcgaac cgctgcccgc tgtggatcgc ccgctacgcc agctccgtcg gcactctgcc 720
caatggctgg ggcttttaca ccttctggca gtacaacgac aagtatcctc agggcggtga 780
ttcgaactgg ttcaacggcg atgcgtcgcg tctcagggct ctcgctaacg gagactaa 838
<210> 21
<211> 420
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 21
Met Ala Ser Leu Ile Lys Thr Ala Val Asp Ile Ala Asn Gly Arg His
1 5 10 15
Ala Leu Ser Arg Tyr Val Ile Phe Gly Leu Trp Leu Ala Asp Ala Val
20 25 30
Leu Cys Gly Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp
35 40 45
Val Ala Tyr Met Glu Gln Val Thr Gln Phe Val His Gly Glu Arg Asp
50 55 60
Tyr Pro Lys Met Glu Gly Gly Thr Gly Pro Leu Val Tyr Pro Ala Ala
65 70 75 80
His Val Tyr Ile Tyr Thr Gly Leu Tyr Tyr Leu Thr Asn Lys Gly Thr
85 90 95
Asp Ile Leu Leu Ala Gln Gln Leu Phe Ala Val Leu Tyr Met Ala Thr
100 105 110
Leu Ala Val Val Met Thr Cys Tyr Ser Lys Ala Lys Val Pro Pro Tyr
115 120 125
Ile Phe Pro Leu Leu Ile Leu Ser Lys Arg Leu His Ser Val Phe Val
130 135 140
Leu Arg Cys Phe Asn Asp Cys Phe Ala Ala Phe Phe Leu Trp Leu Cys
145 150 155 160
Ile Phe Phe Phe Gln Arg Arg Glu Trp Thr Ile Gly Ala Leu Ala Tyr
165 170 175
Ser Ile Gly Leu Gly Val Lys Met Ser Leu Leu Leu Val Leu Pro Ala
180 185 190
Val Val Ile Val Leu Tyr Leu Gly Arg Gly Phe Lys Gly Ala Leu Arg
195 200 205
Leu Leu Trp Leu Met Val Gln Val Gln Leu Leu Leu Ala Ile Pro Phe
210 215 220
Ile Thr Thr Asn Trp Arg Gly Tyr Leu Gly Arg Ala Phe Glu Leu Ser
225 230 235 240
Arg Gln Phe Lys Phe Glu Trp Thr Val Asn Trp Arg Met Leu Gly Glu
245 250 255
Asp Leu Phe Leu Ser Arg Gly Phe Ser Ile Thr Leu Leu Ala Phe His
260 265 270
Ala Ile Phe Leu Leu Ala Phe Ile Leu Gly Arg Trp Leu Lys Ile Arg
275 280 285
Glu Arg Thr Val Leu Gly Met Ile Pro Tyr Val Ile Arg Phe Arg Ser
290 295 300
Pro Phe Thr Glu Gln Glu Glu Arg Ala Ile Ser Asn Arg Val Val Thr
305 310 315 320
Pro Gly Tyr Val Met Ser Thr Ile Leu Ser Ala Asn Val Val Gly Leu
325 330 335
Leu Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr Ala Tyr Leu Ala Trp
340 345 350
Ala Thr Pro Tyr Leu Leu Trp Thr Ala Cys Pro Asn Leu Leu Val Val
355 360 365
Ala Pro Leu Trp Ala Ala Gln Glu Trp Ala Trp Asn Val Phe Pro Ser
370 375 380
Thr Pro Leu Ser Ser Ser Val Val Val Ser Val Leu Ala Val Thr Val
385 390 395 400
Ala Met Ala Phe Ala Gly Ser Asn Pro Gln Pro Arg Glu Thr Ser Lys
405 410 415
Pro Lys Gln His
420
<210> 22
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 1238937寡核苷酸
<400> 22
tgcaggaatt tctactcttg tagatggctc tggcttgcgg atgcggtttt tttggctctt 60
<210> 23
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 1238938寡核苷酸
<400> 23
tgcaggaatt tctactcttg tagatgagag gatgagaagc gggaagtttt tttggctctt 60
<210> 24
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> pAgJg341原型间隔子
<400> 24
ggctctggct tgcggatgcg g 21
<210> 25
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> pAgJg342原型间隔子
<400> 25
gagaggatga gaagcgggaa g 21
<210> 26
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 1238939寡核苷酸
<400> 26
atcaaaactg ccgtggacat tgccaacggc cgccatgcgc tgatcagata tgtcatcttc 60
gggctctggc ttgcggatgc ggtgctgtgc gggc 94
<210> 27
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 1238940寡核苷酸
<400> 27
gcccgcacag caccgcatcc gcaagccaga gcccgaagat gacatatctg atcagcgcat 60
ggcggccgtt ggcaatgtcc acggcagttt tgat 94
<210> 28
<211> 1504
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 28
atggcgtcac tcatcaaaac tgccgtggac attgccaacg gccgccatgc gctgtccaga 60
tatgtcatct ttgggctctg gcttgcggat gcggtgctgt gcgggctgat tatctggaaa 120
gtgccttgtc agtctcaccc atgaatgacc cattcctttg caaccccaag aattgtcact 180
ctgaacatcg gagaaaaggg ggggaaacac atcaagtcgt caaaagaaga catctctacg 240
aatgaaagac acagaactcg tgtatgaagc tgaggctgat caatctctag atacggaaat 300
cgactgggtc gcctacatgg agcaagtcac ccagttcgtc cacggagagc gagactaccc 360
caagatggag ggcggcacag ggcccctggt gtatcccgcg gcccatgtgt acatctacac 420
agggctctac tacctgacga acaagggcac cgacatcctg ctggcgcagc agctctttgc 480
cgtgctctac atggctactc tggcggtcgt catgacatgc tactccaagg ccaaggtgag 540
ctgagccgag ggtgttcacg tttaagagca acaagtcact gaaaccggcc atcaaacacc 600
cccccatgga caggtcccgc cgtacatctt cccgcttctc atcctctcca aaagacttca 660
cagcgtcttc gtcctgagat gcttcaacga ctgcttcgcc gccttcttcc tctggctctg 720
catcttcttc ttccagaggc gagagtggac catcggagct ctcgcataca gcatcggcct 780
gggcgtcaaa atgtcgctgc tactggttct ccccgccgtg gtcatcgtcc tctacctcgg 840
ccgcggcttc aagggcgccc tgcggctgct ctggctcatg gtgcaggtcc agctcctcct 900
cgccataccc ttcatcacga caaattggcg cggctacctc ggccgtgcat tcgagctctc 960
gaggcagttc aagtttgaat ggacagtcaa ttggcgcatg ctgggcgagg atctgttcct 1020
cagccggggc ttctctatca cgctactggc atttcacgcc atcttcctcc tcgcctttat 1080
cctcggccgg tggctgaaga ttagggaacg gaccgtactc gggatgatcc cctatgtcat 1140
ccgattcaga tcgcccttta ccgagcagga agagcgcgcc atctccaacc gcgtcgtcac 1200
gcccggctat gtcatgtcca ccatcttgtc ggccaacgtg gtgggactgc tgtttgcccg 1260
gtctctgcac taccagttct atgcatatct ggcgtgggcg accccctatc tcctgtggac 1320
ggcctgcccc aatcttttgg tggtggcccc cctctgggcg gcgcaagaat gggcctggaa 1380
cgtcttcccc agcacgcctc ttagctcgag cgtcgtggtg agcgtgctgg ccgtgacggt 1440
ggccatggcg tttgcaggtt caaatccgca gccacgtgaa acatcgaagc cgaagcagca 1500
ctaa 1504
<210> 29
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 1238985引物
<400> 29
caagcctcat gttttgccaa cggaac 26
<210> 30
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 1238986引物
<400> 30
ccctaatctt cagccaccgg cc 22
<210> 31
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 1238941引物
<400> 31
gtcccgccgt acatcttccc gcttctcatc ctctccaaga gatttcacag cgtcttcgtc 60
ctgagatgct tcaacgactg cttcgccgcc ttct 94
<210> 32
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 1238942引物
<400> 32
agaaggcggc gaagcagtcg ttgaagcatc tcaggacgaa gacgctgtga aatctcttgg 60
agaggatgag aagcgggaag atgtacggcg ggac 94
<210> 33
<211> 227
<212> PRT
<213> 嗜碱枝顶孢(Acremonium alcalophilum)
<400> 33
Met Lys Leu Leu Pro Ser Leu Ile Gly Leu Ala Ser Leu Ala Ser Leu
1 5 10 15
Ala Val Ala Arg Ile Pro Gly Phe Asp Ile Ser Gly Trp Gln Pro Thr
20 25 30
Thr Asp Phe Ala Arg Ala Tyr Ala Asn Gly Asp Arg Phe Val Tyr Ile
35 40 45
Lys Ala Thr Glu Gly Thr Thr Phe Lys Ser Ser Ala Phe Ser Arg Gln
50 55 60
Tyr Thr Gly Ala Thr Gln Asn Gly Phe Ile Arg Gly Ala Tyr His Phe
65 70 75 80
Ala Gln Pro Ala Ala Ser Ser Gly Ala Ala Gln Ala Arg Tyr Phe Ala
85 90 95
Ser Asn Gly Gly Gly Trp Ser Lys Asp Gly Ile Thr Leu Pro Gly Ala
100 105 110
Leu Asp Ile Glu Tyr Asn Pro Asn Gly Ala Thr Cys Tyr Gly Leu Ser
115 120 125
Gln Ser Ala Met Val Asn Trp Ile Glu Asp Phe Val Thr Thr Tyr His
130 135 140
Gly Ile Thr Ser Arg Trp Pro Val Ile Tyr Thr Thr Thr Asp Trp Trp
145 150 155 160
Thr Gln Cys Thr Gly Asn Ser Asn Arg Phe Ala Asn Arg Cys Pro Leu
165 170 175
Trp Ile Ala Arg Tyr Ala Ser Ser Val Gly Thr Leu Pro Asn Gly Trp
180 185 190
Gly Phe Tyr Thr Phe Trp Gln Tyr Asn Asp Lys Tyr Pro Gln Gly Gly
195 200 205
Asp Ser Asn Trp Phe Asn Gly Asp Ala Ser Arg Leu Arg Ala Leu Ala
210 215 220
Asn Gly Asp
225
<210> 34
<211> 1504
<212> DNA
<213> 人工序列
<220>
<223> S19I Alg3里氏木霉( T. reesei)变体
<400> 34
atggcgtcac tcatcaaaac tgccgtggac attgccaacg gccgccatgc gctgatcaga 60
tatgtcatct tcgggctctg gcttgcggat gcggtgctgt gcgggctgat tatctggaaa 120
gtgccttgtc agtctcaccc atgaatgacc cattcctttg caaccccaag aattgtcact 180
ctgaacatcg gagaaaaggg ggggaaacac atcaagtcgt caaaagaaga catctctacg 240
aatgaaagac acagaactcg tgtatgaagc tgaggctgat caatctctag atacggaaat 300
cgactgggtc gcctacatgg agcaagtcac ccagttcgtc cacggagagc gagactaccc 360
caagatggag ggcggcacag ggcccctggt gtatcccgcg gcccatgtgt acatctacac 420
agggctctac tacctgacga acaagggcac cgacatcctg ctggcgcagc agctctttgc 480
cgtgctctac atggctactc tggcggtcgt catgacatgc tactccaagg ccaaggtgag 540
ctgagccgag ggtgttcacg tttaagagca acaagtcact gaaaccggcc atcaaacacc 600
cccccatgga caggtcccgc cgtacatctt cccgcttctc atcctctcca aaagacttca 660
cagcgtcttc gtcctgagat gcttcaacga ctgcttcgcc gccttcttcc tctggctctg 720
catcttcttc ttccagaggc gagagtggac catcggagct ctcgcataca gcatcggcct 780
gggcgtcaaa atgtcgctgc tactggttct ccccgccgtg gtcatcgtcc tctacctcgg 840
ccgcggcttc aagggcgccc tgcggctgct ctggctcatg gtgcaggtcc agctcctcct 900
cgccataccc ttcatcacga caaattggcg cggctacctc ggccgtgcat tcgagctctc 960
gaggcagttc aagtttgaat ggacagtcaa ttggcgcatg ctgggcgagg atctgttcct 1020
cagccggggc ttctctatca cgctactggc atttcacgcc atcttcctcc tcgcctttat 1080
cctcggccgg tggctgaaga ttagggaacg gaccgtactc gggatgatcc cctatgtcat 1140
ccgattcaga tcgcccttta ccgagcagga agagcgcgcc atctccaacc gcgtcgtcac 1200
gcccggctat gtcatgtcca ccatcttgtc ggccaacgtg gtgggactgc tgtttgcccg 1260
gtctctgcac taccagttct atgcatatct ggcgtgggcg accccctatc tcctgtggac 1320
ggcctgcccc aatcttttgg tggtggcccc cctctgggcg gcgcaagaat gggcctggaa 1380
cgtcttcccc agcacgcctc ttagctcgag cgtcgtggtg agcgtgctgg ccgtgacggt 1440
ggccatggcg tttgcaggtt caaatccgca gccacgtgaa acatcgaagc cgaagcagca 1500
ctaa 1504
<210> 35
<211> 1263
<212> DNA
<213> 人工序列
<220>
<223> S19I Alg3里氏木霉( T. reesei)变体
<400> 35
atggcgtcac tcatcaaaac tgccgtggac attgccaacg gccgccatgc gctgatcaga 60
tatgtcatct tcgggctctg gcttgcggat gcggtgctgt gcgggctgat tatctggaaa 120
gtgccttata cggaaatcga ctgggtcgcc tacatggagc aagtcaccca gttcgtccac 180
ggagagcgag actaccccaa gatggagggc ggcacagggc ccctggtgta tcccgcggcc 240
catgtgtaca tctacacagg gctctactac ctgacgaaca agggcaccga catcctgctg 300
gcgcagcagc tctttgccgt gctctacatg gctactctgg cggtcgtcat gacatgctac 360
tccaaggcca aggtcccgcc gtacatcttc ccgcttctca tcctctccaa aagacttcac 420
agcgtcttcg tcctgagatg cttcaacgac tgcttcgccg ccttcttcct ctggctctgc 480
atcttcttct tccagaggcg agagtggacc atcggagctc tcgcatacag catcggcctg 540
ggcgtcaaaa tgtcgctgct actggttctc cccgccgtgg tcatcgtcct ctacctcggc 600
cgcggcttca agggcgccct gcggctgctc tggctcatgg tgcaggtcca gctcctcctc 660
gccataccct tcatcacgac aaattggcgc ggctacctcg gccgtgcatt cgagctctcg 720
aggcagttca agtttgaatg gacagtcaat tggcgcatgc tgggcgagga tctgttcctc 780
agccggggct tctctatcac gctactggca tttcacgcca tcttcctcct cgcctttatc 840
ctcggccggt ggctgaagat tagggaacgg accgtactcg ggatgatccc ctatgtcatc 900
cgattcagat cgccctttac cgagcaggaa gagcgcgcca tctccaaccg cgtcgtcacg 960
cccggctatg tcatgtccac catcttgtcg gccaacgtgg tgggactgct gtttgcccgg 1020
tctctgcact accagttcta tgcatatctg gcgtgggcga ccccctatct cctgtggacg 1080
gcctgcccca atcttttggt ggtggccccc ctctgggcgg cgcaagaatg ggcctggaac 1140
gtcttcccca gcacgcctct tagctcgagc gtcgtggtga gcgtgctggc cgtgacggtg 1200
gccatggcgt ttgcaggttc aaatccgcag ccacgtgaaa catcgaagcc gaagcagcac 1260
taa 1263
<210> 36
<211> 420
<212> PRT
<213> 人工序列
<220>
<223> S19I Alg3里氏木霉( T. reesei)变体
<400> 36
Met Ala Ser Leu Ile Lys Thr Ala Val Asp Ile Ala Asn Gly Arg His
1 5 10 15
Ala Leu Ile Arg Tyr Val Ile Phe Gly Leu Trp Leu Ala Asp Ala Val
20 25 30
Leu Cys Gly Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp
35 40 45
Val Ala Tyr Met Glu Gln Val Thr Gln Phe Val His Gly Glu Arg Asp
50 55 60
Tyr Pro Lys Met Glu Gly Gly Thr Gly Pro Leu Val Tyr Pro Ala Ala
65 70 75 80
His Val Tyr Ile Tyr Thr Gly Leu Tyr Tyr Leu Thr Asn Lys Gly Thr
85 90 95
Asp Ile Leu Leu Ala Gln Gln Leu Phe Ala Val Leu Tyr Met Ala Thr
100 105 110
Leu Ala Val Val Met Thr Cys Tyr Ser Lys Ala Lys Val Pro Pro Tyr
115 120 125
Ile Phe Pro Leu Leu Ile Leu Ser Lys Arg Leu His Ser Val Phe Val
130 135 140
Leu Arg Cys Phe Asn Asp Cys Phe Ala Ala Phe Phe Leu Trp Leu Cys
145 150 155 160
Ile Phe Phe Phe Gln Arg Arg Glu Trp Thr Ile Gly Ala Leu Ala Tyr
165 170 175
Ser Ile Gly Leu Gly Val Lys Met Ser Leu Leu Leu Val Leu Pro Ala
180 185 190
Val Val Ile Val Leu Tyr Leu Gly Arg Gly Phe Lys Gly Ala Leu Arg
195 200 205
Leu Leu Trp Leu Met Val Gln Val Gln Leu Leu Leu Ala Ile Pro Phe
210 215 220
Ile Thr Thr Asn Trp Arg Gly Tyr Leu Gly Arg Ala Phe Glu Leu Ser
225 230 235 240
Arg Gln Phe Lys Phe Glu Trp Thr Val Asn Trp Arg Met Leu Gly Glu
245 250 255
Asp Leu Phe Leu Ser Arg Gly Phe Ser Ile Thr Leu Leu Ala Phe His
260 265 270
Ala Ile Phe Leu Leu Ala Phe Ile Leu Gly Arg Trp Leu Lys Ile Arg
275 280 285
Glu Arg Thr Val Leu Gly Met Ile Pro Tyr Val Ile Arg Phe Arg Ser
290 295 300
Pro Phe Thr Glu Gln Glu Glu Arg Ala Ile Ser Asn Arg Val Val Thr
305 310 315 320
Pro Gly Tyr Val Met Ser Thr Ile Leu Ser Ala Asn Val Val Gly Leu
325 330 335
Leu Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr Ala Tyr Leu Ala Trp
340 345 350
Ala Thr Pro Tyr Leu Leu Trp Thr Ala Cys Pro Asn Leu Leu Val Val
355 360 365
Ala Pro Leu Trp Ala Ala Gln Glu Trp Ala Trp Asn Val Phe Pro Ser
370 375 380
Thr Pro Leu Ser Ser Ser Val Val Val Ser Val Leu Ala Val Thr Val
385 390 395 400
Ala Met Ala Phe Ala Gly Ser Asn Pro Gln Pro Arg Glu Thr Ser Lys
405 410 415
Pro Lys Gln His
420
<210> 37
<211> 1504
<212> DNA
<213> 人工序列
<220>
<223> L139F Alg3里氏木霉( T. reesei)变体
<400> 37
atggcgtcac tcatcaaaac tgccgtggac attgccaacg gccgccatgc gctgtccaga 60
tatgtcatct ttgggctctg gcttgcggat gcggtgctgt gcgggctgat tatctggaaa 120
gtgccttgtc agtctcaccc atgaatgacc cattcctttg caaccccaag aattgtcact 180
ctgaacatcg gagaaaaggg ggggaaacac atcaagtcgt caaaagaaga catctctacg 240
aatgaaagac acagaactcg tgtatgaagc tgaggctgat caatctctag atacggaaat 300
cgactgggtc gcctacatgg agcaagtcac ccagttcgtc cacggagagc gagactaccc 360
caagatggag ggcggcacag ggcccctggt gtatcccgcg gcccatgtgt acatctacac 420
agggctctac tacctgacga acaagggcac cgacatcctg ctggcgcagc agctctttgc 480
cgtgctctac atggctactc tggcggtcgt catgacatgc tactccaagg ccaaggtgag 540
ctgagccgag ggtgttcacg tttaagagca acaagtcact gaaaccggcc atcaaacacc 600
cccccatgga caggtcccgc cgtacatctt cccgcttctc atcctctcca agagatttca 660
cagcgtcttc gtcctgagat gcttcaacga ctgcttcgcc gccttcttcc tctggctctg 720
catcttcttc ttccagaggc gagagtggac catcggagct ctcgcataca gcatcggcct 780
gggcgtcaaa atgtcgctgc tactggttct ccccgccgtg gtcatcgtcc tctacctcgg 840
ccgcggcttc aagggcgccc tgcggctgct ctggctcatg gtgcaggtcc agctcctcct 900
cgccataccc ttcatcacga caaattggcg cggctacctc ggccgtgcat tcgagctctc 960
gaggcagttc aagtttgaat ggacagtcaa ttggcgcatg ctgggcgagg atctgttcct 1020
cagccggggc ttctctatca cgctactggc atttcacgcc atcttcctcc tcgcctttat 1080
cctcggccgg tggctgaaga ttagggaacg gaccgtactc gggatgatcc cctatgtcat 1140
ccgattcaga tcgcccttta ccgagcagga agagcgcgcc atctccaacc gcgtcgtcac 1200
gcccggctat gtcatgtcca ccatcttgtc ggccaacgtg gtgggactgc tgtttgcccg 1260
gtctctgcac taccagttct atgcatatct ggcgtgggcg accccctatc tcctgtggac 1320
ggcctgcccc aatcttttgg tggtggcccc cctctgggcg gcgcaagaat gggcctggaa 1380
cgtcttcccc agcacgcctc ttagctcgag cgtcgtggtg agcgtgctgg ccgtgacggt 1440
ggccatggcg tttgcaggtt caaatccgca gccacgtgaa acatcgaagc cgaagcagca 1500
ctaa 1504
<210> 38
<211> 1263
<212> DNA
<213> 人工序列
<220>
<223> L139F Alg3里氏木霉( T. reesei)变体
<400> 38
atggcgtcac tcatcaaaac tgccgtggac attgccaacg gccgccatgc gctgtccaga 60
tatgtcatct ttgggctctg gcttgcggat gcggtgctgt gcgggctgat tatctggaaa 120
gtgccttata cggaaatcga ctgggtcgcc tacatggagc aagtcaccca gttcgtccac 180
ggagagcgag actaccccaa gatggagggc ggcacagggc ccctggtgta tcccgcggcc 240
catgtgtaca tctacacagg gctctactac ctgacgaaca agggcaccga catcctgctg 300
gcgcagcagc tctttgccgt gctctacatg gctactctgg cggtcgtcat gacatgctac 360
tccaaggcca aggtcccgcc gtacatcttc ccgcttctca tcctctccaa gagatttcac 420
agcgtcttcg tcctgagatg cttcaacgac tgcttcgccg ccttcttcct ctggctctgc 480
atcttcttct tccagaggcg agagtggacc atcggagctc tcgcatacag catcggcctg 540
ggcgtcaaaa tgtcgctgct actggttctc cccgccgtgg tcatcgtcct ctacctcggc 600
cgcggcttca agggcgccct gcggctgctc tggctcatgg tgcaggtcca gctcctcctc 660
gccataccct tcatcacgac aaattggcgc ggctacctcg gccgtgcatt cgagctctcg 720
aggcagttca agtttgaatg gacagtcaat tggcgcatgc tgggcgagga tctgttcctc 780
agccggggct tctctatcac gctactggca tttcacgcca tcttcctcct cgcctttatc 840
ctcggccggt ggctgaagat tagggaacgg accgtactcg ggatgatccc ctatgtcatc 900
cgattcagat cgccctttac cgagcaggaa gagcgcgcca tctccaaccg cgtcgtcacg 960
cccggctatg tcatgtccac catcttgtcg gccaacgtgg tgggactgct gtttgcccgg 1020
tctctgcact accagttcta tgcatatctg gcgtgggcga ccccctatct cctgtggacg 1080
gcctgcccca atcttttggt ggtggccccc ctctgggcgg cgcaagaatg ggcctggaac 1140
gtcttcccca gcacgcctct tagctcgagc gtcgtggtga gcgtgctggc cgtgacggtg 1200
gccatggcgt ttgcaggttc aaatccgcag ccacgtgaaa catcgaagcc gaagcagcac 1260
taa 1263
<210> 39
<211> 420
<212> PRT
<213> 人工序列
<220>
<223> L139F Alg3里氏木霉( T. reesei)变体
<400> 39
Met Ala Ser Leu Ile Lys Thr Ala Val Asp Ile Ala Asn Gly Arg His
1 5 10 15
Ala Leu Ser Arg Tyr Val Ile Phe Gly Leu Trp Leu Ala Asp Ala Val
20 25 30
Leu Cys Gly Leu Ile Ile Trp Lys Val Pro Tyr Thr Glu Ile Asp Trp
35 40 45
Val Ala Tyr Met Glu Gln Val Thr Gln Phe Val His Gly Glu Arg Asp
50 55 60
Tyr Pro Lys Met Glu Gly Gly Thr Gly Pro Leu Val Tyr Pro Ala Ala
65 70 75 80
His Val Tyr Ile Tyr Thr Gly Leu Tyr Tyr Leu Thr Asn Lys Gly Thr
85 90 95
Asp Ile Leu Leu Ala Gln Gln Leu Phe Ala Val Leu Tyr Met Ala Thr
100 105 110
Leu Ala Val Val Met Thr Cys Tyr Ser Lys Ala Lys Val Pro Pro Tyr
115 120 125
Ile Phe Pro Leu Leu Ile Leu Ser Lys Arg Phe His Ser Val Phe Val
130 135 140
Leu Arg Cys Phe Asn Asp Cys Phe Ala Ala Phe Phe Leu Trp Leu Cys
145 150 155 160
Ile Phe Phe Phe Gln Arg Arg Glu Trp Thr Ile Gly Ala Leu Ala Tyr
165 170 175
Ser Ile Gly Leu Gly Val Lys Met Ser Leu Leu Leu Val Leu Pro Ala
180 185 190
Val Val Ile Val Leu Tyr Leu Gly Arg Gly Phe Lys Gly Ala Leu Arg
195 200 205
Leu Leu Trp Leu Met Val Gln Val Gln Leu Leu Leu Ala Ile Pro Phe
210 215 220
Ile Thr Thr Asn Trp Arg Gly Tyr Leu Gly Arg Ala Phe Glu Leu Ser
225 230 235 240
Arg Gln Phe Lys Phe Glu Trp Thr Val Asn Trp Arg Met Leu Gly Glu
245 250 255
Asp Leu Phe Leu Ser Arg Gly Phe Ser Ile Thr Leu Leu Ala Phe His
260 265 270
Ala Ile Phe Leu Leu Ala Phe Ile Leu Gly Arg Trp Leu Lys Ile Arg
275 280 285
Glu Arg Thr Val Leu Gly Met Ile Pro Tyr Val Ile Arg Phe Arg Ser
290 295 300
Pro Phe Thr Glu Gln Glu Glu Arg Ala Ile Ser Asn Arg Val Val Thr
305 310 315 320
Pro Gly Tyr Val Met Ser Thr Ile Leu Ser Ala Asn Val Val Gly Leu
325 330 335
Leu Phe Ala Arg Ser Leu His Tyr Gln Phe Tyr Ala Tyr Leu Ala Trp
340 345 350
Ala Thr Pro Tyr Leu Leu Trp Thr Ala Cys Pro Asn Leu Leu Val Val
355 360 365
Ala Pro Leu Trp Ala Ala Gln Glu Trp Ala Trp Asn Val Phe Pro Ser
370 375 380
Thr Pro Leu Ser Ser Ser Val Val Val Ser Val Leu Ala Val Thr Val
385 390 395 400
Ala Met Ala Phe Ala Gly Ser Asn Pro Gln Pro Arg Glu Thr Ser Lys
405 410 415
Pro Lys Gln His
420
<210> 40
<211> 1263
<212> DNA
<213> 人工序列
<220>
<223> WT Alg3 cDNA里氏木霉( T. reesei)
<400> 40
atggcgtcac tcatcaaaac tgccgtggac attgccaacg gccgccatgc gctgtccaga 60
tatgtcatct ttgggctctg gcttgcggat gcggtgctgt gcgggctgat tatctggaaa 120
gtgccttata cggaaatcga ctgggtcgcc tacatggagc aagtcaccca gttcgtccac 180
ggagagcgag actaccccaa gatggagggc ggcacagggc ccctggtgta tcccgcggcc 240
catgtgtaca tctacacagg gctctactac ctgacgaaca agggcaccga catcctgctg 300
gcgcagcagc tctttgccgt gctctacatg gctactctgg cggtcgtcat gacatgctac 360
tccaaggcca aggtcccgcc gtacatcttc ccgcttctca tcctctccaa aagacttcac 420
agcgtcttcg tcctgagatg cttcaacgac tgcttcgccg ccttcttcct ctggctctgc 480
atcttcttct tccagaggcg agagtggacc atcggagctc tcgcatacag catcggcctg 540
ggcgtcaaaa tgtcgctgct actggttctc cccgccgtgg tcatcgtcct ctacctcggc 600
cgcggcttca agggcgccct gcggctgctc tggctcatgg tgcaggtcca gctcctcctc 660
gccataccct tcatcacgac aaattggcgc ggctacctcg gccgtgcatt cgagctctcg 720
aggcagttca agtttgaatg gacagtcaat tggcgcatgc tgggcgagga tctgttcctc 780
agccggggct tctctatcac gctactggca tttcacgcca tcttcctcct cgcctttatc 840
ctcggccggt ggctgaagat tagggaacgg accgtactcg ggatgatccc ctatgtcatc 900
cgattcagat cgccctttac cgagcaggaa gagcgcgcca tctccaaccg cgtcgtcacg 960
cccggctatg tcatgtccac catcttgtcg gccaacgtgg tgggactgct gtttgcccgg 1020
tctctgcact accagttcta tgcatatctg gcgtgggcga ccccctatct cctgtggacg 1080
gcctgcccca atcttttggt ggtggccccc ctctgggcgg cgcaagaatg ggcctggaac 1140
gtcttcccca gcacgcctct tagctcgagc gtcgtggtga gcgtgctggc cgtgacggtg 1200
gccatggcgt ttgcaggttc aaatccgcag ccacgtgaaa catcgaagcc gaagcagcac 1260
taa 1263

Claims (13)

1.一种真菌宿主细胞,在该真菌宿主细胞基因组中包含:
a)编码目的多肽的第一多核苷酸;以及
b)第二多核苷酸,该第二多核苷酸编码与SEQ ID NO:7具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置17和/或137的位置处包含改变的多肽,或者编码与SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:21的位置19和/或139的位置处包含改变的多肽。
2.根据权利要求1所述的真菌宿主细胞,其中所述多肽在对应于SEQ ID NO:7的位置17或137,或对应于SEQ ID NO:21的位置19或139的位置处的改变彼此独立地选自氨基酸取代、氨基酸插入、氨基酸缺失或提前多肽终止。
3.根据前述权利要求中任一项所述的真菌宿主细胞,其中所述多肽在对应于SEQ IDNO:7的位置17或137或对应于SEQ ID NO:21的位置19或139的位置处的改变是氨基酸取代,优选在对应于SEQ ID NO:7的位置137的位置处由苯丙氨酸对亮氨酸的取代L137F,或者在对应于SEQ ID NO:21的位置139的位置处由苯丙氨酸对亮氨酸取代L139F,或者在对应于SEQ ID NO:7的位置17的位置处由异亮氨酸对苏氨酸的氨基酸取代T17I,或者在对应于SEQID NO:21的位置19的位置处由异亮氨酸对丝氨酸的氨基酸取代S19I。
4.根据前述权利要求中任一项所述的真菌宿主细胞,所述真菌宿主细胞是酵母宿主细胞;优选地,该酵母宿主细胞选自由以下组成的组:假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属(驹形氏酵母属)、酵母属、裂殖酵母属、和耶氏酵母属细胞;更优选地,该酵母宿主细胞选自由以下组成的组:乳酸克鲁维酵母、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、和解脂耶氏酵母细胞,最优选毕赤酵母(巴斯德毕赤酵母)。
5.根据权利要求1-3中任一项所述的真菌宿主细胞,所述真菌宿主细胞是丝状真菌宿主细胞;优选地,该丝状真菌宿主细胞选自由以下组成的组:枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、线黑粉菌科、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属、和木霉属细胞;更优选地,该丝状真菌宿主细胞选自由以下组成的组:泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡孔菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、女王杜香金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢原毛平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长域毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、和绿色木霉细胞;甚至更优选地,该丝状宿主细胞选自由以下组成的组:米曲霉、镶片镰孢和里氏木霉细胞;最优选地,该丝状真菌宿主细胞是黑曲霉细胞。
6.根据前述权利要求中任一项所述的真菌宿主细胞,其中该目的多肽包含酶;优选地,该酶选自由以下组成的组:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;更优选地是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、核酸酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、和β-木糖苷酶。
7.根据权利要求6所述的真菌宿主细胞,其中该目的多肽是糖蛋白,例如α-葡糖苷酶;优选地,该目的多肽是1,4-α-葡糖苷酶;更优选地,该目的多肽是葡糖淀粉酶,例如包含SEQID NO:9、基本上由其组成或由其组成的葡糖淀粉酶。
8.根据权利要求6所述的真菌宿主细胞,其中该目的多肽是水解酶,例如糖苷水解酶,优选地该目的多肽是溶菌酶,例如包含SEQ ID NO:33、基本上由其组成或由其组成的溶菌酶。
9.一种生产目的多肽的方法,该方法包括:
i)提供根据权利要求1-8中任一项所述的真菌宿主细胞,
ii)在有助于该目的多肽表达的条件下培养所述宿主细胞;以及,任选地
iii)回收该目的多肽。
10.一种核酸构建体,该核酸构建体包含异源启动子,该异源启动子可操作地连接至编码如下多肽的多核苷酸,该多肽与SEQ ID NO:7具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:7的位置17和/或137的位置处包含改变,或者
编码如下多肽的多核苷酸,该多肽与SEQ ID NO:21具有至少50%,例如至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%但小于100%的序列同一性,并且在对应于SEQ ID NO:21的位置19和/或139的位置处包含改变。
11.根据权利要求10所述的核酸构建体,其中对应于SEQ ID NO:7的位置17和/或137的位置处的改变是取代;优选对应于SEQ ID NO:7的位置137的位置处的苯丙氨酸对亮氨酸的取代L137F,和/或对应于SEQ ID NO:7的位置17的位置处的异亮氨酸对苏氨酸的取代T17I。
12.根据权利要求10所述的核酸构建体,其中对应于SEQ ID NO:21的位置19和/或139的位置处的改变是取代;优选对应于SEQ ID NO:21的位置139的位置处的苯丙氨酸对亮氨酸的取代L139F,和/或对应于SEQ ID NO:21的位置19的位置处的异亮氨酸对丝氨酸的取代S19I。
13.一种表达载体,该表达载体包含根据权利要求10-12中任一项所述的核酸构建体。
CN202180069556.4A 2020-10-13 2021-10-08 用于提高蛋白质产量的糖基转移酶变体 Pending CN116529375A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA202001167 2020-10-13
DKPA202001167 2020-10-13
PCT/EP2021/077919 WO2022078910A1 (en) 2020-10-13 2021-10-08 Glycosyltransferase variants for improved protein production

Publications (1)

Publication Number Publication Date
CN116529375A true CN116529375A (zh) 2023-08-01

Family

ID=78232330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180069556.4A Pending CN116529375A (zh) 2020-10-13 2021-10-08 用于提高蛋白质产量的糖基转移酶变体

Country Status (4)

Country Link
US (1) US20230407273A1 (zh)
EP (1) EP4229189A1 (zh)
CN (1) CN116529375A (zh)
WO (1) WO2022078910A1 (zh)

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
DE69523052T2 (de) 1994-06-03 2002-06-20 Novo Nordisk Biotech Inc Gereinigte myceliophthora laccasen und nukleinsäuren dafür kodierend
CN1151762A (zh) 1994-06-30 1997-06-11 诺沃诺尔迪斯克生物技术有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
CN1197965C (zh) 1998-10-26 2005-04-20 诺维信公司 在丝状真菌细胞内构建和筛选目的dna文库
JP4620253B2 (ja) 1999-03-22 2011-01-26 ノボザイムス,インコーポレイティド 菌類細胞中で遺伝子を発現させるためのプロモーター
JP2012504390A (ja) 2008-09-30 2012-02-23 ノボザイムス,インコーポレイティド 糸状菌細胞におけるポジティブ及びネガティブ選択遺伝子の使用方法
EP2513290B1 (en) 2009-12-18 2015-11-11 Novozymes Inc. Methods for producing polypeptides in protease-deficient mutants of trichoderma
EP2527448A1 (en) 2011-05-23 2012-11-28 Novozymes A/S Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi
EP2791315A1 (en) 2011-12-14 2014-10-22 Iogen Energy Corporation Fungal cells and fermentation processes
CN110651048A (zh) 2017-04-11 2020-01-03 诺维信公司 葡糖淀粉酶变体和编码它们的多核苷酸
EP3894565A1 (en) 2018-12-12 2021-10-20 Novozymes A/S Methods for increasing the productivity of a filamentous fungal cell in the production of a polypeptide

Also Published As

Publication number Publication date
WO2022078910A1 (en) 2022-04-21
EP4229189A1 (en) 2023-08-23
US20230407273A1 (en) 2023-12-21

Similar Documents

Publication Publication Date Title
EP3491130B1 (en) An assembly system for a eukaryotic cell
CA2876287C (en) Agse-deficient strain
CN104395454B (zh) 改善的真菌选择
WO2018015444A1 (en) Crispr-cas9 genome editing with multiple guide rnas in filamentous fungi
CN105189730B (zh) 淀粉酶缺陷菌株
WO2017191210A1 (en) Genome editing by crispr-cas9 in filamentous fungal host cells
EP2527448A1 (en) Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi
EP3036324B1 (en) Regulated pepc expression
WO2020123845A1 (en) Methods for increasing the productivity of a filamentous fungal cell in the production of a polypeptide
JP2019503168A (ja) Clr2活性が低減した糸状菌においてタンパク質を生産する方法
US11046736B2 (en) Filamentous fungal host
EP3445776B1 (en) Rlma-inactivated filamentous fungal host cell
EP2652138B1 (en) Promoters for expressing genes in a fungal cell
JP2019501646A (ja) Clr1活性が低減した糸状菌においてタンパク質を生産する方法
WO2018167153A1 (en) Improved filamentous fungal host cell
US20230242960A1 (en) Mutants of a filamentous fungal cell having increased productivity in the production of a polypeptide
WO2022251056A1 (en) Transcriptional regulators and polynucleotides encoding the same
CN116529375A (zh) 用于提高蛋白质产量的糖基转移酶变体
EP4004211A1 (en) Filamentous fungal expression system
CN116583534A (zh) 前导肽和编码其的多核苷酸
CN113056552A (zh) 经修饰的丝状真菌宿主细胞
CN114555777A (zh) 经修饰的丝状真菌宿主细胞

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination