CN1836038B - 制备分泌型多肽的方法 - Google Patents

制备分泌型多肽的方法 Download PDF

Info

Publication number
CN1836038B
CN1836038B CN2004800190693A CN200480019069A CN1836038B CN 1836038 B CN1836038 B CN 1836038B CN 2004800190693 A CN2004800190693 A CN 2004800190693A CN 200480019069 A CN200480019069 A CN 200480019069A CN 1836038 B CN1836038 B CN 1836038B
Authority
CN
China
Prior art keywords
gly
nucleotide sequence
ala
val
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800190693A
Other languages
English (en)
Other versions
CN1836038A (zh
Inventor
萨钦德拉·梅尤兰
阿纳·菲丹特塞夫
霍华德·布罗迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Inc
Original Assignee
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Biotech Inc filed Critical Novozymes Biotech Inc
Publication of CN1836038A publication Critical patent/CN1836038A/zh
Application granted granted Critical
Publication of CN1836038B publication Critical patent/CN1836038B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及生产多肽的方法:包括:(a)在有利于生产所述多肽的培养基中培养真菌宿主细胞,其中所述真菌宿主细胞包含核酸构建体,该核酸构建体包含与编码所述多肽的第二核苷酸序列可操作相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列对第二核苷酸序列来说是外源的,第一核苷酸序列的3`端紧邻第二核苷酸序列起始密码子的上游。本发明还涉及分离的信号肽序列和包含所述信号肽序列的构建体、载体、以及真菌宿主细胞,其中所述信号肽序列可操作地连接至编码多肽的核苷酸序列。

Description

制备分泌型多肽的方法
关于在联邦资助的研究与开发下完成的发明的权利声明
本发明依据能源部提供的基本合同(Primecontract)DE-AC36-98GO10337,转包合同(subcontract)No.ZCO-30017-02,在政府支持下做出。政府在本发明中拥有一定权利。
发明背景
发明所属技术领域
本发明涉及生产分泌多肽的方法。本发明还涉及编码信号肽的分离的核苷酸序列,和包含与编码多肽的核苷酸序列可操作相连的信号肽序列的核酸构建体、载体、以及宿主细胞。
相关现有技术描述
在真菌宿主细胞,尤其是丝状真菌细胞如曲霉属(Aspergillus)或者酵母细胞如糖酵母属(Saccharomyces)中重组生产异源蛋白质,可以提供需求更为迫切的载体,以用于商业相关量的蛋白质生产。
异源蛋白质的重组生产一般通过构建表达盒来完成,在表达盒中,编码蛋白质的DNA置于适合于宿主细胞的启动子的表达控制之下,启动子与受调控的基因分离。表达盒向宿主细胞的导入,通常通过质粒介导的转化进行。然后通过培养转化的宿主细胞来生产异源蛋白质,宿主细胞的培养在包含于表达盒上的启动子正确发挥功能所必需的诱导条件下进行。
蛋白质重组生产的增强一般要求新的调控序列是可用的,其中调控序列适合于控制蛋白质在宿主细胞中的表达。
U.S专利6,015,703公开了包含启动子、木聚糖酶(xylanase)分泌信号和成熟β-葡糖苷酶编码区的遗传学构建体。当所公开的构建体在重组微生物中表达时,与未转化的微生物相比,其显著地增加所生产的β-葡糖苷酶的量。
WO 91/17243公开了来自Humicola insolens DSM 1800的葡聚糖内切酶V及其基因。
本发明的目的是提供经改进的用信号肽序列在真菌宿主细胞中生产多肽的方法。
发明概述
本发明涉及生产分泌多肽的方法,包含:
(a)在有利于生产所述多肽的培养基中培养真菌宿主细胞,其中所述真菌宿主细胞包含核酸构建体,该核酸构建体包含与编码所述多肽的第二核苷酸序列可操作相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列对第二核苷酸序列来说是外源的,第一核苷酸序列的3`端紧邻第二核苷酸序列起始密码子的上游,所述第一核苷酸序列选自下组:
(i)编码信号肽的核苷酸序列,所述信号肽具有与SEQ ID NO:37有至少70%同一性的氨基酸序列;
(ii)与SEQ ID NO:36具有至少70%同源性的核苷酸序列;和
(iii)在严格条件下与SEQ ID NO:36的核苷酸,或其互补链杂交的核苷酸序列,其中所述严格条件定义为:在低于所计算的Tm值5℃至10℃条件下,在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA,0.5%NP-40、1×Denhardt′s溶液、1mM焦磷酸钠、1mM一元磷酸钠(sodium monobasicphosphate)、0.1mM ATP、以及每毫升0.2mg的酵母RNA中进行预杂交,杂交和杂交后洗涤,于低于所计算的Tm值5℃至10℃条件下,在加有0.1%SDS的6×SCC中洗涤一次,15分钟,用6×SCC洗涤两次,每次15分钟;和
(b)从培养基中分离分泌的多肽。
本发明还涉及分离的信号肽序列和包含与编码多肽的核苷酸序列可操作相连的信号肽序列的构建体,载体,以及真菌宿主细胞。
附图简述
图1显示pAILo1的限制性图谱。
图2显示pMJ04的限制性图谱。
图3显示pCahj527的限制性图谱。
图4显示pMT2188的限制性图谱。
图5显示pCaHj568的限制性图谱。
图6显示pMJ05的限制性图谱。
图7显示pSMai130的限制性图谱。
图8显示米曲霉(Aspergillus oryzae)β-葡糖苷酶分泌信号序列的DNA序列(SEQ ID NO:34)和推导的氨基酸序列(SEQ ID NO:35)。
图9显示Humicola insolens葡聚糖内切酶V分泌信号序列的DNA序列(SEQ ID NO:36)和推导的氨基酸序列(SEQ ID NO:37)。
图10显示pSMai135的限制性图谱。
图11显示pSATe101的限制性图谱。
图12显示pSATe111的限制性图谱。
图13显示pALFd1的限制性图谱。
图14显示pAILo2的限制性图谱。
图15显示pEJG97的限制性图谱。
图16显示烟曲霉(Aspergillus fumigatus)β-葡糖苷酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO:46和47)。预期的信号肽用下划线表示,预期的内含子以斜体表示。
图17显示pCR4Blunt-TOPOAfcDNA5`的限制性图谱。
图18显示pCR4Blunt-TOPOAfcDNA3`的限制性图谱。
图19显示pCR4Blunt-TOPOAfcDNA的限制性图谱。
图20显示pALFd7的限制性图谱。
图21显示pALFd6的限制性图谱。
发明详述
本发明涉及生产多肽的方法,包括:(a)在有利于生产所述多肽的培养基中培养真菌宿主细胞,其中所述真菌宿主细胞包含核酸构建体,该核酸构建体包含与编码所述多肽的第二核苷酸序列可操作相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列对第二核苷酸序列来说是外源的,第一核苷酸序列的3`末端紧邻(immediately)第二核苷酸序列起始密码子的上游,所述第一核苷酸序列选自下组::(i)编码信号肽的核苷酸序列,所述信号肽具有与SEQ ID NO:37有至少70%同一性的氨基酸序列;(ii)与SEQ ID NO:36有至少70%同源性的核苷酸序列;和(iii)在严格条件下与SEQ ID NO:36的核苷酸,或其互补链杂交的核苷酸序列,其中所述严格条件定义为:在低于所计算的Tm值5℃至10℃条件下,在0.9M NaCl、0.09M Tris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1×Denhardt′s溶液、1mM焦磷酸钠、1mM一元磷酸钠、0.1mM ATP、以及每毫升0.2mg的酵母RNA中进行预杂交,杂交和杂交后洗涤,于低于所计算的Tm值5℃至10℃条件下,在加有0.1%SDS的6×SCC中洗涤一次,15分钟,用6×SCC洗涤两次,每次15分钟;和(b)从培养基中分离所述的分泌多肽。
在本发明的生产方法中,真菌宿主细胞培养于适合于用本领域已知方法生产多肽的营养培养基中。例如,可以在实验室或者工业发酵罐中,在适当的培养基中以及允许多肽表达和/或分离的条件下,通过摇瓶培养、小规模或大规模发酵(包括连续的、分批的、补料-分批的、或者固态发酵)来培养细胞。在包含碳源和氮源以及无机盐的适当营养培养基中以本领域已知的方法进行培养。合适的培养基可以从供应商处获得,或者可以用公布的组合物(例如,美国典型培养物保藏中心目录中的)制备。
可以用本领域已知的专门用于所述多肽的方法探测多肽。这些探测方法可以包括使用特异性抗体、酶产物形成、或者酶底物的消失。
本发明的生产方法中,在相同的生产条件下培养时,同包含与编码多肽的核苷酸序列可操作相连的天然信号肽序列的真菌细胞相比,真菌细胞生产的多肽至少多约25%、更优选多至少约50%、更优选多至少约75%、更优选多至少约100%、更加优选多至少约200%、最优选多至少约300%、甚至最优选多至少约400%。
可以用本领域已知的方法直接从培养基中回收所得的分泌多肽。例如,可以通过传统的方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发、或沉淀从营养培养基中回收多肽。
可以用本领域已知的多种方法包括但不限于层析(例如,离子交换层析、亲合层析、疏水层析、色谱聚焦层析、大小排阻层析)、电泳方法(例如,制备性等电聚焦电泳)、差别溶解度(differential solubility)(例如,硫酸铵沉淀)、SDS-PAGE、或者提取(参见,例如,Protein Purification,J.-C.Jansonand Lars Ryden,editors,VCH Publishers,New York,1989)来纯化多肽。
信号肽序列
术语“信号肽序列”此处定义为编码连接于多肽氨基端的氨基酸序列并引导所编码的多肽进入细胞分泌途径的肽编码区。
此处术语“可操作相连”定义为一种结构,在这种结构中,控制序列如信号肽序列被适当地置于与编码序列相关的位置,以使控制序列引导由编码序列编码的多肽的生产。
此处术语“编码序列”定义为被转录为mRNA的核苷酸序列,mRNA在适当的控制序列的控制下翻译为多肽。一般通过位于mRNA 5`端开放阅读框开始位置的起始密码子和位于mRNA开放阅读框3`端的终止密码子确定编码序列的界限。编码序列可以包括但不限于DNA、cDNA、半合成的、合成的、以及重组的核苷酸序列。
多肽编码序列的5`端可以包含在翻译阅读框中天然地与编码多肽的编码区片段相连的天然信号肽编码区,其中本发明的信号肽编码区可以简单地替换天然信号肽编码区,以增强多肽的分泌。可选地,多肽编码区的5`端可以缺少天然信号肽编码区。
在本发明的方法中,信号肽序列对于编码感兴趣的多肽的核苷酸序列来说是外源的,但信号肽序列或者核苷酸序列可以是真菌宿主细胞本身就有的。
在第一个方面中,编码信号肽的分离的核苷酸序列与SEQ ID NO:37具有至少约70%、优选至少约75%、更优选至少约80%、更优选至少约85%、更加优选至少约90%、最优选至少约95%、甚至最优选至少约97%的同一性,其具有引导多肽进入细胞分泌途径的能力(此后称“同源信号肽”)。在优选方案中,同源信号肽与SEQ ID NO:37有5个氨基酸、优选4个氨基酸、更优选3个氨基酸、再优选2个氨基酸、最优选1个氨基酸的差异。为达到本发明的目的,用具有同一性表的LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI),通过Clustal方法(Higgins,1989,CABIOS 5:151-153)测定两个氨基酸序列之间的同一性,多序列比对参数如下:空位罚分(gap penalty)为10、空位长度罚分为10。成对(pairwise)比对参数为Ktuple=1、空位罚分=3、窗口=5、对角线(diagonals)=5。
优选地,核苷酸序列编码包含SEQ ID NO:37氨基酸序列,或其等位变异体(allelic variants)的信号肽;或其具有能引导多肽进入细胞分泌途径的片段。在更优选的方案中,本发明的核苷酸序列编码包含SEQ ID NO:37的氨基酸序列的信号肽。在另一个优选方案中,核苷酸序列编码由SEQ IDNO:37的氨基酸序列,或其片段组成的信号肽,其中信号肽片段具有引导多肽进入细胞分泌途径的能力。在另一个优选方案中,本发明的核苷酸序列编码由SEQ ID NO:37的氨基酸序列组成的信号肽。
本发明还包含编码具有SEQ ID NO:37的氨基酸序列的信号肽的核苷酸序列,其由于遗传密码的简并性而与SEQ ID NO:36有所不同。本发明还涉及编码SEQ ID NO:37的片段的SEQ ID NO:36的子序列(subsequence),SEQ ID NO:37的片段具有引导多肽进入细胞分泌途径的能力。
SEQ ID NO:36的子序列是包含于SEQ ID NO:36但在5`和/或3`端删除了一个或多个核苷酸的核苷酸序列。优选地,子序列包含至少45个核苷酸,更优选至少51个核苷酸,最优选至少57个核苷酸。SEQ ID NO:37的片段是从该氨基酸序列的氨基和/或羧基端删除了一个或多个氨基酸的多肽。优选地,片段包含至少15个氨基酸残基,更优选至少17个氨基酸残基,最优选至少19个氨基酸残基。
等位变异体指占据相同染色体位点的两种或多种可选基因形式中的任何一种。等位变异通过突变自然产生,可以导致群体多态性。基因突变可以是沉默的(在所编码的信号肽中没有变化)或者可以编码具有改变的氨基酸序列的信号肽。信号肽的等位变异体是由基因的等位变异体编码的肽。
在优选方案中,第一核苷酸序列是包含于Humicola insolens DSM 1800的葡聚糖内切酶V基因的信号肽编码序列。
在第二个方面中,编码信号肽的分离的核酸序列与SEQ ID NO:36具有至少约70%、优选至少约75%、更优选至少约80%、更优选至少约85%、再优选至少约90%、最优选至少约95%、甚至最优选至少约97%的同源程度,其编码信号肽;或者是编码信号肽片段的SEQ ID NO:36的等位变异体或子序列,信号肽片段具有引导多肽进入细胞分泌途径的能力。为了本发明的目的,用具有同一性表的LASERGENETM MEGALIGNTM软件,通过Wilbur-lipman方法(Wilbur和lipman,1983,Proceedings of the NationalAcademy of Science USA 80:726-730)测定两个核酸序列之间的同源程度,多序列比对参数如下:空位罚分为10、空位长度罚分为10。成对比对参数为Ktuple=3、空位罚分=3、窗口=20。
在第三个方面中,分离的核苷酸序列编码信号肽,其中核苷酸序列在严格条件下与SEQ ID NO:36的核苷酸,或其互补链杂交(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,Molecular colning,A laboratory Manual,2dedition,Cold Spring Harbor,New York)。
SEQ ID NO:36的核苷酸序列或其子序列,以及SEQ ID NO:37的氨基酸序列或其片段可用于通过本领域熟知的方法设计核酸探针,以从不同的属或种鉴定并克隆编码信号肽的DNA。尤其是,可以按照标准Southern印迹法将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定并分离其中的相应基因。这样的探针可以比全序列短得多,但应为至少15、优选至少25、更优选至少35个核苷酸长度。DNA和RNA探针均可使用。典型地,探针被标记,用于探测相应的基因(例如,用32P,3H,35S,生物素或抗生物素蛋白)。本发明也包含这样的探针。
如此,可以从这样的其他生物制备的基因组DNA或cDNA文库筛选DNA,所述DNA与上述探针杂交,并编码信号肽。可以用琼脂糖或聚丙烯酰胺凝胶电泳或其他的分离技术分离来自这样的其他生物的基因组DNA或者其他的DNA。可以将来自所述文库的DNA或者分离的DNA转移并固定在硝化纤维或其他适当的载体材料上。为了鉴定与SEQ ID NO:36,或其子序列同源的克隆或DNA,在Southern印迹中使用所述载体材料。为了本发明的目的,杂交指核酸序列与相应于SEQ ID NO:36的核酸序列,其互补链,或其子序列的标记的核酸探针杂交。用X-射线胶片探测在这些条件下核酸探针所杂交的分子。
在优选方案中,核酸探针是编码SEQ ID NO:37的信号肽的核苷酸序列,或其子序列。在另一个优选方案中,核酸探针是SEQ ID NO:36。在另一个优选方案中,核酸探针是包含于Humicola insolens DSM 1800的葡聚糖内切酶V基因的信号肽编码序列。
对于约15个至约60个核苷酸长度的短探针,严格条件定义为,在低于依照Bolton和McCarthy的计算方法(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)所计算的Tm值5℃至10℃条件下,在0.9M NaCl、0.09 MTris-HCl pH 7.6、6mM EDTA、0.5%NP-40、1×Denhardt′s溶液、1mM焦磷酸钠、1mM一元磷酸钠、0.1mM ATP、以及每ml 0.2mg酵母RNA中,按照标准的Southern印迹法进行预杂交,杂交和杂交后洗涤。
对于约15个至约60个核苷酸长度的短探针,低于所计算的Tm值5℃至10℃条件下,在6×SSC加0.1%SDS中洗涤载体材料一次,15分钟,用6×SSC洗涤两次,每次15分钟。
在第四个方面中,编码信号肽变异体的分离的核酸序列具有包含一个或多个氨基酸取代、删除、和/或插入的SEQ ID NO:37的氨基酸序列。
变异信号肽的氨基酸序列可以由于一个或多个氨基酸残基的插入或删除和/或用不同的氨基酸残基取代一个或多个氨基酸残基,而与SEQ IDNO:37的氨基酸序列不同。优选地,氨基酸变化是具有较小的属性变化,也就是诸如没有明显影响到信号肽的活性的保守性氨基酸取代;或者是小的删除,典型地为一个至约5个氨基酸。
保守性取代的例子发生在碱性氨基酸(精氨酸、赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),极性氨基酸(谷氨酰胺和天冬酰胺),疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸),芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸),和小氨酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)组内。通常不改变特异活性的氨基酸取代在本领域是已知的,例如H.Neurath and R.L.Hill,1979,在The Proteins,Academic Press,New York中所描述的。最常发生的改变为Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu,和Asp/Gly以及相反的改变。
本发明也涉及以上公开的分离的信号肽序列。
编码多肽的核苷酸序列
由第二核苷酸序列所编码的多肽,对感兴趣的真菌宿主细胞来说可以是天然的或者是异源的。
术语“多肽”此处不是指特定长度的编码产物,因此,其包含肽、寡肽和蛋白质。术语“异源多肽”此处定义为对真菌细胞来说非天然的多肽,在天然多肽中进行修饰而改变了其序列的天然多肽,或者通过重组DNA技术对编码多肽的基因进行操作而在数量上改变了其表达的天然多肽。真菌细胞可以包含一个或多个拷贝的编码多肽的核苷酸序列。
优选地,多肽是激素或其变异体、酶、受体或其一部分、抗体或其一部分、或者报告蛋白。在优选方案中,多肽是氧化还原酶、转移酶、水解酶、裂解酶、异构酶、或者连接酶。在更优选方案中,多肽是氨肽酶、淀粉酶、糖化酶、羧肽酶、过氧化氢酶、纤维素酶、纤维二糖水解酶、几丁质酶、角质酶、环化糊精糖基转移酶、脱氧核糖核酸酶、葡聚糖内切酶(endoglucanase)、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡萄糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果胶裂解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺转移酶、木聚糖酶(xylanase)、β-木糖苷酶(xylosidase)。在最优选方案中,多肽是用于将纤维素转化为葡萄糖的葡聚糖内切酶、纤维二糖水解酶、和/或β-葡糖苷酶,其包括但不限于葡聚糖内切酶I、葡聚糖内切酶II、葡聚糖内切酶III、葡聚糖内切酶IV、葡聚糖内切酶V、纤维二糖水解酶I、纤维二糖水解酶II、和β-葡糖苷酶。葡聚糖内切酶和纤维二糖水解酶统称为“纤维素酶”。
编码感兴趣的多肽的核苷酸序列可以由任何原核的、真核的、或其他的来源获得。为了本发明的目的,这里与给定来源连用的术语“由......获得”意指所述的多肽由该来源产生或者由其中插入了来自该来源的基因的细胞产生。
用于分离或克隆编码感兴趣的多肽的核苷酸序列的技术是本领域已知的,包括从基因组DNA分离、从cDNA制备或者两者结合。例如通过利用众所周知的聚合酶链式反应(PCR)可以实现从这样的基因组DNA克隆所述核苷酸序列。参见,例如,Innis等,1990,PCR Protocols:A Guideto Methods and Application,Academic Press,New York。克隆方法可以涉及对包含编码多肽的核苷酸序列的所需核苷酸片段进行切除和分离,将片段插入载体分子,以及将重组载体掺入突变真菌细胞,核苷酸序列的多个拷贝或克隆将在所述的真菌细胞中复制。核苷酸序列可以是基因组的、cDNA、RNA、半合成、合成来源的,或者它们的任何组合。
在本发明的方法中,多肽还可以包括融合的或杂合的多肽,其中另一种多肽融合于所述多肽或其片段的N-端或C-端。通过将编码一种多肽的核苷酸序列(或其一部分)融合于编码另一种多肽的核苷酸序列(或其一部分)来生产融合多肽。生产融合多肽的技术是本领域已知的,其包括将编码多肽的编码序列连接以便它们处于阅读框中,并且融合多肽的表达处于相同启动子和终止子的控制之下。杂合多肽可以包括至少来自两种不同多肽的部分或全部多肽序列的组合,其中所述多肽中的一个或多个对于所述的突变真菌细胞可以是异源的。
核酸构建体
本发明还涉及包含编码多肽的核苷酸序列的核酸构建体,所述核苷酸序列与本发明的信号肽序列和一个或多个控制序列可操作相连,所述控制序列在与控制序列相容的条件下引导编码序列在适当宿主细胞中表达。表达理解为包括涉及多肽生产的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、和分泌。
此处“核酸构建体”定义为单链或双链的核酸分子,其从天然产生的基因分离,或者是经过修饰而包含了以自然界不存在的方式组合和邻接(juxtaposed)的核酸片段。当核酸构建体包含了编码序列和编码序列表达所需的所有控制序列时,术语核酸构建体与术语表达盒是同义的。
可以进一步以多种方法操作编码多肽的分离的核苷酸序列,以供多肽表达之用。依据表达载体的情况,在核苷酸序列插入载体之前对其进行操作是需要或必要的。利用重组DNA方法改造核苷酸序列的技术是本领域熟知的。
在本发明的方法中,核苷酸序列可以包含一个或多个天然的控制序列,或者一个或多个的天然控制序列可以由对核苷酸序列来说为外源的一个或多个控制序列所替换,以提高编码序列在宿主细胞中的表达。
此处定义的术语“控制序列”包括表达感兴趣的多肽所必须或有利的所有组件。每个控制序列对于编码多肽的核苷酸序列来说可以是天然的或外源的。这样的控制序列包括但不限于前导序列(leader)、聚腺苷酸化(polyadenylation)序列、前导肽(propeptide)序列、本发明的信号肽序列、和转录终止子。控制序列最少包括本发明的信号肽序列、以及转录和翻译终止信号。可以为控制序列提供接头(linker),目的是为了引入特定限制性位点以便于控制序列与编码多肽的核苷酸序列的编码区连接。
控制序列可以是合适的启动子序列,其由宿主细胞所识别而使核苷酸序列表达。启动子序列包含介导多肽表达的转录控制序列。启动子可以是在所选择的宿主细胞中显示转录活性的任何序列,包括突变的、截短的和杂交的启动子,其可由编码胞外或胞内多肽的、与宿主细胞同源或异源的基因获得。
引导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适的启动子的例子为:由米曲霉(Aspergillus oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶、毒性镰孢霉(Fusarium venenatum)淀粉葡糖苷酶、和尖孢镰孢霉(Fusarium oxysporum)胰蛋白酶蛋白酶(WO 96/00787)、里氏木霉(Trichoderma reesei)葡聚糖内切酶I、里氏木霉葡聚糖内切酶II、里氏木霉葡聚糖内切酶III、里氏木霉葡聚糖内切酶IV、里氏木霉葡聚糖内切酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶I、里氏木霉β-木糖苷酶基因获得的启动子、以及NA2-tpi启动子(黑曲霉中性α-淀粉酶与米曲霉丙糖磷酸异构酶基因启动子的杂合体)、及其突变、截短以及杂交的启动子。
在酵母宿主中,有用的启动子由啤酒酵母(Saccharomyces cerevisiae)烯醇酶(ENO-1)、啤酒酵母半乳糖激酶(GAL1)、啤酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、啤酒酵母丙糖磷酸异构酶(TPI)、啤酒酵母金属硫蛋白(CUP1)、以及啤酒酵母3-磷酸甘油酸激酶的基因获得。其他有用的醇母宿主细胞启动子描述于Romanos等,1992,Yeast 8:423-488。
控制序列可以是适当的转录终止子序列,其由宿主细胞所识别而终止转录。终止子序列与编码多肽的核苷酸序列3`末端可操作相连。任何在所选择的宿主细胞中发挥功能的终止子均可用于本发明。
用于丝状真菌宿主细胞的优选终止子由米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶、尖孢镰孢霉胰蛋白酶蛋白酶的基因获得。
用于酵母宿主细胞的优选终止子由啤酒酵母烯醇酶、啤酒酵母细胞色素C(CYC1)和啤酒酵母甘油醛-3-磷酸脱氢酶的基因获得。Romanos等,1992,如上,描述了其他用于酵母宿主细胞的有用终止子。
控制序列也可以是前导序列,其是mRNA的非翻译区,但对宿主细胞的翻译是重要的。前导序列与编码多肽的核苷酸序列5`端可操作相连。任何在所选择的宿主细胞中发挥功能的前导序列均可用于本发明。
用于丝状真菌宿主细胞的优选前导序列由米曲霉TAKA淀粉酶、构巢曲霉丙糖磷酸异构酶的基因获得。
用于酵母宿主细胞的合适的前导序列由啤酒酵母烯醇酶(ENO-1)、啤酒酵母3-磷酸甘油酸激酶、啤酒酵母α-因子、和啤酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得。
控制序列也可以是聚腺苷酸化序列,其与核苷酸序列的3`端可操作相连,当转录时,其作为添加多聚腺苷残基的信号由宿主细胞所识别,以转录mRNA。任何在所选择的宿主细胞中发挥功能的聚腺苷酸化序列均可用于本发明。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列由米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、和尖孢镰孢霉胰蛋白酶蛋白酶、黑曲霉α-葡糖苷酶的基因获得。
Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990描述了对酵母宿主细胞有用的聚腺苷酸化序列。
控制序列也可以是编码位于多肽氨基端的氨基酸序列的前导肽编码区。已知所得的多肽称为前体酶(proenzyme)或前体多肽(propolypeptide)(有些时候也叫酶原(zymogen))。前体多肽通常是没有活性的,可以由前体多肽通过前导肽催化或自体催化裂解转变为成熟的活性多肽。可以从啤酒酵母α-因子、米赫根毛霉天冬氨酸蛋白酶、嗜热黄霉(Myceliophthorathermophila)的漆酶(WO 95/33836)基因获得前导肽编码区。
当多肽的氨基端同时存在信号肽和前肽区时,前肽区位于紧邻多肽的氨基端,信号肽区紧邻位于前导肽区的氨基端。
也可能需要添加允许调控宿主细胞生长相关多肽表达的调控序列。调控系统的例子为,因应化学或物理刺激包括调控化合物的存在,而使基因表达开放或关闭的调控系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子和米曲霉葡萄糖淀粉酶启动子可以作为调控序列。调控序列的其他例子为允许基因扩增的调控序列。在真核系统中,其包括存在氨甲蝶呤时扩增的二氢叶酸还原酶基因,以及存在重金属时扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调控序列可操作相连。
表达载体
本发明还涉及包含本发明的信号肽序列、编码感兴趣的多肽的核苷酸序列、以及转录和翻译终止信号的重组表达载体。上述的各种核酸和控制序列可连接在一起而得到重组表达载体,其可以包括一个或多个方便的限制性位点,以允许在这些位点插入或取代启动子和/或编码多肽的核苷酸序列。可选地,可以通过将核苷酸序列或包含信号肽序列和/或编码多肽的核苷酸序列的核酸构建体插入用于表达的适当的表达载体,来表达核苷酸序列。在构建表达载体时,将编码序列置于载体中,以将编码序列与本发明的信号肽序列和一个或多个用于表达的适当的表达控制序列可操作相连。
重组表达载体可以是能够方便地用于重组DNA方法,并可引发核苷酸序列表达的任何载体(例如,质粒或病毒)。典型地,载体的选择依赖于载体与其将要被导入的宿主细胞的兼容性。该载体可以是线性的质粒或封闭的环状质粒。
本发明的载体优选包含一个或多个可选择的标记,其允许很容易地选择转化的细胞。可选择标记为基因,其产物提供生物杀虫或病毒抗性、重金属抗性、对营养缺陷型的原养型等。用于酵母宿主细胞的合适标记包括但不限于ADE2,HIS3,LEU2,LYS2,MET3,TRP1,和URA3。用于丝状真菌宿主细胞的可选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨基甲酰转移酶)、bar(草丁膦乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷酸-5’-磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、trpC(邻氨基苯甲酸合成酶),及其等同物。优选用于曲霉属菌细胞的为构巢曲霉或者米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyceshygroscopicus)的bar基因。
所述载体可以是自主复制载体,例如,以染色体外实体存在的载体,其复制不依赖于染色体的复制,例如,质粒、染色体外成分、微小染色体、或者人工染色体。载体可以包含任何确保自我复制的方式。可选地,载体可以是这样的一个载体,当其被导入宿主细胞中时,其整合到基因组中,并与其所整合的染色体一起复制。另外,也可以使用一起包含将要导入宿主细胞基因组的全部DNA的单一载体或质粒,或者两个或多个载体或质粒,或者可以使用转座子。
本发明的载体优选包含允许载体稳定地整合于宿主细胞基因组或者允许载体在细胞中不依赖于基因组而自主复制的成分。
为了整合于宿主细胞基因组中,载体可能依赖于编码多肽的核苷酸序列,或者依赖于其他任何用于通过同源和不同源重组而将载体稳定地整合于基因组中的载体成分。可选地,载体可以包含通过同源重组引导向宿主细胞基因组整合的额外的核苷酸序列。额外的核苷酸序列使载体能够整合于宿主细胞基因组中精确的染色体位置。为了增加在精确位点整合的可能性,整合成分应优选包含足够数量的核苷酸,例如100至1,500个碱基对,优选400至1,500个碱基对,最优选800至1,500个碱基对,这些碱基对与相应的目标序列高度同源,以增加同源重组的概率。整合成分可以是与宿主细胞基因组中的目标序列同源的任何序列。另外,整合成分可以是非编码或编码核苷酸序列。另一方面,载体可以通过非同源重组整合到宿主细胞基因组中。
为了自主复制,载体可以进一步包含能够使载体在所述的宿主细胞中自主复制的复制起源。复制起源可以介导自主复制的任何质粒复制子,其在细胞内发挥功能。术语“复制起源”或“质粒复制子”此处定义为能够使质粒或载体在体内复制的核苷酸序列。
用于酵母宿主细胞的复制起源的例子为2 micron复制起源、ARS1、ARS4、ARS1与CEN3的组合、和ARS4与CEN6的组合。复制起源可以是具有突变的复制起源,该突变使其在宿主细胞中发挥温度敏感性功能(参见,例如,Ehrlich,1978,Proceedings of the National Academy of Sciences USA75:1433)。
用于丝状真菌细胞的复制起源的例子为AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。AMA1基因的分离和包含该基因的质粒或载体的构建可以按照WO 00/24883中所述进行。
可以将超过一个拷贝的编码多肽的核苷酸序列插入宿主细胞以增加基因产物的生产。可以通过将至少一个额外的序列拷贝整合于宿主细胞基因组中来增加核苷酸序列的拷贝数,或者通过在包含扩增的可选择标记基因拷贝的细胞中,使核苷酸序列包含可扩增的可选择标记基因,并因此可以在存在适当的可选择试剂的情况下,通过培养细胞来选择额外拷贝的核苷酸序列,以用于增加核苷酸序列的拷贝数。
用于连接上述组分,以构建本发明的重组表达载体的方法是本领域技术人员所熟知的(参见,例如,Sambrook等,1989,同上)。
宿主细胞
本发明还涉及包含本发明的信号肽序列的重组宿主细胞,其可方便地用于多肽的重组生产,所述的信号肽序列与编码多肽的核苷酸序列可操作相连。将载体导入宿主细胞,以使载体作为染色体成分或作为前述的自我复制的染色体外载体存在,所述载体包含与编码多肽的核苷酸序列可操作相连的本发明的信号肽序列。术语“宿主细胞”包含与复制过程中发生突变的亲本细胞不同的亲本细胞的任何后裔。宿主细胞的选择将在很大程度上依赖于编码多肽的基因及其来源。
宿主细胞可以是可用于本发明的方法的任何真菌细胞。此处所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如Hawksworth等,在Ainsworth and Bisby’s Dictionary of The Fungi,8th edition,1995,CABInternational,University Press,Cambridge,UK中所定义的)、以及卵菌门(Oomycota)(如Hawksworth等,1995,如上,page 171所引用的)的真菌和所有的有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等,1995,同上)。
在优选方案中,真菌宿主细胞是酵母细胞。此处所用的“酵母”包括产子囊酵母(ascosporogenous)(内孢霉目(Endomycetales)),产担子孢子囊酵母(basidiosporogenous),和属于半知菌(芽孢纲(Blastomycetes))的酵母。由于酵母的分类将来可能会有所变化,为了本发明的目的,应该按照Biology andActivities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述定义酵母。
在更优选方案中,酵母宿主细胞是假丝酵母(Candida)、汉逊酵母(Hansenula)、克鲁维酵母(Kluyveromyces)、毕赤酵母(Pichia)、糖酵母属(Saccharomyces)、裂殖酵母(Schizosaccharomyces)、或Yarrowia细胞。
在最优选方案中,酵母宿主细胞是卡尔酵母(Saccharomyces carlsbergensis)、啤酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、克鲁维酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或者卵形酵母(Saccharomyces oviformis)细胞。在另一个更优选的方案中,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个更优选的方案中,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一优选方案中,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)(如Hawksworth等,1995,以上所定义的)所有丝状形式的亚类。丝状真菌以由甲壳素、纤维素、葡聚糖、脱乙酰壳多糖、甘露聚糖、以及其他复合多糖组成的菌丝体壁为特征。营养生长依靠菌丝的延长,碳分解是需氧的。相反,酵母例如啤酒酵母的营养生长通过单细胞叶状体的萌发进行,碳分解可以是发酵。
在更优选的方案中,丝状真菌细胞是但不限于支顶孢霉属(Acremonium)、曲霉属(Aspergillus)、镰孢霉属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、脉孢菌属(Neurospora)、青霉属(Penicillium)、梭孢壳属(Thielavia)、Tolypociadium或木霉属(Trichodema)物种的细胞。
在更加优选的方案中,丝状真菌细胞是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉、黑曲霉或米曲霉细胞。在另一更加优选的方案中,丝状真菌细胞是杆孢状镰孢(Fusarium bactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides、或者毒性镰孢霉(Fusarium venenatum)细胞。在另一更加优选的方案中,丝状真菌细胞是Humicola insolens、胎毛腐质霉(Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜热黄霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、Thielaviaterrestris、Trichoderma harzianum、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、里氏木霉或绿色木霉(Trichoderma viride)细胞。
在最优选方案中,毒性镰孢霉细胞是毒性镰孢霉A3/5,其最初被保藏为禾谷镰孢(Fusarium graminearum)ATCC 20334,最近Yoder和Christianson,1998,Fungal Genetics and Biology,23:62-80和O’Donnell等,1998,Fungal Genetics and Biology,23:57-67将其重新分类为毒性镰孢霉;以及毒性镰孢霉的分类学等同物,不管当前已知的种名是什么。在另一优选方案中,毒性镰孢霉细胞是如WO97/26330所公开的毒性镰孢霉A3/5或毒性镰孢霉ATCC 20334的形态突变体。
在另一个最优选的方案中,木霉属细胞是里氏木霉ATCC 56765、里氏木霉ATCC 13631、里氏木霉CBS 526.94、里氏木霉CBS 529.94、Trichoderma longibrachiatum CBS528.94、Trichoderma longibrachiatumATCC 2106、Trichoderma longibrachiatum CBS 592.94、绿色木霉NRRL3652、绿色木霉CBS 517.94、以及绿色木霉NIBH FERM/BP447。
可以通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身已知的方式来转化真菌细胞。EP 238 023中和Yelton等,1984,Proceedings of the National Academy of Sciences USA  81:1470-1474描述了用于转化曲霉属宿主细胞的适当方法。Penttila等,1987,Gene,61:155-164,和Gruber等,1990,Curr Genet.,18(1):71-6描述了用于转化里氏木霉宿主细胞的适当方法。Malardier等,1989,Gene,78:147-156和WO 96/00787描述了用于转化镰孢霉属物种的适当方法。可以用Becker和Guarente在Abelson,J.N.和Simon,M.I.,编著的Guide to Yeast Geneticsand Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163;和Hinnen等,1978,Proceedings of the National Academy of Sciences USA75:1920中描述的方法转化酵母。
生物质的降解
本发明还涉及降解或转化含纤维素和/或半纤维素的生物质(biomass)的方法,包含使用由本发明的方法获得的有效量的一种或多种多肽处理生物质,其中一种或多种多肽具有针对含纤维素和/或半纤维素的生物质的酶活性。例如,本发明的方法可以用于生产酶和生产用于从生物质中生产乙醇的宿主细胞。可通过生物质的酶学降解以及将释放的多糖转化为乙醇来生产乙醇。这类乙醇通常指生物乙醇或者生物燃料。其可以用作燃料添加剂或添加物,在混合物中的含量从低于1%直至100%(燃料替代品)。
本发明的方法也可用于制备酶和宿主细胞,所述酶和宿主细胞用于以单糖、二糖和多糖为化学或发酵原料的乙醇、塑料、或者其他产品或中间产物的生产中。酶可以是去除或未去除细胞的粗发酵汤形式,或者是半纯化或纯化的酶制品形式。可选地,本发明的宿主细胞可以用作生物质发酵过程中的一种或多种酶的来源。
生物质可以包括但不限于木材资源、城市固体废料、废纸和农作物残渣(参见,例如,Wiselogel等,1995,Handbook on Bioethanol(编者CharlesE.Wyman),pp.105-118,Tayler和Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andLignocellulosics,in Advances in Biochemical Engineering/Biotechnology,T.Scheper,责任编辑,Volume 65,pp.23-40,Springer-Verlag,New York)。
初级细胞壁中的主要生物质多糖是纤维素,第二丰富的是半纤维素,第三是果胶。细胞生长停止后产生的次级细胞壁也包含多糖,并通过木质素与半纤维素的共价交联而更加坚固。纤维素是脱水纤维二糖的同聚体,因此是线性β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,例如具有取代光谱的以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖(arabinoxylans)、和甘露聚糖。尽管纤维素一般为多态的,但发现其在植物组织中主要以平行葡聚糖链的不溶性晶体阵列存在。半纤维素通常以氢键结合于纤维素及其他的半纤维素,以帮助稳定细胞壁阵列。
三类主要的糖水解酶被用于打断纤维素生物质:
(1)“1,4-β-葡聚糖内切酶”或者1,4-β-D-葡聚糖-葡聚糖水解酶(EC3.2.1.4),其随机地作用于可溶性和不溶性1,4-β-葡聚糖底物。
(2)“1,4-β-葡聚糖外切酶”包括1,4-β-D-葡聚糖葡萄糖水解酶(EC3.2.1.74)和纤维二糖水解酶(1,4-β-D-葡聚糖纤维二糖水解酶,EC 3.2.1.91),1,4-β-D-葡聚糖葡萄糖水解酶从1,4-β-D-葡聚糖释放D-葡萄糖并缓慢水解D-纤维素,纤维二糖水解酶从1,4-β-葡聚糖释放D-纤维二糖。
(3)“β-D-葡糖苷酶”或者β-D-葡萄糖苷葡萄糖水解酶(EC 3.2.1.21),其从纤维二糖和可溶性纤维糊精,以及苷中释放一系列D-葡萄糖单元。
这三类酶一起协同作用,将来自生物质的天然纤维素有效地去结晶化并水解,产生还原糖。
本发明的方法还可用于生产其他酶,这些其他的酶与上述的酶一起进一步降解生物质底物的半纤维素成分。(参见,例如,Brigham等,195,Handbook on Bioethanol(Charles E.Wyman,编者),pp.119-141,Taylor和Francis,Washington D.C.;Lee,1997,Journal of Biotechnology 56:1-24)。这些酶包括但不限于,降解β-1,3-1,4-葡聚糖的酶,例如β-1,3(4)-葡聚糖内切酶,葡聚糖内切酶(β-葡聚糖酶,纤维素酶)和β-葡糖苷酶;降解木葡聚糖的酶,例如木葡聚糖酶,葡聚糖内切酶和纤维素酶;降解木聚糖的酶,例如木聚糖酶,木糖苷酶,α-阿拉伯呋喃糖苷酶(alpha-arabinofuranosidase),鼠李半乳糖醛酸酶(rhamnogalacturonase),鼠李半乳糖醛酸聚糖裂解酶(rhamnogalacturonan lyase)和鼠李半乳糖醛酸聚糖乙酰酯酶(rhamnogalacturonan acetyl esterase);降解木糖聚半乳糖醛酸(xylogalacturonan)的酶,例如xylogalacturonosidase,木糖聚半乳糖醛酸酶(xylogalacturonase)和鼠李半乳糖醛酸聚糖裂解酶,和降解木质素的酶,例如木质素过氧化物酶,锰依赖性过氧化物酶,杂合过氧化物酶,具有木质素过氧化物酶和锰依赖性过氧化物酶组合特性的酶和漆酶。其他的酶包括酯酶,脂肪酶,氧化酶,磷脂酶,肌醇六磷酸酶,蛋白酶和过氧化物酶。
下述实施例进一步描述本发明,但这些实施例不应解释为对本发明范围的限定。
实施例
菌株
由里氏木霉(Trichoderma reesei)Qm6A(ATCC 13631;Mandels和Reese,1957,J.Bacteriol 73:269-278)得到里氏木霉RutC30(ATCC 56765;Montenecourt和Eveleigh,1979,Adv,Chem.Ser.181:289-301)。里氏木霉RutC30和啤酒酵母YNG318(MATα,ura3-52,leu-2Δ2,pep4Δl,his4-539)(W097/07205)用作表达米曲霉β-葡糖苷酶的宿主细胞。烟曲霉PaHa34用作GH3A家族β-葡糖苷酶的来源。
培养基和缓冲液
YP培养基由每升10g的酵母提取物和20g的bactopeptone构成。
酵母选择培养基由每升6.7g的酵母氮碱(nitrogen base)、0.8g的完全补充混合物(complete supplement mixture,CSM,Qbiogene,Inc.,Carlsbad,CA;缺少尿嘧啶,含有40mg/ml的腺嘌呤)、5g的酪蛋白氨基酸(无氨基酸)、100ml的pH 5.0的0.5M琥珀酸盐、40ml的50%葡萄糖、1ml的100mM CuSO4、50mg的氨卡青霉素、和25mg的氯霉素组成。
酵母选择平板培养基由每升酵母选择培养基添加20g的细菌用琼脂和150mg的5-溴-4-氯-3-吲哚-β-D-吡喃型葡糖苷(glucopyranoside)(X-Glc,INALCO SPA,Milano,Italy),而缺少氨卡青霉素和氯霉素的培养基组成。
COVE选择平板由每升342.3g的蔗糖、20ml的COVE盐溶液、10mM的乙酰胺、15mM的CsCl2和25g的Noble琼脂组成。
COVE2由每升30g的蔗糖、20ml的COVE盐溶液、10mM的乙酰胺和25g的Noble琼脂组成。
COVE盐溶液由每升26g的KCl、26g的MgSO4·7H2O、76g的KH2PO4、和50ml的COVE痕量金属组成。
COVE痕量金属溶液由每升0.04g的NaB4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO2·H2O、和10g的ZnSO4·7H2O组成。
纤维素酶诱导培养基由每升20g的Arbocel B800-天然纤维素纤维(J.Rettenmaier USA LP,Schoolcraft,Michigan)、10g的玉米浆固体(corn steepsolids,Sigma Chemical Co.,St.Louis,MO)、1.45g的(NH4)2SO4、2.08g的KH2PO4、0.28g的CaCl2、0.42g的MgSO4·7H2O、0.42ml的里氏木霉痕量金属、和2滴pluronic acid组成;用10N的NaoH将pH调至6.0。
里氏木霉痕量金属溶液由每升216g的FeCl3·6H2O、58g的ZnSO4·7H2O、27g MnSO4·H2O、10g的CuSO4·5H2O、2.4g的H3BO3、和336g的柠檬酸组成。
PEG缓冲液由每升500g的PEG 4000(BDH,Poole,England)、10mM的CaCl2、和10mM的pH为7.5的Tris-HCl(过滤除菌)组成。
STC由每升1M山梨醇、10mM的CaCl2、和10mM的pH为7.5的Tris-HCl(过滤除菌)组成。
接种培养基由每升20g的葡萄糖、10g的玉米浆固体(Sigma ChemicalCo.,St.Louis,MO)、1.45g的(NH4)2SO4、2.08g的KH2PO4、0.28g的CaCl2、0.42g的MgSO4·7H2O、0.42ml的里氏木霉痕量金属溶液、和2滴pluronicacid组成;最终pH为5.0。
发酵培养基由每升4g的葡萄糖、10g的玉米浆固体、30g的ArbocelB800-天然纤维素纤维(J.Rettenmaier USA LP,Schoolcraft,Michigan)、3.8g的(NH4)2SO4、2.8g的KH2PO4、2.08g的CaCl2、1.63g的MgSO4·7H2O、0.75ml的里氏木霉痕量金属溶液、和1.8ml的pluronic acid组成。
补料培养基(Feed Medium)由每升600g的葡萄糖、20g的纤维素B800、35.5g的H3PO4和5ml的pluronic acid组成。
β-葡糖苷酶活性测试
以pH 5.0的50mM琥珀酸盐中200μl的0.5mg/ml p-硝基苯基-β-D-吡喃葡萄糖苷为底物,用在pH 5.0的50mM琥珀酸盐中1∶10稀释的25μl的一部分培养物上清,在常温下测定里氏木霉样品的β-葡糖苷酶活性。温育15分钟后,加入100μl的pH 8.0的1M Tris-HCl终止反应,用分光光度计在405nm处读取吸光值。
对于啤酒酵母样品,在96孔微量滴定板中,用pH 5.0的0.1M琥珀酸盐0.6倍稀释培养物上清样品。将25μl的稀释样品从每个孔中取出,加至新的96孔板,其包含200μl的1mg/ml p-硝基苯基-β-D-吡喃葡萄糖苷底物。在常温下温育滴定板1.5小时,加入pH 9的2M Tris-HCl终止反应。然后用分光光度计在405nm处读取滴定板的吸光值。
一个单位的β-葡糖苷酶活性相当于在常温下,pH 5.0时,每分钟每升生产1μmol的p-硝基苯。黑曲霉β-葡糖苷酶(Novozyme 188,NovozymesA/S,Bagsvaerd,Denmark)用作酶标准。
DNA测序
用染料终止化学法(Giesecke etal.,1992,Journal of Virol.Methods 38:47-60)在ABI3700(Applied Biosystems,Foster City,CA)上进行DNA测序。采用phred/phrap/consed(University of Washington,Seattle WA),用序列特异性引物装配序列。
实施例1:pAILo1表达载体的构建
通过改造pBANe6(U.S.专利6,461,837)构建pAILo1表达载体,pBANe6包含NA2-tpi启动子,黑曲霉淀粉葡糖苷酶终止子序列(AMG终止子),和构巢曲霉乙酰胺酶基因(amdS)。对pBANe6的改造,首先通过定点诱变,从amdS选择标记的2051、2722和3397碱基位置删除三个Nco I限制性位点。所有的变化都设计为“沉默”的,使amdS基因产物的实际蛋白序列保持不变。按照厂商的说明,使用基因编辑器定点诱变试剂盒(Promega,Madison,WI)同时去除这三个位点,操作中使用如下引物(带下划线的核苷酸代表变化的碱基):
AMDS3NcoMut(2050):5′-GTGCCCCATGATACGCCTCCGG-3′(SEQID NO:1)
AMDS2NcoMut(2721):5′-GAGTCGTATTTCCAAGGCTCCTGACC-3′(SEQ ID NO:2)
AMDSlNcoMut(3396):5′-GGAGGCCATGAAGTGGACCAACGG-3′(SEQ ID NO:3)
用QuickChange诱变试剂盒(Stratagene,La Jolla,CA)定点诱变包含所有三个期望的序列改变的质粒,在AMG终止子末端1643位置删除Nco I限制性位点。使用下述的引物(带下划线的核苷酸代表变化的碱基)进行诱变:
诱变黑曲霉淀粉葡糖苷酶(AMG)终止子序列的上游(upper)引物:
5′-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3′(SEQ ID NO:4)
诱变黑曲霉淀粉葡糖苷酶(AMG)终止子序列的下游(lower)引物:
5′-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3′(SEQ ID NO:5)
改造pBANe6的最后一个步骤是在多接头(polylinker)的起始处,用QuickChange诱变试剂盒和下述的引物(带下划线的核苷酸代表变化的碱基)添加新的Nco I限制性位点,以获得pAILo1(图1)。
诱变黑曲霉淀粉酶启动子(NA2-tpi)的上游引物:
5′-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3′(SEQ ID NO:6)
诱变黑曲霉淀粉酶启动子(NA2-tpi)的下游引物:
5′-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3′(SEQ ID NO:7)
将pAILo1的amdS基因与构巢曲霉pyrG基因交换。将质粒pBANe10(图14)用作pyrG基因的来源,pyrG基因作为选择标记。对pBANe10序列的分析显示,pyrG标记包含于Nsi I限制性片段,不包含NcoI或者Pac I限制性位点。由于amdS基因也被Nsi I限制性位点侧连接,因而转换选择标记的策略是Nsi I限制性片段的简单交换。用限制性酶Nsi I消化来自pAILo1和pBANE10的质粒DNA,用琼脂糖凝胶电泳纯化产物。将来自pBANe10的包含pyrG基因的Nsi I片段连接于pAILo1骨架,以替换包含amdS基因的原始Nsi I DNA片段。通过限制性消化分析重组克隆,以测定其具有正确的插入及方向。选择pyrG基因被逆时针方向转录的克隆。将新的质粒指定为pAILo2(图15)。
实施例2:pMJ04表达载体的构建
通过用下述引物993429(反义)和993428(有义)PCR扩增来自里氏木霉RutC30基因组DNA的里氏木霉纤维二糖外切水解酶1基因(exocellobiohydrolase,cdhl)终止子,来构建表达载体pMJ04。对反义引物进行了工程化处理,在其5`端具有Pac I位点,在有义引物的3`端具有SpeI位点。
引物993429(反义):
5′-AACGTTAATTAAGGAATCGTTTTGTGTTT-3′(SEQ ID NO:8)
引物993428(有义):
5′-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3′(SEQ ID NO:9)
用Dneasy Plant Maxi Kit(Qiagen,Chatsworth,CA)分离里氏木霉RutC30基因组DNA。
扩增反应体系(50μl)由1×ThermoPol反应缓冲液(New EnglandBiolabs,Beverly,MA)、0.3mM的dNTPs、100ng的里氏木霉RutC30基因组DNA、0.3μM的引物993429、0.3μM的引物993428和2个单位的Vent聚合酶(NewEngland Biolabs,Beverly,MA)组成。反应体系在Eppendorf Mastercycler5333(Eppendorf Scientific,Inc.,Westbury,NY)中温育,程序如下:94℃30秒、50℃30秒、72℃30秒,共5个循环,然后94℃30秒、65℃30秒、72℃120秒,共25个循环(最后延伸5分钟)。在1.0%琼脂糖凝胶上用40mMTris碱-20mM醋酸钠-1mM二钠EDTA(TAE)缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒(QIAGEN,Chatsworth,CA)从胶上切下229bp的产物条带并纯化。
用Pac I和Spe I消化所得的PCR片段,用快速连接试剂盒(Roche,Indianapolis,IN)将其连接至用相同的限制性酶消化的pAILo01中,以制备pMJ04(图2)。
实施例3:pCaHj568表达载体的构建
由pCaHj170(U.S.专利5,763,254)和pMT2188构建表达质粒pCaHj568。质粒pCaHj 170包含Humicola insolens葡聚糖内切酶V(EGV)编码区。按如下方法构建质粒pMT2188:用下述的引物142779和142780从pCaHj483(WO 98/00529)PCR扩增pUC19复制起点。引物142780在PCR片段中引入BbuI位点。
142779:5′-TTGAATTGAAAATAGATTGATTTAAAACTTC-3′(SEQ IDNO:10)
142780:5′-TTGCATGCGTAATCATGGTCATAGC-3′(SEQ ID NO:11)
按照厂商的说明将Expand PCR系统(Roche Molecular Biochemicals,Basel,Switserland)用于此处的和接下来的PCR扩增。用TAE缓冲液在1%琼脂糖凝胶上分离PCR产物,用Jetquick Gel Extraction Spin试剂盒(Genomed,Wielandstr,Germany)分离并纯化1160bp片段。
用下述引物140288和142778从啤酒酵母克隆载体pYES2(Invitrogen,Carlsbad,CA)扩增URA3基因。引物140288在所述PCR片段中引入Eco RI位点。
140288:5′-TTGAATTCATGGGTAATAACTGATAT-3′(SEQ ID NO:12)
142778:5′-AAATCAATCTATTTTCAATTCAATTCATCATT-3′(SEQ IDNO:13)
用TAE缓冲液在1%琼脂糖凝胶上分离PCR产物,用Jetquick GelExtraction Spin试剂盒分离并纯化1126bp片段。
采用重叠拼接方法(overlap method splicing)(Horton等,1989,Gene 77:61-68),通过混合并用上述的引物142780和140288扩增,将两个PCR片段融合。用TAE缓冲液在1%琼脂糖凝胶上分离PCR产物,用Jetquick GelExtraction Spin试剂盒分离并纯化2263bp的片段。
用Eco RI和Bbu I消化所得的片段,并将其连接至用相同的酶消化的pCaHj483的最大片段。连接所得的混合物用于转化pyrF阴性E.coli菌株DB6507(ATCC 35673),采用Mandel和Higa,1970,J.Mol.Biol.45:154的方法使所述菌株成为感受态菌株。在固体M9培养基上选择转化体,每升所述的培养基补充1g的酪蛋白氨基酸、500μg的硫胺、和10mg的卡那霉素。从一个转化体分离了质粒,并将其命名为pCaHj527(图3)。
用简单的PCR方法定点突变存在于pCaHj527上的NA2/tpi启动子。用突变引物141223将134-144位核苷酸由GTACTAAAACC转变为CCGTTAAATTT:
引物141223:
5′-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3′(SEQ ID NO:14)
用突变引物141222将423-436位核苷酸由ATGCAATTTAAACT转变为CGGCAATTTAACGG:
引物141222:
5′-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3′(SEQ ID NO:15)
所得质粒命名为pMT2188(图4)。
将Humicola insolens葡聚糖内切酶V编码区作为Bam HI-Sal I片段从pCaHj170转移至用Bam HI和Xho I消化的pMT2188中,得到pCaHj568(图5)。
实施例4:pMJ05表达载体的构建
通过从pCaHj568PCR扩增Humicola insolens葡聚糖内切酶V编码区来构建pMJ05表达载体,扩增使用下述的引物HiEGV-F和HiEGV-R。
HiEGV-F(有义):5′-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3′(SEQ ID NO:16)
HiEGV-R(反义):
5′-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3′(SEQ ID NO:17)
扩增反应体系(50μl)由1×ThermoPol反应缓冲液、0.3mM的dNTPs、10ng/μl的pCaHj568质粒、0.3μM的HiEGV-F引物、0.3μM的HiEGV-R引物和2个单位的Vent聚合酶组成。反应体系在Eppendorf Mastercycler5333中温育,程序如下:94℃30秒、50℃30秒、72℃60秒,共5个循环,然后94℃30秒、65℃30秒、72℃120秒,共25个循环(最后延伸5分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下937bp的产物条带并纯化。
以该937bp纯化片段为模板DNA进行随后的扩增,扩增使用下述引物:
HiEGV-R(反义):
5-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3′(SEQ ID NO:18)
HiEGV-F-重叠(有义):
5′-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3′(SEQ ID NO:19)
斜体显示的引物序列与里氏木霉cbhl启动子的17bp同源,带下划线的引物序列与Humicola insolens葡聚糖内切酶V编码区的29bp同源。启动子和编码序列36bp的重叠允许包含里氏木霉cbhl启动子的994bp片段与包含Humicola insolens葡聚糖内切酶V开放阅读框的918bp片段精确融合。
扩增反应体系(50μl)由1×ThermoPol反应缓冲液、0.3mM的dNTPs、1μl的937bp纯化PCR片段、0.3μM的HiEGV-F重叠引物、0.3μM的HiEGV-R引物和2个单位的Vent聚合酶组成。反应体系在EppendorfMastercycler 5333中温育,程序如下:94℃30秒、50℃30秒、72℃60秒,共5个循环,然后94℃30秒、65℃30秒、72℃120秒,共25个循环(最后延伸5分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下945bp的产物条带并纯化。
实施了单独的PCR以扩增里氏木霉cbhl启动子序列,该序列从基因的ATG起始密码子上游994bp处延伸,所述基因来自里氏木霉RutC30基因组DNA,扩增使用下述引物(工程化有义引物,使其5`端具备Sal I限制性位点):
TrCBH1pro-F(有义):
5′-AAACGTCGACCGAATGTAGGATTGTTATC-3′(SEQ ID NO:20)
TrCBH1pro-R(反义):5′-GATGCGCAGTCCGCGGT-3′(SEQ ID NO:21)
扩增反应体系(50μl)由1×ThermoPol反应缓冲液、0.3mM的dNTPs、100ng的里氏木霉RutC30基因组DNA、0.3μM的TrCBH1pro-F引物、0.3μM的TrCBH1pro-R引物和2个单位的Vent聚合酶组成。反应体系在EppendorfMastercycler 5333中温育,程序如下:94℃30秒、55℃30秒、72℃120秒,共30个循环(最后延伸5分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下998bp的产物条带并纯化。
998bp纯化PCR片段用作随后扩增中的模板DNA,扩增使用下述引物:
TrCBH1pro-F:5′-AAACGTCGACCGAATGTAGGATTGTTATC-3′(SEQID NO:22)
TrCBH1pro-R-重叠:
5′-GGAGGGGGGAGGAACGCATGATGCGC4GTCCGCGGT-3′(SEQ ID NO:23)
斜体显示的引物序列与里氏木霉cbhl启动子的17bp同源,带下划线的引物序列与Humicola insolens葡聚糖内切酶V编码区的29bp同源。启动子和编码序列36bp的重叠允许包含里氏木霉cbhl启动子的918bp片段与包含Humicola insolens葡聚糖内切酶V开放阅读框的918bp片段精确融合。
扩增反应体系(50μl)由1×ThermoPol反应缓冲液、0.3mM的dNTPs、1μl的998bp纯化PCR片段、0.3μM的TrCBH1pro-F引物、0.3μM的TrCBH1pro-R重叠引物和2个单位的Vent聚合酶组成。反应体系在Eppendorf Mastercycler 5333中温育,程序如下:94℃30秒、50℃30秒、72℃60秒,共5个循环,然后94℃30秒、65℃30秒、72℃120秒,共25个循环(最后延伸5分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下1017bp的产物条带并纯化。
1017bp里氏木霉cbhl启动子PCR片段和945bp Humicola insolens葡聚糖内切酶V PCR片段用作随后扩增中的模板DNA,扩增使用下述引物,以通过重叠PCR将994bp里氏木霉cbhl启动子与918bp的Humicolainsolens葡聚糖内切酶V编码区融合。
TrCBH1pro-F:5′-AAACGTCGACCGAATGTAGGATTGTTATC-3′(SEQID NO:24)
HiEGV-R :5′-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3′(SEQ ID NO:25)
扩增反应体系(50μl)由1×ThermoPol反应缓冲液、0.3mM的dNTPs、0.3μM的TrCBH1pro-F引物、0.3μM的HiEGV-R引物和2个单位的Vent聚合酶组成。反应体系在Eppendorf Mastercycler 5333中温育,程序如下:94℃30秒、50℃30秒、72℃60秒,共5个循环,然后94℃30秒、65℃30秒、72℃120秒,共25个循环(最后延伸5分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下1926bp的产物条带并纯化。
依照厂商的方案,用Zero Blunt TOPO PCR克隆试剂盒(Invitrogen,Carlsbad,CA)将所得的1926bp片段克隆至pCR-Blunt-II-TOPO载体中。用Not I和Sal I消化所得的载体,纯化1926bp片段并将其连接至pMJ04表达载体中,用同样两个限制性酶消化该载体,得到pMJ05(图6)。
实施例5:pSMai130表达载体的构建
以pJaL660(WO 2002/095014)为模板,用下述的引物993467(有义)和993456(反义)扩增2586bp DNA片段,该片段跨越米曲霉β-葡糖苷酶编码序列(SEQ ID NO:42为cDNA序列,SEQ ID NO:43为推导的氨基酸序列;E.coli DSM 14240)从ATG起始密码子至TAA终止密码子的部分。将Spe I位点工程化至反义引物的5`端,以便于连接。斜体显示的引物序列与里氏木霉cbhl启动子的24bp同源,带下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。
引物
993467:5′-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATC GAGG-3′(SEQ ID NO:26)
引物993456:5′-ACTAGTTTACTGGGCCTTAGGCAGCG-3′(SEQ IDNO:27)
扩增反应体系(50μl)由Pfx扩增缓冲液(Invitrogen,Carlsbad,CA)、0.25mM的dNTPs、10ng的pJaL660质粒、6.4μM的引物993467、3.2μM的引物993456、1mM的MgCl2、和2.5个单位的Pfx DNA聚合酶组成(Invitrogen,Carlsbad,California)。反应体系在Eppendorf Mastercycler 5333中温育,程序如下:94℃30秒、55℃60秒、72℃180秒,共30个循环(最后延伸15分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下2586bp的产物条带并纯化。
实施了单独的PCR以扩增里氏木霉cbhl启动子序列,该序列从基因的ATG起始密码子上游1000bp处延伸,扩增使用下述的引物993453(有义)和引物993463(反义),以产生1000bp PCR片段。斜体显示的引物序列与里氏木霉cbhl启动子的24bp同源,带下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。启动子和编码序列46bp的重叠允许包含里氏木霉cbhl启动子的1000bp片段与包含米曲霉β-葡糖苷酶开放阅读框的2586bp片段精确融合。
引物993453:5′-GTCGACTCGAAGCCCGAATGTAGGAT-3′(SEQ IDNO:28)
引物
993463:5′-CCTCGATCCAACCAAGCTTCATGATGCGCAGTCCGCGGTTGACTA-3′(SEQ ID NO:29)
扩增反应体系(50μl)由Pfx扩增缓冲液、0.25mM的dNTPs、10ng的里氏木霉RutC30基因组DNA、6.4μM的引物993453、3.2μM的引物993463、1mM的MgCl2、和2.5单位的Pfx DNA聚合酶组成。反应体系在Eppendorf Mastercycler 5333中温育,程序如下:94℃60秒、55℃60秒、72℃180秒,共30个循环(最后延伸15分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下1000bp的产物条带并纯化。
使用上述的引物993453(有义)和引物993456(反义),以所述的纯化片段为随后扩增中的模板DNA,通过重叠PCR方法,将包含里氏木霉cbhl启动子的所述1000bp片段与包含米曲霉β-葡糖苷酶开放阅读框的2586bp片段精确融合。
扩增反应体系(50μl)由Pfx扩增缓冲液、0.25mM的dNTPs、6.4μM的引物99353、3.2μM的引物993456、1mM的MgCl2、和2.5个单位的Pfx DNA聚合酶组成。反应体系在Eppendorf Mastercycler 5333中温育,程序如下:94℃60秒、60℃60秒、72℃240秒,共30个循环(最后延伸15分钟)。
用Sal I和Spe I消化所得的3586bp片段并连接至pMJ04中,用相同的两个限制性酶消化,以得到pSMai130(图7)。
实施例6:pSMai135的构建
以pJaL660为模板,从中PCR扩增自Lys-20至TAA终止密码子的米曲霉β-葡糖苷酶编码区(去除天然信号序列,见图8),扩增使用下述的引物993728(有义)和引物993727(反义)。斜体显示的序列与Humicola insolens葡聚糖内切酶V信号序列的20bp同源,带下划线的序列与米曲霉β-葡糖苷酶编码区的22bp同源。将Spe I位点工程化至反义引物的5`端中。
引物
993728:5′-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3′(SEQ ID NO:30)
引物993727:5′-GACTAGTCTTACTGGGCCTTAGGCAGCG-3′(SEQ IDNO:31)
扩增反应体系(5μl)由Pfx扩增缓冲液、0.25mM的dNTPs、10ng/μl的pJal660、6.4μM的引物993728、3.2μM的引物993727、1mM的MgCl2、和2.5个单位的Pfx DNA聚合酶组成。反应体系在Eppendorf Mastercycler5333中温育,程序如下:94℃60秒、55℃60秒、72℃180秒,共30个循环(最后延伸15分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下2523bp的产物条带并纯化。
使用以下所示的引物993724(有义)和引物993729(反义)进行单独的PCR扩增,扩增1000bp的里氏木霉cbhl启动子和63bp的推定的Humicolainsolens葡聚糖内切酶V信号序列(ATG起始密码子至Ala-21,图9,SEQ IDNO:36),。斜体显示的引物序列与Humicola insolens葡聚糖内切酶V信号序列的20bp同源,带下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。质粒pMJ05用作模板以制备包含里氏木霉cbhl启动子/Humicolainsolens葡聚糖内切酶V信号序列片段的1063bp片段,所述质粒pMJ05包含Humicola insolens葡聚糖内切酶V编码区,该编码区处于cbhl启动子的控制之下。里氏木霉cbhl启动子/Humicola insolens葡聚糖内切酶V信号序列和米曲霉编码序列共有的42bp重叠在所述启动子与2523bp米曲霉β-葡糖苷酶的ATG起始密码子之间提供了完美的连接。
引物993724:5-ACGCGTCGACCGAATGTAGGATTGTTATCC-3′(SEQID NO:32)
引物993729:
5′-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3′(SEQ ID NO:33)
扩增反应体系(50μl)由Pfx扩增缓冲液、0.25mM的dNTPs、10ng/μl的pMJ05、6.4μM的引物993728、3.2μM的引物993727、1mM的MgCl2、和2.5个单位的Pfx DNA聚合酶组成。反应体系在Eppendorf Mastercycler5333中温育,程序如下:94℃60秒、60℃60秒、72℃240秒,共30个循环(最后延伸15分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下1063bp的产物条带并纯化。
使用上述的引物993724(有义)和引物993727(反义),以所述的纯化重叠片段为扩增中的模板DNA,通过重叠PCR方法,将包含里氏木霉cbhl启动子/Humicola insolens葡聚糖内切酶V信号序列的1063bp片段与包含米曲霉β-葡糖苷酶开放阅读框的2586bp片段精确融合。
扩增反应体系(50μl)由Pfx扩增缓冲液、0.25mM的dNTPs、6.4μM的引物993724、3.2μM的引物993727、1mM的MgCl2、和2.5个单位的PfxDNA聚合酶组成。反应体系在Eppendorf Mastercycler 5333中温育,程序如下:94℃60秒、60℃60秒、72℃240秒,共30个循环(最后延伸15分钟)。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下3591bp的产物条带并纯化。
用Sal I和Spe I消化所得的3591bp片段并连接至pMJ04中,用相同的两个限制性酶消化,以得到pSMai135(图10)。
实施例7:比较天然和异源Humicola insolens葡聚糖内切酶V分泌信号的里氏木霉中米曲霉β-葡糖苷酶的表达
通过PEG-介导的转化(Penttila等,1987,同上),将质粒pSMai130或者pSMai135导入里氏木霉RutC30,其中质粒pSMai130在cbhl启动子和天然分泌信号(图8,SEQ ID NO:34(DNA序列)和35(推导的氨基酸序列))的引导下表达米曲霉β-葡糖苷酶,质粒pSMai135编码连接至Humicolainsolens葡聚糖内切酶V分泌信号(图9,SEQ ID NO:36(DNA序列)和37(推导的氨基酸序列))的成熟米曲霉β-葡糖苷酶。两个质粒均包含构巢曲霉amdS基因,使转化体能够在乙酰胺作为唯一氮源时生长。
27℃,90rpm下,将里氏木霉RutC30于添加了2%(w/v)葡萄糖和10mM尿苷的25ml YP培养基中培养17小时。用Millipore′s真空驱动的可回收(Disposable)过滤系统(Millipore,Bedford,MA)过滤收集菌丝体,用去离子水洗涤两次,用1.2M山梨醇洗涤两次。将洗涤过的菌丝体悬浮于20ml的1.2M山梨醇中,34℃下以90rpm轻摇温育15-25分钟,得到原生质体,每ml山梨醇含有15mg的Glucanex(Novozymes A/S,Bagsvaerd,Denmark)和0.36单位的几丁质酶(Sigma Chemical Co.,St.Louis,MO)。400×g离心7分钟收集原生质体,用冰冷的1.2M山梨醇洗涤两次。原生质体用血细胞计数器计数,重悬于STC中至终浓度为每ml 1×108原生质体。剩余的原生质体-80℃下存储于Cryo 1℃冷冻容器(Nalgene,Rochester,NY)。
将约7μg Pme I消化的表达质粒(pSMai130或pSMai135)加至100μl原生质体溶液,轻轻混合,接着加入260μl PEG缓冲液,混合,室温下温育30分钟。然后加入STC(3ml),混合,用所述选择溶液在COVE平板上划平板,以构巢曲霉amdS选择。平板于28℃温育5-7天。转化体亚培养于COVE2平板上,在28℃下生长。
用pSMai130获得了110个amdS阳性转化体,用pSMai135获得了65个转化体。28℃下,将20个由pSMai130(天然分泌信号)获得的指定为SMA130的转化体和67个由Smai135(异源分泌信号)获得的指定为SMA135的转化体在含乙酰胺的新鲜平板上亚培养7天,允许其形成孢子。
pH 6.0下,通过接种所述转化体的孢子,将所述的20个SMA130和67个SMA135里氏木霉转化体培养于125ml带隔板(baffled)摇瓶中含有的25ml纤维素酶诱导培养基中,28℃200rpm下培养7天。里氏木霉RutC30用作对照。在第7天时取出培养肉汤样品。1ml的每种培养肉汤在微离心机中15,700×g离心5分钟,上清液转至新的试管。4℃存储样品直至酶测试。如上述,用p-硝基苯基-β-D-吡喃葡萄糖苷作为底物,测试上清液的β-葡糖苷酶活性。
所有20个SMA130转化体显示与宿主菌株里氏木霉RutC30的活性相当的β-葡糖苷酶活性。与此相比,几个SMA135转化体显示了比里氏木霉RutC30的活性大几倍的β-葡糖苷酶活性。转化体SMA135-04产生了最高的β-葡糖苷酶活性,比作为对照的里氏木霉RutC30产生的活性大7倍。
用具有标准系统(BioRad,Hercules,CA)的标准Tris-HCl(5%溶解)凝胶(BioRad,Hercules,CA)进行SDS-PAGE。将5μl的第7天上清液(参见上述)悬浮于2×浓缩的Laemmli样品缓冲液(BioRad,Hercules,CA)中,在5%β-疏基乙醇存在下煮沸3分钟。将上清液样品上样至聚丙烯酰胺凝胶,以1×Tris/Glycine/SDS为流动缓冲液(BioRad,Hercules,CA)进行电泳。所得的凝胶用BioRad′s Bio-Safe Coomassie Stain染色。
对于里氏木霉SMA130转化体培养肉汤上清液,用SDS-PAGE看不到β-葡糖苷酶。与此对照,38个里氏木霉SMA135转化体中的26个产生了约110kDa的蛋白,其在作为对照的里氏木霉RutC30中看不到。转化体里氏木霉SMA135-04产生了最高水平的β-葡糖苷酶。
实施例8:米曲霉SMA135-04的发酵
对米曲霉SMA135-04进行发酵以测定其β-葡糖苷酶活性的产生水平。里氏木霉RutC30(宿主菌株)用作对照。将里氏木霉SMA135-04的孢子接种至500ml的摇瓶中,摇瓶中含有100ml的接种培养基。28℃下,将摇瓶放置于轨道摇动器中约48小时,48小时时,将50ml的培养物接种至2升发酵容器中的1.8升发酵培养基(见上面)中。发酵于pH 5.0,28℃下进行,发酵时,在1.0VVM气流和1100的搅拌度下的最低溶解氧为25%。在18小时时,以3.6g/小时的补料速率加入补料培养基33小时,然后以7.2g/小时的补料速率加入。发酵进行165小时,在165小时时离心最终的发酵肉汤,于-20℃存储上清液直至用前述的方法测试β-葡糖苷酶活性为止。
经测定,里氏木霉SMA135-04发酵样品的β-葡糖苷酶活性比里氏木霉RutC30的活性高约8倍。
实施例9:pSATe111和pALFd1啤酒酵母表达载体的构建
以pJaL660(WO 2002/095014)为模板,从中PCR扩增包含自米曲霉β-葡糖苷酶编码序列(SEQ ID NO:42为cDNA序列,SEQ ID NO:43为推定的氨基酸序列)ATG起始密码子至TAA终止密码子区域的2,605bp DNA片段,扩增使用下述的引物992127(有义)和992328(反义)。
992127:5-GCAGATCTACCATGAAGCTTGGTTGGATCGAG-3′(SEQID NO:38)
992328:5-GCCTCAGATTACTGGGCCTTAGGCAGCGAG-3(SEQ IDNO:39)
引物992127具有上游Bgl II位点,引物992328具有下游Xho I位点。
扩增反应体系(50μl)由含有MgCl2的1×PCR缓冲液(Roche AppliedScience,Manheim,Germany)、0.25mM的dNTPs、50μM的引物992127、50μM的引物992328、80ng的pJaL660和2.5个单位的Pwo DNA聚合酶(Roche Applied Science,Manheim,Germany)组成。反应体系在EppendorfMastercycler 5333中温育,程序如下:94℃5分钟,一个循环,然后94℃60秒、55℃60秒、72℃120秒,共25个循环(最后延伸10分钟)。然后按照厂商的说明,用ZeroBluntTM TOPO PCR克隆试剂盒(Invitrogen,Carlsbad,CA)将PCR产物亚克隆至pCR-Blunt II-TOPO载体,得到质粒pSATe101(图11)。用Bgl II和Xho I消化质粒pSATe101以释放β-葡糖苷酶基因。在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从凝胶上切下2.6kb的产物条带并纯化。
消化2.6kb PCR产物并克隆至铜可诱导的2μm酵母表达载体pCu426(Labbe和Thiele,1999,Methods Enzymol.306:145-53)的Bam HI和Xho I位点中,得到pSATe111(图12)。
构建了质粒pALFd1,以测定在啤酒酵母中用Humicola insolens葡聚糖内切酶V信号肽交换米曲霉β-葡糖苷酶分泌信号是否也可以增强米曲霉β-葡糖苷酶的生产和分泌。
用Xho I和Spe I消化质粒pSATe111,以释放2.6kb(米曲霉β-葡糖苷酶)和6kb(载体的剩余部分)片段。分离6kb片段并连接至2.6kb PCR片段,包含米曲霉β-葡糖苷酶编码区(去除分泌信号序列)和Humicola insolens葡聚糖内切酶V信号序列,其用下述的引物993950和993951从pSMai135扩增。所述引物在其末端包含Xho I和Spe I限制性位点,用于随后亚克隆至pSATe111的Xho I和Spe I限制性位点中。
引物
993950:5′-AATCCGACTAGTGGATCTACCATGCGTTCCTCCCCCCTCC-3′(SEQ ID NO:40)
引物993951:5′-GCGGGCCTCGAGTTACTGGGCCTTAGGCAGCG-3′(SEQ ID NO:41)
扩增反应体系(100μl)由PCR Thermo Pol缓冲液、0.20mM的dNTPs、0.14μg的pSMai135质粒DNA、50μM的引物993950、50μM的引物993951、和2个单位的Vent DNA聚合酶组成。反应体系在RoboCyclerGradient 40热循环仪(Stratagene,La Jolla,CA)中温育,程序如下:95℃1分钟,一个循环,然后95℃1分钟、60℃或64℃1分钟、72℃3分钟,共25个循环(最后延伸10分钟)。反应产物在0.7%琼脂糖凝胶上用TAE缓冲液显像。根据厂商的说明,用PCR MinElute PCR纯化方法(QIAGEN,Chatsworth,CA)纯化所得的2.6kb片段条带。混合纯化的片段,用Xho I和Spe I消化,并连接到用同样的两个限制性酶消化的pSATe111中,以制备pALFd1(图13)。
实施例10:比较天然和异源分泌信号的啤酒酵母中米曲霉β-葡糖苷酶的表达
根据YEASTMAKER酵母转化方案,CLONTECH Laboratories,Inc.,Palo Alto,CA,将质粒pALFd1(约600ng)转化至新制备的啤酒酵母YNG318感受态细胞中。转化的细胞在酵母选择平板上划平板,所述选择平板每ml含有0.15mg的显色底物5-溴-4-氯-3-吲哚-β-D-半乳糖苷,当存在β-葡糖苷酶时其产生蓝色克隆。所述平板于30℃下温育4天。
携带具有Humicola insolens葡聚糖内切酶V分泌信号的表达载体的克隆在颜色上一般要比具有天然米曲霉β-葡糖苷酶信号序列的克隆的蓝色要深一些,显示用Humicola insolens葡聚糖内切酶V分泌信号分泌了更多的米曲霉β-葡糖苷酶。用自动克隆挑选仪(QPix,Genetix USA,Inc.,Boston,MA)从两个构建体中挑选了大约242个蓝色克隆。将242个转化体接种至酵母选择培养基(其包含铜)中,以诱导米曲霉β-葡糖苷酶的表达和分泌。从245个克隆的每一个中取出来自第7天的96孔培养物肉汤,按上述方法,以p-硝基苯基-β-D-吡喃葡萄糖苷为底物测试β-葡糖苷酶活性。结果显示,表达具有异源信号序列的β-葡糖苷酶的克隆,其活性要比用具有天然分泌信号的米曲霉β-葡糖苷酶转化的克隆高6.6倍。
实施例11:烟曲霉基因组序列中糖基水解酶家族GH3A基因的鉴定
对烟曲霉的部分基因组序列(The Institute for GenomicResearch,Rockville,MD)进行了tblastn检索(Altschul等,1997,Nucleic AcidsRes.25:3389-3402),用于查询来自棘孢曲霉(Aspergillus aculeatus)β-葡糖苷酶蛋白序列(登录号No.P48825)。基于与查询序列在氨基酸水平的高度一致性,几个基因被鉴定为推定的GH3A家族同源物。与查询序列在氨基酸水平具有高于70%同一性的一个约3000bp基因组区域被选择用于进一步的研究。
实施例12:烟曲霉基因组DNA提取
37℃,240rpm转速下,使烟曲霉PaHa34生长于带隔板的摇瓶中的250ml马铃薯葡萄糖培养基中。通过过滤收获菌丝体,在TE缓冲液(10mMTris-1mM EDTA)中洗涤两次,液氮冷冻。用研钵磨碎冷冻的菌丝体,捣碎成细末,将其重悬于含10mM Tris、100mM EDTA、1%Triton X-100、0.5M胍-HCl、和200mM NaCl的pH 8.0的缓冲液中。加入无DNase的RNaseA至20μg/ml的浓度,37℃下温育溶菌液30分钟。离心除去细胞碎片,用Qiagen Maxi 500柱子(QIAGEN Inc.,Chatsworth,CA)分离DNA。在用30ml QC洗涤过的10ml QBT中平衡所述柱子,用15ml的QF(所有的缓冲液均来自AIAGEN Inc.,Chatsworth,CA)洗脱。在异丙醇中沉淀DNA,在70%乙醇中洗涤,离心回收。将所述DNA重悬于TE缓冲液。
实施例13:GH3A家族β-葡糖苷酶基因的克隆及米曲霉表达载体的构建
设计了下述的两个合成寡核苷酸引物,用于从实施例14所制备的基因组DNA中PCR扩增烟曲霉PaHa34基因,该基因编码GH3A家族β-葡糖苷酶。用InFusion克隆试剂盒(BD Biosciences,Palo Alto,CA)将所述片段直接克隆至表达载体pAILo2(图14)中,无需限制性消化和连接。
正向引物:5′-ACTGGATTTACCATGAGATTCGGTTGGCTCG-3′(SEQID NO:44)
反向引物:5′-AGTCACCTCTAGTTACTAGTAGACACGGGGC-3′(SEQID NO:45)
粗体字母代表编码序列。其余的序列与pAILo2的插入位点同源,实施例7中所述。
在PCR反应体系中,使用上述每种引物各50皮摩尔,在终体积为50μl的所述反应体系中含有100ng的烟曲霉基因组DNA、1×Pfx扩增缓冲液、1.5μl的10mM的dATP、dTTP、dGTP和dCTP的混合物、2.5个单位的Pfx DNA聚合酶、1μl的50mM MgSO4和2.5μl的10×pCR×增强子溶液(Invitrogen,Carlsbad,CA)。反应体系在Eppendorf Mastercycler 5333中温育,程序如下:94℃2分钟,一个循环;94℃15秒、55℃30秒、68℃3分钟,共30个循环。然后加热块进入4℃保温循环。
在1.0%琼脂糖凝胶上用TAE缓冲液分离反应产物,按照厂商的说明,用QIAquick凝胶提取试剂盒从胶上切下3kb的产物条带并纯化。
然后用Infusion克隆试剂盒将所述片段克隆至pAILo2表达载体中。用Nco I和Pac I消化所述载体。用凝胶电泳和Qiaquick凝胶纯化方法纯化所述片段。反应中,所述基因片段和消化的载体连接在一起,得到表达质粒pEJG97(图15),在该质粒中,GH3A家族β-葡糖苷酶基因的转录处于NA2-tpi启动子的控制之下。连接反应体系(50μl)由1×InFusion缓冲液(BDBiosciences,Palo Alto,CA)、1×BSA(BD Biosciences,Palo Alto,CA)、1μl的InFusion酶(1∶10稀释)(BD Biosciences,Palo Alto,CA)、150ng的用NcoI和Pac I消化的pAILo2、和50ng的烟曲霉β-葡糖苷酶纯化PCR产物组成。将反应体系在室温下温育30分钟。用1μl的反应液转化E.coli XL10Solopac Gold细胞(Stratagene,La Jolla,CA)。通过质粒DNA的限制性消化,探测到了包含pEJG97质粒的E.coli转化体。
实施例14:编码GH3A家族β-葡糖苷酶的烟曲霉基因组序列的鉴定
采用引物步移策略,按前述方法对来自pEJG97的烟曲霉β-葡糖苷酶基因进行DNA测序。以与来自棘孢曲霉、黑曲霉和川地曲霉(Aspergilluskawachii)的同源基因的相似度为基础,构建了烟曲霉序列的基因模型。核苷酸序列(SEQ ID NO:46)和推导的氨基酸序列(SEQ ID NO:47)列于图16中。所述基因组片段编码863个氨基酸的多肽,由62、55、58、63、58、58、63和51bp的8个内含子所隔断。该基因的G+C含量百分比为54.3%。用SignalP软件程序(Nielsen等,1997,Protein Engineering 10:1-6)预测到了19个残基的信号肽。所预测的成熟蛋白含有844个氨基酸,分子量为91.7kDa。
采用LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI),通过Clustal W方法(Higgins,1989,CABIOS 5:151-153)测定了β-葡糖苷酶序列的比较性比对,所述软件具有同一性表和下述的多序列比对参数:空位罚分为10、空位长度罚分为10。成对比对参数为Ktuple=1、空位(gap)罚分=3、窗口=5、对角线(diagonal)=5。比对显示,推导的烟曲霉β-葡糖苷酶基因的氨基酸序列与棘孢曲霉(登录号P48825)、黑曲霉(登录号000089)、和川地曲霉(登录号P87076)的β-葡糖苷酶具有78%、76%、和76%的同一性。
实施例15:烟曲霉GH3A家族β-葡糖苷酶基因在米曲霉JAL250中的表达
参照Christensen等,1988,Bio/Technology 6:1419-1422的方法制备了米曲霉Jal250的原生质体。用5μg的pEJG97(还有作为对照载体的pAILo2)转化米曲霉JAL250。
用pEJG97转化米曲霉Jal250产生了约100个转化体。将10个转化体分离到单个的PDA平板。
用5ml的0.01%Tween 20洗涤10个转化体中其中5个的融合PDA平板,单独接种到125ml玻璃摇瓶中的25ml MDU2BP培养基中,34℃250rpm温育。接种后5天,按照厂商的说明,用8-16%的Tris-Glycine SDS-PAGE凝胶(Invitrogen,Carlsbad,CA)分析0.5μl的来自每一培养物的上清液。培养物的SDS-PAGE图谱显示,其中一个转化体(指定为转化体1)具有约130kDa的主条带。
实施例16:从米曲霉提取总RNA
将实施例13中所述的米曲霉转化体冷冻在液氮中,-80℃保存。接下来,在电动咖啡豆研磨机中研磨冷冻的组织,研磨中加入几片干冰以使粉末化菌丝体保持冰冷。然后,用刀片将研磨后的物质转移到50ml灭菌的圆锥管中,圆锥管中已事先装入20ml的Fenozol(Active Motif,Inc.,Carlsbad,CA)。快速混匀混合物以使冷冻的材料溶解于浓溶液中,置于50℃水浴中15分钟。加入5ml无RNase的氯仿,剧烈涡旋。然后使混合物于室温下静置10分钟。接下来,室温下于Sorvall RT7离心机(Sorvall,Inc,Newtown,CT)中1300×g离心20分钟。将上相转移至新的圆锥管,加入等体积的苯酚-氯仿-异戊醇(25∶24∶1)。涡旋混合物并离心10分钟。该程序重复两次,以完成3次苯酚-氯仿-异戊醇抽提。然后将上相转移至新的试管,加入等体积的氯仿-异戊醇(24∶1)。再次涡旋混合物并离心10分钟。离心后,将水相(约5ml)转移至新的Oak Ridge管中,加入0.5ml pH 5.2的3M醋酸钠和6.25ml的异丙醇。将混合物混匀,于室温下温育15分钟。接下来,将混合物于Sorvall RC5B(Sorvall,Inc,Newtown,CT)中4℃12,000×g离心30分钟。离心后,去除上清液,小心地将18ml 70%乙醇加到颗粒(pellet)上。再次于4℃以12,000×g离心10分钟。小心去除上清液,使颗粒于空气中干燥。将RNA颗粒重悬于500μl的二乙基焦碳酸酯(DEPC)处理过的水中。65℃加热10分钟以帮助重悬。于-80℃保存总RNA。在AgilentBioanalyzer 2100(Englewood,CO)上用RNA芯片量化并评估RNA的品质。本方案中使用的所有材料和试剂均是无RNAse的。
实施例17:烟曲霉β-葡糖苷酶cDNA序列的克隆
用实施例16所述的总RNA克隆烟曲霉β-葡糖苷酶cDNA序列(SEQ IDNO:48为cDNA序列,SEQ ID NO:49为推导的氨基酸序列)。按厂商的说明,用Poly(A)Purist Mag试剂盒(Ambion,Inc.,Austin,TX)纯化来自总RNA的mRNA。然后,用ProStar UltraHF RT-PCR系统(Stratagene,La Jolla,CA)在两个片段中扩增烟曲霉β-葡糖苷酶cDNA序列,1,337bp的DNA片段从ATG起始密码子至1,332位置(标记为5`片段),第二个1,300bp的DNA片段(标记为3`片段)从1,303位置直至终止密码子,扩增按厂商的方案进行,对于50μl的反应体系,用200ng的poly-A mRNA,用于5`片段的引物为Afuma(有义)和Afumc(反义),用于3`片段的引物为Afumd(有义)和Afumb(反义),所述引物如下:
Afuma:5′-GGCTCATGAGATTCGGTTGGCTCGAGGTC-3′(SEQ IDNO:50)
Afumc:5′-GCCGTTATCACAGCCGCGGTCGGGGCAGCC-3′(SEQ IDNO:51)
Afumd:5′-GGCTGCCCCGACCGCGGCTGTGATAACGGC-3′(SEQ IDNO:52)
Afumb:5′-GCTTAATTAATCTAGTAGACACGGGGCAGAGGCGC-3′(SEQ ID NO:53)
引物Afuma具有上游Bsp HI位点,引物Afumb具有下游Pac I位点。1,337片段3`端的29个核苷酸与1,303片段5`端重叠。在重叠区有独特的Sac II 位点。
按厂商的方案,用Zero BluntTM TOPO PCR克隆试剂盒将两个片段各自都亚克隆到pCR-BluntII-TOPO载体中,以用于测序,得到了质粒pCR4Blunt-TOPOAfcDNA5′(图17)和pCR4Blunt-TOPOAfcDNA3′(图18),分别包含5`和3`片段。
通过用0.5μl的每种质粒DNA和3.2pmol的下述引物测序,两个烟曲霉β-葡糖苷酶片段的全部编码区都得到了证实。
BGLU1.正向:5′-ACACTGGCGGAGAAGG-3′(SEQ ID NO:54)
BGLU2.正向:5′-GCCCAGGGATATGGTTAC-3′(SEQ ID NO:55)
BGLU3.正向:5′-CGACTCTGGAGAGGGTTTC-3′(SEQ ID NO:56)
BGLU4.反向:5′-GGACTGGGTCATCACAAAG-3′(SEQ ID NO:57)
BGLU5.反向:5′-GCGAGAGGTCATCAGCA-3′(SEQ ID NO:58)
M13正向:5′-GTAAAACGACGGCCAGT-3′(SEQ ID NO:59)
M13反向:5′-CAGGAAACAGCTATGA-3′(SEQ ID NO:60)
当将获得的烟曲霉β-葡糖苷酶cDNA序列与由基因组研究院(TheInstitute for Genomic Research,Rockville,MD)的基因组数据所推导出来的烟曲霉β-葡糖苷酶cDNA序列比较时,测序结果显示存在几个核苷酸改变。在位置500,T由C所取代,使编码序列GTT变为GCT,这样缬氨酸由丙氨酸所取代。在位置903,T由C所取代,使编码序列CCC变为CCT,然而这个变化是沉默的。在位置2,191,G由C所取代,使编码序列CAG变为GAG,这样谷氨酸由谷氨酰胺所取代。最后,在位置2,368,C由T所取代,使编码序列CTG变为TTG,然而这个变化也是沉默的。
两个片段的测序完成后,使用约9μg的每种质粒DNA,以Sac II和Pme I消化包含每个片段两个克隆。用上述的酶消化pCR4Blunt-TOPOAfcDNA5′载体得到3,956bp(包含载体的大部分)和第二个1,339bp的片段(包含烟曲霉β-葡糖苷酶cDNA 5`片段)。用这些相同的酶消化pCMBlunt-TOPOAfcDNA3′载体产生5,227bp的片段(包含pCR4BIunt-TOPO载体的大部分和烟曲霉β-葡糖苷酶cDNA 3`片段)和31bp的第二个片段。
用虾碱性磷酸酶处理经消化的pCR4Blunt-TOPOAfcDNA3′,以将消化的DNA产物脱磷酸化,该处理按以下方式进行:加入1×SAP缓冲液和1μl的虾碱性磷酸酶(Roche Applied Science,Manheim,Germany),37℃下温育反应体系10分钟,然后85℃温育10分钟使酶失活。两次消化均用TAE缓冲液在0.7%的琼脂糖凝胶上进行,按照厂商的说明,用QIAGEN凝胶纯化试剂盒纯化。按照厂商的说明,用快速DNA连接试剂盒(Roche AppliedScience,Manheim,Germany)将由pCR4Blunt-TOPOAfcDNA5′消化产生的1,339bp条带与由pCR4Blunt-TOPOAfcDNA3′消化产生的5,527bp片段连接。按照厂商的说明(Stratagene,La Jolla,CA),将连接反应液转化至XL1-Blue E.coli亚克隆感受态细胞中。转化时,对来自分离克隆的质粒DNA测序,以确认烟曲霉β-葡糖苷酶cDNA的5`和3`片段均被按顺序亚克隆,产生了6,566bp的pCR4BIunt-TOPOAfcDNA载体(图19)。
实施例18:pALFd6和pALFd7啤酒酵母表达载体的构建
用下述引物PCR扩增烟曲霉β-葡糖苷酶全长cDNA,所述引物与pCu426和烟曲霉β-葡糖苷酶cDNA的5`和3`序列具有同源性:
AfumigatusBGUpper:
5′-CTTCTTGTTAGTGCAATATCATATAGAAGTCATCGACTAGTGGATCTACCATGAGATTCGGTT GGCTCG-3′(SEQ ID NO:61)
ATGAGATTCGGTTGGCTCG与烟曲霉cDNA的5`端具有同源性
AfumigatusBGLower:
5′-GCGTGAATGTAAGCGTGACATAACTAATTACATGACTCGAGCTAGTAGACACGGGGCAGAG-3′(SEQ ID NO:62)
CTAGTAGACACGGGGCAGAG与烟曲霉cDNA的3`端具有同源性
扩增反应体系(100μl)由包含烟曲霉cDNA序列的0.5μl pCR4BIunt-TOPOAfcDNA质粒、1×Pfx扩增缓冲液、各50μM的dATP、dCTP、dGTP和dTTP、各50pmol的上述每种引物、1.5mM的MgSO4、和2.5个单位的Platinum Pfx DNA聚合酶组成。反应体系在RoboCycler Gradient 40中温育,程序如下:95℃5分钟,一个循环;95℃1分钟、50℃1分钟、72℃3分钟,共25个循环;最后72℃延伸10分钟。用QIAquick PCR纯化试剂盒(QIAGEN Inc.,Valencia,CA)纯化PCR反应物。将DNA洗脱到30μl的EB缓冲液(QIAGEN Inc.,Valencia,CA)中。PCR产物包含37bp的同源DNA序列,将其与1μl的pCU426混合,以共转化到实施例10所述的啤酒酵母YNG318感受态细胞中,所述pCU426用Spe I和Xho I切有缺口。这些克隆没有变蓝,显示在烟曲霉β-葡糖苷酶cDNA序列中有一些测序错误。进一步的烟曲霉cDNA序列测序显示在cDNA序列中插入了额外的核苷酸,其破坏了酶的开放阅读框。因此,必须修复此构建体。
在啤酒酵母中表达烟曲霉β-葡糖苷酶cDNA,与此同时,为了在啤酒酵母中表达,用烟曲霉cDNA序列的天然信号序列交换了Humicola insolens葡聚糖内切酶V信号序列,以比较具有两个信号序列的酶的表达。用与pALFd1中的Humicola insolens葡聚糖内切酶V信号序列具有同源性的引物PCR扩增烟曲霉cDNA序列,所述引物与成熟烟曲霉β-葡糖苷酶cDNA序列的5`端也具有同源性。用于烟曲霉β-葡糖苷酶cDNA序列扩增的引物是前述的AfumigatusBGLower引物和下述的HiEGVAfumigatus引物:
HiEGVAfumigatus:
5′-CCGCTCCGCCGTTGTGGCCGCCCTGCCGGTGTTGGCCCTTGCCGAATTGGCTTTCTCTCC-3′(SEQ ID NO:63)
GAATTGGCTTTCTCTCC与烟曲霉成熟序列的5`端具有同源性。
扩增反应体系(100μl)由包含烟曲霉cDNA序列的0.5μl的pCR4BIunt-TOPOAfcDNA质粒、1×Pfx扩增缓冲液、各50μM的dATP、dCTP、dGTP和dTTP、各50pmol的上述引物、1.5mM的MgSO4、和2.5个单位的PlatinumPfx DNA聚合酶组成。反应体系在RoboCycler Gradient 40中温育,程序如下:95℃5分钟,一个循环;95℃1分钟、50℃1分钟、72℃3分钟,共25个循环;最后72℃延伸10分钟。用QIAquick PCR纯化试剂盒纯化PCR反应物。将DNA洗脱到10μl的EB缓冲液中。将3ul的纯净PCR产物与1.8μl的pALFd1混合,以共转化到实施例10中所述的啤酒酵母YNG318感受态细胞中,所述pALFd1用Eco NI和Xho I切有缺口。这些克隆变为浅蓝色。然而,一个克隆很突出,显示出非常蓝的颜色。除了使用20μl的酵母裂解缓冲液(1%SDS,10mM Tris-HCl,1mM EDTA pH 8)外,根据Kaiser和Auer,1993,BioTechniques 14:552的方案从这个克隆中实施DNA拯救(DNA rescue)。将所述质粒转化到E.coli SURE电穿孔-感受态细胞中(Stratagene,La Jolla,CA)测序。全长测序显示烟曲霉β-葡糖苷酶cDNA序列是正确的。该质粒指定为pALFd7(图20),其包含烟曲霉β-葡糖苷酶cDNA序列,该cDNA序列带有用于酵母表达的Humicola insolens葡聚糖内切酶V信号序列。
为了制备包含正确的、具有其天然信号序列的烟曲霉cDNA序列的酵母表达载体,用上述的BGLU.5反向引物和下述的引物PCR扩增来自酵母表达载体的含有正确核苷酸序列的区域,该酵母表达载体包含具有Humicola insolens葡聚糖内切酶V信号序列的烟曲霉cDNA序列(pALFd7):
BGL.7正向:5′-CTGGCGTTGGCGCTGTC-3′(SEQ ID NO:64)
扩增反应体系(100μl)由0.5μl的pALFd7、1×Pfx扩增缓冲液、各50μM的dATP、dCTP、dGTP和dTTP、各50pmol的上述引物、1.5mM的MgSO4、和2.5个单位的Platinum Pfx DNA聚合酶组成。反应体系在RoboCyclerGradient 40中温育,程序如下:95℃5分钟,一个循环;95℃1分钟、50℃1分钟、72℃1分钟,共25个循环;最后72℃延伸10分钟。
用QIAquick PCR纯化试剂盒纯化701bp的PCR片段。将DNA洗脱到10μl的EB缓冲液中。将3ul的纯净PCR产物与3μl的酵母表达载体和额外的核苷酸混合,以共转化到实施例10所述的啤酒酵母YNG318感受态细胞中,所述酵母表达载体包含具有天然信号序列的烟曲霉cDNA序列,所述的额外的核苷酸用Sac II和Xma I载体切有缺口。这些克隆变为蓝色。如上述,从一个随机挑选的蓝色克隆实施了DNA拯救,将所述质粒转化到E.coli SURE电穿孔-感受态细胞中(Stratagene,La Jolla,CA)测序。全长测序显示烟曲霉β-葡糖苷酶cDNA序列是正确的。该酵母表达载体命名为pALFd6(图21),其包含具有其天然信号序列的烟曲霉cDNA序列。
实施例19:比较天然和异源分泌信号的啤酒酵母中烟曲霉β-葡糖苷酶的表达
将大约1μg的质粒pALFd6(包含具有其天然信号序列的烟曲霉)和pALFd7(包含具有所述异源信号序列的烟曲霉)各自转化到新制备的啤酒酵母YNG318感受态细胞中,在酵母选择平板上划平板,如实施例10所述,30℃下温育4天。
手工挑选来自两个构建体的两个蓝色克隆,将其接种到酵母选择培养基(培养基包含铜)中,以诱导米曲霉β-葡糖苷酶的表达和分泌。然后如上述,用p-硝基苯基-β-D-吡喃葡萄糖苷作底物,测试第5天的肉汤的β-葡糖苷酶活性,重复一次。表达具有异源信号序列的β-葡糖苷酶的培养物所生产的β-葡糖苷酶比表达具有其天然信号序列的β-葡糖苷酶的培养物多2.5倍。
生物材料的保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究服务专利培养物保藏中心,北方区研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,给出了下述的保藏号:
保藏物                    保藏号          保藏日期
E.coli TOP10(pEJG113)     NRRL B-30695    2003年10月17日
该菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
此处,本发明所描述的和要求的并非是要用此处所公开的特定方案来限定范围,因为这些方案的用意是要作为本发明几个方面的说明。任何等价的方案都将处于本发明的范围之内。事实上,由前面的描述,除此处所显示和描述的之外,对本发明的多种修改,对于本领域技术人员来讲都将是很显然的。这样的修改也将落在所附的权利要求的范围之内。与此冲突的情况将由包括定义部分的本说明书来解释。
本文引用了许多参考文献,其中公开的全部内容一并作为参考。
关于微生物保藏的说明
(细则13之二)
Figure S04819069320060119D000462
PCt/RO/134表(1998年7月)
序列表
<110>诺维信股份有限公司(NOVOZYMES BIOTECH,INC.)
Maiyiran,Suchindra
Fidantsef,Ana
Brody,Howard
 
<120>制备分泌型多肽的方法
 
<130>10375.204-WO
 
<150>60/467,766
<151>2003-05-02
 
<160>64
 
<170>PatentIn version 3.2
 
<210>1
<211>22
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>1
gtgccccatg atacgcctcc gg                             22
 
<210>2
<211>26
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>2
gagtcgtatt tccaaggctc ctgacc                         26
 
<210>3
<211>24
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>3
ggaggcca tg aagtggacca acgg                          24
 
<210>4
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
 
<400>4
caccgtgaaa gccatgctct ttccttcgtg tagaagacca gacag    45
 
<210>5
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
    
<400>5
ctggtcttct acacgaagga aagagcatgg ctttcacggt gtctg   45
 
<210>6
<211>44
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>6
ctatatacac aactggattt accatgggcc cgcggccgca gatc    44
 
<210>7
<211>44
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>7
gatctgcggc cgcgggccca tggtaaatcc agttgtgtat atag    44
 
<210>8
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>8
aacgttaatt aaggaatcgtt ttgtgttt                     29
 
<210>9
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>9
agtactagta gctccgtggc gaaagcctg                     29
 
<210>10
<211>31
<212>DNA
<213>Humicola insolens
 
<400>10
ttgaattgaa aatagattga tttaaaactt c                  31
 
<210>11
<211>25
<212>DNA
<213>Humicola insolens
 
<400>11
ttgcatgcgt aatcatggtc atagc                         25
 
<210>12
<211>26
<212>DNA
<213>啤酒酵母(Saccharomyces cerevisiae)
 
<400>12
ttgaattcat gggtaataac tgatat                         26
 
<210>13
<211>32
<212>DNA
<213>啤酒酵母(Saccharomyces cerevisiae)
 
<400>13
aaatcaatct attttcaatt caattcatca tt                  32
 
<210>14
<211>45
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>14
ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc    45
 
<210>15
<211>44
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>15
ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc     44
 
<210>16
<211>29
<212>DNA
<213>Humicola insolens
 
<400>16
aagcttaagc atgcgttcct cccccctcc                      29
 
<210>17
<211>32
<212>DNA
<213>Humicola insolens
 
<400>17
ctgcagaatt ctacaggcac tgatggtacc ag                 32
 
<210>18
<211>32
<212>DNA
<213>Humicola insolens.
 
<400>18
ctgcagaatt ctacaggcac tgatggtacc ag                 32
<210>19
<211>36
<212>DNA
<213>Humicola insolens
 
<400>19
accgcggact gcgcatcatg cgt tcctccc ccctcc    36
 
<210>20
<211>29
<212>DNA    
<213>里氏木霉(Trichoderma reesei)
 
<400>20
aaacgtcgac cgaatgtagg attgttatc             29
 
<210>21
<211>17
<212>DNA    
<213>里氏木霉(Trichoderma reesei)
 
<400>21
gatgcgcagt ccgcggt                          17
 
<210>22
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>22
aaacgtcgac cgaatgtagg attgttatc             29
 
<210>23
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>23
ggagggggga ggaacgcatg atgcgcagtc cgcggt     36
 
<210>24
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>24
aaacgtcgac cgaatgtagg attgttatc            29
 
<210>25
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>25
ctgcagaatt ctacaggcac tgatggtacc ag                   32
 
<210>26
<211>46
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>26
atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg    46
 
<210>27
<211>26
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>27
actagtttac tgggccttag gcagcg                          26
 
<210>28
<211>26
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>28
gtcgactcga agcccgaatg taggat                          26
 
<210>29
<211>45
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>29
cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta     45
 
<210>30
<211>42
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>30
tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc       42
 
<210>31
<211>28
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>31
gactagtctt actgggcctt aggcagcg                       28
 
<210>32
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>32
acgcgtcgac cgaatgtagg attgttatcc                                 30
 
<210>33
<211>42
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>33
gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca                   42
 
<210>34
<211>57
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>34
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgcc    57
 
<210>35
<211>19
<212>PRT
<213>米曲霉(Aspergillus oryzae)
 
<400>35
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala
  
<210>36
<211>63
<212>DNA
<213>Humicola insolens
 
<400>36
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt    60
gcc                                                                  63
 
<210>37
<211>21
<212>PRT
<213>Humicola insolens
 
<400>37
 
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala
             20
 
<210>38
<211>32
<212>DNA    
<213>米曲霉(Aspergillus o ryzae)
 
<400>38
gcagatctac catgaagctt ggttggatcg ag               32
 
<210>39
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>39
gcctcagatt actgggcctt aggcagcgag                 30
 
<210>40
<211>40
<212>DNA
<213>Humicola insolens
 
<400>40
aatccgacta gtggatctac catgcgttcc tcccccctcc      40
 
<210>41
<211>32
<212>DNA
<213>Humicola insolens
 
<400>41
gcgggcctcg agttactggg ccttaggcag cg              32
 
<210>42
<211>2586
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<220>
<221>CDS
<222>(1)..(2583)
 
<400>42
atg aag ctt ggt tgg atc gag gtg gcc gca ttg gcg gct gcc tca gta       48
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
gtc agt gcc aag gat gat ctc gcg tac tcc cct cct ttc tac cct tcc       96
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
            20                  25                  30
cca tgg gca gat ggt cag ggt gaa tgg gcg gaa gta tac aaa cgc gct    144
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
        35                  40                  45
gta gac ata gtt tcc cag atg acg ttg aca gag aaa gtc aac tta acg    192
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
    50                  55                  60
act gga aca gga tgg caa cta gag agg tgt gtt gga caa act ggc agt    240
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65                  70                  75                  80
gtt ccc aga ctc aac atc ccc agc ttg tgt ttg cag gat agt cct ctt    288
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
                85                  90                  95
ggt att cgt ttc tcg gac tac aat tca gct ttc cct gcg ggt gtt aat    336
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
            100                 105                 110
gtc gct gcc acc tgg gac aag acg ctc gcc tac ctt cgt ggt cag gca    384
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
        115                 120                 125
atg ggt gag gag ttc agt gat aag ggt att gac gtt cag ctg ggt cct    432
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
    130                 135                 140
gct gct ggc cct ctc ggt gct cat ccg gat ggc ggt aga aac tgg gaa    480
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145                 150                 155                 160
ggt ttc tca cca gat cca gcc ctc acc ggt gta ctt ttt gcg gag acg    528
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
att aag ggt att caa gat gct ggt gtc att gcg aca gct aag cat tat    576
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
atc atg aac gaa caa gag cat ttc cgc caa caa ccc gag gct gcg ggt    624
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
        195                 200                 205
tac gga ttc aac gta agc gac agt ttg agt tcc aac gtt gat gac aag    672
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
     210                 215                 220
act atg cat gaa ttg tac ctc tgg ccc ttc gcg gat gca gta cgc gct    720
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
gga gtc ggt gct gtc atg tgc tct tac aac caa atc aac aac agc tac    768
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
ggt tgc gag aat agc gaa act ctg aac aag ctt ttg aag gcg gag ctt    816
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
             260                 265                 270
ggt ttc caa ggc ttc gtc atg agt gat tgg acc gct cat cac agc ggc      864
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
        275                 280                 285
gta ggc gct gct tta gca ggt ctg gat atg tcg atg ccc ggt gat gtt      912
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
    290                 295                 300
acc ttc gat agt ggt acg tct ttc tgg ggt gca aac ttg acg gtc ggt      960
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305                 310                 315                 320
gtc ctt aac ggt aca atc ccc caa tgg cgt gtt gat gac atg gct gtc     1008
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
cgt atc atg gcc gct tat taca ag gtt ggc cgc gac acc aaa tac acc     1056
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
            340                 345                 350
cct ccc aac ttc agc tcg tgg acc agg gac gaa tat ggt ttc gcg cat     1104
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
        355                 360                 365
aac cat gtt tcg gaa ggt gct tac gag agg gtc aac gaa ttc gtg gac     1152
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
    370                 375                 380
gtg caa cgc gat cat gcc gac cta atc cgt cgc atc ggc gcg cag agc     1200
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385                 390                 395                 400
act gtt ctg ctg aag aac aag ggt gcc ttg ccc ttg agc cgc aag gaa     1248
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
                405                 410                 415
aag ctg gtc gcc ctt ctg gga gag gat gcg ggt tcc aac tcg tgg ggc     1296
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
            420                 425                 430
gct aac ggc tgt gat gac cgt ggt tgc gat aac ggt acc ctt gcc atg     1344
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
gcc tgg ggt agc ggt act gcg aat ttc cca tac ctc gtg aca cca gag     1392
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
cag gcg att cag aac gaa gtt ctt cag ggc cgt ggt aat gtc ttc gcc     1440
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465                 470                 475                 480
gtg acc gac agt tgg gcg ctc gac aag atc gct gcg gct gcc cgc cag     1488
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
                485                 490                 495
gcc agc gta tct ctc gtg ttc gtc aac tcc gac tca gga gaa ggc tat     1536
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
            500                 505                 510
ctt agt gtg gat gga aat gag ggc gat cgt aac aac atc act ctg tgg    1584
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
        515                 520                 525
aag aac ggc gac aat gtg gtc aag acc gca gcg aat aac tgt aac aac    1632
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
    530                 535                 540
acc gtt gtc atc atc cac tcc gtc gga cca gtt ttg atc gat gaa tgg    1680
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545                 550                 555                 560
tat gac cac ccc aat gtc act ggt att ctc tgg gct ggt ctg cca ggc    1728
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
                565                 570                 575
cag gag tct ggt aac tcc att gcc gat gtg ctg tac ggt cgt gtc aac    1776
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
cct ggc gcc aag tct cct ttc act tgg ggc aag acc cgg gag tcg tat    1824
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
       595                 600                 605
ggt tct ccc ttg gtc aag gat gcc aac aat ggc aac gga gcg ccc cag    1872
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
tct gat ttc acc cag ggt gtt ttc atc gat tac cgc cat ttc gat aag    1920
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
ttc aat gag acc cct atc tac gag ttt ggc tac ggc ttg agc tac acc    1968
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
                645                 650                 655
acc ttc gag ctc tcc gac ctc cat gtt cag ccc ctg aac gcg tcc cga    2016
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
            660                 665                 670
tac act ccc acc agt ggc atg act gaa gct gca aag aac ttt ggt gaa    2064
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
        675                 680                 685
att ggc gat gcg tcg gag tac gtg tat ccg gag ggg ctg gaa agg atc    2112
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
    690                 695                 700
cat gag ttt atc tat ccc tgg atc aac tct acc gac ctg aag gca tcg    2160
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705                 710                 715                 720
tct gac gat tct aac tac ggc tgg gaa gac tcc aag tat att ccc gaa    2208
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
                725                 730                 735
ggc gcc acg gat ggg tct gcc cag ccc cgt ttg ccc get agt ggt ggt    2256
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
            740                 745                 750
gcc gga gga aac ccc ggt ctg tac gag gat ctt ttc cgc gtc tct gtg    2304
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
        755                 760                 765
aag gtc aag aac acg ggc aat gtc gcc ggt gat gaa gtt cct cag ctg    2352
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
    770                 775                 780
tac gtt tcc cta ggc ggc ccg aat gag ccc aag gtg gta ctg cgc aag    2400
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785                 790                 795                 800
ttt gag cgt att cac ttg gcc cct tcg cag gag gcc gtg tgg aca acg    2448
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
                805                 810                 815
acc ctt acc cgt cgt gac ctt gca aac tgg gac gtt tcg gct cag gac    2496
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
            820                 825                 830
tgg acc gtc act cct tac ccc aag acg atc tac gtt gga aac tcc tca    2544
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
        835                 840                 845
cgg aaa ctg ccg ctc cag gcc tcg ctg cct aag gcc cag taa    2586
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
    850                 855                 860
 
<210>43
<211>861
<212>PRT    
<213>米曲霉(Aspergillus oryzae)
 
<400>43
 
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
            20                  25                  30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
        35                  40                  45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
    50                  55                  60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65                  70                  75                  80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
        115                 120                 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
        195                 200                 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
    290                 295                 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305                 310                 315                 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
        355                 360                 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
    370                 375                 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
                405                 410                 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
            420                 425                 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
                485                 490                 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
            500                 505                 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
        515                 520                 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
    530                 535                 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545                 550                 555                 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
       595                 600                 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
            660                 665                 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
        675                 680                 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
    690                 695                 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705                 710                 715                 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
                725                 730                 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
            740                 745                 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
        755                 760                 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
    770                 775                 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785                 790                 795                 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
                805                 810                 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
            820                 825                 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
        835                 840                 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850                 855                 860
 
<210>44
<211>31
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>44
actggattta ccatgagatt cggttggctc g                     31
 
<210>45
<211>31
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>45
agtcacctct agttactagtagacacgggg c                      31
 
<210>46
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>46
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag   60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc  120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt  180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg  240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc  300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc  360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag  420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga  480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc  540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact  600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt  660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg    720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca    780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg    840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt    900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga    960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga    1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt    1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa    1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg    1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga    1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt    1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac    1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat    1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc    1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg    1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc    1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat    1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc    1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact    1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct    1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg    1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac    1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac    2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat    2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac    2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg    2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt    2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc    2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct    2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag    2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag  2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat  2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg  2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt  2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat  2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc  2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac  2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat  2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg  3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag  3060
 
<210>47
<211>863
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
 
<400>47
 
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1               5                   10                  15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
            20                  25                  30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
        35                  40                  45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
    50                  55                  60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65                  70                  75                  80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
        115                 120                 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
     130                 135                 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
        195                 200                 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
    290                 295                 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305                 310                 315                 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
        355                 360                 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
    370                 375                 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
                405                 410                 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
            420                 425                 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
                485                 490                 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
            500                 505                 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
        515                 520                 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
    530                 535                 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545                 550                 555                 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
            660                 665                 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
        675                 680                 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
    690                 695                 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705                 710                 715                 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
                725                 730                 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
            740                 745                 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
        755                 760                 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
    770                 775                 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785                 790                 795                 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
                805                 810                 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
            820                 825                 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
        835                 840                 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
    850                 855                 860
 
<210>48
<211>2592
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>48
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag  60
gaattggctt tctctccacc attctaccct tcgccttggg ctgatggcca gggagagtgg  120
gcagatgccc atcgacgcgc cgtcgagatc gtttctcaga tgacactggc ggagaaggtt  180
aaccttacaa cgggtactgg atgggaaatg gaccgatgcg tcggtcaaac cggcagcgtt  240
cccagacttg gtatcaactg gggtctttgt ggccaggatt cccctttggg tatccgtttc  300
tctgacctca actccgcctt ccctgctggt actaatgtcg ccgcgacatg ggacaagaca  360
ctcgcctacc ttcgtggcaa ggccatgggt gaggaattca acgacaaggg cgtggacatt  420
ttgctggggc ctgctgctgg tcctctcggc aaatacccgg acggcggcag aatctgggaa  480
ggcttctctc ctgatccggt tctcactggt gtacttttcg ccgaaactat caagggtatc  540
caagacgcgg gtgtgattgc tactgccaag cattacattc tgaatgaaca ggagcatttc  600
cgacaggttg gcgaggccca gggatatggt tacaacatca cggagacgat cagctccaac  660
gtggatgaca agaccatgca cgagttgtac ctttggccct ttgcagatgc tgtgcgcgct  720
ggcgttggcg ctgtcatgtg ttcctacaat caaatcaaca acagctacgg ttgtcaaaac  780
agtcaaactc tcaacaagct cctcaaggct gagctgggct tccaaggctt cgtcatgagt  840
gactggagcg ctcaccacag cggtgtcggc gctgccctcg ctgggttgga tatgtcgatg  900
cctggagaca tttccttcga cgacggactc tccttctggg gcacgaacct aactgtcagt  960
gttcttaacg gcaccgttcc agcctggcgt gtcgatgaca tggctgttcg tatcatgacc  1020
gcgtactaca aggttggtcg tgaccgtctt cgtattcccc ctaacttcag ctcctggacc  1080
cgggatgagt acggctggga gcattctgct gtctccgagg gagcctggac caaggtgaac  1140
gacttcgtca atgtgcagcg cagtcactct cagatcatcc gtgagattgg tgccgctagt  1200
acagtgctct tgaagaacac gggtgctctt cctttgaccg gcaaggaggt taaagtgggt  1260
gttctcggtg aagacgctgg ttccaacccg tggggtgcta acggctgccc cgaccgcggc  1320
tgtgataacg gcactcttgc tatggcctgg ggtagtggta ctgccaactt cccttacctt  1380
gtcacccccg agcaggctat ccagcgagag gtcatcagca acggcggcaa tgtctttgct  1440
gtgactgata acggggctct cagccagatg gcagatgttg catctcaatc cagcgtgtct  1500
ttggtgtttg tcaacgccga ctctggagag ggtttcatca gtgtcgacgg caacgagggt  1560
gaccgcaaaa atctcactct gtggaagaac ggcgaggccg tcattgacac tgttgtcagc  1620
cactgcaaca acacgattgt ggttattcac agtgttgggc ccgtcttgat cgaccggtgg  1680
tatgataacc ccaacgtcac tgccatcatc tgggccggct tgcccggtca ggagagtggc  1740
aactccctgg tcgacgtgct ctatggccgc gtcaacccca gcgccaagac cccgttcacc  1800
tggggcaaga ctcgggagtc ttacggggct cccttgctca ccgagcctaa caatggcaat  1860
ggtgctcccc aggatgattt caacgagggc gtcttcattg actaccgtca ctttgacaag  1920
cgcaatgaga cccccattta tgagtttggc catggcttga gctacaccac ctttggttac  1980
tctcaccttc gggttcaggc cctcaatagt tcgagttcgg catatgtccc gactagcgga  2040
gagaccaagc ctgcgccaac ctatggtgag atcggtagtg ccgccgacta cctgtatccc  2100
gagggtctca aaagaattac caagtttatt tacccttggc tcaactcgac cgacctcgag  2160
gattcttctg acgacccgaa ctacggctgg gaggactcgg agtacattcc cgaaggcgct  2220
agggatgggt ctcctcaacc cctcctgaag gctggcggcg ctcctggtgg taaccctacc  2280
ctttatcagg atcttgttag ggtgtcggcc accataacca acactggtaa cgtcgccggt  2340
tatgaagtcc ctcaattgta tgtttcactg ggcggaccga acgagcctcg ggtcgttctg  2400
cgcaagttcg accgaatctt cctggctcct ggggagcaaa aggtttggac cacgactctt  2460
aaccgtcgtg atctcgccaa ttgggatgtg gaggctcagg actgggtcat cacaaagtac  2520
cccaagaaag tgcacgtcgg cagctcctcg cgtaagctgc ctctgagagc gcctctgccc  2580
cgtgtctact ag                                                      2592
 
<210>49
<211>863
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
 
<400>49
 
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1               5                   10                  15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
            20                  25                  30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
        35                  40                  45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
    50                  55                  60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65                  70                  75                  80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
        115                 120                 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
        195                 200                 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                 245                 250                 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
    290                 295                 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305                 310                 315                 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
        355                 360                 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
    370                 375                 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
                405                 410                 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
            420                 425                 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
                485                 490                 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
            500                 505                 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
        515                 520                 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
    530                 535                 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545                 550                 555                 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
            660                 665                 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
        675                 680                 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
    690                 695                 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705                 710                 715                 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
                725                 730                 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
            740                 745                 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
        755                 760                 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
    770                 775                 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785                 790                 795                 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
                805                 810                 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
            820                 825                 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
        835                 840                 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
    850                 855                 860
 
<210>50
<211>29
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>50
ggctcatgag attcggttgg ctcgaggtc                     29
 
<210>51
<211>30
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>51
gccgttatcacagccgcggt cggggcagcc                     30
 
<210>52
<211>30
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>52
ggctgccccg accgcggctg tgataacggc                    30
 
<210>53
<211>35
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>53
gcttaattaa tctagtagac acggggcaga ggcgc              35
<210>54
<211>16
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>54
acactggcgg agaagg                                16
 
<210>55
<211>18
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>55
gcccagggat atggttac                              18
 
<210>56
<211>19
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>56
cgactctgga gagggtttc                             19
 
<210>57
<211>19
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>57
ggactgggtc atcacaaag                             19
 
<210>58
<211>17
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>58
gcgagaggtc atcagca                               17
 
<210>59
<211>17
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>59
gtaaaacgac ggccagt                               17
 
<210>60
<211>16
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>60
caggaaacag ctatga                                                    16
 
<210>61
<211>69
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>61
cttcttgtta gtgcaatatc atatagaagt catcgactag tggatctacc atgagattcg    60
gttggctcg                                                            69
 
<210>62
<211>61
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>62
gcgtgaatgt aagcgtgaca taactaatta catgactcga gctagtagac acggggcaga    60
g                                                                    61
 
<210>63
<211>60
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>63
ccgctccgcc gttgtggccg ccctgccggt gttggccctt gccgaattgg ctttctctcc    60
 
<210>64
<211>17
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
 
<400>64
ctggcgttgg cgctgtc                                                   17

Claims (23)

1.生产分泌多肽的方法,包括:
(a)在有利于生产所述多肽的培养基中培养真菌宿主细胞,其中所述真菌宿主细胞包含核酸构建体,该核酸构建体包含与编码所述多肽的第二核苷酸序列可操作相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列对第二核苷酸序列来说是外源的,第一核苷酸序列的3`端紧邻第二核苷酸序列起始密码子的上游,所述第一核苷酸序列选自下组:
SEQ ID NO:36所示的序列,或编码SEQ ID NO:37的核苷酸序列,其中由于遗传密码的简并性而不同于SEQ ID NO:36的核苷酸序列;和
(b)从培养基中分离所述的分泌多肽,
在相同的生产条件下培养时,相对于包含与编码多肽的第二核苷酸序列可操作的天然相连的天然信号肽序列的真菌细胞,所述真菌宿主细胞生产的分泌多肽至少多约25%。
2.权利要求1的方法,其中第一核苷酸序列编码信号肽,该信号肽由SEQID NO:37的氨基酸序列组成。
3.权利要求1的方法,其中第一核苷酸序列由SEQ ID NO:36组成。
4.权利要求1的方法,其中第一核苷酸序列包含于Humicola insolensDSM 1800的葡聚糖内切酶V基因中。
5.权利要求1的方法,其中第二核苷酸序列编码多肽,该多肽对于真菌宿主细胞来说是天然的或异源的。
6.权利要求1的方法,其中所述真菌宿主细胞包含一个或多个拷贝的第二核苷酸序列。
7.权利要求1的方法,其中所述多肽是激素或者激素变异体、酶、受体或其一部分、抗体或其一部分、或者报告蛋白。
8.权利要求7的方法,其中所述酶是氧化还原酶、转移酶、水解酶、裂解酶、异构酶、或连接酶。
9.权利要求8中的方法,其中所述酶是葡聚糖内切酶、纤维二糖水解酶、或β-葡糖苷酶。
10.权利要求1的方法,其中所述多肽是β-葡糖苷酶。
11.权利要求1的方法,其中所述真菌宿主细胞是丝状真菌或酵母细胞。
12.权利要求1的方法,其中所述核酸构建体进一步包含与第一和第二核苷酸序列可操作相连的启动子。
13.权利要求12的方法,其中所述启动子选自下组:里氏木霉纤维二糖水解酶I基因启动子、里氏木霉纤维二糖水解酶II基因启动子、里氏木霉木聚糖酶I基因启动子、里氏木霉木聚糖酶II基因启动子、或里氏木霉β-木糖苷酶基因启动子。
14.权利要求1的方法,在相同的生产条件下培养时,相对于包含与编码多肽的第二核苷酸序列可操作的天然相连的天然信号肽序列的真菌宿主细胞,所述真菌宿主细胞生产的分泌多肽至少多约50%。
15.权利要求14的方法,在相同的生产条件下培养时,相对于包含与编码多肽的第二核苷酸序列可操作的天然相连的天然信号肽序列的真菌宿主细胞,所述真菌宿主细胞生产的分泌多肽至少多约75%。
16.权利要求15的方法,在相同的生产条件下培养时,相对于包含与编码多肽的第二核苷酸序列可操作的天然相连的天然信号肽序列的真菌宿主细胞,所述真菌宿主细胞生产的分泌多肽至少多约100%。
17.权利要求16的方法,在相同的生产条件下培养时,相对于包含与编码多肽的第二核苷酸序列可操作的天然相连的天然信号肽序列的真菌宿主细胞,所述真菌宿主细胞生产的分泌多肽至少多约200%。
18.权利要求17的方法,在相同的生产条件下培养时,相对于包含与编码多肽的第二核苷酸序列可操作的天然相连的天然信号肽序列的真菌宿主细胞,所述真菌宿主细胞生产的分泌多肽至少多约300%。
19.权利要求18的方法,在相同的生产条件下培养时,相对于包含与编码多肽的第二核苷酸序列可操作的天然相连的天然信号肽序列的真菌细胞,所述真菌宿主细胞生产的分泌多肽至少多约400%。
20.核酸构建体,该核酸构建体包含与编码多肽的第二核苷酸序列可操作相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列对第二核苷酸序列来说是外源的,第一核苷酸序列的3`端紧邻第二核苷酸序列起始密码子的上游,所述第一核苷酸序列选自下组:
SEQ ID NO:36所示的序列,或编码SEQ ID NO:37的氨基酸序列的核苷酸序列,但由于遗传密码的简并性而不同于SEQ ID NO:36的核苷酸序列。
21.权利要求20的核苷酸构建体,其中第一核苷酸序列包含于Humicolainsolens DSM 1800中所含的葡聚糖内切酶V基因中。
22.包含权利要求20的核酸构建体的重组表达载体。
23.包含权利要求20的核酸构建体的重组宿主细胞。
CN2004800190693A 2003-05-02 2004-04-30 制备分泌型多肽的方法 Expired - Fee Related CN1836038B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US46776603P 2003-05-02 2003-05-02
US60/467,766 2003-05-02
PCT/US2004/013711 WO2004111228A1 (en) 2003-05-02 2004-04-30 Methods for producing secreted polypeptides

Publications (2)

Publication Number Publication Date
CN1836038A CN1836038A (zh) 2006-09-20
CN1836038B true CN1836038B (zh) 2011-04-06

Family

ID=33551405

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800190693A Expired - Fee Related CN1836038B (zh) 2003-05-02 2004-04-30 制备分泌型多肽的方法

Country Status (8)

Country Link
US (4) US7393664B2 (zh)
EP (1) EP1625219B1 (zh)
CN (1) CN1836038B (zh)
AT (1) ATE478140T1 (zh)
DE (1) DE602004028724D1 (zh)
DK (1) DK1625219T3 (zh)
ES (1) ES2350903T3 (zh)
WO (1) WO2004111228A1 (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005047499A1 (en) * 2003-10-28 2005-05-26 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
WO2005100582A2 (en) 2004-03-25 2005-10-27 Novozymes Inc. Methods for degrading or converting plant cell wall polysaccharides
EP1885868A4 (en) * 2005-05-19 2009-03-11 Novozymes North America Inc PREPARATION OF ENZYMES
WO2008000715A1 (en) * 2006-06-26 2008-01-03 Dsm Ip Assets B.V. High throughput transfection of filamentous fungi
EP2046819B1 (en) 2006-07-21 2015-03-18 Novozymes, Inc. Methods of increasing secretion of polypeptides having biological activity
BRPI0817474B1 (pt) * 2007-09-28 2018-04-24 Novozymes A/S Célula hospedeira microbiana transgênica, construção de ácido nucleico, vetor de expressão, composição detergente, e, métodos para produzir uma proteína, para degradar ou converter um material celulósico, e para produzir um produto de fermentação
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
EP2397491A1 (en) 2010-06-21 2011-12-21 Technische Universität Wien LeaA from Trichoderma reesei
CN103180442A (zh) * 2010-11-05 2013-06-26 旭硝子株式会社 裂殖酵母属酵母的转化体及其制造方法
US9476036B2 (en) 2011-08-24 2016-10-25 Novozymes, Inc. Cellulolytic enzyme compositions and uses thereof
CN103184159B (zh) * 2011-12-27 2016-09-21 丰益(上海)生物技术研发中心有限公司 紧密枝顶孢霉菌株及其特异性脂肪酶
EP2708553A1 (en) 2012-09-18 2014-03-19 Technische Universität Wien Modified fungal cell
CN105229141A (zh) 2013-03-15 2016-01-06 拉勒曼德匈牙利流动管理有限责任公司 用于木质纤维素和相关低聚物的水解的β-葡糖苷酶的表达
WO2015081139A1 (en) 2013-11-26 2015-06-04 Novozymes A/S Enzyme compositions and uses thereof
EP3152315B1 (en) 2014-06-06 2018-08-15 Novozymes A/S Enzyme compositions and uses thereof
US10385352B2 (en) 2015-03-09 2019-08-20 Novozymes A/S Methods of introducing multiple expression constructs into a eukaryotic cell
CN104975039B (zh) * 2015-06-24 2018-05-11 方诩 一种重组质粒及其在降解纤维素原料中的应用
WO2017073716A1 (ja) * 2015-10-30 2017-05-04 サントリーホールディングス株式会社 Aobgl3ホモログを用いたステビオール配糖体およびステビオールの製造方法
WO2017073717A1 (ja) * 2015-10-30 2017-05-04 サントリーホールディングス株式会社 Aobgl1ホモログを用いたステビオール配糖体およびステビオールの製造方法
CN110100011A (zh) 2016-11-21 2019-08-06 诺维信公司 Dna分子的酵母细胞提取物辅助构建
CN110114455A (zh) * 2016-12-27 2019-08-09 国立大学法人鹿儿岛大学 真菌中蛋白质的选择性分泌技术
WO2020106600A1 (en) * 2018-11-19 2020-05-28 Basf Se Leader sequence for yeast
CN110669123B (zh) * 2019-09-03 2020-10-13 南京市妇幼保健院 一种分泌型内源性多肽pdff-co3及其应用
CN111378674B (zh) * 2020-03-25 2021-09-10 中国科学院天津工业生物技术研究所 异宗毁丝霉糖化酶MhglaA及其编码基因和在葡萄糖生产中的应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6159720A (en) * 1996-07-24 2000-12-12 Meiji Seika Kaisha, Ltd. Enzyme endoglucanase and cellulase preparations containing the same

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4220721A (en) * 1979-04-27 1980-09-02 University Of Arkansas Foundation Method for enzyme reutilization
DK187280A (da) * 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
AU639570B2 (en) * 1990-05-09 1993-07-29 Novozymes A/S A cellulase preparation comprising an endoglucanase enzyme
US5861271A (en) * 1993-12-17 1999-01-19 Fowler; Timothy Cellulase enzymes and systems for their expressions
US6015703A (en) * 1998-03-10 2000-01-18 Iogen Corporation Genetic constructs and genetically modified microbes for enhanced production of beta-glucosidase

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6159720A (en) * 1996-07-24 2000-12-12 Meiji Seika Kaisha, Ltd. Enzyme endoglucanase and cellulase preparations containing the same

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘坚.蛋白质的分泌与信号肽.生命的化学 6.1988,(6),第21-22页,表1-2.
陈永青
陈永青;刘坚.蛋白质的分泌与信号肽.生命的化学 6.1988,(6),第21-22页,表1-2. *

Also Published As

Publication number Publication date
DK1625219T3 (da) 2010-11-01
US7393664B2 (en) 2008-07-01
ES2350903T3 (es) 2011-01-28
US20140011262A1 (en) 2014-01-09
WO2004111228A1 (en) 2004-12-23
US20080268526A1 (en) 2008-10-30
ATE478140T1 (de) 2010-09-15
DE602004028724D1 (de) 2010-09-30
US20120122191A1 (en) 2012-05-17
US8497115B2 (en) 2013-07-30
EP1625219A1 (en) 2006-02-15
CN1836038A (zh) 2006-09-20
EP1625219B1 (en) 2010-08-18
US20040248258A1 (en) 2004-12-09
EP1625219A4 (en) 2007-09-05

Similar Documents

Publication Publication Date Title
CN1836038B (zh) 制备分泌型多肽的方法
US9873881B2 (en) Promoter variants for expressing genes in a fungal cell
DE69838106T2 (de) Expressionsklonierung in filamentösen pilzen
CN102227502B (zh) 在镶片镰孢的酶缺陷突变体中产生多肽的方法
CN102224245A (zh) 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
CN102414323A (zh) 用于生产感兴趣的重组多肽的方法
CN104395454A (zh) 改善的真菌选择
CN101679993A (zh) 适于选择产生目标多肽的文库克隆的表达克隆方法
CN103596970A (zh) 载体-宿主系统
CN104838003A (zh) Rasamsonia转化体
FI111958B (fi) Menetelmä tuottaa/erittää proteiinia transformoidun homeen avulla käyttämällä Aspergilluksen endoksylanaasi II-geenistä saatuja ekspressioita/erittämistä sääteleviä alueita
US9701970B2 (en) Promoters for expressing genes in a fungal cell
US20130109055A1 (en) Use of mammalian promoters in filamentous fungi
CN103339259B (zh) 用于在真菌细胞中表达基因的启动子
CN113316641A (zh) 串联蛋白表达
LUU Novel high-throughput approaches for transforming and improving filamentous fungus Trichoderma reesei using a droplet-based microfluidic platform
CN113736672A (zh) 一种能够大量表达南极假丝酵母脂肪酶b的黑曲霉重组菌株及其构建方法及应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110406

Termination date: 20160430