CN107075451A - 丝状真菌双重突变体宿主细胞 - Google Patents

丝状真菌双重突变体宿主细胞 Download PDF

Info

Publication number
CN107075451A
CN107075451A CN201580058541.2A CN201580058541A CN107075451A CN 107075451 A CN107075451 A CN 107075451A CN 201580058541 A CN201580058541 A CN 201580058541A CN 107075451 A CN107075451 A CN 107075451A
Authority
CN
China
Prior art keywords
leu
gly
ser
ala
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580058541.2A
Other languages
English (en)
Inventor
宇田川裕晃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN107075451A publication Critical patent/CN107075451A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01183Alpha-1,3-glucan synthase (2.4.1.183)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及产生感兴趣的多肽的突变体丝状真菌宿主细胞,其中编码涉及α‑葡聚糖合成的两种或更多种多肽的两种或更多种多核苷酸是灭活的;涉及在所述突变体中多肽产生的方法,连同涉及构建此类突变体的方法。

Description

丝状真菌双重突变体宿主细胞
参照序列表
本申请包含计算机可读形式的序列表,将其通过引用结合在此。
发明背景
已经披露了用于通过细胞壁胁迫诱导的启动子来驱动报告子蛋白的表达,鉴别在丝状真菌中的抗真菌化合物的报告子系统;一种此类诱导的启动子是黑曲霉agsA启动子;提供了使用简并引物的全长agsA基因的克隆,连同ags-同系物从其他真菌中的分离(WO03/020922)。还已经描述了黑曲霉中的agsA的灭活(戴姆维尔德R(Damveld R.)等人,2004,诱导agsA,黑曲霉中的五个1,3-α-D-葡聚糖合酶-编码基因的中的一个,响应细胞壁胁迫的表达(Expression of agsA,one of five 1,3-alpha-D-glucan synthase-encodinggenes in Aspergillus niger,is induced in response to cell wall stress),真菌遗传学和生物学(Fungal Genetics and Biology)42(2005)165-177)。
还披露了在五个1,3-α-D-葡聚糖合酶-编码基因中的另一个,agsE中的黑曲霉突变体缺陷;报道在此类突变体中的葡糖氧化酶、磷脂酶A2、和脂肪酶表达是改进的(WO2014/013074)。
发明领域
本发明涉及丝状真菌表达宿主,其中涉及α-葡聚糖合成的两种或更多种多肽是灭活的。
发明概述
本发明的诸位发明人对提高感兴趣的酶的生产力感到有兴趣,并且发现与文献中已经报道的内容相反,黑曲霉的AgsA-或AgsE-灭活的单个突变体提供了它们测试的蛋白酶的更低表达(以下示出)。然而,令他们惊讶的是,双重突变体提供了显著增加的蛋白酶表达(以下示出)。
因此,在第一个方面,本发明涉及产生感兴趣的多肽的突变体丝状真菌宿主细胞,其中编码涉及α-葡聚糖合成的两种或更多种多肽的两种或更多种多核苷酸是灭活的,所述的两种或更多种多肽选自下组,该组由以下各项组成:
(a)涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:3的黑曲霉AgsA多肽的氨基酸序列具有至少70%序列一致性的氨基酸序列,以及涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:6的黑曲霉AgsE多肽具有至少70%序列一致性的氨基酸序列;
(b)涉及α-葡聚糖合成的多肽,该多肽由以下项编码:
(i)包括与SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列具有至少70%序列一致性的核苷酸序列的基因组多核苷酸,以及涉及α-葡聚糖合成的多肽,该多肽由包括与SEQID NO:4的黑曲霉agsE基因组核苷酸序列具有至少70%序列一致性的核苷酸序列的基因组多核苷酸编码,或
(ii)分别示出在SEQ ID NO:2和SEQ ID NO:5中的(i)的cDNA核苷酸序列;和
(c)涉及α-葡聚糖合成的两种多肽,这些多肽由在中严格条件下与以下项杂交的多核苷酸编码:
(I)分别是,SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列,和SEQ ID NO:4中的黑曲霉agsE基因组核苷酸序列;
(II)分别是,在SEQ ID NO:2和SEQ ID NO:5中示出的(I)的cDNA核苷酸序列,或
(III)(I)或(II)的全长互补体。
在第二个方面,本发明涉及在突变体丝状真菌宿主细胞中产生感兴趣的多肽的方法,所述方法包括以下的步骤:
(a)在有助于感兴趣的多肽的产生的条件下,培养如在本发明的第一个方面中定义的突变体丝状真菌宿主细胞;并且,任选地,
(b)回收这一感兴趣的多肽。
在第三个方面,本发明涉及构建突变的丝状真菌宿主细胞的方法,所述方法包括分别地将编码两种或更多种多肽的在丝状真菌宿主细胞中的两种或更多种多核苷酸灭活,这些多肽选自下组,该组由以下各项组成:
(a)涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:3的黑曲霉AgsA多肽的氨基酸序列具有至少70%序列一致性的氨基酸序列,以及涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:6的黑曲霉AgsE多肽具有至少70%序列一致性的氨基酸序列;
(b)涉及α-葡聚糖合成的多肽,该多肽由以下项编码:
(i)包括与SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列具有至少70%序列一致性的核苷酸序列的基因组多核苷酸,以及涉及α-葡聚糖合成的多肽,该多肽由包括与SEQID NO:4的黑曲霉agsE基因组核苷酸序列具有至少70%序列一致性的核苷酸序列的基因组多核苷酸编码,或
(ii)分别示出在SEQ ID NO:2和SEQ ID NO:5中的(i)的cDNA核苷酸序列;和
(c)涉及α-葡聚糖合成的两种多肽,这些多肽由在中严格条件下与以下项杂交的多核苷酸编码:
(I)分别是,SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列,和SEQ ID NO:4中的黑曲霉agsE基因组核苷酸序列;
(II)分别是,在SEQ ID NO:2和SEQ ID NO:5中示出的(I)的cDNA核苷酸序列,或
(III)(I)或(II)的全长互补体。
附图简要说明
图1示出了在以下实例中采用的菌株构建策略的图表。
图2示出了质粒pHUda1685的示意图。
图3示出了质粒pHUda1701的示意图。
图4示出了质粒pHUda1657的示意图。
图5示出了质粒pHUda1694的示意图。
定义
cDNA:术语“cDNA”意指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录物本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由一个开放阅读框架决定,该开放阅读框架从一个起始密码子(如ATG、GTG或TTG)开始并且以一个终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
核酸构建体:术语“核酸构建体”意指单-链或双-链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成包含核酸的区段,或是合成的,该核酸分子包括一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下配置,其中控制序列相对于多核苷酸的编码序列放置在适当位置,以使得控制序列指导编码序列的表达。
控制序列:术语“控制序列”是指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导子、多腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。
表达:术语“表达”包括涉及多肽的产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰以及分泌。
表达载体:术语“表达载体”意指直链或环状DNA分子,该分子包括编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
宿主细胞:术语“宿主细胞”意指易于用包括本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质;(2)至少部分地从一个或多个或所有与它在自然界中相关的天然存在的成分中除去的任何物质,包括但不限于,任何酶、变体、核酸、蛋白质、肽或辅因子,也就是;(3)相对于在自然界中发现的物质经过人为改变的任何物质;或(4)相对于与它天然相关联的其它组分通过增加该物质的量(例如,在宿主细胞中的重组生产;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关联的启动子更强的启动子)而改变的任何物质。
非常高严格条件:术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在70℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
高严格条件:术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并且变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在65℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
中-高严格条件:术语“中高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在60℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
中严格条件:术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在55℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
低严格条件:术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下于5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA以及25%甲酰胺中预杂交和杂交12至24小时。最后在50℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
非常低严格条件:术语“非常低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在45℃下使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
序列一致性:两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“序列一致性”描述。
出于本发明的目的,使用尼德尔曼-翁施算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)确定两个氨基酸序列之间的序列一致性,如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件包(EMBOSS:TheEuropean Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)的尼德尔(Needle)程序,优选地5.0.0版或更新版本中所执行的。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长一致性”的Needle输出(使用-nobrief选项获得)用作百分比一致性并且是如下计算的:
(一致的残基X 100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用尼德曼-翁施算法(尼德曼(Needleman)和翁施(Wunsch),1970,见上文)来确定两个脱氧核苷酸序列之间的序列一致性,该算法如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,赖斯(Rice)等人,2000,见上文)(优选5.0.0版或更新版本)的尼德尔程序所实施的。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将标记为“最长一致性”的Needle输出(使用-nobrief选项获得)用作百分比一致性并且是如下计算的:
(一致的脱氧核糖核苷酸×100)/(比对长度-比对中的空位总数)
涉及α-葡聚糖合成:术语“涉及α-葡聚糖合成”意指意指因此涉及编码参与α-葡聚糖(尤其是α-D-葡聚糖)的合成的酶的多核苷酸。在本发明的背景下,优选的编码的多肽是1,3α-D-葡聚糖合酶,最优选地是来自黑曲霉的AgsA和AgsE,或它们的等位基因同系物或变体。
发明详述
如上述总结中已经概述的,本发明的第一个方面涉及产生感兴趣的多肽的突变体丝状真菌宿主细胞,其中编码涉及α-葡聚糖合成的两种或更多种多肽的两种或更多种多核苷酸是灭活的,第二个方面涉及在如在第一个方面中定义的突变体宿主细胞中产生感兴趣的多肽的方法,并且第三个方面涉及构建突变体丝状真菌宿主细胞的方法。
本发明的所有方面需要将编码涉及α-葡聚糖合成的两种或更多种多肽的两种或更多种多核苷酸的丝状真菌宿主细胞灭活,所述的两种或更多种多肽选自下组,该组由以下各项组成:
(a)涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:3的黑曲霉AgsA多肽的氨基酸序列具有至少60%序列一致性的氨基酸序列,和涉及α-葡聚糖合成的的多肽,该多肽包括与SEQ ID NO:6的黑曲霉AgsE多肽具有至少70%序列一致性的氨基酸序列;优选地,每个多肽分别与SEQ ID NO:3或SEQ ID NO:6具有至少65%,例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。在一方面,该多肽分别与SEQ IDNO:3或SEQ ID NO:6的多肽具有多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸的差异。氨基酸改变可以具有次要性质,即不显著影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;小缺失,小的氨基的、或羧基的末端延伸,如氨基末端蛋氨酸残基;小接头肽;或通过改变净电荷或另一功能来促进纯化的小延伸,如多组氨酸序列(poly histidine tract)、抗原性表位或结合结构域;
(b)涉及α-葡聚糖合成的多肽,该多肽由以下项编码:
(i)包括核苷酸序列的基因组多核苷酸,该核苷酸序列与SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列具有至少60%序列一致性,和涉及α-葡聚糖合成的多肽,该多肽由基因组多核苷酸编码,该基因组多核苷酸包括与SEQ ID NO:4中的黑曲霉agsE基因组核苷酸序列具有至少60%序列一致性的核苷酸序列;优选地每个基因组多核苷酸分别与SEQ IDNO:1或SEQ ID NO:4具有,至少65%,例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。在一方面,该多核苷酸分别与SEQ ID NO:1或SEQ ID NO:4的多核苷酸具有多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)核苷酸的差异。
(ii)(i)的cDNA核苷酸序列,其与SEQ ID NO:2中的黑曲霉agsA cDNA核苷酸序列具有至少60%序列一致性,和涉及α-葡聚糖合成的多肽,该多肽由多核苷酸编码,该多核苷酸包括包括与SEQ ID NO:5中的黑曲霉agsE cDNA核苷酸序列具有至少60%序列一致性的核苷酸序列;优选地每个cDNA多核苷酸分别与SEQ ID NO:2或SEQ ID NO:5具有至少65%,例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。在一方面,该多核苷酸分别与SEQ ID NO:2或SEQ ID NO:5的多核苷酸具有多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)核苷酸的差异;和
(c)涉及α-葡聚糖合成的两种多肽,这些多肽由多核苷酸编码,这些多核苷酸在非常低、低、中、中-高、高、或非常高严格条件下与以下项杂交:
(I)分别是,SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列,和SEQ ID NO:4中的黑曲霉agsE基因组核苷酸序列;
(II)分别是,在SEQ ID NO:2和SEQ ID NO:5中示出的(I)的cDNA核苷酸序列,或
(III)(I)或(II)的全长互补体。(萨拉布鲁克(Sambrook)等人,1989,分子克隆:实验室手册(MolecularCloning,A Laboratory Manual),第2版,冷泉港,纽约)。
在本发明优选的实施例中,两种或更多种多核苷酸编码涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:3的黑曲霉AgsA多肽的氨基酸序列具有至少70%序列一致性的氨基酸序列或其等位基因变体,或由它们组成,以及涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:6的黑曲霉AgsE多肽具有至少70%序列一致性的氨基酸序列或其等位基因变体,或由它们组成。在另一个实施例中,该多肽包括SEQ ID NO:3或SEQ ID NO:6的成熟多肽,或由它们组成。
SEQ ID NO:1或SEQ ID NO:2的多核苷酸或其子序列、和SEQ ID NO:3的多肽或其片段,连同SEQ ID NO:4或SEQ ID NO:5的多核苷酸或其子序列,以及SEQ ID NO:6的多肽或其片段,可以用于根据本领域熟知的方法,设计核酸探针来鉴定和克隆编码涉及α-葡聚糖合成的多肽的多核苷酸,这些多肽来自不同的属或种的菌株。具体而言,此类探针可以用于按照标准DNA印迹程序与感兴趣的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中相应的基因。此类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,核酸探针具有至少100个核苷酸长度,例如至少200个核苷酸长度、至少300个核苷酸长度、至少400个核苷酸长度、至少500个核苷酸长度、至少600个核苷酸长度、至少700个核苷酸长度、至少800个核苷酸长度、或至少900个核苷酸长度。DNA和RNA探针二者均可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以检测相应的基因。本发明涵盖此类探针。
可以针对与以上描述的探针杂交并且编码涉及α-葡聚糖合成的多肽的DNA对从这类其他菌株制备的基因组DNA或cDNA库进行筛选。来自此类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳、或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他适合的载体材料上。为了鉴定克隆或杂交的DNA,然后将载体材料用于DNA印迹。
出于本发明的目的,杂交指示多核苷酸在非常低至非常高严格条件下与标记的核酸探针杂交,所述标记的核酸探针对应于(i)SEQ ID NO:1或SEQ ID NO:4;(ii)SEQ ID NO:1或SEQ ID NO:4的多肽编码序列;(iii)在SEQ ID NO:2或SEQ ID NO:5中示出的其cDNA序列;(iv)其全长互补体;或(v)其子序列。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下核酸探针杂交的分子。
保守氨基酸取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及蛋氨酸)。通常不改变比活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(H.Neurath)和R.L.希尔(R.L.Hill),1979,在蛋白质(TheProteins),学术出版社(Academic Press),纽约(New York)中进行描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
可以做出单个或多个氨基酸取代、缺失和/或插入并且使用已知的诱变、重组和/或改组方法进行测试,随后进行有关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,罗曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向诱变(德比舍尔(Derbyshire)等人,1986,基因(Gene)46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的诱变多肽的活性(奈斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。可以从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。
多核苷酸
本发明还涉及编码涉及α-葡聚糖合成的多肽的多核苷酸的灭活,如在此所述。
用于分离或克隆多核苷酸的技术在本领域中是已知的,并包括从基因组DNA或cDNA,或其组合分离。可以例如通过使用熟知的聚合酶链反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段,实现从基因组DNA克隆多核苷酸。参见,例如英尼斯(Innis)等人,1990,PCR:方法和应用指南(PCR:A Guide to Methods andApplication),学术出版社(Academic Press),纽约(New York)。可以使用其他核酸扩增程序例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以由曲霉属菌株或相关有机体克隆,并且因此,例如可以是该多核苷酸的多肽编码区的等位基因或种变体。
修饰编码本发明的多肽的多核苷酸对于合成与所述多肽基本上类似的多肽可为必需的。术语“实质上类似”于该多肽是指该多肽的非天然发生的形式。这些多肽可能以某种工程化方式而不同于从其天然来源分离的多肽,例如在比活性、热稳定性、最优pH等方面不同的变体。这些变体可以基于以SEQ ID NO:1或SEQ ID NO:4的多肽编码序列形式呈现的多核苷酸,或基于SEQ ID NO:2或SEQ ID NO:5中的其cDNA(例如其子序列),和/或通过引入不会导致该多肽的氨基酸序列改变,但对应于预期用于产生该酶的宿主有机体的密码子使用的核苷酸取代,或通过引入可能产生不同氨基酸序列的核苷酸取代来构建。对于核苷酸取代的一般描述,参见例如福德(Ford)等人,1991,蛋白质表达与纯化(ProteinExpression and Purification)2:95-107。
编码多肽的多核苷酸的灭活或去除
本发明的不同方面和实施例都需要编码两种或更多种多肽的两种或更多种多核苷酸的灭活,这些多肽涉及丝状真菌宿主细胞中的α-葡聚糖合成。
此类灭活可通过破坏或缺失编码本发明的多肽的多核苷酸或其一部分而实现,当在相同的条件下培养时,这导致突变体细胞产生少于亲本细胞的多肽。
可以使用本领域熟知的方法通过消除该多核苷酸的表达来构建突变体细胞,例如插入、破坏、替换、或缺失。在一个优选的方面,该多核苷酸是灭活的。要灭活的多核苷酸可以是,例如,对于活性所必需的编码区或其一部分,或编码区表达所需的调节元件。此类调节或控制序列的实例可以是启动子序列或其功能部分,即足以影响多核苷酸表达的部分。用于可能的灭活的其他控制序列包括,但不限于前导子、多腺苷酸环化序列、前肽序列、信号肽序列、转录终止子、和转录激活因子。
通过使亲本细胞经受诱变,并且选择其中已经消除多核苷酸的表达的突变体细胞来进行多核苷酸的灭活。诱变可能是特异性的或随机的,可以通过例如使用适合的物理或化学诱变剂进行,通过使用适合的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,诱变可通过使用这些诱变剂的任意组合来进行。
适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射,羟胺,N-甲基-N’-硝基-N-亚硝基胍(MNNG),邻-甲基羟胺,亚硝酸,乙基甲磺酸(EMS),亚硫酸氢钠,甲酸和核苷酸类似物。
当使用这些试剂时,通常通过如下方法来进行所述诱变:在适合条件下存在优选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示无基因表达的突变体细胞。
该多核苷酸的灭活可以通过在基因中或在其转录或翻译所需的调控元件中插入、取代、或缺失一个或多个核苷酸来完成。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。这些灭活可根据本领域已知的方法通过定点诱变或PCR产生的诱变来完成。尽管原则上,灭活可以在体内进行,即直接在表达待灭活的多核苷酸的细胞上进行,但如下示例优选在体外进行。
消除多核苷酸表达的方便方法的一个实例是基于基因置换、基因缺失、或基因破坏的技术。例如,在基因破坏方法中,将对应于内源多核苷酸的核酸序列在体外进行诱变以产生缺陷的核酸序列,然后将其转化到亲本细胞中以产生缺陷基因。通过同源重组,该缺陷的核酸序列替换内源多核苷酸。令人希望的是,缺陷的多核苷酸还编码可用于选择其中该多核苷酸已经被修饰或破坏的转化体的标记。在一方面,用例如在此描述的那些选择性标记来破坏该多核苷酸。
本发明进一步涉及在编码该多肽的多核苷酸或其控制序列或编码该多肽的沉默基因中包含破坏或缺失的亲本细胞的突变体细胞,这导致与亲本细胞相比,该突变体细胞产生的多肽少或不产生多肽。
这些多肽缺陷型突变体细胞作为用于原生和异源多肽的表达的宿主细胞尤其有用。因此,本发明进一步涉及产生天然或异源多肽的方法,包括(a)在有益于产生该多肽的条件下培养该突变体细胞;并且(b)回收该多肽。术语“异源多肽”是指对该宿主细胞来说不是原生的多肽,例如天然蛋白质的变体。该宿主细胞可以包括多于一个拷贝的编码该原生或异源多肽的多核苷酸。
在本发明的一个优选的实施例中,两种或更多种多核苷酸的灭活是通过两种或更多种多核苷酸和/或它们各自的启动子的突变;优选地是通过两种或更多种多核苷酸和/或它们各自的启动子从宿主细胞的基因组部分或完全缺失来进行的。
核酸构建体
本发明还涉及包含编码根据本发明的感兴趣的多肽的、可操作地连接至一个或多个控制序列上的多核苷酸的核酸构建体,该一个或多个控制序列在与控制序列相容的条件下指导编码序列在适合的宿主细胞中的表达。
该多核苷酸可以按多种方式操纵,以提供感兴趣的多肽的表达。取决于表达载体,在多核苷酸插入载体之前操作多核苷酸可能是令人希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
该控制序列可以是启动子,即,被宿主细胞识别以对编码本发明的多肽的多核苷酸进行表达的多核苷酸。启动子包含介导多肽表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变、截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的适合启动子的实例是从以下各项的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、以及里氏木霉翻译延长因子,以及NA2tpi启动子(一种修饰的启动子,其来自曲霉属中性α-淀粉酶基因,其中未翻译的前导子由曲霉属丙糖磷酸异构酶基因的未翻译的前导子替代;非限制性实例包括修饰的启动子,其来自黑曲霉中性α-淀粉酶的基因,其中未翻译的前导子由构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导子替代);以及其突变型启动子、截短型启动子、以及杂合型启动子。其他启动子描述于美国专利号6,011,147中。
控制序列还可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3’-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。
用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
该控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域,它增加该基因的表达。
该控制序列还可以是前导子,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导子可操作地连接到编码该多肽的多核苷酸的5’-末端。可以使用在宿主细胞中起作用的任何前导子。
用于丝状真菌宿主细胞的优选前导子是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
控制序列还可以是聚腺苷酸化序列,可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将聚腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因中获得的:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖镰孢胰蛋白酶样蛋白酶。
控制序列也可以是编码信号肽的信号肽编码区,其中所述信号肽与多肽的N-末端连接并且指导多肽进入细胞的分泌途径。多核苷酸的编码序列的5'-末端可以内在地包含在翻译阅读框中与编码多肽的编码序列的区段天然连接的信号肽编码序列。可替代地,编码序列的5’-末端可以包含相对于编码序列为外来的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外来信号肽编码序列。可替代地,外来信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于丝状真菌宿主细胞的有效信号肽编码序列是从黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶的基因获得的信号肽编码序列。
控制序列也可以是编码位于多肽N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下各项的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及酿酒酵母α-因子。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列定位成紧邻多肽的N-末端并且该信号肽序列定位成紧邻该前肽序列的N-末端。
也可能令人希望的是添加调节序列,所述调节序列调节相对于宿主细胞的生长的多肽的表达。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是那些允许基因扩增的序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列可操作地连接。
在本发明的优选地实施例中,感兴趣的多肽是与宿主细胞同源或异源的;优选地,感兴趣的多肽是分泌多肽;更优选地,它是激素、酶、受体或其一部分、抗体或其一部分、或报告子;甚至更优选地,感兴趣的多肽是水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;并且最优选地,感兴趣的多肽是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、碳水化物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
表达载体
本发明还涉及包含编码如在此定义的感兴趣的多肽的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。各种核苷酸和控制序列可以连接在一起以产生重组表达载体,所述重组表达载体可以包含一个或多个合宜的限制性位点以允许在这样的位点插入或取代编码多肽的多核苷酸。可替代地,该多核苷酸可以通过将该多核苷酸或包括该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。
重组表达载体可以是可便利地经受重组DNA程序并且可引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是一种线性的或闭合的环状质粒。
载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可包含任何用以保证自我复制的要素。可替代地,该载体可以是这样载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入到宿主细胞的基因组中的总DNA)或转座子。
该载体优选包含允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶),连同其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。在木霉属细胞中优选使用的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统。在一方面中,双选择性标记是hph-tk双选择性标记系统。
载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合的元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。在另一方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,该载体可以进一步包括使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO 00/24883中的方法完成。
可以将本发明的多核苷酸的多于一个的拷贝插入到宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。
用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,同上)。
宿主细胞
本发明还涉及重组宿主细胞,这些宿主细胞包含可操作地连接到一个或多个控制序列的本发明的多核苷酸,这些控制序列指导本发明的多肽的产生。将包括多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。
突变体丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
真菌细胞可以通过下述过程转化,所述过程涉及原生质体形成、原生质体的转化、以及以本身已知的方式的细胞壁的再生。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法在马拉迪耶(Malardier)等人,1989,基因(Gene)78:147-156和WO 96/00787中描述。
生产方法
本发明还涉及产生本发明多肽的方法,所述方法包括:(a)将如在本发明的第一个或第三个方面定义的重组的或突变的体丝状真菌宿主细胞在有助于产生该多肽的条件下培养;并且任选地,(b)回收该多肽。
这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的一种营养培养基中培养的。例如,可以通过摇瓶培养、或在实验室或工业发酵罐中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞,所述培养在适合的培养基中并且在允许表达和/或分离多肽的条件下进行。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包括碳和氮来源及无机盐。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽分泌到该营养培养基中,那么可直接从培养基中回收多肽。如果多肽不分泌,那么其可从细胞裂解液中进行回收。
可以使用特异性针对这些多肽的本领域已知的方法来检测该多肽。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定该多肽的活性。
可以使用本领域已知的方法来回收多肽。例如,该多肽可以通过常规程序,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从该营养培养基回收。在一方面,回收包含该多肽的发酵液。
可以通过本领域已知的多种方法纯化多肽,所述方法包括但不限于色谱(例如,离子交换色谱法、亲和色谱法、疏水色谱法、聚焦色谱法和大小排阻色谱法)、电泳方法(例如,制备性等电聚焦)、差异性溶解(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,蛋白质纯化(Protein Purification),编者詹森(Janson)和赖登(Ryden),VCH出版公司,纽约,1989),以便获得基本上纯的多肽。
在替代性方面,不回收多肽,而是使用表达该多肽的本发明宿主细胞作为多肽的来源。
用于培养和回收感兴趣的产物的方法可以通过本领域已知的方法进行。
实例
黑曲霉α-葡聚糖合酶基因和基因产物
黑曲霉α-葡聚糖合酶(agsA)基因示出在SEQ ID NO:1(基因组DNA)和SEQ ID NO:2(cDNA)中。编码的AgsA合酶的氨基酸示出在SEQ ID NO:3中。
黑曲霉α-葡聚糖合酶(agsE)基因示出在SEQ ID NO:4(基因组DNA)和SEQ ID NO:5(cDNA)中。编码的AgsA合酶的氨基酸示出在SEQ ID NO:6中。
材料与方法
分子克隆技术描述于萨姆布鲁克,J.(Sambrook,J.),弗里奇,E.F(Fritsch,E.F.),马尼亚蒂斯,T(Maniatis,T.)(1989)分子克隆:实验手册(Molecular cloning:alaboratory manual)(第2版)冷泉港实验室(Cold Spring Harbor Laboratory),冷泉港(Cold Spring Harbor),纽约。
用于DNA操作的酶(例如限制性内切核酸酶,连接酶等)可获得自新英格兰生物实验室公司(New England Biolabs,Inc.),并且根据制造商的说明书使用。
培养基和溶液
AMG痕量金属溶液由0.3g柠檬酸、0.68g ZnCl2、0.25g CuSO4·5H2O、0.024gNiCl2·6H2O、1.39g FeSO4·7H2O、1.356g MnSO4·5H2O组成,并且添加去离子水至1升。
COVE-N-gly板由218g山梨糖醇、10g甘油、2.02g KNO3、50ml COVE盐溶液、25g纯净琼脂组成,并且添加去离子水至1升。
COVE培养基由342.3g的蔗糖、20ml的50X COVE盐溶液、10ml的1M乙酰胺、10ml的1.5M CsCl2、25g的诺布尔琼脂组成,并且添加去离子水至1升。
COVE2培养基由30g蔗糖、20ml 50X COVE盐溶液、10ml 1M乙酰胺、25g纯净琼脂组成,并且添加去离子水至1升。
COVE-N板由342.3g蔗糖、20ml COVE盐溶液、3g NaNO3、30g纯净琼脂组成,并且添加去离子水至1升。
COVE-N顶层琼脂糖由342.3g蔗糖、20ml COVE盐溶液、3g NaNO3、10g低熔点琼脂糖组成,并且添加去离子水至1升。
COVE-N Jp板由30g蔗糖、20ml COVE盐溶液、3g NaNO3、30g纯净琼脂组成,并且添加去离子水至1升。
COVE盐溶液由26g KCl、26g MgSO4·7H2O、76g KH2PO4、50ml COVE痕量金属溶液组成,并且添加去离子水至1升。
COVE痕量金属由0.04g Na2B4O7·10H2O、0.4g CuSO4·5H2O、1.2g FeSO4·7H2O、1.0g MnSO4·5H2O、0.8g Na2MoO4·2H2O、10g ZnSO4·7H2O组成,并且添加去离子水至1升。
LB培养基由10g的胰蛋白胨、5g的酵母提取物、5g的氯化钠组成,并且添加去离子水至1升。
LB加氨比西林板由10g胰蛋白胨、5g酵母提取物、5g氯化钠、15g细菌培养用琼脂、以100μg/ml的氨比西林组成,并且添加去离子水至1升。
MSS培养基由70g蔗糖、100g豆粉、三滴普鲁尼克(pluronic)消泡剂组成,并且添加去离子水至1升;将pH调节至6.0。
不含尿素的MU-1glu培养基由260g葡萄糖、3g MgSO4·7H2O、6g K2SO4、5g KH2PO4、0.5ml AMG痕量金属溶液、几滴消泡剂组成,并且添加去离子水至1升;将pH调节至4.5。
50%尿素由500g尿素组成,并且添加去离子水至1升。
YPG培养基由10g酵母提取物、20g细菌蛋白胨、20g葡萄糖组成,并且添加去离子水至1升。
STC由0.8M山梨糖醇、25mM或50mM Tris pH 8、和25mM或50mM CaCl2组成。
SPTC由STC缓冲液中的40%聚乙二醇4000(PEG4000)组成。
SOC培养基由20g的胰蛋白胨、5g的酵母提取物、0.5g的NaCl、10ml的250mM KCl组成,并且添加去离子水至1升。
TAE缓冲液由4.84g Tris碱、1.14ml冰乙酸、2ml 0.5M EDTA,pH 8.0组成,并且添加去离子水至1升。
购买的材料
将大肠杆菌DH5-α(东洋公司(Toyobo))用于质粒构建和扩增。将商购的质粒pBluescript II SK-(斯图特基因公司(Stratagene)#212206)用于PCR片段的克隆。使用凯杰质粒试剂盒(Plasmid Kit)(凯杰公司(Qiagen))来回收扩增的质粒。使用DNA连接试剂盒(宝生物公司(TAKARA))或T4DNA连接酶(宝灵曼公司(BOEHRINGER MANNHEIM))来进行连接。使用扩展(Expand)TM PCR系统(宝灵曼公司)来进行聚合酶链式反应(PCR)。凝胶提取试剂盒(凯杰公司)被用于纯化PCR片段并从琼脂糖凝胶中提取DNA片段。
菌株
表达宿主菌株黑曲霉C3105由诺维信公司(Novozymes)分离,并且它已被遗传修饰以破坏淀粉葡糖苷酶活性和α-淀粉酶活性的表达,随后引入黑曲霉胞嘧啶脱氨酶基因(fcy1)。
质粒
质粒pHUda801被描述于WO 2012160093中的实例4中。
质粒pHUda1019被描述于WO 2012160093中的实例2中。
用于酶基因的表达的载体的质粒pRika147被描述于WO 2012160093中的实例9中。
黑曲霉的转化
亲本黑曲霉宿主细胞的转化是使用已知用于丝状真菌转化的通用方法,如描述于耶尔顿(Yelton)等人,“通过使用trpC质粒的黑曲霉的转化”(“Transformation ofAspergillus nidulans by using a trpC plasmid)”,美国科学院院刊(Proc Natl AcadSci U S A.)1984年3月;81(5):1470-4中,如下来实现的:
如果该宿主菌株是一种pyrG缺陷型突变体,将黑曲霉宿主菌株接种至100ml的补充有10mM尿苷的YPG培养基上,并且在32℃下在80rpm下孵育16小时。将球粒进行收集并且用0.6M Kcl洗涤,并且将其重悬浮于包含商业β-葡聚糖酶产品(GLUCANEXTM,诺维信公司(Novozymes A/S),鲍斯韦丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将悬浮液在32℃下在80rpm下孵育直到形成原生质体,并且然后用STC缓冲液洗涤两次。将这些原生质体用血红蛋白计计数,并且在8:2:0.1的STC:STPC:DMSO溶液中重悬并调节至终浓度为2.5x107个原生质体/ml。将大约4μg的质粒DNA添加至100μl的原生质体悬浮液中,轻轻混合,并且冰上孵育30分钟。添加1ml SPTC,并且将该原生质体悬浮液在37℃下孵育20分钟。在添加10ml 50℃COVE-N顶层琼脂糖后,将混合物倾倒于基本培养基上,并且将这些板在30℃下孵育5天。
PCR扩增:
PCR条件
用于报告酶生产的摇瓶培养
将选择的转化体的孢子接种进100ml的MSS培养基,并且在30℃下培养3天。将10%的种子培养物以实验室规模罐转移至MU-1glu培养基中,用适当量的葡萄糖和铵进行给料,并且在34℃下培养6天。通过离心获得上清液。使用离心后的培养物上清液用于酶测定。
Southern杂交
将所选择的转化体的菌丝体从在3ml YPG培养基中的过夜培养物中收获,用蒸馏水冲洗。遵循制造商的说明书,将研磨的菌丝体经受使用土壤用FastDNA SPIN试剂盒(MP生物医疗)的基因组DNA制备。遵循制造商的说明书,使用PCR DIG探针合成试剂盒(罗氏应用科学公司(Roche Applied Science),印第安纳州,印第安纳波利斯(Indianapolis,IN))合成非放射性探针。遵循制造商的说明书,使用QIAquick TM凝胶提取试剂盒(凯杰公司(QIAGEN Inc.),巴伦西亚,加利福尼亚州)将DIG标记的探针进行凝胶纯化。
将5微克的基因组DNA用适当的限制性内切酶完全消化16小时(40μl总体积、4U酶/μl DNA)并且在0.8%琼脂糖凝胶上运行。将该DNA在凝胶中通过用0.2M HCl处理进行片段化、变性(0.5M NaOH,1.5M NaCl)并且进行中和(1M Tris,pH 7.5;1.5M NaCl)用于随后在20X SSC中转移至海邦(Hybond)N+膜(安玛西亚公司(Amersham))上。将该DNA进行UV交联到该膜上并且在42℃下在20ml DIG Easy Hyb(罗氏诊断产品有限公司(Roche DiagnosticsCorporation),曼海姆,德国)中预杂交1小时。将变性的探针直接添加至DIG Easy Hyb缓冲液中并且在42℃下进行过夜杂交。在杂交后洗涤(在2X SSC中、室温、5分钟洗涤两次;并且在0.1X SSC中、68℃洗涤两次,各15min),遵循制造商的方案,使用DIG检测系统和CPD-Star(罗氏公司)进行化学发光检测。DIG-标记的DNA分子量标记II(罗氏公司)被用于标准标记。
布拉德福德(Bradford)测定(全部蛋白测定)
布拉德福德(Bradford)测定、比色蛋白测定是基于染料考马斯亮蓝G-250的吸光度偏移,其中在酸性条件下,红色形式的染料转化成其蓝色形式,以结合正在测定的蛋白质。染料与蛋白质的结合稳定化了蓝色阴离子形式。在595nm处的吸光度的增加与结合的染料的量成比例,并且因此与样品中存在的蛋白质的量(浓度)成比例。
遵循制造商的说明书,将酶样品用蒸馏水适当地稀释,并且通过使用QuickStartTM布拉德福德(Bradford)蛋白测定(伯乐公司(Bio-Rad inc.))来测量它们的蛋白质量。
实例1:质粒pHUda1685,用于黑曲霉agsA基因的靶标基因破坏的载体的构建
构建质粒pHUda1685以包含黑曲霉α-葡聚糖合酶(agsA)基因的5’和3’侧翼区,这两个侧翼区通过与其终止子重复一起的作为选择性标记的构巢曲霉乳清苷-5’-磷酸脱羧酶基因(pyrG),和人单纯疱疹病毒1(HSV-1)胸苷激酶基因分开。HSV-1胸苷激酶基因位于agsA基因的3’侧翼区的3’端,允许没有正确地靶向整合至agsA基因座的黑曲霉转化体的反向选择。以如下所述的若干个步骤构建质粒。
使用以下引物产生包含黑曲霉agsA的5’侧翼区的PCR产物:
引物agsA1(正义):5’ggtggcggccgcctgtgaatagctaccagc(SEQ ID NO:7)
引物agsA2(反义):5’ctccactagttgctaatgtattatccatga(SEQ ID NO:8)
通过反应中的PCR来扩增所希望的片段,该反应由大约100ng黑曲霉C3105的基因组DNA、1μl扩展高保真聚合酶(罗氏(Roche))、100μM引物agsA1、100μM引物agsA2、5x PCR缓冲液(包含MgCl2)、20μl 2.5mM dNTP混合物(总体积;100μl)组成。将该反应在C1000TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及72℃下持续2分钟;1个循环,在72℃下持续7分钟;并且4℃保持。将生成的2,509bp PCR片段通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将纯化的2,509bp PCR片段用NotI和SpeI进行消化。
将质粒pHUda801(WO 2012160093A1中的实例4)用Not I和SpeI进行消化,并且通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,将其中的9,558bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中将9,558bp片段连接至2,509bp PCR片段,该反应由1μl9,558bp片段、3μl 2,509bp片段、1μl 5X连接酶缓冲液、5μl2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一种质粒命名为pHUda801-5’agsA。
使用以下引物产生包含黑曲霉agsA的3’侧翼区的PCR产物:
引物agsA3(正义):5’cttctagagtttaaacaaccgcctcagcag(SEQ ID NO:9)
引物agsA4(反义):5’ttaattaaagaagggcattctatggacgta(SEQ ID NO:10)
通过反应中的PCR来扩增所希望的片段,该反应由大约100ng黑曲霉C3105的基因组DNA、1μl扩展高保真聚合酶(罗氏(Roche))、100μM引物agsA3、100μM引物agsA4、5x PCR缓冲液(包含MgCl2)、20μl 2.5mM dNTP混合物(总体积;100μl)组成。将该反应在C1000TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及72℃下持续2分钟;1个循环,在72℃下持续7分钟;并且4℃保持。将生成的2,299bp PCR片段通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将纯化的2,299bp PCR片段用XbaI和PacI进行消化。
将质粒pHUda801-5’agsA用XbaI和PacI进行消化,并且通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,将其中的10,030bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中将10,030bp片段连接至2,299bpPCR片段,该反应由1μl 10,030bp片段、3μl 2,299bp片段、1μl 5X连接酶缓冲液、5μl 2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一种质粒命名为pHUda1685(图2)。
实例2:质粒pHUda1701,用于黑曲霉agsE基因的靶标基因破坏的载体的构建
构建质粒pHUda1701以包含黑曲霉α-葡聚糖合酶(agsE)基因的5’和3’侧翼区,这两个侧翼区通过作为选择性标记的构巢曲霉乙酰胺酶基因(amdS),和人单纯疱疹病毒1(HSV-1)胸苷激酶基因分开。该HSV-1胸苷激酶基因位于agsE基因的3’侧翼区的3’端,允许没有正确地靶向agsE基因座的黑曲霉转化体的反向选择。以如下所述的若干个步骤构建质粒。
使用以下引物产生包含黑曲霉agsE的5’侧翼区的PCR产物:
引物agsE1(正义):5’accgcggtctttcagccagggaatggct(SEQ ID NO:11)
引物agsE2(反义):5’ttactagtacacaatagtgcaggtgatgtc(SEQ ID NO:12)
通过反应中的PCR来扩增所希望的片段,该反应由大约100ng黑曲霉C3105的基因组DNA、1μl扩展高保真聚合酶(Roche)、100μM引物agsE1、100μM引物agsE2、5x PCR缓冲液(包含MgCl2)、20μl 2.5mM dNTP混合物(总体积;100μl)组成。将该反应在C1000TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及72℃下持续2分钟;1个循环,在72℃下持续7分钟;并且4℃保持。将生成的2,300bp PCR片段通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将纯化的2,300bp PCR片段用SacII和SpeI进行消化。
将质粒pHUda801(在WO 2012160093A1中的实例4)用SacII和SpeI进行消化,并且通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,将其中的9,561bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中,将9,561bp片段连接至2,300bp PCR片段,该反应由1μl9,561bp片段、3μl 2,300bp片段、1μl 5X连接酶缓冲液、5μl 2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一种质粒命名为pHUda801-5’agsE。
使用以下引物产生包含黑曲霉agsE的3’侧翼区的PCR产物:
引物agsE3(正义):5’tttctagacgccttaatgatgtggtggtg(SEQ ID NO:13)
引物agsE4(反义):5’ttaattaaatggcgcccactgctacagg(SEQ ID NO:14)
通过反应中的PCR来扩增所希望的片段,该反应由大约100ng黑曲霉C3105的基因组DNA、1μl扩展高保真聚合酶(罗氏(Roche))、100μM引物agsE3、100μM引物agsE4、5x PCR缓冲液(包含MgCl2)、20μl 2.5mM dNTP混合物(总体积;100μl)组成。将该反应在C1000TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及72℃下持续2分钟;1个循环,在72℃下持续7分钟;并且4℃保持。将生成的2,280bp PCR片段通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将纯化的2,280bp PCR片段用XbaI和PacI进行消化。
将质粒pHUda801-5’agsE用XbaI和PacI进行消化,并且通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,将其中的9,830bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中,将9,830bp片段连接至2,280bpPCR片段,该反应由1μl 9,830bp片段、3μl 2,280bp片段、1μl 5X连接酶缓冲液、5μl 2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一种质粒命名为pHUda801-5’agsE-3’agsE。
将质粒pHUda801-5’agsE-3’agsE用XbaI和SpeI进行消化,并且通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,将其中的9,946bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将质粒pHUda1019(描述于在WO 2012160093中的实例2中)用XbaI和AvrII进行消化,并且通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,将其中的包含amdS基因、米曲霉tef1(翻译延长因子1)启动子、和米曲霉niaD(硝酸还原酶)终止子的3,114bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中,将9,946bp片段连接至3,114bp片段,该反应由1μl 9,946bp片段、3μl 3,114bp片段、1μl 5X连接酶缓冲液、5μl 2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一个质粒命名为pHUda1701(图3)。
实例3:黑曲霉C3105agsA基因破坏
黑曲霉C3105中的pyrG基因被解救如下。将菌株C3105接种到包含10mM尿苷和1g/L5-氟-乳清酸(5-FOA)的Cove-N Jp培养基上,在30℃下持续5天。其中已经缺失pyrG基因的菌株将在5-FOA的存在下生长;保留该基因的那些将5-FOA转换为5-氟-UMP,即一种毒性中间体。将这些生长的菌落用灭菌的牙签转移到补充有10mM尿苷的COVE-N-gly板上,并且在30℃下生长7天。将分离菌株命名为M1405。
通过在32℃下持续16小时,以80rpm轻微搅动,在补充有10mM尿苷的100ml的YPG培养基中培养菌株,来制备黑曲霉菌株M1405的原生质体。将球粒进行收集并且用0.6M Kcl洗涤,并且将其重悬浮于包含商业β-葡聚糖酶产品(GLUCANEXTM,诺维信公司(Novozymes A/S),鲍斯韦丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将该悬浮液在32℃下以80rpm孵育直到形成原生质体。将原生质体通过衬有的漏斗,过滤到50ml无菌塑料离心管中,并且用0.6M Kcl进行洗涤以提取受陷的原生质体。通过在2,000rpm离心15分钟收集合并的滤液和上清液。弃去上清液,并且用10-25ml的STC洗涤该球粒,并且在2,000rpm再次离心10分钟,并且然后用STC缓冲液洗涤两次。将这些原生质体用血红蛋白计计数,并且在8:2:0.1的STC:STPC:DMSO溶液中重悬并调节至终浓度为2.5x107个原生质体/ml。
将大约10μg的pHUda1685添加至0.3ml的M1405原生质体悬浮液,轻轻混合,并且在冰上孵育30分钟。添加三ml SPTC,并且将该原生质体悬浮液在37℃下孵育20分钟。在添加12ml 50℃COVE-N顶层琼脂糖之后,将该混合物倾倒于COVE-N板上,并且将这些板在30℃下孵育7天。用无菌牙签将这些生长转化体转移到补充有1.5μM 5-氟-2-脱氧尿苷(FdU)(即一种杀死表达包含在pHUda1685中的单纯疱疹病毒(HSV)胸苷激酶基因(TK)的细胞的试剂)的Cove-N JP板上。将单孢子分离物转移至COVE-N-gly板上。
通过DNA印迹分析筛选包含用来破坏agsA基因的pHUda1685的黑曲霉菌株M1405的可能的转化体。将每个孢子纯化的转化体在3ml YPG培养基中进行培养,并且在30℃下以200rpm摇动孵育2天。使用衬有的漏斗来收集生物质。遵循制造商的说明书,将研磨的菌丝体经受使用土壤用FastDNA SPIN试剂盒(MP生物医疗)的基因组DNA制备。
进行DNA印迹分析,以确认agsA基因座的破坏。用SpeI来消化来自每个转化体的五μg的基因组DNA。基因组DNA消化反应是由5μg的基因组DNA、1μl Spe I、2μl 10X Ne缓冲液4组成,并且水补足至20μl。在37℃下,将基因组DNA消化孵育大约16小时。遵循制造商的建议,将这些消化提交至使用TAE缓冲液的0.8%琼脂糖凝胶电泳,并且使用印迹至hybond N+(GE医疗集团生命科学部(GE Healthcare LifeSciences),曼彻斯特,新罕布什尔州,美国)持续大约1小时。将该膜与500bp地高辛标记的黑曲霉gasA探针杂交,其中使用如下所示的引物agsA5(正义)和agsA6(反义)通过PCR,通过掺入地高辛-11-dUTP合成该探针。
正向引物(agsA5):5’agcagtctcggcggcgagga(SEQ ID NO:15)
反向引物(agsA6):5'attgcccaagcggcgtctca(SEQ ID NO:16)
该扩增反应(100μl)是由以下项组成的:200μM PCR DIG标记的混合物(vial 2)(罗氏应用科学公司(Roche Applied Science),帕洛阿尔托(Palo Alto),加利福尼亚州,美国),0.5μM引物,高保真酶混合物(vial 1)(罗氏应用科学公司(RocheApplied Science),帕洛阿尔托(Palo Alto),加利福尼亚州,美国),以及作为模板的1μl(100pg/μl)的pHUda1685,最终体积为100μl。将该扩增反应在C1000TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及在72℃下持续30秒;并且保持4℃。通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,将PCR产物进行分离,其中将0.5kb片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将变性的探针直接添加至DIG Easy Hyb缓冲液中并且在42℃下进行过夜杂交。在杂交后洗涤(在2X SSC中、室温、5分钟洗涤两次;并且在0.1X SSC中、68℃洗涤两次,各15min),遵循制造商的方案,使用DIG检测系统和CPD-Star(罗氏公司)进行化学发光检测。DIG-标记的DNA分子量标记II(罗氏公司)被用于标准标记。
选择具有在agsA基因座(从11.9kb移位至4.7kb的杂交带)中的正确整合的表示为M1405-1685-16的转化体agsA突变体菌株,用于之后的实验。参见图1。
实例4:在C3105和M1405-1685-16中的黑曲霉agsE基因破坏
通过在32℃下持续16小时,以80rpm轻微搅动,在100ml的YPG培养基中培养菌株,来制备黑曲霉菌株C3105和M1405-1685-16的原生质体。将球粒进行收集并且用0.6M Kcl洗涤,并且将其重悬浮于包含商业β-葡聚糖酶产品(GLUCANEXTM,诺维信公司(Novozymes A/S),鲍斯韦丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将该悬浮液在32℃下以80rpm孵育直到形成原生质体。将原生质体通过衬有的漏斗,过滤到50ml无菌塑料离心管中,并且用0.6M Kcl进行洗涤以提取受陷的原生质体。通过在2,000rpm离心15分钟收集合并的滤液和上清液。弃去上清液,并且用10-25ml的STC洗涤该球粒,并且在2,000rpm再次离心10分钟,并且然后用STC缓冲液洗涤两次。将这些原生质体用血红蛋白计计数,并且在8:2:0.1的STC:STPC:DMSO溶液中重悬并调节至终浓度为2.5x107个原生质体/ml。
将大约10μg的pHUda1701添加至0.3ml的原生质体悬浮液中,轻轻混合,并且在冰上孵育30分钟。添加三ml SPTC,并且将该原生质体悬浮液在37℃下孵育20分钟。在添加12ml 50℃COVE顶层琼脂糖之后,将该混合物倾倒在COVE板上,并且将这些板在30℃下孵育7天。用无菌牙签将这些生长转化体转移至补充有1.5μM 5-氟-2-脱氧尿苷(FdU)(即一种杀死表达包含在pHUda1701中的单纯疱疹病毒(HSV)胸苷激酶基因(TK)的细胞的试剂)的Cove-2板上。将单孢子分离物转移至COVE-N-gly板上。
通过DNA印迹分析筛选包含用来破坏agsE基因的pHUda1701的黑曲霉菌株C3105和M1405-1685-16的可能的转化体。将每个孢子纯化的转化体在3ml YPG培养基中进行培养,并且在30℃下以200rpm摇动孵育2天。使用衬有的漏斗来收集生物质。遵循制造商的说明书,将研磨的菌丝体经受使用土壤用FastDNA SPIN试剂盒(MP生物医疗)的基因组DNA制备。
进行DNA印迹分析,以确认agsE基因座的破坏。用HindIII和XbaI消化来自每个转化体的五μg的基因组DNA。基因组DNA消化反应是由5μg基因组DNA、0.5μl HindIII、0.5μlXbaI、2μl 10X NE缓冲液4组成,并且水补足至20μl。在37℃下,将基因组DNA消化孵育大约16小时。遵循制造商的建议,将这些消化提交至使用TAE缓冲液的0.8%琼脂糖凝胶电泳,并且使用印迹至hybond N+(GE医疗集团生命科学部(GE HealthcareLife Sciences),曼彻斯特,新罕布什尔州,美国)持续大约1小时。将该膜与500bp地高辛标记的黑曲霉agsE探针杂交,其中使用如下所示的引物agsE5(正义)和agsE6(反义),通过PCR,通过掺入地高辛-11-dUTP合成该探针。
正向引物(agsE5):5’accgggcatgaacatttaac(SEQ ID NO:17)
反向引物(agsE6):5'aagtatttattgtattttgg(SEQ ID NO:18)
该扩增反应(100μl)是由以下项组成的:200μM PCR DIG标记的混合物(vial 2)(罗氏应用科学公司(Roche Applied Science),帕洛阿尔托(Palo Alto),加利福尼亚州,美国),0.5μM引物,高保真酶混合物(vial 1)(罗氏应用科学公司(RocheApplied Science),帕洛阿尔托(Palo Alto),加利福尼亚州,美国),以及作为模板的1μl(100pg/μl)的pHUda1685,最终体积为100μl。将该扩增反应在C1000TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及在72℃下持续30秒;并且保持4℃。通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,将PCR产物进行分离,其中将0.5kb片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将变性的探针直接添加至DIG Easy Hyb缓冲液中并且在42℃下进行过夜杂交。在杂交后洗涤(在2X SSC中、室温、5分钟洗涤两次;并且在0.1X SSC中、68℃洗涤两次,各15min),遵循制造商的方案,使用DIG检测系统和CPD-Star(罗氏公司)进行化学发光检测。DIG-标记的DNA分子量标记II(罗氏公司)被用于标准标记。
选择分别从C3105和M1405-1685-16中产生的两种菌株(M1405-1701-1和1685-1701-11),它们给出在agsE基因座(由具有从5.4kb移位至3.2kb的杂交带指示)处的正确整合,用于随后的实验。参见图1。
实例5:金黄色嗜热子囊菌金属蛋白酶基因(ap025)表达载体pHUda1657和pHUda1694的构建
将质粒pHUda1657构建为包含2个拷贝的以下项:由串联排列的黑曲霉中性淀粉酶启动子II(Pna2)和葡糖淀粉酶终止子(Tamg)驱动的金黄色嗜热子囊菌金属蛋白酶基因(ap025)、作为选择性标记的构巢曲霉乙酰胺酶基因(amdS)、以及由黑曲霉酸性稳定性淀粉酶启动子(PasaA)和米曲霉硝酸还原酶终止子(Tniad)驱动的酵母酿酒酵母FLP重组基因(flp)。质粒pHUda1694具有与pHUda1657相同的构建,除了具有作为选择性标记而不是amdS选择性标记的构巢曲霉乳清苷-5’-磷酸脱羧酶基因(pyrG)。以如下所述的若干个步骤构建这些质粒。
pHUda1260的构建
通过在pRika147中从构巢曲霉乳清苷-5’-磷酸脱羧酶基因(pyrG)改变至构巢曲霉乙酰胺酶基因(amdS)来构建质粒pHUda1260。
遵循制造商的方案(NEB,新英格兰生物实验室公司(New England Biolabs,Inc.)),用SphI和SpeI来消化质粒pRika147(描述于WO 2012160093中的实例9中),并且通过使用T4DNA多聚酶来填满其末端。通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,将该片段进行纯化,其中将9,241bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。
遵循制造商的方案(NEB,新英格兰生物实验室公司(New England Biolabs,Inc.)),用XbaI和AvrII来消化质粒pHUda1019(描述于WO 2012160093中的实例2中),并且通过使用T4DNA多聚酶来填满其末端。通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,将该片段进行纯化,其中将包含amdS基因、米曲霉tef1(翻译延长因子1)启动子、和米曲霉niaD(硝酸还原酶)终止子的3,114bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中,将9,241bp片段连接至3,114bp片段,该反应由1μl 9,241bp片段、3μl 3,114bp片段、1μl 5X连接酶缓冲液、5μl 2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一种质粒命名为pHUda1260。(PWL:质粒图和全部序列?)
质粒pHUda1657的构建
使用以下引物产生包含金黄色嗜热子囊菌金属蛋白酶基因(ap025)的PCR产物:
引物ap025-1(正义):5’tttggatccaccatgcgtttcatttctgtctcc(SEQ ID NO:19)
引物ap025-2(反义):5’ccacgtgttagcaaccaaggtatatggcat(SEQ ID NO:20)
通过反应中的PCR来扩增所希望的片段,该反应由大约100ng包含ap025 cDNA基因的质粒DNA(描述于WO 2003048353中)、1μl扩展高保真聚合酶(Roche)、100μM引物ap025-1、100μM引物ap025-2、5x PCR缓冲液(包含MgCl2)、20μl 2.5mM dNTP混合物(总体积;100μl)组成。将该反应在C1000 TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及在72℃下持续1分钟;1个循环,在72℃下持续7分钟;并且保持4℃。将生成的1,073bp PCR片段通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将纯化的1,073bp PCR片段用BamHI和PmlI进行消化。
将质粒pHUda1260用BamHI和PmlI进行消化,并且通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,其中将10,512bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中,将10,512bp片段连接至1,073bp PCR片段,该反应由1μl10,512bp片段、3μl 1,073bp片段、1μl 5X连接酶缓冲液、5μl 2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一种质粒命名为pHUda1555。
将质粒pHUda1555用SpeI进行消化,通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,其中将11,585bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。
将质粒pHUda1555用NheI和SpeI进行消化,通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,其中将包含ap025基因、黑曲霉中性淀粉酶启动子II(Pna2)、和葡糖淀粉酶终止子(Tamg)的2,699bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中,将11,585bp片段连接至2,699bp片段,该反应由1μl 11,585bp片段、3μl 2,699bp片段、1μl5X连接酶缓冲液、5μl 2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一种质粒命名为pHUda1657(图4)。
质粒pHUda1694的构建
将质粒pRika147用NheI和SpeI进行消化,通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,其中将7,268bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。
将质粒pHUda1657用NheI和SpeI进行消化,通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化,其中将包含ap025基因、黑曲霉中性淀粉酶启动子II(Pna2)、和葡糖淀粉酶终止子(Tamg)的串联构建体的5,036bp片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。在一个反应中,将7,268bp片段连接至5,036bp片段,该反应由1μl 7,268bp片段、3μl 5,036bp片段、1μl 5X连接酶缓冲液、5μl 2X连接酶缓冲液、以及1μl连接酶(罗氏(Roche)快速DNA连接试剂盒)组成。将该连接反应在室温下孵育10分钟。将5μl的连接混合物转化到DH5-α化学感受态大肠杆菌细胞中。将转化体涂布在LB加氨比西林板上,并且在37℃下孵育过夜。使用QIA小量制备试剂盒,将质粒DNA从若干个转化体中纯化。通过使用适当的限制性酶,随后通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,筛选适当连接的质粒DNA。将一种质粒命名为pHUda1694(图5)。
实例6:黑曲霉菌株C3105和M1405-1685-16中的金黄色嗜热子囊菌金属蛋白酶基因(ap025)表达载体pHUda1657的引入
应当通过flp重组酶,将ap025表达质粒引入四个预指定的基因座处,它们是中性淀粉酶I(amyA)、中性淀粉酶II(amyB)、酸性稳定淀粉酶(asaA)、以及推定的碱性硫酸酯酶(payA)。
通过在32℃下持续16小时,以80rpm轻微搅动,在100ml的YPG培养基中培养菌株,来制备黑曲霉菌株C3105和M1405-1685-16的原生质体。将球粒进行收集并且用0.6M Kcl洗涤,并且将其重悬浮于包含商业β-葡聚糖酶产品(GLUCANEXTM,诺维信公司(Novozymes A/S),鲍斯韦丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将该悬浮液在32℃下以80rpm孵育直到形成原生质体。将原生质体通过衬有的漏斗,过滤到50ml无菌塑料离心管中,并且用0.6M Kcl进行洗涤以提取受陷的原生质体。通过在2,000rpm离心15分钟收集合并的滤液和上清液。弃去上清液,并且用10-25ml的STC洗涤该球粒,并且在2,000rpm再次离心10分钟,并且然后用STC缓冲液洗涤两次。将这些原生质体用血红蛋白计计数,并且在8:2:0.1的STC:STPC:DMSO溶液中重悬并调节至终浓度为2.5x107个原生质体/ml。
将大约10μg的pHUda1657添加至0.3ml的原生质体悬浮液中,轻轻混合,并且在冰上孵育30分钟。添加三ml SPTC,并且将该原生质体悬浮液在37℃下孵育20分钟。添加12ml补充有50微克/ml的5’氟胞嘧啶(5FC)(即一种杀死表达包含在C3105和M1405-1685-16中的黑曲霉胞嘧啶脱氨酶(fcy1)基因的细胞的试剂)的50℃COVE顶层琼脂糖之后,将该混合物倾倒在COVE板上,并且将这些板在30℃下孵育10天。将这些生长转化体用无菌牙签转移至补充有10μg/ml 5’氟胞嘧啶(5FC)的Cove-2板上。将单孢子分离物转移至COVE-N-gly板上。
通过DNA印迹分析筛选包含用来引入ap025基因的pHUda1657的黑曲霉菌株C3105和M1405-1685-16的可能的转化体。将每个孢子纯化的转化体在3ml YPG培养基中进行培养,并且在30℃下以200rpm摇动孵育2天。使用衬有的漏斗来收集生物质。遵循制造商的说明书,将研磨的菌丝体经受使用土壤用FastDNA SPIN试剂盒(MP生物医疗)的基因组DNA制备。
进行DNA印迹分析来确认四个预指定的基因座(amyA、amyB、asaA、payA)处的ap025基因的引入。用HindIII来消化来自每个转化体的五μg的基因组DNA。基因组DNA消化反应是由5μg基因组DNA、0.5μl HindIII、2μl 10X NE缓冲液4组成,并且水补足至20μl。在37℃下,将基因组DNA消化孵育大约16小时。遵循制造商的建议,将这些消化提交至使用TAE缓冲液的0.5%琼脂糖凝胶电泳,并且使用印迹至hybond N+(GE医疗集团生命科学部(GE Healthcare Life Sciences),曼彻斯特,新罕布什尔州,美国)持续大约1小时。将该膜与500bp地高辛标记的ap025探针杂交,其中使用如下所示的引物ap025-3(正义)和ap025-4(反义),通过PCR,通过掺入地高辛-11-dUTP合成该探针。
正向引物(ap025-3):5’aggatcagttcctgctccgg(SEQ ID NO:21)
反向引物(ap025-4):5'ggtatatggcattcgcatag(SEQ ID NO:22)
该扩增反应(100μl)是由以下项组成的:200μM PCR DIG标记的混合物(vial 2)(罗氏应用科学公司(Roche Applied Science),帕洛阿尔托(Palo Alto),加利福尼亚州,美国)、0.5μM引物、高保真酶混合物(vial 1)(罗氏应用科学公司(RocheApplied Science),帕洛阿尔托(Palo Alto),加利福尼亚州,美国)、以及作为模板的1μl(100pg/μl)的pHUda1555,最终体积为100μl。将该扩增反应在C1000TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及在72℃下持续30秒;并且保持4℃。通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,将PCR产物进行分离,其中将0.5kb片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将变性的探针直接添加至DIG Easy Hyb缓冲液中并且在42℃下进行过夜杂交。在杂交后洗涤(在2X SSC中、室温、5分钟洗涤两次;并且在0.1X SSC中、68℃洗涤两次,各15min),遵循制造商的方案,使用DIG检测系统和CPD-Star(罗氏公司)进行化学发光检测。DIG-标记的DNA分子量标记II(罗氏公司)被用于标准标记。
选择分别从亲本菌株C3105和M1405-1685-16产生的,各自具有在四个基因座处的(在6.6kb、7.0kb、8.6kb、和10.1kb的大小的四个杂交带)正确整合的两种菌株(C3105-1657-8和1685-1657-16),用于随后的实验。参见图1。
实例7:黑曲霉菌株(M1405-1701-1和1685-1701-11)中的金黄色嗜热子囊菌金属蛋白酶基因(ap025)表达载体pHUda1694的引入
应当通过FLP重组酶,将ap025表达质粒引入四个预指定的基因座处,它们是中性淀粉酶I(amyA)、中性淀粉酶II(amyB)、酸性稳定淀粉酶(asaA)、以及推定的碱性硫酸酯酶(payA)。
M1405-1701-1和1685-1701-11中的pyrG基因被解救如下。将两种菌株接种到包含10mM尿苷和1g/L 5-氟-乳清酸(5-FOA)的Cove-N JP培养基上,在30℃下持续5天。其中已经缺失pyrG基因的菌株将在5-FOA的存在下生长;保留该基因的那些将5-FOA转换为5-氟-UMP,即一种毒性中间体。将这些生长的菌落用灭菌的牙签转移到补充有10mM尿苷的COVE-N-gly板上,并且在30℃下生长7天。将来自M1405-1701-1,1685-1701-11的这些分离的菌株分别命名为M1405-1701-P2和1685-1701-11-P1。
通过在32℃下持续16小时,以80rpm轻微搅动,在补充有10mM尿苷的100ml的YPG培养基中培养菌株,来制备黑曲霉菌株M1405-1701-P2和1685-1701-11-P1的原生质体。将球粒进行收集并且用0.6M Kcl洗涤,并且将其重悬浮于包含商业β-葡聚糖酶产品(GLUCANEXTM,诺维信公司(Novozymes A/S),鲍斯韦丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将该悬浮液在32℃下以80rpm孵育直到形成原生质体。将原生质体通过衬有的漏斗,过滤到50ml无菌塑料离心管中,并且用0.6M Kcl进行洗涤以提取受陷的原生质体。通过在2,000rpm离心15分钟收集合并的滤液和上清液。弃去上清液,并且用10-25ml的STC洗涤该球粒,并且在2,000rpm再次离心10分钟,并且然后用STC缓冲液洗涤两次。将这些原生质体用血红蛋白计计数,并且在8:2:0.1的STC:STPC:DMSO溶液中重悬并调节至终浓度为2.5x107个原生质体/ml。
将大约10μg的pHUda1694添加至0.3ml的原生质体悬浮液中,轻轻混合,并且在冰上孵育30分钟。添加三ml SPTC,并且将该原生质体悬浮液在37℃下孵育20分钟。添加12ml补充有50μg/ml的5’氟胞嘧啶(5FC)(即一种杀死表达包含在M1405-1701-P2和1685-1701-11-P1中的黑曲霉胞嘧啶脱氨酶(fcy1)基因的细胞的试剂)的50℃COVE-N顶层琼脂糖之后,将该混合物倾倒在COVE-N板上,并且将这些板在30℃下孵育10天。将这些生长转化体用无菌牙签转移至补充有10微克/ml的5’氟胞嘧啶(5FC)的Cove-N JP板上。将单孢子分离物转移至COVE-N-gly板上。
通过DNA印迹分析筛选包含用来引入ap025基因的pHUda1694的黑曲霉菌株M1405-1701-P2和1685-1701-11-P1的可能的转化体。将每个孢子纯化的转化体在3ml YPG培养基中进行培养,并且在30℃下以200rpm摇动孵育2天。使用衬有的漏斗来收集生物质。遵循制造商的说明书,将研磨的菌丝体经受使用土壤用FastDNA SPIN试剂盒(MP生物医疗)的基因组DNA制备。
进行DNA印迹分析来确认四个预指定的基因座(amyA、amyB、asaA、payA)处的ap025基因的引入。用AvrII和HindIII消化来自每个转化体的五μg的基因组DNA。基因组DNA消化反应是由5μg基因组DNA、0.5μl HindIII、0.5μl AvrII、2μl 10X NE缓冲液4组成,并且水补足至20μl。在37℃下,将基因组DNA消化孵育大约16小时。遵循制造商的建议,将这些消化提交至使用TAE缓冲液的0.5%琼脂糖凝胶电泳,并且使用印迹至hybondN+(GE医疗集团生命科学部(GE Healthcare Life Sciences),曼彻斯特,新罕布什尔州,美国)持续大约1小时。将该膜与500bp地高辛标记的ap025探针杂交,其中使用如下所示的引物ap025-3(正义)和ap025-4(反义),通过PCR,通过掺入地高辛-11-dUTP合成该探针。
正向引物(ap025-3):5’aggatcagttcctgctccgg(SEQ ID NO:23)
反向引物(ap025-4):5'ggtatatggcattcgcatag(SEQ ID NO:24)
该扩增反应(100μl)是由以下项组成的:200μM PCR DIG标记的混合物(vial 2)(罗氏应用科学公司(Roche Applied Science),帕洛阿尔托(Palo Alto),加利福尼亚州,美国)、0.5μM引物、高保真酶混合物(vial 1)(罗氏应用科学公司(RocheApplied Science),帕洛阿尔托(Palo Alto),加利福尼亚州,美国)、以及作为模板的1μl(100pg/μl)的pHUda1555,最终体积为100μl。将该扩增反应在C1000TouchTM热循环仪中孵育,编程为:1个循环,在94℃下持续2分钟;30个循环,每个循环在94℃下持续30秒,55℃下持续30秒,以及在72℃下持续30秒;并且保持4℃。通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳,将PCR产物进行分离,其中将0.5kb片段从该凝胶切离,并且使用凝胶提取试剂盒进行提取。将变性的探针直接添加至DIG Easy Hyb缓冲液中并且在42℃下进行过夜杂交。在杂交后洗涤(在2X SSC中、室温、5分钟洗涤两次;并且在0.1X SSC中、68℃洗涤两次,各15min),遵循制造商的方案,使用DIG检测系统和CPD-Star(罗氏公司)进行化学发光检测。DIG-标记的DNA分子量标记II(罗氏公司)被用于标准标记。
选择分别从M1405-1701和1685-1701-11产生的,各自具有在四个基因座处(在6.0kb、6.3kb、7.3kb、9.4kb的大小的四个杂交带)正确整合的两种菌株(1701-1694-1和1685-1701-1694-18),用于随后的实验。参见图1。
实例8:在摇瓶培养中的AP025蛋白酶表达评价
在30℃下,将黑曲霉菌株C3105-1657-8、1685-1657-16、1701-1694-1、和1685-1701-1694-18在COVE-N-gly板上培养约一周。使用无菌移液管将来自每个板的一块小塞子打洞,将其各自接种到在500ml烧瓶中的100ml的MSS培养基中。将这些烧瓶在30℃下以200rpm孵育3天。然后,将10ml的培养液转移至在500ml烧瓶中的100ml的MU1glu培养基中。将这些烧瓶在30℃下以200rpm孵育6天。将每个培养物在10ml试管中以5,000rpm离心10分钟,并且回收培养物上清液,用于确定蛋白酶生产力。使用Quick StartTM布拉德福德(Bradford)蛋白测定试剂盒(伯乐公司(Bio-Rad inc.))进行该蛋白酶生产力测定。将培养物上清液在蒸馏水中适当稀释。使用若干步骤在蒸馏水中稀释牛血清白蛋白(WAKO目录号519-83921),起始于0.5mg/ml浓度并且结束于0.1mg/ml浓度。将包括标准品的每个稀释的五μl转移至96孔平底板中。将250μl 1x的染料试剂溶液添加至每个孔中,然后在室温下孵育5分钟。在595nm下测量反应的终点。通过从产生的标准曲线外推,并且与设置在100%的黑曲霉菌株C3105-1685-8相比来确定全部蛋白生产力。
agsA和agsE双基因破坏的菌株相比参照菌株黑曲霉菌株C3105-1657-8给出23%更高的AP025生产力,尽管单个ags或agsE基因破坏的菌株与在摇瓶中的亲本参照菌株黑曲霉菌株C3105-1657-8相比示出可比较的或略微更低的蛋白酶AP025生产力(表1)。
表1:在摇瓶培养物中的AP025蛋白酶生产力。
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 丝状真菌双重突变体宿主细胞
<130> NZ12887-WO-PCT
<160> 24
<170> PatentIn版本3.5
<210> 1
<211> 7368
<212> DNA
<213> 黑曲霉
<400> 1
atgttcggca cgacggttca gcgctgcgtg gtgctcattc tggggatact cagcgtcacg 60
accgtgggct ggccctacga tgagtcgctc gttgattaca acctgaacga gaacaagacc 120
gcagagggac cgataaacta ttggggagaa tggccagatc acacctatca tccgtcacca 180
gacaactggc gcttccccat ctataccatc ttcctggatc gcatcgccaa cggagatccc 240
gctaatgacg atattaacgg caccacctac gagcatgtac tcgattcgaa tcagatgcgc 300
catggcggtg acctagtcgg cttgattgac acgctcgatt acatcagagg catgggcttc 360
aaggtgagtc tattccattg atatcagttc ccggtccatc cttgactgac tgactgatca 420
ttctagggaa tctacttcgc tggtacgggc ttgatgaatc ttccctgggg ctacgatggt 480
tactccccgg tggataccac cctcctcgac aagcaccatg gcaccctgtc cgactggagg 540
cggaccatca aggagatcca cgaccgggat atgtatgtga tcatggataa tacattagca 600
acgtgagtat gcaccgagta ttctagacga ccatgccact aacaatctcc ccgtgcagtt 660
tgagtaacct gatcggtttc aagggccact tgaacgattc ggctgatttc aatgcgaaag 720
agtacgaggt ggagtacgtc accgagagaa cgtacgccga tttccagttc agcaatgact 780
acaatgacac ctgcaactac ccgaaattct ggaacgagac gggatacccg ttgacgtccg 840
gtggcgtgca agacctgaag ggttgctaca acagtgattt cgatcagtat ggcgaactcg 900
aggcgtttgg taatttcccc gactggaagc gacagctcac gaaattcgct tcggtgcaag 960
atcgtctgcg agaatggcac aagccggttc gcgatgtcat cacccggcat tcctgcattg 1020
tgatcgccag tttggacatt gatggcttcc ggtttgataa ggccgtccag gccactctgg 1080
atccgctggg tgacatgcta gcggtctacc gtgaatgtgc caagcaatat ggcaagaaga 1140
acttcttcct gccgggagag atcacttcgg gaaacacctt tggtagtctc tatcttggcc 1200
ggggtcgtca gccaaaccag acgcccgatt cggcagacgc tggcgcgaag ttgacgaatg 1260
cttcgtcgga ttcctacttc ctccgcgatg atggcctgca ggcgttggac gctgcagcct 1320
ttcactacac catctatcgt tcgatgaccc gtttcctggg aatggacggg aacctggtgg 1380
ccggctttga cctgcccact gatttcatcg aagcctggaa tggcatgctc gtcactaacg 1440
acttcatcaa tgccttcacg ggcgagttgg atcccagaca tatgtatgga gtgtcgaacc 1500
aggataactt tcgctggccc gccatcaaga atggtacgga gaaatacctg ctgggtctat 1560
acattgttac gctggagctg ccgggaatcc ctttggttct ctggggcgag gagcaggaga 1620
tgtacgtgtt cgatgcgact gcgtccaact atctgttcgg tcggcaaccc atgacttacc 1680
agacggcgtg gtggacgcat ggctgcttct cgctaaacac ctcgaaattc tacgatttcc 1740
ccaacgacaa gggattgaat ggttgcaacg atatcacagt gacttacgac caacggaatc 1800
cggcgcaccc ccttcgcaac atcatgaagc gcatgtttga gattcgggag cagtacccag 1860
tggccaatga tggcttcaac cttgagacca tttcccagct tacccaggat atctatcttc 1920
cgggttcatc gactaccccg acggtgactg gtctctggtc agtgctgcgc agctactacc 1980
ccggggttca gaaagaggcc tcgagtagca acgatactct ttggcttgta tatcataatg 2040
ccaataaaac ggaaacctat ggcaagaact gtactagcaa ggactccgct cttctgtccc 2100
cttacgagtc gggcacgaag ttgaaaaacc tcttctatcc ctacgatgaa ctcacgctgc 2160
aggatggacc aagtgacgct agcaacggca ccgagtccta cgggtgcacg accaacatga 2220
aattgctgcc atgggaattc cgggcttacg tcaaggcgag cgacttcgtt gaacctggcc 2280
ctaccgtcac cgagtttgtc cccggccacg atgctcgcct gctgtcttcc gaggatactg 2340
gggaaacact gaagatccag ctgggctact ccaaggccat ggactgcagt gccatcacga 2400
aagcagtctc cctgaattcg accaccgtca agggcgtcaa tgccaccctt gacacctcta 2460
gcgtgagctg caccaacgtc accgccagga cgagcagtaa taactacatc ggcgaggttc 2520
ccactgtttg gacctggtcc gcgaacctga caaacgtcta tcacggaatc caccagctca 2580
ccgtcaagaa tgcctccacg acgtctggaa cgcgcgtaga tgccatcgac cgctttttat 2640
tccgagtcgg aacccacacc aacccgttaa tatcgccact ggccaactac tctaccagcc 2700
tcgtccatca gtcggataac ggcagctact atgttcagca tgatgcggcc ggcgctgacc 2760
agttccgcta cacgaccgac tttggcctga actggtccaa ctggacagac tacactggtg 2820
gtaacacgac gattgaattt ccgacttgga ccggcacaga tgctcaaaag tgggagggca 2880
ctcacattcg cgtccagtat ttctcccgcc ttaccggcag cagtgattac atccaggagg 2940
gtgattatga ctgggaatcc ggtgtccctc gcagatttcc ccatctgtgg tggaatggcc 3000
cgtacaacca atacggttat gatgccggtc tggacagcaa gatgcggttt gatactaagg 3060
atcgccgctg gaaatatgat ttcgtttatg aatggccgtc cgtcggacag atcagtgtct 3120
ggggcactgg caaggacggt gttccggaga caacgaatgt ttatggcgat gttgacaact 3180
catcggttgt acaggtcttg cctccctcct acttgtcgtc gaacgtgatt aatatcaccg 3240
agctgccccc cttcccgcac cttggctgga ccatctctct caatgatgcc aacctccgct 3300
atgaattgct tccggtcgga tctggatggg cccagctggt actttacatc cttctctggg 3360
tcgtccctat cttgatgggg ctggcgggag ttttcatctt catccgcacc ttctaccgtg 3420
ttgagctgaa taccgatggc aatgttgtta aggaggacaa gctgccgctg ttgttctggc 3480
gcaggatgaa gggccaatct ggaggtgatg gccagatgga ccgggaagaa tcagatgtcg 3540
ccgccgtggc aggcgaaatg gccattgcag gagcccccga gaaacgccgc acggtcttga 3600
tcgccaccat ggagtacgat attgcggatt ggcaggccaa ggtcaagatt ggtggtctgg 3660
gagtcatggc ccagctcatg tcccaaaacc tgggatatca gaatcttatc tgggtggttc 3720
cctgcgtggg agacatcgaa tatcccgagg ataccccgac agagccatac atcgtgaaga 3780
tcctcgacaa cccctatctc gtcaatgtgc agtatcacgt tctcaacaat atcacctacg 3840
tccttcttga cgctcctgtg ttccgccagc agacaaaagc cgagccgtat cctccccgca 3900
tggatgacct ggatagcgcc atttactact ccgcctggaa ccaatgtatc gcagagacca 3960
tcaagcgctt cccgtccatc gatctgtatc acatcaacga tttccacgga tgcctggcac 4020
cgttgtacct cctgcccaca cgcacgatcc ccgtgtgttt gtctctccac aacgccgagt 4080
tccagggtct ctggcccctc cggacccagc aagaaaagaa ggaagtctgt tcggtcttca 4140
acctccccgt cgagacggct accaaatatt gtcaattcgg taatgtgttc aacttgcttc 4200
acacaggagc gagttacctt cggttccatc agcgcgggtt tggcgcggtc ggtgtgtcaa 4260
agaagtacgg aaagcgttcc tgggctcggt atcctatttt ctggagtttg gacaagatcg 4320
gtagtctgcc caaccctgac ccaactgata cggcggccct ggaggatact cctgacgaga 4380
aagctctgac tcggtcatat gaggaacgga tcactgacaa gctcgaggcc cagaagtggg 4440
ctggcctgac cgaggatcgc aacgccgacc tcctggtgtt cgtcggtcgc tggtctaagc 4500
agaagggtgt cgatctgatt gcggatgtca tccccgccgt tctgtctgac cggccgcagg 4560
tgcaggtgat ctgtgttggt cccatcatcg atctttacgg aagactggct gccattaagc 4620
tggagaagat cgctgccatg ttccctggcc gggtcttctc ccgacctgag ttcactgctt 4680
tgcccccgtg tgtcttctct ggcgctgact tcgctctgat cccgtctcgt gatgagccat 4740
ttggattgat tgccgttgag ttcggtcgga agggtgcact gggaatcgga tctcgcatcg 4800
gaggtttggg tcagatgcca ggctggtggt acaccgttga atcagacgcc actcgccatc 4860
ttctacacca gctgaagact gcgatcaaat ctgccctgga ttcgactcct gaaactcgag 4920
cccagatgcg cgcaaactcc gctaagcagc gattccccgt tctcgagtgg atccagaaac 4980
tcgagacttt gcagcggaca tcgatcaaga ttcatcatga caagaacaag gacaccgtga 5040
ctggttcgat cccggagtct gagagcgtat gggacctgca aaaccttcag agtgcgcgct 5100
attccagtgt ggcacttcct aatatggctc tgtccagagc ggacggcacg gaaaccccgc 5160
ctgaagccat gatccagcag gcccacgctc gccttcaaga gatccaggca tccgagggaa 5220
gcagtcgcga cagcagcctc aaccgcaaac tgtcactggg tcgccggtcc ggccctggtc 5280
agggcagaaa gcgcttgacg aagaggcaag cgaccgcaag ccaggcatcc actgatcacg 5340
gagaagatga gaacgatacc gacgctgacg acgaccacac caggccgcag gaggattaca 5400
tttctcccga ggaggccatg caggccgtta acaacactct aactccccat gctatcactg 5460
gagacagtac tccccgcgcc tcctacttgt ctagacccgt atccccgtac cccatctcac 5520
agatctctac tccagcgtgc ccgacaccgc cacccatgac tcacttccgg accgtttcta 5580
tgctgtcgtt gccatccgtt gttggggacc ataaccgcct cagcagtctc ggcggcgagg 5640
agcagaacca gcccgtcttc gagttgcaga aggtggaccc gactttcacg gacagcttgg 5700
gccacttcac ccggcgcttc gagcagtcgc ttgagaagtt gaacaagaag aactccatca 5760
cggactattg cattgaggtc tatctgatga agagtgagcg caagttctac aattcataca 5820
acgacgccca gcttaagaag cagcctaaga accgttcgct cgcggttccc agctctgaga 5880
gtgttgtgca agaagggccc ggtggctcag tcgttcgtca ctcgtactcc agtgaggatt 5940
ctgaaatcaa tggggaggat gagattgacc gctggctgat gcggttgggt tacacgcgtc 6000
cgatcgcagt tcagcgattc atgagacgcc gcttgggcaa ttggccagtg tattcactat 6060
tcctgggtct gggtcagatc atcgccacca actccgcaca aatcaccctg cttgtcggcc 6120
aggtcggaga gaccgctgtg aagctttatg tcatcgccgc tatctactgc ctgtcctcca 6180
tcgcgtggtg gttcctgtat catcggttcc cagccgtcat ctccctcagt cttccctggt 6240
tcatctactg catggcattc atcgttatcg gtgtttcacc cttcggtctc acggctctcg 6300
gtcgggcctg ggctcagaat gttgcggctg gcgtctacgc cattgcgtcg tctagcggtt 6360
ccttgttctt cgctctgaac tttggagacc agggtgccgt ccctgtcaag gactggatgt 6420
tccgcgccag tatcattcaa ggtatctcac agatctacac ggtcgcgctc tggttctgga 6480
gctccaaggt cactgccgcc gaagtgggag gtgtatctgt agcggccttg agctcctggc 6540
gtctcacggc cgtggtgatg cccattgctg ccctgtgctt cgtgatcgga gtcctgctgg 6600
ccctgggatt gcccaactac taccgtcaag ctcccagccg tatcctgttc ttctacaagt 6660
ctctgttccg ccgacgcatc atcctgtggt tcttcttcat ggtcatcgtc cagaactggt 6720
tccttgctgc cgctttcggc cgcaactggt ccttcctctg gtcgtccaaa cacaccaagc 6780
cctgggagat tgtcctcctt gtgttcggct tcttcgtcgt cctatgggta gtcattcttg 6840
tcatattccg tgccctgtcg aaggaacaca gctggatctt gccagttttc ggtctgagtc 6900
tgggtgctcc ccggtgggca caaacctggt ggggaacctc caacatcggc tactatctcc 6960
cttgggctgg cagcttggtg tcggggtcga tcgcttcccg ctgcctgtgg ctctggctgg 7020
gactccttga cgagatccaa caagtcggat tgggtatgat tctgctgcag accatgactc 7080
gcgtgcatgt ctgcttcgtc ctgttggccg cgcaagcact gggatccatc gccaccatct 7140
gcgcccgcgg cttcgcgccg aacaagattg gccctgggga tatctctccg gatgtgggca 7200
cgtcggtgga caaggtcggt aacgcatggt tctggatcgc tctcttcttc cagctcctgg 7260
caaggtaagc cttcccacac tttcttttct cacgcgagct ttatctaacg tttgaacagt 7320
tggggcttcc tgctcttcta ccgccgcgaa cagctcaacc gaccctaa 7368
<210> 2
<211> 7194
<212> DNA
<213> 黑曲霉
<220>
<221> CDS
<222> (1)..(7191)
<223> AgsA编码cDNA
<400> 2
atg ttc ggc acg acg gtt cag cgc tgc gtg gtg ctc att ctg ggg ata 48
Met Phe Gly Thr Thr Val Gln Arg Cys Val Val Leu Ile Leu Gly Ile
1 5 10 15
ctc agc gtc acg acc gtg ggc tgg ccc tac gat gag tcg ctc gtt gat 96
Leu Ser Val Thr Thr Val Gly Trp Pro Tyr Asp Glu Ser Leu Val Asp
20 25 30
tac aac ctg aac gag aac aag acc gca gag gga ccg ata aac tat tgg 144
Tyr Asn Leu Asn Glu Asn Lys Thr Ala Glu Gly Pro Ile Asn Tyr Trp
35 40 45
gga gaa tgg cca gat cac acc tat cat ccg tca cca gac aac tgg cgc 192
Gly Glu Trp Pro Asp His Thr Tyr His Pro Ser Pro Asp Asn Trp Arg
50 55 60
ttc ccc atc tat acc atc ttc ctg gat cgc atc gcc aac gga gat ccc 240
Phe Pro Ile Tyr Thr Ile Phe Leu Asp Arg Ile Ala Asn Gly Asp Pro
65 70 75 80
gct aat gac gat att aac ggc acc acc tac gag cat gta ctc gat tcg 288
Ala Asn Asp Asp Ile Asn Gly Thr Thr Tyr Glu His Val Leu Asp Ser
85 90 95
aat cag atg cgc cat ggc ggt gac cta gtc ggc ttg att gac acg ctc 336
Asn Gln Met Arg His Gly Gly Asp Leu Val Gly Leu Ile Asp Thr Leu
100 105 110
gat tac atc aga ggc atg ggc ttc aag gga atc tac ttc gct ggt acg 384
Asp Tyr Ile Arg Gly Met Gly Phe Lys Gly Ile Tyr Phe Ala Gly Thr
115 120 125
ggc ttg atg aat ctt ccc tgg ggc tac gat ggt tac tcc ccg gtg gat 432
Gly Leu Met Asn Leu Pro Trp Gly Tyr Asp Gly Tyr Ser Pro Val Asp
130 135 140
acc acc ctc ctc gac aag cac cat ggc acc ctg tcc gac tgg agg cgg 480
Thr Thr Leu Leu Asp Lys His His Gly Thr Leu Ser Asp Trp Arg Arg
145 150 155 160
acc atc aag gag atc cac gac cgg gat atg tat gtg atc atg gat aat 528
Thr Ile Lys Glu Ile His Asp Arg Asp Met Tyr Val Ile Met Asp Asn
165 170 175
aca tta gca act ttg agt aac ctg atc ggt ttc aag ggc cac ttg aac 576
Thr Leu Ala Thr Leu Ser Asn Leu Ile Gly Phe Lys Gly His Leu Asn
180 185 190
gat tcg gct gat ttc aat gcg aaa gag tac gag gtg gag tac gtc acc 624
Asp Ser Ala Asp Phe Asn Ala Lys Glu Tyr Glu Val Glu Tyr Val Thr
195 200 205
gag aga acg tac gcc gat ttc cag ttc agc aat gac tac aat gac acc 672
Glu Arg Thr Tyr Ala Asp Phe Gln Phe Ser Asn Asp Tyr Asn Asp Thr
210 215 220
tgc aac tac ccg aaa ttc tgg aac gag acg gga tac ccg ttg acg tcc 720
Cys Asn Tyr Pro Lys Phe Trp Asn Glu Thr Gly Tyr Pro Leu Thr Ser
225 230 235 240
ggt ggc gtg caa gac ctg aag ggt tgc tac aac agt gat ttc gat cag 768
Gly Gly Val Gln Asp Leu Lys Gly Cys Tyr Asn Ser Asp Phe Asp Gln
245 250 255
tat ggc gaa ctc gag gcg ttt ggt aat ttc ccc gac tgg aag cga cag 816
Tyr Gly Glu Leu Glu Ala Phe Gly Asn Phe Pro Asp Trp Lys Arg Gln
260 265 270
ctc acg aaa ttc gct tcg gtg caa gat cgt ctg cga gaa tgg cac aag 864
Leu Thr Lys Phe Ala Ser Val Gln Asp Arg Leu Arg Glu Trp His Lys
275 280 285
ccg gtt cgc gat gtc atc acc cgg cat tcc tgc att gtg atc gcc agt 912
Pro Val Arg Asp Val Ile Thr Arg His Ser Cys Ile Val Ile Ala Ser
290 295 300
ttg gac att gat ggc ttc cgg ttt gat aag gcc gtc cag gcc act ctg 960
Leu Asp Ile Asp Gly Phe Arg Phe Asp Lys Ala Val Gln Ala Thr Leu
305 310 315 320
gat ccg ctg ggt gac atg cta gcg gtc tac cgt gaa tgt gcc aag caa 1008
Asp Pro Leu Gly Asp Met Leu Ala Val Tyr Arg Glu Cys Ala Lys Gln
325 330 335
tat ggc aag aag aac ttc ttc ctg ccg gga gag atc act tcg gga aac 1056
Tyr Gly Lys Lys Asn Phe Phe Leu Pro Gly Glu Ile Thr Ser Gly Asn
340 345 350
acc ttt ggt agt ctc tat ctt ggc cgg ggt cgt cag cca aac cag acg 1104
Thr Phe Gly Ser Leu Tyr Leu Gly Arg Gly Arg Gln Pro Asn Gln Thr
355 360 365
ccc gat tcg gca gac gct ggc gcg aag ttg acg aat gct tcg tcg gat 1152
Pro Asp Ser Ala Asp Ala Gly Ala Lys Leu Thr Asn Ala Ser Ser Asp
370 375 380
tcc tac ttc ctc cgc gat gat ggc ctg cag gcg ttg gac gct gca gcc 1200
Ser Tyr Phe Leu Arg Asp Asp Gly Leu Gln Ala Leu Asp Ala Ala Ala
385 390 395 400
ttt cac tac acc atc tat cgt tcg atg acc cgt ttc ctg gga atg gac 1248
Phe His Tyr Thr Ile Tyr Arg Ser Met Thr Arg Phe Leu Gly Met Asp
405 410 415
ggg aac ctg gtg gcc ggc ttt gac ctg ccc act gat ttc atc gaa gcc 1296
Gly Asn Leu Val Ala Gly Phe Asp Leu Pro Thr Asp Phe Ile Glu Ala
420 425 430
tgg aat ggc atg ctc gtc act aac gac ttc atc aat gcc ttc acg ggc 1344
Trp Asn Gly Met Leu Val Thr Asn Asp Phe Ile Asn Ala Phe Thr Gly
435 440 445
gag ttg gat ccc aga cat atg tat gga gtg tcg aac cag gat aac ttt 1392
Glu Leu Asp Pro Arg His Met Tyr Gly Val Ser Asn Gln Asp Asn Phe
450 455 460
cgc tgg ccc gcc atc aag aat ggt acg gag aaa tac ctg ctg ggt cta 1440
Arg Trp Pro Ala Ile Lys Asn Gly Thr Glu Lys Tyr Leu Leu Gly Leu
465 470 475 480
tac att gtt acg ctg gag ctg ccg gga atc cct ttg gtt ctc tgg ggc 1488
Tyr Ile Val Thr Leu Glu Leu Pro Gly Ile Pro Leu Val Leu Trp Gly
485 490 495
gag gag cag gag atg tac gtg ttc gat gcg act gcg tcc aac tat ctg 1536
Glu Glu Gln Glu Met Tyr Val Phe Asp Ala Thr Ala Ser Asn Tyr Leu
500 505 510
ttc ggt cgg caa ccc atg act tac cag acg gcg tgg tgg acg cat ggc 1584
Phe Gly Arg Gln Pro Met Thr Tyr Gln Thr Ala Trp Trp Thr His Gly
515 520 525
tgc ttc tcg cta aac acc tcg aaa ttc tac gat ttc ccc aac gac aag 1632
Cys Phe Ser Leu Asn Thr Ser Lys Phe Tyr Asp Phe Pro Asn Asp Lys
530 535 540
gga ttg aat ggt tgc aac gat atc aca gtg act tac gac caa cgg aat 1680
Gly Leu Asn Gly Cys Asn Asp Ile Thr Val Thr Tyr Asp Gln Arg Asn
545 550 555 560
ccg gcg cac ccc ctt cgc aac atc atg aag cgc atg ttt gag att cgg 1728
Pro Ala His Pro Leu Arg Asn Ile Met Lys Arg Met Phe Glu Ile Arg
565 570 575
gag cag tac cca gtg gcc aat gat ggc ttc aac ctt gag acc att tcc 1776
Glu Gln Tyr Pro Val Ala Asn Asp Gly Phe Asn Leu Glu Thr Ile Ser
580 585 590
cag ctt acc cag gat atc tat ctt ccg ggt tca tcg act acc ccg acg 1824
Gln Leu Thr Gln Asp Ile Tyr Leu Pro Gly Ser Ser Thr Thr Pro Thr
595 600 605
gtg act ggt ctc tgg tca gtg ctg cgc agc tac tac ccc ggg gtt cag 1872
Val Thr Gly Leu Trp Ser Val Leu Arg Ser Tyr Tyr Pro Gly Val Gln
610 615 620
aaa gag gcc tcg agt agc aac gat act ctt tgg ctt gta tat cat aat 1920
Lys Glu Ala Ser Ser Ser Asn Asp Thr Leu Trp Leu Val Tyr His Asn
625 630 635 640
gcc aat aaa acg gaa acc tat ggc aag aac tgt act agc aag gac tcc 1968
Ala Asn Lys Thr Glu Thr Tyr Gly Lys Asn Cys Thr Ser Lys Asp Ser
645 650 655
gct ctt ctg tcc cct tac gag tcg ggc acg aag ttg aaa aac ctc ttc 2016
Ala Leu Leu Ser Pro Tyr Glu Ser Gly Thr Lys Leu Lys Asn Leu Phe
660 665 670
tat ccc tac gat gaa ctc acg ctg cag gat gga cca agt gac gct agc 2064
Tyr Pro Tyr Asp Glu Leu Thr Leu Gln Asp Gly Pro Ser Asp Ala Ser
675 680 685
aac ggc acc gag tcc tac ggg tgc acg acc aac atg aaa ttg ctg cca 2112
Asn Gly Thr Glu Ser Tyr Gly Cys Thr Thr Asn Met Lys Leu Leu Pro
690 695 700
tgg gaa ttc cgg gct tac gtc aag gcg agc gac ttc gtt gaa cct ggc 2160
Trp Glu Phe Arg Ala Tyr Val Lys Ala Ser Asp Phe Val Glu Pro Gly
705 710 715 720
cct acc gtc acc gag ttt gtc ccc ggc cac gat gct cgc ctg ctg tct 2208
Pro Thr Val Thr Glu Phe Val Pro Gly His Asp Ala Arg Leu Leu Ser
725 730 735
tcc gag gat act ggg gaa aca ctg aag atc cag ctg ggc tac tcc aag 2256
Ser Glu Asp Thr Gly Glu Thr Leu Lys Ile Gln Leu Gly Tyr Ser Lys
740 745 750
gcc atg gac tgc agt gcc atc acg aaa gca gtc tcc ctg aat tcg acc 2304
Ala Met Asp Cys Ser Ala Ile Thr Lys Ala Val Ser Leu Asn Ser Thr
755 760 765
acc gtc aag ggc gtc aat gcc acc ctt gac acc tct agc gtg agc tgc 2352
Thr Val Lys Gly Val Asn Ala Thr Leu Asp Thr Ser Ser Val Ser Cys
770 775 780
acc aac gtc acc gcc agg acg agc agt aat aac tac atc ggc gag gtt 2400
Thr Asn Val Thr Ala Arg Thr Ser Ser Asn Asn Tyr Ile Gly Glu Val
785 790 795 800
ccc act gtt tgg acc tgg tcc gcg aac ctg aca aac gtc tat cac gga 2448
Pro Thr Val Trp Thr Trp Ser Ala Asn Leu Thr Asn Val Tyr His Gly
805 810 815
atc cac cag ctc acc gtc aag aat gcc tcc acg acg tct gga acg cgc 2496
Ile His Gln Leu Thr Val Lys Asn Ala Ser Thr Thr Ser Gly Thr Arg
820 825 830
gta gat gcc atc gac cgc ttt tta ttc cga gtc gga acc cac acc aac 2544
Val Asp Ala Ile Asp Arg Phe Leu Phe Arg Val Gly Thr His Thr Asn
835 840 845
ccg tta ata tcg cca ctg gcc aac tac tct acc agc ctc gtc cat cag 2592
Pro Leu Ile Ser Pro Leu Ala Asn Tyr Ser Thr Ser Leu Val His Gln
850 855 860
tcg gat aac ggc agc tac tat gtt cag cat gat gcg gcc ggc gct gac 2640
Ser Asp Asn Gly Ser Tyr Tyr Val Gln His Asp Ala Ala Gly Ala Asp
865 870 875 880
cag ttc cgc tac acg acc gac ttt ggc ctg aac tgg tcc aac tgg aca 2688
Gln Phe Arg Tyr Thr Thr Asp Phe Gly Leu Asn Trp Ser Asn Trp Thr
885 890 895
gac tac act ggt ggt aac acg acg att gaa ttt ccg act tgg acc ggc 2736
Asp Tyr Thr Gly Gly Asn Thr Thr Ile Glu Phe Pro Thr Trp Thr Gly
900 905 910
aca gat gct caa aag tgg gag ggc act cac att cgc gtc cag tat ttc 2784
Thr Asp Ala Gln Lys Trp Glu Gly Thr His Ile Arg Val Gln Tyr Phe
915 920 925
tcc cgc ctt acc ggc agc agt gat tac atc cag gag ggt gat tat gac 2832
Ser Arg Leu Thr Gly Ser Ser Asp Tyr Ile Gln Glu Gly Asp Tyr Asp
930 935 940
tgg gaa tcc ggt gtc cct cgc aga ttt ccc cat ctg tgg tgg aat ggc 2880
Trp Glu Ser Gly Val Pro Arg Arg Phe Pro His Leu Trp Trp Asn Gly
945 950 955 960
ccg tac aac caa tac ggt tat gat gcc ggt ctg gac agc aag atg cgg 2928
Pro Tyr Asn Gln Tyr Gly Tyr Asp Ala Gly Leu Asp Ser Lys Met Arg
965 970 975
ttt gat act aag gat cgc cgc tgg aaa tat gat ttc gtt tat gaa tgg 2976
Phe Asp Thr Lys Asp Arg Arg Trp Lys Tyr Asp Phe Val Tyr Glu Trp
980 985 990
ccg tcc gtc gga cag atc agt gtc tgg ggc act ggc aag gac ggt gtt 3024
Pro Ser Val Gly Gln Ile Ser Val Trp Gly Thr Gly Lys Asp Gly Val
995 1000 1005
ccg gag aca acg aat gtt tat ggc gat gtt gac aac tca tcg gtt 3069
Pro Glu Thr Thr Asn Val Tyr Gly Asp Val Asp Asn Ser Ser Val
1010 1015 1020
gta cag gtc ttg cct ccc tcc tac ttg tcg tcg aac gtg att aat 3114
Val Gln Val Leu Pro Pro Ser Tyr Leu Ser Ser Asn Val Ile Asn
1025 1030 1035
atc acc gag ctg ccc ccc ttc ccg cac ctt ggc tgg acc atc tct 3159
Ile Thr Glu Leu Pro Pro Phe Pro His Leu Gly Trp Thr Ile Ser
1040 1045 1050
ctc aat gat gcc aac ctc cgc tat gaa ttg ctt ccg gtc gga tct 3204
Leu Asn Asp Ala Asn Leu Arg Tyr Glu Leu Leu Pro Val Gly Ser
1055 1060 1065
gga tgg gcc cag ctg gta ctt tac atc ctt ctc tgg gtc gtc cct 3249
Gly Trp Ala Gln Leu Val Leu Tyr Ile Leu Leu Trp Val Val Pro
1070 1075 1080
atc ttg atg ggg ctg gcg gga gtt ttc atc ttc atc cgc acc ttc 3294
Ile Leu Met Gly Leu Ala Gly Val Phe Ile Phe Ile Arg Thr Phe
1085 1090 1095
tac cgt gtt gag ctg aat acc gat ggc aat gtt gtt aag gag gac 3339
Tyr Arg Val Glu Leu Asn Thr Asp Gly Asn Val Val Lys Glu Asp
1100 1105 1110
aag ctg ccg ctg ttg ttc tgg cgc agg atg aag ggc caa tct gga 3384
Lys Leu Pro Leu Leu Phe Trp Arg Arg Met Lys Gly Gln Ser Gly
1115 1120 1125
ggt gat ggc cag atg gac cgg gaa gaa tca gat gtc gcc gcc gtg 3429
Gly Asp Gly Gln Met Asp Arg Glu Glu Ser Asp Val Ala Ala Val
1130 1135 1140
gca ggc gaa atg gcc att gca gga gcc ccc gag aaa cgc cgc acg 3474
Ala Gly Glu Met Ala Ile Ala Gly Ala Pro Glu Lys Arg Arg Thr
1145 1150 1155
gtc ttg atc gcc acc atg gag tac gat att gcg gat tgg cag gcc 3519
Val Leu Ile Ala Thr Met Glu Tyr Asp Ile Ala Asp Trp Gln Ala
1160 1165 1170
aag gtc aag att ggt ggt ctg gga gtc atg gcc cag ctc atg tcc 3564
Lys Val Lys Ile Gly Gly Leu Gly Val Met Ala Gln Leu Met Ser
1175 1180 1185
caa aac ctg gga tat cag aat ctt atc tgg gtg gtt ccc tgc gtg 3609
Gln Asn Leu Gly Tyr Gln Asn Leu Ile Trp Val Val Pro Cys Val
1190 1195 1200
gga gac atc gaa tat ccc gag gat acc ccg aca gag cca tac atc 3654
Gly Asp Ile Glu Tyr Pro Glu Asp Thr Pro Thr Glu Pro Tyr Ile
1205 1210 1215
gtg aag atc ctc gac aac ccc tat ctc gtc aat gtg cag tat cac 3699
Val Lys Ile Leu Asp Asn Pro Tyr Leu Val Asn Val Gln Tyr His
1220 1225 1230
gtt ctc aac aat atc acc tac gtc ctt ctt gac gct cct gtg ttc 3744
Val Leu Asn Asn Ile Thr Tyr Val Leu Leu Asp Ala Pro Val Phe
1235 1240 1245
cgc cag cag aca aaa gcc gag ccg tat cct ccc cgc atg gat gac 3789
Arg Gln Gln Thr Lys Ala Glu Pro Tyr Pro Pro Arg Met Asp Asp
1250 1255 1260
ctg gat agc gcc att tac tac tcc gcc tgg aac caa tgt atc gca 3834
Leu Asp Ser Ala Ile Tyr Tyr Ser Ala Trp Asn Gln Cys Ile Ala
1265 1270 1275
gag acc atc aag cgc ttc ccg tcc atc gat ctg tat cac atc aac 3879
Glu Thr Ile Lys Arg Phe Pro Ser Ile Asp Leu Tyr His Ile Asn
1280 1285 1290
gat ttc cac gga tgc ctg gca ccg ttg tac ctc ctg ccc aca cgc 3924
Asp Phe His Gly Cys Leu Ala Pro Leu Tyr Leu Leu Pro Thr Arg
1295 1300 1305
acg atc ccc gtg tgt ttg tct ctc cac aac gcc gag ttc cag ggt 3969
Thr Ile Pro Val Cys Leu Ser Leu His Asn Ala Glu Phe Gln Gly
1310 1315 1320
ctc tgg ccc ctc cgg acc cag caa gaa aag aag gaa gtc tgt tcg 4014
Leu Trp Pro Leu Arg Thr Gln Gln Glu Lys Lys Glu Val Cys Ser
1325 1330 1335
gtc ttc aac ctc ccc gtc gag acg gct acc aaa tat tgt caa ttc 4059
Val Phe Asn Leu Pro Val Glu Thr Ala Thr Lys Tyr Cys Gln Phe
1340 1345 1350
ggt aat gtg ttc aac ttg ctt cac aca gga gcg agt tac ctt cgg 4104
Gly Asn Val Phe Asn Leu Leu His Thr Gly Ala Ser Tyr Leu Arg
1355 1360 1365
ttc cat cag cgc ggg ttt ggc gcg gtc ggt gtg tca aag aag tac 4149
Phe His Gln Arg Gly Phe Gly Ala Val Gly Val Ser Lys Lys Tyr
1370 1375 1380
gga aag cgt tcc tgg gct cgg tat cct att ttc tgg agt ttg gac 4194
Gly Lys Arg Ser Trp Ala Arg Tyr Pro Ile Phe Trp Ser Leu Asp
1385 1390 1395
aag atc ggt agt ctg ccc aac cct gac cca act gat acg gcg gcc 4239
Lys Ile Gly Ser Leu Pro Asn Pro Asp Pro Thr Asp Thr Ala Ala
1400 1405 1410
ctg gag gat act cct gac gag aaa gct ctg act cgg tca tat gag 4284
Leu Glu Asp Thr Pro Asp Glu Lys Ala Leu Thr Arg Ser Tyr Glu
1415 1420 1425
gaa cgg atc act gac aag ctc gag gcc cag aag tgg gct ggc ctg 4329
Glu Arg Ile Thr Asp Lys Leu Glu Ala Gln Lys Trp Ala Gly Leu
1430 1435 1440
acc gag gat cgc aac gcc gac ctc ctg gtg ttc gtc ggt cgc tgg 4374
Thr Glu Asp Arg Asn Ala Asp Leu Leu Val Phe Val Gly Arg Trp
1445 1450 1455
tct aag cag aag ggt gtc gat ctg att gcg gat gtc atc ccc gcc 4419
Ser Lys Gln Lys Gly Val Asp Leu Ile Ala Asp Val Ile Pro Ala
1460 1465 1470
gtt ctg tct gac cgg ccg cag gtg cag gtg atc tgt gtt ggt ccc 4464
Val Leu Ser Asp Arg Pro Gln Val Gln Val Ile Cys Val Gly Pro
1475 1480 1485
atc atc gat ctt tac gga aga ctg gct gcc att aag ctg gag aag 4509
Ile Ile Asp Leu Tyr Gly Arg Leu Ala Ala Ile Lys Leu Glu Lys
1490 1495 1500
atc gct gcc atg ttc cct ggc cgg gtc ttc tcc cga cct gag ttc 4554
Ile Ala Ala Met Phe Pro Gly Arg Val Phe Ser Arg Pro Glu Phe
1505 1510 1515
act gct ttg ccc ccg tgt gtc ttc tct ggc gct gac ttc gct ctg 4599
Thr Ala Leu Pro Pro Cys Val Phe Ser Gly Ala Asp Phe Ala Leu
1520 1525 1530
atc ccg tct cgt gat gag cca ttt gga ttg att gcc gtt gag ttc 4644
Ile Pro Ser Arg Asp Glu Pro Phe Gly Leu Ile Ala Val Glu Phe
1535 1540 1545
ggt cgg aag ggt gca ctg gga atc gga tct cgc atc gga ggt ttg 4689
Gly Arg Lys Gly Ala Leu Gly Ile Gly Ser Arg Ile Gly Gly Leu
1550 1555 1560
ggt cag atg cca ggc tgg tgg tac acc gtt gaa tca gac gcc act 4734
Gly Gln Met Pro Gly Trp Trp Tyr Thr Val Glu Ser Asp Ala Thr
1565 1570 1575
cgc cat ctt cta cac cag ctg aag act gcg atc aaa tct gcc ctg 4779
Arg His Leu Leu His Gln Leu Lys Thr Ala Ile Lys Ser Ala Leu
1580 1585 1590
gat tcg act cct gaa act cga gcc cag atg cgc gca aac tcc gct 4824
Asp Ser Thr Pro Glu Thr Arg Ala Gln Met Arg Ala Asn Ser Ala
1595 1600 1605
aag cag cga ttc ccc gtt ctc gag tgg atc cag aaa ctc gag act 4869
Lys Gln Arg Phe Pro Val Leu Glu Trp Ile Gln Lys Leu Glu Thr
1610 1615 1620
ttg cag cgg aca tcg atc aag att cat cat gac aag aac aag gac 4914
Leu Gln Arg Thr Ser Ile Lys Ile His His Asp Lys Asn Lys Asp
1625 1630 1635
acc gtg act ggt tcg atc ccg gag tct gag agc gta tgg gac ctg 4959
Thr Val Thr Gly Ser Ile Pro Glu Ser Glu Ser Val Trp Asp Leu
1640 1645 1650
caa aac ctt cag agt gcg cgc tat tcc agt gtg gca ctt cct aat 5004
Gln Asn Leu Gln Ser Ala Arg Tyr Ser Ser Val Ala Leu Pro Asn
1655 1660 1665
atg gct ctg tcc aga gcg gac ggc acg gaa acc ccg cct gaa gcc 5049
Met Ala Leu Ser Arg Ala Asp Gly Thr Glu Thr Pro Pro Glu Ala
1670 1675 1680
atg atc cag cag gcc cac gct cgc ctt caa gag atc cag gca tcc 5094
Met Ile Gln Gln Ala His Ala Arg Leu Gln Glu Ile Gln Ala Ser
1685 1690 1695
gag gga agc agt cgc gac agc agc ctc aac cgc aaa ctg tca ctg 5139
Glu Gly Ser Ser Arg Asp Ser Ser Leu Asn Arg Lys Leu Ser Leu
1700 1705 1710
ggt cgc cgg tcc ggc cct ggt cag ggc aga aag cgc ttg acg aag 5184
Gly Arg Arg Ser Gly Pro Gly Gln Gly Arg Lys Arg Leu Thr Lys
1715 1720 1725
agg caa gcg acc gca agc cag gca tcc act gat cac gga gaa gat 5229
Arg Gln Ala Thr Ala Ser Gln Ala Ser Thr Asp His Gly Glu Asp
1730 1735 1740
gag aac gat acc gac gct gac gac gac cac acc agg ccg cag gag 5274
Glu Asn Asp Thr Asp Ala Asp Asp Asp His Thr Arg Pro Gln Glu
1745 1750 1755
gat tac att tct ccc gag gag gcc atg cag gcc gtt aac aac act 5319
Asp Tyr Ile Ser Pro Glu Glu Ala Met Gln Ala Val Asn Asn Thr
1760 1765 1770
cta act ccc cat gct atc act gga gac agt act ccc cgc gcc tcc 5364
Leu Thr Pro His Ala Ile Thr Gly Asp Ser Thr Pro Arg Ala Ser
1775 1780 1785
tac ttg tct aga ccc gta tcc ccg tac ccc atc tca cag atc tct 5409
Tyr Leu Ser Arg Pro Val Ser Pro Tyr Pro Ile Ser Gln Ile Ser
1790 1795 1800
act cca gcg tgc ccg aca ccg cca ccc atg act cac ttc cgg acc 5454
Thr Pro Ala Cys Pro Thr Pro Pro Pro Met Thr His Phe Arg Thr
1805 1810 1815
gtt tct atg ctg tcg ttg cca tcc gtt gtt ggg gac cat aac cgc 5499
Val Ser Met Leu Ser Leu Pro Ser Val Val Gly Asp His Asn Arg
1820 1825 1830
ctc agc agt ctc ggc ggc gag gag cag aac cag ccc gtc ttc gag 5544
Leu Ser Ser Leu Gly Gly Glu Glu Gln Asn Gln Pro Val Phe Glu
1835 1840 1845
ttg cag aag gtg gac ccg act ttc acg gac agc ttg ggc cac ttc 5589
Leu Gln Lys Val Asp Pro Thr Phe Thr Asp Ser Leu Gly His Phe
1850 1855 1860
acc cgg cgc ttc gag cag tcg ctt gag aag ttg aac aag aag aac 5634
Thr Arg Arg Phe Glu Gln Ser Leu Glu Lys Leu Asn Lys Lys Asn
1865 1870 1875
tcc atc acg gac tat tgc att gag gtc tat ctg atg aag agt gag 5679
Ser Ile Thr Asp Tyr Cys Ile Glu Val Tyr Leu Met Lys Ser Glu
1880 1885 1890
cgc aag ttc tac aat tca tac aac gac gcc cag ctt aag aag cag 5724
Arg Lys Phe Tyr Asn Ser Tyr Asn Asp Ala Gln Leu Lys Lys Gln
1895 1900 1905
cct aag aac cgt tcg ctc gcg gtt ccc agc tct gag agt gtt gtg 5769
Pro Lys Asn Arg Ser Leu Ala Val Pro Ser Ser Glu Ser Val Val
1910 1915 1920
caa gaa ggg ccc ggt ggc tca gtc gtt cgt cac tcg tac tcc agt 5814
Gln Glu Gly Pro Gly Gly Ser Val Val Arg His Ser Tyr Ser Ser
1925 1930 1935
gag gat tct gaa atc aat ggg gag gat gag att gac cgc tgg ctg 5859
Glu Asp Ser Glu Ile Asn Gly Glu Asp Glu Ile Asp Arg Trp Leu
1940 1945 1950
atg cgg ttg ggt tac acg cgt ccg atc gca gtt cag cga ttc atg 5904
Met Arg Leu Gly Tyr Thr Arg Pro Ile Ala Val Gln Arg Phe Met
1955 1960 1965
aga cgc cgc ttg ggc aat tgg cca gtg tat tca cta ttc ctg ggt 5949
Arg Arg Arg Leu Gly Asn Trp Pro Val Tyr Ser Leu Phe Leu Gly
1970 1975 1980
ctg ggt cag atc atc gcc acc aac tcc gca caa atc acc ctg ctt 5994
Leu Gly Gln Ile Ile Ala Thr Asn Ser Ala Gln Ile Thr Leu Leu
1985 1990 1995
gtc ggc cag gtc gga gag acc gct gtg aag ctt tat gtc atc gcc 6039
Val Gly Gln Val Gly Glu Thr Ala Val Lys Leu Tyr Val Ile Ala
2000 2005 2010
gct atc tac tgc ctg tcc tcc atc gcg tgg tgg ttc ctg tat cat 6084
Ala Ile Tyr Cys Leu Ser Ser Ile Ala Trp Trp Phe Leu Tyr His
2015 2020 2025
cgg ttc cca gcc gtc atc tcc ctc agt ctt ccc tgg ttc atc tac 6129
Arg Phe Pro Ala Val Ile Ser Leu Ser Leu Pro Trp Phe Ile Tyr
2030 2035 2040
tgc atg gca ttc atc gtt atc ggt gtt tca ccc ttc ggt ctc acg 6174
Cys Met Ala Phe Ile Val Ile Gly Val Ser Pro Phe Gly Leu Thr
2045 2050 2055
gct ctc ggt cgg gcc tgg gct cag aat gtt gcg gct ggc gtc tac 6219
Ala Leu Gly Arg Ala Trp Ala Gln Asn Val Ala Ala Gly Val Tyr
2060 2065 2070
gcc att gcg tcg tct agc ggt tcc ttg ttc ttc gct ctg aac ttt 6264
Ala Ile Ala Ser Ser Ser Gly Ser Leu Phe Phe Ala Leu Asn Phe
2075 2080 2085
gga gac cag ggt gcc gtc cct gtc aag gac tgg atg ttc cgc gcc 6309
Gly Asp Gln Gly Ala Val Pro Val Lys Asp Trp Met Phe Arg Ala
2090 2095 2100
agt atc att caa ggt atc tca cag atc tac acg gtc gcg ctc tgg 6354
Ser Ile Ile Gln Gly Ile Ser Gln Ile Tyr Thr Val Ala Leu Trp
2105 2110 2115
ttc tgg agc tcc aag gtc act gcc gcc gaa gtg gga ggt gta tct 6399
Phe Trp Ser Ser Lys Val Thr Ala Ala Glu Val Gly Gly Val Ser
2120 2125 2130
gta gcg gcc ttg agc tcc tgg cgt ctc acg gcc gtg gtg atg ccc 6444
Val Ala Ala Leu Ser Ser Trp Arg Leu Thr Ala Val Val Met Pro
2135 2140 2145
att gct gcc ctg tgc ttc gtg atc gga gtc ctg ctg gcc ctg gga 6489
Ile Ala Ala Leu Cys Phe Val Ile Gly Val Leu Leu Ala Leu Gly
2150 2155 2160
ttg ccc aac tac tac cgt caa gct ccc agc cgt atc ctg ttc ttc 6534
Leu Pro Asn Tyr Tyr Arg Gln Ala Pro Ser Arg Ile Leu Phe Phe
2165 2170 2175
tac aag tct ctg ttc cgc cga cgc atc atc ctg tgg ttc ttc ttc 6579
Tyr Lys Ser Leu Phe Arg Arg Arg Ile Ile Leu Trp Phe Phe Phe
2180 2185 2190
atg gtc atc gtc cag aac tgg ttc ctt gct gcc gct ttc ggc cgc 6624
Met Val Ile Val Gln Asn Trp Phe Leu Ala Ala Ala Phe Gly Arg
2195 2200 2205
aac tgg tcc ttc ctc tgg tcg tcc aaa cac acc aag ccc tgg gag 6669
Asn Trp Ser Phe Leu Trp Ser Ser Lys His Thr Lys Pro Trp Glu
2210 2215 2220
att gtc ctc ctt gtg ttc ggc ttc ttc gtc gtc cta tgg gta gtc 6714
Ile Val Leu Leu Val Phe Gly Phe Phe Val Val Leu Trp Val Val
2225 2230 2235
att ctt gtc ata ttc cgt gcc ctg tcg aag gaa cac agc tgg atc 6759
Ile Leu Val Ile Phe Arg Ala Leu Ser Lys Glu His Ser Trp Ile
2240 2245 2250
ttg cca gtt ttc ggt ctg agt ctg ggt gct ccc cgg tgg gca caa 6804
Leu Pro Val Phe Gly Leu Ser Leu Gly Ala Pro Arg Trp Ala Gln
2255 2260 2265
acc tgg tgg gga acc tcc aac atc ggc tac tat ctc cct tgg gct 6849
Thr Trp Trp Gly Thr Ser Asn Ile Gly Tyr Tyr Leu Pro Trp Ala
2270 2275 2280
ggc agc ttg gtg tcg ggg tcg atc gct tcc cgc tgc ctg tgg ctc 6894
Gly Ser Leu Val Ser Gly Ser Ile Ala Ser Arg Cys Leu Trp Leu
2285 2290 2295
tgg ctg gga ctc ctt gac gag atc caa caa gtc gga ttg ggt atg 6939
Trp Leu Gly Leu Leu Asp Glu Ile Gln Gln Val Gly Leu Gly Met
2300 2305 2310
att ctg ctg cag acc atg act cgc gtg cat gtc tgc ttc gtc ctg 6984
Ile Leu Leu Gln Thr Met Thr Arg Val His Val Cys Phe Val Leu
2315 2320 2325
ttg gcc gcg caa gca ctg gga tcc atc gcc acc atc tgc gcc cgc 7029
Leu Ala Ala Gln Ala Leu Gly Ser Ile Ala Thr Ile Cys Ala Arg
2330 2335 2340
ggc ttc gcg ccg aac aag att ggc cct ggg gat atc tct ccg gat 7074
Gly Phe Ala Pro Asn Lys Ile Gly Pro Gly Asp Ile Ser Pro Asp
2345 2350 2355
gtg ggc acg tcg gtg gac aag gtc ggt aac gca tgg ttc tgg atc 7119
Val Gly Thr Ser Val Asp Lys Val Gly Asn Ala Trp Phe Trp Ile
2360 2365 2370
gct ctc ttc ttc cag ctc ctg gca agt tgg ggc ttc ctg ctc ttc 7164
Ala Leu Phe Phe Gln Leu Leu Ala Ser Trp Gly Phe Leu Leu Phe
2375 2380 2385
tac cgc cgc gaa cag ctc aac cga ccc taa 7194
Tyr Arg Arg Glu Gln Leu Asn Arg Pro
2390 2395
<210> 3
<211> 2397
<212> PRT
<213> 黑曲霉
<400> 3
Met Phe Gly Thr Thr Val Gln Arg Cys Val Val Leu Ile Leu Gly Ile
1 5 10 15
Leu Ser Val Thr Thr Val Gly Trp Pro Tyr Asp Glu Ser Leu Val Asp
20 25 30
Tyr Asn Leu Asn Glu Asn Lys Thr Ala Glu Gly Pro Ile Asn Tyr Trp
35 40 45
Gly Glu Trp Pro Asp His Thr Tyr His Pro Ser Pro Asp Asn Trp Arg
50 55 60
Phe Pro Ile Tyr Thr Ile Phe Leu Asp Arg Ile Ala Asn Gly Asp Pro
65 70 75 80
Ala Asn Asp Asp Ile Asn Gly Thr Thr Tyr Glu His Val Leu Asp Ser
85 90 95
Asn Gln Met Arg His Gly Gly Asp Leu Val Gly Leu Ile Asp Thr Leu
100 105 110
Asp Tyr Ile Arg Gly Met Gly Phe Lys Gly Ile Tyr Phe Ala Gly Thr
115 120 125
Gly Leu Met Asn Leu Pro Trp Gly Tyr Asp Gly Tyr Ser Pro Val Asp
130 135 140
Thr Thr Leu Leu Asp Lys His His Gly Thr Leu Ser Asp Trp Arg Arg
145 150 155 160
Thr Ile Lys Glu Ile His Asp Arg Asp Met Tyr Val Ile Met Asp Asn
165 170 175
Thr Leu Ala Thr Leu Ser Asn Leu Ile Gly Phe Lys Gly His Leu Asn
180 185 190
Asp Ser Ala Asp Phe Asn Ala Lys Glu Tyr Glu Val Glu Tyr Val Thr
195 200 205
Glu Arg Thr Tyr Ala Asp Phe Gln Phe Ser Asn Asp Tyr Asn Asp Thr
210 215 220
Cys Asn Tyr Pro Lys Phe Trp Asn Glu Thr Gly Tyr Pro Leu Thr Ser
225 230 235 240
Gly Gly Val Gln Asp Leu Lys Gly Cys Tyr Asn Ser Asp Phe Asp Gln
245 250 255
Tyr Gly Glu Leu Glu Ala Phe Gly Asn Phe Pro Asp Trp Lys Arg Gln
260 265 270
Leu Thr Lys Phe Ala Ser Val Gln Asp Arg Leu Arg Glu Trp His Lys
275 280 285
Pro Val Arg Asp Val Ile Thr Arg His Ser Cys Ile Val Ile Ala Ser
290 295 300
Leu Asp Ile Asp Gly Phe Arg Phe Asp Lys Ala Val Gln Ala Thr Leu
305 310 315 320
Asp Pro Leu Gly Asp Met Leu Ala Val Tyr Arg Glu Cys Ala Lys Gln
325 330 335
Tyr Gly Lys Lys Asn Phe Phe Leu Pro Gly Glu Ile Thr Ser Gly Asn
340 345 350
Thr Phe Gly Ser Leu Tyr Leu Gly Arg Gly Arg Gln Pro Asn Gln Thr
355 360 365
Pro Asp Ser Ala Asp Ala Gly Ala Lys Leu Thr Asn Ala Ser Ser Asp
370 375 380
Ser Tyr Phe Leu Arg Asp Asp Gly Leu Gln Ala Leu Asp Ala Ala Ala
385 390 395 400
Phe His Tyr Thr Ile Tyr Arg Ser Met Thr Arg Phe Leu Gly Met Asp
405 410 415
Gly Asn Leu Val Ala Gly Phe Asp Leu Pro Thr Asp Phe Ile Glu Ala
420 425 430
Trp Asn Gly Met Leu Val Thr Asn Asp Phe Ile Asn Ala Phe Thr Gly
435 440 445
Glu Leu Asp Pro Arg His Met Tyr Gly Val Ser Asn Gln Asp Asn Phe
450 455 460
Arg Trp Pro Ala Ile Lys Asn Gly Thr Glu Lys Tyr Leu Leu Gly Leu
465 470 475 480
Tyr Ile Val Thr Leu Glu Leu Pro Gly Ile Pro Leu Val Leu Trp Gly
485 490 495
Glu Glu Gln Glu Met Tyr Val Phe Asp Ala Thr Ala Ser Asn Tyr Leu
500 505 510
Phe Gly Arg Gln Pro Met Thr Tyr Gln Thr Ala Trp Trp Thr His Gly
515 520 525
Cys Phe Ser Leu Asn Thr Ser Lys Phe Tyr Asp Phe Pro Asn Asp Lys
530 535 540
Gly Leu Asn Gly Cys Asn Asp Ile Thr Val Thr Tyr Asp Gln Arg Asn
545 550 555 560
Pro Ala His Pro Leu Arg Asn Ile Met Lys Arg Met Phe Glu Ile Arg
565 570 575
Glu Gln Tyr Pro Val Ala Asn Asp Gly Phe Asn Leu Glu Thr Ile Ser
580 585 590
Gln Leu Thr Gln Asp Ile Tyr Leu Pro Gly Ser Ser Thr Thr Pro Thr
595 600 605
Val Thr Gly Leu Trp Ser Val Leu Arg Ser Tyr Tyr Pro Gly Val Gln
610 615 620
Lys Glu Ala Ser Ser Ser Asn Asp Thr Leu Trp Leu Val Tyr His Asn
625 630 635 640
Ala Asn Lys Thr Glu Thr Tyr Gly Lys Asn Cys Thr Ser Lys Asp Ser
645 650 655
Ala Leu Leu Ser Pro Tyr Glu Ser Gly Thr Lys Leu Lys Asn Leu Phe
660 665 670
Tyr Pro Tyr Asp Glu Leu Thr Leu Gln Asp Gly Pro Ser Asp Ala Ser
675 680 685
Asn Gly Thr Glu Ser Tyr Gly Cys Thr Thr Asn Met Lys Leu Leu Pro
690 695 700
Trp Glu Phe Arg Ala Tyr Val Lys Ala Ser Asp Phe Val Glu Pro Gly
705 710 715 720
Pro Thr Val Thr Glu Phe Val Pro Gly His Asp Ala Arg Leu Leu Ser
725 730 735
Ser Glu Asp Thr Gly Glu Thr Leu Lys Ile Gln Leu Gly Tyr Ser Lys
740 745 750
Ala Met Asp Cys Ser Ala Ile Thr Lys Ala Val Ser Leu Asn Ser Thr
755 760 765
Thr Val Lys Gly Val Asn Ala Thr Leu Asp Thr Ser Ser Val Ser Cys
770 775 780
Thr Asn Val Thr Ala Arg Thr Ser Ser Asn Asn Tyr Ile Gly Glu Val
785 790 795 800
Pro Thr Val Trp Thr Trp Ser Ala Asn Leu Thr Asn Val Tyr His Gly
805 810 815
Ile His Gln Leu Thr Val Lys Asn Ala Ser Thr Thr Ser Gly Thr Arg
820 825 830
Val Asp Ala Ile Asp Arg Phe Leu Phe Arg Val Gly Thr His Thr Asn
835 840 845
Pro Leu Ile Ser Pro Leu Ala Asn Tyr Ser Thr Ser Leu Val His Gln
850 855 860
Ser Asp Asn Gly Ser Tyr Tyr Val Gln His Asp Ala Ala Gly Ala Asp
865 870 875 880
Gln Phe Arg Tyr Thr Thr Asp Phe Gly Leu Asn Trp Ser Asn Trp Thr
885 890 895
Asp Tyr Thr Gly Gly Asn Thr Thr Ile Glu Phe Pro Thr Trp Thr Gly
900 905 910
Thr Asp Ala Gln Lys Trp Glu Gly Thr His Ile Arg Val Gln Tyr Phe
915 920 925
Ser Arg Leu Thr Gly Ser Ser Asp Tyr Ile Gln Glu Gly Asp Tyr Asp
930 935 940
Trp Glu Ser Gly Val Pro Arg Arg Phe Pro His Leu Trp Trp Asn Gly
945 950 955 960
Pro Tyr Asn Gln Tyr Gly Tyr Asp Ala Gly Leu Asp Ser Lys Met Arg
965 970 975
Phe Asp Thr Lys Asp Arg Arg Trp Lys Tyr Asp Phe Val Tyr Glu Trp
980 985 990
Pro Ser Val Gly Gln Ile Ser Val Trp Gly Thr Gly Lys Asp Gly Val
995 1000 1005
Pro Glu Thr Thr Asn Val Tyr Gly Asp Val Asp Asn Ser Ser Val
1010 1015 1020
Val Gln Val Leu Pro Pro Ser Tyr Leu Ser Ser Asn Val Ile Asn
1025 1030 1035
Ile Thr Glu Leu Pro Pro Phe Pro His Leu Gly Trp Thr Ile Ser
1040 1045 1050
Leu Asn Asp Ala Asn Leu Arg Tyr Glu Leu Leu Pro Val Gly Ser
1055 1060 1065
Gly Trp Ala Gln Leu Val Leu Tyr Ile Leu Leu Trp Val Val Pro
1070 1075 1080
Ile Leu Met Gly Leu Ala Gly Val Phe Ile Phe Ile Arg Thr Phe
1085 1090 1095
Tyr Arg Val Glu Leu Asn Thr Asp Gly Asn Val Val Lys Glu Asp
1100 1105 1110
Lys Leu Pro Leu Leu Phe Trp Arg Arg Met Lys Gly Gln Ser Gly
1115 1120 1125
Gly Asp Gly Gln Met Asp Arg Glu Glu Ser Asp Val Ala Ala Val
1130 1135 1140
Ala Gly Glu Met Ala Ile Ala Gly Ala Pro Glu Lys Arg Arg Thr
1145 1150 1155
Val Leu Ile Ala Thr Met Glu Tyr Asp Ile Ala Asp Trp Gln Ala
1160 1165 1170
Lys Val Lys Ile Gly Gly Leu Gly Val Met Ala Gln Leu Met Ser
1175 1180 1185
Gln Asn Leu Gly Tyr Gln Asn Leu Ile Trp Val Val Pro Cys Val
1190 1195 1200
Gly Asp Ile Glu Tyr Pro Glu Asp Thr Pro Thr Glu Pro Tyr Ile
1205 1210 1215
Val Lys Ile Leu Asp Asn Pro Tyr Leu Val Asn Val Gln Tyr His
1220 1225 1230
Val Leu Asn Asn Ile Thr Tyr Val Leu Leu Asp Ala Pro Val Phe
1235 1240 1245
Arg Gln Gln Thr Lys Ala Glu Pro Tyr Pro Pro Arg Met Asp Asp
1250 1255 1260
Leu Asp Ser Ala Ile Tyr Tyr Ser Ala Trp Asn Gln Cys Ile Ala
1265 1270 1275
Glu Thr Ile Lys Arg Phe Pro Ser Ile Asp Leu Tyr His Ile Asn
1280 1285 1290
Asp Phe His Gly Cys Leu Ala Pro Leu Tyr Leu Leu Pro Thr Arg
1295 1300 1305
Thr Ile Pro Val Cys Leu Ser Leu His Asn Ala Glu Phe Gln Gly
1310 1315 1320
Leu Trp Pro Leu Arg Thr Gln Gln Glu Lys Lys Glu Val Cys Ser
1325 1330 1335
Val Phe Asn Leu Pro Val Glu Thr Ala Thr Lys Tyr Cys Gln Phe
1340 1345 1350
Gly Asn Val Phe Asn Leu Leu His Thr Gly Ala Ser Tyr Leu Arg
1355 1360 1365
Phe His Gln Arg Gly Phe Gly Ala Val Gly Val Ser Lys Lys Tyr
1370 1375 1380
Gly Lys Arg Ser Trp Ala Arg Tyr Pro Ile Phe Trp Ser Leu Asp
1385 1390 1395
Lys Ile Gly Ser Leu Pro Asn Pro Asp Pro Thr Asp Thr Ala Ala
1400 1405 1410
Leu Glu Asp Thr Pro Asp Glu Lys Ala Leu Thr Arg Ser Tyr Glu
1415 1420 1425
Glu Arg Ile Thr Asp Lys Leu Glu Ala Gln Lys Trp Ala Gly Leu
1430 1435 1440
Thr Glu Asp Arg Asn Ala Asp Leu Leu Val Phe Val Gly Arg Trp
1445 1450 1455
Ser Lys Gln Lys Gly Val Asp Leu Ile Ala Asp Val Ile Pro Ala
1460 1465 1470
Val Leu Ser Asp Arg Pro Gln Val Gln Val Ile Cys Val Gly Pro
1475 1480 1485
Ile Ile Asp Leu Tyr Gly Arg Leu Ala Ala Ile Lys Leu Glu Lys
1490 1495 1500
Ile Ala Ala Met Phe Pro Gly Arg Val Phe Ser Arg Pro Glu Phe
1505 1510 1515
Thr Ala Leu Pro Pro Cys Val Phe Ser Gly Ala Asp Phe Ala Leu
1520 1525 1530
Ile Pro Ser Arg Asp Glu Pro Phe Gly Leu Ile Ala Val Glu Phe
1535 1540 1545
Gly Arg Lys Gly Ala Leu Gly Ile Gly Ser Arg Ile Gly Gly Leu
1550 1555 1560
Gly Gln Met Pro Gly Trp Trp Tyr Thr Val Glu Ser Asp Ala Thr
1565 1570 1575
Arg His Leu Leu His Gln Leu Lys Thr Ala Ile Lys Ser Ala Leu
1580 1585 1590
Asp Ser Thr Pro Glu Thr Arg Ala Gln Met Arg Ala Asn Ser Ala
1595 1600 1605
Lys Gln Arg Phe Pro Val Leu Glu Trp Ile Gln Lys Leu Glu Thr
1610 1615 1620
Leu Gln Arg Thr Ser Ile Lys Ile His His Asp Lys Asn Lys Asp
1625 1630 1635
Thr Val Thr Gly Ser Ile Pro Glu Ser Glu Ser Val Trp Asp Leu
1640 1645 1650
Gln Asn Leu Gln Ser Ala Arg Tyr Ser Ser Val Ala Leu Pro Asn
1655 1660 1665
Met Ala Leu Ser Arg Ala Asp Gly Thr Glu Thr Pro Pro Glu Ala
1670 1675 1680
Met Ile Gln Gln Ala His Ala Arg Leu Gln Glu Ile Gln Ala Ser
1685 1690 1695
Glu Gly Ser Ser Arg Asp Ser Ser Leu Asn Arg Lys Leu Ser Leu
1700 1705 1710
Gly Arg Arg Ser Gly Pro Gly Gln Gly Arg Lys Arg Leu Thr Lys
1715 1720 1725
Arg Gln Ala Thr Ala Ser Gln Ala Ser Thr Asp His Gly Glu Asp
1730 1735 1740
Glu Asn Asp Thr Asp Ala Asp Asp Asp His Thr Arg Pro Gln Glu
1745 1750 1755
Asp Tyr Ile Ser Pro Glu Glu Ala Met Gln Ala Val Asn Asn Thr
1760 1765 1770
Leu Thr Pro His Ala Ile Thr Gly Asp Ser Thr Pro Arg Ala Ser
1775 1780 1785
Tyr Leu Ser Arg Pro Val Ser Pro Tyr Pro Ile Ser Gln Ile Ser
1790 1795 1800
Thr Pro Ala Cys Pro Thr Pro Pro Pro Met Thr His Phe Arg Thr
1805 1810 1815
Val Ser Met Leu Ser Leu Pro Ser Val Val Gly Asp His Asn Arg
1820 1825 1830
Leu Ser Ser Leu Gly Gly Glu Glu Gln Asn Gln Pro Val Phe Glu
1835 1840 1845
Leu Gln Lys Val Asp Pro Thr Phe Thr Asp Ser Leu Gly His Phe
1850 1855 1860
Thr Arg Arg Phe Glu Gln Ser Leu Glu Lys Leu Asn Lys Lys Asn
1865 1870 1875
Ser Ile Thr Asp Tyr Cys Ile Glu Val Tyr Leu Met Lys Ser Glu
1880 1885 1890
Arg Lys Phe Tyr Asn Ser Tyr Asn Asp Ala Gln Leu Lys Lys Gln
1895 1900 1905
Pro Lys Asn Arg Ser Leu Ala Val Pro Ser Ser Glu Ser Val Val
1910 1915 1920
Gln Glu Gly Pro Gly Gly Ser Val Val Arg His Ser Tyr Ser Ser
1925 1930 1935
Glu Asp Ser Glu Ile Asn Gly Glu Asp Glu Ile Asp Arg Trp Leu
1940 1945 1950
Met Arg Leu Gly Tyr Thr Arg Pro Ile Ala Val Gln Arg Phe Met
1955 1960 1965
Arg Arg Arg Leu Gly Asn Trp Pro Val Tyr Ser Leu Phe Leu Gly
1970 1975 1980
Leu Gly Gln Ile Ile Ala Thr Asn Ser Ala Gln Ile Thr Leu Leu
1985 1990 1995
Val Gly Gln Val Gly Glu Thr Ala Val Lys Leu Tyr Val Ile Ala
2000 2005 2010
Ala Ile Tyr Cys Leu Ser Ser Ile Ala Trp Trp Phe Leu Tyr His
2015 2020 2025
Arg Phe Pro Ala Val Ile Ser Leu Ser Leu Pro Trp Phe Ile Tyr
2030 2035 2040
Cys Met Ala Phe Ile Val Ile Gly Val Ser Pro Phe Gly Leu Thr
2045 2050 2055
Ala Leu Gly Arg Ala Trp Ala Gln Asn Val Ala Ala Gly Val Tyr
2060 2065 2070
Ala Ile Ala Ser Ser Ser Gly Ser Leu Phe Phe Ala Leu Asn Phe
2075 2080 2085
Gly Asp Gln Gly Ala Val Pro Val Lys Asp Trp Met Phe Arg Ala
2090 2095 2100
Ser Ile Ile Gln Gly Ile Ser Gln Ile Tyr Thr Val Ala Leu Trp
2105 2110 2115
Phe Trp Ser Ser Lys Val Thr Ala Ala Glu Val Gly Gly Val Ser
2120 2125 2130
Val Ala Ala Leu Ser Ser Trp Arg Leu Thr Ala Val Val Met Pro
2135 2140 2145
Ile Ala Ala Leu Cys Phe Val Ile Gly Val Leu Leu Ala Leu Gly
2150 2155 2160
Leu Pro Asn Tyr Tyr Arg Gln Ala Pro Ser Arg Ile Leu Phe Phe
2165 2170 2175
Tyr Lys Ser Leu Phe Arg Arg Arg Ile Ile Leu Trp Phe Phe Phe
2180 2185 2190
Met Val Ile Val Gln Asn Trp Phe Leu Ala Ala Ala Phe Gly Arg
2195 2200 2205
Asn Trp Ser Phe Leu Trp Ser Ser Lys His Thr Lys Pro Trp Glu
2210 2215 2220
Ile Val Leu Leu Val Phe Gly Phe Phe Val Val Leu Trp Val Val
2225 2230 2235
Ile Leu Val Ile Phe Arg Ala Leu Ser Lys Glu His Ser Trp Ile
2240 2245 2250
Leu Pro Val Phe Gly Leu Ser Leu Gly Ala Pro Arg Trp Ala Gln
2255 2260 2265
Thr Trp Trp Gly Thr Ser Asn Ile Gly Tyr Tyr Leu Pro Trp Ala
2270 2275 2280
Gly Ser Leu Val Ser Gly Ser Ile Ala Ser Arg Cys Leu Trp Leu
2285 2290 2295
Trp Leu Gly Leu Leu Asp Glu Ile Gln Gln Val Gly Leu Gly Met
2300 2305 2310
Ile Leu Leu Gln Thr Met Thr Arg Val His Val Cys Phe Val Leu
2315 2320 2325
Leu Ala Ala Gln Ala Leu Gly Ser Ile Ala Thr Ile Cys Ala Arg
2330 2335 2340
Gly Phe Ala Pro Asn Lys Ile Gly Pro Gly Asp Ile Ser Pro Asp
2345 2350 2355
Val Gly Thr Ser Val Asp Lys Val Gly Asn Ala Trp Phe Trp Ile
2360 2365 2370
Ala Leu Phe Phe Gln Leu Leu Ala Ser Trp Gly Phe Leu Leu Phe
2375 2380 2385
Tyr Arg Arg Glu Gln Leu Asn Arg Pro
2390 2395
<210> 4
<211> 7532
<212> DNA
<213> 黑曲霉
<400> 4
atgaagtggg ctatttccgg cacgctgctc gcctgtttcg caacaactgc aacggcctgg 60
ccttacgacg agtccctcgt cgactacaac ttcaatcaga accagtccgc tacgaacccg 120
gcggactatt ggggaacatg gcccaatcat accggggact acttcccctc cccggacaat 180
tggcgcttcc ccgtctacac cctctttctc gaccgcttcg tcaacggtga ccccacaaac 240
gacaacatca atggcaccct gttcgaacat gacctccgct cgaatcagat gcgccatggt 300
ggcgatgttg ccggcctgct ggataccttg gattacttgc agggcatggg aatcaaggtc 360
ggtccctgtg gcttgtccga tgctgcgatc aattactgac gatggtttag ggtctctatc 420
ttgccggaac aatcctcatg aaccagccct ggggatctga cggttattcg gctttggaca 480
cgacattgtt ggatcaacac tatggtaacc tgcagacgtg gcgcaatgcc atcacggaaa 540
ttcacaagcg cgggatgtat gtcatcttcg ataacaccat cgcaacgtaa gtttgccgct 600
gccttttccc ctctttccta cccaacaaac taacctgcaa tttttaggat gggtgatttg 660
atcggatttg atggctatct gaacaccacc acccccttct ccgtgaagga acaccaaacg 720
gtgtggaaga ctgaccgccg ctatgtggac ttcgacattg gcaatgacta caacgagacg 780
tgcgactacc cccgcttctg gttcgaggat ggctaccccg ttcaagcgtc agtcaccgag 840
gagcttgtcg gatgttacaa cagtgatttc gaccagtacg gtgatattga ggcctttggt 900
gtcttccccg attggcaacg tcagctggca aaattcgcct ccgttcagga tcgactccgt 960
gaatgggttc cctccgtgcg cgagcgtttg atccgccact cctgcatcat tattcagtcg 1020
ctcgatattg acggtttccg gtacgacaag gcgactcagg caaccgtcga cgccctcgga 1080
gatatgtcca atgcgtaccg cgagtgcgcc cgcgccgtag gaaaagagaa cttcttcatt 1140
gcgggcgaaa tcacgggtgg taataccttt ggttccatct acttgggccg aggaagacag 1200
cccaaccagt tccctgactc ggcggaggca gccatgaagc tgaccaacac ttccgacgcc 1260
cagtatttcc tgcgtgaagt gggacatgag gcgattgatg gtgcagcctt ccactactcc 1320
atttaccgag cgctgacccg cttcctgggc atggatggta acttggctgc cggttacgat 1380
gtgccagtcg actgggttga tgcctggaat ctcatgctgc agtccaacga tctggtcaat 1440
gcgaatacag gcaagttcga cccccgccac atgtacgggg ctaccaacca ggatgtcttc 1500
cgttggccca cggtggaaaa gggcgtggag cgtcagttgc ttggattgta catcacgact 1560
cttctgctcc ccggaattcc gctccttctc tggggcgagg aacaggcgtt ttacgtactg 1620
gatgccacgg catcgaacta catctacggt cggcaggcca tgtctcctgc caccgcatgg 1680
agggatcatg gctgtttctc cttggaatcg tctcagtact ataattggcc cattgagtcc 1740
ggccgtcagg gctgccacga ccccacggtg gcctacgatc atcgtgaccc gtctcatccc 1800
gtgcgcaata tcattaagca tatgtatcag atgcgcgaac agttccccgt cctcaatgac 1860
ggctatacta ttcaaaagct ctcgaaccac accgaggacg tgtactatct cggttccaac 1920
ggcacagcca ccgagaccgg actctggtcg attcttcgtg atgtgaacgc ggatgtgcag 1980
gatttgggct ccgatgcgaa gaaccagcct gtctggctgg tttaccacaa cacgaaccgc 2040
accattgatt acaagtttga ctgctcggat aatgatacag ctctgattgc ccccttcgat 2100
agtggcacct gggtcaaaaa cctgttccac ccgtatgacg agcaccagct gatcgattcc 2160
cccaccaagt tgggattgaa cggatcaact gcatacagtg gctgcttggc taatatgacc 2220
atgtccgcct atgaattccg ggcctacgtg cctaaaaccc gctttactaa acccaggccg 2280
atgattacaa agttcactcc gggacacgat gtcccgatcc gctcgaccgt ggccccgaac 2340
gcagacgaga acgtggaggt cgaaatttac ttctccgaag aaatggattg cgactcggtg 2400
acaaagtcca ttaccctttc gtcatcgacc gaaattggaa aggccccctc tgtcgattct 2460
ggcagtgtca actgcaagtc agtccccgcc actaacacca gctggaccgg ccagattccc 2520
ggggtgtgga tgtgggcggc caacctgaca ggtgtgtaca acggcattca tcgtctcaca 2580
gtcaacaatg tcagcacaga gagtgggaac gcaaccacca acgccgtcga ccatttcctc 2640
ttccgcatcg gccagattga taatccgatg attttcagca gtgcgaacta ttcaactagt 2700
ttgctccata aggaatccaa cggcaccctt ttcatccagc accacgccgc gggtgctgat 2760
aagtatcgct attctacgaa ttggggtacc actttctccg attggattga ctacaggggc 2820
ggaaatgaca ctattgagga actcgaatgg tcgggaacca agaagcagtc atggaaagga 2880
aaccacgttc gcgtggagta ttggagtcgt tggaccggca gcagcgatta cgtccaagag 2940
ggagacgcgg gctggaacga gaatgttcca cgccgtttcc ctcacgtctt cttcaacgga 3000
ccctacaacc agtatgggta tgatgcaggt ctggacaacg tggtccgcca ggacagcgtt 3060
gacggtctct ggaaatatca tttcaccgcg gaatggcctg ctcaagctca attgaacatt 3120
tggggtatga accctgatgg ggagcctgac cagagttggg tcctgggaga tgccgataat 3180
gattcggttc tcgatcgcat gccgccctct tcgctgtccg cgacattgat taacatcact 3240
gaacaccccc cctctcccta catttcgtgg aatatcttca ttgatgacgg gaccatgcgc 3300
ttccagctgt tccccgtcgg gcatcagaat actcagatcg ccatgtatgt gctcttttgg 3360
atcatccccg tcatcacggg cgcagccggt gtgtgggctt tcatgaagtc tttctacaag 3420
gtcaaattca accaggttgg tgtgagcgaa aaacaccaga tgatcccatt ggccttgcgg 3480
cggaagttca agcgcaatcg caatcgtggc ggtgatgagg aaaactcaaa ccctctcatg 3540
cgtctggcga acaagtccgg gttcctccag actgacacgg cgattggtgg tgctgctagc 3600
ggcaagcgtc gcatggtcct gatcgccacc atggagtacg acattgagga ttgggccatc 3660
aagatcaaga ttggtggtct tggtgtcatg gcgcaactca tgggtaagac tctgggtcat 3720
caagacttga tctgggtggt gccttgcgtt gggggtgtcg attaccccgt ggacaaaccc 3780
gcagagccca tgcatgtcac cattcttggc aattcgtacg aggtccaggt ccagtatcac 3840
gtcttgaata acatcaccta tgttctgctg gatgcccctg tgttccgtca acagtctaag 3900
tcagagcctt acccggctcg catggacgac ctgaacagcg ccatttacta ctcggcctgg 3960
aatcagtgca ttgcggaagc ctgcaagaga ttccctatcg acctgtatca tatcaacgac 4020
taccatggtt ccctggctcc actgtatcta cttcctgaca cagtacctgc ctgtctttcc 4080
ctgcataacg ccgagttcca aggtttgtgg cccatgcgga cgcagaaaga aaaggaggaa 4140
gtttgctccg tgttcaatct ggatatcgag accgtgaggc attacgtgca gtttggagag 4200
gtgttcaact tgctccactc gggtgctagt tatctccgtg ttcaccaaca aggtttcggt 4260
gctgttggtg tgtctaagaa gtacggaaag cggtcctacg cgcgttaccc cattttctgg 4320
ggtctccgca aggttggaaa cctacctaac cctgatccgt ctgatgtcgg tgagtggagc 4380
aaggaacagg ccagcgccat gggtgacaat gtgagcgtgg acccgactta tgaagccggt 4440
cgaggcgacc tcaagcgtca agctcaggag tgggccggtc ttgaacagaa ccctgacgcc 4500
gatttgcttg tcttcgttgg tcgttggtcg atgcagaagg gtgttgattt gatcgccgac 4560
gtcatgcctg ctgtcctgga agcacgcccc aatgttcagc tcatttgtgt tggaccagtt 4620
atcgatctct acggtaaatt cgcggccctc aaactcgatc acatgatgaa ggtctacccc 4680
ggacgagtgt tctctagacc tgagttcacg gcattgcccc cctacatctt ctctggtgct 4740
gaattcgcgc tgattccctc tcgtgacgag cccttcggtc tggtcgccgt cgagttcgga 4800
cgtaagggag ctctgggtat cggtgcccgg gttggtggtc tcggtcagat gccaggttgg 4860
tggtacaatg tggaatcgac agctacctcc catttgctcg ttcagttcaa gctggctatc 4920
gacgcggctc tcagttcgaa aacggaaact cgtgctatga tgcgtgcccg gtccgccaaa 4980
cagcgcttcc cggtcgccca gtgggtggaa gacttggaga tcctgcaaac caccgccatc 5040
caagtgcaca acaaggaatt ggttaaacat aacggtcgac ccttcacccc gtctggaact 5100
accacgccgg gtggcatctt aagccagccg tcaagtccac taatgccccc tggaatgcag 5160
actcccttgg ctcattctcg ggaaagcagc tattctaacc tgaaccgtct cagtgaatat 5220
gtcacagatc cgaaaacaaa ctacagtcga gacatcagcc ccagtgggac ggaaaagccg 5280
cggtccggcc tgcaacgaca gctttctctt ggtgttcgct caggacctgg tcatcaagag 5340
cgccgtggcc gtcgtggacg ccagcgcgac agcatccccg aacacgaaga caccgcaggg 5400
gccatgaccg acgtcgaaga agaccacgag gacattgggg atcagcagga tgcggacgac 5460
gagtacactc tcaccccggc tcaggtcgag gaaggacgtc gcttgcaggc tgtccagcag 5520
cagggagtgg gtatgccgac gagtccgggc gtccgccgtt atagtcaaga ctccttgcat 5580
ccgcgacagc ttcctagcag ccctggcccc gtcccacctc ctacacagag cctccttccg 5640
ccacccaggc ttggggatgc cggtagccga ctcagtagcg cgtctgtcct gtccctggat 5700
tcggtcgttg gtaccaagac ggacttcaag ctccagaagg ttgacccctt ctttacggat 5760
tctactggcg agtactacaa ggcattcgac aagaggctgg tcggcttgaa cggctcgaac 5820
tccgaatccc agctttgcat tgaggaatat ctcatcaaga gtgagaagga atggttcgac 5880
aagttccgcg atgcccgact gggtcgtcta aaatcccccg cgtcgtctgt cttccgggac 5940
aagcatggtg cctcccctgt tggctcctac tacgatgata cgggctcccg ggtgagtggt 6000
gactatgacc gggagtcccg cgacacggaa gatgacgagt tcctcctggg caaggactac 6060
gtgcctccga cgggtctgcg caagtggatg cagattcgtg ttggagactg gccagtctac 6120
tcgttattcc ttgccttggg tcagatcatt gcagccaact cttatcaggt gaccttgctt 6180
accggtgagg ttggtgagac ggccgagaag ctctatggta tcgcaaccac ctacctgatc 6240
acctcgatcc tttggtggct tgtgttccgt tacttcaaat cggtggtgtg cctctcggct 6300
ccctggttct tctatggcct tgccttcctt ctgatcggct ccgctcactt tgaacccaat 6360
tcattcaacc ggggttggat ccagaacatc ggaagtggat gttacgccgc tgcctcgtct 6420
agcggttcca tcttcttcgc cttgaacttt ggtgacgaag gtggtgcgcc ggtcgaaacc 6480
tggatcttcc gggcttgtct cattcagggt atccagtcgg cttatatcat cggactgtgg 6540
tattggggtt ccactctgac caaggcatcc agccagggtc tgttgacctc gacgaacaac 6600
atcgccaata gctggaagat gacgtgagta cattgaaccc tctgattgtt catcaatcag 6660
ccagtcattc catcttgtga cccgctaaca ctgatctcct ctagtgccat ctgttacccg 6720
attgcaatct tcctctgggc tgttggattg ctgcttctct ttggacttcc taactactat 6780
cgccaaaccc cgggcaaagt ggcctccttt tacaagtccg tattccgccg caagatcgtc 6840
ctctggaact tcgttgccgt catcctgcaa aacttcttcc tcagcgcacc gtacggccgc 6900
aactggggct gtaagtctaa ctttccctgc cacatcgtgt cgaattgata agctaactct 6960
agtccgcagt cctttggtct tccaatcacg ccaaggcctg gcaaatcgtt attctctgta 7020
tcgtcttcta cgggttcgtc tgggcgggct tcctgttcgt cgtcagccgc tatttcaagt 7080
cccacagctg gttcctgccc gtgtttgcgt gcggacttgg agcacctcgc ttcattcaaa 7140
tctggtgggg tgtctcgggc atcggttact tccttccctg ggtctccgga ggctatctcg 7200
gcggagcttt ggcctcgagg agtctctggc tctggctggg cgtgttggat tccatccagg 7260
gtctcgggtt cggtatcatc ctcctgcaga ccctcacccg catgcacatg ctgttcaccc 7320
tgatctgctc gcaggtgctt ggttccattg ccaccatctg tgcgcgggcg tttgccccga 7380
ataacgtcgg gcccggccct gtgtcgccgg accctacctt tggaggaagt gcagtggcca 7440
atgcgtggtt ctgggtggcc ctgttttgtc agctgttggt gtgtgctggc ttcctcctct 7500
tcttccggaa agagcagctt tccaaacctt ga 7532
<210> 5
<211> 7278
<212> DNA
<213> 黑曲霉
<220>
<221> CDS
<222> (1)..(7275)
<223> AgsE编码cDNA
<400> 5
atg aag tgg gct att tcc ggc acg ctg ctc gcc tgt ttc gca aca act 48
Met Lys Trp Ala Ile Ser Gly Thr Leu Leu Ala Cys Phe Ala Thr Thr
1 5 10 15
gca acg gcc tgg cct tac gac gag tcc ctc gtc gac tac aac ttc aat 96
Ala Thr Ala Trp Pro Tyr Asp Glu Ser Leu Val Asp Tyr Asn Phe Asn
20 25 30
cag aac cag tcc gct acg aac ccg gcg gac tat tgg gga aca tgg ccc 144
Gln Asn Gln Ser Ala Thr Asn Pro Ala Asp Tyr Trp Gly Thr Trp Pro
35 40 45
aat cat acc ggg gac tac ttc ccc tcc ccg gac aat tgg cgc ttc ccc 192
Asn His Thr Gly Asp Tyr Phe Pro Ser Pro Asp Asn Trp Arg Phe Pro
50 55 60
gtc tac acc ctc ttt ctc gac cgc ttc gtc aac ggt gac ccc aca aac 240
Val Tyr Thr Leu Phe Leu Asp Arg Phe Val Asn Gly Asp Pro Thr Asn
65 70 75 80
gac aac atc aat ggc acc ctg ttc gaa cat gac ctc cgc tcg aat cag 288
Asp Asn Ile Asn Gly Thr Leu Phe Glu His Asp Leu Arg Ser Asn Gln
85 90 95
atg cgc cat ggt ggc gat gtt gcc ggc ctg ctg gat acc ttg gat tac 336
Met Arg His Gly Gly Asp Val Ala Gly Leu Leu Asp Thr Leu Asp Tyr
100 105 110
ttg cag ggc atg gga atc aag ggt ctc tat ctt gcc gga aca atc ctc 384
Leu Gln Gly Met Gly Ile Lys Gly Leu Tyr Leu Ala Gly Thr Ile Leu
115 120 125
atg aac cag ccc tgg gga tct gac ggt tat tcg gct ttg gac acg aca 432
Met Asn Gln Pro Trp Gly Ser Asp Gly Tyr Ser Ala Leu Asp Thr Thr
130 135 140
ttg ttg gat caa cac tat ggt aac ctg cag acg tgg cgc aat gcc atc 480
Leu Leu Asp Gln His Tyr Gly Asn Leu Gln Thr Trp Arg Asn Ala Ile
145 150 155 160
acg gaa att cac aag cgc ggg atg tat gtc atc ttc gat aac acc atc 528
Thr Glu Ile His Lys Arg Gly Met Tyr Val Ile Phe Asp Asn Thr Ile
165 170 175
gca acg atg ggt gat ttg atc gga ttt gat ggc tat ctg aac acc acc 576
Ala Thr Met Gly Asp Leu Ile Gly Phe Asp Gly Tyr Leu Asn Thr Thr
180 185 190
acc ccc ttc tcc gtg aag gaa cac caa acg gtg tgg aag act gac cgc 624
Thr Pro Phe Ser Val Lys Glu His Gln Thr Val Trp Lys Thr Asp Arg
195 200 205
cgc tat gtg gac ttc gac att ggc aat gac tac aac gag acg tgc gac 672
Arg Tyr Val Asp Phe Asp Ile Gly Asn Asp Tyr Asn Glu Thr Cys Asp
210 215 220
tac ccc cgc ttc tgg ttc gag gat ggc tac ccc gtt caa gcg tca gtc 720
Tyr Pro Arg Phe Trp Phe Glu Asp Gly Tyr Pro Val Gln Ala Ser Val
225 230 235 240
acc gag gag ctt gtc gga tgt tac aac agt gat ttc gac cag tac ggt 768
Thr Glu Glu Leu Val Gly Cys Tyr Asn Ser Asp Phe Asp Gln Tyr Gly
245 250 255
gat att gag gcc ttt ggt gtc ttc ccc gat tgg caa cgt cag ctg gca 816
Asp Ile Glu Ala Phe Gly Val Phe Pro Asp Trp Gln Arg Gln Leu Ala
260 265 270
aaa ttc gcc tcc gtt cag gat cga ctc cgt gaa tgg gtt ccc tcc gtg 864
Lys Phe Ala Ser Val Gln Asp Arg Leu Arg Glu Trp Val Pro Ser Val
275 280 285
cgc gag cgt ttg atc cgc cac tcc tgc atc att att cag tcg ctc gat 912
Arg Glu Arg Leu Ile Arg His Ser Cys Ile Ile Ile Gln Ser Leu Asp
290 295 300
att gac ggt ttc cgg tac gac aag gcg act cag gca acc gtc gac gcc 960
Ile Asp Gly Phe Arg Tyr Asp Lys Ala Thr Gln Ala Thr Val Asp Ala
305 310 315 320
ctc gga gat atg tcc aat gcg tac cgc gag tgc gcc cgc gcc gta gga 1008
Leu Gly Asp Met Ser Asn Ala Tyr Arg Glu Cys Ala Arg Ala Val Gly
325 330 335
aaa gag aac ttc ttc att gcg ggc gaa atc acg ggt ggt aat acc ttt 1056
Lys Glu Asn Phe Phe Ile Ala Gly Glu Ile Thr Gly Gly Asn Thr Phe
340 345 350
ggt tcc atc tac ttg ggc cga gga aga cag ccc aac cag ttc cct gac 1104
Gly Ser Ile Tyr Leu Gly Arg Gly Arg Gln Pro Asn Gln Phe Pro Asp
355 360 365
tcg gcg gag gca gcc atg aag ctg acc aac act tcc gac gcc cag tat 1152
Ser Ala Glu Ala Ala Met Lys Leu Thr Asn Thr Ser Asp Ala Gln Tyr
370 375 380
ttc ctg cgt gaa gtg gga cat gag gcg att gat ggt gca gcc ttc cac 1200
Phe Leu Arg Glu Val Gly His Glu Ala Ile Asp Gly Ala Ala Phe His
385 390 395 400
tac tcc att tac cga gcg ctg acc cgc ttc ctg ggc atg gat ggt aac 1248
Tyr Ser Ile Tyr Arg Ala Leu Thr Arg Phe Leu Gly Met Asp Gly Asn
405 410 415
ttg gct gcc ggt tac gat gtg cca gtc gac tgg gtt gat gcc tgg aat 1296
Leu Ala Ala Gly Tyr Asp Val Pro Val Asp Trp Val Asp Ala Trp Asn
420 425 430
ctc atg ctg cag tcc aac gat ctg gtc aat gcg aat aca ggc aag ttc 1344
Leu Met Leu Gln Ser Asn Asp Leu Val Asn Ala Asn Thr Gly Lys Phe
435 440 445
gac ccc cgc cac atg tac ggg gct acc aac cag gat gtc ttc cgt tgg 1392
Asp Pro Arg His Met Tyr Gly Ala Thr Asn Gln Asp Val Phe Arg Trp
450 455 460
ccc acg gtg gaa aag ggc gtg gag cgt cag ttg ctt gga ttg tac atc 1440
Pro Thr Val Glu Lys Gly Val Glu Arg Gln Leu Leu Gly Leu Tyr Ile
465 470 475 480
acg act ctt ctg ctc ccc gga att ccg ctc ctt ctc tgg ggc gag gaa 1488
Thr Thr Leu Leu Leu Pro Gly Ile Pro Leu Leu Leu Trp Gly Glu Glu
485 490 495
cag gcg ttt tac gta ctg gat gcc acg gca tcg aac tac atc tac ggt 1536
Gln Ala Phe Tyr Val Leu Asp Ala Thr Ala Ser Asn Tyr Ile Tyr Gly
500 505 510
cgg cag gcc atg tct cct gcc acc gca tgg agg gat cat ggc tgt ttc 1584
Arg Gln Ala Met Ser Pro Ala Thr Ala Trp Arg Asp His Gly Cys Phe
515 520 525
tcc ttg gaa tcg tct cag tac tat aat tgg ccc att gag tcc ggc cgt 1632
Ser Leu Glu Ser Ser Gln Tyr Tyr Asn Trp Pro Ile Glu Ser Gly Arg
530 535 540
cag ggc tgc cac gac ccc acg gtg gcc tac gat cat cgt gac ccg tct 1680
Gln Gly Cys His Asp Pro Thr Val Ala Tyr Asp His Arg Asp Pro Ser
545 550 555 560
cat ccc gtg cgc aat atc att aag cat atg tat cag atg cgc gaa cag 1728
His Pro Val Arg Asn Ile Ile Lys His Met Tyr Gln Met Arg Glu Gln
565 570 575
ttc ccc gtc ctc aat gac ggc tat act att caa aag ctc tcg aac cac 1776
Phe Pro Val Leu Asn Asp Gly Tyr Thr Ile Gln Lys Leu Ser Asn His
580 585 590
acc gag gac gtg tac tat ctc ggt tcc aac ggc aca gcc acc gag acc 1824
Thr Glu Asp Val Tyr Tyr Leu Gly Ser Asn Gly Thr Ala Thr Glu Thr
595 600 605
gga ctc tgg tcg att ctt cgt gat gtg aac gcg gat gtg cag gat ttg 1872
Gly Leu Trp Ser Ile Leu Arg Asp Val Asn Ala Asp Val Gln Asp Leu
610 615 620
ggc tcc gat gcg aag aac cag cct gtc tgg ctg gtt tac cac aac acg 1920
Gly Ser Asp Ala Lys Asn Gln Pro Val Trp Leu Val Tyr His Asn Thr
625 630 635 640
aac cgc acc att gat tac aag ttt gac tgc tcg gat aat gat aca gct 1968
Asn Arg Thr Ile Asp Tyr Lys Phe Asp Cys Ser Asp Asn Asp Thr Ala
645 650 655
ctg att gcc ccc ttc gat agt ggc acc tgg gtc aaa aac ctg ttc cac 2016
Leu Ile Ala Pro Phe Asp Ser Gly Thr Trp Val Lys Asn Leu Phe His
660 665 670
ccg tat gac gag cac cag ctg atc gat tcc ccc acc aag ttg gga ttg 2064
Pro Tyr Asp Glu His Gln Leu Ile Asp Ser Pro Thr Lys Leu Gly Leu
675 680 685
aac gga tca act gca tac agt ggc tgc ttg gct aat atg acc atg tcc 2112
Asn Gly Ser Thr Ala Tyr Ser Gly Cys Leu Ala Asn Met Thr Met Ser
690 695 700
gcc tat gaa ttc cgg gcc tac gtg cct aaa acc cgc ttt act aaa ccc 2160
Ala Tyr Glu Phe Arg Ala Tyr Val Pro Lys Thr Arg Phe Thr Lys Pro
705 710 715 720
agg ccg atg att aca aag ttc act ccg gga cac gat gtc ccg atc cgc 2208
Arg Pro Met Ile Thr Lys Phe Thr Pro Gly His Asp Val Pro Ile Arg
725 730 735
tcg acc gtg gcc ccg aac gca gac gag aac gtg gag gtc gaa att tac 2256
Ser Thr Val Ala Pro Asn Ala Asp Glu Asn Val Glu Val Glu Ile Tyr
740 745 750
ttc tcc gaa gaa atg gat tgc gac tcg gtg aca aag tcc att acc ctt 2304
Phe Ser Glu Glu Met Asp Cys Asp Ser Val Thr Lys Ser Ile Thr Leu
755 760 765
tcg tca tcg acc gaa att gga aag gcc ccc tct gtc gat tct ggc agt 2352
Ser Ser Ser Thr Glu Ile Gly Lys Ala Pro Ser Val Asp Ser Gly Ser
770 775 780
gtc aac tgc aag tca gtc ccc gcc act aac acc agc tgg acc ggc cag 2400
Val Asn Cys Lys Ser Val Pro Ala Thr Asn Thr Ser Trp Thr Gly Gln
785 790 795 800
att ccc ggg gtg tgg atg tgg gcg gcc aac ctg aca ggt gtg tac aac 2448
Ile Pro Gly Val Trp Met Trp Ala Ala Asn Leu Thr Gly Val Tyr Asn
805 810 815
ggc att cat cgt ctc aca gtc aac aat gtc agc aca gag agt ggg aac 2496
Gly Ile His Arg Leu Thr Val Asn Asn Val Ser Thr Glu Ser Gly Asn
820 825 830
gca acc acc aac gcc gtc gac cat ttc ctc ttc cgc atc ggc cag att 2544
Ala Thr Thr Asn Ala Val Asp His Phe Leu Phe Arg Ile Gly Gln Ile
835 840 845
gat aat ccg atg att ttc agc agt gcg aac tat tca act agt ttg ctc 2592
Asp Asn Pro Met Ile Phe Ser Ser Ala Asn Tyr Ser Thr Ser Leu Leu
850 855 860
cat aag gaa tcc aac ggc acc ctt ttc atc cag cac cac gcc gcg ggt 2640
His Lys Glu Ser Asn Gly Thr Leu Phe Ile Gln His His Ala Ala Gly
865 870 875 880
gct gat aag tat cgc tat tct acg aat tgg ggt acc act ttc tcc gat 2688
Ala Asp Lys Tyr Arg Tyr Ser Thr Asn Trp Gly Thr Thr Phe Ser Asp
885 890 895
tgg att gac tac agg ggc gga aat gac act att gag gaa ctc gaa tgg 2736
Trp Ile Asp Tyr Arg Gly Gly Asn Asp Thr Ile Glu Glu Leu Glu Trp
900 905 910
tcg gga acc aag aag cag tca tgg aaa gga aac cac gtt cgc gtg gag 2784
Ser Gly Thr Lys Lys Gln Ser Trp Lys Gly Asn His Val Arg Val Glu
915 920 925
tat tgg agt cgt tgg acc ggc agc agc gat tac gtc caa gag gga gac 2832
Tyr Trp Ser Arg Trp Thr Gly Ser Ser Asp Tyr Val Gln Glu Gly Asp
930 935 940
gcg ggc tgg aac gag aat gtt cca cgc cgt ttc cct cac gtc ttc ttc 2880
Ala Gly Trp Asn Glu Asn Val Pro Arg Arg Phe Pro His Val Phe Phe
945 950 955 960
aac gga ccc tac aac cag tat ggg tat gat gca ggt ctg gac aac gtg 2928
Asn Gly Pro Tyr Asn Gln Tyr Gly Tyr Asp Ala Gly Leu Asp Asn Val
965 970 975
gtc cgc cag gac agc gtt gac ggt ctc tgg aaa tat cat ttc acc gcg 2976
Val Arg Gln Asp Ser Val Asp Gly Leu Trp Lys Tyr His Phe Thr Ala
980 985 990
gaa tgg cct gct caa gct caa ttg aac att tgg ggt atg aac cct gat 3024
Glu Trp Pro Ala Gln Ala Gln Leu Asn Ile Trp Gly Met Asn Pro Asp
995 1000 1005
ggg gag cct gac cag agt tgg gtc ctg gga gat gcc gat aat gat 3069
Gly Glu Pro Asp Gln Ser Trp Val Leu Gly Asp Ala Asp Asn Asp
1010 1015 1020
tcg gtt ctc gat cgc atg ccg ccc tct tcg ctg tcc gcg aca ttg 3114
Ser Val Leu Asp Arg Met Pro Pro Ser Ser Leu Ser Ala Thr Leu
1025 1030 1035
att aac atc act gaa cac ccc ccc tct ccc tac att tcg tgg aat 3159
Ile Asn Ile Thr Glu His Pro Pro Ser Pro Tyr Ile Ser Trp Asn
1040 1045 1050
atc ttc att gat gac ggg acc atg cgc ttc cag ctg ttc ccc gtc 3204
Ile Phe Ile Asp Asp Gly Thr Met Arg Phe Gln Leu Phe Pro Val
1055 1060 1065
ggg cat cag aat act cag atc gcc atg tat gtg ctc ttt tgg atc 3249
Gly His Gln Asn Thr Gln Ile Ala Met Tyr Val Leu Phe Trp Ile
1070 1075 1080
atc ccc gtc atc acg ggc gca gcc ggt gtg tgg gct ttc atg aag 3294
Ile Pro Val Ile Thr Gly Ala Ala Gly Val Trp Ala Phe Met Lys
1085 1090 1095
tct ttc tac aag gtc aaa ttc aac cag gtt ggt gtg agc gaa aaa 3339
Ser Phe Tyr Lys Val Lys Phe Asn Gln Val Gly Val Ser Glu Lys
1100 1105 1110
cac cag atg atc cca ttg gcc ttg cgg cgg aag ttc aag cgc aat 3384
His Gln Met Ile Pro Leu Ala Leu Arg Arg Lys Phe Lys Arg Asn
1115 1120 1125
cgc aat cgt ggc ggt gat gag gaa aac tca aac cct ctc atg cgt 3429
Arg Asn Arg Gly Gly Asp Glu Glu Asn Ser Asn Pro Leu Met Arg
1130 1135 1140
ctg gcg aac aag tcc ggg ttc ctc cag act gac acg gcg att ggt 3474
Leu Ala Asn Lys Ser Gly Phe Leu Gln Thr Asp Thr Ala Ile Gly
1145 1150 1155
ggt gct gct agc ggc aag cgt cgc atg gtc ctg atc gcc acc atg 3519
Gly Ala Ala Ser Gly Lys Arg Arg Met Val Leu Ile Ala Thr Met
1160 1165 1170
gag tac gac att gag gat tgg gcc atc aag atc aag att ggt ggt 3564
Glu Tyr Asp Ile Glu Asp Trp Ala Ile Lys Ile Lys Ile Gly Gly
1175 1180 1185
ctt ggt gtc atg gcg caa ctc atg ggt aag act ctg ggt cat caa 3609
Leu Gly Val Met Ala Gln Leu Met Gly Lys Thr Leu Gly His Gln
1190 1195 1200
gac ttg atc tgg gtg gtg cct tgc gtt ggg ggt gtc gat tac ccc 3654
Asp Leu Ile Trp Val Val Pro Cys Val Gly Gly Val Asp Tyr Pro
1205 1210 1215
gtg gac aaa ccc gca gag ccc atg cat gtc acc att ctt ggc aat 3699
Val Asp Lys Pro Ala Glu Pro Met His Val Thr Ile Leu Gly Asn
1220 1225 1230
tcg tac gag gtc cag gtc cag tat cac gtc ttg aat aac atc acc 3744
Ser Tyr Glu Val Gln Val Gln Tyr His Val Leu Asn Asn Ile Thr
1235 1240 1245
tat gtt ctg ctg gat gcc cct gtg ttc cgt caa cag tct aag tca 3789
Tyr Val Leu Leu Asp Ala Pro Val Phe Arg Gln Gln Ser Lys Ser
1250 1255 1260
gag cct tac ccg gct cgc atg gac gac ctg aac agc gcc att tac 3834
Glu Pro Tyr Pro Ala Arg Met Asp Asp Leu Asn Ser Ala Ile Tyr
1265 1270 1275
tac tcg gcc tgg aat cag tgc att gcg gaa gcc tgc aag aga ttc 3879
Tyr Ser Ala Trp Asn Gln Cys Ile Ala Glu Ala Cys Lys Arg Phe
1280 1285 1290
cct atc gac ctg tat cat atc aac gac tac cat ggt tcc ctg gct 3924
Pro Ile Asp Leu Tyr His Ile Asn Asp Tyr His Gly Ser Leu Ala
1295 1300 1305
cca ctg tat cta ctt cct gac aca gta cct gcc tgt ctt tcc ctg 3969
Pro Leu Tyr Leu Leu Pro Asp Thr Val Pro Ala Cys Leu Ser Leu
1310 1315 1320
cat aac gcc gag ttc caa ggt ttg tgg ccc atg cgg acg cag aaa 4014
His Asn Ala Glu Phe Gln Gly Leu Trp Pro Met Arg Thr Gln Lys
1325 1330 1335
gaa aag gag gaa gtt tgc tcc gtg ttc aat ctg gat atc gag acc 4059
Glu Lys Glu Glu Val Cys Ser Val Phe Asn Leu Asp Ile Glu Thr
1340 1345 1350
gtg agg cat tac gtg cag ttt gga gag gtg ttc aac ttg ctc cac 4104
Val Arg His Tyr Val Gln Phe Gly Glu Val Phe Asn Leu Leu His
1355 1360 1365
tcg ggt gct agt tat ctc cgt gtt cac caa caa ggt ttc ggt gct 4149
Ser Gly Ala Ser Tyr Leu Arg Val His Gln Gln Gly Phe Gly Ala
1370 1375 1380
gtt ggt gtg tct aag aag tac gga aag cgg tcc tac gcg cgt tac 4194
Val Gly Val Ser Lys Lys Tyr Gly Lys Arg Ser Tyr Ala Arg Tyr
1385 1390 1395
ccc att ttc tgg ggt ctc cgc aag gtt gga aac cta cct aac cct 4239
Pro Ile Phe Trp Gly Leu Arg Lys Val Gly Asn Leu Pro Asn Pro
1400 1405 1410
gat ccg tct gat gtc ggt gag tgg agc aag gaa cag gcc agc gcc 4284
Asp Pro Ser Asp Val Gly Glu Trp Ser Lys Glu Gln Ala Ser Ala
1415 1420 1425
atg ggt gac aat gtg agc gtg gac ccg act tat gaa gcc ggt cga 4329
Met Gly Asp Asn Val Ser Val Asp Pro Thr Tyr Glu Ala Gly Arg
1430 1435 1440
ggc gac ctc aag cgt caa gct cag gag tgg gcc ggt ctt gaa cag 4374
Gly Asp Leu Lys Arg Gln Ala Gln Glu Trp Ala Gly Leu Glu Gln
1445 1450 1455
aac cct gac gcc gat ttg ctt gtc ttc gtt ggt cgt tgg tcg atg 4419
Asn Pro Asp Ala Asp Leu Leu Val Phe Val Gly Arg Trp Ser Met
1460 1465 1470
cag aag ggt gtt gat ttg atc gcc gac gtc atg cct gct gtc ctg 4464
Gln Lys Gly Val Asp Leu Ile Ala Asp Val Met Pro Ala Val Leu
1475 1480 1485
gaa gca cgc ccc aat gtt cag ctc att tgt gtt gga cca gtt atc 4509
Glu Ala Arg Pro Asn Val Gln Leu Ile Cys Val Gly Pro Val Ile
1490 1495 1500
gat ctc tac ggt aaa ttc gcg gcc ctc aaa ctc gat cac atg atg 4554
Asp Leu Tyr Gly Lys Phe Ala Ala Leu Lys Leu Asp His Met Met
1505 1510 1515
aag gtc tac ccc gga cga gtg ttc tct aga cct gag ttc acg gca 4599
Lys Val Tyr Pro Gly Arg Val Phe Ser Arg Pro Glu Phe Thr Ala
1520 1525 1530
ttg ccc ccc tac atc ttc tct ggt gct gaa ttc gcg ctg att ccc 4644
Leu Pro Pro Tyr Ile Phe Ser Gly Ala Glu Phe Ala Leu Ile Pro
1535 1540 1545
tct cgt gac gag ccc ttc ggt ctg gtc gcc gtc gag ttc gga cgt 4689
Ser Arg Asp Glu Pro Phe Gly Leu Val Ala Val Glu Phe Gly Arg
1550 1555 1560
aag gga gct ctg ggt atc ggt gcc cgg gtt ggt ggt ctc ggt cag 4734
Lys Gly Ala Leu Gly Ile Gly Ala Arg Val Gly Gly Leu Gly Gln
1565 1570 1575
atg cca ggt tgg tgg tac aat gtg gaa tcg aca gct acc tcc cat 4779
Met Pro Gly Trp Trp Tyr Asn Val Glu Ser Thr Ala Thr Ser His
1580 1585 1590
ttg ctc gtt cag ttc aag ctg gct atc gac gcg gct ctc agt tcg 4824
Leu Leu Val Gln Phe Lys Leu Ala Ile Asp Ala Ala Leu Ser Ser
1595 1600 1605
aaa acg gaa act cgt gct atg atg cgt gcc cgg tcc gcc aaa cag 4869
Lys Thr Glu Thr Arg Ala Met Met Arg Ala Arg Ser Ala Lys Gln
1610 1615 1620
cgc ttc ccg gtc gcc cag tgg gtg gaa gac ttg gag atc ctg caa 4914
Arg Phe Pro Val Ala Gln Trp Val Glu Asp Leu Glu Ile Leu Gln
1625 1630 1635
acc acc gcc atc caa gtg cac aac aag gaa ttg gtt aaa cat aac 4959
Thr Thr Ala Ile Gln Val His Asn Lys Glu Leu Val Lys His Asn
1640 1645 1650
ggt cga ccc ttc acc ccg tct gga act acc acg ccg ggt ggc atc 5004
Gly Arg Pro Phe Thr Pro Ser Gly Thr Thr Thr Pro Gly Gly Ile
1655 1660 1665
tta agc cag ccg tca agt cca cta atg ccc cct gga atg cag act 5049
Leu Ser Gln Pro Ser Ser Pro Leu Met Pro Pro Gly Met Gln Thr
1670 1675 1680
ccc ttg gct cat tct cgg gaa agc agc tat tct aac ctg aac cgt 5094
Pro Leu Ala His Ser Arg Glu Ser Ser Tyr Ser Asn Leu Asn Arg
1685 1690 1695
ctc agt gaa tat gtc aca gat ccg aaa aca aac tac agt cga gac 5139
Leu Ser Glu Tyr Val Thr Asp Pro Lys Thr Asn Tyr Ser Arg Asp
1700 1705 1710
atc agc ccc agt ggg acg gaa aag ccg cgg tcc ggc ctg caa cga 5184
Ile Ser Pro Ser Gly Thr Glu Lys Pro Arg Ser Gly Leu Gln Arg
1715 1720 1725
cag ctt tct ctt ggt gtt cgc tca gga cct ggt cat caa gag cgc 5229
Gln Leu Ser Leu Gly Val Arg Ser Gly Pro Gly His Gln Glu Arg
1730 1735 1740
cgt ggc cgt cgt gga cgc cag cgc gac agc atc ccc gaa cac gaa 5274
Arg Gly Arg Arg Gly Arg Gln Arg Asp Ser Ile Pro Glu His Glu
1745 1750 1755
gac acc gca ggg gcc atg acc gac gtc gaa gaa gac cac gag gac 5319
Asp Thr Ala Gly Ala Met Thr Asp Val Glu Glu Asp His Glu Asp
1760 1765 1770
att ggg gat cag cag gat gcg gac gac gag tac act ctc acc ccg 5364
Ile Gly Asp Gln Gln Asp Ala Asp Asp Glu Tyr Thr Leu Thr Pro
1775 1780 1785
gct cag gtc gag gaa gga cgt cgc ttg cag gct gtc cag cag cag 5409
Ala Gln Val Glu Glu Gly Arg Arg Leu Gln Ala Val Gln Gln Gln
1790 1795 1800
gga gtg ggt atg ccg acg agt ccg ggc gtc cgc cgt tat agt caa 5454
Gly Val Gly Met Pro Thr Ser Pro Gly Val Arg Arg Tyr Ser Gln
1805 1810 1815
gac tcc ttg cat ccg cga cag ctt cct agc agc cct ggc ccc gtc 5499
Asp Ser Leu His Pro Arg Gln Leu Pro Ser Ser Pro Gly Pro Val
1820 1825 1830
cca cct cct aca cag agc ctc ctt ccg cca ccc agg ctt ggg gat 5544
Pro Pro Pro Thr Gln Ser Leu Leu Pro Pro Pro Arg Leu Gly Asp
1835 1840 1845
gcc ggt agc cga ctc agt agc gcg tct gtc ctg tcc ctg gat tcg 5589
Ala Gly Ser Arg Leu Ser Ser Ala Ser Val Leu Ser Leu Asp Ser
1850 1855 1860
gtc gtt ggt acc aag acg gac ttc aag ctc cag aag gtt gac ccc 5634
Val Val Gly Thr Lys Thr Asp Phe Lys Leu Gln Lys Val Asp Pro
1865 1870 1875
ttc ttt acg gat tct act ggc gag tac tac aag gca ttc gac aag 5679
Phe Phe Thr Asp Ser Thr Gly Glu Tyr Tyr Lys Ala Phe Asp Lys
1880 1885 1890
agg ctg gtc ggc ttg aac ggc tcg aac tcc gaa tcc cag ctt tgc 5724
Arg Leu Val Gly Leu Asn Gly Ser Asn Ser Glu Ser Gln Leu Cys
1895 1900 1905
att gag gaa tat ctc atc aag agt gag aag gaa tgg ttc gac aag 5769
Ile Glu Glu Tyr Leu Ile Lys Ser Glu Lys Glu Trp Phe Asp Lys
1910 1915 1920
ttc cgc gat gcc cga ctg ggt cgt cta aaa tcc ccc gcg tcg tct 5814
Phe Arg Asp Ala Arg Leu Gly Arg Leu Lys Ser Pro Ala Ser Ser
1925 1930 1935
gtc ttc cgg gac aag cat ggt gcc tcc cct gtt ggc tcc tac tac 5859
Val Phe Arg Asp Lys His Gly Ala Ser Pro Val Gly Ser Tyr Tyr
1940 1945 1950
gat gat acg ggc tcc cgg gtg agt ggt gac tat gac cgg gag tcc 5904
Asp Asp Thr Gly Ser Arg Val Ser Gly Asp Tyr Asp Arg Glu Ser
1955 1960 1965
cgc gac acg gaa gat gac gag ttc ctc ctg ggc aag gac tac gtg 5949
Arg Asp Thr Glu Asp Asp Glu Phe Leu Leu Gly Lys Asp Tyr Val
1970 1975 1980
cct ccg acg ggt ctg cgc aag tgg atg cag att cgt gtt gga gac 5994
Pro Pro Thr Gly Leu Arg Lys Trp Met Gln Ile Arg Val Gly Asp
1985 1990 1995
tgg cca gtc tac tcg tta ttc ctt gcc ttg ggt cag atc att gca 6039
Trp Pro Val Tyr Ser Leu Phe Leu Ala Leu Gly Gln Ile Ile Ala
2000 2005 2010
gcc aac tct tat cag gtg acc ttg ctt acc ggt gag gtt ggt gag 6084
Ala Asn Ser Tyr Gln Val Thr Leu Leu Thr Gly Glu Val Gly Glu
2015 2020 2025
acg gcc gag aag ctc tat ggt atc gca acc acc tac ctg atc acc 6129
Thr Ala Glu Lys Leu Tyr Gly Ile Ala Thr Thr Tyr Leu Ile Thr
2030 2035 2040
tcg atc ctt tgg tgg ctt gtg ttc cgt tac ttc aaa tcg gtg gtg 6174
Ser Ile Leu Trp Trp Leu Val Phe Arg Tyr Phe Lys Ser Val Val
2045 2050 2055
tgc ctc tcg gct ccc tgg ttc ttc tat ggc ctt gcc ttc ctt ctg 6219
Cys Leu Ser Ala Pro Trp Phe Phe Tyr Gly Leu Ala Phe Leu Leu
2060 2065 2070
atc ggc tcc gct cac ttt gaa ccc aat tca ttc aac cgg ggt tgg 6264
Ile Gly Ser Ala His Phe Glu Pro Asn Ser Phe Asn Arg Gly Trp
2075 2080 2085
atc cag aac atc gga agt gga tgt tac gcc gct gcc tcg tct agc 6309
Ile Gln Asn Ile Gly Ser Gly Cys Tyr Ala Ala Ala Ser Ser Ser
2090 2095 2100
ggt tcc atc ttc ttc gcc ttg aac ttt ggt gac gaa ggt ggt gcg 6354
Gly Ser Ile Phe Phe Ala Leu Asn Phe Gly Asp Glu Gly Gly Ala
2105 2110 2115
ccg gtc gaa acc tgg atc ttc cgg gct tgt ctc att cag ggt atc 6399
Pro Val Glu Thr Trp Ile Phe Arg Ala Cys Leu Ile Gln Gly Ile
2120 2125 2130
cag tcg gct tat atc atc gga ctg tgg tat tgg ggt tcc act ctg 6444
Gln Ser Ala Tyr Ile Ile Gly Leu Trp Tyr Trp Gly Ser Thr Leu
2135 2140 2145
acc aag gca tcc agc cag ggt ctg ttg acc tcg acg aac aac atc 6489
Thr Lys Ala Ser Ser Gln Gly Leu Leu Thr Ser Thr Asn Asn Ile
2150 2155 2160
gcc aat agc tgg aag atg act gcc atc tgt tac ccg att gca atc 6534
Ala Asn Ser Trp Lys Met Thr Ala Ile Cys Tyr Pro Ile Ala Ile
2165 2170 2175
ttc ctc tgg gct gtt gga ttg ctg ctt ctc ttt gga ctt cct aac 6579
Phe Leu Trp Ala Val Gly Leu Leu Leu Leu Phe Gly Leu Pro Asn
2180 2185 2190
tac tat cgc caa acc ccg ggc aaa gtg gcc tcc ttt tac aag tcc 6624
Tyr Tyr Arg Gln Thr Pro Gly Lys Val Ala Ser Phe Tyr Lys Ser
2195 2200 2205
gta ttc cgc cgc aag atc gtc ctc tgg aac ttc gtt gcc gtc atc 6669
Val Phe Arg Arg Lys Ile Val Leu Trp Asn Phe Val Ala Val Ile
2210 2215 2220
ctg caa aac ttc ttc ctc agc gca ccg tac ggc cgc aac tgg ggc 6714
Leu Gln Asn Phe Phe Leu Ser Ala Pro Tyr Gly Arg Asn Trp Gly
2225 2230 2235
ttc ctt tgg tct tcc aat cac gcc aag gcc tgg caa atc gtt att 6759
Phe Leu Trp Ser Ser Asn His Ala Lys Ala Trp Gln Ile Val Ile
2240 2245 2250
ctc tgt atc gtc ttc tac ggg ttc gtc tgg gcg ggc ttc ctg ttc 6804
Leu Cys Ile Val Phe Tyr Gly Phe Val Trp Ala Gly Phe Leu Phe
2255 2260 2265
gtc gtc agc cgc tat ttc aag tcc cac agc tgg ttc ctg ccc gtg 6849
Val Val Ser Arg Tyr Phe Lys Ser His Ser Trp Phe Leu Pro Val
2270 2275 2280
ttt gcg tgc gga ctt gga gca cct cgc ttc att caa atc tgg tgg 6894
Phe Ala Cys Gly Leu Gly Ala Pro Arg Phe Ile Gln Ile Trp Trp
2285 2290 2295
ggt gtc tcg ggc atc ggt tac ttc ctt ccc tgg gtc tcc gga ggc 6939
Gly Val Ser Gly Ile Gly Tyr Phe Leu Pro Trp Val Ser Gly Gly
2300 2305 2310
tat ctc ggc gga gct ttg gcc tcg agg agt ctc tgg ctc tgg ctg 6984
Tyr Leu Gly Gly Ala Leu Ala Ser Arg Ser Leu Trp Leu Trp Leu
2315 2320 2325
ggc gtg ttg gat tcc atc cag ggt ctc ggg ttc ggt atc atc ctc 7029
Gly Val Leu Asp Ser Ile Gln Gly Leu Gly Phe Gly Ile Ile Leu
2330 2335 2340
ctg cag acc ctc acc cgc atg cac atg ctg ttc acc ctg atc tgc 7074
Leu Gln Thr Leu Thr Arg Met His Met Leu Phe Thr Leu Ile Cys
2345 2350 2355
tcg cag gtg ctt ggt tcc att gcc acc atc tgt gcg cgg gcg ttt 7119
Ser Gln Val Leu Gly Ser Ile Ala Thr Ile Cys Ala Arg Ala Phe
2360 2365 2370
gcc ccg aat aac gtc ggg ccc ggc cct gtg tcg ccg gac cct acc 7164
Ala Pro Asn Asn Val Gly Pro Gly Pro Val Ser Pro Asp Pro Thr
2375 2380 2385
ttt gga gga agt gca gtg gcc aat gcg tgg ttc tgg gtg gcc ctg 7209
Phe Gly Gly Ser Ala Val Ala Asn Ala Trp Phe Trp Val Ala Leu
2390 2395 2400
ttt tgt cag ctg ttg gtg tgt gct ggc ttc ctc ctc ttc ttc cgg 7254
Phe Cys Gln Leu Leu Val Cys Ala Gly Phe Leu Leu Phe Phe Arg
2405 2410 2415
aaa gag cag ctt tcc aaa cct tga 7278
Lys Glu Gln Leu Ser Lys Pro
2420 2425
<210> 6
<211> 2425
<212> PRT
<213> 黑曲霉
<400> 6
Met Lys Trp Ala Ile Ser Gly Thr Leu Leu Ala Cys Phe Ala Thr Thr
1 5 10 15
Ala Thr Ala Trp Pro Tyr Asp Glu Ser Leu Val Asp Tyr Asn Phe Asn
20 25 30
Gln Asn Gln Ser Ala Thr Asn Pro Ala Asp Tyr Trp Gly Thr Trp Pro
35 40 45
Asn His Thr Gly Asp Tyr Phe Pro Ser Pro Asp Asn Trp Arg Phe Pro
50 55 60
Val Tyr Thr Leu Phe Leu Asp Arg Phe Val Asn Gly Asp Pro Thr Asn
65 70 75 80
Asp Asn Ile Asn Gly Thr Leu Phe Glu His Asp Leu Arg Ser Asn Gln
85 90 95
Met Arg His Gly Gly Asp Val Ala Gly Leu Leu Asp Thr Leu Asp Tyr
100 105 110
Leu Gln Gly Met Gly Ile Lys Gly Leu Tyr Leu Ala Gly Thr Ile Leu
115 120 125
Met Asn Gln Pro Trp Gly Ser Asp Gly Tyr Ser Ala Leu Asp Thr Thr
130 135 140
Leu Leu Asp Gln His Tyr Gly Asn Leu Gln Thr Trp Arg Asn Ala Ile
145 150 155 160
Thr Glu Ile His Lys Arg Gly Met Tyr Val Ile Phe Asp Asn Thr Ile
165 170 175
Ala Thr Met Gly Asp Leu Ile Gly Phe Asp Gly Tyr Leu Asn Thr Thr
180 185 190
Thr Pro Phe Ser Val Lys Glu His Gln Thr Val Trp Lys Thr Asp Arg
195 200 205
Arg Tyr Val Asp Phe Asp Ile Gly Asn Asp Tyr Asn Glu Thr Cys Asp
210 215 220
Tyr Pro Arg Phe Trp Phe Glu Asp Gly Tyr Pro Val Gln Ala Ser Val
225 230 235 240
Thr Glu Glu Leu Val Gly Cys Tyr Asn Ser Asp Phe Asp Gln Tyr Gly
245 250 255
Asp Ile Glu Ala Phe Gly Val Phe Pro Asp Trp Gln Arg Gln Leu Ala
260 265 270
Lys Phe Ala Ser Val Gln Asp Arg Leu Arg Glu Trp Val Pro Ser Val
275 280 285
Arg Glu Arg Leu Ile Arg His Ser Cys Ile Ile Ile Gln Ser Leu Asp
290 295 300
Ile Asp Gly Phe Arg Tyr Asp Lys Ala Thr Gln Ala Thr Val Asp Ala
305 310 315 320
Leu Gly Asp Met Ser Asn Ala Tyr Arg Glu Cys Ala Arg Ala Val Gly
325 330 335
Lys Glu Asn Phe Phe Ile Ala Gly Glu Ile Thr Gly Gly Asn Thr Phe
340 345 350
Gly Ser Ile Tyr Leu Gly Arg Gly Arg Gln Pro Asn Gln Phe Pro Asp
355 360 365
Ser Ala Glu Ala Ala Met Lys Leu Thr Asn Thr Ser Asp Ala Gln Tyr
370 375 380
Phe Leu Arg Glu Val Gly His Glu Ala Ile Asp Gly Ala Ala Phe His
385 390 395 400
Tyr Ser Ile Tyr Arg Ala Leu Thr Arg Phe Leu Gly Met Asp Gly Asn
405 410 415
Leu Ala Ala Gly Tyr Asp Val Pro Val Asp Trp Val Asp Ala Trp Asn
420 425 430
Leu Met Leu Gln Ser Asn Asp Leu Val Asn Ala Asn Thr Gly Lys Phe
435 440 445
Asp Pro Arg His Met Tyr Gly Ala Thr Asn Gln Asp Val Phe Arg Trp
450 455 460
Pro Thr Val Glu Lys Gly Val Glu Arg Gln Leu Leu Gly Leu Tyr Ile
465 470 475 480
Thr Thr Leu Leu Leu Pro Gly Ile Pro Leu Leu Leu Trp Gly Glu Glu
485 490 495
Gln Ala Phe Tyr Val Leu Asp Ala Thr Ala Ser Asn Tyr Ile Tyr Gly
500 505 510
Arg Gln Ala Met Ser Pro Ala Thr Ala Trp Arg Asp His Gly Cys Phe
515 520 525
Ser Leu Glu Ser Ser Gln Tyr Tyr Asn Trp Pro Ile Glu Ser Gly Arg
530 535 540
Gln Gly Cys His Asp Pro Thr Val Ala Tyr Asp His Arg Asp Pro Ser
545 550 555 560
His Pro Val Arg Asn Ile Ile Lys His Met Tyr Gln Met Arg Glu Gln
565 570 575
Phe Pro Val Leu Asn Asp Gly Tyr Thr Ile Gln Lys Leu Ser Asn His
580 585 590
Thr Glu Asp Val Tyr Tyr Leu Gly Ser Asn Gly Thr Ala Thr Glu Thr
595 600 605
Gly Leu Trp Ser Ile Leu Arg Asp Val Asn Ala Asp Val Gln Asp Leu
610 615 620
Gly Ser Asp Ala Lys Asn Gln Pro Val Trp Leu Val Tyr His Asn Thr
625 630 635 640
Asn Arg Thr Ile Asp Tyr Lys Phe Asp Cys Ser Asp Asn Asp Thr Ala
645 650 655
Leu Ile Ala Pro Phe Asp Ser Gly Thr Trp Val Lys Asn Leu Phe His
660 665 670
Pro Tyr Asp Glu His Gln Leu Ile Asp Ser Pro Thr Lys Leu Gly Leu
675 680 685
Asn Gly Ser Thr Ala Tyr Ser Gly Cys Leu Ala Asn Met Thr Met Ser
690 695 700
Ala Tyr Glu Phe Arg Ala Tyr Val Pro Lys Thr Arg Phe Thr Lys Pro
705 710 715 720
Arg Pro Met Ile Thr Lys Phe Thr Pro Gly His Asp Val Pro Ile Arg
725 730 735
Ser Thr Val Ala Pro Asn Ala Asp Glu Asn Val Glu Val Glu Ile Tyr
740 745 750
Phe Ser Glu Glu Met Asp Cys Asp Ser Val Thr Lys Ser Ile Thr Leu
755 760 765
Ser Ser Ser Thr Glu Ile Gly Lys Ala Pro Ser Val Asp Ser Gly Ser
770 775 780
Val Asn Cys Lys Ser Val Pro Ala Thr Asn Thr Ser Trp Thr Gly Gln
785 790 795 800
Ile Pro Gly Val Trp Met Trp Ala Ala Asn Leu Thr Gly Val Tyr Asn
805 810 815
Gly Ile His Arg Leu Thr Val Asn Asn Val Ser Thr Glu Ser Gly Asn
820 825 830
Ala Thr Thr Asn Ala Val Asp His Phe Leu Phe Arg Ile Gly Gln Ile
835 840 845
Asp Asn Pro Met Ile Phe Ser Ser Ala Asn Tyr Ser Thr Ser Leu Leu
850 855 860
His Lys Glu Ser Asn Gly Thr Leu Phe Ile Gln His His Ala Ala Gly
865 870 875 880
Ala Asp Lys Tyr Arg Tyr Ser Thr Asn Trp Gly Thr Thr Phe Ser Asp
885 890 895
Trp Ile Asp Tyr Arg Gly Gly Asn Asp Thr Ile Glu Glu Leu Glu Trp
900 905 910
Ser Gly Thr Lys Lys Gln Ser Trp Lys Gly Asn His Val Arg Val Glu
915 920 925
Tyr Trp Ser Arg Trp Thr Gly Ser Ser Asp Tyr Val Gln Glu Gly Asp
930 935 940
Ala Gly Trp Asn Glu Asn Val Pro Arg Arg Phe Pro His Val Phe Phe
945 950 955 960
Asn Gly Pro Tyr Asn Gln Tyr Gly Tyr Asp Ala Gly Leu Asp Asn Val
965 970 975
Val Arg Gln Asp Ser Val Asp Gly Leu Trp Lys Tyr His Phe Thr Ala
980 985 990
Glu Trp Pro Ala Gln Ala Gln Leu Asn Ile Trp Gly Met Asn Pro Asp
995 1000 1005
Gly Glu Pro Asp Gln Ser Trp Val Leu Gly Asp Ala Asp Asn Asp
1010 1015 1020
Ser Val Leu Asp Arg Met Pro Pro Ser Ser Leu Ser Ala Thr Leu
1025 1030 1035
Ile Asn Ile Thr Glu His Pro Pro Ser Pro Tyr Ile Ser Trp Asn
1040 1045 1050
Ile Phe Ile Asp Asp Gly Thr Met Arg Phe Gln Leu Phe Pro Val
1055 1060 1065
Gly His Gln Asn Thr Gln Ile Ala Met Tyr Val Leu Phe Trp Ile
1070 1075 1080
Ile Pro Val Ile Thr Gly Ala Ala Gly Val Trp Ala Phe Met Lys
1085 1090 1095
Ser Phe Tyr Lys Val Lys Phe Asn Gln Val Gly Val Ser Glu Lys
1100 1105 1110
His Gln Met Ile Pro Leu Ala Leu Arg Arg Lys Phe Lys Arg Asn
1115 1120 1125
Arg Asn Arg Gly Gly Asp Glu Glu Asn Ser Asn Pro Leu Met Arg
1130 1135 1140
Leu Ala Asn Lys Ser Gly Phe Leu Gln Thr Asp Thr Ala Ile Gly
1145 1150 1155
Gly Ala Ala Ser Gly Lys Arg Arg Met Val Leu Ile Ala Thr Met
1160 1165 1170
Glu Tyr Asp Ile Glu Asp Trp Ala Ile Lys Ile Lys Ile Gly Gly
1175 1180 1185
Leu Gly Val Met Ala Gln Leu Met Gly Lys Thr Leu Gly His Gln
1190 1195 1200
Asp Leu Ile Trp Val Val Pro Cys Val Gly Gly Val Asp Tyr Pro
1205 1210 1215
Val Asp Lys Pro Ala Glu Pro Met His Val Thr Ile Leu Gly Asn
1220 1225 1230
Ser Tyr Glu Val Gln Val Gln Tyr His Val Leu Asn Asn Ile Thr
1235 1240 1245
Tyr Val Leu Leu Asp Ala Pro Val Phe Arg Gln Gln Ser Lys Ser
1250 1255 1260
Glu Pro Tyr Pro Ala Arg Met Asp Asp Leu Asn Ser Ala Ile Tyr
1265 1270 1275
Tyr Ser Ala Trp Asn Gln Cys Ile Ala Glu Ala Cys Lys Arg Phe
1280 1285 1290
Pro Ile Asp Leu Tyr His Ile Asn Asp Tyr His Gly Ser Leu Ala
1295 1300 1305
Pro Leu Tyr Leu Leu Pro Asp Thr Val Pro Ala Cys Leu Ser Leu
1310 1315 1320
His Asn Ala Glu Phe Gln Gly Leu Trp Pro Met Arg Thr Gln Lys
1325 1330 1335
Glu Lys Glu Glu Val Cys Ser Val Phe Asn Leu Asp Ile Glu Thr
1340 1345 1350
Val Arg His Tyr Val Gln Phe Gly Glu Val Phe Asn Leu Leu His
1355 1360 1365
Ser Gly Ala Ser Tyr Leu Arg Val His Gln Gln Gly Phe Gly Ala
1370 1375 1380
Val Gly Val Ser Lys Lys Tyr Gly Lys Arg Ser Tyr Ala Arg Tyr
1385 1390 1395
Pro Ile Phe Trp Gly Leu Arg Lys Val Gly Asn Leu Pro Asn Pro
1400 1405 1410
Asp Pro Ser Asp Val Gly Glu Trp Ser Lys Glu Gln Ala Ser Ala
1415 1420 1425
Met Gly Asp Asn Val Ser Val Asp Pro Thr Tyr Glu Ala Gly Arg
1430 1435 1440
Gly Asp Leu Lys Arg Gln Ala Gln Glu Trp Ala Gly Leu Glu Gln
1445 1450 1455
Asn Pro Asp Ala Asp Leu Leu Val Phe Val Gly Arg Trp Ser Met
1460 1465 1470
Gln Lys Gly Val Asp Leu Ile Ala Asp Val Met Pro Ala Val Leu
1475 1480 1485
Glu Ala Arg Pro Asn Val Gln Leu Ile Cys Val Gly Pro Val Ile
1490 1495 1500
Asp Leu Tyr Gly Lys Phe Ala Ala Leu Lys Leu Asp His Met Met
1505 1510 1515
Lys Val Tyr Pro Gly Arg Val Phe Ser Arg Pro Glu Phe Thr Ala
1520 1525 1530
Leu Pro Pro Tyr Ile Phe Ser Gly Ala Glu Phe Ala Leu Ile Pro
1535 1540 1545
Ser Arg Asp Glu Pro Phe Gly Leu Val Ala Val Glu Phe Gly Arg
1550 1555 1560
Lys Gly Ala Leu Gly Ile Gly Ala Arg Val Gly Gly Leu Gly Gln
1565 1570 1575
Met Pro Gly Trp Trp Tyr Asn Val Glu Ser Thr Ala Thr Ser His
1580 1585 1590
Leu Leu Val Gln Phe Lys Leu Ala Ile Asp Ala Ala Leu Ser Ser
1595 1600 1605
Lys Thr Glu Thr Arg Ala Met Met Arg Ala Arg Ser Ala Lys Gln
1610 1615 1620
Arg Phe Pro Val Ala Gln Trp Val Glu Asp Leu Glu Ile Leu Gln
1625 1630 1635
Thr Thr Ala Ile Gln Val His Asn Lys Glu Leu Val Lys His Asn
1640 1645 1650
Gly Arg Pro Phe Thr Pro Ser Gly Thr Thr Thr Pro Gly Gly Ile
1655 1660 1665
Leu Ser Gln Pro Ser Ser Pro Leu Met Pro Pro Gly Met Gln Thr
1670 1675 1680
Pro Leu Ala His Ser Arg Glu Ser Ser Tyr Ser Asn Leu Asn Arg
1685 1690 1695
Leu Ser Glu Tyr Val Thr Asp Pro Lys Thr Asn Tyr Ser Arg Asp
1700 1705 1710
Ile Ser Pro Ser Gly Thr Glu Lys Pro Arg Ser Gly Leu Gln Arg
1715 1720 1725
Gln Leu Ser Leu Gly Val Arg Ser Gly Pro Gly His Gln Glu Arg
1730 1735 1740
Arg Gly Arg Arg Gly Arg Gln Arg Asp Ser Ile Pro Glu His Glu
1745 1750 1755
Asp Thr Ala Gly Ala Met Thr Asp Val Glu Glu Asp His Glu Asp
1760 1765 1770
Ile Gly Asp Gln Gln Asp Ala Asp Asp Glu Tyr Thr Leu Thr Pro
1775 1780 1785
Ala Gln Val Glu Glu Gly Arg Arg Leu Gln Ala Val Gln Gln Gln
1790 1795 1800
Gly Val Gly Met Pro Thr Ser Pro Gly Val Arg Arg Tyr Ser Gln
1805 1810 1815
Asp Ser Leu His Pro Arg Gln Leu Pro Ser Ser Pro Gly Pro Val
1820 1825 1830
Pro Pro Pro Thr Gln Ser Leu Leu Pro Pro Pro Arg Leu Gly Asp
1835 1840 1845
Ala Gly Ser Arg Leu Ser Ser Ala Ser Val Leu Ser Leu Asp Ser
1850 1855 1860
Val Val Gly Thr Lys Thr Asp Phe Lys Leu Gln Lys Val Asp Pro
1865 1870 1875
Phe Phe Thr Asp Ser Thr Gly Glu Tyr Tyr Lys Ala Phe Asp Lys
1880 1885 1890
Arg Leu Val Gly Leu Asn Gly Ser Asn Ser Glu Ser Gln Leu Cys
1895 1900 1905
Ile Glu Glu Tyr Leu Ile Lys Ser Glu Lys Glu Trp Phe Asp Lys
1910 1915 1920
Phe Arg Asp Ala Arg Leu Gly Arg Leu Lys Ser Pro Ala Ser Ser
1925 1930 1935
Val Phe Arg Asp Lys His Gly Ala Ser Pro Val Gly Ser Tyr Tyr
1940 1945 1950
Asp Asp Thr Gly Ser Arg Val Ser Gly Asp Tyr Asp Arg Glu Ser
1955 1960 1965
Arg Asp Thr Glu Asp Asp Glu Phe Leu Leu Gly Lys Asp Tyr Val
1970 1975 1980
Pro Pro Thr Gly Leu Arg Lys Trp Met Gln Ile Arg Val Gly Asp
1985 1990 1995
Trp Pro Val Tyr Ser Leu Phe Leu Ala Leu Gly Gln Ile Ile Ala
2000 2005 2010
Ala Asn Ser Tyr Gln Val Thr Leu Leu Thr Gly Glu Val Gly Glu
2015 2020 2025
Thr Ala Glu Lys Leu Tyr Gly Ile Ala Thr Thr Tyr Leu Ile Thr
2030 2035 2040
Ser Ile Leu Trp Trp Leu Val Phe Arg Tyr Phe Lys Ser Val Val
2045 2050 2055
Cys Leu Ser Ala Pro Trp Phe Phe Tyr Gly Leu Ala Phe Leu Leu
2060 2065 2070
Ile Gly Ser Ala His Phe Glu Pro Asn Ser Phe Asn Arg Gly Trp
2075 2080 2085
Ile Gln Asn Ile Gly Ser Gly Cys Tyr Ala Ala Ala Ser Ser Ser
2090 2095 2100
Gly Ser Ile Phe Phe Ala Leu Asn Phe Gly Asp Glu Gly Gly Ala
2105 2110 2115
Pro Val Glu Thr Trp Ile Phe Arg Ala Cys Leu Ile Gln Gly Ile
2120 2125 2130
Gln Ser Ala Tyr Ile Ile Gly Leu Trp Tyr Trp Gly Ser Thr Leu
2135 2140 2145
Thr Lys Ala Ser Ser Gln Gly Leu Leu Thr Ser Thr Asn Asn Ile
2150 2155 2160
Ala Asn Ser Trp Lys Met Thr Ala Ile Cys Tyr Pro Ile Ala Ile
2165 2170 2175
Phe Leu Trp Ala Val Gly Leu Leu Leu Leu Phe Gly Leu Pro Asn
2180 2185 2190
Tyr Tyr Arg Gln Thr Pro Gly Lys Val Ala Ser Phe Tyr Lys Ser
2195 2200 2205
Val Phe Arg Arg Lys Ile Val Leu Trp Asn Phe Val Ala Val Ile
2210 2215 2220
Leu Gln Asn Phe Phe Leu Ser Ala Pro Tyr Gly Arg Asn Trp Gly
2225 2230 2235
Phe Leu Trp Ser Ser Asn His Ala Lys Ala Trp Gln Ile Val Ile
2240 2245 2250
Leu Cys Ile Val Phe Tyr Gly Phe Val Trp Ala Gly Phe Leu Phe
2255 2260 2265
Val Val Ser Arg Tyr Phe Lys Ser His Ser Trp Phe Leu Pro Val
2270 2275 2280
Phe Ala Cys Gly Leu Gly Ala Pro Arg Phe Ile Gln Ile Trp Trp
2285 2290 2295
Gly Val Ser Gly Ile Gly Tyr Phe Leu Pro Trp Val Ser Gly Gly
2300 2305 2310
Tyr Leu Gly Gly Ala Leu Ala Ser Arg Ser Leu Trp Leu Trp Leu
2315 2320 2325
Gly Val Leu Asp Ser Ile Gln Gly Leu Gly Phe Gly Ile Ile Leu
2330 2335 2340
Leu Gln Thr Leu Thr Arg Met His Met Leu Phe Thr Leu Ile Cys
2345 2350 2355
Ser Gln Val Leu Gly Ser Ile Ala Thr Ile Cys Ala Arg Ala Phe
2360 2365 2370
Ala Pro Asn Asn Val Gly Pro Gly Pro Val Ser Pro Asp Pro Thr
2375 2380 2385
Phe Gly Gly Ser Ala Val Ala Asn Ala Trp Phe Trp Val Ala Leu
2390 2395 2400
Phe Cys Gln Leu Leu Val Cys Ala Gly Phe Leu Leu Phe Phe Arg
2405 2410 2415
Lys Glu Gln Leu Ser Lys Pro
2420 2425
<210> 7
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物agsA1 (正义)
<400> 7
ggtggcggcc gcctgtgaat agctaccagc 30
<210> 8
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物agsA2 (反义)
<400> 8
ctccactagt tgctaatgta ttatccatga 30
<210> 9
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物agsA3 (正义)
<400> 9
cttctagagt ttaaacaacc gcctcagcag 30
<210> 10
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物agsA4 (反义)
<400> 10
ttaattaaag aagggcattc tatggacgta 30
<210> 11
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物agsE1 (正义)
<400> 11
accgcggtct ttcagccagg gaatggct 28
<210> 12
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物agsE2 (反义)
<400> 12
ttactagtac acaatagtgc aggtgatgtc 30
<210> 13
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物agsE3 (正义)
<400> 13
tttctagacg ccttaatgat gtggtggtg 29
<210> 14
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 引物agsE4 (反义)
<400> 14
ttaattaaat ggcgcccact gctacagg 28
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物(agsA5)
<400> 15
agcagtctcg gcggcgagga 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物(agsA6)
<400> 16
attgcccaag cggcgtctca 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物(agsE5)
<400> 17
accgggcatg aacatttaac 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物(agsE6)
<400> 18
aagtatttat tgtattttgg 20
<210> 19
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物ap025-1 (正义)
<400> 19
tttggatcca ccatgcgttt catttctgtc tcc 33
<210> 20
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物ap025-2 (反义)
<400> 20
ccacgtgtta gcaaccaagg tatatggcat 30
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物(ap025-3)
<400> 21
aggatcagtt cctgctccgg 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物(ap025-4)
<400> 22
ggtatatggc attcgcatag 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物(ap025-3)
<400> 23
aggatcagtt cctgctccgg 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物(ap025-4)
<400> 24
ggtatatggc attcgcatag 20

Claims (11)

1.一种产生感兴趣的多肽的突变体丝状真菌宿主细胞,其中编码涉及α-葡聚糖合成的两种或更多种多肽的两种或更多种多核苷酸是灭活的,所述的两种或更多种多肽选自下组,该组由以下各项组成:
(a)涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:3的黑曲霉AgsA多肽的氨基酸序列具有至少70%序列一致性的氨基酸序列,以及涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:6的黑曲霉AgsE多肽具有至少70%序列一致性的氨基酸序列;
(b)涉及α-葡聚糖合成的多肽,该多肽由以下项编码:
(i)包括与SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列具有至少70%序列一致性的核苷酸序列的基因组多核苷酸,以及涉及α-葡聚糖合成的多肽,该多肽由包括与SEQ IDNO:4的黑曲霉agsE基因组核苷酸序列具有至少70%序列一致性的核苷酸序列的基因组多核苷酸编码,或
(ii)分别示出在SEQ ID NO:2和SEQ ID NO:5中的(i)的cDNA核苷酸序列;和
(c)涉及α-葡聚糖合成的两种多肽,这些多肽由在中严格条件下与以下项杂交的多核苷酸编码:
(I)分别是,SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列,和SEQ ID NO:4中的黑曲霉agsE基因组核苷酸序列;
(II)分别是,在SEQ ID NO:2和SEQ ID NO:5中示出的(I)的cDNA核苷酸序列,或
(III)(I)或(II)的全长互补体。
2.如权利要求1所述的突变体丝状真菌宿主细胞,该突变体丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
3.如权利要求1或2所述的突变丝状真菌宿主细胞,该突变体丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、昆士兰金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长绒毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
4.如权利要求1-3中任一项所述的突变体丝状真菌宿主细胞,其中这一感兴趣的多肽是与该宿主细胞同源或异源的;优选地,这一感兴趣的多肽是分泌多肽;更优选地,它是激素、酶、受体或其一部分、抗体或其一部分、或报告子;甚至更优选地,这一感兴趣的多肽是水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;并且最优选地,这一感兴趣的多肽是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、碳水化物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
5.如权利要求1-4中任一项所述的突变体丝状真菌宿主细胞,其中这两种或更多种多核苷酸的灭活是通过这两种或更多种多核苷酸和/或它们各自的启动子的突变;优选地是通过这两种或更多种多核苷酸和/或它们各自的启动子从该宿主细胞的基因组部分或完全缺失来进行的。
6.如权利要求1-5中任一项所述的突变体丝状真菌宿主细胞,其中这两种或更多种多核苷酸编码涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:3的黑曲霉AgsA多肽的氨基酸序列具有至少70%序列一致性的氨基酸序列,或由其组成,以及涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:6的黑曲霉AgsE多肽具有至少70%序列一致性的氨基酸序列,或由其组成。
7.在突变体丝状真菌宿主细胞中产生感兴趣的多肽的一种方法,所述方法包括以下步骤:
(a)在有助于这一感兴趣的多肽产生的条件下培养如在权利要求1-6中任一项所定义的突变体丝状真菌宿主细胞;并且,任选地,
(b)回收这一感兴趣的多肽。
8.构建突变的丝状真菌宿主细胞的一种方法,所述方法包括分别地将编码两种或更多种多肽的在丝状真菌宿主细胞中的两种或更多种多核苷酸灭活,这些多肽选自下组,该组由以下各项组成:
(a)涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:3的黑曲霉AgsA多肽的氨基酸序列具有至少70%序列一致性的氨基酸序列,以及涉及α-葡聚糖合成的多肽,该多肽包括与SEQ ID NO:6的黑曲霉AgsE多肽具有至少70%序列一致性的氨基酸序列;
(b)涉及α-葡聚糖合成的多肽,该多肽由以下项编码:
(i)包括与SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列具有至少70%序列一致性的核苷酸序列的基因组多核苷酸,以及涉及α-葡聚糖合成的多肽,该多肽由包括与SEQ IDNO:4的黑曲霉agsE基因组核苷酸序列具有至少70%序列一致性的核苷酸序列的基因组多核苷酸编码,或
(ii)分别示出在SEQ ID NO:2和SEQ ID NO:5中的(i)的cDNA核苷酸序列;和
(c)涉及α-葡聚糖合成的两种多肽,这些多肽由在中严格条件下与以下项杂交的多核苷酸编码:
(I)分别是,SEQ ID NO:1中的黑曲霉agsA基因组核苷酸序列,和SEQ ID NO:4中的黑曲霉agsE基因组核苷酸序列;
(II)分别是,在SEQ ID NO:2和SEQ ID NO:5中示出的(I)的cDNA核苷酸序列,或
(III)(I)或(II)的全长互补体。
9.如权利要求8所述的方法,其中该丝状真菌宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌、干拟蜡菌、卡内基拟蜡菌、浅黄拟蜡菌、潘诺希塔拟蜡菌、环带拟蜡菌、微红拟蜡菌、虫拟蜡菌、狭边金孢子菌、嗜角质金孢子菌、卢克诺文思金孢子菌、粪状金孢子菌、租金孢子菌、昆士兰金孢子菌、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛革盖菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌、射脉菌、刺芹侧耳、土生梭孢壳霉、长绒毛栓菌、变色栓菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
10.如权利要求8或9所述的方法,其中该丝状真菌宿主细胞产生感兴趣的多肽;优选地,这一感兴趣的多肽是与该宿主细胞同源或异源的;更优选地,这一感兴趣的多肽是分泌多肽;甚至更优选地,它是激素、酶、受体或其一部分、抗体或其一部分、或报告子;仍更优选地,这一感兴趣的多肽是水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶;并且最优选地,这一感兴趣的多肽是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、碳水化物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
11.如权利要求8-10中任一项所述的方法,其中这两种或更多种多核苷酸的灭活是通过这两种或更多种多核苷酸和/或它们各自的启动子的突变;优选地是通过这两种或更多种多核苷酸和/或它们各自的启动子从该宿主细胞的基因组部分或完全缺失来进行的。
CN201580058541.2A 2014-10-29 2015-10-28 丝状真菌双重突变体宿主细胞 Pending CN107075451A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14190952.3 2014-10-29
EP14190952 2014-10-29
PCT/EP2015/074989 WO2016066690A1 (en) 2014-10-29 2015-10-28 Filamentous fungal double-mutant host cells

Publications (1)

Publication Number Publication Date
CN107075451A true CN107075451A (zh) 2017-08-18

Family

ID=51870849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580058541.2A Pending CN107075451A (zh) 2014-10-29 2015-10-28 丝状真菌双重突变体宿主细胞

Country Status (5)

Country Link
US (1) US20170313997A1 (zh)
EP (1) EP3212768A1 (zh)
JP (1) JP2017532055A (zh)
CN (1) CN107075451A (zh)
WO (1) WO2016066690A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109476714A (zh) * 2016-07-22 2019-03-15 诺维信公司 改善的丝状真菌宿主
US20200063166A1 (en) 2017-03-13 2020-02-27 Dsm Ip Assets B.V. Zinc binuclear cluster transcriptional regulator-deficient strain
WO2018172155A1 (en) 2017-03-23 2018-09-27 Novozymes A/S Improved filamentous fungal host cells
EP3809852A1 (en) 2018-06-19 2021-04-28 DSM IP Assets B.V. Lipolytic enzyme variants
EP4048777A4 (en) * 2019-09-12 2024-04-17 Dartmouth College COMPOSITIONS AND METHODS RELATED TO MYCOTIC HYPOXIARESPONSIVE MORPHOLOGICAL FACTOR A (HRMA) AND BIOFILM ARCHITECTURE FACTOR (BAF)
KR102199005B1 (ko) * 2019-12-13 2021-01-06 전남대학교산학협력단 휴미콜라 속 js-0112 균주 및 이를 함유하는 항진균제 조성물
WO2023222614A1 (en) 2022-05-16 2023-11-23 Dsm Ip Assets B.V. Lipolytic enzyme variants

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014013074A1 (en) * 2012-07-19 2014-01-23 Dsm Ip Assets B.V. Agse-deficient strain
WO2014073674A1 (ja) * 2012-11-09 2014-05-15 国立大学法人東北大学 糸状菌の高密度培養株を用いた有用物質生産方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014013074A1 (en) * 2012-07-19 2014-01-23 Dsm Ip Assets B.V. Agse-deficient strain
WO2014073674A1 (ja) * 2012-11-09 2014-05-15 国立大学法人東北大学 糸状菌の高密度培養株を用いた有用物質生産方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DAMVELD RA等: "expression of agsA, one of five 1,3-alpha-d-glucan synthase-encoding genes in Asperillus niger, is induced in response to cell wall stress", 《FUNGAL GENETICS AND BIOLOGY》 *

Also Published As

Publication number Publication date
WO2016066690A1 (en) 2016-05-06
JP2017532055A (ja) 2017-11-02
US20170313997A1 (en) 2017-11-02
EP3212768A1 (en) 2017-09-06

Similar Documents

Publication Publication Date Title
CN107075451A (zh) 丝状真菌双重突变体宿主细胞
CN104603273B (zh) 重组系统
CN103459600B (zh) 用于生产感兴趣的化合物的方法
CN105586355B (zh) 在镶片镰孢的酶缺陷突变体中产生多肽的方法
CN101218348A (zh) 具有提高的同源重组效率的丝状真菌突变体
CN102224245A (zh) 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
CN107090467A (zh) 丝状真菌中多个基因拷贝的同时位点特异性整合
DK3036324T3 (en) Regulated PepC expression
CN105992821A (zh) 真菌基因文库的双分裂标记物整合
CN104630174B (zh) 磷脂酶c突变体及其用途
CN109563522A (zh) 真菌宿主细胞中dna片段的基因组整合
JPH08500733A (ja) グルコースの存在下で活性的な真菌プロモーター
US11046736B2 (en) Filamentous fungal host
CN108431204A (zh) 改良的表达蛋白质的菌株
US8415119B2 (en) Method for increasing expression yield of a protein of interest
EP3887524A1 (en) Modified filamentous fungal host cells
EP2665812B1 (en) Expression of plant peroxidases in filamentous fungi
CN108779155A (zh) RlmA灭活的丝状真菌宿主细胞
US20160304887A1 (en) Introducing or Inactivating Female Fertility in Filamentous Fungal Cells
WO2018167153A1 (en) Improved filamentous fungal host cell
EP2929028A1 (en) Method for generating site-specific mutations in filamentous fungi
CN113699176A (zh) 高产溶血磷脂酶黑曲霉重组表达菌株的构建及应用
CN107109424A (zh) 真菌宿主菌株、dna构建体及使用方法
CN114555777A (zh) 经修饰的丝状真菌宿主细胞
CN113056552A (zh) 经修饰的丝状真菌宿主细胞

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170818

WD01 Invention patent application deemed withdrawn after publication