CN101180396A - 在真核细胞中生产化合物的方法 - Google Patents

在真核细胞中生产化合物的方法 Download PDF

Info

Publication number
CN101180396A
CN101180396A CNA2005800353708A CN200580035370A CN101180396A CN 101180396 A CN101180396 A CN 101180396A CN A2005800353708 A CNA2005800353708 A CN A2005800353708A CN 200580035370 A CN200580035370 A CN 200580035370A CN 101180396 A CN101180396 A CN 101180396A
Authority
CN
China
Prior art keywords
ala
peroxysome
leu
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800353708A
Other languages
English (en)
Inventor
科尼利斯·玛丽亚·雅各布斯·沙吉
彼得吕斯·约翰尼斯·费瑞德瑞克·汉福特·顿
约翰尼斯·翰德里克·温德·德
帕那吉帝斯·萨拉帝诺普罗斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN101180396A publication Critical patent/CN101180396A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/582Recycling of unreacted starting or intermediate materials

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及含有过氧化物酶体的真核细胞,所述过氧化物酶体能与细胞分泌途径所涉及的细胞的膜结构融合。以这种方式,真核细胞能将过氧化物酶体的内含物释放到细胞外。本发明还涉及一种方法,用于在所述真核细胞中生产感兴趣的化合物,其中,感兴趣的化合物存在于细胞的过氧化物酶体中。所述感兴趣的化合物将通过促进过氧化物酶体定位的信号在过氧化物酶体中积累。优选的宿主细胞是有丝真菌细胞。

Description

在真核细胞中生产化合物的方法
发明领域
本发明涉及重组DNA技术。特别地,本发明涉及用于在真核细胞中生产化合物的方法,其中所述化合物存在于下述过氧化物酶体中,所述过氧化物酶体能与细胞分泌途径所涉及的细胞的膜结构融合,这使得所述化合物可被释放到细胞外。
发明背景
蛋白通过真核细胞向培养基的分泌涉及蛋白转运经过多个膜闭合的区室,这构成了分泌途径。首先,蛋白被转移到内质网ER内腔。蛋白质在膜的泡囊中从那儿转运到Golgi复合体,并从Golgi复合体转运到质膜。分泌过程涉及多个步骤,其中,含有被分泌蛋白的泡囊从供体膜上被剪下来,定位到受体膜并与之融合。在这些步骤中的每一个,需要若干种不同蛋白(例如折叠蛋白的伴侣分子)的功能,以进行对蛋白的足够熟化,包括糖基化和二硫键形成。细胞外蛋白在ER的氧化环境中成熟,在该处它们成为核心糖基化的,该糖基化过程随后在Golgi复合体中完成。
已经进行了若干尝试,企图提高有丝真菌中蛋白的分泌。用于提高异源蛋白分泌的常用手段是使用信号序列(见,例如,EP 0215 594)。如上文所示的真核细胞中的传统分泌途径被改造为适应细胞外蛋白的成熟。细胞内蛋白的成熟在具有特定伴侣分子和折叠蛋白的细胞质的还原环境中实现。以工业设置对蛋白质(尤其是细胞内蛋白质)的生产仍是困难的忍weu,因为分泌和下游加工的低效率导致低的蛋白产量(Hopkins TR.Physical and chemical cell disruption for the recovery of intracellular proteins.Bioprocess Technol.1991;12:57-83.)
由于生产蛋白质的日益增长的工业重要性以及分泌和下游加工途径的低效率,人们仍然需要获得用于在真核细胞中生产蛋白质的改进方法。本发明提供了一种新颖的方法,用于高效率地生产蛋白质。
附图说明
图1展示了A.niger表达载体pGBFIN-32。
图2展示了K.lactis表达载体pGBK-20。
图3展示了在用乙酰胺酶转化过的对照A.niger细胞中或者在用与SKL序列融合的乙酰胺酶基因转化过的A.niger细胞中测量的乙酰胺酶活性。
图4展示了在用乙酰胺酶转化过的对照K.lactis细胞中或者在用与SKL序列融合的乙酰胺酶基因转化过的K.lactis细胞中测量的乙酰胺酶活性。
图5显示了用GFP-SKL转化过的A.niger的过氧化物酶体。
图6显示了用GFP-SKL转化过并且与油酸钠(过氧化物酶体增殖的介导物(mediator))一起培养的A.niger的过氧化物酶体。
图7显示了含有若干种经转化A.niger菌株的培养物上清液的SDS-PAGE凝胶,其展示了GFP-SKL在上清液中的释放。
图8显示了含有若干种经转化A.niger菌株的培养物上清液的Western杂交印迹,其展示了GFP-SKL在上清液中的释放。
图9显示了表达GFP(图C)、GFP-SKL(图B)或GFP/Pmp22(图A)的A.niger菌株。
图10显示了细胞的a-特异性溶解的程度,其作为乙酰胺酶(amdS)/ml培养物上清液的相对量展示。
图11展示了A.niger表达载体pGBFIN-5。
图12显示了10L规模发酵中A.niger中细胞外的GFP-SKL生产以及生物物质浓度。
图13显示了A.niger中细胞内的GFP-SKL生产上的葡萄糖受限和氧受限发酵条件之间的区别。
图14显示了具有C末端SKL的经分泌乙酰胺酶在培养物上清液中的存在;方块2和4展示了能分泌细胞内化合物的A.niger宿主细胞中的具有SKL的乙酰胺酶;方块1和2展示了能分泌细胞内化合物的A.niger宿主细胞中的不具有SKL的乙酰胺酶。
图15展示了培养物上清液中具有C末端SRL的经分泌乙酰胺酶的存在。
发明详述
在第一个方面,本发明涉及一种真核细胞,其含有过氧化物酶体,所述过氧化物酶体能与细胞分泌途径所涉及的细胞的膜结构融合。以这种方式,本发明提供了真核细胞的一种新能力,由此它们能将过氧化物酶体的内含物释放到细胞外。以这种方式,过去不能被真核细胞分泌的化合物现在可有利地通过过氧化物酶体途径释放。
根据本发明,过氧化物酶体与细胞分泌途径所涉及的细胞的膜结构的融合等价于过氧化物酶体的膜与细胞分泌途径所涉及的细胞的膜结构的融合。融合指不同元件的合并,形成统一的整体:此处一种元件是过氧化物酶体的膜,另外的元件是来自细胞分泌途径所涉及的细胞的膜结构的膜。过氧化物酶体的脂双层膜与分泌途径的膜结构的脂双层膜的融合在本文中被理解为表示两种脂双层膜形成一种单一的、连续的脂双层膜,其包围着过氧化物酶体和分泌途径的膜结构的内含物。当过氧化物酶体脂双层膜与质膜融合形成单一的、连续的脂双层膜的情况下,应当理解,新形成的单一的膜将不包围过氧化物酶体的内含物,而是过氧化物酶体的内含物将释放进细胞外环境。例如,如果过氧化物酶体与质膜的融合发生,过氧化物酶体的内含物将直接输出到细胞外。在另一个例子中,如果过氧化物酶体与Golgi复合体和/或与ER的融合发生,过氧化物酶体内含物将转移到Golgi复合体和/或ER中,由此通过细胞的内在分泌途径间接输出到细胞外。
过氧化物酶体(也称作微体)被定义为单一膜限定的(singlemembrane-bound)细胞器,其涉及在真核细胞中普遍发现的多种代谢过程(Sakai et al.Yeast 14,1175-1187;1998)。在真核细胞中,过氧化物酶体通常不与细胞分泌途径所涉及的细胞的膜结构融合,但其作为单一膜限定的细胞器被保持于胞质中。
在本发明的上下文中,细胞分泌途径所涉及的细胞的膜结构可以是细胞对多肽的分泌所涉及的任何膜结构。在本发明通篇中,短语“细胞分泌途径所涉及的细胞的膜结构”和术语“膜结构”可同义使用。优选地,细胞分泌途径所涉及的细胞的膜结构选自质膜、Golgi复合体和内质网(ER)构成的组。Golgi复合体被定义为包括最少三种(顺区、中区和反区Golgi)不同的扁平膜限定区室(池,cisternae)构成,所述区室互相连接,形成堆叠(Pfeffer SR,Constructing a Golgi complex.J Cell Biol.2001Dec 10;155(6):873-5)。
分泌途径中膜融合的过程在所有真核物种中高度保守。根据本领域的现有技术状况,驱动膜融合的中央组分是被称为SNARE(可溶N-乙基顺丁烯二酰亚胺-敏感因子联接蛋白受体)的多肽。在供体(v-SNARE)和受体(acceptor)膜(t-SNARE)上存在的互补性SNARE通过保守序列基元(SNARE基元)区分。为介导膜融合,四种SNARE基元捆束起来,形成平行的卷曲螺旋(coiled-coil)结构,其被称为SNAREpin。该SNAREpin包含在受体膜结构上的至少一种锚定膜的SNARE,以及在供体膜结构上的至少一种锚定膜的SNARE。含有一种或多种SNARE基元(例如Sec9)的可溶性或膜限定的SNARE可补充SNAREpin的形成。SNAREpin组件在供体:受体膜结构中的排列可能是1∶3,但也可以是2∶2(Burri L,Lithgow T.A complete set of SNAREs in yeast.Traffic.2004Jan;5(1):45-52)。
根据本发明,过氧化物酶体膜与细胞分泌途径所涉及的细胞的膜结构的融合可以以多种方法来实现,所述方法可单独或组合使用。
本发明公开了:为获得过氧化物酶体与真核细胞的质膜(或分泌途径的另一种膜)的融合,一种优选的选择是将融合多肽或其一部分在过氧化物酶体的表面暴露。根据本发明,融合多肽是供体膜结构与受体膜结构的融合所涉及的多肽,其通常在供体膜结构的表面暴露。在表面暴露在本文中被理解为表示在供体膜的细胞质侧暴露,与内腔侧相反。供体膜结构被定义为能产生下述泡囊的膜结构,所述泡囊能与受体的膜结构融合。优选地,供体和受体膜结构是分泌途径的膜。更优选地,供体膜结构选自Golgi复合体和ER构成的组。
典型地,融合多肽包含在供体膜结构(例如Glogi复合体或ER)的表面暴露的部分以及跨膜结构域。在一种优选的实施方式中,融合多肽的通常在供体膜结构的表面暴露的部分,即,表面暴露的结构域,被用于在过氧化物酶体的表面暴露。
在一种优选的实施方式中,供体膜结构是Golgi复合体,即,融合多肽是通常在Golgi复合体的泡囊表面表达,并且已知涉及Golgi泡囊与质膜的融合的多肽。
优选的融合多肽是v-SNARE或v-SNARE多肽家族的多肽,如vesicle-SNAREs,Jahn et al,Annu Rev.Biochem.(1999)863-911;上文所述的Burri et al.所述。通过与SEQ ID NO:13的序列同一性,在下文中对优选的v-SNARE进行了进一步定义。
在Golgi复合体的泡囊表面表达的若干种v-SNARE已被描述,例如,Snc1和Snc2(上文所述的Burri et al.)。在ER表面表达的v-SNARE的例子是Sec22和Ykt6(上文所述的Burri et al.)。在本发明的一种优选的实施方式中,使用v-SNARE Snc1或Snc2中的至少一种或其同源体。Snc1/Snc2同源体的例子是本发明提供的Aspergillus niger SncA多肽。
本发明包括本发明中关于其从特定对照物种(通常是酵母(S.cerevisiae))的来源所述的任何多肽的同源体的用途。因此,同源体(或同源序列)被定义为来自与对照物种不同的另一物种的、与对照物种的多肽发挥实质上相同的功能的多肽,虽然同源体可能具有与用于对照物种中的名称不同的名称。典型地,此类同源体可能与对照物种的多肽具有至少50%的同一性程度。此类同源体优选来自与按照本发明修饰的真核细胞相同的真核物种。
为获得融合多肽例如v-SNARE在过氧化物酶体表面的暴露,融合多肽或其能与受体膜上的互补SNARE发生相互作用的至少一部分与过氧化物酶体的膜-多肽或其一部分可操作地相连,优选地,与其融合。以这种方式获得包含融合多肽部分或组分以及过氧化物酶体膜-多肽部分或组分的嵌合多肽。
过氧化物酶体膜-多肽或其一部分作为嵌合多肽的组分,优选能介导嵌合多肽向过氧化物酶体膜的靶向,更优选地,过氧化物酶体膜多肽或其一部分能将嵌合多肽锚定到过氧化物酶体膜。最优选地,嵌合多肽向过氧化物酶体膜的锚定由过氧化物酶体膜多肽或其一部分通过将至少一个跨越膜的跨膜片断整合进过氧化物酶体膜来实现。优选地,整个嵌合多肽在过氧化物酶体膜中的定位(localization)使得其作为膜-锚(membrane-anchor)发挥作用,并且同时,在过氧化物酶体的(胞质)表面暴露嵌合多肽的融合多肽部分。优选地,过氧化物酶体膜-多肽在N末端部分被修饰调整,导致融合多肽尽可能接近过氧化物酶体膜的暴露,而不取消嵌合融合多肽的过氧化物酶体靶向。
优选地,融合多肽(例如v-SNARE)的部分用作为嵌合多肽的组分,所述嵌合多肽至少包含通常在供体膜结构(例如Golgi泡囊)表面暴露的融合多肽的结构域。融合多肽的跨膜结构域在嵌合多肽中可部分不存在或完全不存在。
适合用作为过氧化物酶体膜-锚的任何过氧化物酶体膜-多肽或其一部分发挥作用适合用于与至少融合多肽的表面暴露结构域可操作地相连,优选地,与其融合,只要能得到包含位于过氧化物酶体的胞质侧(或表面)的融合多肽部分的嵌合肽(以便能与细胞分泌途径所涉及的细胞的膜结构相互作用)。优选地,融合多肽部分位于嵌合多肽的N末端部分,因此,优选地,过氧化物酶体膜多肽是下述多肽,所述多肽中,N末端天然在过氧化物酶体胞质侧暴露,或者,其具有至少一种跨膜片断,该片断的天然定向使得该片断的N末端朝向胞质。
优选的过氧化物酶体膜多肽的一个例子是过氧化物酶体膜多肽22(Pmp22)或其同源体(Brosius U,Dehmel T,Gartner J.Two differenttargeting signals direct human peroxisomal membrane protein 22 toperoxisomes.J Biol Chem.2002 Jan 4;277(1):774-84)。Pmp22同源体的一个例子是本发明提供的Aspergillus niger Pmp22。Brosius et al.(2002,前文所述)已显示,人和大鼠的Pmp22蛋白具有四个跨膜结构域(1个以N到C末端的方向经过)以及2个独立的过氧化物酶体靶向信号,所述信号位于第一个和第二个跨膜结构域的N末端。根据一种优选的实施方式,Pmp22多肽被用作为嵌合多肽组分的部分由此至少包含Pmp22的过氧化物酶体跨膜结构域3和4,更优选地,Pmp22的4个过氧化物酶体跨膜结构域。优选地,Pmp22多肽作为嵌合多肽组分的部分仅包含Pmp22的过氧化物酶体跨膜结构域3和4以及包含N末端到跨膜结构域3的足够的氨基酸,以包括进功能性过氧化物酶体靶向信号。优选地,包括Brosius et al.(2002,前文所述)定义的N末端到跨膜结构域3的至少15、12、10、8或7个氨基酸。
适用于与至少融合多肽的表面暴露结构域可操作地相连(优选地,与其融合)的其它合适的过氧化物酶体膜蛋白(或其适合用作为过氧化物酶体膜锚发挥作用的部分)包括但不限于,例如,PMP34、PMP47、PMP70、PEX3、PEX11、PEX14和PEX22(综述见Eckert JH and ErdmannR.,Peroxisome biogenesis.Rev Physiol Biochem Pharmacol.2003;147:75-121)。
优选地,Pmp22和另外的过氧化物酶体膜蛋白在N末端部分按前文所述经过修饰调整。所述修饰调整包括至少第一个甲硫氨酸的缺失。在N末端部分的修饰调整还可包含N末端1至50,例如48的氨基酸的缺失,优选地,N末端1至35,例如,33的氨基酸的缺失,更优选地,N末端1至20,例如,18的氨基酸的缺失。优选地,对过氧化物酶体膜蛋白的N末端加以修饰调整,使得至少15、12、8、7、5或3个氨基酸保留为N末端到第一个(以N到C末端的方向)跨膜结构域,其天然定向使得片断的N末端朝向胞质。优选地,对过氧化物酶体膜蛋白的N末端的修饰调整不会使得过氧化物酶体靶向需要的氨基酸序列被缺失或破坏。
根据一种优选的实施方式,在供体膜结构的表面暴露的v-SNARE(例如Snc1、Snc2或SncA)的结构域与过氧化物酶体膜多肽Pmp22可操作地相连(或融合),以用v-SNARE(例如Snc1、Snc2或SncA)的相应部分改装(decorate)过氧化物酶体。更优选地,使用SncA的表面暴露结构域。进一步更优选地,嵌合多肽具有根据SEQ ID NO:24的氨基酸序列。技术人员将知道如何按照从针对SEQ ID NO:24所述的同样的原则从来自其它生物的Pmp22多肽直向同源体和v-SNARE直向同源体构建嵌合多肽。
在本发明的一种实施方式中,融合多肽在过氧化物酶体表面的暴露由细胞受体膜结构(例如,Glogi复合体的质膜)处的补充性(complementing)融合多肽的过量表达来进行。“补充性融合多肽”根据本发明是协助供体膜结构(例如Glogi复合体或ER的泡囊)与受体膜结构(例如Golgi复合体的质膜)融合所涉及的多肽。
补充性融合多肽优选是靶-SNARE或t-SNARE(Jahn et al.,Annu.Rev.Biochem.863-911(1999))。优选的t-SNARE多肽例如Sso1或Sso2,或其同源体(定位于质膜)或Sed5或其同源体(定位于Golgi复合体)(如前文所述的Brosius et al.)。其它优选的补充性融合多肽是Sec9(涉及在质膜的融合)或Bos1、Gos1、Bet1或其同源体(涉及在Golgi复合体的融合)(如前文所述的Brosius et al.)。
根据一种优选的实施方式,融合多肽和补充性融合多肽被暴露或以化学计量的量过量表达,这意味着融合多肽和补充性融合多肽之间的多肽相互作用尽可能接近于生理比例或天然化学计量(如前文所述的Brosius etal.)。化学计量共暴露预计能进一步协助过氧化物酶体与受体膜结构(例如质膜)的融合。该化学计量共表达优选通过使用基本相同拷贝数的相同的表达盒来获得。优选地,t-sNARE基因的内源拷贝保留不变,使得从内源拷贝获得的t-SNARE的量对于与分泌途径的天然泡囊的融合来说是可利用的。
根据本发明的一种实施方式,真核细胞含有能与细胞的质膜以及Golgi复合体融合的过氧化物酶体。
根据一种优选的实施方式,所有选出的融合多肽以及可选的补充性融合多肽,以及将被表达的过氧化物酶体膜多肽对于选用的真核宿主细胞来说是天然的。
本发明还包括对根据本发明的真核细胞的改进,使得真核细胞能满足根据本发明的具有提高的效率的活性。
例如,过氧化物酶体向质膜的靶向以及随后的膜融合可通过使用Golgi来源的泡囊的靶向机制来增强。修饰可允许该机制对过氧化物酶体有效。
修饰该机制以对过氧化物酶体有效的例子是对Sec4或其同源体进行工程改造,使得其与过氧化物酶体可操作地相连。这将导致过氧化物酶体向质膜(胞质外(exocyst))中分泌复合物的靶向,此外,将增加SNAPEpin的形成,以增强过氧化物酶体与质膜融合的效率。通常,Sec4在GDP可溶状态和GRP结合分泌泡囊膜联接状态之间循环。已表明(Ossig et al 1995.EMBO Journal 3645-3653.),永久性联接的Sec4是具有生物活性的,Sec4的膜联接通常通过对两个C末端半胱氨酸残基进行牻牛儿基牻牛儿基化来获得。为允许Sec4向过氧化物酶体膜的永久联接,Sec4的两个C末端半胱氨酸残基可被缺失或被不同的氨基酸取代,包含过氧化物酶体膜多肽或其一部分的嵌合多肽可被工程改造为与已描述过的包含融合多肽和过氧化物酶体膜多肽的嵌合多肽类似。
此外,过氧化物酶体与细胞分泌途径所涉及的细胞的膜结构的融合可通过下述方法提高:制造对与融合多肽的相互作用更敏感的补充性融合多肽。这可以以下文所述的多种方法来进行。
融合多肽以及可选地,补充性融合多肽的组成性活性突变体可被制备,并且(过量)暴露于过氧化物酶体以及可选地,受体膜结构(例如质膜)的表面。组成性活性突变体的例子是补充性融合多肽(优选地,t-SNARE,更优选地,Sso1或其同源体)的去磷酸化的突变体(Marash M,Gerst JE.t-SNARE dephosphorylation promotes SNARE assembly andexocytosis in yeast.EMBO J.2001 Feb 1;20(3):411-21)。
还可能通过本领域技术人员已知的技术对SNARE的调控子基因加以失活。此类调控子例如是v-SNARE主体(master)(VSM-1或其同源体),其与磷酸化的Sso1结合,对Sso1的闭合的、失活的构象加以稳定(Marash M,Gerst JE.MoI Biol Cell.2003Aug;14(8):3114-25)。
还可能对已知能活化SNARE相互作用的酶过量表达。优选地,神经酰胺活化的磷酸酶蛋白(CAPP)或其同源体过量表达(Fishbein JD,Dobrowsky RT,Bielawska A,Garrett S,Hannun YA.Ceramide-mediatedgrowth inhibition and CAPP are conserved in Saccharomyces cerevisiae.J BiolChem.1993May 5;268(13):9255-61)。
还可能以使得过氧化物酶体的内稳态受到影响的方式对真核细胞加以修饰。此类修饰可包括,提高过氧化物酶体生物发生的速率和/或降低过氧化物酶体降解的速率,这是较之根据本发明的真核细胞来源的亲本细胞的过氧化物酶体生物发生和/或降解而言的。
根据一种更优选的实施方式,已通过下述方法对真核细胞进行了遗传修饰(WO 00/71579所述):
(a)对涉及过氧化物酶体生物发生的基因过量表达,所述基因例如pex11和/或pex3或其同源体,和/或
(b)对过氧化物酶体降解涉及的基因负调,所述基因例如vps15和/或pdd1和/或APG或其同源体。
pex3和pex11多肽在过氧化物酶体生物发生中的作用已被描述(Baerends RJ,et al Yeast.1997 Dec;13(15):1449-63 and WO 00/71579)。Apg和Vps15多肽在过氧化物酶体降解中的作用也已被描述(Wang CW etal.J Biol Chem.2001 Aug 10;276(32):30442-51 and Hutchins MU,et al.J CellSci.1999 Nov;112(Pt 22):4079-87)。
或者,或与上述方法组合,含有能与细胞分泌途径所涉及的细胞的膜结构融合的过氧化物酶体的真核细胞可通过使用合适的筛选方法进行经典菌株改进来获得。优选的筛选方法使用模型多肽,例如GFP在细胞过氧化物酶体中的表达来进行,优选地,使用促进模型蛋白的过氧化物酶体定位的信号,按照下文所述测量模型多肽在细胞外的存在。GFP在细胞外的存在可通过但不限于荧光和/或western杂交印迹来测定。
本发明的真核细胞可被遗传修饰,以获得较之野生型细胞展示出更低的蛋白表达和/或分泌的表型。此类表型可通过对蛋白表达的转录调控子的缺失和/或修饰和/或失活来获得。此类转录调控子例如prtT。用于通过调节prtT降低蛋白酶表达的技术描述于US2004/0191864A1中。
对将按照本发明修饰的宿主细胞的选择将在很大程度上取决于编码感兴趣多肽的核酸序列的来源或者取决于将生产的代谢产物的同一性。优选地,真核细胞是哺乳动物、昆虫、植物、真菌或藻类细胞。优选的哺乳动物细胞包括中国仓鼠卵巢(CHO)细胞、COS细胞、293细胞、PerC6细胞和杂交瘤细胞。优选的昆虫细胞包括Sf9和Sf21细胞及其衍生物。更优选地,真核细胞是真菌细胞,即酵母细胞,例如K.lactis或S.cerevisiae或Hansenula polymorpha或Pichia pastoris,或有丝真菌细胞。根据一种最优选的实施方式,真核细胞是有丝真菌细胞。
“有丝真菌”包括Eumycota和Oomycota亚门的所有有丝形式(如前文Hawksworth et al.,1995所定义)。有丝真菌的特征在于几丁质、纤维素、葡聚糖、脱乙酰几丁质、甘露聚糖和其它复杂多糖构成的菌丝体壁。营养生长通过菌丝延长进行,碳代谢是专性需氧的。有丝真菌菌株包括但不限于,Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium和Trichoderma的菌株。
优选的有丝真菌细胞属于Aspergillus、Penicillium或Trichoderma属的种,最优选地,Aspergillus niger、Aspergillus sojae、Aspergillusfumigatus、Aspergillus oryzae、Trichoderma reesei或Penicilliumchrysogenum的种。
公众可以从大量培养集合物,例如American Type Culture Collection(ATCC)、Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)和AgriculturalResearch Service Patent Culture Collection、Northern Regional ResearchCenter(NRRL)容易地获得若干种有丝真菌菌株Aspergillus niger CBS513.88、Aspergillus oryzae ATCC 20423、IFO 4177、ATCC 1011、ATCC9576、ATCC14488-14491、ATCC 11601、ATCC12892、P.chrysogenumCBS 455.95、Penicillium citrinum ATCC 38065、Penicillium chrysogenumP2、Acremonium chrysogenum ATCC 36225或ATCC 48272、Trichodermareesei ATCC 26921或ATCC 56765或ATCC 26921、Aspergillus sojaeATCC11906、Chrysosporium lucknowense ATCC44006及其衍生物。
多肽
在第二个方面,本发明涉及用于制备第一个方面的真核细胞的新颖的多肽。特别地,本发明提供了如上文定义的融合多肽、嵌合多肽(其中,融合多肽与过氧化物酶体膜多肽可操作地相连)、过氧化物酶体膜多肽和补充性融合多肽。
在一种实施方式中,本发明提供了展示出v-SNARE功能的多肽,所述多肽选自下述组,所述组由(a)具有根据SEQ ID NO:13的氨基酸序列的多肽;(b)具有展示出与SEQ ID NO:13的氨基酸序列至少85%同一性,优选至少90%,更优选至少93%,进一步更优选至少95%,进一步更优选至少97%,进一步更优选至少98%,进一步更优选至少99%同一性的氨基酸序列的多肽;以及(c)(a)或(b)定义的多肽的功能片段构成。
在另一种实施方式中,本发明提供了选自下述组的过氧化物酶体膜多肽,所述组由(a)具有根据SEQ ID NO:16的氨基酸序列的多肽;(b)具有展示出与SEQ ID NO:16的氨基酸序列至少85%同一性,优选至少90%,更优选至少93%,进一步更优选至少95%,进一步更优选至少97%,进一步更优选至少98%,进一步更优选至少99%同一性的氨基酸序列的多肽;以及(c)(a)或(b)定义的多肽的功能片段构成。
在又一种实施方式中,本发明提供了一种嵌合多肽,其适合用于获得下述氨基酸序列在过氧化物酶体表面的暴露,所述氨基酸序列对应于在供体膜结构表面暴露的融合多肽的氨基酸序列,其中,所述嵌合多肽包含与过氧化物酶体膜多肽或其一部分可操作地相连的融合多肽或其一部分。
优选地,嵌合多肽的融合多肽组分包含v-SNARE多肽的从其N末端到第一个(最N末端的)跨膜结构域的氨基酸。更优选地,融合多肽组分包含选自下述组的氨基酸序列,所述组由(a)对应于SEQ ID NO:13的1至95位的序列和(b)展示出与(a)定义的序列具有至少50%,优选至少60%,更优选至少70%,进一步更优选至少80%,最优选至少90%同一性程度的同源序列构成。
还优选地,嵌合多肽的过氧化物酶体膜蛋白组分包含选自下述组的氨基酸序列,所述组由(a)对应于SEQ ID NO:16的2至224位的序列,优选地,对应于3或4或5或6或7或8或9或10或11或12或13或14或15或16或17或18或19或20或21或22或23或24或25或26或27或28或29或30或31或32或33或34或35或36或37或38或39或40位至224位,和(b)展示出与(a)定义的序列具有至少50%,优选至少60%,更优选至少70%,进一步更优选至少80%,最优选至少90%同一性程度的同源序列构成。
更优选地,嵌合多肽具有根据SEQ ID NO:24的氨基酸序列。
因此本发明的一种优选的嵌合多肽包含(a)在分泌途径供体膜胞质表面暴露的融合多肽结构域;以及(b)靶向过氧化物酶体膜并与过氧化物酶体膜相连的结构域;其中,结构域(a)和(b)可操作地相连,并且其中,嵌合多肽在包含过氧化物酶体的宿主细胞中的表达赋予过氧化物酶体与宿主细胞分泌途径受体膜融合的能力。优选地,结构域(a)和(b)存在于单一的开放读码框中,其中,结构域(a)较之结构域(b)与多肽的N末端更为接近。优选地,结构域(a)来自v-SNARE。更优选地,结构域(a)包含来自v-SNARE的从N末端跨越至v-SNARE的第一个跨膜结构域或包括该第一个跨膜结构域在内的片段。在根据本发明的一种优选的嵌合多肽中,结构域(a)中的片段包含对应于SEQ ID NO:13的1至95位的序列或展示出与SEQ ID NO:13具有至少50%,优选至少60%,更优选至少70%,进一步更优选至少80%,最优选至少90%同一性程度的同源序列。该片段可跨越v-SNARE的N末端直到第一个跨膜结构域的氨基酸的至少70%,80%,90%或95%。
在根据本发明的一种优选的嵌合多肽中,结构域(b)包含跨膜结构域和将该结构域靶向至过氧化物酶体膜的序列。优选地,最接近结构域(a)的跨膜结构域N末端朝向胞质定位。优选地,结构域(b)包含来自过氧化物酶体膜蛋白的序列。更优选地,结构域(b)来自下述过氧化物酶体膜多肽,所述多肽的N末端天然暴露于过氧化物酶体的胞质侧,或者所述多肽具有至少一个其N末端朝向胞质的跨膜结构域。最优选地,结构域(b)来自下述过氧化物酶体膜多肽,其N末端已被从最N末端的跨膜结构域(具有朝向胞质的其N末端)去除了多达至少10个氨基酸。结构域(b)可取自下述过氧化物酶体膜多肽,所述过氧化物酶体膜多肽选自Pmp22、Pmp34、Pmp47、Pmp70、Pex3、Pex11、Pex14和Pex22。在一种优选的实施方式中,根据本发明的嵌合蛋白结构域(b)是对应于SEQ IDNO:16的2至224位的序列,优选地,对应于3或4或5或6或7或8或9或10或11或12或13或14或15或16或17或18或19或20或21或22或23或24或25或26或27或28或29或30或31或32或33或34或35或36或37或38或39或40位至224位,或展示出与SEQ ID NO:16具有至少50%,优选至少60%,更优选至少70%,进一步更优选至少80%,最优选至少90%同一性程度的同源序列。最优选地,嵌合蛋白具有根据SEQ ID NO:24的氨基酸序列。
就本发明的目的而言,两条氨基酸序列间的同一性程度指两条序列键相同氨基酸的百分比。首先,使用Basic Local Alignment Search Tool(BLAST)算法来检索同源多肽序列,该算法被描述于Altschul,et al.,J.Mol.Biol.215:403-410(1990)中。用以开展BLAST分析的软件可以通过国家生物技术信息中心(National Center for Biotechnology Information,http://www.ncbi.nlm.nih.gov/)为公众所获得。BLAST算法的参数W、B和E确定了比对的敏感性和速度。BLAST程序缺省使用的字长度(wordlength,W)为3,BLOSUM62分数矩阵(见Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))比对(B)为50,期望值(expectation,E)为10,M=5,N=-4。
接着,使用CLUSTALW比对算法(Higgins D.et al(1994).NucleicAcids Res.22:4673-4680)对同源序列的同一性程度(按上文定义的)进行测定,其中使用下述参数:缺口大小:5,缺口开放:11,缺口延伸:1,错配:-15,字长:3。
多核苷酸
在第三个方面,本发明涉及多核苷酸,其包含编码第二个方面任何多肽的核酸序列。
本发明包括下述核酸序列,其编码如上文定义的融合多肽、嵌合多肽(其中,融合多肽与过氧化物酶体膜多肽可操作地相连)、过氧化物酶体膜多肽和补充性融合多肽。
选出将根据本发明被修饰的真核细胞后,可以确定融合多肽、作为过氧化物酶体膜锚发挥作用的多肽以及可选地,补充性融合多肽的身份(来源)。例如,编码第二个方面的多肽的核酸序列的来源可取决于选出的真核细胞的身份。优选地,编码第二个方面的多肽的核酸序列对于将按照本发明修饰的真核细胞来说是内源的。
本发明还提供了一种核酸构建体,其包含编码按照上文定义的多肽的核酸序列,其与指导合适宿主中多肽表达的一种或多种控制序列可操作地相连。
表达应被理解为包括对多肽的生产中涉及的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰。
“核酸构建体”在本文中被定义为单链或双链的核酸分子,其是从天然存在的基因分离出的,或已经过修饰以含有以自然界中不存在的方式组合及并置的核酸片断。当核酸构建体含有编码序列表达所需的所有控制序列时,术语核酸构建体与术语表达盒同义。
术语“控制序列”在本文中被定义为包括对于多肽表达来说必须或有利的所有组分。每种控制序列可以是编码多肽的核酸序列天然的或外源的。此类控制序列包括但不限于,启动子、引导序列、最优翻译起始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870所述)、聚腺苷化序列、前肽(pro-peptide)序列、转录终止子。就最小程度而言,控制序列包括启动子以及转录和翻译终止信号。
术语“可操作地相连”在本文中被定义为下述构象,其中,控制序列以相对于DNA序列的编码序列的下述位置被合适地放置,所述位置使得控制序列能指导多肽的表达。
控制序列可以是合适的启动子序列,其在细胞中显示出转录活性,包括突变的、截短的和杂交的启动子,其可从编码对细胞来说同源(天然)或异源(外源)的细胞外或细胞内多肽的基因获得。
启动子可以是与将表达的编码序列天然相连的启动子。启动子还可以是对将表达的编码序列来说外源的组成型或可诱导启动子。用于哺乳动物的合适的启动子的例子在例如Sambrook and Russell(2001)″MolecularCloning:A Laboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,New York中有所描述。用于酵母中的合适的启动子的例子是例如糖分解启动子。
可使用的优选的可诱导启动子的例子是淀粉可诱导、铜可诱导、油酸可诱导启动子。
根据另一种优选的实施方式,如果基因必须在本发明的宿主细胞中过量表达,例如CAPP,那么使用强的可诱导启动子,例如A.niger的葡糖淀粉酶启动子或A.oryzae的TAKA淀粉酶启动子。
控制序列还可以是合适的转录终止子序列,这是能被有丝真菌细胞识别用来终止转录的序列。终止子序列与编码多肽的核酸序列的3’末端可操作地连接。在细胞中具有功能的任何终止子可用于本发明。
优选用于有丝真菌细胞的终止子可从编码A.oryzae TAKA-淀粉酶、A.niger葡糖淀粉酶、A.nidulans邻氨基苯甲酸盐/酯合酶、A.niger alpha葡糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶类似蛋白酶的基因获得。
控制序列还可以是合适的引导序列,这是mRNA的非翻译区域,其对于通过有丝真菌细胞的翻译来说是重要的。引导序列与编码多肽的核酸序列的5’末端可操作地连接。在细胞中具有功能的任何引导序列都可用于本发明。
优选用于有丝真核细胞的引导序列可从编码A.oryzae TAKA-淀粉酶和A.nidulans丙糖磷酸酯异构酶和A.niger葡糖淀粉酶的基因获得。
控制序列还可以是聚腺苷化序列,这是与核酸序列3’末端可操作地相连,并且当被转录时能被有丝真菌细胞作为信号识别以向经转录mRNA加上聚腺苷残基的序列。在细胞中起作用的任何聚腺苷化序列都可用于本发明。
优选用于有丝真核细胞的聚腺苷化序列从编码A.oryzae TAKA-淀粉酶、A.niger葡糖淀粉酶、A.nidulans邻氨基苯甲酸盐/酯合酶、Fusariumoxysporum胰蛋白酶类似蛋白酶和A.niger alpha葡糖苷酶的基因获得。
控制序列还可以是前肽编码区域,其编码位于多肽氨基末端的氨基酸序列。得到的多肽已知为前酶或前多肽(在某些情况下,酶原)。
核酸构建体可与载体或表达载体相同或在其中克隆。
重组表达载体可以是能方便地经历重组DNA过程并能导致编码融合多肽(或补充性融合多肽)的核酸序列表达的任何载体(例如质粒或病毒)。典型地,对载体的选择将取决于载体与载体将被引入的真核细胞之间的兼容性。载体可以是线性的或闭合环状的质粒。载体可以是自主复制载体,即作为其复制不依赖染色体复制的染色体外主体存在,例如,质粒、染色体外元件、微型染色体或人工染色体。自主保持的克隆载体可包含AMA1-序列(见,例如Aleksenko and Clutterbuck(1997),Fungal Genet.Biol.21:373-397)。
或者,载体可以是下述载体,当其被引入细胞时,其整合进基因组,与其已整合进的染色体一起复制。整合型载体可在宿主细胞的染色体中随机整合或在预定靶位点整合。
在本发明的一种优选的实施方式中,整合型载体包含下述DNA片段,该片段与宿主细胞基因组中预定靶基因座中的、用于将克隆载体整合到预定基因座上的DNA序列同源。为促进定位整合,优选在转化宿主细胞之前对载体进行线性化。线性化优选进行至如下程度:使得克隆载体的至少一端,但优选地,任意一端侧翼有与靶基因座同源的序列。靶基因座侧翼的同源序列的长度取决于宿主细胞的身份。对真菌而言,该长度优选为至少30bp,优选地,至少50bp,进一步优选地,至少0.1kb,进一步优选地,至少0.2kb,更优选地,至少0.5kb,进一步更优选地,至少1kb,最优选地,至少2kb。优选地,载体中与靶基因座同源的DNA序列是从高度表达的基因座获得的,这意味着,其是从能在宿主细胞中高水平表达的基因获得的。能高水平表达的基因,即,高度表达的基因在本文中被定义为其mRNA占细胞总mRNA的至少0.5%(w/w)的基因,例如,在诱导条件下的;或者其基因产物占细胞总蛋白的至少1%(w/w)的基因,(如EP 357 127所述)。大量优选的高度表达的真菌基因的例子是:来自Aspergilli或Trichoderm的淀粉酶、葡糖淀粉酶、醇脱氢酶、木聚糖酶、磷酸甘油醛脱氢酶或纤维二糖水解酶(cellobiohydrolase)基因。用于这些目的的最优选的高度表达的基因是葡糖淀粉酶基因(优选A.niger葡糖淀粉酶基因)、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、Trichoderma reesei cbh基因。这种类型的表达载体高度适用于在本发明的真核细胞中过量表达给定的基因,例如CAPP,或融合多肽或补充性融合多肽的野生型或组成性活性突变体(ssol)。
或者,可通过使用与基因核酸序列互补的核苷酸序列进行已建立起来的反义技术,来对基因修饰或失活。更具体地,可通过引入与核酸序列互补的核苷酸序列(其可在细胞中转录,并且能与细胞中产生的mRNA杂交)来降低或去除有丝真菌细胞对基因的表达。在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译出的蛋白质的量由此减少或消失。表达反义RNA的例子展示于Appl Environ Microbiol.2000Feb;66(2):775-82.(Characterization of a foldase,protein disulfide isomerase A,in the proteinsecretory pathway of Aspergillus niger.Ngiam C,Jeenes DJ,Punt PJ,Van DenHondel CA,Archer DB)或(Zrenner R,Willmitzer L,Sonnewald U.Analysisof the expression of potato uridinediphosphate-glucose pyrophosphorylase andits inhibition by antisense RNA.Planta.(1993);190(2):247-52.)中。
此外,可通过RNA干扰(RNAi)技术(FEMS Microb.Lett.237(2004):317-324)来获得对基因的修饰、负调或失活。在该方法中,核苷酸序列(其表达待受到影响的)的同样的正义或反义部分被依次克隆,中间是核苷酸间隔,并且插入到表达载体中。此种分子转录后,小的(21-23)核苷酸片段的形成将导致待受影响的mRNA的定位降解。对特定mRNA的去除可进行至多种不同的程度。WO2005/05672A1和/或WO2005/026356A1描述的RNA干扰技术可用于对基因的负调、修饰或失活。
如果必须被失活的宿主的基因是VSM1,优选通过下述方法来进行:按照EP 635 574所述的技术,设计出失活载体,将载体靶向到将被失活的基因的基因座上。
编码融合(可选地,补充性融合)多肽的核酸序列的超过一个拷贝可被插入到宿主细胞中,以增加对基因产物的生产。这可以优选通过整合进DNA序列的基因组拷贝来进行,更优选地,通过将DNA序列的整合靶向到高度表达的基因座(优选地,葡糖淀粉酶或淀粉酶基因座)来进行。或者,或者,这可以通过将可扩增的选择标记基因加入核酸序列来进行,其中可通过在合适的选择试剂存在的情况下培养所述细胞来对含有选择标记基因的扩增拷贝以及由此核酸序列的额外拷贝的细胞加以选择。为进一步增多将被过量表达的DNA序列的拷贝数,可以使用WO98/46772所述的基因转化技术。这种类型的表达载体还高度适用于在本发明的宿主细胞中过量表达给定的基因,例如CAPP。
用于有丝真菌细胞的选择标记可选自包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5′-磷酸脱羧酶)、sC(硫酸腺苷转移酶)和trpC(邻氨基苯甲酸盐/酯合酶)基因以及来自其它物种的等同物的组。用于Aspergillus细胞的优选者是A.nidulans或A.oryzae的amdS(EP 635574B1、WO 97/06261)和pyrG基因,以及Streptomyces hygroscopicus的bar基因。更优选地,使用amdS基因,进一步更优选地,使用来自A.nidulans或A.oryzae的amdS基因。最优选的选择标记基因是与A.nidulans gpdA启动子融合的A.nidulans amdS编码序列(EP 635574B1中公开的)。来自其它有丝真菌的amdS基因也可使用(WO 97/06261)。来自Streptoalloteichus hindustanus的ble基因也可使用,如Cassettes of the Streptoalloteichus hindustanus ble gene fortransformation of lower and higher eukaryotes to phleomycin resistance.Drocourt D,Calmels T,Reynes JP,Baron M,Tiraby G.Nucleic Acids Res.1990 Jul 11;18(13):4009所述。
用于将上述元件连接起来构建本发明的重组表达载体的方法是本领域技术人员公知的(见,例如上文所述的Sambrook et al.,1989)。
载体系统可以是单个载体或质粒,或两个或多个载体或质粒,它们一起含有将被引入到有丝真菌细胞中的总DNA或转座子。载体优选含有一种或多种选择标记,其允许对经转化的细胞进行容易的选择。选择标记是下述基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、针对营养缺陷型的原营养型等。
使用通常已知的技术来将表达载体或核酸构建体引入细胞。其可能涉及由以本身已知的手段进行的原生质体形成、对原生质体的转化以及细胞壁重建构成的方法。用于转化Aspergillus细胞的合适方法见EP 238 023和Yelton et al.,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474所述。用于转化Fusarium的种的合适的方法由Malardier et.al.,1989,Gene 78:147156或WO 96/00787所述。可应用其它方法,例如使用基因枪(biolistic)转化的方法,如Biolistic transformation of the obligateplant pathogenic fungus,Erysiphe graminis f.sp.hordei.Christiansen SK,Knudsen S,Giese H.Curr Genet.1995 Dec;29(1):100-2所述。然后针对过氧化物酶体与细胞分泌途径所涉及的细胞的膜结构(例如质膜)融合的能力对选出的经转化细胞加以分析。
对细胞是否获得了过氧化物酶体与细胞分泌途径所涉及的细胞的膜结构融合的能力进行分析的若干种方法是可获得的。
根据一种实施方式,使用过氧化物酶体特异性标签(用于过氧化物酶体与细胞分泌途径所涉及的细胞的膜结构的融合的可视化),在电子或荧光显微镜下研究细胞的形态。过氧化物酶体特异性标签的例子是:
●硫解酶标签,如Simon M,Binder M,Adam G,Hartig A,Ruis HControl of peroxisome proliferation in Saccharomyces cerevisiae byADR1,SNF1(CAT1,CCR1)and SNF4(CAT3).Yeast.1992
Apr;8(4):303-9所述,或
●GFP标签,如Monosov EZ,Wenzel TJ,Luers GH,Heyman JA,Subramani S Labeling of peroxisomes with green fluorescent protein inliving P.pastoris cells.J Histochem Cytochem.1996 Jun;44(6):581-9所述,或
●过氧化氢酶标签,如Kunce CM,Trelease RN,Turley RB.Purification and biosynthesis of cottonseed(Gossypium hirsutum L)catalase.Biochem J.1988Apr 1;251(1):147-55所述。
根据另一种实施方式,通过在细胞的过氧化物酶体中表达模型多肽并测量培养基中模型多肽的存在来监测过氧化物酶体与细胞分泌途径所涉及的细胞的膜结构的融合,优选地,使用促进模型多肽的过氧化物酶体定位的信号。优选的模型多肽是绿色荧光蛋白(GFP),因为其在发酵培养基中的存在可通过荧光显现,并可通过western杂交印迹来监测。其它模型多肽可以是具有酶活性的细胞内蛋白质,其与过氧化物酶体定位信号可操作地相连,例如乙酰胺酶,或天然的过氧化物酶体定位蛋白,例如过氧化氢酶、阿马多里酶(amadoriase)或硫解酶。
优选地,第一个方面的真核细胞展示出下述程度的过氧化物酶体融合效率,所述程度为:产生的多肽总量中的至少10%在培养期间在给定的时间点分泌进培养基,更优选地,产生的多肽中的至少40%分泌进培养基,进一步更优选地,产生的多肽中的至少60%分泌进培养基,进一步更优选地,产生的多肽中的至少70%分泌进培养基,进一步更优选地,产生的多肽中的至少80%分泌进培养基,最优选地,产生的多肽中的至少90%分泌进培养基。产生的多肽的总量被定义为:培养基中存在的多肽的量,其中,培养基被定义为由生物物质部分和培养基的部分构成的。分泌的多肽的量可用模型多肽来估计。该模型多肽可以是下述绿色荧光蛋白(GFP),其具有经工程改造的促进过氧化物酶体定位的信号(例如PTS-1)(例如GFP-SKL),这在下文中有定义。培养基的部分中GFP-SKL的浓度可用本领域技术人员已知的技术来测定(例如荧光测量、吸光度测量、Western杂交印迹)。使用测定出的模型多肽的浓度,分泌的模型多肽的部分可被计算为产生的模型多肽的总量的百分比。
生产感兴趣的化合物
本发明还涉及一种方法,其用于在第一个方面的真核细胞中生产感兴趣的化合物,其中,所述化合物存在于细胞的过氧化物酶体中。所述方法包括如下步骤:
(a)在给定的培养基中,在有益于感兴趣的化合物表达的条件下,培养第一个方面的真核细胞,以及
(b)可选地,对感兴趣的化合物进行纯化。
根据一种优选的实施方式,从培养基中回收感兴趣的化合物,可选地,对其进行纯化。
根据另一种优选的实施方式,感兴趣的化合物是多肽。
更优选地,第一个方面的真核细胞额外包含下述核酸构建体或表达载体,其包含编码感兴趣的多肽的核酸序列,该序列与编码下述信号的核酸序列可操作地相连,所述信号能促进感兴趣的多肽的过氧化物酶体定位。
促进过氧化物酶体定位的信号可以是任何信号,只要其允许相连的多肽在过氧化物酶体中的定位和/或积累。
优选地,促进过氧化物酶体定位的信号选自如下物质构成的组:
(a)一种三肽,其中,N至C末端方向上的第一个氨基酸是A、C、H、K、N、P、S或T,N至C末端方向上的第二个氨基酸是H、K、N、Q、R或S,N至C末端方向上的第三个氨基酸是A、F、I、L、M或V,以及
(b)定义为如下所示的肽:(R/K)(L/V/I/Q)XX(L/V/I/H/Q)(L/S/G/A/K)X(H/Q)(L/A/F),其中X可以是任何氨基酸。
更优选地,(a)中定义的三肽也被称为PTS-1,其作为将在过氧化物酶体中生产的多肽的C末端延伸存在。因此,编码促进过氧化物酶体定位的信号的DNA序列被克隆于编码感兴趣的多肽的DNA序列下游,并与其可操作地相连。
根据一种优选的实施方式,(a)中定义的三肽是[PAS]-[HKR]-[L]的变体,如In silico prediction of the peroxisomal proteome in fungi,plants andanimals.Olof Emanuelsson,Ame Elofsson,Gunnar von Heijne and SusanaCristo′bal.J.MoI.Biol.(2003)330,443-456所述。根据一种更为优选的实施方式,(a)中定义的三肽是SKL或PRL。
根据另一种优选的实施方式,(a)中定义的三肽PTS-1的前面有允许该三肽序列被移除,或者允许该三肽序列与该三肽序列之前的序列一起从感兴趣的多肽的C末端被移除(一旦多肽分泌到细胞外)的序列。此类序列可以例如是合适的序列特异性蛋白酶或肽酶的识别序列。
(b)中定义的肽还被称为PTS2信号(Swinkels,B et al 1991.EMBOJournal 3255-3262;Petriv O.I.et al 2004.The Journal of molecular Biology119-134)。优选地,它们存在于多肽的N末端部分。
如果感兴趣的多肽已经含有促进过氧化物酶体定位的信号,优选地,该天然信号被用于促进过氧化物酶体定位。或者,人们可以选择用不同的信号来置换掉促进过氧化物酶体定位的天然信号。或者,人们可以选择用编码前文所定义的促进过氧化物酶体定位的序列的DNA序列之一来置换促进过氧化物酶体定位的天然DNA序列。
在一种实施方式中,本发明涉及对过氧化物酶体中存在的感兴趣的蛋白进行的分阶段(phased)细胞外生产。在第一个阶段,感兴趣的多肽在过氧化物酶体中积累,在第二个阶段,通过向培养基中加入特定诱导剂来诱导驱动本发明嵌合多肽(可选地,补充性融合多肽)表达的可诱导的启动子,其进而将导致过氧化物酶体与细胞分泌途径所涉及的细胞的受体膜结构的融合。这将导致对感兴趣的多肽的细胞外生产。
或者,分阶段生产的其它类型是可能的:首先,生产感兴趣的多肽,然后诱导过氧化物酶体增殖,最后一步,诱导过氧化物酶体与细胞分泌途径所涉及的细胞的受体膜结构融合。
多肽可以是对宿主细胞来说天然或异源的任何多肽。术语“异源多肽”在本文中被定义为给定的细胞天然不生产的多肽。术语“多肽”在本文中不用来指特定长度的被编码产品,因此其包括肽、寡肽和蛋白。
第一个方面的真核细胞高度适合用于生产需要还原环境用于突变的多肽,例如,细胞内多肽。因此,根据一种优选的实施方式,感兴趣的多肽是细胞内多肽。因此,使用第一个方面的真核细胞的本发明的方法是能以工业规模在培养基中生产细胞内多肽的第一个方法。
优选的多肽是过氧化物酶体中天然生产的酶,例如阿马多里酶(amadoriase)、过氧化氢酶、酰基-CoA氧化酶、亚油酸盐/酯异构酶、反式-2-烯酰基-ACP还原酶、单端孢霉烯3-O-乙酰转移酶、醇脱氢酶、肉碱消旋酶、D-扁桃酸盐/酯脱氢酶、烯酰基CoA水合酶、果糖基胺氧氧化还原酶、2-羟基庚-2,4-二烯-1,7-二酸盐/酯异构酶、NADP-依赖型苹果酸盐/酯脱氢酶、氧化还原酶、醌还原酶。所有这些酶都含有C末端SKL序列。
其它细胞内的酶是神经酰胺酶、环氧化物水解酶、氨肽酶、酰基转移酶、醛缩酶、羟化酶、氨肽酶。
在另一种实施方式中,多肽是抗体或其一部分、抗原、凝血因子、细胞外酶、激素或激素变体、受体或其一部分、调控蛋白、结构蛋白、报道蛋白或转运蛋白。
根据另一种优选的实施方式,将被生产的多肽是重组的:已用包含下述DNA序列的表达构建体或核酸构建体转化过第一个方面的真核细胞,所述DNA序列能促进过氧化物酶体定位,并且与编码将被生产的多肽的DNA序列可操作地相连。
本发明因此有利地允许对多肽进行细胞外生产,这在细胞的正常分泌途径中会遭遇困难。例如,生产的感兴趣的多肽是细胞外多肽,其可能不含超过20个半胱氨酸,不含超过10个的半胱氨酸,不含超过6个半胱氨酸或者不含超过2个半胱氨酸。此类多肽可能是宿主细胞天然的或异源的。这些多肽优选对于宿主细胞来说是重组的。此类多肽的例子是下述这些:来自Aspergillus phoenicis的草酸盐/酯脱羧酶,其不含半胱氨酸,(APOXD,在WO 9842827-A2中有所描述);来自Aspergillus niger的曲霉蛋白酶(aspergillopepsin)II,其不含半胱氨酸(The gene and deducedprotein sequences of the zymogen of Aspergillus niger acid proteinase A,Inoueet al.,J Biol Chem.1991 Oct 15;266(29):19484-19489);来自Leishmaniamexicana的分泌的酸性磷酸酶2,其不含半胱氨酸(Ser/Thr-rich repetitivemotifs as targets for phosphoglycan modifications in Leishmania mexicanasecreted acid phosphatase,Wiese et al.,EMBO J.1995 Mar 15;14(6):1067-1074);来自Sclerotinia sclerotiorum的非天冬氨酸蛋白酶,其不含半胱氨酸(Regulation of acp1,encoding a non-aspartyl acid protease expressed duringpathogenesis of Sclerotinia sclerotiorum,Poussereau et al.,Microbiology.2001Mar;147(Pt 3):717-726);来自Aspergillus niger的木聚糖酶A,其含1个半胱氨酸(专利申请WO 200068396-A2中描述的xynA);来自Musmusculus的硫酰胺酶(sulphamidase),其含有2个半胱氨酸(Geneencoding the mouse sulphamidase:cDNA cloning,structure,and chromosomalmapping,Costanzi et al.,Mamm Genome.2000 Jun;11(6):436-439)。感兴趣的多肽还可以是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、环糊精糖基转移酶、酯酶、alpha-半乳糖苷酶、beta-半乳糖苷酶、葡糖淀粉酶、alpha-葡糖苷酶、beta-葡糖苷酶、卤素过氧化物酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、脂加氧酶、裂合酶、甘露糖苷酶、变构酶(mutanase)、氧化镁、加氧酶、氧化还原酶、果胶酶、过氧化物酶、磷脂酶、植酸酶、多酚氧化酶、蛋白酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。编码感兴趣的多肽的核酸可以从任何原核、真核或其它来源获得。就本发明的目的而言,术语“从……获得”在本文中与给定的来源一起使用时将表示,多肽是通过该来源或通过已插入了来自该来源的基因的细胞生产的。
本发明的方法有利地允许在培养过程终点,生产出至少0.01g/l的多肽。优选地,生产出至少0.05g/l的多肽,进一步更优选地,至少0.5/l,最优选地,至少1g/l。
根据另一种优选的实施方式,感兴趣的化合物是代谢产物。优选的代谢产物是,紫杉醇,类异戊二烯(包括类胡萝卜素),青霉素,头孢菌素(包括生物碱)、斯达汀(包括洛伐他汀)和抗氧化剂。根据第一种优选的实施方式,第一个方面的宿主细胞被用于生产内源过氧化物酶体代谢产物。内源过氧化物酶体代谢产物的例子是异丁酸、异戊酸和a-甲基丁酸。根据第二种优选的实施方式,使用第一个方面的真核细胞作为宿主细胞来生产代谢产物,其中所述真核细胞额外包含含有下述核酸序列的核酸构建体或表达载体,所述序列编码代谢产物合成过程所涉及的酶,并且与编码下述信号的核酸序列可操作地相连,所述信号能促进代谢产物合成过程所涉及的酶的过氧化物酶体定位。促进过氧化物酶体定位的信号可以是任何信号,只要其允许前文所述的、过氧化物酶体中相关多肽的定位和/或积累。代谢产物合成过程所涉及的酶的例子是下述这些:
-类胡萝卜素合成:八氢番茄红素-β胡萝卜素合酶crtYB和crtE、crtI、crtY、crtB和crtZ。
-紫杉醇生物合成:紫杉烷13α-羟化酶和紫杉二烯合酶。
-青霉素合成:酰基转移酶。
-头孢菌素合成:扩环酶。
-生物碱合成:S)-去甲乌药碱(Norcoclaurine)合酶(NCS)
-斯达汀聚酮(polyketide)合酶:香叶醇10-羟化酶。
根据又一种实施方式,本发明涉及对过氧化物酶体中存在的代谢产物的细胞外分阶段生产。在第一个阶段,代谢产物在过氧化物酶体中积累,在第二个阶段,通过向培养基中加入特定诱导剂来诱导驱动本发明嵌合多肽(可选地,补充性融合多肽)表达的可诱导的启动子,其进而将导致过氧化物酶体与细胞分泌途径所涉及的细胞的受体膜结构的融合。这将导致对感代谢产物的细胞外生产。
或者,分阶段生产的其它类型是可能的:首先,生产代谢产物,然后诱导过氧化物酶体增殖,最后一步,诱导过氧化物酶体与细胞分泌途径所涉及的细胞的受体膜结构融合。
培养条件
使用本领域已知的方法,在适合用于生产感兴趣的化合物的营养培养基中培养第一个方面的宿主细胞。例如,可通过在合适的培养基中、允许感兴趣的化合物被表达和/或分离的条件下进行摇瓶培养、实验室或工业发酵罐中的小规模或大规模的发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。培养发生于包含碳源和氮源以及无机盐的合适的营养培养基中,使用本领域已知的方法来进行(见,例如Bennett,J.W.andLaSure,L.,eds.,More Gene Manipulations in Fungi,Academic Press,CA,1991)。合适的培养基可从商业供货商处获得,或者使用公开的组合物(例如,American Type Culture Collection目录中的)来制备。
本发明还提供了一种改进的生产方法,用于生产感兴趣的化合物。根据第一种优选的实施方式,在培养基中培养第一个方面的宿主细胞,其中,向培养基中进料合适量的氧,以保持培养物处于氧受限的条件下。更优选地,氧受限的培养条件在下述培养基中进行,其中,在培养期间的至少一部分,所有营养物都以过量提供。进一步更优选地,在培养期间的至少一部分意味着培养期间的一半,更优选地,培养期间的2/3,进一步更优选地,培养期间的4/5,进一步更优选地,培养期间的5/6,最优选地,整个培养期间。
“以过量提供”表示:在培养期间,所有营养物都以足够避免对本发明宿主细胞的生长造成限制的量提供。明显地,营养物不应以会导致抑制或毒性效果的量提供。
向培养基中进料合适量的氧,以将培养物保持在氧受限的条件下。因此,在本发明的上下文中,合适量的氧被定义为:能实现在培养期间氧受限的氧的量。为将培养基保持为氧受限,进料到培养基中的氧的量不应超过被宿主细胞消耗的氧的量。换句话说,OTR应当与OUR基本相同。OTR(氧转移速率)被定义为氧从气相转移至培养基液相的速率。OTR以每单位时间的氧量(例如摩尔/h)表示。可从进入培养设备的氧的量和在气体出口测量的氧的量之间的差异来方便地测定OTR。OUR(氧吸收速率)被定义为宿主细胞消耗进料至培养基中的氧的速率。“基本相同”表示,OTR与OUR相同,偏差为正负5%。优选地,OTR尽可能的高,即,被例如培养设备构造和/或气体进料中的氧浓度所允许的高,前提条件是宿主细胞能立刻消耗氧。但是,对于本领域技术人员来说,明显还可能在OTR低于可达到的最大OTR的氧受限条件下(例如,OTR最大值的80或90%)开展培养过程。
在OTR与OUR基本相同的情况下,典型地,培养基中的溶解氧浓度将是恒定的,如果氧受限控制培养,溶解氧将为零或接近零。用于测定培养过程中是否存在氧受限的一种方便的方法是检验搅拌速度的轻微降低(例如5%)对OTR的影响。如果OTR也降低,那么确实存在氧受限。如果OTR未降低并且/或者仅溶解氧的浓度降低,那么不存在氧受限。另一种替代性方法是测定营养物进料的增加对OTR的影响。如果营养物进料的增加不伴随OTR的增加,那么存在氧受限。
根据第二种优选的实施方式,对第一个方面的宿主细胞的培养包括在培养过程期间改变培养基的pH,以实现分阶段的对感兴趣的化合物的细胞外生产。典型地,可在有益于宿主细胞和感兴趣的化合物的任何pH下来进行对第一个方面的宿主细胞的培养。分阶段细胞外生产可增加该方法的总产量。在第一个阶段,在最有益于第一个方面的宿主细胞的pH下,感兴趣的化合物在过氧化物酶体中积累。在第二个阶段,改变培养基的pH。更优选地,在对第一个方面的宿主细胞进行的培养的第一个和第二个阶段之间的过渡阶段中,以线性过程改变pH。对第一个方面的宿主细胞的培养过程的总持续时间通过下述等式定义:Tc=a+t+b,其中:
Tc=以小时计的培养过程的总持续时间,
a=以小时计的第一个培养阶段的持续时间,
t=以小时计的过渡阶段的持续时间,
b=以小时计的第二个培养阶段的持续时间。
根据另一种更优选的实施方式,该等式满足下述条件:
97≤Tc=a+t+b≤240,其中:
72≤a≤120,
1≤t≤24,
24≤b≤96
进一步更优选地,该等式满足下述条件:
128≤Tc=a+t+b≤216,其中:
72≤a≤96,
8≤t≤24,
48≤b≤96
又进一步更优选地,该等式满足下述条件:
160≤Tc=a+t+b≤216,其中:
72≤a≤96,
16≤t≤24,
72≤b≤96
最优选地,该等式满足下述条件:
Tc=a+t+b≤192,其中:
a≤72,
t≤24,
b≤96
优选地,第一个阶段,在4.5至6.0之间的pH范围内对宿主细胞加以培养,在第二个阶段,在5.5至7.0的范围内培养。最优选地,第一个阶段,在pH 6.0对宿主细胞加以培养,第二个阶段,pH 6.7。
根据第三种优选的实施方式,对第一个方面的宿主细胞的培养包括在培养过程期间对培养基温度的改变,以实现分阶段的对感兴趣的化合物的细胞外生产。典型地,可在有益于宿主细胞和感兴趣的化合物的任何温度下来进行对第一个方面的宿主细胞的培养。分阶段细胞外生产可增加该方法的总产量。在第一个阶段,在最有益于第一个方面的宿主细胞的温度下,感兴趣的化合物在过氧化物酶体中积累。在第二个阶段,改变培养基的温度。优选地,第一个阶段,在30℃至37℃范围内的温度下对宿主细胞进行培养,第二个阶段,在34℃和38℃范围内的温度下培养。最优选地,第一个阶段在30℃对宿主细胞进行培养,第二个阶段,36℃。
或者,以及根据一种进一步更优选的实施方式,对第一个方面的宿主细胞的培养在下述条件下进行:
●其中,在培养期间的至少一部分,向培养基中进料合适量的氧,以保持培养物处于氧受限的条件下,和/或
●其中,在培养过程期间改变培养基的pH,以实现分阶段的对感兴趣的化合物的细胞外生产,和/或
●其中,在培养过程期间改变培养基的温度,以实现分阶段的对感兴趣的化合物的细胞外生产,和/或
●其中,第一个方面的宿主细胞是Aspergillus的种,最优选地,Aspergillus niger的菌株。
最优选地,对第一个方面的宿主细胞的培养在下述条件下进行:
●其中,在培养期间的至少一部分,向培养基中进料合适量的氧,以保持培养物处于氧受限的条件下,和/或
●其中,在培养过程期间改变培养基的pH,以实现分阶段的对感兴趣的化合物的细胞外生产,其中,上述总培养时间的等式满足下述条件:Tc=a+t+b≤168,其中:a≤72,t≤24,b≤96,
以及其中,第一个阶段的pH为6.0,第二个阶段的pH为6.7,和/或
●其中,在培养过程期间改变培养基的温度,以实现分阶段的对感兴趣的化合物的细胞外生产,以及其中,第一个阶段的温度为30℃,第二个阶段的温度为36℃,和/或
●其中,第一个方面的宿主细胞是Aspergillus的种,最优选地,Aspergillus niger的菌株。
可针对将被生产的有兴趣的化合物和所选用的真核细胞对培养基加以改造。
根据一种优选的实施方式,培养基包含神经酰胺活化的磷酸酶蛋白(CAPP)的激活剂。该磷酸酶已知能通过对t-SNARE进行去磷酸化从而激活SNARE相互作用(Marash M,Gerst JE:t-SNARE dephosphorylationpromotes SNARE assembly and exocytosis in yeast.EMBO J.2001 Feb1;20(3):411-21)。CAPP的激活剂的一个例子是神经酰胺,例如二氢-C2神经酰胺或另一种C2-神经酰胺(Calbiochem,SIGMA)。优选地,在培养开始时,在培养基中存在1至100μM神经酰胺。更优选地,在培养开始时,在培养基中存在5至50μM神经酰胺。进一步更优选地,在培养开始时,在培养基中存在大约10μM神经酰胺。根据一种最优选的实施方式,在整个培养过程中,对神经酰胺的浓度加以监测,以将其保持为上述的值。如果需要的话,可在培养过程中持续加入新鲜的神经酰胺。
根据另一种优选的实施方式,培养基包含能诱导过氧化物酶体增殖的物质,例如通过正常定位于过氧化物酶体中的至少一种酶代谢产生的物质,优选地,脂肪酸,更优选地,油酸,这如以前所述(Yasuyoshi Sakaiet al,Regulation of Peroxisomal Proteins and Organelle Proliferation byMultiple Carbon Sources in the Methylotrophic Yeast,Candida boidinii.Yeast14,1175-1187(1998))。按照之前所述,脂肪酸也可用于获得过氧化物酶体的增殖(Intrasuksri U,et al,Mechanisms of peroxisome proliferation byperfluorooctanoic acid and endogenous fatty acids.Gen Pharmacol.1998Aug;31(2):187-97.)。能诱导过氧化物酶体增殖的物质的量被定义为培养基中可获得的碳的百分比(例如,培养基的碳源由10%的过氧化物酶体增殖诱导物质+90%葡萄糖构成)。优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的0.1%至100%的范围内。更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的1%至50%的范围内。进一步更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的2%至40%的范围内。进一步更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的3%至30%的范围内。进一步更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的4%至25%的范围内。进一步更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的5%至20%的范围内。进一步更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的6%至18%的范围内。进一步更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的7%至15%的范围内。进一步更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的8%至13%的范围内。进一步更优选地,能诱导过氧化物酶体增殖的物质的量在培养基碳源的9%至12%的范围内。最优选地,能诱导过氧化物酶体增殖的物质的量等于培养基碳源的10%。根据一种最优选的实施方式,能诱导过氧化物酶体增殖的物质是油酸钠和/或油酸,培养基中存在的油酸钠和/或油酸的量等于培养基碳源的10%。
根据一种更优选的实施方式,培养基包含CAPP的激活剂和能诱导过氧化物酶体的物质,它们都以前文段落所述的优选的量存在。
可通过本领域已知的方法,从培养基中分离出得到的感兴趣的化合物。例如,可通过传统方法,包括但不限于,离心、过滤、萃取、喷雾干燥、蒸发或沉淀,从培养基分离出感兴趣的化合物。然后可通过本领域已知的大量方法对经分离的多肽加以进一步纯化,所述方法包括但不限于,色谱(例如,离子交换、亲和、疏水、层析聚焦和尺寸排除)、电泳方法(例如制备等电聚焦)、差异溶解度(例如硫酸铵沉淀)或萃取(见,例如Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,New York,1989)。
感兴趣的化合物在过氧化物酶体中的积累
在另一个方面,本发明提供了一种方法,用于在宿主细胞中生产以及可选地,分离多肽,优选地,在有丝真菌细胞中进行,其中所述宿主细胞包含核酸构建体或表达构建体,所述构建体包含能促进过氧化物酶体定位的DNA序列,该序列与编码将被生产的多肽的DNA序列可操作地相连。在另一个方面,本发明提供了一种方法,用于在宿主细胞中生产以及可选地,分离代谢产物,优选地,在有丝真菌细胞中进行,其中所述宿主细胞包含核酸构建体或表达构建体,所述构建体包含能促进过氧化物酶体定位的DNA序列,该序列与编码代谢产物合成过程所涉及的酶的DNA序列可操作地相连。所有这些元件都已在前文中定义。在最后这两个方面,所述宿主细胞的过氧化物酶体的内稳态优选按前文所定义的那样被影响。在最后这两个方面,培养基优选包含前文定义的能诱导过氧化物酶体的物质。在最后这两个方面,随后可从细胞裂解物的过氧化物酶体回收感兴趣的化合物。对感兴趣的化合物的回收优选按照已有的描述来进行(Visualizationand purification of yeast peroxisomes.Erdmann R,Gould SJ.Methods Enzymol.2002;351:365-81)。在最后这两个方面,所述宿主细胞的培养条件(氧受限和/或培养基的pH值和/或培养基的温度)优选按本说明书前文所定义。
本发明还将由下述实施例加以描述,所述实施例不应被理解为限制本发明的范围。
实施例1
实施例1使用C末端SKL标签将乙酰胺酶(amdS)蛋白靶向到 Aspergillus niger和Kluyveromyces lactis的过氧化物酶体
使用的Aspergillus niger菌株(CBS 513.88)和K.lactis菌株(CBS685.97)都已被保藏。在这些菌株中,使用如Molecular Cloning:ALaboratoy Manual,Sambrook et al.,New York:Cold Spring Harbour Press,1989所述的经典分子生物学技术,对若干种基因加以过量表达,并且按照下文所述测定被编码的蛋白的活性。
1.1克隆具有或不具有SKL标签的A.niger乙酰胺酶基因以及在A. niger和K.lactis中的表达
在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:1和SEQ ID NO:2,得到SEQ ID NO:4所示的编码序列。此外,在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:1和SEQ ID NO:3,得到SEQ ID NO:5所示的编码序列。所有PCR反应、cDNA合成、连接以及转化都按照上文所述的Molecular Cloning所述来进行。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:4和SEQ ID NO:5)进行切割,将其各自连接进用PacI、AscI线性化过的图1所示的A.niger表达载体,得到两个构建体,其中,每种乙酰胺酶基因(具有和不具有SKL的)被放置于glaA启动子的控制下。表达载体被用于转化A.niger。
此外,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ IDNO:6和SEQ ID NO:7,得到SEQ ID NO:9所示的编码序列。此外,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:6和SEQ ID NO:8,得到SEQ ID NO:10所示的编码序列。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:9和SEQ ID NO:10)进行切割,将其各自连接进用PacI、AscI线性化过的图2所示的K.lactis表达载体,得到两个构建体,其中,每种A.niger乙酰胺酶基因(具有和不具有SKL的;分别为SEQ ID NO:9和SEQ ID NO:10)被放置于lac4启动子的控制下。表达载体被用于转化K.lactis。
将得到的质粒分别转化进A.niger CBS 513.88或K.lactis CBS685.97。对A.niger的转化按照(Kelly JM,Hynes MJ Transformation ofAspergillus niger by the amdS gene of Aspergillus nidulans.EMBO J.1985Feb;4(2):475-9)来进行,对K.lactis的转化按照(Sreekrishna K,WebsterTD,Dickson RC,Transformation of Kluyveromyces lactis with the kanamycin(G418)resistance gene of Tn903.Gene.1984 Apr;28(1):73-81)来进行。
1.2对A.niger和K.lactis转化子的培养以及对细胞内乙酰胺酶活性的 测定
通过PCR来检查A.niger转化子中表达盒的存在。将选出的转化子在30℃和250rpm下培养五天,这在500ml带挡板锥形摇瓶中的100ml下述培养基中进行,所述培养基为:150g/l麦芽糖、60g/l大豆胨、1g/lNa2HPO4、15g/l(NH4)2SO4、1g/l MgSO4·4H2O、0.08g/l Tween 80、0.02gBasildon、20g码啉乙磺酸(MES)、1g L-精氨酸。收获细胞,通过在液氮下碾磨进行破碎。通过将25mg经碾磨的生物物质悬浮于0.5ml磷酸缓冲过的D2O中(氘水,Cambridge Isoteope Laboratories,氘pD 7.0),来获得细胞裂解物。随后加入0.5ml D2O中的10mg/ml底物(丙酰胺),在37℃温育4天,并离心(终浓度为5mg/ml底物和25mg/mL提取物)。对参照细胞CBS 513.88和经转化细胞中乙酰胺酶活性的测量按照厂商说明书通过核磁共振来进行(图3)。在Bruker DRX-600(运行于600MHz的质子频率以及300K的探针温度下)上记录1H NMR谱。使用5mm三共振探针和自保护(self-shielded)梯度。获得所有对照化合物的1H NMR谱,表明涉及的所有的化合物都具有独特的NMR信号,基于此它们能被鉴定和定量(未示出)。为对每种相关化合物都产生完美的对照谱,在D2O中制备每种化合物的10mg/ml的贮液。通过称量底物或对照化合物,以及加入D2O,制备出浓度为10mg/ml的贮液。从这些贮液中取500μl,与500μl 0.5M的磷酸盐缓冲液(pH 6.96)(KH2PO4/K2HPO4)混合。随后在27℃,D2O中,于600MHz收集每种化合物(即,丙烯酰胺、丙烯酸、乙酰胺、乙酸、丙酰胺和丙酸)的1H NMR谱(D2O中,终浓度5mg/ml的底物或对照化合物)。针对每种化合物,鉴定出不与其它化合物导致的信号重叠的独特的化学位移。此外,检测每种对照的纯度,证实了可能污染物不存在。
化合物具有下述特征信号:
丙烯酰胺(目录号8.00830,lot 4202056,Merck NJ USA):5.82(dd,Hb,J=10.3Hz,1.2Hz),6.22(dd,Hc,J=17.2Hz,1.2Hz),6.28(d,Ha,J=10.3Hz),6.31(d,Ha,J=10.3Hz)ppm。
丙烯酸(目录号14,723-0,lot S17163-034,Aldrich,W1USA):5.65(dd,Hb,J=10.4Hz,1.6Hz),6.01(dd,Hc,J=17.4Hz,1.6Hz),6.11(d,CH2=CH,3J=10.3Hz),6.14(d,CH2=CH,3J=10.3Hz)。
乙酰胺(目录号12,263-7,lot16813BA-453,Aldrich,W1USA):1.99(s,CH3)ppm。
乙酸(目录号1.00063,lot K31668363,Merck NJ USA):1.90(s,CH3)ppm。
丙酰胺(目录号14,393-6,lot 25009JB-413,Aldrich,W1USA):1.10(t,CH3),2.27(q,CH2)ppm。
丙酸(目录号P-1386,lot 083K3404,Sigma,St Louis,Mo USA):1.09(t,CH3),2.37(q,CH2)ppm。
在100ml YEPD(酵母提取物10g/l、蛋白胨20g/l、糊精20g/l)中,于30℃、250rpm下,在带挡板的500ml锥形摇瓶中对得到的K.lactis转化子(通过PCR检查的)进行3天的培养。收获细胞,通过在液氮中碾磨进行破碎。通过将经碾磨的生物物质重新溶解于20mM磷酸钠缓冲液(pH 7.4)、1mM EDTA、2mM DTT以及蛋白酶抑制剂(由Roche完成,目录号1873580)中来获得细胞提取物。按照Skouloubris et al.,Molecular Microbiology(2001)40(3),596-609所述,在对照K.lactis细胞以及经转化的细胞中测定乙酰胺酶活性(图4)。
如图3和4清楚地显示,C末端SKL标签的加入(其促进乙酰胺酶蛋白的过氧化物酶体定位)增加了A.niger和K.lactis中的细胞内乙酰胺酶活性。
实施例2向发酵培养基中加入油酸盐以增加过氧化物酶体的增殖
通过用油酸钠(目录号26125,Riedel-de Haen,Hannover,Germany)和Tween-40(目录号93775,Fluka,Buchs,Switzerland)补充培养基,来介导每个细胞中过氧化物酶体数量的增加以及由此导致的A.niger过氧化物酶体储备体积(storage volume)的增加。使用具有经工程改造的C末端SKL标签的绿色荧光蛋白(GFP)(Chalfie,M et al.,Science(1994)263(5148):802-805),通过荧光显微方法来展示过氧化物酶体的增加数量。C末端SKL标签被工程改造为广泛使用的、能被很好表征的GFP基因,这是按照实施例1所述使用PCR方法实现的。将得到的GFP-SKL基因克隆进A.niger表达载体,使用实施例1所述的方法将其转化至A.niger CBS513.88。
在最小程度富集Aspergillus培养基(MEAM,在专利申请WO98/46772中描述过)中,于30℃和250rpm,使用轨道振荡器在摇瓶中,对获得的过量表达具有连接SKL的C末端的GFP的A.niger菌株进行培养。48小时的预培养后,收获菌丝体,洗涤,随后将其转移至补充有0.18%(w/v)油酸钠和0.02%(w/v)Tween-40的新鲜培养基(MEAM)中。在没有补充油酸钠和Tween-40的MEAM中对对照培养物加以培养。26小时的培养后,使用Zeiss荧光显微镜,用蓝光激发(490nm)分析样品。代表性样品用于使用Fujicolor 800ASA彩色胶片进行的荧光显影。
从图5可以观察到,在不包含油酸钠和Tween-40的培养基中对过量表达GFP-SKL的菌株的培养导致每个细胞的过氧化物酶体极少。如图6清楚展示,在补充有油酸钠和Tween-40的发酵培养基中培养同样的细胞,就能诱导过氧化物酶体增殖,导致每个细胞的过氧化物酶体数量增加。
实施例3通过过氧化物酶体与质膜的融合使过氧化物酶体内含物(GFP- SKL)释放到细胞外
3.1在过氧化物酶体表面上克隆和表达融合多肽
将没有跨膜结构域的A.niger v-SNARE ScnA(其基因组、cDNA和蛋白质序列分别示为SEQ ID NO:11、12和13)与过氧化物酶体膜蛋白22(Pmp22)(其基因组、cDNA和蛋白质序列分别示为SEQ ID NO:14、15和16)融合。在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:17和SEQ ID NO:18,得到编码SEQ IDNO:19。此外,在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:20和SEQ ID NO:21,得到编码SEQ IDNO:22。随后,在PCR反应中,SEQ ID NO:19和SEQ ID NO:22被用作为模板,使用SEQ ID NO:17和SEQ ID NO:21,得到SEQ ID NO:23。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:23)进行消化,将其连接进用PacI、AscI线性化过的图1所示的A.niger表达载体。这产生了下述构建体,其中,编码具有过氧化物酶体膜锚的融合多肽(SncA/Pmp-22)的基因被放置于glaA启动子的控制下。该基因的表达产生了包含过氧化物酶体膜锚的嵌合蛋白,如SEQ ID NO:24所示。SncA/Pmp-22表达载体与GFP-SKL表达载体一起用于共转化A.niger。所有PCR反应、连接以及转化都按照上文所述的Molecular Cloning:ALaboratory Manual,Sambrook et al.,New York:Cold Spring Harbor Press,1989所述使用经典分子生物学技术来进行。
3.2培养共转化子用于分析过氧化物酶体内含物的释放
使用PCR,对前文段落获得的过量表达GFP-SKL和SncA/Pmp-22的A.niger菌株的若干克隆进行选择,选出含有每种基因的单拷贝的克隆。在含或不含10μM C2-神经酰胺(N-乙酰基-D-鞘氨醇:目录号A7191,Sigma,St.Louis Missouri USA)的MEAM缓冲过的培养基(在专利申请WO 98/46772中详细描述过)中,于30℃和250rpm,使用轨道振荡器在摇瓶中,对选出的克隆进行培养。含有单基因拷贝的过量表达GFP-SKL的菌株(实施例2中描述的构建)以及空宿主菌株(CBS513.88)被用作对照。在24和48小时的时间点取样。通过离心来澄清上清液样品,通过经0.45μm过滤器(目录号4614,Pall,Ann Arbor,Mo USA)进行超滤将其与残余的细胞残骸分开。
3.3对过氧化物酶体内含物向细胞外的释放进行SDS-PAGE分析;对 作为释放促进剂的C2-神经酰胺的分析
通过SDS-PAGE对来自3.2的上清液样品进行分析。按照厂商说明书,使用NuPAGE Novex高效预铸凝胶(pre-cast gel)(4-12%Bis-Tris梯度凝胶,Invitrogen,Paisley,UK)来进行SDS-PAGE。按照厂商说明书,将样品(20μl)与2.0μl还原剂和6.0μl样品缓冲液混合,随后在上样到凝胶上之前,在70℃加热10分钟。电泳之后,按照厂商说明书,使用Simply Blue Safe染料(Invitrogen,Paisley,UK)对凝胶染色。
在图7中,可清楚观察到GFP-SKL向细胞外的释放。通过54kD处的内源条带观察到的,所有样品含有等量的内源蛋白。相反,第4、5、6和7道含有比第1、2和3道明显更多的GFP-SKL。此外,还显示,C2-神经酰胺还诱导过氧化物酶体内含物(即GFP-SKL)向细胞外的释放;第5和7道(MEAM+C2-神经酰胺)分别比第4和6道含有更多的GFP-SKL。
3.4对过氧化物酶体内含物向细胞外的释放进行Western杂交印迹分 析;对作为释放促进剂的C2-神经酰胺的分析
通过Western杂交印迹对来自3.2的上清液样品进行分析。按照与3.3相同的方法进行SDS-PAGE,按照厂商说明书,使用XCeII II Blot Module(Invitrogen,Paisley,UK)来进行Western杂交印迹。电泳之后,在30伏特,在预先切割的硝酸纤维素膜(Invitrogen)上对NuPage凝胶进行印迹杂交。在Tris缓冲盐水(TBS,20mM Tris-HCI pH 7.4,0.9%w/v NaCl;目录号:T5912,Sigma)+2%脱脂奶中,室温(rT)下对杂交印迹进行1小时的封闭。将商业上可获得的抗GFP抗体(anti-GFP,Eurogentec,Belgium,目录号:MMS-118P)稀释至1/10,000,将杂交印迹与该抗体温育1小时。。随后,用MilliQ水和TBS+0.2%脱脂奶对杂交印迹洗三次,每次5分钟。洗涤之后,将杂交印迹与山羊抗兔过氧化物酶(目录号:31460,Pierce Rock Ford Illinois USA)的1/5000稀释液一起在室温下温育。再洗杂交印迹,用检测液(ECL直接核酸标记和检测系统,Amersham biosciences,Buckinghamshire,UK)浸泡。最后,将杂交印迹暴露给AGFA Curix Blue HC-S plus胶片(AGFA Mortsel,Belgium)。
在图8中,可观察到GFP-SKL向细胞外的释放。在第5、6、7和8道中存在有GFP-SKL。相反,在第3、4和9、10道中不存在细胞外GFP-SKL。
3.5对A.niger培养物的a-特异性裂解的分析
为展示出3.1-3.4所述的过氧化物酶体内含物被观察到的释放不是a-特异性裂解介导的,通过对培养物上清液中细胞内乙酰胺酶(amdS)的活性加以测量来测定培养物的裂解程度。乙酰胺酶测量按照Skouloubris et al.,Molecular Microbiology(2001)40(3),596-609来进行。将10μl来自培养物的上清液加入到磷酸EDTA缓冲液(PEB,100mM磷酸钠,pH 7.4,10mMEDTA)中的100mM乙酰胺(目录号A0500,Sigma Missouri USA)中。37℃温育90分钟之后,加入400μl苯酚硝普(目录号P6994,SigmaMissouri USA)和400μl碱性次氯酸盐溶液(0.2%,目录号A1727,SigmaMissouri USA)并混合。将混合物在55℃温育6分钟。随后,按照厂商说明书,在Ultraspec 2000UV/VIS Spectrophotometer(Pharmacia Biotech,Sweden)中于635nm测量吸光度。从标准曲线来计算样品中amdS的量,其被指定为相对单位/ml培养物上清液。
结果示于图10中,可清楚观察到,24小时的培养之后,培养物上清液中不存在amdS活性,这表明没有发生裂解。48小时的培养之后,所有样品含有等量的amdS活性,这表明所有培养物中的裂解程度都是相同的。这些结果清楚显示,在3.1至3.4中的培养物上清液中观察到的GFP-SKL的存在由过氧化物酶体内含物向细胞外的积极释放引起,而非由对细胞的a-特异性裂解引起。
实施例4Pmp22可被用于改装具有重组(多)肽的过氧化物酶体
为证实Pmp22可用作为过氧化物酶体膜锚,构建嵌合基因,其中绿色荧光蛋白(GFP)与Pmp22的N末端融合,并在A.niger中表达。荧光显微揭示了强烈的绿色球形细胞内微体。
4.1克隆和表达GFP/Pmp22嵌合构建体
将SEQ ID NO:25和26示出的GFP与过氧化物酶体膜蛋白22(Pmp22)(示为SEQ ID NO:14、15和16)融合。
在PCR反应中,GFP DNA(SEQ ID NO:25)被用作为模板,使用SEQ ID NO:27和SEQ ID NO:28,得到SEQ ID NO:29。此外,在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQID NO:30和SEQ ID NO:31,得到编码SEQ ID NO:32。随后,在PCR反应中,SEQ ID NO:29和SEQ ID NO:32被用作为模板,使用SEQ IDNO:27和SEQ ID NO:31,得到SEQ ID NO:33。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:33)进行消化,将其连接进用PacI、AscI线性化过的图1所示的A.niger表达载体。这产生了下述构建体,其中,编码具有过氧化物酶体膜锚的GFP(GFP/Pmp-22)的基因被放置于glaA启动子的控制下。该基因的表达产生了包含过氧化物酶体膜锚的GFP,如SEQ ID NO:34所示。GFP/Pmp-22表达载体被用于转化A.niger。所有PCR反应、连接以及转化都按照上文所述的Molecular Cloning:A Laboratory Manual,Sambrook et al.,New York:Cold Spring Harbor Press,1989所述使用经典分子生物学技术来进行。
在最小程度富集Aspergillus培养基(MEAM,在专利申请WO98/46772中描述过)中,于30℃和250rpm,使用轨道振荡器在摇瓶中,对获得的过量表达GFP/Pmp-22的A.niger菌株进行培养。使用相同培养条件,对过量表达有或没有连接SKL的C末端的GFP的对照培养物加以培养。18小时的培养后,使用Zeiss荧光显微镜,用蓝光激发(490nm)分析样品。代表性样品用于使用Fujicolor 800ASA彩色胶片进行的荧光显影。
如可从图9A观察到的,过量表达GFP/Pmp22嵌合蛋白的A.niger显示出与过量表达GFP-SKL的A.niger(图9B)(其中,GFP-SKL通过C末端的SKL靶向至过氧化物酶体)相同的强烈的绿色球形细胞内微体点状图案。相反,过量表达野生型GFP(即没有C末端SKL)的A.niger在细胞的整个胞质中都显示普通的绿色荧光(图9C)。
组合结果清楚显示,Pmp-22可用作为过氧化物酶体膜锚,以改装具有本发明所述重组(多)肽例如GFP或融合肽的过氧化物酶体。
实施例5使用用融合多肽改装过的过氧化物酶体来构建能分泌细胞内化 合物的A.niger宿主细胞
5.1 在A.niger宿主细胞的过氧化物酶体表面上克隆和表达融合多肽
将没有跨膜结构域的A.niger v-SNARE ScnA(其基因组、cDNA和蛋白质序列分别示为SEQ ID NO:11、12和13)与过氧化物酶体膜蛋白22(Pmp22)(其基因组、cDNA和蛋白质序列分别示为SEQ ID NO:14、15和16)融合。在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:18和SEQ ID NO:35,得到编码SEQ IDNO:36。此外,在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:20和SEQ ID NO:37,得到编码SEQ IDNO:38。随后,在PCR反应中,SEQ ID NO:36和SEQ ID NO:38被用作为模板,使用SEQ ID NO:35和SEQ ID NO:37,得到SEQ ID NO:39。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:39)进行消化,将其连接进用PacI、AscI线性化过的图11所示的A.niger表达载体(pGBFIN-5)。这产生了下述构建体,其中,编码具有过氧化物酶体膜锚的融合多肽(SncA/Pmp-22)的基因被放置于glaA启动子的控制下。该基因的表达产生了包含过氧化物酶体膜锚的嵌合蛋白,如SEQ IDNO:40所示(SncA/Pmp22蛋白)。SncA/Pmp-22表达载体被用于转化过量表达GFP-SKL的A.niger CBS 513.88(如实施例2所述)。通过PCR,针对表达构建体SncA/Pmp-22和GFP-SKL的存在对得到的A.niger转化子进行分析。按照实施例3.2和3.3所述,通过培养和SDS-PAGE对包含这两种表达构建体的若干种克隆进行分析,分析针对过氧化物酶体内含物的释放进行。在实施例6和7中对表现最好的克隆进行进一步分析。所有PCR反应、连接以及转化都按照上文所述的Molecular Cloning:ALaboratory Manual,Sambrook et al.,New York:Cold Spring Harbor Press,1989所述使用经典分子生物学技术来进行。
5.2对能分泌细胞内化合物的A.niger宿主细胞进行加工处理
将前文段落获得的、并在实施例6和7中进一步分析的表现最好的克隆被选用来进行GFP-SKL表达的加工处理。得到的能分泌细胞内化合物的A.niger宿主细胞在实施例8和9中被用作为能分泌细胞内化合物的通用A.niger宿主。
在MEAM缓冲过的培养基(在专利申请WO 98/46772中详细描述过)中,于30℃和250rpm,使用轨道振荡器在摇瓶中,对选出的克隆进行培养。将该克隆的培养物涂布到含有PDA培养基(Difco,France)的平板上,以便在自发的重组事件中丢失GFP-SKL表达载体。针对GFP-SKL的表达,使用UV-发光在Geldoc 2000系统(Bio-Rad,Italy)上于315nm处,对总共100,000个菌落进行分析。展示出最少的GFP表达的菌落被用于另一轮培养和涂布。两轮选择之后,具有最小的GFP-SKL表达的科隆被选出。PCR展示出,该菌株仍然含有SncA/Pmp22表达载体,同时保留有GFP-SKL表达盒的至少一个拷贝。得到的能分泌细胞内化合物的A.niger宿主细胞在实施例8和9中被用作为能分泌细胞内化合物的通用A.niger宿主。
实施例6以10L规模的发酵罐来进行细胞外GFP-SKL生产
菌株:
按照实施例5.1所述构建出过量表达GFP-SKL以及SncA/Pmp22的A.niger CBS513.88。将菌株的孢子贮藏于-80℃(5×107个可见孢子/管)
接种程序:
将一个孢子管的内含物加入到带挡板的2L摇瓶(20g/L酵母提取物、20g/L葡萄糖,pH 6.8(用KOH),300mL培养基,在121℃蒸汽灭菌20分钟)中的预培养培养基中。该预培养物在30℃和220rpm下被培养40小时。
补料分批发酵:
使用本领域已知的程序(WO93/37179中描述的),在包含碳和氮源以及无机盐的合适的营养培养基中进行培养。所用的生长条件如下所示:过程中的pH在培养的最初72个小时被控制为6.0,之后24小时内逐步增加至6.7,保持为这个值。温度被控制为30℃。工作体积为10L,总发酵时间为192小时。对培养基的受控进料施加氧受限条件。遵循指数曲线(速率增加为0.025h-1)的通过搅拌来控制氧吸收速率。将含有葡萄糖的进料调节至在培养基中保持超过10g/L的葡萄糖浓度。必要的时候停止。使用分光光度分析,针对GFP-SKL对上清液样品进行分析。使用200μl样品,在室温下,用490nm处的激发、510nm处的发射、495nm处的截止点(cut-off)、自动获取(gain automatic)和61000M-1cm-1的488nm处的摩尔消光系数来测量相对荧光。用于荧光测量的样品被稀释于含有5mM Na2EDTA的5mM Tris HCl缓冲液(pH 8.0)中。将滤出物稀释2至640倍,这取决于预期的eGFP浓度。
如图12所示,在培养的最初72小时(pH 6.0),生物物质浓度迅速增加,然后直到发酵终点都保持几乎恒定,这是由于对培养基的连续进料导致的稀释效果造成的。在该时间段内(最初72小时),细胞外仅发现了非常低的GFP-SKL水平(大约0.25g/L)。pH从6.0变为6.7之后(在第72至第96小时间实现),细胞外GFP-SKL浓度持续增加,直到发酵终点,在192小时达到3.3g/L的值。这清楚表明,使用上述过程条件,在10L规模的补料分批培养过程中以超过3.0g/L的产率生产出了GFP-SKL。
实施例7在葡萄糖受限和氧受限条件下采用相同培养情况来进行细胞内 GFP-SKL生产
菌株:
按照实施例5.1所述构建出过量表达GFP-SKL以及SncA/Pmp22的A.niger CBS513.88。将菌株的孢子贮藏于-80℃(5×107个可见孢子/管)
接种程序:
将一个孢子管的内含物加入到带挡板的2L摇瓶(20g/L酵母提取物、20g/L葡萄糖,pH 6.8(用KOH),300mL培养基,在121℃蒸汽灭菌20分钟)中的预培养培养基中。该预培养物在30℃和220rpm下被培养40小时。
补料分批发酵:
使用本领域已知的程序(WO93/37179中描述的),在包含碳和氮源以及无机盐的合适的营养培养基中进行培养。
所用的生长条件如下所示:过程中的pH被控制为5.5,温度被控制为30℃。工作体积为10L,总发酵时间为144小时。气流为1vvm(每分钟每体积培养基的空气体积)。对于葡萄糖受限的培养物,应用速率增加为0.025h-1的指数补料曲线。对于氧受限的培养物,遵循速率增加为0.025h- 1的指数曲线通过搅拌来控制氧吸收速率。将含有葡萄糖的进料调节至在培养基中保持超过10g/L的葡萄糖浓度。必要的时候停止。取样,制备不含细胞的提取物。按照实施例6所述的方法,针对GFP-SKL对样品进行分析。
如图13所示,氧受限条件下,细胞内GFP-SKL的生产要比葡萄糖受限条件下高得多。在发酵终点(144小时),使用氧受限条件时,细胞内的GFP-SKL生产较之葡萄糖受限的条件为大约20倍高。该具体例子清楚表明,在10L规模的补料分批培养过程中,氧受限条件对于GFP-SKL的过氧化物酶体/细胞内积累来说是有好处的。
实施例8通过过氧化物酶体与质膜的融合使过氧化物酶体内含物(乙酰 胺酶)释放到细胞外
8.1A.niger乙酰胺酶的克隆和表达
使用A.niger乙酰胺酶AmdS(其基因组、cDNA和蛋白质序列分别示为SEQ ID NO:41、SEQ ID NO:42和SEQ ID NO:43)。在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:44和SEQ ID NO:45,得到编码SEQ ID NO:46。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:46)进行消化,将其连接进用PacI、AscI线性化过的图1所示的A.niger表达载体。这产生了下述构建体,其中,编码A.niger乙酰胺酶的基因被放置于glaA启动子的控制下。
此外,在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:44和SEQ ID NO:47,得到编码SEQ ID NO:48。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:48)进行消化,将其连接进用PacI、AscI线性化过的图1所示的A.niger表达载体(pGBFIN-5)。这产生了下述构建体,其中,编码具有经工程改造的C末端SKL尾巴的A.niger乙酰胺酶的基因被放置于glaA启动子的控制下。该构建体的表达产生SEQ ID NO:49所示的多肽。所有PCR反应、连接以及转化都按照上文所述的Molecular Cloning:A LaboratoryManual,Sambrook et a1.,New York:Cold Spring Harbor Press,1989所述使用经典分子生物学技术来进行。
得到的编码具有或不具有C末端SKL的A.niger乙酰胺酶的表达构建体被用于转化来自实施例5.2的能分泌细胞内化合物的通用A.niger宿主和CBS 513.88。针对SncA/Pmp22表达构建体以及乙酰胺酶构建体的存在,SncA/Pmp22表达构建体以及乙酰胺酶-SKL构建体的存在,分别通过PCR对转化子进行分析。选出的克隆在实施例8.3中被进一步分析。
8.2对A.nidulans乙酰胺酶的克隆和表达
对该实验而言,使用公知的A.nidulans乙酰胺酶基因(Tilburn et al,1983,Gene 26:205-221),其基因组、cDNA和蛋白质序列分别示为SEQID NO:50、SEQ ID NO:51和SEQ ID NO:52。在PCR反应中,来自含有A.nidulans AmdS(描述于EP13211523中)的表达载体的质粒DNA被用作为模板,使用SEQ ID NO:53和SEQ ID NO:54,得到编码SEQ IDNO:55。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ IDNO:55)进行消化,将其连接进用PacI、AscI线性化过的图1所示的A.niger表达载体。这产生了下述构建体,其中,编码A.nidulans乙酰胺酶的基因被放置于glaA启动子的控制下。
此外,在PCR反应中,来自含有A.nidulans AmdS(描述于EP13211523中)的表达载体的质粒DNA被用作为模板,使用SEQ IDNO:53和SEQ ID NO:56,得到编码SEQ ID NO:57。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:57)进行消化,将其连接进用PacI、AscI线性化过的图1所示的A.niger表达载体。这产生了下述构建体,其中,编码具有经工程改造的C末端SKL尾巴的A.nidulans乙酰胺酶的基因被放置于glaA启动子的控制下。该构建体的表达产生SEQ ID NO:58所示的多肽。所有PCR反应、连接以及转化都按照上文所述的Molecular Cloning:A Laboratory Manual,Sambrook et al.,NewYork:Cold Spring Harbor Press,1989所述使用经典分子生物学技术来进行。得到的编码具有或不具有C末端SKL的A.nidulans乙酰胺酶的表达构建体被用于转化来自实施例5.2的能分泌细胞内化合物的通用A.niger宿主和CBS 513.88。针对SncA/Pmp22表达构建体以及乙酰胺酶构建体的存在,SncA/Pmp22表达构建体以及乙酰胺酶-SKL构建体的存在,分别通过PCR对转化子进行分析。选出的克隆在实施例8.3中被进一步分析。
8.3培养来自实施例8.1和8.2的转化子,用于分析细胞内乙酰胺酶的 释放
将具有或不具有SKL的A.niger AmdS以及具有或不具有SKL的A.nidulans AmdS转化进能分泌细胞内化合物的通用A.niger宿主(实施例5.2中构建的)和CBS 513.88(作为阴性对照)。使用PCR选出含有乙酰胺酶表达盒单个拷贝的转化子。在MEAM缓冲过的培养基(在专利申请WO 98/46772中详细描述过)中,于30℃和250rpm,使用轨道振荡器在摇瓶中,对8种类型的克隆进行培养。在培养开始之后120和144小时的时间点,取上清液样品。通过离心来澄清上清液样品,通过经0.45μm过滤器(目录号4614,Pall,Ann Arbor,Mo USA)进行超滤将其与残余的细胞残骸分开。在实施例8.4中针对乙酰胺酶活性对上清液样品进行分析。
8.4乙酰胺酶试验
通过测量样品中的游离氨,针对乙酰胺酶活性对来自8.3的上清液样品进行分析。游离氨是乙酰胺酶活性的指标(如Skouloubris et al.,Molecular Microbiology(2001)40(3),596-609所述)。CBS 513.88的所有选出并分析为经转化的克隆没有产生可检测到的游离氨(数据未示出)。在图14中,展示了通过实施例5.2的菌株的四种类型的转化子产生的游离氨。如图14清楚所示,含有C末端SKL延伸(即靶向过氧化物酶体)的构建体较之不含C末端SKL延伸的构建体产生更高的细胞外乙酰胺酶活性。这种更高的乙酰胺酶活性是过氧化物酶体内含物的释放导致的。在图14中,当将方块2(具有SKL的A.niger乙酰胺酶)和4(具有SKL的A.nidulans乙酰胺酶)与对应的方块1(不具有SKL的A.niger乙酰胺酶)和3(不具有SKL的A.nidulans乙酰胺酶)进行比较时,可以清楚地观察到具有和不具有SKL的分泌到细胞外的乙酰胺酶之间的差异;在具有SKL的乙酰胺酶的上清液中,存在多得多的乙酰胺酶活性。
实施例9通过过氧化物酶体与质膜的融合使过氧化物酶体内含物(阿马 多里酶)释放到细胞外
9.1 A.niger阿马多里酶-SRL的克隆和表达
使用A.niger阿马多里酶-SRL(其基因组、cDNA和蛋白质序列分别示为SEQ ID NO:59、SEQ ID NO:60和SEQ ID NO:61)。在PCR反应中,来自CBS 513.88的基因组DNA被用作为模板,使用SEQ ID NO:62和SEQ ID NO:63,得到编码SEQ ID NO:64。按照厂商说明书,用PacI和AscI对得到的PCR片段(SEQ ID NO:64)进行消化,将其连接进用PacI、AscI线性化过的图11所示的A.niger表达载体。这产生了下述构建体,其中,编码阿马多里酶的基因被放置于glaA启动子的控制下。按照厂商说明书,用PacI和AscI对得到的质粒DNA进行消化,将其连接进用PacI、AscI线性化过的图1所示的A.niger表达载体。所有PCR反应、连接以及转化都按照上文所述的Molecular Cloning:A Laboratory Manual,Sambrook et al.,New York:Cold Spring Harbor Press,1989所述使用经典分子生物学技术来进行。得到的编码A.niger阿马多里酶-SRL的表达构建体被用于转化来自实施例5.2的能分泌细胞内化合物的通用A.niger宿主和CBS 513.88(作为阴性对照)。针对SncA/Pmp22表达构建体以及阿马多里酶-SRL构建体的存在,分别通过PCR对转化子进行分析。选出的克隆在实施例9.2中被进一步分析。
9.2培养来自实施例9.1的转化子,用于分析细胞内阿马多里酶的释放
将A.niger阿马多里酶-SRL转化进来白实施例5.2的能分泌细胞内化合物的通用A.niger宿主和CBS 513.88(作为阴性对照)。使用PCR选出含有阿马多里表达盒单个拷贝的转化子。对2种类型的转化子(实施例5.2的A.niger和CBS 513.88,每种都包含阿马多里酶-SRL)的代表性克隆进行选择,并在MEAM缓冲过的培养基(在专利申请WO 98/46772中详细描述过)中,于30℃和250rpm,使用轨道振荡器在摇瓶中对它们进行培养。在培养开始之后96小时的时间点,取上清液样品。通过离心来澄清上清液样品,通过经0.45μm过滤器(目录号4614,Pall,Ann Arbor,Mo USA)进行超滤将其与残余的细胞残骸分开。在实施例9.3中针对阿马多里活性对上清液样品进行分析。
9.3阿马多里酶试验
通过酶试验来分析来自9.2的上清液样品。阿马多里酶活性试验如Monnier VM et al,J Biol Chem.1997 Feb 7;272(6):3437-43所述。用果糖基丙胺(Monnier教授友情提供)作为底物,通过与邻苯二胺的显色反应测量得到的葡糖醛酮的释放来监测酶活性。该试验基于对120分钟反应时间之后形成的葡糖醛酮的终点测量。反应混合物含有20mM磷酸钠(pH7.4)、10mM OPD、10mM果糖基丙胺以及来自实施例9.3的上清液样品,最终体积为1ml。在37℃温育2小时后,测量320nm处的吸光度。结果展示于图15中。结果清楚地显示,较之用阿马多里酶-SRL基因转化过的对照菌株CBS 513.88,来自实施例5.2的能分泌细胞内化合物的通用A.niger宿主在培养基中能产生至少三倍多的阿马多里酶-SRL。
实施例10过氧化物酶体代谢产物的增加的排出
进行实验,以证实来自实施例5.2的能分泌细胞内化合物的通用A.niger宿主较之阴性对照菌株CBS513.88展示出增加的对过氧化物酶体代谢产物的分泌。
按照实施例6所述,培养来自实施例5.2的能分泌细胞内化合物的通用A.niger宿主和CBS513.88。在培养开始之后138小时的时间点,取上清液样品。通过离心来澄清上清液样品,通过经0.45μm过滤器(目录号4614,Pall,Ann Arbor,Mo USA)进行超滤将其与残余的细胞残骸分开。随后,通过1H NMR,针对过氧化物酶体的beta氧化代谢产物(David EMetzler,Biochemistry,2nd edition,Academic Press 2001)对样品进行分析。
用4N HCl将2ml上清液酸化至pH 2,用4ml氯仿进行萃取。从澄清的氯仿层(离心之后)萃取回3ml进入2ml水(用0.01N NaOH调节为pH 7.5)中。离心之后,取1.5ml水层,冻干,重新溶解进0.5ml D2O(氘水,Cambridge Isotope Laboratories)。在600MHZ,在BrukerAvance 600核磁疑上测量1H NMR。通过二维NMR测量法,将展示出浓度以2的因子增加的化合物鉴定为带支链脂肪酸:异丁酸(a)、异戊酸(b)和a-甲基丁酸(c)。已知它们来自对带支链异异脂肪酸和ante-异脂肪酸的beta氧化(分别针对a+b和c的)(David E Metzler,Biochemistry,2nd edition,Academic Press 2001)。
对这些酸之间的定量比较通过将它们在NMR谱中的特征性甲基共振(对a来说,1.114ppm,对b来说,0.928,对c来说,0.885和1.089ppm)加以整合来进行。对所有三种代谢产物而言,对于来自实施例5.2的能分泌细胞内化合物的通用A.niger宿主,测量到了较之阴性对照菌株CBS 513.88而言的以2为因子的增加。结果清楚显示,来自实施例5.2的能分泌细胞内化合物的通用A.niger宿主可被用作为宿主菌株,用于对感兴趣的过氧化物酶体代谢产物进行细胞外生产。
本文描述和要求保护的本发明不限于本文公开的具体实施方式的范围,因为这些实施方式仅用于阐述本发明的若干方面。任何等同的实施方式都在本发明的范围之内。事实上,除了本文所展示和描述的之外,本领域技术人员可从前述说明书明显获得对本发明的多种改变。此类改变也在所附权利要求的范围内。在有冲突的情况下,以本文的公开内容为准,包括定义。
序列表
<110>帝斯曼知识产权资产管理有限公司
<120>在真核细胞中生产化合物的方法
<130>24249WO
<160>64
<170>PatentIn version 3.1
<210>1
<211>36
<212>DNA
<213>引物
<400>1
gtcctgttaa ttaaccacca tggcgaacac aacgtg           36
<210>2
<211>37
<212>DNA
<213>引物
<400>2
acttcaggcg cgcctcaaga gacatcactc attacgg          37
<210>3
<211>45
<212>DNA
<213>引物
<400>3
acttcaggcg cgccttacag cttcgaagag acatcactca ttacg 45
<210>4
<211>1793
<212>DNA
<213>合成构建体
<400>4
gtcctgttaa ttaaccacca tggcgaacac aacgtgggag catagagcca agagcaagca     60
agctcagacg gcagcagcga ttccaccaga atggacttta ccagccgata tacttctcga    120
ctcctcggcg aatgtcctcg atgtgcccag gacctgtggg ctcctgaccg aaagagaaat    180
ccatattacc gaagactatg atgccacagc attacttgaa aagttggcta ccggagagtt    240
cagctcactc gaggtcacga cagcattctg caagcgggct gcaattgcgc agcagttgac    300
ctgctgcttg acggaaatct tcttcgacaa agcactagcc agagcaaagc agctcgacga    360
aattctggct caaactgggg taacaaccgg gccactgcat ggcctgccca taagtatcaa     420
ggagtcgttc aatgtccctg gagttccgac tacactgggg ttcgtcggat ttctcgatcg     480
ggccccggcg tccatgagtt ccgccctggt tgagatcctg aacaactgtg gggctgttct     540
atatgtcaag accaatgtcc cccagacaat gatgactccg gactcccata acaatgtctt     600
cggtcgtgtg ctcaacccgc acggacggag cctgaccgct ggaggcagca gtggcggaga     660
gggagcattg gtggcgatga ggggctcagt cctcggcgtg gggacagata tcgccggctc     720
cattcgcatc cccgccctct gctgtggtgt ttttggtttc aaacccacgg cttgccgtat     780
cccatatgca ggtcaaacgt ctgccgggcg tccgggtatg acgggcatcc tgccgtccgc     840
cgggcccatg tgccattcta tccgcgatgc agaactcttt ctcaaagttg tcctcaactc     900
gaggcctgcc gatctggatg actatgcact cgacattcca tggtcccctg ctccgcaaaa     960
ggagaggctt actattgggc tcctgcccga ggacccgtcg ttcccgcttc atccaccgat    1020
gcgacgtacc ctgaacgccg cagtgaaggc gctgactaca gccggacacc gggtcatcga    1080
cctctcagga caggctccgt ccttctccaa tgcatgttct ctggcattgc gatatttcgg    1140
cctggacccg gatcgaactg cactgcgcca cataacgcag gcgggcgaac ctttcattcc    1200
ttcgctcaaa ttcacctatg atctcaatga gccgacacgt gagcccacct tgagagatct    1260
attcgaatcg aatgtcgccc gtagtcagct cgcaacccag gcacgaaagc tcttcgttga    1320
taatcagctt gatctgttcc tgggcgcggc ttatcaaagc acatcggttc cccatgatac    1380
ctacggtatt ccggtatata ccgtgctttg gaacctgatt aatgtgggta tcccacactg    1440
cctttcttgt tttctttttc ttttttgttt cccccccttc tttctgctcc aattgcatgg    1500
ggtgtctgct aatgatgcac tagtatccgg cgtgcgttat cccatttggg caggccaaca    1560
aggtagagga cgcagcgtat aaccgcgacg tctcttatgt gccagactgt aagttgcgcc    1620
cctcaattgg tctcgctcag tctactaact actgtagatc ggccagaaga aattgaaggc    1680
gcaccgtgtc acatccatct gataggcaga ccgatggcgg acgaaaaatt ggttcaggat    1740
gcgaagacta tatgcaccgt aatgagtgat gtctcttgag gcgcgcctga agt           1793
<210>5
<211>1802
<212>DNA
<213>合成构建体
<400>5
gtcctgttaa ttaaccacca tggcgaacac aacgtgggag catagagcca agagcaagca    60
agctcagacg gcagcagcga ttccaccaga atggacttta ccagccgata tacttctcga     120
ctcctcggcg aatgtcctcg atgtgcccag gacctgtggg ctcctgaccg aaagagaaat     180
ccatattacc gaagactatg atgccacagc attacttgaa aagttggcta ccggagagtt     240
cagctcactc gaggtcacga cagcattctg caagcgggct gcaattgcgc agcagttgac     300
ctgctgcttg acggaaatct tcttcgacaa agcactagcc agagcaaagc agctcgacga     360
aattctggct caaactgggg taacaaccgg gccactgcat ggcctgccca taagtatcaa     420
ggagtcgttc aatgtccctg gagttccgac tacactgggg ttcgtcggat ttctcgatcg     480
ggccccggcg tccatgagtt ccgccctggt tgagatcctg aacaactgtg gggctgttct     540
atatgtcaag accaatgtcc cccagacaat gatgactccg gactcccata acaatgtctt     600
cggtcgtgtg ctcaacccgc acggacggag cctgaccgct ggaggcagca gtggcggaga     660
gggagcattg gtggcgatga ggggctcagt cctcggcgtg gggacagata tcgccggctc     720
cattcgcatc cccgccctct gctgtggtgt ttttggtttc aaacccacgg cttgccgtat     780
cccatatgca ggtcaaacgt ctgccgggcg tccgggtatg acgggcatcc tgccgtccgc     840
cgggcccatg tgccattcta tccgcgatgc agaactcttt ctcaaagttg tcctcaactc     900
gaggcctgcc gatctggatg actatgcact cgacattcca tggtcccctg ctccgcaaaa     960
ggagaggctt actattgggc tcctgcccga ggacccgtcg ttcccgcttc atccaccgat    1020
gcgacgtacc ctgaacgccg cagtgaaggc gctgactaca gccggacacc gggtcatcga    1080
cctctcagga caggctccgt ccttctccaa tgcatgttct ctggcattgc gatatttcgg    1140
cctggacccg gatcgaactg cactgcgcca cataacgcag gcgggcgaac ctttcattcc    1200
ttcgctcaaa ttcacctatg atctcaatga gccgacacgt gagcccacct tgagagatct    1260
attcgaatcg aatgtcgccc gtagtcagct cgcaacccag gcacgaaagc tcttcgttga    1320
taatcagctt gatctgttcc tgggcgcggc ttatcaaagc acatcggttc cccatgatac    1380
ctacggtatt ccggtatata ccgtgctttg gaacctgatt aatgtgggta tcccacactg    1440
cctttcttgt tttctttttc ttttttgttt cccccccttc tttctgctcc aattgcatgg    1500
ggtgtctgct aatgatgcac tagtatccgg cgtgcgttat cccatttggg caggccaaca    1560
aggtagagga cgcagcgtat aaccgcgacg tctcttatgt gccagactgt aagttgcgcc    1620
cctcaattgg tctcgctcag tctactaact actgtagatc ggccagaaga aattgaaggc    1680
gcaccgtgtc acatccatct gataggcaga ccgatggcgg acgaaaaatt ggttcaggat    1740
gcgaagacta tatgcaccgt aatgagtgat gtctcttcga agctataagg cgcgcctgaa    1800
gt                                                          1802
<210>6
<211>40
<212>DNA
<213>引物
<400>6
gtcctgttaa ttaaccacca tgcttccccc  ctttgattac                  40
<210>7
<211>39
<212>DNA
<213>引物
<400>7
acttcaggcg cgccctagtc  aagctcaatc aatgggtat                   39
<210>8
<211>49
<212>DNA
<213>引物
<400>8
acttcaggcg cgccttacag cttcgagtca agctcaatca atgggtatt         49
<210>9
<211>1987
<212>DNA
<213>合成构建体
<400>9
gtcctgttaa ttaaccacca tgcttccccc ctttgattac tttacgtatc gtcgcatccg     60
gtaggttacc ccgtgtgcct tcacgcagca acttaagcag tcctacacag cccacatgca    120
acttagccga cggctcactg accattcaca gggacctcaa gaggagggaa cgggcggctc    180
gatttgcatc gctatctccc gattatcatg cgcccttctc ggctatcgac agggttatca    240
ttaacaagcc tatccaggac ttggtatatg aggtccagaa tgattccttg gcacctttag    300
atgtcctacg cacatacggc aaggttgcag tcaaggctca cgaaaagacc aattgcgtga    360
ctgagcttct attgcctgag gcagaatcat gggctcagtc cgaagtaaac ctaaaaggtc    420
ccctggcggg tgtgcctatc tctttgaaag actcggtgca agtcaaagga ttcgatatta    480
ctctggggta taccaagttc gcgtgtaaac cgtataagga ggatggtcca atggcaaagc    540
tgttgaagga tgctggtagg tgacctgtgc cgcgaaacat cacagaaagt atccctgcgc    600
taatgatgaa ctccatcagg tgcggtccca tatgcgaaaa cggcgctgcc cgtgacgctt     660
ctgtcgttcg aatcagcaaa cgctctttgg ggtcactgcc ttaacccaca tgtcccggaa     720
tactctcctg gcggctcgac gggtggtgaa ggtgctctgc tggctcttgg tggtcgcatc     780
ggtatcgggt cggatgtcgc tggctcggtt cgcgttcccg ctgcctggag cggcatctac     840
tccctccgct gtagtactgg ccgctggcct aaggtcggag tcaacaccag catggctggc     900
caggaaggtg ttgccagtgt cttcagtcct atggcccgta ctttgaacga tctcacctat     960
ttcaccaaag ctattgtcgg aatgaagcct tggaactacg accataccgt ccaccctatc    1020
tcctggagag aagatgagga aattgaagcc caaaacaaaa ggttgaggat cggcctcatg    1080
agcaacgatg gtaagttcca agagcgggga catcaaggac actacttggg cctttctgac    1140
cacttgcagg tgtcgttccc ccaacgccgg ccattgaacg tgctatttcc accacagtag    1200
ccgccctcac cgccgctggg catactgtat ctgagatcac accccccgct gcggctgaca    1260
cttttactgg tctctccctc gcctcgcagc tgctcaactc tgatgggtgc gtcacgttta    1320
actcgcatct gcacagcttt gagccatccg accctggtgc agatcagctg acgcggatat    1380
gcaatctgcc ccgtcctcta cgttatctct actacctttg ggttcggtac atccgacggg    1440
atgagaagtg ggcgacgctg atccgcgggt ttgcccccaa gtctgcggcg gagctttgga    1500
agctcactgc ccagcgggaa gctttccggg cgacctggca cagctggtgg gatgccgaga    1560
cgcagcagta cgatttcatc ctctgccccg tcaatgcgac gccggctctg ccccacaaag    1620
ccatgcacga tgcggtatcc tcatgcggat acacgttcct ctggaacctg ctggactaca    1680
cagccggtgt cgtgcctgtc tcgcacgtgg acgcgaagaa ggatgctctg tctggtccgt    1740
acaagaaggt gctgaaacag ctgggagcca gcaacgcggt ggcctacggt gcctggaagc    1800
actacgacgc ggcgaagatg gcgggattgc ctactgcagt gcaggtggtg ggacgcagat    1860
ggcaggaaga gaaggtgctt ggatacatgg cggcagttga ggaggccttg gagcagtatc    1920
aggacccggt aactggagaa ggggggaaat acccattgat tgagcttgac tagggcgcgc    1980
ctgaagt                                                              1987
<210>10
<211>1996
<212>DNA
<213>合成构建体
<400>10
gtcctgttaa ttaaccacca tgcttccccc ctttgattac tttacgtatc gtcgcatccg    60
gtaggttacc ccgtgtgcct tcacgcagca acttaagcag tcctacacag cccacatgca     120
acttagccga cggctcactg accattcaca gggacctcaa gaggagggaa cgggcggctc     180
gatttgcatc gctatctccc gattatcatg cgcccttctc ggctatcgac agggttatca     240
ttaacaagcc tatccaggac ttggtatatg aggtccagaa tgattccttg gcacctttag     300
atgtcctacg cacatacggc aaggttgcag tcaaggctca cgaaaagacc aattgcgtga     360
ctgagcttct attgcctgag gcagaatcat gggctcagtc cgaagtaaac ctaaaaggtc     420
ccctggcggg tgtgcctatc tctttgaaag actcggtgca agtcaaagga ttcgatatta     480
ctctggggta taccaagttc gcgtgtaaac cgtataagga ggatggtcca atggcaaagc     540
tgttgaagga tgctggtagg tgacctgtgc cgcgaaacat cacagaaagt atccctgcgc     600
taatgatgaa ctccatcagg tgcggtccca tatgcgaaaa cggcgctgcc cgtgacgctt     660
ctgtcgttcg aatcagcaaa cgctctttgg ggtcactgcc ttaacccaca tgtcccggaa     720
tactctcctg gcggctcgac gggtggtgaa ggtgctctgc tggctcttgg tggtcgcatc     780
ggtatcgggt cggatgtcgc tggctcggtt cgcgttcccg ctgcctggag cggcatctac     840
tccctccgct gtagtactgg ccgctggcct aaggtcggag tcaacaccag catggctggc     900
caggaaggtg ttgccagtgt cttcagtcct atggcccgta ctttgaacga tctcacctat     960
ttcaccaaag ctattgtcgg aatgaagcct tggaactacg accataccgt ccaccctatc    1020
tcctggagag aagatgagga aattgaagcc caaaacaaaa ggttgaggat cggcctcatg    1080
agcaacgatg gtaagttcca agagcgggga catcaaggac actacttggg cctttctgac    1140
cacttgcagg tgtcgttccc ccaacgccgg ccattgaacg tgctatttcc accacagtag    1200
ccgccctcac cgccgctggg catactgtat ctgagatcac accccccgct gcggctgaca    1260
cttttactgg tctctccctc gcctcgcagc tgctcaactc tgatgggtgc gtcacgttta    1320
actcgcatct gcacagcttt gagccatccg accctggtgc agatcagctg acgcggatat    1380
gcaatctgcc ccgtcctcta cgttatctct actacctttg ggttcggtac atccgacggg    1440
atgagaagtg ggcgacgctg atccgcgggt ttgcccccaa gtctgcggcg gagctttgga    1500
agctcactgc ccagcgggaa gctttccggg cgacctggca cagctggtgg gatgccgaga    1560
cgcagcagta cgatttcatc ctctgccccg tcaatgcgac gccggctctg ccccacaaag    1620
ccatgcacga tgcggtatcc tcatgcggat acacgttcct ctggaacctg ctggactaca    1680
cagccggtgt cgtgcctgtc tcgcacgtgg acgcgaagaa ggatgctctg tctggtccgt    1740
acaagaaggt gctgaaacag ctgggagcca gcaacgcggt ggcctacggt gcctggaagc    1800
actacgacgc ggcgaagatg gcgggattgc ctactgcagt gcaggtggtg ggacgcagat    1860
ggcaggaaga gaaggtgctt ggatacatgg cggcagttga ggaggccttg gagcagtatc    1920
aggacccggt aactggagaa ggggggaaat acccattgat tgagcttgac tcgaagctat    1980
aaggcgcgcc tgaagt                                                    1996
<210>11
<211>628
<212>DNA
<213>Aspergillus niger
<400>11
atgtccgagc agccctatga tccctacatc ccctctggcg ccaatggggc tggcgccggc      60
gccagcgctg cgcaaaatgg cgaccccagg acacgggaaa tcgacaaagt aagttgccga     120
aacgcctcgc ggtcaacttt tatcgttcca caaggatatg tcgcccaggt tgaataggat     180
gtgatggctt tccagttttc atttggactt ccatctgagt tcaactggac ttggaggcca     240
ccgggtcttt ttgaatctta ttaagcttgt gtctattatg gcatttgtcg caaagtattt     300
actaacgctg tgtttcttct ctgtctagaa aatccaagaa accgttgaca caatgcgctc     360
caacatcttt aaagtttcag aacgtggtga acgtctagat tccctccagg acaagacgga     420
caatttggca acatcagcgc agggattccg cagaggtgcc aaccgcgtga ggaagcaaat     480
gtggtggaag gatatgaaga tgcgcgtgtg cctaatcgtt tgtatcatta ttctgctcat     540
tgtgattatc gtccctgcag gtaagatcag cgctatcctc cagcactcca ccaagctgga     600
ctcggaaaaa catcccggaa tgcgctaa                                        628
<210>12
<211>408
<212>DNA
<213>Aspergillus niger
<400>12
atgtccgagc agccctatga tccctacatc ccctctggcg ccaatggggc tggcgccggc      60
gccagcgctg cgcaaaatgg cgaccccagg acacgggaaa tcgacaaaaa aatccaagaa     120
accgttgaca caatgcgctc caacatcttt aaagtttcag aacgtggtga acgtctagat     180
tccctccagg acaagacgga caatttggca acatcagcgc agggattccg cagaggtgcc     240
aaccgcgtga ggaagcaaat gtggtggaag gatatgaaga tgcgcgtgtg cctaatcgtt     300
tgtatcatta ttctgctcat tgtgattatc gtccctgcag gtaagatcag cgctatcctc     360
cagcactcca ccaagctgga ctcggaaaaa catcccggaa tgcgctaa                    408
<210>13
<211>135
<212>PRT
<213>Aspergillus niger
<400>13
Met Ser Glu Gln Pro Tyr Asp Pro Tyr Ile Pro Ser Gly Ala Asn Gly
1               5                   10                  15
Ala Gly Ala Gly Ala Ser Ala Ala Gln Asn Gly Asp Pro Arg Thr Arg
            20                  25                  30
Glu Ile Asp Lys Lys Ile Gln Glu Thr Val Asp Thr Met Arg Ser Asn
        35                  40                  45
Ile Phe Lys Val Ser Glu Arg Gly Glu Arg Leu Asp Ser Leu Gln Asp
    50                  55                  60
Lys Thr Asp Asn Leu Ala Thr Ser Ala Gln Gly Phe Arg Arg Gly Ala
65                  70                  75                  80
Asn Arg Val Arg Lys Gln Met Trp Trp Lys Asp Met Lys Met Arg Val
                85                  90                  95
Cys Leu Ile Val Cys Ile Ile Ile Leu Leu Ile Val Ile Ile Val Pro
            100                 105                 110
Ala Gly Lys Ile Ser Ala Ile Leu Gln His Ser Thr Lys Leu Asp Ser
        115                 120                 125
Glu Lys His Pro Gly Met Arg
    130                 135
<210>14
<211>974
<212>DNA
<213>Aspergillus niger
<400>14
atgtctgcca agttccagga tgaggccgtc acctcgatac gggaggacac aaaggaattg      60
gtgcacaagg ttggaaaccg gttgactggc gatggctatc tcgctgtagg ttttgcgcct     120
gtgtaatcac accccgaatg cgtgttttgc agtccactga ttgagacaat gcgcgtccgt     180
tatagctcta cctccgccaa ctgcagtcca accccctgcg cactaagatg ttgacctccg     240
gtgtcctgtc cagtctgcaa gaaatcctgg cctcgtggat cgcccatgat gtcagcaagc     300
acggtcacta cttcagcgcc cgcgtcccca aaatggccct ctacggaatg ttcatcagcg     360
ccccgctggg ccactttctc atcggaattc tgcagcgggt cttcgctggc cggactagca     420
tcaaggccaa gatcctgcaa attctcgcca gcaacttgtt ggtatgttcg atctgacact     480
ccccttctga cgtgcggctg gaatgctgac gcgacgcagg tctcccccat ccaaaacgcc     540
gtgtacctgt gctgcatggc cgttatcgcg ggcgcgcgca ccttccacca ggtccgcgct     600
accgtgcggg ccggtttcat gcccgtcatg aaggtcagct gggtcacctc gcccattgcg     660
ctggcctttg cccagaagtt cctccccgag cacacctggg tgcctttctt caacattgtc     720
gggttcgtca ttggaaccta cgtcaacacg cacaccaaga agaagcgtct tgaggctctc     780
cgcaaggtaa atcaactacg tgacgatccc gccgacgcga ccagtcgcta acctagcacg     840
acagcgctac gaccaacgcc gtggacccgg tagcgagtac gacaagggcg actaccggta     900
aacgatgtaa atatactgta cctagcttat gactaccgac tggttagtgt ggacttcccg     960
atatggtcgg ttag                                                       974
<210>15
<211>675
<212>DNA
<213>Aspergillus niger
<400>15
atgtctgcca agttccagga tgaggccgtc acctcgatac gggaggacac aaaggaattg      60
gtgcacaagg ttggaaaccg gttgactggc gatggctatc tcgctctcta cctccgccaa     120
ctgcagtcca accccctgcg cactaagatg ttgacctccg gtgtcctgtc cagtctgcaa     180
gaaatcctgg cctcgtggat cgcccatgat gtcagcaagc acggtcacta cttcagcgcc     240
cgcgtcccca aaatggccct ctacggaatg ttcatcagcg ccccgctggg ccactttctc     300
atcggaattc tgcagcgggt cttcgctggc cggactagca tcaaggccaa gatcctgcaa     360
attctcgcca gcaacttgtt ggtctccccc atccaaaacg ccgtgtacct gtgctgcatg     420
gccgttatcg cgggcgcgcg caccttccac caggtccgcg ctaccgtgcg ggccggtttc     480
atgcccgtca tgaaggtcag ctgggtcacc tcgcccattg cgctggcctt tgcccagaag     540
ttcctccccg agcacacctg ggtgcctttc ttcaacattg tcgggttcgt cattggaacc     600
tacgtcaaca cgcacaccaa gaagaagcgt cttgaggctc tccgcaagtg tggacttccc     660
gatatggtcg gttag                                            675
<210>16
<211>224
<212>PRT
<213>Aspergillus niger
<400>16
Met Ser Ala Lys Phe Gln Asp Glu Ala Val Thr Ser Ile Arg Glu Asp
1               5                   10                  15
Thr Lys Glu Leu Val His Lys Val Gly Asn Arg Leu Thr Gly Asp Gly
            20                  25                  30
Tyr Leu Ala Leu Tyr Leu Arg Gln Leu Gln Ser Asn Pro Leu Arg Thr
        35                  40                  45
Lys Met Leu Thr Ser Gly Val Leu Ser Ser Leu Gln Glu Ile Leu Ala
    50                  55                  60
Ser Trp Ile Ala His Asp Val Ser Lys His Gly His Tyr Phe Ser Ala
65                  70                  75                  80
Arg Val Pro Lys Met Ala Leu Tyr Gly Met Phe Ile Ser Ala Pro Leu
                85                  90                  95
Gly His Phe Leu Ile Gly Ile Leu Gln Arg Val Phe Ala Gly Arg Thr
            100                 105                 110
Ser Ile Lys Ala Lys Ile Leu Gln Ile Leu Ala Ser Asn Leu Leu Val
        115                 120                 125
Ser Pro Ile Gln Asn Ala Val Tyr Leu Cys Cys Met Ala Val Ile Ala
    130                 135                 140
Gly Ala Arg Thr Phe His Gln Val Arg Ala Thr Val Arg Ala Gly Phe
145                 150                 155                 160
Met Pro Val Met Lys Val Ser Trp Val Thr Ser Pro Ile Ala Leu Ala
                165                 170                 175
Phe Ala Gln Lys Phe Leu Pro Glu His Thr Trp Val Pro Phe Phe Asn
            180                 185                 190
Ile Val Gly Phe Val Ile Gly Thr Tyr Val Asn Thr His Thr Lys Lys
        195                 200                 205
Lys Arg Leu Glu Ala Leu Arg Lys Cys Gly Leu Pro Asp Met Val Gly
    210                 215                 220
<210>17
<211>39
<212>DNA
<213>引物
<400>17
tgcttaatta accaccatgt ccgagcagcc ctatgatcc    39
<210>18
<211>42
<212>DNA
<213>引物
<400>18
cctcatcctg gaacttggca gagcgcatct tcatatcctt cc 42
<210>19
<211>543
<212>DNA
<213>合成构建体
<400>19
tgcttaatta accaccatgt ccgagcagcc ctatgatccc tacatcccct ctggcgccaa     60
tggggctggc gccggcgcca gcgctgcgca aaatggcgac cccaggacac gggaaatcga    120
caaagtaagt tgccgaaacg cctcgcggtc aacttttatc gttccacaag gatatgtcgc    180
ccaggttgaa taggatgtga tggctttcca gttttcattt ggacttccat ctgagttcaa    240
ctggacttgg aggccaccgg gtctttttga atcttattaa gcttgtgtct attatggcat    300
ttgtcgcaaa gtatttacta acgctgtgtt tcttctctgt ctagaaaatc caagaaaccg    360
ttgacacaat gcgctccaac atctttaaag tttcagaacg tggtgaacgt ctagattccc    420
tccaggacaa gacggacaat ttggcaacat cagcgcaggg attccgcaga ggtgccaacc    480
gcgtgaggaa gcaaatgtgg tggaaggata tgaagatgcg ctctgccaag ttccaggatg    540
agg                                                                  543
<210>20
<211>42
<212>DNA
<213>引物
<400>20
ggaaggatat gaagatgcgc tctgccaagt tccaggatga gg    42
<210>21
<211>35
<212>DNA
<213>引物
<400>21
attggcgcgc cctaaccgac catatcggga agtcc            35
<210>22
<211>1002
<212>DNA
<213>合成构建体
<400>22
ggaaggatat gaagatgcgc tctgccaagt tccaggatga ggccgtcacc tcgatacggg       60
aggacacaaa ggaattggtg cacaaggttg gaaaccggtt gactggcgat ggctatctcg      120
ctgtaggttt tgcgcctgtg taatcacacc ccgaatgcgt gttttgcagt ccactgattg      180
agacaatgcg cgtccgttat agctctacct ccgccaactg cagtccaacc ccctgcgcac      240
taagatgttg acctccggtg tcctgtccag tctgcaagaa atcctggcct cgtggatcgc      300
ccatgatgtc agcaagcacg gtcactactt cagcgcccgc gtccccaaaa tggccctcta      360
cggaatgttc atcagcgccc cgctgggcca ctttctcatc ggaattctgc agcgggtctt      420
cgctggccgg actagcatca aggccaagat cctgcaaatt ctcgccagca acttgttggt      480
atgttcgatc tgacactccc cttctgacgt gcggctggaa tgctgacgcg acgcaggtct      540
cccccatcca aaacgccgtg tacctgtgct gcatggccgt tatcgcgggc gcgcgcacct      600
tccaccaggt ccgcgctacc gtgcgggccg gtttcatgcc cgtcatgaag gtcagctggg      660
tcacctcgcc cattgcgctg gcctttgccc agaagttcct ccccgagcac acctgggtgc      720
ctttcttcaa cattgtcggg ttcgtcattg gaacctacgt caacacgcac accaagaaga      780
agcgtcttga ggctctccgc aaggtaaatc aactacgtga cgatcccgcc gacgcgacca      840
gtcgctaacc tagcacgaca gcgctacgac caacgccgtg gacccggtag cgagtacgac      900
aagggcgact accggtaaac gatgtaaata tactgtacct agcttatgac taccgactgg      960
ttagtgtgga cttcccgata tggtcggtta gggcgcgcca at                        1002
<210>23
<211>1503
<212>DNA
<213>合成构建体
<400>23
tgcttaatta accaccatgt ccgagcagcc ctatgatccc tacatcccct ctggcgccaa      60
tggggctggc gccggcgcca gcgctgcgca aaatggcgac cccaggacac gggaaatcga     120
caaagtaagt tgccgaaacg cctcgcggtc aacttttatc gttccacaag gatatgtcgc     180
ccaggttgaa taggatgtga tggctttcca gttttcattt ggacttccat ctgagttcaa     240
ctggacttgg aggccaccgg gtctttttga atcttattaa gcttgtgtct attatggcat     300
ttgtcgcaaa gtatttacta acgctgtgtt tcttctctgt ctagaaaatc caagaaaccg     360
ttgacacaat gcgctccaac atctttaaag tttcagaacg tggtgaacgt ctagattccc     420
tccaggacaa gacggacaat ttggcaacat cagcgcaggg attccgcaga ggtgccaacc     480
gcgtgaggaa gcaaatgtgg tggaaggata tgaagatgcg ctctgccaag ttccaggatg     540
aggccgtcac ctcgatacgg gaggacacaa aggaattggt gcacaaggtt ggaaaccggt     600
tgactggcga tggctatctc gctgtaggtt ttgcgcctgt gtaatcacac cccgaatgcg     660
tgttttgcag tccactgatt gagacaatgc gcgtccgtta tagctctacc tccgccaact     720
gcagtccaac cccctgcgca ctaagatgtt gacctccggt gtcctgtcca gtctgcaaga     780
aatcctggcc tcgtggatcg cccatgatgt cagcaagcac ggtcactact tcagcgcccg     840
cgtccccaaa atggccctct acggaatgtt catcagcgcc ccgctgggcc actttctcat     900
cggaattctg cagcgggtct tcgctggccg gactagcatc aaggccaaga tcctgcaaat     960
tctcgccagc aacttgttgg tatgttcgat ctgacactcc ccttctgacg tgcggctgga    1020
atgctgacgc gacgcaggtc tcccccatcc aaaacgccgt gtacctgtgc tgcatggccg    1080
ttatcgcggg cgcgcgcacc ttccaccagg tccgcgctac cgtgcgggcc ggtttcatgc    1140
ccgtcatgaa ggtcagctgg gtcacctcgc ccattgcgct ggcctttgcc cagaagttcc    1200
tccccgagca cacctgggtg cctttcttca acattgtcgg gttcgtcatt ggaacctacg    1260
tcaacacgca caccaagaag aagcgtcttg aggctctccg caaggtaaat caactacgtg    1320
acgatcccgc cgacgcgacc agtcgctaac ctagcacgac agcgctacga ccaacgccgt    1380
ggacccggta gcgagtacga caagggcgac taccggtaaa cgatgtaaat atactgtacc    1440
tagcttatga ctaccgactg gttagtgtgg acttcccgat atggtcggtt agggcgcgcc    1500
aat                                                                  1503
<210>24
<211>318
<212>PRT
<213>合成构建体
<400>24
Met Ser Glu Gln Pro Tyr Asp Pro Tyr Ile Pro Ser Gly Ala Asn Gly
1               5                   10                  15
Ala Gly Ala Gly Ala Ser Ala Ala Gln Asn Gly Asp Pro Arg Thr Arg
            20                   25                 30
Glu Ile Asp Lys Lys Ile Gln Glu Thr Val Asp Thr Met Arg Ser Asn
        35                  40                  45
Ile Phe Lys Val Ser Glu Arg Gly Glu Arg Leu Asp Ser Leu Gln Asp
    50                  55                  60
Lys Thr Asp Asn Leu Ala Thr Ser Ala Gln Gly Phe Arg Arg Gly Ala
65                  70                  75                  80
Asn Arg Val Arg Lys Gln Met Trp Trp Lys Asp Met Lys Met Arg Ser
                85                  90                  95
Ala Lys Phe Gln Asp Glu Ala Val Thr Ser Ile Arg Glu Asp Thr Lys
            100                 105                 110
Glu Leu Val His Lys Val Gly Asn Arg Leu Thr Gly Asp Gly Tyr Leu
        115                 120                 125
Ala Leu Tyr Leu Arg Gln Leu Gln Ser Asn Pro Leu Arg Thr Lys Met
    130                 135                 140
Leu Thr Ser Gly Val Leu Ser Ser Leu Gln Glu Ile Leu Ala Ser Trp
145                 150                 155                 160
Ile Ala His Asp Val Ser Lys His Gly His Tyr Phe Ser Ala Arg Val
                165                 170                 175
Pro Lys Met Ala Leu Tyr Gly Met Phe Ile Ser Ala Pro Leu Gly His
            180                 185                 190
Phe Leu Ile Gly Ile Leu Gln Arg Val Phe Ala Gly Arg Thr Ser Ile
        195                 200                 205
Lys Ala Lys Ile Leu Gln Ile Leu Ala Ser Asn Leu Leu Val Ser Pro
    210                 215                 220
Ile Gln Asn Ala Val Tyr Leu Cys Cys Met Ala Val Ile Ala Gly Ala
225                 230                 235                 240
Arg Thr Phe His Gln Val Arg Ala Thr Val Arg Ala Gly Phe Met Pro
                245                 250                 255
Val Met Lys Val Ser Trp Val Thr Ser Pro Ile Ala Leu Ala Phe Ala
            260                 265                 270
Gln Lys Phe Leu Pro Glu His Thr Trp Val Pro Phe Phe Asn Ile Val
        275                 280                 285
Gly Phe Val Ile Gly Thr Tyr Val Asn Thr His Thr Lys Lys Lys Arg
    290                 295                 300
Leu Glu Ala Leu Arg Lys Cys Gly Leu Pro Asp Met Val Gly
305                 310                 315
<210>25
<211>720
<212>DNA
<213>合成构建体
<400>25
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac      60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac     120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc     180
ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag     240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc     300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg     360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac     420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac     480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc     540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac     600
tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc    660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa    720
<210>26
<211>239
<212>PRT
<213>合成构建体蛋白质
<400>26
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1               5                   10                  15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
            20                  25                  30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
        35                  40                  45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
    50                  55                  60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65                  70                  75                  80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
                85                  90                  95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
            100                 105                 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
        115                 120                 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
    130                 135                 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145                 150                 155                 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
                165                 170                 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
            180                 185                 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
        195                 200                 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
    210                 215                 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys
225                 230                 235
<210>27
<211>34
<212>DNA
<213>引物
<400>27
gtcctgttaa ttaaccacca tggtgagcaa gggc          34
<210>28
<211>40
<212>DNA
<213>引物
<400>28
ctcatcctgg aacttggcag acttgtacag ctcgtccatg    40
<210>29
<211>758
<212>DNA
<213>合成构建体
<400>29
gtcctgttaa ttaaccacca tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc      60
catcctggtc gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg     120
cgagggcgat gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct     180
gcccgtgccc tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg     240
ctaccccgac cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt     300
ccaggagcgc accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa     360
gttcgagggc gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga     420
cggcaacatc ctggggcaca agctggagta caactacaac agccacaacg tctatatcat     480
ggccgacaag cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga     540
cggcagcgtg cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt    600
gctgctgccc gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga    660
gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat    720
ggacgagctg tacaagtctg ccaagttcca ggatgagg                            758
<210>30
<211>41
<212>DNA
<213>引物
<400>30
catggacgag ctgtacaagt ctgccaagtt ccaggatgag g 41
<210>31
<211>38
<212>DNA
<213>引物
<400>31
acttcaggcg cgccctaacc gaccatatcg ggaagtcc    38
<210>32
<211>1004
<212>DNA
<213>合成构建体
<400>32
catggacgag ctgtacaagt ctgccaagtt ccaggatgag gccgtcacct cgatacggga     60
ggacacaaag gaattggtgc acaaggttgg aaaccggttg actggcgatg gctatctcgc    120
tgtaggtttt gcgcctgtgt aatcacaccc cgaatgcgtg ttttgcagtc cactgattga    180
gacaatgcgc gtccgttata gctctacctc cgccaactgc agtccaaccc cctgcgcact    240
aagatgttga cctccggtgt cctgtccagt ctgcaagaaa tcctggcctc gtggatcgcc    300
catgatgtca gcaagcacgg tcactacttc agcgcccgcg tccccaaaat ggccctctac    360
ggaatgttca tcagcgcccc gctgggccac tttctcatcg gaattctgca gcgggtcttc    420
gctggccgga ctagcatcaa ggccaagatc ctgcaaattc tcgccagcaa cttgttggta    480
tgttcgatct gacactcccc ttctgacgtg cggctggaat gctgacgcga cgcaggtctc    540
ccccatccaa aacgccgtgt acctgtgctg catggccgtt atcgcgggcg cgcgcacctt    600
ccaccaggtc cgcgctaccg tgcgggccgg tttcatgccc gtcatgaagg tcagctgggt    660
cacctcgccc attgcgctgg cctttgccca gaagttcctc cccgagcaca cctgggtgcc    720
tttcttcaac attgtcgggt tcgtcattgg aacctacgtc aacacgcaca ccaagaagaa     780
gcgtcttgag gctctccgca aggtaaatca actacgtgac gatcccgccg acgcgaccag     840
tcgctaacct agcacgacag cgctacgacc aacgccgtgg acccggtagc gagtacgaca     900
agggcgacta ccggtaaacg atgtaaatat actgtaccta gcttatgact accgactggt     960
tagtgtggac ttcccgatat ggtcggttag ggcgcgcctg aagt                     1004
<210>33
<211>1721
<212>DNA
<213>合成产物
<400>33
gtcctgttaa ttaaccacca tggtgagcaa gggcgaggag ctgttcaccg gggtggtgcc      60
catcctggtc gagctggacg gcgacgtaaa cggccacaag ttcagcgtgt ccggcgaggg     120
cgagggcgat gccacctacg gcaagctgac cctgaagttc atctgcacca ccggcaagct     180
gcccgtgccc tggcccaccc tcgtgaccac cctgacctac ggcgtgcagt gcttcagccg     240
ctaccccgac cacatgaagc agcacgactt cttcaagtcc gccatgcccg aaggctacgt     300
ccaggagcgc accatcttct tcaaggacga cggcaactac aagacccgcg ccgaggtgaa     360
gttcgagggc gacaccctgg tgaaccgcat cgagctgaag ggcatcgact tcaaggagga     420
cggcaacatc ctggggcaca agctggagta caactacaac agccacaacg tctatatcat     480
ggccgacaag cagaagaacg gcatcaaggt gaacttcaag atccgccaca acatcgagga     540
cggcagcgtg cagctcgccg accactacca gcagaacacc cccatcggcg acggccccgt     600
gctgctgccc gacaaccact acctgagcac ccagtccgcc ctgagcaaag accccaacga     660
gaagcgcgat cacatggtcc tgctggagtt cgtgaccgcc gccgggatca ctctcggcat     720
ggacgagctg tacaagtctg ccaagttcca ggatgaggcc gtcacctcga tacgggagga     780
cacaaaggaa ttggtgcaca aggttggaaa ccggttgact ggcgatggct atctcgctgt     840
aggttttgcg cctgtgtaat cacaccccga atgcgtgttt tgcagtccac tgattgagac     900
aatgcgcgtc cgttatagct ctacctccgc caactgcagt ccaaccccct gcgcactaag     960
atgttgacct ccggtgtcct gtccagtctg caagaaatcc tggcctcgtg gatcgcccat    1020
gatgtcagca agcacggtca ctacttcagc gcccgcgtcc ccaaaatggc cctctacgga    1080
atgttcatca gcgccccgct gggccacttt ctcatcggaa ttctgcagcg ggtcttcgct    1140
ggccggacta gcatcaaggc caagatcctg caaattctcg ccagcaactt gttggtatgt    1200
tcgatctgac actccccttc tgacgtgcgg ctggaatgct gacgcgacgc aggtctcccc    1260
catccaaaac gccgtgtacc tgtgctgcat ggccgttatc gcgggcgcgc gcaccttcca    1320
ccaggtccgc gctaccgtgc gggccggttt catgcccgtc atgaaggtca gctgggtcac    1380
ctcgcccatt gcgctggcct ttgcccagaa gttcctcccc gagcacacct gggtgccttt    1440
cttcaacatt gtcgggttcg tcattggaac ctacgtcaac acgcacacca agaagaagcg    1500
tctcgaggct ctccgcaagg taaatcaact acgtgacgat cccgccgacg cgaccagtcg    1560
ctaacctagc acgacagcgc tacgaccaac gccgtggacc cggtagcgag tacgacaagg    1620
gcgactaccg gtaaacgatt taaatatact gtacctagct tatgactacc gactggttag    1680
tgtggacttc ccgatatggt cggttagggc gcgcctgaag t                        1721
<210>34
<211>462
<212>PRT
<213>合成构建体
<400>34
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
1               5                   10                  15
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly
            20                  25                  30
Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile
        35                  40                  45
Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
    50                  55                  60
Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys
65                  70                  75                  80
Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
                85                  90                  95
Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu
            100                 105                 110
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
        115                 120                 125
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
    130                 135                 140
Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn
145                 150                 155                 160
Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser
                165                 170                 175
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
            180                 185                 190
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu
        195                 200                 205
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
    210                 215                 220
Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Ser
225                 230                 235                 240
Ala Lys Phe Gln Asp Glu Ala Val Thr Ser Ile Arg Glu Asp Thr Lys
                245                 250                 255
Glu Leu Val His Lys Val Gly Asn Arg Leu Thr Gly Asp Gly Tyr Leu
            260                 265                 270
Ala Leu Tyr Leu Arg Gin Leu Gln Ser Asn Pro Leu Arg Thr Lys Met
        275                 280                 285
Leu Thr Ser Gly Val Leu Ser Ser Leu Gln Glu Ile Leu Ala Ser Trp
    290                 295                 300
Ile Ala His Asp Val Ser Lys His Gly His Tyr Phe Ser Ala Arg Val
305                 310                 315                 320
Pro Lys Met Ala Leu Tyr Gly Met Phe Ile Ser Ala Pro Leu Gly His
                325                 330                 335
Phe Leu Ile Gly Ile Leu Gln Arg Val Phe Ala Gly Arg Thr Ser Ile
            340                 345                 350
Lys Ala Lys Ile Leu Gln Ile Leu Ala Ser Asn Leu Leu Val Ser Pro
        355                 360                 365
Ile Gln Asn Ala Val Tyr Leu Cys Cys Met Ala Val Ile Ala Gly Ala
    370                 375                 380
Arg Thr Phe His Gln Val Arg Ala Thr Val Arg Ala Gly Phe Met Pro
385                 390                 395                 400
Val Met Lys Val Ser Trp Val Thr Ser Pro Ile Ala Leu Ala Phe Ala
                405                 410                 415
Gln Lys Phe Leu Pro Glu His Thr Trp Val Pro Phe Phe Asn Ile Val
            420                 425                 430
Gly Phe Val Ile Gly Thr Tyr Val Asn Thr His Thr Lys Lys Lys Arg
        435                 440                 445
Leu Glu Ala Leu Arg Lys Cys Gly Leu Pro Asp Met Val Gly
    450                 455                 460
<210>35
<211>45
<212>DNA
<213>引物
<400>35
gtcctgttaa ttaaccttca ccatgtccga gcagccctat gatcc 45
<210>36
<211>549
<212>DNA
<213>合成构建体
<400>36
gtcctgttaa ttaaccttca ccatgtccga gcagccctat gatccctaca tcccctctgg      60
cgccaatggg gctggcgccg gcgccagcgc tgcgcaaaat ggcgacccca ggacacggga     120
aatcgacaaa gtaagttgcc gaaacgcctc gcggtcaact tttatcgttc cacaaggata     180
tgtcgcccag gttgaatagg atgtgatggc tttccagttt tcatttggac ttccatctga     240
gttcaactgg acttggaggc caccgggtct ttttgaatct tattaagctt gtgtctatta     300
tggcatttgt cgcaaagtat ttactaacgc tgtgtttctt ctctgtctag aaaatccaag     360
aaaccgttga cacaatgcgc tccaacatct ttaaagtttc agaacgtggt gaacgtctag     420
attccctcca ggacaagacg gacaatttgg caacatcagc gcagggattc cgcagaggtg    480
ccaaccgcgt gaggaagcaa atgtggtgga aggatatgaa gatgcgctct gccaagttcc    540
aggatgagg                                                            549
<210>37
<211>39
<212>DNA
<213>引物
<400>37
acttcaggcg cgcctttaac cgaccatatc gggaagtcc    39
<210>38
<211>1006
<212>DNA
<213>合成构建体
<400>38
ggaaggatat gaagatgcgc tctgccaagt tccaggatga ggccgtcacc tcgatacggg      60
aggacacaaa ggaattggtg cacaaggttg gaaaccggtt gactggcgat ggctatctcg     120
ctgtaggttt tgcgcctgtg taatcacacc ccgaatgcgt gttttgcagt ccactgattg     180
agacaatgcg cgtccgttat agctctacct ccgccaactg cagtccaacc ccctgcgcac     240
taagatgttg acctccggtg tcctgtccag tctgcaagaa atcctggcct cgtggatcgc     300
ccatgatgtc agcaagcacg gtcactactt cagcgcccgc gtccccaaaa tggccctcta     360
cggaatgttc atcagcgccc cgctgggcca ctttctcatc ggaattctgc agcgggtctt     420
cgctggccgg actagcatca aggccaagat cctgcaaatt ctcgccagca acttgttggt     480
atgttcgatc tgacactccc cttctgacgt gcggctggaa tgctgacgcg acgcaggtct     540
cccccatcca aaacgccgtg tacctgtgct gcatggccgt tatcgcgggc gcgcgcacct     600
tccaccaggt ccgcgctacc gtgcgggccg gtttcatgcc cgtcatgaag gtcagctggg     660
tcacctcgcc cattgcgctg gcctttgccc agaagttcct ccccgagcac acctgggtgc     720
ctttcttcaa cattgtcggg ttcgtcattg gaacctacgt caacacgcac accaagaaga     780
agcgtcttga ggctctccgc aaggtaaatc aactacgtga cgatcccgcc gacgcgacca     840
gtcgctaacc tagcacgaca gcgctacgac caacgccgtg gacccggtag cgagtacgac     900
aagggcgact accggtaaac gatgtaaata tactgtacct agcttatgac taccgactgg     960
ttagtgtgga cttcccgata tggtcggtta aaggcgcgcc tgaagt                    1006
<210>39
<211>1513
<212>DNA
<213>合成构建体
<400>39
gtcctgttaa ttaaccttca ccatgtccga gcagccctat gatccctaca tcccctctgg      60
cgccaatggg gctggcgccg gcgccagcgc tgcgcaaaat ggcgacccca ggacacggga     120
aatcgacaaa gtaagttgcc gaaacgcctc gcggtcaact tttatcgttc cacaaggata     180
tgtcgcccag gttgaatagg atgtgatggc tttccagttt tcatttggac ttccatctga     240
gttcaactgg acttggaggc caccgggtct ttttgaatct tattaagctt gtgtctatta     300
tggcatttgt cgcaaagtat ttactaacgc tgtgtttctt ctctgtctag aaaatccaag     360
aaaccgttga cacaatgcgc tccaacatct ttaaagtttc agaacgtggt gaacgtctag     420
attccctcca ggacaagacg gacaatttgg caacatcagc gcagggattc cgcagaggtg     480
ccaaccgcgt gaggaagcaa atgtggtgga aggatatgaa gatgcgctct gccaagttcc     540
aggatgaggc cgtcacctcg atacgggagg acacaaagga attggtgcac aaggttggaa     600
accggttgac tggcgatggc tatctcgctg taggttttgc gcctgtgtaa tcacaccccg     660
aatgcgtgtt ttgcagtcca ctgattgaga caatgcgcgt ccgttatagc tctacctccg     720
ccaactgcag tccaaccccc tgcgcactaa gatgttgacc tccggtgtcc tgtccagtct     780
gcaagaaatc ctggcctcgt ggatcgccca tgatgtcagc aagcacggtc actacttcag     840
cgcccgcgtc cccaaaatgg ccctctacgg aatgttcatc agcgccccgc tgggccactt     900
tctcatcgga attctgcagc gggtcttcgc tggccggact agcatcaagg ccaagatcct     960
gcaaattctc gccagcaact tgttggtatg ttcgatctga cactcccctt ctgacgtgcg    1020
gctggaatgc tgacgcgacg caggtctccc ccatccaaaa cgccgtgtac ctgtgctgca    1080
tggccgttat cgcgggcgcg cgcaccttcc accaggtccg cgctaccgtg cgggccggtt    1140
tcatgcccgt catgaaggtc agctgggtca cctcgcccat tgcgctggcc tttgcccaga    1200
agttcctccc cgagcacacc tgggtgcctt tcttcaacat tgtcgggttc gtcattggaa    1260
cctacgtcaa cacgcacacc aagaagaagc gtcttgaggc tctccgcaag gtaaatcaac    1320
tacgtgacga tcccgccgac gcgaccagtc gctaacctag cacgacagcg ctacgaccaa    1380
cgccgtggac ccggtagcga gtacgacaag ggcgactacc ggtaaacgat gtaaatatac    1440
tgtacctagc ttatgactac cgactggtta gtgtggactt cccgatatgg tcggttaaag    1500
gcgcgcctga agt                                            1513
<210>40
<211>318
<212>PRT
<213>合成构建体
<400>40
Met Ser Glu Gln Pro Tyr Asp Pro Tyr Ile Pro Ser Gly Ala Asn Gly
1               5                   10                  15
Ala Gly Ala Gly Ala Ser Ala Ala Gln Asn Gly Asp Pro Arg Thr Arg
            20                  25                  30
Glu Ile Asp Lys Lys Ile Gln Glu Thr Val Asp Thr Met Arg Ser Asn
        35                  40                  45
Ile Phe Lys Val Ser Glu Arg Gly Glu Arg Leu Asp Ser Leu Gln Asp
    50                  55                  60
Lys Thr Asp Asn Leu Ala Thr Ser Ala Gln Gly Phe Arg Arg Gly Ala
65                  70                  75                  80
Asn Arg Val Arg Lys Gln Met Trp Trp Lys Asp Met Lys Met Arg Ser
                85                  90                  95
Ala Lys Phe Gln Asp Glu Ala Val Thr Ser Ile Arg Glu Asp Thr Lys
            100                 105                 110
Glu Leu Val His Lys Val Gly Asn Arg Leu Thr Gly Asp Gly Tyr Leu
        115                 120                 125
Ala Leu Tyr Leu Arg Gln Leu Gln Ser Asn Pro Leu Arg Thr Lys Met
    130                 135                 140
Leu Thr Ser Gly Val Leu Ser Ser Leu Gln Glu Ile Leu Ala Ser Trp
145                 150                 155                 160
Ile Ala His Asp Val Ser Lys His Gly His Tyr Phe Ser Ala Arg Val
                165                 170                 175
Pro Lys Met Ala Leu Tyr Gly Met Phe Ile Ser Ala Pro Leu Gly His
            180                 185                 190
Phe Leu Ile Gly Ile Leu Gln Arg Val Phe Ala Gly Arg Thr Ser Ile
        195                 200                 205
Lys Ala Lys Ile Leu Gln Ile Leu Ala Ser Asn Leu Leu Val Ser Pro
    210                 215                 220
Ile Gln Asn Ala Val Tyr Leu Cys Cys Met Ala Val Ile Ala Gly Ala
225                 230                 235                 240
Arg Thr Phe His Gln Val Arg Ala Thr Val Arg Ala Gly Phe Met Pro
                245                 250                 255
Val Met Lys Val Ser Trp Val Thr Ser Pro Ile Ala Leu Ala Phe Ala
            260                 265                 270
Gln Lys Phe Leu Pro Glu His Thr Trp Val Pro Phe Phe Asn Ile Val
        275                 280                 285
Gly Phe Val Ile Gly Thr Tyr Val Asn Thr His Thr Lys Lys Lys Arg
    290                 295                 300
Leu Glu Ala Leu Arg Lys Cys Gly Leu Pro Asp Met Val Gly
305                 310                 315
<210>41
<211>1980
<212>DNA
<213>Aspergillus niger
<400>41
atggccctca catcctggga acaaaccgca gcggccaaac gccaatccgt cctcaacgcc      60
atccccgaga aatggcgcat caagggtcct atccccgcac cgtcggagca gcgcgacgta     120
acaggcccct acatccagca gttcctatcc ccacgcgagg ttgaaatcac cgaaacagac     180
gccgtaggga tcacagagcg aactacaacg ggccagtgga cagctgtgga ggtgaccgag     240
gcgttctgcc atcgcgcagc attggcgcat caactcgtac attccccatc cacaaggagt     300
gctagtctgc gctttactaa tcgagaaaaa ggtaaactgc ttgcatgaaa tcttcttcga     360
tgccgcgctt gaaaccgccc gcattctaga cgaccactac accaagaccg gcaagccact     420
cggtcccctt cacggcctcc ctgtcagtct gaaggatcaa ttccacgtca agggcgtaga     480
aacaaccatg ggttacgtcg gctggataaa caccttccaa ggcaagacca atgacccgcg     540
ctatcttaca cacgaaagcg aactcgttaa agaactccgc gccgcgggag ccgtcctcta     600
ctgcaagact agcgtcccca tgacgttgat gtcaggtgaa accatgaaca atatcataac     660
ttacacacat aacccgaaga acaggcttct cagttctgga ggtagttccg ggggcgaagg     720
agcactgatc gcgttgcggg gatcaccagc cgggtttggt acggatatcg ggggtagtat     780
ccgtgttcct gcgtcgttca atggactgta tgggatacgg ccgtctgtgg ggagaatgcc     840
gtacgagggg gcggccaatt cgggcgatgg acagaatact gtgttgtcgg ttgtggggcc     900
gttgtctcct tcggcgagag ggttgatatt gctgttcaag acggtgttgg gggcaatgcc     960
gtggttggga gatcctggtg tgttggagat tccctggagg gaggaaatcg tagaggagac    1020
gagaaaatta gtgcagggaa agccagaggg gctagctttt ggaatattct acgatgatgg    1080
tcaggtaaag ccgcagccac cggtcgagag agcgatgcgg attgctgcag agacgatcaa    1140
gcgtctagga cataaggtga gtgccctcct tcttcttgcg acactgctaa cattcatccc    1200
agctcatcaa ttgggaaccc ccctctcacc taacagccgc ctccctcgca gtaagtcccc    1260
catccaaccc actacaccac aaccccctaa caataaacca acccccagaa ccgcgcctac    1320
aacatggacg gcggcgccga cgtactccaa aacttcgccc tgtccaacga agccatccac    1380
acctccgtag taatcgacgc atcaggatcc ccccaaaaga ccgcactaga gatcgccgcg    1440
ctaaacgtcg agaagcgcga ataccagaaa caataccttg actactggaa cagcacggcg    1500
caattgacag ggactggacg acccgtcgac gcggtcattt gtccagtggc gccgcatgcg    1560
gcgtgcattc cggggaagta tgcgacgatc gggtatacgg cgtttattaa tgtgttggat    1620
tatacgagtg cggttgtgcc ggttacgagt gctgatagga gggtggatgt tgtagggaag    1680
gaaggaaggg agtattttgg ggagttggat aggaagaccg agggggagtg taagttcttc    1740
cctttctttt cttctttctt ttcattgagc tatccaattt ggttggaggt cttgtgtgtt    1800
tgtttgttcg gagagtggtg atggggttat gtgctgactg gatgtttcta tctagacgat    1860
gcggatgtgt ttgatggggc gccggctggg attcagctct ttggaagacg gcttcaggag    1920
gagaagattc tggtactggc tgagtatctt ggtgaggaat tcaagaaggc tagtgcttga    1980
<210>42
<211>1695
<212>DNA
<213>Aspergillus niger
<400>42
atggccctca catcctggga acaaaccgca gcggccaaac gccaatccgt cctcaacgcc      60
atccccgaga aatggcgcat caagggtcct atccccgcac cgtcggagca gcgcgacgta     120
acaggcccct acatccagca gttcctatcc ccacgcgagg ttgaaatcac cgaaacagac     180
gccgtaggga tcacagagcg aactacaacg ggccagtgga cagctgtgga ggtgaccgag     240
gcgttctgcc atcgcgcagc attggcgcat caactcgtaa actgcttgca tgaaatcttc     300
ttcgatgccg cgcttgaaac cgcccgcatt ctagacgacc actacaccaa gaccggcaag     360
ccactcggtc cccttcacgg cctccctgtc agtctgaagg atcaattcca cgtcaagggc     420
gtagaaacaa ccatgggtta cgtcggctgg ataaacacct tccaaggcaa gaccaatgac     480
ccgcgctatc ttacacacga aagcgaactc gttaaagaac tccgcgccgc gggagccgtc     540
ctctactgca agactagcgt ccccatgacg ttgatgtcag gtgaaaccat gaacaatatc     600
ataacttaca cacataaccc gaagaacagg cttctcagtt ctggaggtag ttccgggggc     660
gaaggagcac tgatcgcgtt gcggggatca ccagccgggt ttggtacgga tatcgggggt     720
agtatccgtg ttcctgcgtc gttcaatgga ctgtatggga tacggccgtc tgtggggaga     780
atgccgtacg agggggcggc caattcgggc gatggacaga atactgtgtt gtcggttgtg     840
gggccgttgt ctccttcggc gagagggttg atattgctgt tcaagacggt gttgggggca     900
atgccgtggt tgggagatcc tggtgtgttg gagattccct ggagggagga aatcgtagag     960
gagacgagaa aattagtgca gggaaagcca gaggggctag cttttggaat attctacgat    1020
gatggtcagg taaagccgca gccaccggtc gagagagcga tgcggattgc tgcagagacg    1080
atcaagcgtc taggacataa gctcatcaat tgggaacccc cctctcacct aacagccgcc    1140
tccctcgcaa accgcgccta caacatggac ggcggcgccg acgtactcca aaacttcgcc    1200
ctgtccaacg aagccatcca cacctccgta gtaatcgacg catcaggatc cccccaaaag    1260
accgcactag agatcgccgc gctaaacgtc gagaagcgcg aataccagaa acaatacctt    1320
gactactgga acagcacggc gcaattgaca gggactggac gacccgtcga cgcggtcatt    1380
tgtccagtgg cgccgcatgc ggcgtgcatt ccggggaagt atgcgacgat cgggtatacg    1440
gcgtttatta atgtgttgga ttatacgagt gcggttgtgc cggttacgag tgctgatagg    1500
agggtggatg ttgtagggaa ggaaggaagg gagtattttg gggagttgga taggaagacc    1560
gagggggagt acgatgcgga tgtgtttgat ggggcgccgg ctgggattca gctctttgga    1620
agacggcttc aggaggagaa gattctggta ctggctgagt atcttggtga ggaattcaag    1680
aaggctagtg cttga                                                     1695
<210>43
<211>564
<212>PRT
<213>Aspergillus niger
<400>43
Met Ala Leu Thr Ser Trp Glu Gln Thr Ala Ala Ala Lys Arg Gln Ser
1               5                   10                  15
Val Leu Asn Ala Ile Pro Glu Lys Trp Arg Ile Lys Gly Pro Ile Pro
            20                  25                  30
Ala Pro Ser Glu Gln Arg Asp Val Thr Gly Pro Tyr Ile Gln Gln Phe
        35                  40                  45
Leu Ser Pro Arg Glu Val Glu Ile Thr Glu Thr Asp Ala Val Gly Ile
    50                  55                  60
Thr Glu Arg Thr Thr Thr Gly Gln Trp Thr Ala Val Glu Val Thr Glu
65                  70                  75                  80
Ala Phe Cys His Arg Ala Ala Leu Ala His Gln Leu Val Asn Cys Leu
                 85                  90                  95
His Glu Ile Phe Phe Asp Ala Ala Leu Glu Thr Ala Arg Ile Leu Asp
            100                 105                 110
Asp His Tyr Thr Lys Thr Gly Lys Pro Leu Gly Pro Leu His Gly Leu
        115                 120                 125
Pro Val Ser Leu Lys Asp Gln Phe His Val Lys Gly Val Glu Thr Thr
    130                 135                 140
Met Gly Tyr Val Gly Trp Ile Asn Thr Phe Gln Gly Lys Thr Asn Asp
145                 150                 155                 160
Pro Arg Tyr Leu Thr His Glu Ser Glu Leu Val Lys Glu Leu Arg Ala
                165                 170                 175
Ala Gly Ala Val Leu Tyr Cys Lys Thr Ser Val Pro Met Thr Leu Met
            180                 185                 190
Ser Gly Glu Thr Met Asn Asn Ile Ile Thr Tyr Thr His Asn Pro Lys
        195                 200                 205
Asn Arg Leu Leu Ser Ser Gly Gly Ser Ser Gly Gly Glu Gly Ala Leu
    210                 215                 220
Ile Ala Leu Arg Gly Ser Pro Ala Gly Phe Gly Thr Asp Ile Gly Gly
225                 230                 235                 240
Ser Ile Arg Val Pro Ala Ser Phe Asn Gly Leu Tyr Gly Ile Arg Pro
                245                 250                 255
Ser Val Gly Arg Met Pro Tyr Glu Gly Ala Ala Asn Ser Gly Asp Gly
            260                 265                 270
Gln Asn Thr Val Leu Ser Val Val Gly Pro Leu Ser Pro Ser Ala Arg
        275                 280                 285
Gly Leu Ile Leu Leu Phe Lys Thr Val Leu Gly Ala Met Pro Trp Leu
    290                 295                 300
Gly Asp Pro Gly Val Leu Glu Ile Pro Trp Arg Glu Glu Ile Val Glu
305                 310                 315                 320
Glu Thr Arg Lys Leu Val Gln Gly Lys Pro Glu Gly Leu Ala Phe Gly
                325                 330                 335
Ile Phe Tyr Asp Asp Gly Gln Val Lys Pro Gln Pro Pro Val Glu Arg
            340                 345                 350
Ala Met Arg Ile Ala Ala Glu Thr Ile Lys Arg Leu Gly His Lys Leu
        355                 360                 365
Ile Asn Trp Glu Pro Pro Ser His Leu Thr Ala Ala Ser Leu Ala Asn
    370                 375                 380
Arg Ala Tyr Asn Met Asp Gly Gly Ala Asp Val Leu Gln Asn Phe Ala
385                 390                 395                 400
Leu Ser Asn Glu Ala Ile His Thr Ser Val Val Ile Asp Ala Ser Gly
                405                 410                 415
Ser Pro Gln Lys Thr Ala Leu Glu Ile Ala Ala Leu Asn Val Glu Lys
            420                 425                 430
Arg Glu Tyr Gln Lys Gln Tyr Leu Asp Tyr Trp Asn Ser Thr Ala Gln
        435                 440                 445
Leu Thr Gly Thr Gly Arg Pro Val Asp Ala Val Ile Cys Pro Val Ala
    450                 455                 460
Pro His Ala Ala Cys Ile Pro Gly Lys Tyr Ala Thr Ile Gly Tyr Thr
465                 470                 475                 480
Ala Phe Ile Asn Val Leu Asp Tyr Thr Ser Ala Val Val Pro Val Thr
                485                 490                 495
Ser Ala Asp Arg Arg Val Asp Val Val Gly Lys Glu Gly Arg Glu Tyr
            500                 505                 510
Phe Gly Glu Leu Asp Arg Lys Thr Glu Gly Glu Tyr Asp Ala Asp Val
        515                 520                 525
Phe Asp Gly Ala Pro Ala Gly Ile Gln Leu Phe Gly Arg Arg Leu Gln
    530                 535                 540
Glu Glu Lys Ile Leu Val Leu Ala Glu Tyr Leu Gly Glu Glu Phe Lys
545                 550                 555                 560
Lys Ala Ser Ala
<210>44
<211>42
<212>DNA
<213>引物
<400>44
gtcctgttaa ttaaccttca ccatggccct cacatcctgg ga 42
<210>45
<211>41
<212>DNA
<213>引物
<400>45
acttcaggcg cgcctttaag cactagcctt cttgaattcc t  41
<210>46
<211>2017
<212>DNA
<213>合成构建体
<400>46
gtcctgttaa ttaaccttca ccatggccct cacatcctgg gaacaaaccg cagcggccaa      60
acgccaatcc gtcctcaacg ccatccccga gaaatggcgc atcaagggtc ctatccccgc     120
accgtcggag cagcgcgacg taacaggccc ctacatccag cagttcctat ccccacgcga     180
ggttgaaatc accgaaacag acgccgtagg gatcacagag cgaactacaa cgggccagtg     240
gacagctgtg gaggtgaccg aggcgttctg ccatcgcgca gcattggcgc atcaactcgt     300
acattcccca tccacaagga gtgctagtct gcgctttact aatcgagaaa aaggtaaact     360
gcttgcatga aatcttcttc gatgccgcgc ttgaaaccgc ccgcattcta gacgaccact     420
acaccaagac cggcaagcca ctcggtcccc ttcacggcct ccctgtcagt ctgaaggatc     480
aattccacgt caagggcgta gaaacaacca tgggttacgt cggctggata aacaccttcc     540
aaggcaagac caatgacccg cgctatctta cacacgaaag cgaactcgtt aaagaactcc     600
gcgccgcggg agccgtcctc tactgcaaga ctagcgtccc catgacgttg atgtcaggtg     660
aaaccatgaa caatatcata acttacacac ataacccgaa gaacaggctt ctcagttctg     720
gaggtagttc cgggggcgaa ggagcactga tcgcgttgcg gggatcacca gccgggtttg     780
gtacggatat cgggggtagt atccgtgttc ctgcgtcgtt caatggactg tatgggatac     840
ggccgtctgt ggggagaatg ccgtacgagg gggcggccaa ttcgggcgat ggacagaata     900
ctgtgttgtc ggttgtgggg ccgttgtctc cttcggcgag agggttgata ttgctgttca     960
agacggtgtt gggggcaatg ccgtggttgg gagatcctgg tgtgttggag attccctgga    1020
gggaggaaat cgtagaggag acgagaaaat tagtgcaggg aaagccagag gggctagctt    1080
ttggaatatt ctacgatgat ggtcaggtaa agccgcagcc accggtcgag agagcgatgc    1140
ggattgctgc agagacgatc aagcgtctag gacataaggt gagtgccctc cttcttcttg    1200
cgacactgct aacattcatc ccagctcatc aattgggaac ccccctctca cctaacagcc    1260
gcctccctcg cagtaagtcc cccatccaac ccactacacc acaaccccct aacaataaac    1320
caacccccag aaccgcgcct acaacatgga cggcggcgcc gacgtactcc aaaacttcgc    1380
cctgtccaac gaagccatcc acacctccgt agtaatcgac gcatcaggat ccccccaaaa    1440
gaccgcacta gagatcgccg cgctaaacgt cgagaagcgc gaataccaga aacaatacct    1500
tgactactgg aacagcacgg cgcaattgac agggactgga cgacccgtcg acgcggtcat    1560
ttgtccagtg gcgccgcatg cggcgtgcat tccggggaag tatgcgacga tcgggtatac    1620
ggcgtttatt aatgtgttgg attatacgag tgcggttgtg ccggttacga gtgctgatag    1680
gagggtggat gttgtaggga aggaaggaag ggagtatttt ggggagttgg ataggaagac    1740
cgagggggag tgtaagttct tccctttctt ttcttctttc ttttcattga gctatccaat    1800
ttggttggag gtcttgtgtg tttgtttgtt cggagagtgg tgatggggtt atgtgctgac    1860
tggatgtttc tatctagacg atgcggatgt gtttgatggg gcgccggctg ggattcagct    1920
ctttggaaga cggcttcagg aggagaagat tctggtactg gctgagtatc ttggtgagga    1980
attcaagaag gctagtgctt aaaggcgcgc ctgaagt                             2017
<210>47
<211>50
<212>DNA
<213>引物
<400>47
acttcaggcg cgcctttaga gcttggaagc actagccttc ttgaattcct    50
<210>48
<211>2026
<212>DNA
<213>合成构建体
<400>48
gtcctgttaa ttaaccttca ccatggccct cacatcctgg gaacaaaccg cagcggccaa      60
acgccaatcc gtcctcaacg ccatccccga gaaatggcgc atcaagggtc ctatccccgc     120
accgtcggag cagcgcgacg taacaggccc ctacatccag cagttcctat ccccacgcga     180
ggttgaaatc accgaaacag acgccgtagg gatcacagag cgaactacaa cgggccagtg     240
gacagctgtg gaggtgaccg aggcgttctg ccatcgcgca gcattggcgc atcaactcgt     300
acattcccca tccacaagga gtgctagtct gcgctttact aatcgagaaa aaggtaaact     360
gcttgcatga aatcttcttc gatgccgcgc ttgaaaccgc ccgcattcta gacgaccact     420
acaccaagac cggcaagcca ctcggtcccc ttcacggcct ccctgtcagt ctgaaggatc     480
aattccacgt caagggcgta gaaacaacca tgggttacgt cggctggata aacaccttcc     540
aaggcaagac caatgacccg cgctatctta cacacgaaag cgaactcgtt aaagaactcc     600
gcgccgcggg agccgtcctc tactgcaaga ctagcgtccc catgacgttg atgtcaggtg     660
aaaccatgaa caatatcata acttacacac ataacccgaa gaacaggctt ctcagttctg     720
gaggtagttc cgggggcgaa ggagcactga tcgcgttgcg gggatcacca gccgggtttg     780
gtacggatat cgggggtagt atccgtgttc ctgcgtcgtt caatggactg tatgggatac     840
ggccgtctgt ggggagaatg ccgtacgagg gggcggccaa ttcgggcgat ggacagaata     900
ctgtgttgtc ggttgtgggg ccgttgtctc cttcggcgag agggttgata ttgctgttca     960
agacggtgtt gggggcaatg ccgtggttgg gagatcctgg tgtgttggag attccctgga    1020
gggaggaaat cgtagaggag acgagaaaat tagtgcaggg aaagccagag gggctagctt    1080
ttggaatatt ctacgatgat ggtcaggtaa agccgcagcc accggtcgag agagcgatgc    1140
ggattgctgc agagacgatc aagcgtctag gacataaggt gagtgccctc cttcttcttg    1200
cgacactgct aacattcatc ccagctcatc aattgggaac ccccctctca cctaacagcc    1260
gcctccctcg cagtaagtcc cccatccaac ccactacacc acaaccccct aacaataaac    1320
caacccccag aaccgcgcct acaacatgga cggcggcgcc gacgtactcc aaaacttcgc    1380
cctgtccaac gaagccatcc acacctccgt agtaatcgac gcatcaggat ccccccaaaa    1440
gaccgcacta gagatcgccg cgctaaacgt cgagaagcgc gaataccaga aacaatacct    1500
tgactactgg aacagcacgg cgcaattgac agggactgga cgacccgtcg acgcggtcat    1560
ttgtccagtg gcgccgcatg cggcgtgcat tccggggaag tatgcgacga tcgggtatac    1620
ggcgtttatt aatgtgttgg attatacgag tgcggttgtg ccggttacga gtgctgatag    1680
gagggtggat gttgtaggga aggaaggaag ggagtatttt ggggagttgg ataggaagac    1740
cgagggggag tgtaagttct tccctttctt ttcttctttc ttttcattga gctatccaat    1800
ttggttggag gtcttgtgtg tttgtttgtt cggagagtgg tgatggggtt atgtgctgac    1860
tggatgtttc tatctagacg atgcggatgt gtttgatggg gcgccggctg ggattcagct    1920
ctttggaaga cggcttcagg aggagaagat tctggtactg gctgagtatc ttggtgagga    1980
attcaagaag gctagtgctt ccaagctcta aaggcgcgcc tgaagt                   2026
<210>49
<211>567
<212>PRT
<213>合成构建体
<400>49
Met Ala Leu Thr Ser Trp Glu Gln Thr Ala Ala Ala Lys Arg Gln Ser
1               5                   10                  15
Val Leu Asn Ala Ile Pro Glu Lys Trp Arg Ile Lys Gly Pro Ile Pro
            20                  25                  30
Ala Pro Ser Glu Gln Arg Asp Val Thr Gly Pro Tyr Ile Gln Gln Phe
        35                  40                  45
Leu Ser Pro Arg Glu Val Glu Ile Thr Glu Thr Asp Ala Val Gly Ile
    50                  55                  60
Thr Glu Arg Thr Thr Thr Gly Gln Trp Thr Ala Val Glu Val Thr Glu
65                  70                  75                  80
Ala Phe Cys His Arg Ala Ala Leu Ala His Gln Leu Val Asn Cys Leu
                85                  90                  95
His Glu Ile Phe Phe Asp Ala Ala Leu Glu Thr Ala Arg Ile Leu Asp
            100                 105                 110
Asp His Tyr Thr Lys Thr Gly Lys Pro Leu Gly Pro Leu His Gly Leu
        115                 120                 125
Pro Val Ser Leu Lys Asp Gln Phe His Val Lys Gly Val Glu Thr Thr
    130                 135                 140
Met Gly Tyr Val Gly Trp Ile Asn Thr Phe Gln Gly Lys Thr Asn Asp
145                 150                 155                 160
Pro Arg Tyr Leu Thr His Glu Ser Glu Leu Val Lys Glu Leu Arg Ala
                165                 170                 175
Ala Gly Ala Val Leu Tyr Cys Lys Thr Ser Val Pro Met Thr Leu Met
            180                 185                 190
Ser Gly Glu Thr Met Asn Asn Ile Ile Thr Tyr Thr His Asn Pro Lys
        195                 200                 205
Asn Arg Leu Leu Ser Ser Gly Gly Ser Ser Gly Gly Glu Gly Ala Leu
    210                 215                 220
Ile Ala Leu Arg Gly Ser Pro Ala Gly Phe Gly Thr Asp Ile Gly Gly
225                 230                 235                 240
Ser Ile Arg Val Pro Ala Ser Phe Asn Gly Leu Tyr Gly Ile Arg Pro
                245                 250                 255
Ser Val Gly Arg Met Pro Tyr Glu Gly Ala Ala Asn Ser Gly Asp Gly
            260                 265                 270
Gln Asn Thr Val Leu Ser Val Val Gly Pro Leu Ser Pro Ser Ala Arg
        275                 280                 285
Gly Leu Ile Leu Leu Phe Lys Thr Val Leu Gly Ala Met Pro Trp Leu
    290                 295                 300
Gly Asp Pro Gly Val Leu Glu Ile Pro Trp Arg Glu Glu Ile Val Glu
305                 310                 315                 320
Glu Thr Arg Lys Leu Val Gln Gly Lys Pro Glu Gly Leu Ala Phe Gly
                325                 330                 335
Ile Phe Tyr Asp Asp Gly Gln Val Lys Pro Gln Pro Pro Val Glu Arg
            340                 345                 350
Ala Met Arg Ile Ala Ala Glu Thr Ile Lys Arg Leu Gly His Lys Leu
        355                 360                 365
Ile Asn Trp Glu Pro Pro Ser His Leu Thr Ala Ala Ser Leu Ala Asn
    370                 375                 380
Arg Ala Tyr Asn Met Asp Gly Gly Ala Asp Val Leu Gln Asn Phe Ala
385                 390                 395                 400
Leu Ser Asn Glu Ala Ile His Thr Ser Val Val Ile Asp Ala Ser Gly
                405                 410                 415
Ser Pro Gln Lys Thr Ala Leu Glu Ile Ala Ala Leu Asn Val Glu Lys
            420                 425                 430
Arg Glu Tyr Gln Lys Gln Tyr Leu Asp Tyr Trp Asn Ser Thr Ala Gln
        435                 440                 445
Leu Thr Gly Thr Gly Arg Pro Val Asp Ala Val Ile Cys Pro Val Ala
    450                 455                 460
Pro His Ala Ala Cys Ile Pro Gly Lys Tyr Ala Thr Ile Gly Tyr Thr
465                 470                 475                 480
Ala Phe Ile Asn Val Leu Asp Tyr Thr Ser Ala Val Val Pro Val Thr
                485                 490                 495
Ser Ala Asp Arg Arg Val Asp Val Val Gly Lys Glu Gly Arg Glu Tyr
            500                 505                 510
Phe Gly Glu Leu Asp Arg Lys Thr Glu Gly Glu Tyr Asp Ala Asp Val
        515                 520                 525
Phe Asp Gly Ala Pro Ala Gly Ile Gln Leu Phe Gly Arg Arg Leu Gln
    530                 535                 540
Glu Glu Lys Ile Leu Val Leu Ala Glu Tyr Leu Gly Glu Glu Phe Lys
545                 550                 555                 560
Lys Ala Ser Ala Ser Lys Leu
                565
<210>50
<211>1953
<212>DNA
<213>Aspergillus nidulans
<400>50
atgcctcaat cctgggaaga actggccgct gataagcgcg cccgcctcgc aaaaaccatc      60
cctgatgaat ggaaagtcca gacgctgcct gcggaagaca gcgttattga tttcccaaag     120
aaatcgggga tcctttcaga ggccgaactg aagatcacag aggcctccgc tgcagatctt     180
gtgtccaagc tggcggccgg agagttgacc tcggtggaag ttacgctagc attctgtaaa     240
cgggcagcaa tcgcccagca gttagtaggg tcccctctac ctctcaggga gatgtaacaa     300
cgccacctta tgggactatc aagctgacgc tggcttctgt gcagacaaac tgcgcccacg     360
agttcttccc tgacgccgct ctcgcgcagg caagggaact cgatgaatac tacgcaaagc     420
acaagagacc cgttggtcca ctccatggcc tccccatctc tctcaaagac cagcttcgag     480
tcaaggtaca ccgttgcccc taagtcgtta gatgtccctt tttgtcagct aacatatgcc     540
accagggcta cgaaacatca atgggctaca tctcatggct aaacaagtac gacgaagggg     600
actcggttct gacaaccatg ctccgcaaag ccggtgccgt cttctacgtc aagacctctg     660
tcccgcagac cctgatggtc tgcgagacag tcaacaacat catcgggcgc accgtcaacc     720
cacgcaacaa gaactggtcg tgcggcggca gttctggtgg tgagggtgcg atcgttggga     780
ttcgtggtgg cgtcatcggt gtaggaacgg atatcggtgg ctcgattcga gtgccggccg     840
cgttcaactt cctgtacggt ctaaggccga gtcatgggcg gctgccgtat gcaaagatgg     900
cgaacagcat ggagggtcag gagacggtgc acagcgttgt cgggccgatt acgcactctg     960
ttgagggtga gtccttcgcc tcttccttct tttcctgctc tataccaggc ctccactgtc    1020
ctcctttctt gctttttata ctatatacga gaccggcagt cactgatgaa gtatgttaga    1080
cctccgcctc ttcaccaaat ccgtcctcgg tcaggagcca tggaaatacg actccaaggt    1140
catccccatg ccctggcgcc agtccgagtc ggacattatt gcctccaaga tcaagaacgg    1200
cgggctcaat atcggctact acaacttcga cggcaatgtc cttccacacc ctcctatcct    1260
gcgcggcgtg gaaaccaccg tcgccgcact cgccaaagcc ggtcacaccg tgaccccgtg    1320
gacgccatac aagcacgatt tcggccacga tctcatctcc catatctacg cggctgacgg    1380
cagcgccgac gtaatgcgcg atatcagtgc atccggcgag ccggcgattc caaatatcaa    1440
agacctactg aacccgaaca tcaaagctgt taacatgaac gagctctggg acacgcatct    1500
ccagaagtgg aattaccaga tggagtacct tgagaaatgg cgggaggctg aagaaaaggc    1560
cgggaaggaa ctggacgcca tcatcgcgcc gattacgcct accgctgcgg tacggcatga    1620
ccagttccgg tactatgggt atgcctctgt gatcaacctg ctggatttca cgagcgtggt    1680
tgttccggtt acctttgcgg ataagaacat cgataagaag aatgagagtt tcaaggcggt    1740
tagtgagctt gatgccctcg tgcaggaaga gtatgatccg gaggcgtacc atggggcacc    1800
ggttgcagtg caggttatcg gacggagact cagtgaagag aggacgttgg cgattgcaga    1860
ggaagtgggg aagttgctgg gaaatgtggt gactccatag ctaataagtg tcagatagca    1920
atttgcacaa gaaatcaata ccagcaactg taa                                 1953
<210>51
<211>1524
<212>DNA
<213>Aspergillus nidulans
<400>51
atgcctcaat cctgggaaga actggccgct gataagcgcg cccgcctcgc aaaaaccatc      60
cctgatgaat ggaaagtcca gacgctgcct gcggaagaca gcgttattga tttcccaaag     120
aaatcgggga tcctttcaga ggccgaactg aagatcacag aggcctccgc tgcagatctt     180
gtgtccaagc tggcggccgg agagttgacc tcggtggaag ttacgctagc attctgtaaa     240
cgggcagcaa tcgcccagca gttaacaaac tgcgcccacg agttcttccc tgacgccgct     300
ctcgcgcagg caagggaact cgatgaatac tacgcaaagc acaagagacc cgttggtcca     360
ctccatggcc tccccatctc tctcaaagac cagcttcgag tcaagggcta cgaaacatca     420
atgggctaca tctcatggct aaacaagtac gacgaagggg actcggttct gacaaccatg     480
ctccgcaaag ccggtgccgt cttctacgtc aagacctctg tcccgcagac cctgatggtc     540
tgcgagacag tcaacaacat catcgggcgc accgtcaacc cacgcaacaa gaactggtcg     600
tgcggcggca gttctggtgg tgagggtgcg atcgttggga ttcgtggtgg cgtcatcggt     660
gtaggaacgg atatcggtgg ctcgattcga gtgccggccg cgttcaactt cctgtacggt     720
ctaaggccga gtcatgggcg gctgccgtat gcaaagatgg cgaacagcat ggagggtcag     780
gagacggtgc acagcgttgt cgggccgatt acgcactctg ttgaggacct ccgcctcttc     840
accaaatccg tcctcggtca ggagccatgg aaatacgact ccaaggtcat ccccatgccc     900
tggcgccagt ccgagtcgga cattattgcc tccaagatca agaacggcgg gctcaatatc     960
ggctactaca acttcgacgg caatgtcctt ccacaccctc ctatcctgcg cggcgtggaa    1020
accaccgtcg ccgcactcgc caaagccggt cacaccgtga ccccgtggac gccatacaag    1080
cacgatttcg gccacgatct catctcccat atctacgcgg ctgacggcag cgccgacgta    1140
atgcgcgata tcagtgcatc cggcgagccg gcgattccaa atatcaaaga cctactgaac    1200
ccgaacatca aagctgttaa catgaacgag ctctgggaca cgcatctcca gaagtggaat    1260
taccagatgg agtaccttga gaaatggcgg gaggctgaag aaaaggccgg gaaggaactg    1320
gacgccatca tcgcgccgat tacgcctacc gctgcggtac ggcatgacca gttccggtac    1380
tatgggtatg cctctgtgat caacctgctg gatttcacga gcgtggttgt tccggttacc    1440
tttgcggata agaacatcga taagaagaat gagagtttca aggcgatagc aatttgcaca    1500
agaaatcaat accagcaact gtaa                                           1524
<210>52
<211>507
<212>PRT
<213>Aspergillus nidulans
<400>52
Met Pro Gln Ser Trp Glu Glu Leu Ala Ala Asp Lys Arg Ala Arg Leu
1               5                   10                  15
Ala Lys Thr Ile Pro Asp Glu Trp Lys Val Gln Thr Leu Pro Ala Glu
            20                  25                  30
Asp Ser Val Ile Asp Phe Pro Lys Lys Ser Gly Ile Leu Ser Glu Ala
        35                  40                  45
Glu Leu Lys Ile Thr Glu Ala Ser Ala Ala Asp Leu Val Ser Lys Leu
    50                  55                  60
Ala Ala Gly Glu Leu Thr Ser Val Glu Val Thr Leu Ala Phe Cys Lys
65                  70                  75                  80
Arg Ala Ala Ile Ala Gln Gln Leu Thr Asn Cys Ala His Glu Phe Phe
                85                  90                  95
Pro Asp Ala Ala Leu Ala Gln Ala Arg Glu Leu Asp Glu Tyr Tyr Ala
            100                 105                 110
Lys His Lys Arg Pro Val Gly Pro Leu His Gly Leu Pro Ile Ser Leu
        115                 120                 125
Lys Asp Gln Leu Arg Val Lys Gly Tyr Glu Thr Ser Met Gly Tyr Ile
    130                 135                 140
Ser Trp Leu Asn Lys Tyr Asp Glu Gly Asp Ser Val Leu Thr Thr Met
145                 150                 155                 160
Leu Arg Lys Ala Gly Ala Val Phe Tyr Val Lys Thr Ser Val Pro Gln
                165                 170                 175
Thr Leu Met Val Cys Glu Thr Val Asn Asn Ile Ile Gly Arg Thr Val
            180                 185                 190
Asn Pro Arg Asn Lys Asn Trp Ser Cys Gly Gly Ser Ser Gly Gly Glu
        195                 200                 205
Gly Ala Ile Val Gly Ile Arg Gly Gly Val Ile Gly Val Gly Thr Asp
    210                 215                 220
Ile Gly Gly Ser Ile Arg Val Pro Ala Ala Phe Asn Phe Leu Tyr Gly
225                 230                 235                 240
Leu Arg Pro Ser His Gly Arg Leu Pro Tyr Ala Lys Met Ala Asn Ser
                245                 250                 255
Met Glu Gly Gln Glu Thr Val His Ser Val Val Gly Pro Ile Thr His
            260                 265                 270
Ser Val Glu Asp Leu Arg Leu Phe Thr Lys Ser Val Leu Gly Gln Glu
        275                 280                 285
Pro Trp Lys Tyr Asp Ser Lys Val Ile Pro Met Pro Trp Arg Gln Ser
    290                 295                 300
Glu Ser Asp Ile Ile Ala Ser Lys Ile Lys Asn Gly Gly Leu Asn Ile
305                 310                 315                 320
Gly Tyr Tyr Asn Phe Asp Gly Asn Val Leu Pro His Pro Pro Ile Leu
                325                 330                 335
Arg Gly Val Glu Thr Thr Val Ala Ala Leu Ala Lys Ala Gly His Thr
            340                 345                 350
Val Thr Pro Trp Thr Pro Tyr Lys His Asp Phe Gly His Asp Leu Ile
        355                 360                 365
Ser His Ile Tyr Ala Ala Asp Gly Ser Ala Asp Val Met Arg Asp Ile
    370                 375                 380
Ser Ala Ser Gly Glu Pro Ala Ile Pro Asn Ile Lys Asp Leu Leu Asn
385                 390                 395                 400
Pro Asn Ile Lys Ala Val Asn Met Asn Glu Leu Trp Asp Thr His Leu
                405                 410                 415
Gln Lys Trp Asn Tyr Gln Met Glu Tyr Leu Glu Lys Trp Arg Glu Ala
            420                 425                 430
Glu Glu Lys Ala Gly Lys Glu Leu Asp Ala Ile Ile Ala Pro Ile Thr
        435                 440                 445
Pro Thr Ala Ala Val Arg His Asp Gln Phe Arg Tyr Tyr Gly Tyr Ala
    450                 455                 460
Ser Val Ile Asn Leu Leu Asp Phe Thr Ser Val Val Val Pro Val Thr
465                 470                 475                 480
Phe Ala Asp Lys Asn Ile Asp Lys Lys Asn Glu Ser Phe Lys Ala Ile
                485                 490                 495
Ala Ile Cys Thr Arg Asn Gln Tyr Gln Gln Leu
            500                 505
<210>53
<211>44
<212>DNA
<213>引物
<400>53
gtcctgttaa ttaaccttca ccatgcctca atcctgggaa gaac 44
<210>54
<211>39
<212>DNA
<213>引物
<400>54
acttcaggcg cgcctttatg gagtcaccac atttcccag       39
<210>55
<211>1939
<212>DNA
<213>合成产物
<400>55
gtcctgttaa ttaaccttca ccatgcctca atcctgggaa gaactggccg ctgataagcg      60
cgcccgcctc gcaaaaacca tccctgatga atggaaagtc cagacgctgc ctgcggaaga     120
cagcgttatt gatttcccaa agaaatcggg gatcctttca gaggccgaac tgaagatcac     180
agaggcctcc gctgcagaga tcttgtgtcc aagctggcgg ccggagagtt gacctcggtg     240
gaagttacgc tagcattctg taaacgggca gcaatcgccc agcagttagt agggtcccct     300
ctacctctca gggagatgta acaacgccac cttatgggac tatcaagctg acgctggctt     360
ctgtgcagac aaactgcgcc cacgagttct tccctgacgc cgctctcgcg caggcaaggg     420
aactcgatga atactacgca aagcacaaga gacccgttgg tccactccat ggcctcccca     480
tctctctcaa agaccagctt cgagtcaagg tacaccgttg cccctaagtc gttagatgtc     540
cctttttgtc agctaacata tgccaccagg gctacgaaac atcaatgggc tacatctcat     600
ggctaaacaa gtacgacgaa ggggactcgg ttctgacaac catgctccgc aaagccggtg     660
ccgtcttcta cgtcaagacc tctgtcccgc agaccctgat ggtctgcgag acagtcaaca     720
acatcatcgg gcgcaccgtc aacccacgca acaagaactg gtcgtgcggc ggcagttctg     780
gtggtgaggg tgcgatcgtt gggattcgtg gtggcgtcat cggtgtagga acggatatcg     840
gtggctcgat tcgagtgccg gccgcgttca acttcctgta cggtctaagg ccgagtcatg     900
ggcggctgcc gtatgcaaag atggcgaaca gcatggaggg tcaggagacg gtgcacagcg     960
ttgtcgggcc gattacgcac tctgttgagg gtgagtcctt cgcctcttcc ttcttttcct    1020
gctctatacc aggcctccac tgtcctcctt tcttgctttt tatactatat acgagaccgg    1080
cagtcactga tgaagtatgt tagacctccg cctcttcacc aaatccgtcc tcggtcagga    1140
gccatggaaa tacgactcca aggtcatccc catgccctgg cgccagtccg agtcggacat    1200
tattgcctcc aagatcaaga acggcgggct caatatcggc tactacaact tcgacggcaa    1260
tgtccttcca caccctccta tcctgcgcgg cgtggaaacc accgtcgccg cactcgccaa    1320
agccggtcac accgtgaccc cgtggacgcc atacaagcac gatttcggcc acgatctcat    1380
ctcccatatc tacgcggctg acggcagcgc cgacgtaatg cgcgatatca gtgcatccgg    1440
cgagccggcg attccaaata tcaaagacct actgaacccg aacatcaaag ctgttaacat    1500
gaacgagctc tgggacacgc atctccagaa gtggaattac cagatggagt accttgagaa    1560
atggcgggag gctgaagaaa aggccgggaa ggaactggac gccatcatcg cgccgattac    1620
gcctaccgct gcggtacggc atgaccagtt ccggtactat gggtatgcct ctgtgatcaa    1680
cctgctggat ttcacgagcg tggttgttcc ggttaccttt gcggataaga acatcgataa    1740
gaagaatgag agtttcaagg cggttagtga gcttgatgcc ctcgtgcagg aagagtatga    1800
tccggaggcg taccatgggg caccggttgc agtgcaggtt atcggacgga gactcagtga    1860
agagaggacg ttggcgattg cagaggaagt ggggaagttg ctgggaaatg tggtgactcc    1920
ataaaggcgc gcctgaagt                                                 1939
<210>56
<211>48
<212>DNA
<213>引物
<400>56
acttcaggcg cgcctttaga gcttggatgg agtcaccaca tttcccag 48
<210>57
<211>1948
<212>DNA
<213>合成产物
<400>57
gtcctgttaa ttaaccttca ccatgcctca atcctgggaa gaactggccg ctgataagcg     60
cgcccgcctc gcaaaaacca tccctgatga atggaaagtc cagacgctgc ctgcggaaga    120
cagcgttatt gatttcccaa agaaatcggg gatcctttca gaggccgaac tgaagatcac     180
agaggcctcc gctgcagaga tcttgtgtcc aagctggcgg ccggagagtt gacctcggtg     240
gaagttacgc tagcattctg taaacgggca gcaatcgccc agcagttagt agggtcccct     300
ctacctctca gggagatgta acaacgccac cttatgggac tatcaagctg acgctggctt     360
ctgtgcagac aaactgcgcc cacgagttct tccctgacgc cgctctcgcg caggcaaggg     420
aactcgatga atactacgca aagcacaaga gacccgttgg tccactccat ggcctcccca     480
tctctctcaa agaccagctt cgagtcaagg tacaccgttg cccctaagtc gttagatgtc     540
cctttttgtc agctaacata tgccaccagg gctacgaaac atcaatgggc tacatctcat     600
ggctaaacaa gtacgacgaa ggggactcgg ttctgacaac catgctccgc aaagccggtg     660
ccgtcttcta cgtcaagacc tctgtcccgc agaccctgat ggtctgcgag acagtcaaca     720
acatcatcgg gcgcaccgtc aacccacgca acaagaactg gtcgtgcggc ggcagttctg     780
gtggtgaggg tgcgatcgtt gggattcgtg gtggcgtcat cggtgtagga acggatatcg     840
gtggctcgat tcgagtgccg gccgcgttca acttcctgta cggtctaagg ccgagtcatg     900
ggcggctgcc gtatgcaaag atggcgaaca gcatggaggg tcaggagacg gtgcacagcg     960
ttgtcgggcc gattacgcac tctgttgagg gtgagtcctt cgcctcttcc ttcttttcct    1020
gctctatacc aggcctccac tgtcctcctt tcttgctttt tatactatat acgagaccgg    1080
cagtcactga tgaagtatgt tagacctccg cctcttcacc aaatccgtcc tcggtcagga    1140
gccatggaaa tacgactcca aggtcatccc catgccctgg cgccagtccg agtcggacat    1200
tattgcctcc aagatcaaga acggcgggct caatatcggc tactacaact tcgacggcaa    1260
tgtccttcca caccctccta tcctgcgcgg cgtggaaacc accgtcgccg cactcgccaa    1320
agccggtcac accgtgaccc cgtggacgcc atacaagcac gatttcggcc acgatctcat    1380
ctcccatatc tacgcggctg acggcagcgc cgacgtaatg cgcgatatca gtgcatccgg    1440
cgagccggcg attccaaata tcaaagacct actgaacccg aacatcaaag ctgttaacat    1500
gaacgagctc tgggacacgc atctccagaa gtggaattac cagatggagt accttgagaa    1560
atggcgggag gctgaagaaa aggccgggaa ggaactggac gccatcatcg cgccgattac    1620
gcctaccgct gcggtacggc atgaccagtt ccggtactat gggtatgcct ctgtgatcaa    1680
cctgctggat ttcacgagcg tggttgttcc ggttaccttt gcggataaga acatcgataa    1740
gaagaatgag agtttcaagg cggttagtga gcttgatgcc ctcgtgcagg aagagtatga    1800
tccggaggcg taccatgggg caccggttgc agtgcaggtt atcggacgga gactcagtga  1860
agagaggacg ttggcgattg cagaggaagt ggggaagttg ctgggaaatg tggtgactcc  1920
atccaagctc taaaggcgcg cctgaagt                                     1948
<210>58
<211>551
<212>PRT
<213>合成产物
<400>58
Met Pro Gln Ser Trp Glu Glu Leu Ala Ala Asp Lys Arg Ala Arg Leu
1               5                   10                  15
Ala Lys Thr Ile Pro Asp Glu Trp Lys Val Gln Thr Leu Pro Ala Glu
            20                  25                  30
Asp Ser Val Ile Asp Phe Pro Lys Lys Ser Gly Ile Leu Ser Glu Ala
        35                  40                  45
Glu Leu Lys Ile Thr Glu Ala Ser Ala Ala Asp Leu Val Ser Lys Leu
    50                  55                  60
Ala Ala Gly Glu Leu Thr Ser Val Glu Val Thr Leu Ala Phe Cys Lys
65                  70                  75                  80
Arg Ala Ala Ile Ala Gln Gln Leu Thr Asn Cys Ala His Glu Phe Phe
                85                  90                  95
Pro Asp Ala Ala Leu Ala Gln Ala Arg Glu Leu Asp Glu Tyr Tyr Ala
            100                 105                 110
Lys His Lys Arg Pro Val Gly Pro Leu His Gly Leu Pro Ile Ser Leu
        115                 120                 125
Lys Asp Gln Leu Arg Val Lys Gly Tyr Glu Thr Ser Met Gly Tyr Ile
    130                 135                 140
Ser Trp Leu Asn Lys Tyr Asp Glu Gly Asp Ser Val Leu Thr Thr Met
145                 150                 155                 160
Leu Arg Lys Ala Gly Ala Val Phe Tyr Val Lys Thr Ser Val Pro Gln
                165                 170                 175
Thr Leu Met Val Cys Glu Thr Val Asn Asn Ile Ile Gly Arg Thr Val
            180                 185                 190
Asn Pro Arg Asn Lys Asn Trp Ser Cys Gly Gly Ser Ser Gly Gly Glu
        195                 200                 205
Gly Ala Ile Val Gly Ile Arg Gly Gly Val Ile Gly Val Gly Thr Asp
    210                 215                 220
Ile Gly Gly Ser Ile Arg Val Pro Ala Ala Phe Asn Phe Leu Tyr Gly
225                 230                 235                 240
Leu Arg Pro Ser His Gly Arg Leu Pro Tyr Ala Lys Met Ala Asn Ser
                245                 250                 255
Met Glu Gly Gln Glu Thr Val His Ser Val Val Gly Pro Ile Thr His
            260                 265                 270
Ser Val Glu Asp Leu Arg Leu Phe Thr Lys Ser Val Leu Gly Gln Glu
        275                 280                 285
Pro Trp Lys Tyr Asp Ser Lys Val Ile Pro Met Pro Trp Arg Gln Ser
    290                 295                 300
Glu Ser Asp Ile Ile Ala Ser Lys Ile Lys Asn Gly Gly Leu Asn Ile
305                 310                 315                 320
Gly Tyr Tyr Asn Phe Asp Gly Asn Val Leu Pro His Pro Pro Ile Leu
                325                 330                 335
Arg Gly Val Glu Thr Thr Val Ala Ala Leu Ala Lys Ala Gly His Thr
            340                 345                 350
Val Thr Pro Trp Thr Pro Tyr Lys His Asp Phe Gly His Asp Leu Ile
        355                 360                 365
Ser His Ile Tyr Ala Ala Asp Gly Ser Ala Asp Val Met Arg Asp Ile
    370                 375                 380
Ser Ala Ser Gly Glu Pro Ala Ile Pro Asn Ile Lys Asp Leu Leu Asn
385                 390                 395                 400
Pro Asn Ile Lys Ala Val Asn Met Asn Glu Leu Trp Asp Thr His Leu
                405                 410                 415
Gln Lys Trp Asn Tyr Gln Met Glu Tyr Leu Glu Lys Trp Arg Glu Ala
            420                 425                 430
Glu Glu Lys Ala Gly Lys Glu Leu Asp Ala Ile Ile Ala Pro Ile Thr
        435                 440                 445
Pro Thr Ala Ala Val Arg His Asp Gln Phe Arg Tyr Tyr Gly Tyr Ala
    450                 455                 460
Ser Val Ile Asn Leu Leu Asp Phe Thr Ser Val Val Val Pro Val Thr
465                 470                 475                 480
Phe Ala Asp Lys Asn Ile Asp Lys Lys Asn Glu Ser Phe Lys Ala Val
                485                 490                 495
Ser Glu Leu Asp Ala Leu Val Gln Glu Glu Tyr Asp Pro Glu Ala Tyr
            500                 505                 510
His Gly Ala Pro Val Ala Val Gln Val Ile Gly Arg Arg Leu Ser Glu
        515                 520                 525
Glu Arg Thr Leu Ala Ile Ala Glu Glu Val Gly Lys Leu Leu Gly Asn
    530                 535                 540
Val Val Thr Pro Ser Lys Leu
545                 550
<210>59
<211>1387
<212>DNA
<213>Aspergillus niger
<400>59
atggcaccct ccacggtaac ccatgattct accatcctcg tggtgggagc gggtgtatgg      60
ggttgttcta ctgctttgca tttggctcgt cgcggatata agcatgtcac ggttctagac     120
ccctacacgg tcccatccgc aatcgcagcc ggcaatgata tcaacaagat catggaacac     180
aaggagccca aaggtatgtc tgcaccgttc agccaatgac catcttccaa cgctaacaac     240
tccaacagca ggcgaagaaa gtccacgcag cattgcgttc gcgacgtgca ctcgtgccgc     300
tctgaaagcg tggcggacgg atcctgtttt caagcagtac tttcatgaga ccggtgtcat     360
agtatccggt cataccccgg cactcattga gcacatccgc aaagacgaaa tcgagtcatc     420
tgatgcagac tttgtcgaat tgaagacagc agaagacttc cgaaagacaa tgcctccagg     480
tgttctcact ggtgagtttc ctggctggaa gggctggttg aacaagtcgg gtgccggctg     540
gattcatgcc aagaaagcca tgatctctgc gtacactgaa gccaagcgtc ttggggtcaa     600
cttcatcact ggatctcccc aggggaacgt tgtatcacta gtatacgaga atggagatgt     660
ggttggagct aaaacgtccg atggggtcat tcatcgagca gaccaaacca ttttggcagc     720
cggtgcggga agtgaccgtc tcctggattt caagaaacag ctgcgtccta ctgcctggac     780
gctctctcat attcagatga cccctgagga ggccaagcag tacaaggatt tacccgtgct     840
tttcaatatt gcgaaggggt tcttcatgga gcctgatgag gataagcacg aactgaagat     900
ctgtgacgag catcctggat actgtaactt tattccagac cctgcaagat ccggcgagat     960
cagaagcatc ccatttgcga agcatcaaat tcccctggag gccgaagctc gcgttaagga    1020
cttcctgcgg gatacaatgc cacacttggc cgaccgtccg ctggtatttg cccgtatctg    1080
ctgggatgct gacacggtag atcgcgcctt tttgatcgat aaacatcctg accacccttc    1140
actgctggtc gccgtgggag cttctgggaa cggggctatg cagatgccca ctattggagg    1200
gttcattgtg gatgcactgg agggtcacct acaagatgag ctaaaacatg tcgttcggtg    1260
gaggccagaa acagcggtcg acagagactg gaagtcgaca cagaaccgtt tcggaggacc    1320
agatgcggtt atggacttcc agacggttgg cgaaactgaa tggaccaaga tcaagagccg    1380
gctatag                                                              1387
<210>60
<211>1332
<212>DNA
<213>Aspergillus niger
<400>60
atggcaccct ccacggtaac ccatgattct accatcctcg tggtgggagc gggtgtatgg      60
ggttgttcta ctgctttgca tttggctcgt cgcggatata agcatgtcac ggttctagac     120
ccctacacgg tcccatccgc aatcgcagcc ggcaatgata tcaacaagat catggaacac     180
aaggagccca aagcaggcga agaaagtcca cgcagcattg cgttcgcgac gtgcactcgt     240
gccgctctga aagcgtggcg gacggatcct gttttcaagc agtactttca tgagaccggt     300
gtcatagtat ccggtcatac cccggcactc attgagcaca tccgcaaaga cgaaatcgag     360
tcatctgatg cagactttgt cgaattgaag acagcagaag acttccgaaa gacaatgcct     420
ccaggtgttc tcactggtga gtttcctggc tggaagggct ggttgaacaa gtcgggtgcc     480
ggctggattc atgccaagaa agccatgatc tctgcgtaca ctgaagccaa gcgtcttggg     540
gtcaacttca tcactggatc tccccagggg aacgttgtat cactagtata cgagaatgga     600
gatgtggttg gagctaaaac gtccgatggg gtcattcatc gagcagacca aaccattttg     660
gcagccggtg cgggaagtga ccgtctcctg gatttcaaga aacagctgcg tcctactgcc     720
tggacgctct ctcatattca gatgacccct gaggaggcca agcagtacaa ggatttaccc     780
gtgcttttca atattgcgaa ggggttcttc atggagcctg atgaggataa gcacgaactg     840
aagatctgtg acgagcatcc tggatactgt aactttattc cagaccctgc aagatccggc     900
gagatcagaa gcatcccatt tgcgaagcat caaattcccc tggaggccga agctcgcgtt     960
aaggacttcc tgcgggatac aatgccacac ttggccgacc gtccgctggt atttgcccgt    1020
atctgctggg atgctgacac ggtagatcgc gcctttttga tcgataaaca tcctgaccac    1080
ccttcactgc tggtcgccgt gggagcttct gggaacgggg ctatgcagat gcccactatt    1140
ggagggttca ttgtggatgc actggagggt cacctacaag atgagctaaa acatgtcgtt    1200
cggtggaggc cagaaacagc ggtcgacaga gactggaagt cgacacagaa ccgtttcgga    1260
ggaccagatg cggttatgga cttccagacg gttggcgaaa ctgaatggac caagatcaag    1320
agccggctat ag                                                        1332
<210>61
<211>443
<212>PRT
<213>Aspergillus niger
<400>61
Met Ala Pro Ser Thr Val Thr His Asp Ser Thr Ile Leu Val Val Gly
1               5                   10                  15
Ala Gly Val Trp Gly Cys Ser Thr Ala Leu His Leu Ala Arg Arg Gly
            20                  25                  30
Tyr Lys His Val Thr Val Leu Asp Pro Tyr Thr Val Pro Ser Ala Ile
        35                  40                  45
Ala Ala Gly Asn Asp Ile Asn Lys Ile Met Glu His Lys Glu Pro Lys
    50                  55                  60
Ala Gly Glu Glu Ser Pro Arg Ser Ile Ala Phe Ala Thr Cys Thr Arg
65                  70                  75                  80
Ala Ala Leu Lys Ala Trp Arg Thr Asp Pro Val Phe Lys Gln Tyr Phe
                85                  90                  95
His Glu Thr Gly Val Ile Val Ser Gly His Thr Pro Ala Leu Ile Glu
            100                 105                 110
His Ile Arg Lys Asp Glu Ile Glu Ser Ser Asp Ala Asp Phe Val Glu
        115                 120                 125
Leu Lys Thr Ala Glu Asp Phe Arg Lys Thr Met Pro Pro Gly Val Leu
    130                 135                 140
Thr Gly Glu Phe Pro Gly Trp Lys Gly Trp Leu Asn Lys Ser Gly Ala
145                 150                 155                 160
Gly Trp Ile His Ala Lys Lys Ala Met Ile Ser Ala Tyr Thr Glu Ala
                165                 170                 175
Lys Arg Leu Gly Val Asn Phe Ile Thr Gly Ser Pro Gln Gly Asn Val
            180                 185                 190
Val Ser Leu Val Tyr Glu Asn Gly Asp Val Val Gly Ala Lys Thr Ser
        195                 200                 205
Asp Gly Val Ile His Arg Ala Asp Gln Thr Ile Leu Ala Ala Gly Ala
    210                 215                 220
Gly Ser Asp Arg Leu Leu Asp Phe Lys Lys Gln Leu Arg Pro Thr Ala
225                 230                 235                 240
Trp Thr Leu Ser His Ile Gln Met Thr Pro Glu Glu Ala Lys Gln Tyr
                245                 250                 255
Lys Asp Leu Pro Val Leu Phe Asn Ile Ala Lys Gly Phe Phe Met Glu
            260                 265                 270
Pro Asp Glu Asp Lys His Glu Leu Lys Ile Cys Asp Glu His Pro Gly
        275                 280                 285
Tyr Cys Asn Phe Ile Pro Asp Pro Ala Arg Ser Gly Glu Ile Arg Ser
    290                 295                 300
Ile Pro Phe Ala Lys His Gln Ile Pro Leu Glu Ala Glu Ala Arg Val
305                 310                 315                 320
Lys Asp Phe Leu Arg Asp Thr Met Pro His Leu Ala Asp Arg Pro Leu
                325                 330                 335
Val Phe Ala Arg Ile Cys Trp Asp Ala Asp Thr Val Asp Arg Ala Phe
            340                 345                 350
Leu Ile Asp Lys His Pro Asp His Pro Ser Leu Leu Val Ala Val Gly
        355                 360                 365
Ala Ser Gly Asn Gly Ala Met Gln Met Pro Thr Ile Gly Gly Phe Ile
    370                 375                 380
Val Asp Ala Leu Glu Gly His Leu Gln Asp Glu Leu Lys His Val Val
385                 390                 395                 400
Arg Trp Arg Pro Glu Thr Ala Val Asp Arg Asp Trp Lys Ser Thr Gln
                405                 410                 415
Asn Arg Phe Gly Gly Pro Asp Ala Val Met Asp Phe Gln Thr Val Gly
            420                 425                 430
Glu Thr Glu Trp Thr Lys Ile Lys Ser Arg Leu
        435                 440
<210>62
<211>46
<212>DNA
<213>引物
<400>62
cccttaatta actcataggc atcatggcac cctccacggt  aaccca    46
<210>63
<211>34
<212>DNA
<213>引物
<400>63
cgaggcgcgc cagtagttat ggaaggtata atca                  34
<210>64
<211>1505
<212>DNA
<213>合成产物
<400>64
cccttaatta actcataggc atcatggcac cctccacggt aacccatgat tctaccatcc      60
tcgtggtggg agcgggtgta tggggttgtt ctactgcttt gcatttggct cgtcgcggat     120
ataagcatgt cacggttcta gacccctaca cggtcccatc cgcaatcgca gccggcaatg     180
atatcaacaa gatcatggaa cacaaggagc ccaaaggtat gtctgcaccg ttcagccaat     240
gaccatcttc caacgctaac aactccaaca gcaggcgaag aaagtccacg cagcattgcg     300
ttcgcgacgt gcactcgtgc cgctctgaaa gcgtggcgga cggatcctgt tttcaagcag     360
tactttcatg agaccggtgt catagtatcc ggtcataccc cggcactcat tgagcacatc     420
cgcaaagacg aaatcgagtc atctgatgca gactttgtcg aattgaagac agcagaagac     480
ttccgaaaga caatgcctcc aggtgttctc actggtgagt ttcctggctg gaagggctgg     540
ttgaacaagt cgggtgccgg ctggattcat gccaagaaag ccatgatctc tgcgtacact     600
gaagccaagc gtcttggggt caacttcatc actggatctc cccaggggaa cgttgtatca     660
ctagtatacg agaatggaga tgtggttgga gctaaaacgt ccgatggggt cattcatcga     720
gcagaccaaa ccattttggc agccggtgcg ggaagtgacc gtctcctgga tttcaagaaa     780
cagctgcgtc ctactgcctg gacgctctct catattcaga tgacccctga ggaggccaag     840
cagtacaagg atttacccgt gcttttcaat attgcgaagg ggttcttcat ggagcctgat     900
gaggataagc acgaactgaa gatctgtgac gagcatcctg gatactgtaa ctttattcca     960
gaccctgcaa gatccggcga gatcagaagc atcccatttg cgaagcatca aattcccctg    1020
gaggccgaag ctcgcgttaa ggacttcctg cgggatacaa tgccacactt ggccgaccgt    1080
ccgctggtat ttgcccgtat ctgctgggat gctgacacgg tagatcgcgc ctttttgatc    1140
gataaacatc ctgaccaccc ttcactgctg gtcgccgtgg gagcttctgg gaacggggct    1200
atgcagatgc ccactattgg agggttcatt gtggatgcac tggagggtca cctacaagat    1260
gagctaaaac atgtcgttcg gtggaggcca gaaacagcgg tcgacagaga ctggaagtcg    1320
acacagaacc gtttcggagg accagatgcg gttatggact tccagacggt tggcgaaact    1380
gaatggacca agatcaagag ccggctatag atgagcggtc atgtatgaga gcgaaatgca    1440
aatagtgata ttgccatgaa atatcagctt atgattatac cttccataac tactggcgcg    1500
cctcg                                                                1505
申请人或代理人文件参考编号24805WO  国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)
Figure A20058003537001101
申请人或代理人文件参考编号24805WO 国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)
Figure A20058003537001111

Claims (50)

1.一种真核细胞,其含有过氧化物酶体,所述过氧化物酶体能与细胞分泌途径所涉及的细胞的膜结构融合。
2.如权利要求1所述的真核细胞,其中,所述细胞分泌途径所涉及的细胞的膜结构选自质膜、Golgi复合体和内质网构成的组。
3.如权利要求1或2所述的真核细胞,其中,融合多肽或其一部分在所述过氧化物酶体的表面暴露。
4.如权利要求3所述的真核细胞,其中,所述融合多肽的一部分暴露,其通常在供体膜结构的表面暴露。
5.如权利要求3或4所述的真核细胞,其中,所述融合多肽或其一部分与过氧化物酶体膜多肽或其一部分融合或可操作地相连。
6.如权利要求5所述的真核细胞,其中,所述过氧化物酶体膜多肽的所述部分包含至少一个跨膜结构域。
7.如权利要求3至7中任意一项所述的真核细胞,其中,所述融合多肽为v-SNARE。
8.如权利要求7所述的真核细胞,其中,所述v-SNARE是Snc1、Sn2或其同源体,优选地,SncA。
9.如权利要求5或6所述的真核细胞,其中,所述过氧化物酶体膜多肽是Pmp22或其同源体。
10.如前述任意一项权利要求所述的真核细胞,其中,补充性融合多肽或其一部分在受体膜结构上过量表达。
11.如权利要求10所述的真核细胞,其中,所述受体膜结构是质膜。
12.如权利要求10或11所述的真核细胞,其中,所述补充性融合多肽是t-SNARE。
13.如权利要求3至12中任意一项所述的真核细胞,其中,所述细胞胞含下述核酸构建体,所述核酸构建体包含编码与过氧化物酶体膜多肽或其一部分可操作地相连的融合多肽或其一部分的核酸序列。
14.如权利要求13所述的真核细胞,其中,所述核酸构建体包含编码具有根据SEQ ID NO:24的氨基酸序列的嵌合多肽的核酸序列,优选地,根据SEQ ID NO:23的核酸序列。
15.如前述任意一项权利要求所述的真核细胞,其中,所述细胞还包含下述核酸构建体或表达载体,所述核酸构建体或表达载体包含编码感兴趣的多肽的DNA序列,所述DNA序列与能促进所述感兴趣的多肽的过氧化物酶体定位的DNA序列可操作地相连。
16.如权利要求15所述的真核细胞,其中,所述能促进过氧化物酶体定位的信号是选自如下物质构成的组的氨基酸序列:(a)一种三肽,其中,N至C末端方向上的第一个氨基酸是A、C、H、K、N、P、S或T,N至C末端方向上的第二个氨基酸是H、K、N、Q、R或S,N至C末端方向上的第三个氨基酸是A、F、I、L、M或V,以及(b)定义为如下所示的肽:(R/K)(L/V/I/Q)XX(L/V/I/H/Q)(L/S/G/A/K)X(H/Q)(L/A/F),其中X可以是任何氨基酸。
17.如前述任意一项权利要求所述的真核细胞,其中,所述真核细胞是哺乳动物、昆虫、植物、真菌或藻类细胞。
18.如权利要求17所述的真核细胞,其中,所述真菌细胞是酵母细胞,优选地,K.lactis或S.cerevisiae。
19.如权利要求17所述的真核细胞,其中,所述真菌细胞是有丝真菌细胞,优选地,属于Aspergillus、Penicillium或Trichoderma属的种的细胞。
20.如权利要求19所述的真核细胞,其中,所述有丝真菌细胞属于Aspergillus niger、Aspergillus sojae、Aspergillus oryzae、Trichoderma reesei或Penicillium chrysogenum的种。
21.一种方法,用于在根据权利要求1至20中任意一项所述的真核细胞中生产感兴趣的多肽,其中,所述感兴趣的多肽存在于所述细胞的过氧化物酶体中,所述方法包括在给定的培养基中培养所述真核细胞,以及可选地,纯化所述多肽。
22.如权利要求21所述的方法,其中,所述培养基包含CAPP的激活剂,优选地,神经酰胺,和/或能诱导过氧化物酶体增殖的物质,例如油酸盐/酯。
23.如权利要求21或22所述的方法,其中,生产至少0.01g/l的所述感兴趣的多肽。
24.一种方法,用于在根据权利要求1至20中任意一项所述的真核细胞中生产代谢产物,其中,所述代谢产物存在于所述细胞的过氧化物酶体中,所述方法包括在给定的培养基中培养所述真核细胞,以及可选地,纯化所述代谢产物。
25.如权利要求24所述的方法,用于生产代谢产物,其中,所述真核细胞还包含下述核酸构建体或表达载体,所述核酸构建体或表达载体包含编码所述代谢产物合成过程所涉及的酶的DNA序列,所述DNA序列与能促进所述酶的过氧化物酶体定位的DNA序列可操作地相连。
26.如权利要求21至25中任意一项所述的方法,用于在真核细胞中生产感兴趣的化合物,其中,培养所述真核细胞,将适当量的氧进料至培养物以保持所述培养物处于氧受限的条件下。
27.如权利要求21至26中任意一项所述的方法,用于在真核细胞中生产感兴趣的化合物,其中,在所述培养过程中改变所述培养基的pH。
28.如权利要求21至27中任意一项所述的方法,用于在真核细胞中生产感兴趣的化合物,其中,所述培养过程的总持续时间为192小时,其由以下阶段构成:
●72小时的第一个阶段,其中,所述培养基的pH为6.0,
●24小时的过渡阶段,其中,所述培养基的pH以线性过程从6.0变为6.7,以及
●96小时的第二个阶段,其中,所述培养基的pH为6.7。
29.如权利要求21至28中任意一项所述的方法,用于在真核细胞中生产感兴趣的化合物,在所述培养过程中改变所述培养基的温度。
30.如权利要求21至29中任意一项所述的方法,用于在真核细胞中生产感兴趣的化合物,其中,所述培养基的温度在所述培养过程中从30℃变为36℃。
31.如权利要求26至30中任意一项所述的方法,用于在真核细胞中生产感兴趣的化合物,其中,所述真核细胞是有丝真菌,优选地,属于Aspergillus的种,更优选地,Aspergillus niger菌株。
32.展示出v-SNARE功能的多肽,其选自下述组,所述组由(a)具有根据SEQ ID NO:13的氨基酸序列的多肽;(b)具有展示出与SEQ IDNO:13的氨基酸序列至少85%同一性,优选至少90%,更优选至少93%,进一步更优选至少95%,进一步更优选至少97%,进一步更优选至少98%,进一步更优选至少99%的氨基酸序列的多肽;以及(c)(a)或(b)定义的多肽的功能片段构成。
33.选自下述组的过氧化物酶体膜多肽,所述组由(a)具有根据SEQID NO:16的氨基酸序列的多肽;(b)具有展示出与SEQ ID NO:16的氨基酸序列至少85%同一性,优选至少90%,更优选至少93%,进一步更优选至少95%,进一步更优选至少97%,进一步更优选至少98%,进一步更优选至少99%的氨基酸序列的多肽;以及(c)(a)或(b)定义的多肽的功能片段构成。
34.嵌合多肽,其适合用于实现下述氨基酸序列在过氧化物酶体表面的暴露,所述氨基酸序列对应于在供体膜结构表面暴露的融合多肽的氨基酸序列,其中,所述嵌合多肽包含与过氧化物酶体膜多肽或其一部分可操作地相连的融合多肽或其一部分。
35.嵌合多肽,其包含:
(a)在分泌途径供体膜胞质表面暴露的融合多肽的结构域;以及
(b)靶向过氧化物酶体膜并与过氧化物酶体膜相连的结构域;
其中,结构域(a)和(b)可操作地相连,并且其中,所述嵌合多肽在包含过氧化物酶体的宿主细胞中的表达赋予所述过氧化物酶体与所述宿主细胞分泌途径受体膜融合的能力。
36.如权利要求35所述的嵌合多肽,其中,结构域(a)和(b)存在于单个的开放读码框中,其中,结构域(a)较之结构域(b)与所述多肽的N末端更为接近。
37.如权利要求35或36所述的嵌合多肽,其中,结构域(a)来自v-SNARE。
38.如权利要求37所述的嵌合多肽,其中,结构域(a)包含来自v-SNARE的从N末端跨越至v-SNARE的第一个跨膜结构域或包括该第一个跨膜结构域在内的片段。
39.如权利要求38所述的嵌合多肽,其中,结构域(a)中的片段包含对应于SEQ ID NO:13的1至95位的序列或展示出与SEQ ID NO:13具有至少50%,优选至少60%,更优选至少70%,进一步更优选至少80%,最优选至少90%同一性程度的同源序列。
40.如权利要求38或39所述的嵌合多肽,其中,所述片段跨越v-SNARE的N末端直到第一个跨膜结构域的氨基酸的至少70%,优选80%,更优选90%,最优选95%。
41.如权利要求35-40中任意一项所述的嵌合多肽,其中,结构域(b)包含跨膜结构域和将所述结构域靶向至所述过氧化物酶体膜的序列。
42.如权利要求41所述的嵌合多肽,其中,最接近结构域(a)的跨膜结构域N末端朝向胞质定向。
43.如权利要求42或43所述的嵌合多肽,其中,结构域(b)包含来自过氧化物酶体膜蛋白的序列。
44.如权利要求43所述的嵌合多肽,其中,结构域(b)来自下述过氧化物酶体膜多肽,所述多肽的N末端天然暴露给所述过氧化物酶体的胞质侧,或者所述多肽具有至少一个其N末端朝向胞质的跨膜结构域。
45.如权利要求44所述的嵌合多肽,其中,结构域(b)来自下述过氧化物酶体膜多肽,所述多肽的N末端已被从最N末端的跨膜结构域去除了多达至少10个氨基酸,所述最N末端的跨膜结构域具有朝向胞质的其N末端。
46.如权利要求45所述的嵌合多肽,其中,结构域(b)来自下述过氧化物酶体膜多肽,所述过氧化物酶体膜多肽选自Pmp22、Pmp34、Pmp47、Pmp70、Pex3、Pex11、Pex14和Pex22。
47.如权利要求46所述的嵌合蛋白,其中,结构域(b)是对应于SEQ ID NO:16的2至224位的序列,优选地,对应于3或4或5或6或7或8或9或10或11或12或13或14或15或16或17或18或19或20或21或22或23或24或25或26或27或28或29或30或31或32或33或34或35或36或37或38或39或40位至224位,或展示出与SEQ IDNO:16具有至少50%,优选至少60%,更优选至少70%,进一步更优选至少80%,最优选至少90%同一性程度的同源序列。
48.如权利要求47所述的嵌合蛋白,其具有根据SEQ ID NO:24的氨基酸序列。
49.编码如权利要求35-48中任意一项定义的嵌合蛋白的核苷酸序列。
50.表达构建体,其包含权利要求49定义的核苷酸序列,所述核苷酸序列与启动子可操作地连接。
CNA2005800353708A 2004-10-15 2005-10-13 在真核细胞中生产化合物的方法 Pending CN101180396A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04105077 2004-10-15
EP04105077.4 2004-10-15
EP05106200.8 2005-07-07

Publications (1)

Publication Number Publication Date
CN101180396A true CN101180396A (zh) 2008-05-14

Family

ID=38890190

Family Applications (3)

Application Number Title Priority Date Filing Date
CNA2005800353708A Pending CN101180396A (zh) 2004-10-15 2005-10-13 在真核细胞中生产化合物的方法
CNA200580034983XA Pending CN101040046A (zh) 2004-10-15 2005-10-13 新颖的食物制造方法
CNA200580035377XA Pending CN101198697A (zh) 2004-10-15 2005-10-17 作为选择性标记的同源amds基因

Family Applications After (2)

Application Number Title Priority Date Filing Date
CNA200580034983XA Pending CN101040046A (zh) 2004-10-15 2005-10-13 新颖的食物制造方法
CNA200580035377XA Pending CN101198697A (zh) 2004-10-15 2005-10-17 作为选择性标记的同源amds基因

Country Status (1)

Country Link
CN (3) CN101180396A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109234177A (zh) * 2017-07-11 2019-01-18 中国农业科学院饲料研究所 一种里氏木霉工程菌及其制备方法与应用
CN111334444A (zh) * 2018-12-19 2020-06-26 中国科学院微生物研究所 长链二元酸生产菌株及其制备方法和应用
CN111406112A (zh) * 2017-11-30 2020-07-10 豪夫迈·罗氏有限公司 用于培养哺乳动物细胞的工艺
CN116286880A (zh) * 2023-02-09 2023-06-23 昆明理工大学 一种过氧化物酶体增值因子基因RkPEX11及其用途

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2807688A1 (en) * 2010-09-06 2012-03-15 Dupont Nutrition Biosciences Aps Food additive comprising amidase for detoxifying ochratoxin

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109234177A (zh) * 2017-07-11 2019-01-18 中国农业科学院饲料研究所 一种里氏木霉工程菌及其制备方法与应用
CN111406112A (zh) * 2017-11-30 2020-07-10 豪夫迈·罗氏有限公司 用于培养哺乳动物细胞的工艺
US20200385673A1 (en) * 2017-11-30 2020-12-10 Hoffmann-La Roche Inc. Process for culturing mammalian cells
CN111334444A (zh) * 2018-12-19 2020-06-26 中国科学院微生物研究所 长链二元酸生产菌株及其制备方法和应用
CN116286880A (zh) * 2023-02-09 2023-06-23 昆明理工大学 一种过氧化物酶体增值因子基因RkPEX11及其用途
CN116286880B (zh) * 2023-02-09 2024-04-30 昆明理工大学 一种过氧化物酶体增值因子基因RkPEX11及其用途

Also Published As

Publication number Publication date
CN101040046A (zh) 2007-09-19
CN101198697A (zh) 2008-06-11

Similar Documents

Publication Publication Date Title
JP5025480B2 (ja) 真核細胞における化合物の生成方法
CN101146820B (zh) 通过提高的分泌来生产多肽的方法
CN103459600B (zh) 用于生产感兴趣的化合物的方法
US6011147A (en) Fungal promoters active in the presence of glucose
CN100547078C (zh) 在缺乏酶的黑曲霉突变体中生产生物物质的方法
CN105586355B (zh) 在镶片镰孢的酶缺陷突变体中产生多肽的方法
EP2825651B1 (en) Recombination system
EP1266011B1 (en) Fungal transcriptional activator useful in methods for producing polypeptides
CN101180396A (zh) 在真核细胞中生产化合物的方法
KR102004003B1 (ko) 변경된 점성 표현형을 갖는 사상균
Xu et al. The arthrospore-related gene Acaxl2 is involved in cephalosporin C production in industrial Acremonium chrysogenum by the regulatory factors AcFKH1 and CPCR1
EP1809659B1 (en) Pntr transcription factor knock-out and uses thereof
JP2002515252A (ja) 糸状菌変異体細胞においてポリペプチドを生産するための方法
EP2132319B1 (en) Method for producing an antifungal peptide in a filamentous fungal host cell
CN103261420A (zh) 用于在真菌细胞中表达基因的启动子
Yu Secretory pathway of the filamentous fungus Trichoderma reesei
CN103339259B (zh) 用于在真菌细胞中表达基因的启动子
CN100439504C (zh) 皂草苷分解酶及其基因以及大豆皂草精醇b的大量生产系统
CN101142231A (zh) 在丝状真菌中重组表达防卫素
US20170002364A1 (en) Recombinant vector for foreign gene expression without biological circuit interference of host cell and uses thereof
Eades Characterization of the alpha-mannosidase gene family in filamentous fungi
JPH099966A (ja) セファロスポリンc生合成に係わる遺伝子を含むdna断片

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20080514