CN101198697A - 作为选择性标记的同源amds基因 - Google Patents

作为选择性标记的同源amds基因 Download PDF

Info

Publication number
CN101198697A
CN101198697A CNA200580035377XA CN200580035377A CN101198697A CN 101198697 A CN101198697 A CN 101198697A CN A200580035377X A CNA200580035377X A CN A200580035377XA CN 200580035377 A CN200580035377 A CN 200580035377A CN 101198697 A CN101198697 A CN 101198697A
Authority
CN
China
Prior art keywords
ala
leu
gly
ser
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200580035377XA
Other languages
English (en)
Inventor
科尼利斯·玛丽亚·雅各布斯·沙吉
约翰尼斯·翰德里克·温德·德
蒂鲍特·乔斯·维恩策尔
布伦达·沃恩克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN101198697A publication Critical patent/CN101198697A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/582Recycling of unreacted starting or intermediate materials

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及来自A.niger的新颖的功能性amdS基因,其可在对生物的转化中用作为显性、双向选择标记基因。本发明还涉及在经本发明的amdS基因转化过的真菌宿主细胞中对感兴趣的化合物的生产。优选的真菌宿主细胞是有丝真菌细胞。本发明的amdS基因提供了鉴定其它Aspergillus物种中功能性同源物的手段。

Description

作为选择性标记的同源AMDS基因
发明领域
本发明涉及分子生物学领域,特别地,本发明涉及用于转化生物的选择标记基因。
发明背景
Aspergillus nidulans amdS基因可能是用于转化有丝真菌的最频繁使用的选择性标记,其已应用于大多数工业上重要的有丝真菌,例如Aspergillus niger(Kelly and Hynes 1985,EMBO J.4:475-479)、Penicilliumchrysogenum(Beri and Turner 1987,Curr.Genet.11:639-641)、Trichodermareesei(Pentilla et al.1987,Gene 61:155-164)、Aspergillus oryzae(Christensen et al.1988,Bio/technology 6:1419-1422)和Trichodermaharzianum(Pe′er et al.1991,Soil Biol.Biochem.23:1043-1046)。
amdS基因作为选择性标记的流行最可能是下述事实的结果:其是惟一可获得的非抗生素标记基因,其可在真菌转化中用作为显性选择性标记。显性选择性标记提供了下述好处:它们可直接用于任何菌株,而不需要突变型受体菌株。然而,抗生素抗性基因对于用于工业菌株来说并不优选,因为考虑到大规模使用携带此类基因的生产菌株在生物圈传播抗生素抗性基因的潜在风险,在大多数国家管理机构都反对使用抗生素标记。
amdS基因作为显性标记甚至已用于已知含有内源amdS基因的真菌,即A.nidulans(Tilburn et al.1983,Gene 26:205-221)和A.oryzae(Gomi et al.1991,Gene 108:91-98)中。在这些情况下,可通过将CsCl加入选择培养基来遏制非转化子的背景。此外,因为存在更高的基因剂量,高拷贝数的转化子提供了相对于非转化子的高的生长优势(当乙酰胺作为唯一氮源的时候)。
除了其显性特征之外,amdS选择性标记提供了作为双向标记的好处。这意味着,与使用乙酰胺作为唯一碳源或氮源针对amdS基因的存在进行的阳性选择不同,可使用氟乙酰胺来进行反向选择,以选出并非存在amdS基因的(Hynes and Pateman 1970,Mol.Gen.Genet.108,107-106)。氟乙酰胺反向选择已被用于从携带有amdS基因的重组构建体来加工经过遗传改造的菌株(例如,Ward et al.1993,Appl.Microbiol.Biotechnol.39,738-743)。
amdS标记的一个缺点在于下述事实:A.nidulans amdS基因在工业真菌,例如A.niger、A.oryzae、T.reesei和P.chrysogenum中是异源基因。即使这对于大多数分子生物学家来说看似是无足轻重的,但是管理机构经常反对,因为含有异源A.nidulans amdS基因的生产菌株具有新的(该基因是异源的)并且不必要的(一旦获得了转化菌株,该标记基因就不是必需的了)属性,其风险无法预见。
我们之前通过开发下述用于获得不含选择性标记的重组生产菌株的方法来解决这一问题(EP-A-0 635 574)。在这种方法中,amdS标记的双向性被用于从特别构建的表达盒中除去标记,这在表达盒一旦引入真菌基因组后进行。但是该方法与工业生产菌株中通常必需的高拷贝数较不兼容。鉴于这些情况,人们仍然需要同源显性选择性标记。
从关于A.nidulans amdS基因作为同源显性标记的用途的第一份报道以来,大量的研究努力使得人们发现了多种其它amdS基因,以用作同源选择标记,例如,在A.oryzae、S.cerevisiae、P.chrysogenum(描述于EP0758020A2中)中。但是,在科学界中已有怀疑:A.niger根本不含可用作为显性标记的功能性amdS基因(Debets et al.,MoI.Gen.Genet.(1990)222:284-290;Debets et al.,Mol.Gen.Genet.(1990)224:264-268;Finkelsteinand Ball,Biotechnology of Filamentous fungi;Technology and products(1992)ISBN 0-7506-91 15-8)。该偏见在过去数年被大大强化,因为几乎十年间都没有从A.niger中鉴定出amdS基因。最近,在A.niger中鉴定出了功能性amdS基因(描述于EP0758020A2中)。
但是,人们仍需要显性双向选择标记基因。
附图描述
图1展示了A.niger表达载体pGBFIN-32。
图2展示了A.niger表达载体pGBFINAMD-2,用于表达新颖的编码乙酰胺酶的基因AMD2。
图3展示了A.niger表达载体pGBFINAAE-1,用于表达新颖的编码乙酰胺酶的基因AAEl。
发明详述
下面定义了用于本说明书的若干术语。
术语“基因”在本文中被定义为编码多肽的DNA序列,无论该DNA序列是cDNA或基因组DNA序列,该术语可含有一个或多个内含子。
术语“选择标记基因”(或者“选择性标记基因”)在本文中被定义为编码下述多肽的基因,所述多肽向含有该基因的细胞提供下述表型,该表型允许对含有该选择标记基因的细胞加以阳性或阴性选择。选择标记基因可用于区别经转化和未经转化的细胞,或者可用于鉴定经历过重组或者其它类型的遗传修饰的细胞。
“乙酰胺酶”在本文中被定义为能催化乙酰胺水解为乙酸和氨,和/或能催化相关酰胺化合物(例如丙烯酰胺或ù-氨基酸)的酶。
术语“amdS基因”在本文中被定义为优选可从有丝真菌获得,编码上文定义的乙酰胺酶的基因。优选地,amdS基因显示出与本领域已知的一种或多种amdS基因(即,来自A.nidulans、A.oryzae、A.niger、P.chrysogenum的amdS基因或来自S.cerevisiae的amdS类似基因)的序列相似性。amdS基因优选编码大约500至600个氨基酸的蛋白。amdS基因因此通常被含有在大约2.0kb的DNA片段中。当然,在基因组amdS基因中内含子的存在可将长度增加至例如大约2.5kb或更多。
术语“同源”基因在本文中被定义为可从属于与实际上含有该基因的菌株相同的物种(包括其变体)的菌株获得的基因。优选地,供体和受体菌株是同样的。应当理解,这同样应用于同源基因编码的多肽。当突变体或片段的来源基因是同源基因的时候,基因的片段和突变体也被认为是同源的。此外,只要编码序列是同源的,调控序列和编码序列的非天然组合也被认为是同源的。术语异源在本文中指下述基因或多肽,针对其的供体和受体菌株不属于同样的物种或其变体。
术语“内源”基因在本文中被定义为关注的生物基因组中基因的天然存在的拷贝。
术语“真菌”在本文中指真菌界Eumycota门的所有成员,由此包括所有有丝真菌和酵母。
“有丝真菌”包括Eumycota和Oomycota亚门的所有有丝形式(如前文Hawksworth et al.,1995所定义)。有丝真菌的特征在于几丁质、纤维素、葡聚糖、脱乙酰几丁质、甘露聚糖和其它复杂多糖构成的菌丝体壁。营养生长通过菌丝延长进行,碳代谢是专性需氧的。有丝真菌菌株包括但不限于,Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium和Trichoderma的菌株。
考虑到术语黑Aspergilli,术语Aspergillus niger在本文中被定义为包括:可在如Raper和Fennell(1965,In:The Genus Aspergillus,The Williams& Wilkins Company,Baltimore,pp 293-344)所定义的Aspergillus niger组中发现的所有(黑)Aspergilli。类似地,此外,对于其它Aspergillus物种而言,我们指上文Raper和Fennell所定义的Aspergillus组,其由此包括这些作者包括在特定组中的所有物种和变体。
从关于A.nidulans amdS基因作为同源显性标记的用途的第一份报道以来,大量的研究努力使得人们发现了多种其它amdS基因,以用作同源选择标记,例如,在A.oryzae、S.cerevisiae、P.chrysogenum(描述于EP0758020A2中)中以及A.niger中(在EP0758020A2中描述过)。
令人吃惊地,我们在A.niger中发现了五种新颖的可能的amdS基因。本发明的新颖的amdS基因可被用作为同源的选择性标记基因,其在本文中被理解为表示,amdS基因被用于对与最初获得amdS基因的物种相同的物种的转化子加以选择。这提供了下述优点:获得的转化子不含外源选择性标记基因。原则上,这允许构建不含外源DNA(除了完全必要的之外,即将被表达的感兴趣的(异源)基因)的重组菌株。
在第一个方面,本发明涉及可从Aspergillus,优选Aspergillus niger获得的、编码乙酰胺酶的DNA序列,其中,所述DNA序列并非EP0758020A2中所述的SEQ ID NO:18,该序列选自下述物质构成的组:
a.具有SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ IDNO:14或SEQ ID NO:17的核苷酸序列的DNA序列,以及
b.(a)中的DNA序列中任何序列的片段或突变体。
在一种优选的实施方式中,根据(a)或(b)的序列编码的乙酰胺酶包含下述氨基酸序列,其中,所述氨基酸序列与SEQ ID NO:3、SEQ IDNO:8、SEQ ID NO:13、SEQ ID NO:16或SEQ ID NO:19中序列之一具有的位置同一性超过40%。优选地,匹配百分比,即位置同一性为至少大约50%,更优选至少大约60%,进一步更优选至少大约70%,进一步更优选至少大约80%,进一步更优选至少大约85%,进一步更优选至少大约90%,进一步更优选至少大约95%,进一步更优选至少大约97%,进一步更优选至少大约98%,进一步更优选至少大约99%,最优选地,匹配百分比,即同一性等于100%。
就本发明的目的而言,两条多肽,或者两条核酸序列之间的同一性程度,即匹配百分比优选使用最优整体比对方法CDA来测定(Huang,1994,A Context Dependent Method for Comparing Sequences,Proceedings of the 5thSymposium on Combinatorial Pattern Matching,Lecture Notes in ComputerScience 807,Springer-Verlag,54-63),其中使用如下参数:(1)用于(多)肽比对:错配:-2,缺口打开(GapOpen):11,缺口延伸(GapExtend):1,文本长度(ContextLength):10,匹配奖励(MatchBonus):1,以及(ii)用于核苷酸序列比对:错配:-15,缺口打开:5,缺口延伸:2,文本长度:10,匹配奖励:1。
术语“同一性程度”、“同一性”和“匹配百分比”可交换使用,以表示通过上述最优整体比对方法计算出的、两条多肽或核酸序列之间的同一性的程度。
用于比对和测定同源性的其它程序的例子是Clustal方法(Higgins,1989,CABIOS 5:151-153)、使用LASERGENE.TM.MEGALIGN.TM.软件(DNASTAR,Inc.,Madison,Wis.)的Wilbur-Lipman方法(Wilbur andLipman,1983,Proceedings of the National Academy of Science USA 80:726-730)、BLAST(NCBI)、用于最优整体比对的GAP(Huang)、用于多条序列比对的MAP(Huang)、MultiBLAST(NCBI)、ClustalW、CapAssembler和Smith Waterman。
参考文献:
Figure A20058003537700091
用于分离或克隆编码多肽的核酸序列的技术是本领域已知的,其包括从基因组DNA的分离,从cDNA的制备或其组合。从上述基因组DNA对本发明的核酸序列的克隆可例如通过使用下述方法来进行,所述方法基于聚合酶链式反应(PCR)或对表达文库进行的抗体筛选(以探测具有共同结构特征的被克隆的DNA片段)(见,例如Innis etal.,1990,PCR:AGuide to Methods and Application,Academic Press,New York.)。其它核酸扩增方法,例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于核酸序列的扩增(NASBA)可以使用。
本文提供的序列信息不应被狭义地理解为需要包括进错误鉴定的碱基。本文公开的特定序列可容易地用于从有丝真菌,特别是A.niger中分离出完整基因,接着还可以容易地对其进行进一步序列分析由此鉴定出序列错误。
除非另有指明,本文中通过对DNA分子测序测得的所有核苷酸序列都是用自动DNA测序仪测得的,本文中,测定的DNA分子编码的多肽的所有氨基酸序列都是通过对上文测定的DNA序列进行翻译推断出来的。因此,如本领域技术人员针对通过该自动方法测得的任何DNA序列已知的那样,本文测定的任何核苷酸序列可能含有一些错误。典型地,通过自动方法测定的核苷酸序列与被测序的DNA的实际核苷酸序列至少大约90%相同,更典型地,至少大约95%至至少大约99.9%相同。可以通过其它方法,包括本领域公知的手动DNA测序方法对实际序列进行更为精确的测定。本领域还已知,较之实际序列,测得的核苷酸序列中的单个插入或缺失将导致对核苷酸序列的翻译中出现读码框位移,这会使得测得的核苷酸序列编码的预期氨基酸序列从上述插入或缺失的点开始就完全不同于被测序的DNA序列实际编码的氨基酸序列。
本领域技术人员能鉴定出此类被错误鉴定的碱基,并且知道如何更正此类错误。
Aspergillus属的优选物种是属于Aspergillus niger的组、Aspergillusglaucus的组、Aspergillus terreus的组、Aspergillus restrictus的组、Aspergillus fumigatus的组、Aspergillus cervinus的组、Aspergillus ornatus的组、Aspergillus clavatus的组、Aspergillus versicolor的组、Aspergillusustus的组、Aspergillus wentii的组、Aspergillus ochraceus的组、Aspergillus candidus的组、Aspergillus cremeus的组、Aspergillus sparsus的组、Aspergillus sojae的组和Aspergillus oryzae的组的有丝真菌。
在第二个方面,本发明涉及包含根据本发明第一个方面的DNA序列的核酸构建体。
“核酸构建体”在本文中被定义为单链或双链的核酸分子,其是从天然存在的基因分离出的,或已经过修饰以含有以自然界中不存在的方式组合及并置的核酸片断。当核酸构建体含有编码序列表达所需的所有控制序列时,术语“核酸构建体”与术语“表达盒”同义。术语“编码序列”在本文中被定义为:能转录成mRNA并翻译成包括本发明乙酰胺酶活性的多肽的序列。编码序列的边界通常通过mRNA 5’末端的ATG起始密码子和mRNA 3’末端终止开放读码框的翻译终止密码子序列来界定。编码序列可包括但不限于DNA、cDNA和重组核酸序列。
表达应被理解为包括对多肽的生产中涉及的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
术语“控制序列”在本文中被定义为包括对于多肽表达来说必须或有益的所有组分。每种控制序列可以是编码多肽的核酸序列天然的或外源的。此类控制序列包括但不限于,引导序列、最优翻译起始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870所述)、聚腺苷化序列、前肽(pro-peptide)序列、前原肽(pre-pro-peptide)序列、启动子、信号序列和转录终止子。就最小程度而言,控制序列包括启动子以及转录和翻译终止信号。
为了引入特异性限制性位点以协助控制序列与编码多肽的核酸序列的编码区域连接,控制序列可与连接子(linker)一起提供。术语“可操作地相连”在本文中被定义为下述构型,其中,控制序列以相对于DNA序列的编码序列的下述位置被合适地放置,所述位置使得控制序列能指导多肽的生产。
控制序列可以是合适的启动子序列,这是能被宿主细胞识别用于表达核酸序列的核酸序列。启动子序列含有能介导多肽表达的转录控制序列。启动子可以是在细胞中显示出转录活性的任何核酸序列,其包括突变型、截短的和杂交的启动子,其可从编码对细胞来说同源或异源的细胞外或细胞内多肽的基因获得。
控制序列还可以是合适的转录终止子序列,这是能被真菌宿主细胞识别用来终止转录的序列。终止子序列与编码多肽的核酸序列的3’末端可操作地相连。在细胞中起作用的任何终止子可用于本发明。
优选用于真菌宿主细胞的终止子可从编码A.oryzae TAKA-淀粉酶、A.niger葡糖淀粉酶(glucoamylase,glaA)、A.nidulans邻氨基苯甲酸盐含酶、A.niger alpha葡糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶类似蛋白酶的基因获得。
控制序列还可以是合适的引导序列,这是mRNA的非翻译区域,其对于通过真菌宿主细胞的翻译来说是重要的。引导序列与编码多肽的核酸序列的5’末端可操作地相连。在细胞中起作用的任何引导序列都可用于本发明。
优选用于真菌宿主细胞的引导序列可从编码A.oryzae TAKA-淀粉酶和A.nidulans丙糖磷酸酯异构酶和A.niger glaA的基因获得。
其它控制序列可从Penicillium IPNS基因或pcbC基因、beta微管蛋白基因获得。WO 01/021779中提到的所有控制序列通过引用并入本文。
控制序列还可以是聚腺苷化序列,这是与核酸序列3’末端可操作地相连,并且当被转录时能被真菌宿主细胞作为信号识别以向被转录的mRNA加上聚腺苷残基的序列。在细胞中起作用的任何聚腺苷化序列都可用于本发明。
优选用于真菌宿主细胞的聚腺苷化序列从编码A.oryzae TAKA-淀粉酶、A.niger葡糖淀粉酶、A.nidulans邻氨基苯甲酸盐合酶、Fusariumoxysporum胰蛋白酶类似蛋白酶和A.niger alpha葡糖苷酶的基因获得。
在其插入到载体之前对编码多肽的核酸序列的操作可能是想要的或必需的,这取决于表达载体。用于利用克隆方法修饰核酸序列的技术是本领域公知的。
在一种优选的实施方式中,包含根据本发明第一方面的DNA序列的核酸构建体包含对于所述DNA序列来说是天然的启动子。
在另一种优选的实施方式中,包含根据本发明第一方面的DNA序列的核酸构建体包含对于所述DNA序列来说是外源的启动子。在该实施方式中,同源amdS基因的天然启动子可被不同的启动子置换。该置换启动子在本文中被称为外源启动子,其可以比天然amdS启动子更强,或者其可以以不同的方式被调控。或者,对天然amdS启动子的置换可用于协助对转化子的选择,例如,通过在乙酰胺或相关酰胺化合物作为唯一N源或C源时转化子相对非转化子的生长优势来进行。优选地,外源启动子还可与其中使用它们的宿主同源。合适的外源启动子可从编码糖分解的酶或醇代谢涉及的酶获得,例如来自编码磷酸甘油酸酯激酶、甘油醛-磷酸酯脱氢酶、丙糖磷酸激酶、丙酮酸激酶或醇脱氢酶基因的启动子。可使用的优选的可诱导启动子是淀粉诱导、铜诱导、油酸诱导的启动子。
在本发明的另一种实施方式中,前述段落的核酸构建体还包括将被表达的感兴趣的基因。感兴趣的基因可与单独的控制序列可操作地相连,或可处于与本发明乙酰胺酶基因可操作地相连的序列的控制之下。
优选地,核酸构建体将被包括于合适的载体中,以使得能引入宿主细胞。载体可以是能方便地经历重组DNA过程并能导致编码多肽的核酸序列表达的任何载体(例如质粒或病毒)。典型地,对载体的选择将取决于载体与载体将被引入的有丝真菌细胞之间的兼容性。载体可以是线性的或闭合环状的质粒。载体可以是自主复制载体,即作为其复制不依赖染色体复制的染色体外主体存在,例如,质粒、染色体外元件、微型染色体或人工染色体。适用于真菌宿主细胞的自主保持的克隆载体可包含AMA1-序列(见,例如Aleksenko and Clutterbuck(1997),Fungal Genet.Biol.21:373-397)。
或者,载体可以是下述载体,当其被引入有丝真菌细胞时,其被整合进基因组,与其已被整合进的染色体一起复制。整合型克隆载体可在有丝真菌宿主的染色体中随机整合或在预定目标位点整合。整合型克隆载体可包含下述DNA片段,该片段与有丝真菌宿主细胞基因组中预定目标基因座中的、用于将克隆载体整合到预定基因座上的DNA序列同源。为促进定位整合,优选在转化宿主细胞之前对克隆载体进行线性化。线性化优选进行至如下程度:使得克隆载体的至少一端侧翼,但优选地,任意一端侧翼,有与目标基因座同源的序列。目标基因座侧翼的同源序列的长度优选为至少30bp,优选地,至少50bp,优选地,至少0.1kb,进一步优选地,至少0.2kb,更优选地,至少0.5kb,进一步更优选地,至少1kb,最优选地,至少2kb。优选地,克隆载体中与目标基因座同源的DNA序列是从高度表达的基因座获得的,这意味着,其是从能在有丝真菌宿主细胞中高水平表达的基因获得的。能高水平表达的基因,即,能高度表达的基因在本文中被定义为其mRNA占细胞总mRNA的至少0.5%(w/w)的基因,例如,在诱导条件下的;或者其基因产物占细胞总蛋白的至少1%(w/w)的基因;或者,在分泌出的基因产物的情况下,可分泌至至少0.1g/l的水平(如EP 357 127 B1所述)。大量优选的高度表达的真菌基因的例子是:来自Aspergilli或Trichoderm的淀粉酶、葡糖淀粉酶、醇脱氢酶、木聚糖酶、磷酸甘油醛脱氢酶或纤维二糖水解酶(cellobiohydrolase,cbh)基因。用于这些目的的最优选的高度表达的基因是葡糖淀粉酶基因(优选A.niger葡糖淀粉酶基因)、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、Trichoderma reesei cbh基因(优选地,cbh1)。
载体系统可以是单个载体或质粒,或两个或多个载体或质粒,它们一起含有将被引入到有丝真菌细胞中的总DNA或转座子。
在第三个方面,本发明涉及一种多肽,其具有本发明第一个方面的DNA序列编码的乙酰胺酶活性。
在一种优选的实施方式中,所述多肽包含序列SEQ ID NO:3、SEQID NO:8、SEQ ID NO:13、SEQ ID NO:16或SEQ ID NO:19中的任一序列。
在第四个方面,本发明涉及一种真菌宿主细胞,其中包含根据本发明第二个方面的核酸构建体。
在一种优选的实施方式中,所述宿主细胞还包含将被表达的感兴趣的基因。
将被表达的感兴趣的基因可编码多肽。多肽可以是对真菌宿主细胞来说天然或异源的任何多肽。术语“异源多肽”在本文中被定义为野生型真菌宿主细胞不生产的多肽。术语“多肽”在本文中不用来指特定长度的被编码产品,因此其包括肽、寡肽和蛋白。多肽还可以是重组多肽,这是对于细胞来说天然的多肽,其通过下述核酸序列编码,所述核酸序列包含对于该核酸序列来说外源的、在对多肽的生产中涉及的一种或多种控制序列。多肽可以是野生型多肽或其变体。多肽还可以是杂交体多肽,其含有从至少两种不同多肽获得的部分或完整多肽序列的组合,其中,至少两种不同多肽中的一种或多种可能与细胞是异源的。多肽还包括上述多肽的天然存在的等位基因和经工程改造的变异。
优选地,多肽是抗体或其一部分、抗原、凝血因子、酶、激素或激素变体、受体或其一部分、调控蛋白、结构蛋白、报道蛋白或转运蛋白、细胞内蛋白、分泌过程涉及的蛋白、折叠过程涉及的蛋白、伴侣分子、肽氨基酸转运蛋白、糖基化因子、转录因子。优选地,多肽是细胞外分泌的。
或者,多肽是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶、连接酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、环糊精糖基转移酶、酯酶.
或者,多肽是碳水化合物酶,例如,纤维素酶,例如内葡聚糖酶,β-葡聚糖酶,纤维二糖水解酶或β-葡糖苷酶,半纤维素酶或胶质水解(pectinolytic)酶,例如,木聚糖酶,木糖苷酶,甘露聚糖酶,半乳糖酶,半乳糖苷酶,胶质甲酯酶,胶质裂解酶,果胶酸盐/酯裂解酶,内聚半乳糖醛酸酶,外聚半乳糖醛酸酶,鼠李半乳糖醛酸酶,阿拉伯聚糖酶,阿拉伯呋喃糖苷酶,阿拉伯木聚糖水解酶,半乳糖醛酸酶,裂解酶或淀粉水解酶;水解酶,异构酶或连接酶,磷酸酶(例如,植酸酶),酯酶(例如脂肪酶),蛋白水解酶,氧化还原酶(例如氧化酶),转移酶或异构酶。更优选地,目标基因编码植酸酶。进一步更优选地,多肽是氨肽酶、淀粉酶、碳水化合物酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶、过氧化氢酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、alpha-半乳糖苷酶、beta-半乳糖苷酶、葡糖淀粉酶、alpha-葡糖苷酶、beta-葡糖苷酶、卤素过氧化物酶、蛋白水解酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变构酶(mutanase)、氧化镁、胶质水解酶、过氧化物酶、磷脂酶、多酚氧化酶、核糖核酸酶、转谷氨酰胺酶或葡萄糖氧化酶、己糖氧化酶、单加氧酶。
或者,多肽是人胰岛素或其类似物、人生长因子、促红细胞生成素、组织血纤维蛋白溶酶原活化因子(tPA)或促胰岛素生成素(insulinotropin)。
编码异源多肽的核酸序列可从任何原核、真核或其它来源获得。就本发明的目的而言,术语“从……获得”在本文中与给定的来源一起使用时将表示,多肽是通过该来源或通过已插入了来自该来源的基因的细胞生产的。
或者,多肽可以是细胞内蛋白或酶,例如伴侣分子、蛋白酶或转录因子。这方面的一个例子在Appl Microbiol Biotechnol.1998 Oct;50(4):447-54(″Analysis of the role of the gene bipA,encoding the major endoplasmicreticulum chaperone protein in the secretion of homologous and heterologousproteins in black Aspergilli.Punt PJ,van Gemeren IA,Drint-Kuijvenhoven J,Hessing JG,van Muijlwijk-Harteveld GM,Beijersbergen A,Verrips CT,vanden Hondel CA)中有所描述。这可用于,例如,提高宿主细胞作为蛋白生产者的效率,如果该多肽(例如伴侣分子、蛋白酶或转录因子)已知是蛋白生产中限制性因素的话。
在本发明的方法中,真菌宿主细胞还可用于对对细胞来说是天然的多肽的重组生产。可通过例如将编码多肽的基因放置于不同启动子的控制下,以增强多肽的表达、通过使用信号序列加速目标天然多肽向细胞外的运输以及增加编码细胞正常生产的多肽的基因的拷贝数,来重组生产天然多肽。在术语“异源多肽”的范围内,本发明还包括,对对细胞来说天然的多肽的上述重组生产,包括程度至:此类表达涉及使用对细胞并非天然的遗传元件,或者使用天然元件,但这些元件已被操作,以按照并非正常存在于有丝真菌细胞中的方式发挥功能。用于分离或克隆编码异源多肽的核酸序列的技术是本领域已知的,其包括从基因组DNA的分离,从cDNA的制备及其组合。
在本发明的方法中,异源多肽还可包括融合的或杂交的多肽,其中,另一个多肽在该多肽或其片段的N末端或C末端融合。融合的多肽是通过将编码一种多肽的核酸序列(或其一部分)与编码另一种多肽的核酸序列(或其一部分)融合产生的。
用于生产融合多肽的技术是本领域已知的,其包括,将编码多肽的编码序列连接起来,使得它们符合读码框原则,并且使得融合的多肽的表达处于同样的启动子和终止子的控制之下。杂交体多肽可包含从至少两种不同多肽获得的部分或全部多肽序列的组合,其中,所述多肽中的一条或多条对突变型真菌细胞来说可能是异源的。可通过多种方法,对编码感兴趣的异源多肽的经分离的核酸序列进行操作,以提供所述多肽的表达。表达应当被理解为包括生产多肽过程所涉及的任何步骤,其包括但不限于,转录、转录后修饰、翻译、翻译后修饰和分泌。在其插入到载体之前,对编码多肽的核酸序列的操作可能是想要的或必需的,这取决于表达载体。用于利用克隆方法修饰核酸序列的技术是本领域公知的。
在另一种优选的实施方式中,真菌宿主细胞的内源乙酰胺酶活性可通过下述方法降低:通过随机诱变、定点诱变、PCR产生的诱变、核苷酸插入核/或缺失和/或取代、基因打断或基因置换技术,反义技术、RNAi技术或其组合对一个或多个内源乙酰胺酶基因进行修饰和/或失活。方法包括但不限于,对亲本细胞进行诱变,选出能生产较之亲本细胞而言具有降低活性的乙酰胺酶的突变细胞。诱变可以是特异性或随机的,例如通过使用合适的物理或化学诱变剂,通过使用合适的寡核苷酸,或者通过对DNA序列进行PCR产生的诱变来进行。此外,诱变可通过使用这些诱变剂的任何组合来进行。
适合本发明目的的物理或化学诱变剂的例子包括紫外(UV)照射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、甲基磺酸乙酯(EMS)、亚硫酸氢钠、蚁酸和核苷酸类似物。
使用此类试剂时,典型地,通过下述方法来进行诱变:在存在选用的诱变剂的情况下,在合适条件下培养待诱变亲本细胞,以及选出展示出降低的基因表达的突变细胞。
或者,可通过使用与基因核酸序列互补的核苷酸序列进行已建立起来的反义技术,来进行对基因的修饰或失活。更具体地,可通过引入与核酸序列互补的核苷酸序列(其可在细胞中转录,并且能与细胞中产生的mRNA杂交)来降低或去除有丝真菌细胞对基因的表达。在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译出的蛋白质的量由此减少或消失。表达反义RNA的例子展示于Appl Environ Microbiol.2000Feb;66(2):775-82.(Characterization of a foldase,protein disulfide isomerase A,in the protein secretory pathway of Aspergillus niger.Ngiam C,Jeenes DJ,PuntPJ,Van Den Hondel CA,Archer DB)或(Zrenner R,Willmitzer L,Sonnewald U.Analysis of the expression of potato uridinediphosphate-glucosepyrophosphorylase and its inhibition by antisense RNA.Planta.(1993);190(2):247-52.)中。
此外,可通过RNA干扰(RNAi)技术(FEMS Microb.Lett.237(2004):317-324)来获得对基因的修饰、负调或失活。在该方法中,核苷酸序列(其表达待受到影响的)的同样的正义或反义部分被依次克隆,中间是核苷酸间隔,并且插入到表达载体中。此种分子转录后,小的(21-23)核苷酸片段的形成将导致待受影响的mRNA的定位降解。对特定mRNA的去除可进行至多种不同的程度。WO2005/05672A1和/或WO2005/026356A1描述的RNA干扰技术可用于对基因的负调、修饰或失活。
或者,根据本发明另一种优选的实施方式,新颖的amdS基因的序列可用于失活生物基因组中amdS基因的内源拷贝(或多个拷贝),该生物指从其中获得该amdS基因的生物。为达到此目的,使用新颖的amdS基因的序列来构建失活载体,以通过同源重组将载体定位至该基因的内源拷贝。然后,可通过置换或通过向内源amdS基因的插入来造成失活。对内源amdS基因的失活提供了下述好处:其可在使用amdS基因作为选择性标记用于引入感兴趣基因的转化中,降低未转化细胞的背景。或者,内源amdS基因座可用作整合的界定位点,用于将被表达的感兴趣的基因。
在另一种优选的实施方式中,在用本发明第二方面的核酸构建体转化过的、以及可选包含待表达的感兴趣的基因和/或具有降低的内源乙酰胺酶活性的真菌宿主细胞中,本发明的第二方面的核酸构建体被缺失,或被失活,这是通过对重组DNA构建体或其组合进行基因置换和/或失活和/或修饰和/或打断来进行的。在该实施方式中,对真菌宿主细胞的转化之后,对转化子进行后续加工处理(curing),以获得EP-A1-0635 574所述的MARKER GENE FREETM重组菌株。或者,可使用用于降低内源乙酰胺酶表达的已有过描述的方法来进行加工处理。
可选地,较之野生型细胞,宿主细胞包含提高的解折叠蛋白应答(UPR),以增加对目标多肽的生产能力。可通过US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2所述的技术来增加UPR。更具体地,HAC1和/或IRE1和/或PTC2的蛋白水平已被调节,用于获得具有提高的UPR的宿主细胞。
或者替代性地,或与提高的UPR组合,可对宿主细胞进行遗传修饰,以获得较之野生型细胞展示出更低的蛋白酶表达和/或蛋白酶分泌的表型,以提高对感兴趣的多肽的生产能力。此类表型可通过对蛋白酶表达的转录调控因子(例如prtT)进行缺失和/或修饰和/或失活来获得。通过调节prtT来降低蛋白酶的表达可通过US2004/0191864A1所述的技术来进行。
或者替代性地,或与提高的UPR和/或展示出更低的蛋白酶表达和/或蛋白酶分泌的表型组合,宿主细胞展示出草酸缺陷型表型,以提高对感兴趣的多肽的生产产量。草酸缺陷型表型可通过WO2004/070022A2所述的技术来获得。
或者替代性地,或与提高的UPR和/或展示出更低的蛋白酶表达和/或蛋白酶分泌和/或草酸缺陷型的表型组合,宿主细胞展示出较之野生型细胞的表型差异组合,以提高对感兴趣的多肽的生产产量。这些差异可包括但不限于葡糖淀粉酶和/或中性alpha淀粉酶A和/或中性alpha淀粉酶B、蛋白酶和草酸水解酶的降低的表达。通过宿主细胞展示出的所述表型差异可通过US2004/0191864A1所述的技术进行遗传修饰来获得。
在一种更为优选的实施方式中,真菌宿主细胞是有丝真菌细胞,优选地,属于Aspergillus、Penicillium或Trichoderma属的种。更优选地,有丝真菌宿主细胞属于Aspergillus niger、Aspergillus oryzae、Aspergillussojae、Trichoderma reesei或Penicillium chrysogenum的组。
在第五个方面,本发明涉及一种方法,用于在第四个方面的真菌宿主细胞中生产感兴趣的化合物。使用本领域已知的方法,在有益于乙酰胺酶和感兴趣的化合物表达的条件下,培养第四个方面的宿主细胞。例如,可通过在合适的培养基中、允许多肽被表达和/或分离的条件下进行摇瓶培养、实验室或工业发酵罐中的小规模或大规模的发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。培养发生于包含碳源和氮源以及无机盐的合适营养培养基中,使用本领域已知的方法来进行(见,例如Bennett,J.W.and LaSure,L.,eds.,More Gene Manipulations in Fungi,Academic Press,CA,1991)。合适的培养基可从商业供货商处获得,或者使用公开的组合物(例如,American Type Culture Collection目录中的)来制备。可选地,通过本领域已知的方法从培养基中回收感兴趣的化合物。如果多肽分泌进营养培养基,可直接从培养基回收多肽。如果多肽不分泌,从细胞裂解物回收多肽。
可通过本领域已知的方法来分离得到的感兴趣的化合物。例如,可通过传统方法,包括但不限于,离心、过滤、萃取、喷雾干燥、蒸发或沉淀,从营养培养基分离感兴趣的化合物。然后可通过本领域已知的大量方法对经分离的感兴趣的化合物加以进一步纯化,所述方法包括但不限于,色谱(例如,离子交换、亲和、疏水、层析聚焦和尺寸排除)、电泳方法(例如制备等电聚焦)、差异溶解度(例如硫酸铵沉淀)或萃取(见,例如Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,New York,1989)。
在一种优选的实施方式中,在培养基中用下述方法来培养第四个方面的宿主细胞,其中,所述培养基包含乙酰胺作为唯一碳源和/或氮源,所述方法中,所述培养导致根据本发明的细胞的比例富集。
在另一种优选的实施方式中,通过将CsCl加入到包含乙酰胺作为唯一碳源和/或氮源的培养基中来降低非转化子背景。
本发明还公开了根据本发明的真菌细胞,优选地,有丝真菌细胞,其具有在含有乙酰胺作为唯一碳源和/或氮源的培养基上良好生长的能力,并且所述能力不是异源乙酰胺酶基因的表达导致的,其是同源乙酰胺酶的表达(优选地过量表达)导致的。细胞在含有乙酰胺作为唯一碳和/或氮源的培养基上良好生长的能力在本文中被定义为:较之相应的野生型细胞生长得更快的能力,其中,野生型被理解为表示针对其乙酰胺酶基因型来说是野生型的。
本发明还将由下述实施例加以描述,所述实施例不应被理解为限制本发明的范围。
实施例
常规分子克隆技术
在本文所述的实施例中,标准分子克隆技术,例如对核酸的分离和纯化、对核酸的电泳、对核酸的酶促修饰、切割和/或扩增、对E.coli的转化等都按照文献(Sambrook et al.(1989)″Molecular Cloning:a laboratorymanual″,Cold Spring Harbour Laboratories,Cold Spring Harbour,New York;lnnis et al.(eds.)(1990)″PCR protocols,a guide to methods and applications″Academic Press,San Diego)所述来进行。所用的Aspergillus niger菌株(CBS 513.88)已保藏于CBS Institute,保藏号为CBS 513.88。
实施例1新颖的A.niger amdS基因的鉴定
通过本领域技术人员熟悉的DNA序列同源性检索,对真菌的经完全注释的基因组序列加以仔细检查,鉴定出新颖的可能的来自A.niger的乙酰胺酶基因。乙酰胺酶基因同源物AMD2的基因组、cDNA和蛋白质序列分别示为SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3。乙酰胺酶同源物AAE1的基因组、cDNA和蛋白质序列分别示为SEQ ID NO:6、SEQID NO:7和SEQ ID NO:8。乙酰胺酶同源物AAE2的基因组、cDNA和蛋白质序列分别示为SEQ ID NO:11、SEQ ID NO:12和SEQ ID NO:13。乙酰胺酶同源物AAE3的基因组、cDNA和蛋白质序列分别示为SEQID NO:14、SEQ ID NO:15和SEQ ID NO:16。乙酰胺酶同源物AAE4的基因组、cDNA和蛋白质序列分别示为SEQ ID NO:17、SEQ ID NO:18和SEQ ID NO:19。
实施例2对新颖的A.niger amdS基因的分子克降
在PCR反应中,用来自CBS513.88的基因组DNA作为模板,用SEQID NO:4和SEQ ID NO:5用于扩增AMD-2基因。按照厂商说明书,用限制性酶PacI和AscI来消化得到的PCR片段(SEQ ID NO:20),将其连接进用PacI、AscI线性化过的图1所示A.niger表达载体中。这得到了下述构建体,其中,编码可能的A.niger乙酰胺酶的AMD2基因被放置于glaA启动子的控制之下(图2)。
此外,在PCR反应中,用来自CBS513.88的基因组DNA作为模板,用SEQ ID NO:9和SEQ ID NO:10用于扩增AAE1基因。按照厂商说明书,用限制性酶PacI和AscI来消化得到的PCR片段(SEQ ID NO:21),将其连接进用PacI、AscI线性化过的图1所示A.niger表达载体中。这得到了下述构建体,其中,编码可能的A.niger乙酰胺酶的AAE1基因被放置于glaA启动子的控制之下(图3)。
得到的编码可能的新颖的A.niger乙酰胺酶的表达构建体(图2和3)被用于转化A.niger CBS513.88。通过PCR,针对乙酰胺酶构建体的存在对转化子加以分析。在实施例3中对选出的克隆进行进一步分析。
实施例3新颖的A.niger amdS基因作为选择标记基因在转化A.niger CBS513.88中的用途
为测定编码可能的乙酰胺酶A.niger同源物的基因是否能在对A.niger的转化中用作为选择标记基因,AMD2和AAE1表达构建体(图2和3)被用于转化A.nigerCBS513.88。最初将转化子培养于含有50μg/ml腐草霉素的培养基上,以选出含有完整表达构建体的基因,因为质粒骨架含有赋予腐草霉素抗性的BLE基因(图1、2和3)。随后,将腐草霉素抗性转化子转移至琼脂培养基,其中含有乙酰胺作为唯一氮源。只有含AMD2或AAE1表达构建体(通过PCR分析证实的)的抗性转化子能在含有乙酰胺作为唯一氮源的培养基上生长,表明AMD2和AAE1的确可在对A.niger的转化中用作为新颖的乙酰胺酶标记基因。
本文描述和要求保护的本发明不限于本文公开的具体实施方式的范围,因为这些实施方式仅用于阐述本发明的若干方面。任何等同的实施方式都在本发明的范围之内。事实上,除了本文所展示和描述的之外,本领域技术人员可从前述说明书明显获得对本发明的多种改变。此类改变也在所附权利要求的范围内。在有冲突的情况下,以本文的公开内容为准,包括定义。
申请人或代理人文件参考编号24805WO 国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)
Figure A20058003537700241
序列表
<110>帝斯曼知识产权资产管理有限公司
<120>作为选择性标记的同源AMDS基因
<130>24805WO
<160>21
<170>PatentIn version 3.1
<210>1
<211>1980
<212>DNA
<213>Aspergillus niger
<400>1
atggccctca catcctggga acaaaccgca gcggccaaac gccaatccgt cctcaacgcc     60
atccccgaga aatggcgcat caagggtcct atccccgcac cgtcggagca gcgcgacgta    120
acaggcccct acatccagca gttcctatcc ccacgcgagg ttgaaatcac cgaaacagac    180
gccgtaggga tcacagagcg aactacaacg ggccagtgga cagctgtgga ggtgaccgag    240
gcgttctgcc atcgcgcagc attggcgcat caactcgtac attccccatc cacaaggagt    300
gctagtctgc gctttactaa tcgagaaaaa ggtaaactgc ttgcatgaaa tcttcttcga    360
tgccgcgctt gaaaccgccc gcattctaga cgaccactac accaagaccg gcaagccact    420
cggtcccctt cacggcctcc ctgtcagtct gaaggatcaa ttccacgtca agggcgtaga    480
aacaaccatg ggttacgtcg gctggataaa caccttccaa ggcaagacca atgacccgcg    540
ctatcttaca cacgaaagcg aactcgttaa agaactccgc gccgcgggag ccgtcctcta    600
ctgcaagact agcgtcccca tgacgttgat gtcaggtgaa accatgaaca atatcataac    660
ttacacacat aacccgaaga acaggcttct cagttctgga ggtagttccg ggggcgaagg    720
agcactgatc gcgttgcggg gatcaccagc cgggtttggt acggatatcg ggggtagtat    780
ccgtgttcct gcgtcgttca atggactgta tgggatacgg ccgtctgtgg ggagaatgcc    840
gtacgagggg gcggccaatt cgggcgatgg acagaatact gtgttgtcgg ttgtggggcc    900
gttgtctcct tcggcgagag ggttgatatt gctgttcaag acggtgttgg gggcaatgcc    960
gtggttggga gatcctggtg tgttggagat tccctggagg gaggaaatcg tagaggagac   1020
gagaaaatta gtgcagggaa agccagaggg gctagctttt ggaatattct acgatgatgg   1080
tcaggtaaag ccgcagccac cggtcgagag agcgatgcgg attgctgcag agacgatcaa   1140
gcgtctagga cataaggtga gtgccctcct tcttcttgcg acactgctaa cattcatccc   1200
agctcatcaa ttgggaaccc ccctctcacc taacagccgc ctccctcgca gtaagtcccc    1260
catccaaccc actacaccac aaccccctaa caataaacca acccccagaa ccgcgcctac    1320
aacatggacg gcggcgccga cgtactccaa aacttcgccc tgtccaacga agccatccac    1380
acctccgtag taatcgacgc atcaggatcc ccccaaaaga ccgcactaga gatcgccgcg    1440
ctaaacgtcg agaagcgcga ataccagaaa caataccttg actactggaa cagcacggcg    1500
caattgacag ggactggacg acccgtcgac gcggtcattt gtccagtggc gccgcatgcg    1560
gcgtgcattc cggggaagta tgcgacgatc gggtatacgg cgtttattaa tgtgttggat    1620
tatacgagtg cggttgtgcc ggttacgagt gctgatagga gggtggatgt tgtagggaag    1680
gaaggaaggg agtattttgg ggagttggat aggaagaccg agggggagtg taagttcttc    1740
cctttctttt cttctttctt ttcattgagc tatccaattt ggttggaggt cttgtgtgtt    1800
tgtttgttcg gagagtggtg atggggttat gtgctgactg gatgtttcta tctagacgat    1860
gcggatgtgt ttgatggggc gccggctggg attcagctct ttggaagacg gcttcaggag    1920
gagaagattc tggtactggc tgagtatctt ggtgaggaat tcaagaaggc tagtgcttga    1980
<210>2
<211>1695
<212>DNA
<213>Aspergillus niger
<400>2
atggccctca catcctggga acaaaccgca gcggccaaac gccaatccgt cctcaacgcc     60
atccccgaga aatggcgcat caagggtcct atccccgcac cgtcggagca gcgcgacgta    120
acaggcccct acatccagca gttcctatcc ccacgcgagg ttgaaatcac cgaaacagac    180
gccgtaggga tcacagagcg aactacaacg ggccagtgga cagctgtgga ggtgaccgag    240
gcgttctgcc atcgcgcagc attggcgcat caactcgtaa actgcttgca tgaaatcttc    300
ttcgatgccg cgcttgaaac cgcccgcatt ctagacgacc actacaccaa gaccggcaag    360
ccactcggtc cccttcacgg cctccctgtc agtctgaagg atcaattcca cgtcaagggc    420
gtagaaacaa ccatgggtta cgtcggctgg ataaacacct tccaaggcaa gaccaatgac    480
ccgcgctatc ttacacacga aagcgaactc gttaaagaac tccgcgccgc gggagccgtc    540
ctctactgca agactagcgt ccccatgacg ttgatgtcag gtgaaaccat gaacaatatc    600
ataacttaca cacataaccc gaagaacagg cttctcagtt ctggaggtag ttccgggggc    660
gaaggagcac tgatcgcgtt gcggggatca ccagccgggt ttggtacgga tatcgggggt    720
agtatccgtg ttcctgcgtc gttcaatgga ctgtatggga tacggccgtc tgtggggaga     780
atgccgtacg agggggcggc caattcgggc gatggacaga atactgtgtt gtcggttgtg     840
gggccgttgt ctccttcggc gagagggttg atattgctgt tcaagacggt gttgggggca     900
atgccgtggt tgggagatcc tggtgtgttg gagattccct ggagggagga aatcgtagag     960
gagacgagaa aattagtgca gggaaagcca gaggggctag cttttggaat attctacgat    1020
gatggtcagg taaagccgca gccaccggtc gagagagcga tgcggattgc tgcagagacg    1080
atcaagcgtc taggacataa gctcatcaat tgggaacccc cctctcacct aacagccgcc    1140
tccctcgcaa accgcgccta caacatggac ggcggcgccg acgtactcca aaacttcgcc    1200
ctgtccaacg aagccatcca cacctccgta gtaatcgacg catcaggatc cccccaaaag    1260
accgcactag agatcgccgc gctaaacgtc gagaagcgcg aataccagaa acaatacctt    1320
gactactgga acagcacggc gcaattgaca gggactggac gacccgtcga cgcggtcatt    1380
tgtccagtgg cgccgcatgc ggcgtgcatt ccggggaagt atgcgacgat cgggtatacg    1440
gcgtttatta atgtgttgga ttatacgagt gcggttgtgc cggttacgag tgctgatagg    1500
agggtggatg ttgtagggaa ggaaggaagg gagtattttg gggagttgga taggaagacc    1560
gagggggagt acgatgcgga tgtgtttgat ggggcgccgg ctgggattca gctctttgga    1620
agacggcttc aggaggagaa gattctggta ctggctgagt atcttggtga ggaattcaag    1680
aaggctagtg cttga                                                     1695
<210>3
<211>564
<212>PRT
<213>Aspergillus niger
<400>3
Met Ala Leu Thr Ser Trp Glu Gln Thr Ala Ala Ala Lys Arg Gln Ser
1               5                   10                  15
Val Leu Asn Ala Ile Pro Glu Lys Trp Arg Ile Lys Gly Pro Ile Pro
            20                  25                  30
Ala Pro Ser Glu Gln Arg Asp Val Thr Gly Pro Tyr Ile Gln Gln Phe
        35                  40                  45
Leu Ser Pro Arg Glu Val Glu Ile Thr Glu Thr Asp Ala Val Gly Ile
    50                  55                  60
Thr Glu Arg Thr Thr Thr Gly Gln Trp Thr Ala Val Glu Val Thr Glu
65                  70                  75                  80
Ala Phe Cys His Arg Ala Ala Leu Ala His Gln Leu Val Asn Cys Leu
                85                  90                  95
His Glu Ile Phe Phe Asp Ala Ala Leu Glu Thr Ala Arg Ile Leu Asp
            100                 105                 110
Asp His Tyr Thr Lys Thr Gly Lys Pro Leu Gly Pro Leu His Gly Leu
        115                 120                 125
Pro Val Ser Leu Lys Asp Gln Phe His Val Lys Gly Val Glu Thr Thr
    130                 135                 140
Met Gly Tyr Val Gly Trp Ile Asn Thr Phe Gln Gly Lys Thr Asn Asp
145                 150                 155                 160
Pro Arg Tyr Leu Thr His Glu Ser Glu Leu Val Lys Glu Leu Arg Ala
                165                 170                 175
Ala Gly Ala Val Leu Tyr Cys Lys Thr Ser Val Pro Met Thr Leu Met
            180                 185                 190
Ser Gly Glu Thr Met Asn Asn Ile Ile Thr Tyr Thr His Asn Pro Lys
        195                 200                 205
Asn Arg Leu Leu Ser Ser Gly Gly Ser Ser Gly Gly Glu Gly Ala Leu
    210                 215                 220
Ile Ala Leu Arg Gly Ser Pro Ala Gly Phe Gly Thr Asp Ile Gly Gly
225                 230                 235                 240
Ser Ile Arg Val Pro Ala Ser Phe Asn Gly Leu Tyr Gly Ile Arg Pro
                245                 250                 255
Ser Val Gly Arg Met Pro Tyr Glu Gly Ala Ala Asn Ser Gly Asp Gly
            260                 265                 270
Gln Asn Thr Val Leu Ser Val Val Gly Pro Leu Ser Pro Ser Ala Arg
        275                 280                 285
Gly Leu Ile Leu Leu Phe Lys Thr Val Leu Gly Ala Met Pro Trp Leu
    290                 295                 300
Gly Asp Pro Gly Val Leu Glu Ile Pro Trp Arg Glu Glu Ile Val Glu
305                 310                 315                 320
Glu Thr Arg Lys Leu Val Gln Gly Lys Pro Glu Gly Leu Ala Phe Gly
                325                 330                 335
Ile Phe Tyr Asp Asp Gly Gln Val Lys Pro Gln Pro Pro Val Glu Arg
            340                 345                 350
Ala Met Arg Ile Ala Ala Glu Thr Ile Lys Arg Leu Gly His Lys Leu
        355                 360                 365
Ile Asn Trp Glu Pro Pro Ser His Leu Thr Ala Ala Ser Leu Ala Asn
    370                 375                 380
Arg Ala Tyr Asn Met Asp Gly Gly Ala Asp Val Leu Gln Asn Phe Ala
385                 390                 395                 400
Leu Ser Asn Glu Ala Ile His Thr Ser Val Val Ile Asp Ala Ser Gly
                405                 410                 415
Ser Pro Gln Lys Thr Ala Leu Glu Ile Ala Ala Leu Asn Val Glu Lys
            420                 425                 430
Arg Glu Tyr Gln Lys Gln Tyr Leu Asp Tyr Trp Asn Ser Thr Ala Gln
        435                 440                 445
Leu Thr Gly Thr Gly Arg Pro Val Asp Ala Val Ile Cys Pro Val Ala
    450                 455                 460
Pro His Ala Ala Cys Ile Pro Gly Lys Tyr Ala Thr Ile Gly Tyr Thr
465                 470                 475                 480
Ala Phe Ile Asn Val Leu Asp Tyr Thr Ser Ala Val Val Pro Val Thr
                485                 490                 495
Ser Ala Asp Arg Arg Val Asp Val Val Gly Lys Glu Gly Arg Glu Tyr
            500                 505                 510
Phe Gly Glu Leu Asp Arg Lys Thr Glu Gly Glu Tyr Asp Ala Asp Val
        515                 520                 525
Phe Asp Gly Ala Pro Ala Gly Ile Gln Leu Phe Gly Arg Arg Leu Gln
    530                 535                 540
Glu Glu Lys Ile Leu Val Leu Ala Glu Tyr Leu Gly Glu Glu Phe Lys
545                 550                 555                 560
Lys Ala Ser Ala
<210>4
<211>42
<212>DNA
<213>引物
<400>4
gtcctgttaa ttaaccttca ccatggccct cacatcctgg ga                        42
<210>5
<211>41
<212>DNA
<213>引物
<400>5
acttcaggcg cgcctttaag cactagcctt cttgaattcc t                         41
<210>6
<211>1954
<212>DNA
<213>Aspergillus niger
<400>6
atgcttcccc cctttgatta ctttacgtat cgtcgcatcc ggtaggttac cccgtgtgcc     60
ttcacgcagc aacttaagca gtcctacaca gcccacatgc aacttagccg acggctcact    120
gaccattcac agggacctca agaggaggga acgggcggct cgatttgcat cgctatctcc    180
cgattatcat gcgcccttct cggctatcga cagggttatc attaacaagc ctatccagga    240
cttggtatat gaggtccaga atgattcctt ggcaccttta gatgtcctac gcacatacgg    300
caaggttgca gtcaaggctc acgaaaagac caattgcgtg actgagcttc tattgcctga    360
ggcagaatca tgggctcagt ccgaagtaaa cctaaaaggt cccctggcgg gtgtgcctat    420
ctctttgaaa gactcggtgc aagtcaaagg attcgatatt actctggggt ataccaagtt    480
cgcgtgtaaa ccgtataagg aggatggtcc aatggcaaag ctgttgaagg atgctggtag    540
gtgacctgtg ccgcgaaaca tcacagaaag tatccctgcg ctaatgatga actccatcag     600
gtgcggtccc atatgcgaaa acggcgctgc ccgtgacgct tctgtcgttc gaatcagcaa     660
acgctctttg gggtcactgc cttaacccac atgtcccgga atactctcct ggcggctcga     720
cgggtggtga aggtgctctg ctggctcttg gtggtcgcat cggtatcggg tcggatgtcg     780
ctggctcggt tcgcgttccc gctgcctgga gcggcatcta ctccctccgc tgtagtactg     840
gccgctggcc taaggtcgga gtcaacacca gcatggctgg ccaggaaggt gttgccagtg     900
tcttcagtcc tatggcccgt actttgaacg atctcaccta tttcaccaaa gctattgtcg     960
gaatgaagcc ttggaactac gaccataccg tccaccctat ctcctggaga gaagatgagg    1020
aaattgaagc ccaaaacaaa aggttgagga tcggcctcat gagcaacgat ggtaagttcc    1080
aagagcgggg acatcaagga cactacttgg gcctttctga ccacttgcag gtgtcgttcc    1140
cccaacgccg gccattgaac gtgctatttc caccacagta gccgccctca ccgccgctgg    1200
gcatactgta tctgagatca caccccccgc tgcggctgac acttttactg gtctctccct    1260
cgcctcgcag ctgctcaact ctgatgggtg cgtcacgttt aactcgcatc tgcacagctt    1320
tgagccatcc gaccctggtg cagatcagct gacgcggata tgcaatctgc cccgtcctct    1380
acgttatctc tactaccttt gggttcggta catccgacgg gatgagaagt gggcgacgct    1440
gatccgcggg tttgccccca agtctgcggc ggagctttgg aagctcactg cccagcggga    1500
agctttccgg gcgacctggc acagctggtg ggatgccgag acgcagcagt acgatttcat    1560
cctctgcccc gtcaatgcga cgccggctct gccccacaaa gccatgcacg atgcggtatc    1620
ctcatgcgga tacacgttcc tctggaacct gctggactac acagccggtg tcgtgcctgt    1680
ctcgcacgtg gacgcgaaga aggatgctct gtctggtccg tacaagaagg tgctgaaaca    1740
gctgggagcc agcaacgcgg tggcctacgg tgcctggaag cactacgacg cggcgaagat    1800
ggcgggattg cctactgcag tgcaggtggt gggacgcaga tggcaggaag agaaggtgct    1860
tggatacatg gcggcagttg aggaggcctt ggagcagtat caggacccgg taactggaga    1920
aggggggaaa tacccattga ttgagcttga ctag                                1954
<210>7
<211>1740
<212>DNA
<213>Aspergillus niger
<400>7
atgcttcccc cctttgatta ctttacgtat cgtcgcatcc gggacctcaa gaggagggaa      60
cgggcggctc gatttgcatc gctatctccc gattatcatg cgcccttctc ggctatcgac     120
agggttatca ttaacaagcc tatccaggac ttggtatatg aggtccagaa tgattccttg     180
gcacctttag atgtcctacg cacatacggc aaggttgcag tcaaggctca cgaaaagacc     240
aattgcgtga ctgagcttct attgcctgag gcagaatcat gggctcagtc cgaagtaaac     300
ctaaaaggtc ccctggcggg tgtgcctatc tctttgaaag actcggtgca agtcaaagga     360
ttcgatatta ctctggggta taccaagttc gcgtgtaaac cgtataagga ggatggtcca     420
atggcaaagc tgttgaagga tgctggtgcg gtcccatatg cgaaaacggc gctgcccgtg     480
acgcttctgt cgttcgaatc agcaaacgct ctttggggtc actgccttaa cccacatgtc     540
ccggaatact ctcctggcgg ctcgacgggt ggtgaaggtg ctctgctggc tcttggtggt     600
cgcatcggta tcgggtcgga tgtcgctggc tcggttcgcg ttcccgctgc ctggagcggc     660
atctactccc tccgctgtag tactggccgc tggcctaagg tcggagtcaa caccagcatg     720
gctggccagg aaggtgttgc cagtgtcttc agtcctatgg cccgtacttt gaacgatctc     780
acctatttca ccaaagctat tgtcggaatg aagccttgga actacgacca taccgtccac     840
cctatctcct ggagagaaga tgaggaaatt gaagcccaaa acaaaaggtt gaggatcggc     900
ctcatgagca acgatggtgt cgttccccca acgccggcca ttgaacgtgc tatttccacc     960
acagtagccg ccctcaccgc cgctgggcat actgtatctg agatcacacc ccccgctgcg    1020
gctgacactt ttactggtct ctccctcgcc tcgcagctgc tcaactctga tgggtgcgtc    1080
acgtttaact cgcatctgca cagctttgag ccatccgacc ctggtgcaga tcagctgacg    1140
cggatatgca atctgccccg tcctctacgt tatctctact acctttgggt tcggtacatc    1200
cgacgggatg agaagtgggc gacgctgatc cgcgggtttg cccccaagtc tgcggcggag    1260
ctttggaagc tcactgccca gcgggaagct ttccgggcga cctggcacag ctggtgggat    1320
gccgagacgc agcagtacga tttcatcctc tgccccgtca atgcgacgcc ggctctgccc    1380
cacaaagcca tgcacgatgc ggtatcctca tgcggataca cgttcctctg gaacctgctg    1440
gactacacag ccggtgtcgt gcctgtctcg cacgtggacg cgaagaagga tgctctgtct    1500
ggtccgtaca agaaggtgct gaaacagctg ggagccagca acgcggtggc ctacggtgcc    1560
tggaagcact acgacgcggc gaagatggcg ggattgccta ctgcagtgca ggtggtggga    1620
cgcagatggc aggaagagaa ggtgcttgga tacatggcgg cagttgagga ggccttggag    1680
cagtatcagg acccggtaac tggagaaggg gggaaatacc cattgattga gcttgactag    1740
<210>8
<211>579
<212>PRT
<213>Aspergillus niger
<400>8
Met Leu Pro Pro Phe Asp Tyr Phe Thr Tyr Arg Arg Ile Arg Asp Leu
1               5                   10                  15
Lys Arg Arg Glu Arg Ala Ala Arg Phe Ala Ser Leu Ser Pro Asp Tyr
            20                  25                  30
His Ala Pro Phe Ser Ala Ile Asp Arg Val Ile Ile Asn Lys Pro Ile
        35                  40                  45
Gln Asp Leu Val Tyr Glu Val Gln Asn Asp Ser Leu Ala Pro Leu Asp
    50                  55                  60
Val Leu Arg Thr Tyr Gly Lys Val Ala Val Lys Ala His Glu Lys Thr
65                  70                  75                  80
Asn Cys Val Thr Glu Leu Leu Leu Pro Glu Ala Glu Ser Trp Ala Gln
                85                  90                  95
Ser Glu Val Asn Leu Lys Gly Pro Leu Ala Gly Val Pro Ile Ser Leu
            100                 105                 110
Lys Asp Ser Val Gln Val Lys Gly Phe Asp Ile Thr Leu Gly Tyr Thr
        115                 120                 125
Lys Phe Ala Cys Lys Pro Tyr Lys Glu Asp Gly Pro Met Ala Lys Leu
    130                 135                 140
Leu Lys Asp Ala Gly Ala Val Pro Tyr Ala Lys Thr Ala Leu Pro Val
145                 150                 155                 160
Thr Leu Leu Ser Phe Glu Ser Ala Asn Ala Leu Trp Gly His Cys Leu
                165                 170                 175
Asn Pro His Val Pro Glu Tyr Ser Pro Gly Gly Ser Thr Gly Gly Glu
            180                 185                 190
Gly Ala Leu Leu Ala Leu Gly Gly Arg Ile Gly Ile Gly Ser Asp Val
        195                 200                 205
Ala Gly Ser Val Arg Val Pro Ala Ala Trp Ser Gly Ile Tyr Ser Leu
    210                 215                 220
Arg Cys Ser Thr Gly Arg Trp Pro Lys Val Gly Val Asn Thr Ser Met
225                 230                 235                 240
Ala Gly Gln Glu Gly Val Ala Ser Val Phe Ser Pro Met Ala Arg Thr
                245                 250                 255
Leu Asn Asp Leu Thr Tyr Phe Thr Lys Ala Ile Val Gly Met Lys Pro
            260                 265                 270
Trp Asn Tyr Asp His Thr Val His Pro Ile Ser Trp Arg Glu Asp Glu
        275                 280                 285
Glu Ile Glu Ala Gln Asn Lys Arg Leu Arg Ile Gly Leu Met Ser Asn
    290                 295                 300
Asp Gly Val Val Pro Pro Thr Pro Ala Ile Glu Arg Ala Ile Ser Thr
305                 310                 315                 320
Thr Val Ala Ala Leu Thr Ala Ala Gly His Thr Val Ser Glu Ile Thr
                325                 330                 335
Pro Pro Ala Ala Ala Asp Thr Phe Thr Gly Leu Ser Leu Ala Ser Gln
            340                 345                 350
Leu Leu Asn Ser Asp Gly Cys Val Thr Phe Asn Ser His Leu His Ser
        355                 360                 365
Phe Glu Pro Ser Asp Pro Gly Ala Asp Gln Leu Thr Arg Ile Cys Asn
    370                 375                 380
Leu Pro Arg Pro Leu Arg Tyr Leu Tyr Tyr Leu Trp Val Arg Tyr Ile
385                 390                 395                 400
Arg Arg Asp Glu Lys Trp Ala Thr Leu Ile Arg Gly Phe Ala Pro Lys
                405                 410                 415
Ser Ala Ala Glu Leu Trp Lys Leu Thr Ala Gln Arg Glu Ala Phe Arg
            420                 425                 430
Ala Thr Trp His Ser Trp Trp Asp Ala Glu Thr Gln Gln Tyr Asp Phe
        435                 440                 445
Ile Leu Cys Pro Val Asn Ala Thr Pro Ala Leu Pro His Lys Ala Met
    450                 455                 460
His Asp Ala Val Ser Ser Cys Gly Tyr Thr Phe Leu Trp Asn Leu Leu
465                 470                 475                 480
Asp Tyr Thr Ala Gly Val Val Pro Val Ser His Val Asp Ala Lys Lys
                485                 490                 495
Asp Ala Leu Ser Gly Pro Tyr Lys Lys Val Leu Lys Gln Leu Gly Ala
            500                 505                 510
Ser Asn Ala Val Ala Tyr Gly Ala Trp Lys His Tyr Asp Ala Ala Lys
        515                 520                 525
Met Ala Gly Leu Pro Thr Ala Val Gln Val Val Gly Arg Arg Trp Gln
    530                 535                 540
Glu Glu Lys Val Leu Gly Tyr Met Ala Ala Val Glu Glu Ala Leu Glu
545                 550                 555                 560
Gln Tyr Gln Asp Pro Val Thr Gly Glu Gly Gly Lys Tyr Pro Leu Ile
                565                 570                 575
Glu Leu Asp
<210>9
<211>40
<212>DNA
<213>引物
<400>9
gtcctgttaa ttaaccacca tgcttccccc ctttgattac                                    40
<210>10
<211>39
<212>DNA
<213>引物
<400>10
acttcaggcg cgccctagtc aagctcaatc aatgggtat                             39
<210>11
<211>1735
<212>DNA
<213>Aspergillus niger
<400>11
atgtcgctcc tgcgggaagc cgagaagtgc ttggctaatc agggctctca tgcggctcta      60
aatgcgctaa ttaccaccct acatcagtca ggacaatggt tggaacgtgt gagagatgcg     120
gatgcgcggc gcacccgggg tgagtatgaa ggctgcattg aaaccaatcc tcgctttatt     180
cagagctgac caactcgctt cgccaaatag ggacgcctaa atctgagata gatggccggt     240
tggttgccgt caaggacaat atgtgcacac gcgaccttcc aacaacatgc gcttcaaacg     300
ctctggacaa attcgtcagt ccgtttaacg cgacagtcgt tcaacaattg gaggatgcag     360
gcgctgtcgt ggccgggaaa gctaatctcg acgaatttgg aatgggctcc cactctattc     420
attcaaactt tggccctgtc agaagctcgc gccgtggcca ggatgcagaa tacctctcag     480
ccggtggtag ttcgggtgga agtgcggttg ctgttgcgac agcccaatgt tacgcgtatg     540
taactctcca gattagcctt gaatcatacg acgagtaacg gtttggctta acattgctgg     600
aacatttaca gagcgttggg aactgataca ggcggctccg tgcgattacc cgcagcatat     660
acgggaacag tcggcttcaa gccttcttat gggctggtct ctcgctgggg agtggttgcg     720
tacgctaatt cactggatac agtcggtgta ctgggaaggg acgtggccag cgttcgccat     780
gtcttcggta tgtcttgatt atgtcggaat ttctctcgtc tctttgcgtc tcgactcact     840
aactcgtgtt cgaaacatag gcgtcgtgaa ccagcatgat tcacgcgatc ccactaacct     900
ttctccctcc agtcggtcac ggatagactc acatcttaaa atgtctgctt tggcatctcg     960
gacaagttct cctcttagga taggagtccc tctcgagtac aacatatcag agttgtctcc    1020
atctgcgcga catgcgtggt ctcgctctct ggcctatttg caacgacagg gccatagcat    1080
ccaaacggtg tcccttccaa cgaccaaact cgccttatcg gcatattacg tactcgcgcc    1140
tgctgaggca tcctcaaacc tggccaagta tgatggcgtc aggtacggaa gccgccccga    1200
agcaccagac ggaaatgcat catcagaaag gtatctatat gcgaaaacac gaggtgatgg    1260
gttcggctcc gaagtcaaaa gacgaatttt gctcggggca tttagcctaa gcgctgacgc    1320
tatggataac tacttcattc aagcacagcg ggttcgccgc cttgtccaac atgacttcaa    1380
cgccgcgttt agggcatgcc agccattgat ttcctcgcaa cttggatcaa agtcgggttc    1440
tgcagacacc ggtgtagatg ttctcatttg cccgacagcg ccatcatcac caccacgcat    1500
ttcaagcctt ataggacctg atgcgacaac ttcgcctttg gaggcatata cgaatgatgt    1560
atttactgtg cctgctagtt tggcaggtct tccggctata tctgtgccgg tcactacaga    1620
aaatgctgat ggcgccgagg atggagatct ggctggaatc caagtaattg gccaatacgg    1680
tgatgatgag cttgtgttaa aggttgccga gctgctcgag ggcaggcacc tatga         1735
<210>12
<211>1515
<212>DNA
<213>Aspergillus niger
<400>12
atgtcgctcc tgcgggaagc cgagaagtgc ttggctaatc agggctctca tgcggctcta     60
aatgcgctaa ttaccaccct acatcagtca ggacaatggt tggaacgtgt gagagatgcg    120
gatgcgcggc gcacccgggg gacgcctaaa tctgagatag atggccggtt ggttgccgtc    180
aaggacaata tgtgcacacg cgaccttcca acaacatgcg cttcaaacgc tctggacaaa    240
ttcgtcagtc cgtttaacgc gacagtcgtt caacaattgg aggatgcagg cgctgtcgtg    300
gccgggaaag ctaatctcga cgaatttgga atgggctccc actctattca ttcaaacttt    360
ggccctgtca gaagctcgcg ccgtggccag gatgcagaat acctctcagc cggtggtagt    420
tcgggtggaa gtgcggttgc tgttgcgaca gcccaatgtt acgcagcgtt gggaactgat    480
acaggcggct ccgtgcgatt acccgcagca tatacgggaa cagtcggctt caagccttct    540
tatgggctgg tctctcgctg gggagtggtt gcgtacgcta attcactgga tacagtcggt    600
gtactgggaa gggacgtggc cagcgttcgc catgtcttcg gcgtcgtgaa ccagcatgat    660
tcacgcgatc ccactaacct ttctccctcc agtcggtcac ggatagactc acatcttaaa    720
atgtctgctt tggcatctcg gacaagttct cctcttagga taggagtccc tctcgagtac    780
aacatatcag agttgtctcc atctgcgcga catgcgtggt ctcgctctct ggcctatttg    840
caacgacagg gccatagcat ccaaacggtg tcccttccaa cgaccaaact cgccttatcg    900
gcatattacg tactcgcgcc tgctgaggca tcctcaaacc tggccaagta tgatggcgtc    960
aggtacggaa gccgccccga agcaccagac ggaaatgcat catcagaaag gtatctatat   1020
gcgaaaacac gaggtgatgg gttcggctcc gaagtcaaaa gacgaatttt gctcggggca   1080
tttagcctaa gcgctgacgc tatggataac tacttcattc aagcacagcg ggttcgccgc   1140
cttgtccaac atgacttcaa cgccgcgttt agggcatgcc agccattgat ttcctcgcaa   1200
cttggatcaa agtcgggttc tgcagacacc ggtgtagatg ttctcatttg cccgacagcg    1260
ccatcatcac caccacgcat ttcaagcctt ataggacctg atgcgacaac ttcgcctttg    1320
gaggcatata cgaatgatgt atttactgtg cctgctagtt tggcaggtct tccggctata    1380
tctgtgccgg tcactacaga aaatgctgat ggcgccgagg atggagatct ggctggaatc    1440
caagtaattg gccaatacgg tgatgatgag cttgtgttaa aggttgccga gctgctcgag    1500
ggcaggcacc tatga                                                     1515
<210>13
<211>504
<212>PRT
<213>Aspergillus niger
<400>13
Met Ser Leu Leu Arg Glu Ala Glu Lys Cys Leu Ala Asn Gln Gly Ser
1               5                   10                  15
His Ala Ala Leu Asn Ala Leu Ile Thr Thr Leu His Gln Ser Gly Gln
            20                  25                  30
Trp Leu Glu Arg Val Arg Asp Ala Asp Ala Arg Arg Thr Arg Gly Thr
        35                  40                  45
Pro Lys Ser Glu Ile Asp Gly Arg Leu Val Ala Val Lys Asp Asn Met
    50                  55                  60
Cys Thr Arg Asp Leu Pro Thr Thr Cys Ala Ser Asn Ala Leu Asp Lys
65                  70                  75                  80
Phe Val Ser Pro Phe Asn Ala Thr Val Val Gln Gln Leu Glu Asp Ala
                85                  90                  95
Gly Ala Val Val Ala Gly Lys Ala Asn Leu Asp Glu Phe Gly Met Gly
            100                 105                 110
Ser His Ser Ile His Ser Asn Phe Gly Pro Val Arg Ser Ser Arg Arg
        115                 120                 125
Gly Gln Asp Ala Glu Tyr Leu Ser Ala Gly Gly Ser Ser Gly Gly Ser
    130                 135                 140
Ala Val Ala Val Ala Thr Ala Gln Cys Tyr Ala Ala Leu Gly Thr Asp
145                 150                 155                 160
Thr Gly Gly Ser Val Arg Leu Pro Ala Ala Tyr Thr Gly Thr Val Gly
                165                 170                 175
Phe Lys Pro Ser Tyr Gly Leu Val Ser Arg Trp Gly Val Val Ala Tyr
            180                 185                 190
Ala Asn Ser Leu Asp Thr Val Gly Val Leu Gly Arg Asp Val Ala Ser
        195                 200                 205
Val Arg His Val Phe Gly Val Val Asn Gln His Asp Ser Arg Asp Pro
    210                 215                 220
Thr Asn Leu Ser Pro Ser Ser Arg Ser Arg Ile Asp Ser His Leu Lys
225                 230                 235                 240
Met Ser Ala Leu Ala Ser Arg Thr Ser Ser Pro Leu Arg Ile Gly Val
                245                 250                 255
Pro Leu Glu Tyr Asn Ile Ser Glu Leu Ser Pro Ser Ala Arg His Ala
            260                 265                 270
Trp Ser Arg Ser Leu Ala Tyr Leu Gln Arg Gln Gly His Ser Ile Gln
        275                 280                 285
Thr Val Ser Leu Pro Thr Thr Lys Leu Ala Leu Ser Ala Tyr Tyr Val
    290                 295                 300
Leu Ala Pro Ala Glu Ala Ser Ser Asn Leu Ala Lys Tyr Asp Gly Val
305                 310                 315                 320
Arg Tyr Gly Ser Arg Pro Glu Ala Pro Asp Gly Asn Ala Ser Ser Glu
                325                 330                 335
Arg Tyr Leu Tyr Ala Lys Thr Arg Gly Asp Gly Phe Gly Ser Glu Val
            340                 345                 350
Lys Arg Arg Ile Leu Leu Gly Ala Phe Ser Leu Ser Ala Asp Ala Met
        355                 360                 365
Asp Asn Tyr Phe Ile Gln Ala Gln Arg Val Arg Arg Leu Val Gln His
    370                 375                 380
Asp Phe Asn Ala Ala Phe Arg Ala Cys Gln Pro Leu Ile Ser Ser Gln
385                 390                 395                 400
Leu Gly Ser Lys Ser Gly Ser Ala Asp Thr Gly Val Asp Val Leu Ile
                405                 410                 415
Cys Pro Thr Ala Pro Ser Ser Pro Pro Arg Ile Ser Ser Leu Ile Gly
            420                 425                 430
Pro Asp Ala Thr Thr Ser Pro Leu Glu Ala Tyr Thr Asn Asp Val Phe
        435                 440                 445
Thr Val Pro Ala Ser Leu Ala Gly Leu Pro Ala Ile Ser Val Pro Val
    450                 455                 460
Thr Thr Glu Asn Ala Asp Gly Ala Glu Asp Gly Asp Leu Ala Gly Ile
465                 470                 475                 480
Gln Val Ile Gly Gln Tyr Gly Asp Asp Glu Leu Val Leu Lys Val Ala
                485                 490                 495
Glu Leu Leu Glu Gly Arg His Leu
            500
<210>14
<211>1760
<212>DNA
<213>Aspergillus niger
<400>14
atggcgaaca caacgtggga gcatagagcc aagagcaagc aagctcagac ggcagcagcg     60
attccaccag aatggacttt accagccgat atacttctcg actcctcggc gaatgtcctc    120
gatgtgccca ggacctgtgg gctcctgacc gaaagagaaa tccatattac cgaagactat    180
gatgccacag cattacttga aaagttggct accggagagt tcagctcact cgaggtcacg    240
acagcattct gcaagcgggc tgcaattgcg cagcagttga cctgctgctt gacggaaatc    300
ttcttcgaca aagcactagc cagagcaaag cagctcgacg aaattctggc tcaaactggg    360
gtaacaaccg ggccactgca tggcctgccc ataagtatca aggagtcgtt caatgtccct    420
ggagttccga ctacactggg gttcgtcgga tttctcgatc gggccccggc gtccatgagt    480
tccgccctgg ttgagatcct gaacaactgt ggggctgttc tatatgtcaa gaccaatgtc    540
ccccagacaa tgatgactcc ggactcccat aacaatgtct tcggtcgtgt gctcaacccg     600
cacggacgga gcctgaccgc tggaggcagc agtggcggag agggagcatt ggtggcgatg     660
aggggctcag tcctcggcgt ggggacagat atcgccggct ccattcgcat ccccgccctc     720
tgctgtggtg tttttggttt caaacccacg gcttgccgta tcccatatgc aggtcaaacg     780
tctgccgggc gtccgggtat gacgggcatc ctgccgtccg ccgggcccat gtgccattct     840
atccgcgatg cagaactctt tctcaaagtt gtcctcaact cgaggcctgc cgatctggat     900
gactatgcac tcgacattcc atggtcccct gctccgcaaa aggagaggct tactattggg     960
ctcctgcccg aggacccgtc gttcccgctt catccaccga tgcgacgtac cctgaacgcc    1020
gcagtgaagg cgctgactac agccggacac cgggtcatcg acctctcagg acaggctccg    1080
tccttctcca atgcatgttc tctggcattg cgatatttcg gcctggaccc ggatcgaact    1140
gcactgcgcc acataacgca ggcgggcgaa cctttcattc cttcgctcaa attcacctat    1200
gatctcaatg agccgacacg tgagcccacc ttgagagatc tattcgaatc gaatgtcgcc    1260
cgtagtcagc tcgcaaccca ggcacgaaag ctcttcgttg ataatcagct tgatctgttc    1320
ctgggcgcgg cttatcaaag cacatcggtt ccccatgata cctacggtat tccggtatat    1380
accgtgcttt ggaacctgat taatgtgggt atcccacact gcctttcttg ttttcttttt    1440
cttttttgtt tccccccctt ctttctgctc caattgcatg gggtgtctgc taatgatgca    1500
ctagtatccg gcgtgcgtta tcccatttgg gcaggccaac aaggtagagg acgcagcgta    1560
taaccgcgac gtctcttatg tgccagactg taagttgcgc ccctcaattg gtctcgctca    1620
gtctactaac tactgtagat cggccagaag aaattgaagg cgcaccgtgt cacatccatc    1680
tgataggcag accgatggcg gacgaaaaat tggttcagga tgcgaagact atatgcaccg    1740
taatgagtga tgtctcttga                                                1760
<210>15
<211>1611
<212>DNA
<213>Aspergillus niger
<400>15
atggcgaaca caacgtggga gcatagagcc aagagcaagc aagctcagac ggcagcagcg     60
attccaccag aatggacttt accagccgat atacttctcg actcctcggc gaatgtcctc    120
gatgtgccca ggacctgtgg gctcctgacc gaaagagaaa tccatattac cgaagactat    180
gatgccacag cattacttga aaagttggct accggagagt tcagctcact cgaggtcacg    240
acagcattct gcaagcgggc tgcaattgcg cagcagttga cctgctgctt gacggaaatc    300
ttcttcgaca aagcactagc cagagcaaag cagctcgacg aaattctggc tcaaactggg    360
gtaacaaccg ggccactgca tggcctgccc ataagtatca aggagtcgtt caatgtccct    420
ggagttccga ctacactggg gttcgtcgga tttctcgatc gggccccggc gtccatgagt    480
tccgccctgg ttgagatcct gaacaactgt ggggctgttc tatatgtcaa gaccaatgtc    540
ccccagacaa tgatgactcc ggactcccat aacaatgtct tcggtcgtgt gctcaacccg    600
cacggacgga gcctgaccgc tggaggcagc agtggcggag agggagcatt ggtggcgatg    660
aggggctcag tcctcggcgt ggggacagat atcgccggct ccattcgcat ccccgccctc    720
tgctgtggtg tttttggttt caaacccacg gcttgccgta tcccatatgc aggtcaaacg    780
tctgccgggc gtccgggtat gacgggcatc ctgccgtccg ccgggcccat gtgccattct    840
atccgcgatg cagaactctt tctcaaagtt gtcctcaact cgaggcctgc cgatctggat    900
gactatgcac tcgacattcc atggtcccct gctccgcaaa aggagaggct tactattggg    960
ctcctgcccg aggacccgtc gttcccgctt catccaccga tgcgacgtac cctgaacgcc   1020
gcagtgaagg cgctgactac agccggacac cgggtcatcg acctctcagg acaggctccg   1080
tccttctcca atgcatgttc tctggcattg cgatatttcg gcctggaccc ggatcgaact   1140
gcactgcgcc acataacgca ggcgggcgaa cctttcattc cttcgctcaa attcacctat   1200
gatctcaatg agccgacacg tgagcccacc ttgagagatc tattcgaatc gaatgtcgcc   1260
cgtagtcagc tcgcaaccca ggcacgaaag ctcttcgttg ataatcagct tgatctgttc   1320
ctgggcgcgg cttatcaaag cacatcggtt ccccatgata cctacggtat tccggtatat   1380
accgtgcttt ggaacctgat taattatccg gcgtgcgtta tcccatttgg gcaggccaac   1440
aaggtagagg acgcagcgta taaccgcgac gtctcttatg tgccagacta tcggccagaa   1500
gaaattgaag gcgcaccgtg tcacatccat ctgataggca gaccgatggc ggacgaaaaa   1560
ttggttcagg atgcgaagac tatatgcacc gtaatgagtg atgtctcttg a            1611
<210>16
<211>536
<212>PRT
<213>Aspergillus  niger
<400>16
Met Ala Asn Thr Thr Trp Glu His Arg Ala Lys Ser Lys Gln Ala Gln
1                5                  10                  15
Thr Ala Ala Ala Ile Pro Pro Glu Trp Thr Leu Pro Ala Asp Ile Leu
            20                  25                  30
Leu Asp Ser Ser Ala Asn Val Leu Asp Val Pro Arg Thr Cys Gly Leu
        35                  40                  45
Leu Thr Glu Arg Glu Ile His Ile Thr Glu Asp Tyr Asp Ala Thr Ala
    50                  55                  60
Leu Leu Glu Lys Leu Ala Thr Gly Glu Phe Ser Ser Leu Glu Val Thr
65                  70                  75                  80
Thr Ala Phe Cys Lys Arg Ala Ala Ile Ala Gln Gln Leu Thr Cys Cys
                85                  90                  95
Leu Thr Glu Ile Phe Phe Asp Lys Ala Leu Ala Arg Ala Lys Gln Leu
            100                 105                 110
Asp Glu Ile Leu Ala Gln Thr Gly Val Thr Thr Gly Pro Leu His Gly
        115                 120                 125
Leu Pro Ile Ser Ile Lys Glu Ser Phe Asn Val Pro Gly Val Pro Thr
    130                 135                 140
Thr Leu Gly Phe Val Gly Phe Leu Asp Arg Ala Pro Ala Ser Met Ser
145                 150                 155                 160
Ser Ala Leu Val Glu Ile Leu Asn Asn Cys Gly Ala Val Len Tyr Val
                165                 170                 175
Lys Thr Asn Val Pro Gln Thr Met Met Thr Pro Asp Ser His Asn Asn
            180                 185                 190
Val Phe Gly Arg Val Leu Asn Pro His Gly Arg Ser Leu Thr Ala Gly
        195                 200                 205
Gly Ser Ser Gly Gly Glu Gly Ala Leu Val Ala Met Arg Gly Ser Val
    210                 215                 220
Leu Gly Val Gly Thr Asp Ile Ala Gly Ser Ile Arg Ile Pro Ala Leu
225                 230                 235                 240
Cys Cys Gly Val Phe Gly Phe Lys Pro Thr Ala Cys Arg Ile Pro Tyr
                245                 250                 255
Ala Gly Gln Thr Ser Ala Gly Arg Pro Gly Met Thr Gly Ile Leu Pro
            260                 265                 270
Ser Ala Gly Pro Met Cys His Ser Ile Arg Asp Ala Glu Leu Phe Leu
        275                 280                 285
Lys Val Val Leu Asn Ser Arg Pro Ala Asp Leu Asp Asp Tyr Ala Leu
    290                 295                 300
Asp Ile Pro Trp Ser Pro Ala Pro Gln Lys Glu Arg Leu Thr Ile Gly
305                 310                 315                 320
Leu Leu Pro Glu Asp Pro Ser Phe Pro Leu His Pro Pro Met Arg Arg
                325                 330                 335
Thr Leu Asn Ala Ala Val Lys Ala Leu Thr Thr Ala Gly His Arg Val
            340                 345                 350
Ile Asp Leu Ser Gly Gln Ala Pro Ser Phe Ser Asn Ala Cys Ser Leu
        355                 360                 365
Ala Leu Arg Tyr Phe Gly Leu Asp Pro Asp Arg Thr Ala Leu Arg His
    370                 375                 380
Ile Thr Gln Ala Gly Glu Pro Phe Ile Pro Ser Leu Lys Phe Thr Tyr
385                 390                 395                 400
Asp Leu Asn Glu Pro Thr Arg Glu Pro Thr Leu Arg Asp Leu Phe Glu
                405                 410                 415
Ser Asn Val Ala Arg Ser Gln Leu Ala Thr Gln Ala Arg Lys Leu Phe
            420                 425                 430
Val Asp Asn Gln Leu Asp Leu Phe Leu Gly Ala Ala Tyr Gln Ser Thr
        435                 440                 445
Ser Val Pro His Asp Thr Tyr Gly Ile Pro Val Tyr Thr Val Leu Trp
    450                 455                 460
Asn Leu Ile Asn Tyr Pro Ala Cys Val Ile Pro Phe Gly Gln Ala Asn
465                 470                 475                 480
Lys Val Glu Asp Ala Ala Tyr Asn Arg Asp Val Ser Tyr Val Pro Asp
                485                 490                 495
Tyr Arg Pro Glu Glu Ile Glu Gly Ala Pro Cys His Ile His Leu Ile
            500                 505                 510
Gly Arg Pro Met Ala Asp Glu Lys Leu Val Gln Asp Ala Lys Thr Ile
        515                 520                 525
Cys Thr Val Met Ser Asp Val Ser
    530                 535
<210>17
<211>1990
<212>DNA
<213>Aspergillus niger
<400>17
atgactatcc caacctggaa atcaaccgtg cacaagaagc gcgcagctca gctggccgcc     60
attccacctg attggcgtct cccggagtcc atcactgccg atccgccact caatgctctt    120
gaggcaatcc gctcttgtga tattctcacg gagaaagagc aggaatggac ggagattaat    180
gatagtactg tgctgctttc catgctggcg aaccgtgaga ttagctccgt tcagcttacg    240
acggcgttct gtaagcgcgc ggccgtcgcc cagcagctta ccaagtgctt gacggagatt    300
ttcttcgata gggcgctagc acgggctaag gagctcgatg atattttgga aaagacagga    360
aaggtgacgg ggccgttgca tgggctgccg gtttcaatta aggatcggtt tgatgtcgag    420
ggatatgata caaccgttgg ttcgtatcca tgttctagca tcactgctgc tgggagagga    480
gccttggcta actagtggta tgtaggctgg gttgggctag tgggcaaacc cgcgcaaagc    540
tccagcagta ttgccttgtc gttggagtca atgggcgcag tattgtatgt caagacgaat    600
gtaccacagt ctttgatggt atgcaatcac ccttttacat ttcgcatgat gggagattct    660
gattaagtca gatgtctgat tcctacaacc atgtgttcgg acaatccatc aatgccttca    720
acaaacaact catctccggt gggagttccg gcggcgaagg cgccctcatt ggcacgggtg    780
gcagtgtcgt tggtataggg acagatatcg ggggctcgat tcgtatcccg gccaatttgc    840
agggtttata ctcaatctgt cctactacag gtcgagtgcc atggaactgc tcgttgtacg    900
tgtccatctc tatctactga ttctagacca tagctgacca tacccagcat gcaccagcac    960
taccttgttc ctccagtcgc aggacccatg gcccgcagtc tttccagcat tgaacatttc    1020
atgcaatccc tcctcgactc caatccttgg aatattgatc cgggctgcat cccaattccc    1080
tggagaaagg aacttgcagc gaagcccact ggtaaactac gactcggaat tgtctacgac    1140
gacggcgtgg taaaaccaca gcccccaatc gccagggcaa tgcgcgaagt tgcaaagaaa    1200
ctcaaagaag ctggccatga aggtgtgtac acaatctaca atctccctct tacctcatca    1260
atcagctttc actgactaga caagtcttcg aatgggacac ctccctccac accacaggcc    1320
aaaacctctg gacaaaagcc atcctcgccg acggaggcca acactgtcgc tatctatgcg    1380
acattgttgg agagccactg atagaaggga tggttgtagg gacagaaaaa gatgagctga    1440
ccatctcaga acgcgaagag gtcggtccca taccctaatc ttctacctct ccaatgctta    1500
tattaataca aacatatagc tcgaagagac caaatgggcc taccaaacca gcttcctcca    1560
gcaatggaca tcaagcaaca tcgacgccct cctcatgccc gtcacgccct gggtcggcta    1620
ccggccaaaa tcctgggtcg tcagctccca gtggctcggc tacacggctc tctggaactt    1680
gctcaactac gcggctgtta ctgttccggt ggctaaagtg gatggagcac ttgatcagcc    1740
ggatcaggag tggttggagc atgtgcctag gaatgactcg gatcggttta attgggaaca    1800
gtgtatgcat actctccttt ccatacatac ggttatcggg gataatagct aaccctatca    1860
ctatgatcta gatgatcccg acctggtcaa agacatgccc atcactgtac aaatcgtcgg    1920
aggccgcttt ggcgaagaaa aggccgtttc ggtagccaag gtagtagatg aggttttgca    1980
ggagccctag                                                           1990
<210>18
<211>1494
<212>DNA
<213>Aspergillus niger
<400>18
atgactatcc caacctggaa atcaaccgtg cacaagaagc gcgcagctca gctggccgcc     60
attccacctg attggcgtct cccggagtcc atcactgccg atccgccact caatgctctt    120
gaggcaatcc gctcttgtga tattctcacg gagaaagagc aggaatggac ggagattaat    180
gatagtactg tgctgctttc catgctggcg aaccgtgaga ttagctccgt tcagcttacg    240
acggcgttct gtaagcgcgc ggccgtcgcc cagcagctta ccaagtgctt gacggagatt    300
ttcttcgata gggcgctagc acgggctaag gagctcgatg atattttgga aaagacagga    360
aaggtgacgg ggccgttgca tgggctgccg gtttcaatta aggatcggtt tgatgtcgag    420
ggatatgata caaccgttgg ctgggttggg ctagtgggca aacccgcgca aagctccagc     480
agtattgcct tgtcgttgga gtcaatgggc gcagtattgt atgtcaagac gaatgtacca     540
cagtctttga tgatgtctga ttcctacaac catgtgttcg gacaatccat caatgccttc     600
aacaaacaac tcatctccgg tgggagttcc ggcggcgaag gcgccctcat tggcacgggt     660
ggcagtgtcg ttggtatagg gacagatatc gggggctcga ttcgtatccc ggccaatttg     720
cagggtttat actcaatctg tcctactaca ggtcgagtgc catggaactg ctcgttcatg     780
caccagcact accttgttcc tccagtcgca ggacccatgg cccgcagtct ttccagcatt     840
gaacatttca tgcaatccct cctcgactcc aatccttgga atattgatcc gggctgcatc     900
ccaattccct ggagaaagga acttgcagcg aagcccactg gtaaactacg actcggaatt     960
gtctacgacg acggcgtggt aaaaccacag cccccaatcg ccagggcaat gcgcgaagtt    1020
gcaaagaaac tcaaagaagc tggccatgaa gggacagaaa aagatgagct gaccatctca    1080
gaacgcgaag agctcgaaga gaccaaatgg gcctaccaaa ccagcttcct ccagcaatgg    1140
acatcaagca acatcgacgc cctcctcatg cccgtcacgc cctgggtcgg ctaccggcca    1200
aaatcctggg tcgtcagctc ccagtggctc ggctacacgg ctctctggaa cttgctcaac    1260
tacgcggctg ttactgttcc ggtggctaaa gtggatggag cacttgatca gccggatcag    1320
gagtggttgg agcatgtgcc taggaatgac tcggatcggt ttaattggga acagtatgat    1380
cccgacctgg tcaaagacat gcccatcact gtacaaatcg tcggaggccg ctttggcgaa    1440
gaaaaggccg tttcggtagc caaggtagta gatgaggttt tgcaggagcc ctag          1494
<210>19
<211>497
<212>PRT
<213>Aspergillus niger
<400>19
Met Thr Ile Pro Thr Trp Lys Ser Thr Val His Lys Lys Arg Ala Ala
1               5                   10                  15
Gln Leu Ala Ala Ile Pro Pro Asp Trp Arg Leu Pro Glu Ser Ile Thr
            20                  25                  30
Ala Asp Pro Pro Leu Asn Ala Leu Glu Ala Ile Arg Ser Cys Asp Ile
        35                  40                  45
Leu Thr Glu Lys Glu Gln Glu Trp Thr Glu Ile Asn Asp Ser Thr Val
    50                  55                  60
Leu Leu Ser Met Leu Ala Asn Arg Glu Ile Ser Ser Val Gln Leu Thr
65                  70                  75                  80
Thr Ala Phe Cys Lys Arg Ala Ala Val Ala Gln Gln Leu Thr Lys Cys
                85                  90                  95
Leu Thr Glu Ile Phe Phe Asp Arg Ala Leu Ala Arg Ala Lys Glu Leu
            100                 105                 110
Asp Asp Ile Leu Glu Lys Thr Gly Lys Val Thr Gly Pro Leu His Gly
        115                 120                 125
Leu Pro Val Ser Ile Lys Asp Arg Phe Asp Val Glu Gly Tyr Asp Thr
    130                 135                 140
Thr Val Gly Trp Val Gly Leu Val Gly Lys Pro Ala Gln Ser Ser Ser
145                 150                 155                 160
Ser Ile Ala Leu Ser Leu Glu Ser Met Gly Ala Val Leu Tyr Val Lys
                165                 170                 175
Thr Asn Val Pro Gln Ser Leu Met Met Ser Asp Ser Tyr Asn His Val
            180                 185                 190
Phe Gly Gln Ser Ile Asn Ala Phe Asn Lys Gln Leu Ile Ser Gly Gly
        195                 200                 205
Ser Ser Gly Gly Glu Gly Ala Leu Ile Gly Thr Gly Gly Ser Val Val
    210                 215                 220
Gly Ile Gly Thr Asp Ile Gly Gly Ser Ile Arg Ile Pro Ala Asn Leu
225                 230                 235                 240
Gln Gly Leu Tyr Ser Ile Cys Pro Thr Thr Gly Arg Val Pro Trp Asn
                245                 250                 255
Cys Ser Phe Met His Gln His Tyr Leu Val Pro Pro Val Ala Gly Pro
            260                 265                 270
Met Ala Arg Ser Leu Ser Ser Ile Glu His Phe Met Gln Ser Leu Leu
        275                 280                 285
Asp Ser Asn Pro Trp Asn Ile Asp Pro Gly Cys Ile Pro Ile Pro Trp
    290                 295                 300
Arg Lys Glu Leu Ala Ala Lys Pro Thr Gly Lys Leu Arg Leu Gly Ile
305                 310                 315                 320
Val Tyr Asp Asp Gly Val Val Lys Pro Gln Pro Pro Ile Ala Arg Ala
                325                 330                 335
Met Arg Glu Val Ala Lys Lys Leu Lys Glu Ala Gly His Glu Gly Thr
            340                 345                 350
Glu Lys Asp Glu Leu Thr Ile Ser Glu Arg Glu Glu Leu Glu Glu Thr
        355                 360                 365
Lys Trp Ala Tyr Gln Thr Ser Phe Leu Gln Gln Trp Thr Ser Ser Asn
    370                 375                 380
Ile Asp Ala Leu Leu Met Pro Val Thr Pro Trp Val Gly Tyr Arg Pro
385                 390                 395                 400
Lys Ser Trp Val Val Ser Ser Gln Trp Leu Gly Tyr Thr Ala Leu Trp
                405                 410                 415
Asn Leu Leu Asn Tyr Ala Ala Val Thr Val Pro Val Ala Lys Val Asp
            420                 425                 430
Gly Ala Leu Asp Gln Pro Asp Gln Glu Trp Leu Glu His Val Pro Arg
        435                 440                 445
Asn Asp Ser Asp Arg Phe Asn Trp Glu Gln Tyr Asp Pro Asp Leu Val
    450                 455                 460
Lys Asp Met Pro Ile Thr Val Gln Ile Val Gly Gly Arg Phe Gly Glu
465                 470                 475                 480
Glu Lys Ala Val Ser Val Ala Lys Val Val Asp Glu Val Leu Gln Glu
                485                 490                 495
Pro
<210>20
<211>2017
<212>DNA
<213>合成
<400>20
gtcctgttaa ttaaccttca ccatggccct cacatcctgg gaacaaaccg cagcggccaa     60
acgccaatcc gtcctcaacg ccatccccga gaaatggcgc atcaagggtc ctatccccgc    120
accgtcggag cagcgcgacg taacaggccc ctacatccag cagttcctat ccccacgcga    180
ggttgaaatc accgaaacag acgccgtagg gatcacagag cgaactacaa cgggccagtg    240
gacagctgtg gaggtgaccg aggcgttctg ccatcgcgca gcattggcgc atcaactcgt    300
acattcccca tccacaagga gtgctagtct gcgctttact aatcgagaaa aaggtaaact    360
gcttgcatga aatcttcttc gatgccgcgc ttgaaaccgc ccgcattcta gacgaccact    420
acaccaagac cggcaagcca ctcggtcccc ttcacggcct ccctgtcagt ctgaaggatc    480
aattccacgt caagggcgta gaaacaacca tgggttacgt cggctggata aacaccttcc    540
aaggcaagac caatgacccg cgctatctta cacacgaaag cgaactcgtt aaagaactcc    600
gcgccgcggg agccgtcctc tactgcaaga ctagcgtccc catgacgttg atgtcaggtg    660
aaaccatgaa caatatcata acttacacac ataacccgaa gaacaggctt ctcagttctg    720
gaggtagttc cgggggcgaa ggagcactga tcgcgttgcg gggatcacca gccgggtttg    780
gtacggatat cgggggtagt atccgtgttc ctgcgtcgtt caatggactg tatgggatac    840
ggccgtctgt ggggagaatg ccgtacgagg gggcggccaa ttcgggcgat ggacagaata    900
ctgtgttgtc ggttgtgggg ccgttgtctc cttcggcgag agggttgata ttgctgttca    960
agacggtgtt gggggcaatg ccgtggttgg gagatcctgg tgtgttggag attccctgga   1020
gggaggaaat cgtagaggag acgagaaaat tagtgcaggg aaagccagag gggctagctt   1080
ttggaatatt ctacgatgat ggtcaggtaa agccgcagcc accggtcgag agagcgatgc   1140
ggattgctgc agagacgatc aagcgtctag gacataaggt gagtgccctc cttcttcttg   1200
cgacactgct aacattcatc ccagctcatc aattgggaac ccccctctca cctaacagcc   1260
gcctccctcg cagtaagtcc cccatccaac ccactacacc acaaccccct aacaataaac   1320
caacccccag aaccgcgcct acaacatgga cggcggcgcc gacgtactcc aaaacttcgc   1380
cctgtccaac gaagccatcc acacctccgt agtaatcgac gcatcaggat ccccccaaaa   1440
gaccgcacta gagatcgccg cgctaaacgt cgagaagcgc gaataccaga aacaatacct   1500
tgactactgg aacagcacgg cgcaattgac agggactgga cgacccgtcg acgcggtcat    1560
ttgtccagtg gcgccgcatg cggcgtgcat tccggggaag tatgcgacga tcgggtatac    1620
ggcgtttatt aatgtgttgg attatacgag tgcggttgtg ccggttacga gtgctgatag    1680
gagggtggat gttgtaggga aggaaggaag ggagtatttt ggggagttgg ataggaagac    1740
cgagggggag tgtaagttct tccctttctt ttcttctttc ttttcattga gctatccaat    1800
ttggttggag gtcttgtgtg tttgtttgtt cggagagtgg tgatggggtt atgtgctgac    1860
tggatgtttc tatctagacg atgcggatgt gtttgatggg gcgccggctg ggattcagct    1920
ctttggaaga cggcttcagg aggagaagat tctggtactg gctgagtatc ttggtgagga    1980
attcaagaag gctagtgctt aaaggcgcgc ctgaagt                             2017
<210>21
<211>1987
<212>DNA
<213>合成
<400>21
gtcctgttaa ttaaccacca tgcttccccc ctttgattac tttacgtatc gtcgcatccg     60
gtaggttacc ccgtgtgcct tcacgcagca acttaagcag tcctacacag cccacatgca    120
acttagccga cggctcactg accattcaca gggacctcaa gaggagggaa cgggcggctc    180
gatttgcatc gctatctccc gattatcatg cgcccttctc ggctatcgac agggttatca    240
ttaacaagcc tatccaggac ttggtatatg aggtccagaa tgattccttg gcacctttag    300
atgtcctacg cacatacggc aaggttgcag tcaaggctca cgaaaagacc aattgcgtga    360
ctgagcttct attgcctgag gcagaatcat gggctcagtc cgaagtaaac ctaaaaggtc    420
ccctggcggg tgtgcctatc tctttgaaag actcggtgca agtcaaagga ttcgatatta    480
ctctggggta taccaagttc gcgtgtaaac cgtataagga ggatggtcca atggcaaagc    540
tgttgaagga tgctggtagg tgacctgtgc cgcgaaacat cacagaaagt atccctgcgc    600
taatgatgaa ctccatcagg tgcggtccca tatgcgaaaa cggcgctgcc cgtgacgctt    660
ctgtcgttcg aatcagcaaa cgctctttgg ggtcactgcc ttaacccaca tgtcccggaa    720
tactctcctg gcggctcgac gggtggtgaa ggtgctctgc tggctcttgg tggtcgcatc    780
ggtatcgggt cggatgtcgc tggctcggtt cgcgttcccg ctgcctggag cggcatctac    840
tccctccgct gtagtactgg ccgctggcct aaggtcggag tcaacaccag catggctggc    900
caggaaggtg ttgccagtgt cttcagtcct atggcccgta ctttgaacga tctcacctat    960
ttcaccaaag ctattgtcgg aatgaagcct tggaactacg accataccgt ccaccctatc    1020
tcctggagag aagatgagga aattgaagcc caaaacaaaa ggttgaggat cggcctcatg    1080
agcaacgatg gtaagttcca agagcgggga catcaaggac actacttggg cctttctgac    1140
cacttgcagg tgtcgttccc ccaacgccgg ccattgaacg tgctatttcc accacagtag    1200
ccgccctcac cgccgctggg catactgtat ctgagatcac accccccgct gcggctgaca    1260
cttttactgg tctctccctc gcctcgcagc tgctcaactc tgatgggtgc gtcacgttta    1320
actcgcatct gcacagcttt gagccatccg accctggtgc agatcagctg acgcggatat    1380
gcaatctgcc ccgtcctcta cgttatctct actacctttg ggttcggtac atccgacggg    1440
atgagaagtg ggcgacgctg atccgcgggt ttgcccccaa gtctgcggcg gagctttgga    1500
agctcactgc ccagcgggaa gctttccggg cgacctggca cagctggtgg gatgccgaga    1560
cgcagcagta cgatttcatc ctctgccccg tcaatgcgac gccggctctg ccccacaaag    1620
ccatgcacga tgcggtatcc tcatgcggat acacgttcct ctggaacctg ctggactaca    1680
cagccggtgt cgtgcctgtc tcgcacgtgg acgcgaagaa ggatgctctg tctggtccgt    1740
acaagaaggt gctgaaacag ctgggagcca gcaacgcggt ggcctacggt gcctggaagc    1800
actacgacgc ggcgaagatg gcgggattgc ctactgcagt gcaggtggtg ggacgcagat    1860
ggcaggaaga gaaggtgctt ggatacatgg cggcagttga ggaggccttg gagcagtatc    1920
aggacccggt aactggagaa ggggggaaat acccattgat tgagcttgac tagggcgcgc    1980
ctgaagt                                                              1987

Claims (16)

1.编码乙酰胺酶的DNA序列,其可从Aspergillus获得,优选地,可从Aspergillus niger获得,其中,所述DNA序列不是EP0758020A2所描述的SEQ ID NO:18,但其选自下述物质所构成的组:
c.具有SEQ ID NO:1、SEQ ID NO:6、SEQ ID NO:11、SEQ IDNO:14或SEQ ID NO:17的核苷酸序列的DNA序列,以及
d.(a)的DNA序列中任何序列的片段或突变体。
2.如权利要求1所述的编码乙酰胺酶的DNA序列,其中所述乙酰胺酶包含下述氨基酸序列,其中,所述氨基酸序列与SEQ ID NO:3、SEQID NO:8、SEQ ID NO:13、SEQ ID NO:16或SEQ ID NO:19中序列之一具有的位置同一性超过40%。
3.一种核酸构建体,其包含根据权利要求1或2任意一项所述的DNA序列。
4.如权利要求3所述的核酸构建体,其包含对于权利要求1或2任意一项所述的DNA序列来说天然的启动子。
5.如权利要求3所述的核酸构建体,其包含对于权利要求1或2任意一项所述的DNA序列来说外源的启动子。
6.如权利要求3至5中任意一项所述的核酸构建体,其还包含将被表达的感兴趣的基因。
7.由根据权利要求1或2中任意一项所述的DNA序列编码的多肽。
8.根据权利要求7的多肽,其包含SEQ ID NO:3、SEQ ID NO:8、SEQ ID NO:13、SEQ ID NO:16或SEQ ID NO:19中的任一序列。
9.一种真菌宿主细胞,其包含根据权利要求3至6中任意一项所述的核酸构建体。
10.一种真菌宿主细胞,其中包含根据权利要求3至6中任意一项所述的核酸构建体,并且还包含将被表达的感兴趣的基因。
11.根据权利要求9或10任意一项所述的真菌宿主细胞,其中内源乙酰胺酶活性通过下述方法降低:通过特异性诱变或随机诱变、定点诱变、PCR产生的诱变、核苷酸插入和/或缺失和/或取代、基因打断或基因置换技术,反义技术、RNAi技术或其组合对一个或多个内源乙酰胺酶基因进行修饰和/或失活。
12.如权利要求9至11中任意一项所述的真菌宿主细胞,其中,根据权利要求1或2任意一项所述的DNA序列或根据权利要求3至6任意一项所述的核酸构建体被缺失,或被失活,这是通过对重组DNA构建体或其组合进行基因置换和/或失活和/或修饰和/或打断来进行的。
13.如权利要求9至12中任意一项所述的真菌宿主细胞,其中,所述真菌细胞是有丝真菌细胞,优选地,属于Aspergillus、Penicillium或Trichoderma属的种的细胞。
14.如权利要求9至13中任意一项所述的真菌宿主细胞,其中,所述有丝真菌细胞属于Aspergillus niger、Aspergillus oryzae、Aspergillussojae、Trichoderma reesei或Penicillium chrysogenum。
15.一种方法,用于在真菌宿主中生产感兴趣的化合物,所述方法包括如下步骤:
a.在有益于乙酰胺酶表达和感兴趣的化合物的条件下,培养如权利要求9至14中任意一项所述的真菌宿主细胞,以及可选地,
b.回收所述感兴趣的化合物。
16.如权利要求15所述的方法,其中培养基含有乙酰胺作为唯一碳和/或氮源。
CNA200580035377XA 2004-10-15 2005-10-17 作为选择性标记的同源amds基因 Pending CN101198697A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04105077.4 2004-10-15
EP04105077 2004-10-15
EP04107053.3 2004-12-29

Publications (1)

Publication Number Publication Date
CN101198697A true CN101198697A (zh) 2008-06-11

Family

ID=38890190

Family Applications (3)

Application Number Title Priority Date Filing Date
CNA2005800353708A Pending CN101180396A (zh) 2004-10-15 2005-10-13 在真核细胞中生产化合物的方法
CNA200580034983XA Pending CN101040046A (zh) 2004-10-15 2005-10-13 新颖的食物制造方法
CNA200580035377XA Pending CN101198697A (zh) 2004-10-15 2005-10-17 作为选择性标记的同源amds基因

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CNA2005800353708A Pending CN101180396A (zh) 2004-10-15 2005-10-13 在真核细胞中生产化合物的方法
CNA200580034983XA Pending CN101040046A (zh) 2004-10-15 2005-10-13 新颖的食物制造方法

Country Status (1)

Country Link
CN (3) CN101180396A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2613647T3 (en) * 2010-09-06 2018-05-22 Dupont Nutrition Biosci Aps FOOD ADDITIVES INCLUDING AN AMIDASE TO DETERMINE OCHRATOXIN
CN109234177A (zh) * 2017-07-11 2019-01-18 中国农业科学院饲料研究所 一种里氏木霉工程菌及其制备方法与应用
CN111406112A (zh) * 2017-11-30 2020-07-10 豪夫迈·罗氏有限公司 用于培养哺乳动物细胞的工艺
CN111334444A (zh) * 2018-12-19 2020-06-26 中国科学院微生物研究所 长链二元酸生产菌株及其制备方法和应用
CN116286880B (zh) * 2023-02-09 2024-04-30 昆明理工大学 一种过氧化物酶体增值因子基因RkPEX11及其用途

Also Published As

Publication number Publication date
CN101040046A (zh) 2007-09-19
CN101180396A (zh) 2008-05-14

Similar Documents

Publication Publication Date Title
CN101094919B (zh) 在生产多肽的方法中有用的真菌转录活化因子
EP0758020B1 (en) amdS gene from Aspergillus niger coding for an acetamidase
EP2588616B1 (en) A method for the production of a compound of interest
DK2875119T3 (en) AGSE-DEFICIENT TRIALS
AU2005293516B2 (en) Homologous amdS genes as selectable marker
EP3293264A1 (en) Improved host cell for the production of a compound of interest
CN109576244B (zh) 一种新型脂肪酶及其制备与应用
EP4092128A1 (en) Factor regulating protein expression efficiency of trichoderma reesei, and regulation method and use thereof
CN101198697A (zh) 作为选择性标记的同源amds基因
US20230174998A1 (en) Compositions and methods for enhanced protein production in filamentous fungal cells
EP1809659B1 (en) Pntr transcription factor knock-out and uses thereof
CN115717135B (zh) 一种耐热木糖苷酶突变体及其制备
US20220267783A1 (en) Filamentous fungal expression system
CN113755509A (zh) 溶血磷脂酶变体及其构建方法和在黑曲霉菌株中的表达
CN113201055B (zh) 蛋白pox01387及其相关生物材料与应用
KR20210038591A (ko) 향상된 단백질 생산성 표현형을 포함하는 돌연변이체 및 유전자 변형된 사상성 진균 균주 및 이의 방법
JP5473179B2 (ja) アスペルギルス・オリザの新規変異株及び選択マーカー
JP5686974B2 (ja) 新規ターミネーターおよびその利用
KR101038900B1 (ko) 크리포넥트리아 파라시티카 유래의 신규한 프로모터 및 이의 용도
WO2000032798A1 (en) Xylanase promoter from thermomyces lanuginosus

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20080611