CN101094919A - 在生产多肽的方法中有用的真菌转录活化因子 - Google Patents

在生产多肽的方法中有用的真菌转录活化因子 Download PDF

Info

Publication number
CN101094919A
CN101094919A CN200580034648.XA CN200580034648A CN101094919A CN 101094919 A CN101094919 A CN 101094919A CN 200580034648 A CN200580034648 A CN 200580034648A CN 101094919 A CN101094919 A CN 101094919A
Authority
CN
China
Prior art keywords
seq
polypeptide
sequence
leu
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200580034648.XA
Other languages
English (en)
Other versions
CN101094919B (zh
Inventor
诺林·尼古拉斯·玛丽亚·艾里萨伯斯·佩伊·范鲁斯·帕拉尼克瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN101094919A publication Critical patent/CN101094919A/zh
Application granted granted Critical
Publication of CN101094919B publication Critical patent/CN101094919B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Mycology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及编码PrtT蛋白的功能性cDNA和基因组序列,所述蛋白具有针对蛋白酶启动子的转录活性,本发明还涉及PrtT蛋白及其用途。本发明还涉及两种不同类型的有丝真菌细胞。有丝真菌细胞经过转化,以过量表达这些PrtT蛋白:这种类型的有丝真菌将高度适合作为蛋白酶生产者。或者,有丝真菌细胞的内源prtT基因被失活:这种类型的有丝真菌高度适合用于生产对蛋白酶降解高度敏感的任何多肽,无论是否天然的。本发明的PrtT蛋白提供了在其它物种中鉴定功能性同源体的手段。

Description

在生产多肽的方法中有用的真菌转录活化因子
发明领域
本发明涉及具有针对蛋白酶启动子的转录活化活性的多肽、编码这些多肽的核酸序列以及这些核酸序列的多种用途。
发明背景
名为PrtT的真菌转录活化因子近来在WO00/20596和WO01/68864中被描述过。这些转录活化因子分离自Aspergillus niger(A.niger)和Aspergillus oryzae(A.oryzae)。蛋白酶基因的这些转录活化因子可用于改进在真菌细胞中生产蛋白酶的方法,或用于改进在真菌细胞中生产多肽的方法,其中,所述多肽对蛋白酶降解敏感。
本发明提供了新颖的PrtT真菌转录活化因子,它们较之之前的两份申请所描述的那些具有改进的性质。
附图说明
图1培养于补充有2%脱脂豆粉的IM中的WT1菌株上清液中的内切蛋白酶活性。
Y轴上的活性是内切蛋白酶活性,其以每小时U/50μl上清液来测定。X轴表示转移至IM之后的培养时间,以小时表示。
图2表达载体pGBFIN-23的质粒图谱。指示的是相对glaA启动子和HindIII-XhoI克隆位点的glaA侧翼区域。可在对A.niger菌株进行转化之前,通过用限制性酶NotI加以消化来除去E.coli DNA。
图3表达载体pGBFINPRT-1的质粒图谱。指示的是相对glaA启动子和编码位于HindIII-XhoI克隆位点的本发明PrtT转录调控子的cDNA插入的glaA侧翼序列。可在对A.niger菌株进行转化之前,通过用限制性酶NotI加以消化来除去E.coli DNA。
图4对本发明的PrtT序列(SEQ ID NO:3是“A.niger 1”)和来自WO 00/20596和WO01/68864的PrtT序列(“A.niger 2”)的比对。这些氨基酸序列间的不同用灰色标示。下划线标出的序列分别表示锌双核簇Zn(II)2-Cys6 DNA结合结构域(47-89)和亮氨酸拉链(438-461,基于A.niger 1的序列计数)。
图5对本发明的PrtT序列(SEQ ID NO:3是“A.niger”)和来自WO 01/68864的A.oryzae PrtT序列(“A.oryzae”)的比对。这些氨基酸序列间的不同用灰色标示。
图6通过单同源重组的整合的示意图。表达载体包含选择性amdS标记、与本发明蛋白酶转录活化因子prtT序列相连的glaA启动子。这些特征的侧翼有glaA基因座的同源区域(分别是3’glaA和3”glaA),以指导基因组基因座上的整合。
图7若干天发酵期间PRTT菌株的细胞外酸性蛋白酶活性。使用BSΛ作为底物来测量蛋白酶活性。一个单位=50μl上清液的ΔOD280/小时。
图8置换型载体pGBDEL的质粒图谱。指示的是用于克隆amdS标记侧翼区域的多克隆位点。
图9置换型载体pGBDEL-PRT2的质粒图谱。指示的是相对于amdS标记的5’prtT侧翼区域、3’prtT侧翼区域。prtT 3’序列的序列覆盖了至少数百个bp。可在对A.niger菌株转化之前,通过用限制性酶BstBI和XmaI加以消化来除去E.coli DNA。
图10prtT缺失的示意图。pGBDEL-PRT2的线性DNA构建体(包含amdS选择标记,其侧翼有prtT基因的同源区域(5’和3’))(1),通过双同源重组(X)整合于基因组prtT基因座上(2),置换基因组prtT基因拷贝(3)。随后,在正向重复上的重组(U)除去了amdS标记,得到对prtT基因的精确切除(4)。
图11A.niger WT2菌株和dPRTT菌株上清液中的内切蛋白酶活性。Y轴上的活性是以每小时U/50μl测定的内切蛋白酶活性。X轴表示上清液被收集时的培养时间(小时)。
图12PLA2表达载体pGBFIN-PLA2的质粒图谱。指示的是相对glaA启动子、截短的glaA基因和pla2编码序列的glaA侧翼区域。可在对A.niger菌株转化之前,通过用限制性酶NotI加以消化来除去E.coli DNA。
图13在WT2和dPRTT菌株的A.niger pGBFIN-PLA2转化子培养液中测量的磷脂酶A2活性。磷脂酶A2活性是按照实验信息章节所述测量的。
图14对由经测序cDNA’s确定的A.niger WT1的PrtT序列(“A.niger”)(SEQ ID NO:3)与通过针对Patent数据库进行TBlastn检索鉴定出的A.oryzae PrtT序列(“A.oryzae”)进行的比对。这两条氨基酸序列间的不同用灰色标示。
图15对通过针对Patent数据库进行TBlastn检索鉴定出的A.oryzac的PrtT序列(“A.oryzae 1”)(SEQ ID NO:15)与来自WO01/68864的A.oryzae PrtT序列(“A.oryzae 2”)进行的比对。这两条氨基酸序列间的不同用灰色标示。
图16对通过针对核苷酸数据库进行TBlastn检索鉴定出的A.fumigatus PrtT序列(“A.fumigatus”)与由经测序cDNA’s确定的A.niger WT1的PrtT序列(“A.niger”)(SEQ ID NO:3)进行的比对。这两条氨基酸序列间的不同用灰色标示。
图17本发明的四种真菌PrtT多肽的CLUSTAL W多条序列比对。标出的方框分别表示锌双核簇Zn(II)2-Cys6 DNA结合结构域(灰色)和亮氨酸拉链(粗体)。亮氨酸拉链方框中的保守Leu残基以斜体表示。
*在该比对下,代表相同氨基酸的存在,
:表示该类型氨基酸在全部三条序列中保守,以及
.表示至少在两条序列中存在类似类型的氨基酸。
下划线表示的序列显示肽SEQ ID NO:22定位的区域。
图18对来自A.niger WT1的肽SEQ ID NO:22和本发明其它PrtT真菌多肽以及专利申请WO 00/20596和WO 01/68864中的那些多肽的相应肽序列进行的比较。
图19pGBFINPRT-1的质粒图谱。
指示的是与根据SEQ ID NO:2的全长prtT cDNA序列融合的pglaA启动子的200bp的3’片段。将PCR产生的融合片段克隆进来自Invitrogcn的pCR-BluntII-TOPO载体。可通过用EcoRI和XhoI进行限制性酶消化来分离融合片段。随后,该片段可被连接进表达载体pGBFIN-23的EcoRI和XhoI位点。
发明详述
具有针对蛋白酶启动子的转录活化活性的多肽
根据第一个方面,本发明涉及具有针对蛋白酶启动子的转录活性的多肽,其中所述多肽选自如下多肽构成的组:
(a)具有下述氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ ID NO:21的氨基酸序列具有至少50%的匹配百分比,即同一性,或者包含下述肽片段的多肽,所述肽片段与SEQ ID NO:22或SEQ ID NO:4或SEQ ID NO:25或SEQ IDNO:26或SEQ ID NO:27具有至少50%的匹配百分比;或
(b)包含下述肽片段的多肽,所述肽片段与SEQ ID NO:22和SEQID NO:4两者,或与SEQ ID NO:22和SEQ ID NO:25两者,或与SEQID NO:22和SEQ ID NO:26两者,或与SEQ ID NO:22和SEQ IDNO:27两者均具有至少50%的匹配百分比;或
(c)具有根据(a)和(b)或(a)和(c)的氨基酸序列的多肽;或
(d)具有下述氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ ID NO:21的氨基酸序列具有至少50%的匹配百分比,即同一性,所述多肽还包括下述肽片段,所述肽片段具有下述氨基酸序列:EWAHL(X)5-20ST,其中“X”代表任何氨基酸,范围5-20代表发现的“X”的数量,或者,
(e)(a)或(b)或(c)或(d)或(e)的变体。
具有针对蛋白酶启动子的转录活性的多肽是蛋白酶启动子的转录活化因子。本文中使用的术语“转录活化因子”指能激活从特定蛋白酶启动子或一组蛋白酶启动子开始的转录的多肽,所述活化因子对于起始蛋白启动子可操作连接到其上的蛋白酶编码序列的转录来说是必要的。
转录活化因子的生物活性优选通过对蛋白酶活性的测量来测定,所述测量按照本文实施例关于使用牛血清白蛋白(BSA)作为底物测定酸性内切蛋白酶活性的部分所述来进行。关于此方法的详细描述还见van denHombergh et al.,Current Genetics 28:299-308(1995)。用于蛋白酶测量的替代性方法可在WO 02/068623中找到。或者,一种或多种特异性蛋白酶报道基因,例如编码抑肽素(pepstatin)敏感性细胞外天冬氨酸蛋白酶的pepA基因可被用于测量转录活化因子的活性。
此外,可考虑在蛋白酶启动子控制下使用报道基因,使得与蛋白酶启动子可操作相连的报道蛋白的酶活性被测量。测量LacZ和GFP报道基因活性的例子已被描述(Luo,Gene,(1995),163:127-131和Santerre HenriksenAL et al,Microbiology,(1999),145:729-34)。
或者,可通过测量蛋白酶转录本的mRNA水平来测定转录活化因子活性的生物活性。mRNA水平例如可通过Northern印迹杂交来测量(J.Sambrook,E.F.Fritsch,and T.Maniatis,1989,Molecular Cloning,ALaboratory Manual,2d edition,Cold Spring Harbor,New York)。
根据一种优选的实施方式,本发明的多肽不具有WO 01/68864公开的氨基酸序列SEQ ID NO:2或SEQ ID NO:49。
就本发明的目的而言,两条多肽,或者两条核酸序列之间的同一性程度,即匹配百分比优选使用最优整体比对方法CDA来测定(Huang,1994,A Context Dependent Method for Comparing Sequences,Proceedings of the 5thSymposium on Combinatorial Pattern Matching,Lecture Notes in ComputerScience 807,Springer-Verlag,54-63),其中使用如下参数:(1)用于(多)肽比对:错配:-2,缺口打开(GapOpen):11,缺口延伸(GapExtend):1,文本长度(ContextLength):10,匹配奖励(MatchBonus):1,以及(ii)用于核苷酸序列比对:错配:-15,缺口打开:5,缺口延伸:2,文本长度:10,匹配奖励:1。
术语“同一性程度”、“同一性”和“匹配百分比”可交换使用,以表示通过上述最优整体比对方法计算出的、两条多肽或核酸序列之间的同一性的程度。用于比对和对同源性加以测定的其它程序的例子是Clustal方法(Higgins,1989,CABIOS 5:151-153)、使用LASERGENE.TM.MEGALIGN.TM.软件(DNASTAR,Inc.,Madison,Wis.)的Wilbur-Lipman方法(Wilbur and Lipman,1983,Proceedings of the National Academy ofScience USA 80:726-730)、BLAST(NCBI)、用于最优整体比对的GAP(Huang)、MAP(Huang)、MultiBLAST(NCBI)、ClustalW、CapAssembler和用于多条序列比对的Smith Waterman。
参考文献:
逐对比对:(1)BLAST,(2)GAP,(3)MAP,(4)Smith Assembler和(5)CapAssembler
(1) Tatussova TA and Madden TL(1999) BLAST 2 sequences,a new tool for comparing protein andnucleotide sequence.FEMS Microbiol Lett 174:247-50
(2) (3)Huang X(1994) On global sequence alignment.Comput Appl Biosci 10:227-35
(4) Smith TF and Waterman MS(1981) Identification of common molecular subsequences.J MolBiol 147:195-197
(5) Huang X(1992) A contig assembly program based on sensitive detection offragment overlaps.Genomics 14:18-25
(5) Huang X(1996) An improved sequence assembly program.Genomics 33:21-31
(6) Thompson JD.Higgins DG.and Gibson TJ(1994) CLUSTAL W:improving the sensitiivity of progressivemultiple sequence alignment through sequence weighting,positions-specific gap penalties and weight matrix choice.Nucleic Acids Research 22:4673-4680
在一种最优选的实施方式中,多肽具有SEQ ID NO:3或SEQ IDNO:15或SEQ ID NO:18或SEQ ID NO:21或可通过对图3所示pGBFINPRT-1(作为CBS118680保藏)中含有的prtT cDNA的表达获得的多肽或可通过对图19所示pGBPRT-1(作为CBS118681保藏)中含有的prtT cDNA的表达获得的多肽的氨基酸序列。
根据一种更优选的实施方式,多肽具有下述氨基酸序列,所述氨基酸序列与SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ IDNO:21的氨基酸序列具有至少50%的匹配百分比,即同一性,并且,所述多肽包含下述肽片段,所述肽片段与SEQ ID NO:22或SEQ ID NO:4或SEQ ID NO:25或SEQ ID NO:26或SEQ ID NO:27具有至少50%的匹配百分比,即同一性。
根据另一种更优选的实施方式,多肽具有下述氨基酸序列,所述氨基酸序列与SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ IDNO:21的氨基酸序列具有至少50%的匹配百分比,即同一性,并且,所述多肽包含下述肽片段,所述肽片段与SEQ ID NO:22和SEQ ID NO:4两者,或与SEQ ID NO:22和SEQ ID NO:25两者,或与SEQ ID NO:22和SEQ ID NO:26两者,或与SEQ ID NO:22和SEQ ID NO:27两者均具有至少50%的匹配百分比。
根据另一种优选的实施方式,多肽具有下述氨基酸序列,所述氨基酸序列与SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ IDNO:21的氨基酸序列具有至少50%的匹配百分比,即同一性,并且,所述多肽包含下述肽片段,所述肽片段具有下述氨基酸序列:EWAHL(X)5-20ST,其中“X”代表任何氨基酸,数字代表发现的“X”的数量。此类肽片段的例子由SEQ ID NO:22所代表。
优选地,匹配百分比,即同一性为至少大约60%,优选至少大约70%,更优选至少大约80%,进一步更优选至少大约90%,进一步更优选至少大约93%,进一步更优选至少大约95%,进一步更优选至少大约96%,进一步更优选至少大约97%,进一步更优选至少大约98%,最优选至少大约99%。
根据另一种优选的实施方式,多肽是前文定义的任何多肽序列的变体。对本发明多肽的修饰对于合成变体多肽来说可能是必要的。术语变体优选指多肽的非天然存在的形式。这些多肽变体可以以一些经功能改造的方式与从其天然来源分离的多肽有所不同。例如,通过例如定点诱变合成多肽的下述变体可能是人们感兴趣的,其中,所述变体的比活性、结合特异性和/或亲和性等有所不同。变体序列可在SEQ ID NO:3、SEQ IDNO:15、SEQ ID NO:18或SEQ ID NO:21的氨基酸序列基础上构建,或在作为SEQ ID NO:2、SEQ ID NO:14、SEQ ID NO:17或SEQ IDNO:20的多肽编码部分所示的核酸序列的基础上构建。
SEQ ID NO:3、SEQ ID NO:15、SEQ ID NO:18或SEQ ID NO:21变体优选是具有下述变化的多肽:
-缺失一个或多个氨基酸,优选从该氨基酸序列的氨基和/或羧基末端缺失,和/或
-插入一个或多个氨基酸残基,和/或
-被一个或多个不同的氨基酸残基替换的一个或多个氨基酸残基
-上述变化的组合。
根据另一种优选的实施方式,SEQ ID NO:3、SEQ ID NO:15、SEQID NO:18或SEQ ID NO:21的变体至少含有SEQ ID NO:3、SEQ IDNO:15、SEQ ID NO:18或SEQ ID NO:21示出的多肽序列。
在一种优选的实施方式中,多肽具有与SEQ ID NO:3、SEQ IDNO:15、SEQ ID NO:18、SEQ ID NO:21或SEQ ID NO:22所示的氨基酸序列相比有五个氨基酸不同,优选地,四个氨基酸不同,更优选地,三个氨基酸不同,进一步更优选地,两个氨基酸不同,最优选地,一个氨基酸不同的氨基酸序列。
根据另一种优选的实施方式,多肽变体是从其它生物分离的转录活化因子和/或存在于同样的生物中的、最初分离的转录活化因子的另一家族成员。
根据一种优选的实施方式,多肽变体含有不改变被编码多肽的生物学功能的突变。此类多肽的氨基酸序列与SEQ ID NO:3、SEQ ID NO:15、SEQ ID NO:18或SEQ ID NO:21有所不同,但保留它们生物学活性中的至少一种,并且优选地,这些蛋白质不是具有WO01/68864所公开的SEQ ID NO:2或29的蛋白。关于如何制造出表型沉默氨基酸取代的指导,提供于Bowie,J.U.et al.,Science 247:1306-1310(1990)中。
根据一种优选的实施方式,多肽变体展示出蛋白酶启动子转录活化因子的特定功能。该转录活化因子变体至少展示出针对至少一种蛋白酶启动子的转录活化因子的功能。该变体可仅含有对具有SEQ ID NO:3、SEQID NO:15、SEQ ID NO:18或SEQ ID NO:21的序列的一处或多处氨基酸的保守取代,或不重要氨基酸的取代、插入或缺失。因此,不重要氨基酸是上述序列之一中可被改变而基本不会改变生物学功能的残基。例如,在本发明的转录活化因子间保守的氨基酸残基被预计为特别不适合改变。术语“保守取代”用于表示下述取代,其中,氨基酸残基被具有相似侧链的氨基酸残基所取代。这些家族是本领域已知的,其包括具有碱性侧链(例如,赖氨酸、精氨酸和组氨酸)、酸性侧链(例如,天冬氨酸和谷氨酸)、不带电荷的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、带beta支链侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。
此类突变可通过标准技术引入,例如定点诱变或PCR介导的诱变。诱变程序的例子是QuickChangeTM定点诱变试剂盒(Stratagene CloningSystems,La JoIIa,CA)、Altered SitesII体外诱变系统(PromegaCorporation),或通过使用Gene.1989 Apr 15;77(1):51-9.(Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis by overlapextension using the polymerase chain reaction″)所述的PCR或使用MolecularBiology:Current Innovations and Future Trends.(Eds.A.M.Griffin and H.G.Griffin.ISBN 1-898486-01-8;1995 Horizon Scientific Press.PO Box 1,Wymondham,Norfolk,U.K.)所述的PCR进行的覆盖延伸。
本发明的蛋白酶启动子转录活化因子可从任何有丝真菌获得。
“有丝真菌”包括Oomycota和Eumycota亚门的所有有丝形式(如前文Hawksworth et al.,1995所定义)。有丝真菌的特征在于几丁质、纤维素、葡聚糖、脱乙酰几丁质、甘露聚糖和其它复杂多糖构成的菌丝体壁。营养生长通过菌丝延长进行,碳代谢是专性需氧的。有丝真菌菌株包括但不限于,Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium和Trichoderma的菌株。
在一种更优选的实施方式中,本发明的蛋白酶启动子转录活化因子获得自Aspergillus的菌株,例如A.awamori、A.nidulans、A.niger、A.oryzae、A.sojae或A.fumigatus。优选地,转录活化因子从A.niger或A.oryzae或A.fumigatus的菌株获得。进一步更优选地,转录活化因子从A.fumigatus的菌株的分离物获得,例如,SEQ ID NO:18所示的多肽序列。进一步更优选地,转录活化因子从A.oryzae的菌株的分离物获得,例如,SEQ ID NO:15所示的多肽序列。进一步更优选地,转录活化因子从A.niger的菌株的分离物获得,例如,SEQ ID NO:3所示的多肽序列。
在另一种优选的实施方式,转录活化因子从Penicillium(例如Penicillium chrysogenum)的菌株的分离物获得;例如,SEQ ID NO:21所示的多肽序列。
根据另一种优选的实施方式,本发明的转录活化因子是A.niger、A.oryzae、A.fumigatus或P.chrysogenum转录活化因子的直向同源物。这些多肽的直向同源物是可从其它菌株或物种分离出的、具有类似或相同生物学活性的多肽。可按照包含与SEQ ID NO:3、SEQ ID NO:15、SEQ IDNO:18或SEQ ID NO:21高度同源的氨基酸序列的原则,容易地鉴定出此类直向同源物。
术语“高度同源”指下述第一条氨基酸或核苷酸序列,其含有足够或满足最小数量的与第二条氨基酸或核苷酸序列的氨基酸或核苷酸相同或等同(例如,具有相似的侧链)的氨基酸或核苷酸,使得第一条和第二条氨基酸或核苷酸序列具有共有的肽或核酸片段。例如,含有共同的肽或核酸片段的、具有大约90%、优选大约92%、优选大约93%、优选大约95%、更优选大约97%、进一步更优选大约99%的同一性或更高同一性的多肽或核苷酸序列在本文中被定义为足够相同。此类共同结构域的一个例子是SEQ ID NO:4、SEQ ID NO:22、SEQ ID NO:25、SEQ ID NO:26或SEQ ID NO:27中展示的那个。
在一种优选的实施方式中,蛋白启动子转录活化因子具有根据SEQ IDNO:3、SEQ ID NO:15、SEQ ID NO:18或SEQ ID NO:21的氨基酸序列。在另一种实施方式中,多肽或由此获得的肽与根据SEQ ID NO:3、SEQ ID NO:15、SEQ ID NO:18或SEQ ID NO:21、SEQ ID NO:4、SEQ ID NO:22、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27的氨基酸序列高度同源,并且保留根据SEQ ID NO:3、SEQ ID NO:15、SEQ ID NO:18或SEQ ID NO:21的多肽的至少一种生物学活性,但由于上文所述的诱变或天然变异,氨基酸序列仍有不同。优选地,本发明的蛋白酶启动子转录活化因子并非WO 01/68864中展示的、具有SEQ IDNO:2或29的那些。
在另一种优选的实施方式中,本发明的转录活化因子从Fusarium(例如F.oxysporum)的菌株获得。优选地,该菌株是F.venenatum的菌株。
应当理解,关于上述物种,本发明包括完美和不完美的状态以及其它分类学等同物,例如,无性型(anamorph),无论它们已知的物种名是什么。本领域技术人员将容易地识别出合适的等同物的身份。例如,多肽可从Raper,K.D.and Fennel,D.1.(1965.The Genus Aspergillusjhe WilkinsCompany,Baltimore MD)所定义的Aspergillus分类学等同物的微生物获得,而无论它们已知的物种名是什么。
Aspergilli是有丝分裂的真菌,其特征在于由无性孢子柄组成的曲霉(aspergillum),其没有已知的有性状态,其顶部为囊,该囊进而承担一层或两层同步形成的专门细胞(分别被称为担孢子梗(sterigmata)或瓶梗(phialide))以及无性形成的孢子(被称为分生孢子)。已知的Aspergillus有性型(teleomorph)包括Eurotium、Neosartorya和Emericella。
公众可以从大量培养集合物容易地获得Aspergillus及其有性型。根据一种优选的实施方式,用于分离转录活化因子的有丝真菌的菌株是Aspergillus niger CBS513.88、Aspergillus oryzae ATCC20423、IFO4177、ATCC1011、ATCC9576、ATCC14488-14491、ATCC11601、ATCC12892、Aspergillus fumigatus AF293(CBS101355)、P.chrysogenumCBS455.95、Penicillium citrinum ATCC38065、Penicillium chrysogenumP2、Acremonium chrysogenum ATCC36225或ATCC48272、Trichodermareesei ATCC26921或ATCC56765或ATCC26921、Aspergillus sojaeATCC11906、Chrysosporium lucknowense ATCC44006及其衍生物。
此外,可使用上述探针,从其它来源鉴定并获得此类蛋白酶启动子转录活化因子,所述来源包括从自然界(例如土壤、肥料、水等)分离的微生物。用于从自然栖息地分离微生物的技术是本领域公知的。然后可通过对另一种微生物的基因组或cDNA文库加以类似的筛选来获得核酸序列。一旦已用探针探测到了编码蛋白酶启动子转录活化因子的核酸序列,可通过利用本领域技术人员已知的技术分离或克隆出序列(见例如,J.Sambrook,et al.1989)。
蛋白酶启动子的减效转录活化因子
在本发明的另一种优选的实施方式中,蛋白启动子的转录活化因子的变体是蛋白酶启动子的减效转录活化因子。蛋白酶启动子的减效转录活化因子是下述多肽,其中,使用给定的试验,或本说明书前文定义的体外试验在给定的有丝真菌宿主中进行测量时,较之它们的野生型副本的生物学活性而言,它们有至少一种生物学活性被降低。例如,使用给定的试验之一在给定的有丝真菌宿主中测量时,此类多肽较之其野生型副本,可具有针对至少一种蛋白酶启动子的较小的转录活性。或者,使用给定的试验之一在给定的有丝真菌宿主中测量时,减效的多肽较之其野生型副本的活性而言,可丢失其对至少一种特定蛋白酶启动子的转录活性,而保持其野生型副本对至少另一种蛋白酶启动子的活性。根据一种优选的实施方式,使用给定的试验之一在给定的有丝真菌宿主中测量时,较之其野生型副本的活性,减效的转录活化因子不具有对于被检验的任何蛋白酶启动子的任何可探测到的转录活化活性。用于测量减效的转录活化因子的一种优选的试验方法是:按照本文所述,使用牛血清清蛋白(BSA)作为底物,通过测量酸性内切蛋白酶的活性来进行。优选地,用于进行蛋白酶试验的有丝真菌宿主是如本说明书前文所述已保藏的菌株之一。所有这些减效的转录活化因子可用于在给定的有丝真菌宿主细胞中代替它们的野生型副本。此类细胞高度适合用于生产将经历蛋白酶降解的任何多肽(见宿主细胞一节)。此类细胞,特别是Aspergillus fumigatus还可具有降低的病原性。
可通过向其编码序列的全部或部分随机引入突变来获得(使用SEQ IDNO:2、SEQ ID NO:14、SEQ ID NO:17或SEQ ID NO:20)此类多肽,例如通过饱和诱变来获得,可重组表达得到的突变体,并使用前文提到的试验方法之一针对生物学活性对其加以筛选。例如,现有技术提供了用于测量转录活性的标准试验,因此可以容易地选出具有衰退的转录活性的转录活化因子。
具有增强的活性的蛋白酶启动子转录活化因子
根据本发明的另一种优选的实施方式,蛋白酶启动子的转录活化因子的变体是具有增强的活性的蛋白酶启动子转录活化因子。具有增强的活性的蛋白酶启动子转录活化因子是下述多肽,其中,使用给定的试验,或体外试验在给定的有丝真菌宿主中进行测量时,较之它们的野生型副本的生物学活性而言,它们有至少一种生物学活性被提高。例如,使用前文提高的试验之一在给定的有丝真菌宿主中测量时,此类多肽较之其野生型副本,可具有针对至少一种蛋白酶启动子的至少更高的转录活性。或者,使用给定的试验之一在给定的有丝真菌中测量时,增强的多肽较之其野生型副本的活性而言,可具有针对至少一种特定蛋白酶启动子的更高的蛋白酶启动子转录活性,而保持其野生型副本对至少另一种蛋白酶启动子的活性。根据一种优选的实施方式,使用前文所述试验之一在给定的有丝真菌宿主中测量时,较之其野生型副本的活性,增强的转录活化因子对被检验的任何蛋白酶启动子都具有增强的转录活化活性。用于测量增强的转录活化因子的一种优选的试验方法是:按照本文所述,使用牛血清清蛋白(BSA)作为底物,通过测量酸性内切蛋白酶的活性来进行。优选地,用于进行蛋白酶试验的有丝真菌宿主是如本说明书前文所述已保藏的菌株之一。所有这些增强的转录活化因子可用于在给定的有丝真菌宿主细胞中代替它们的野生型副本。此类细胞高度适合用于生产将经历此类转录活化因子的转录调节的任何多肽(见宿主细胞一节)。可使用与针对获得减效的转录活化因子所述相同的策略来获得此类增强的转录活化因子。
编码蛋白酶启动子转录活化因子的核酸序列
根据另一个方面,本发明提供了一种核酸序列,其编码如前面的章节所定义的多肽。
在一种优选的实施方式中,核酸序列选自下述构成的组:
(a)一种核酸序列,其与SEQ ID NO:2或SEQ ID NO:14或SEQID NO:17或SEQ ID NO:20的核酸序列具有至少50%的匹配百分比,即同一性;或
(b)一种核酸序列,其包含下述片段,所述片段与SEQ ID NO:2的核酸序列的碱基对编号1267至碱基对编号1302构成的片段具有至少45%的匹配百分比,即同一性;或
(c)一种核酸序列,其与SEQ ID NO:2或SEQ ID NO:14或SEQID NO:17或SEQ ID NO:20的核酸序列具有至少50%的匹配百分比,即同一性,并且包含下述片段,所述片段与SEQ ID NO:2的核酸序列的碱基对编号1267至碱基对编号1302构成的片段具有至少45%的匹配百分比,即同一性;或
(d)(a)、(b)或(c)的变体;或
(e)(a)、(b)、(c)或(d)的亚序列。
优选地,匹配百分比,即同一性为至少大约60%,更优选至少大约70%,进一步更优选至少大约80%,进一步更优选至少大约90%,进一步更优选至少大约93%,进一步更优选至少大约95%,进一步更优选至少大约96%,进一步更优选至少大约97%,进一步更优选至少大约98%,最优选至少大约99%的同一性。
在进一步更优选的一种实施方式中,编码蛋白酶启动子转录活化因子的核酸序列具有SEQ ID NO:2或SEQ ID NO:14或SEQ ID NO:17或SEQ ID NO:20所示的核酸序列,或图3所示质粒pGBFINPRT-1(作为CBS118680保藏)的XhoI/HindIII片段或图19所示质粒pGBPRT-1(作为CBS118681保藏)中含有的prtT cDNA。
根据另一种优选的实施方式,本发明的核酸序列不是WO 01/68864中公开的核酸序列SEQ ID NO:1或SEQ ID NO:48。
根据另一种优选的实施方式,本发明的核酸序列是前文定义的任何核酸序列的变体。对本发明的核酸序列的修饰对于合成变体多肽(如说明书前文所定义的)来说可能是必须的。核酸序列变体可基于核酸序列SEQID NO:2、SEQ ID NO:14、SEQ ID NO:17或SEQ ID NO:20或图3所示质粒pGBFINPRT-1(作为CBS118680保藏)的XhoI/HindIII片段或图19所示质粒pGBPRT-1(作为CBS118681保藏)中含有的prtT cDNA来构建。
核酸序列变体可以是前文提到的天然核酸序列的片段。优选的核酸序列变体是含有沉默突变的核酸序列。或者,或以组合的方式,核酸序列变体还可通过引入下述核苷酸取代来获得,所述取代不会导致核酸序列编码的多肽具有另外的氨基酸序列,但其对应于用于生产酶的宿主生物的密码子使用,或者还可通过引入可能产生不同氨基酸序列的核苷酸取代来获得。对于核苷酸取代的一般描述,见,例如Ford et al.,1991,ProteinExpression and Purification 2:95-107。
优选地,核酸变体是这样的:其从前文提到的核酸序列中的任意一种缺失5’和/或3’末端的一个或多个核苷酸。更优选地,变体编码对于蛋白酶启动子具有转录活化活性的多肽片段。
或者,或以组合的方式,核酸序列变体优选为编码下述转录活化因子的核酸序列,所述转录活化因子分离自其它生物,和/或编码存在于同一生物中的、最初分离的转录活性因子的家族成员。可通过典型手段,使用cDNA或基因组DNA文库,通过在低至中等至高严谨度条件下与可用于设计探针的下述核酸序列之一进行杂交,对上述文库加以筛选,来获得所有这些变体,所述文库是从例如有丝真菌(特别是从Aspergillus的种)等生物构建的,所述核酸序列是:
-SEQ ID NO:2
-SEQ ID NO:14
-SEQ ID NO:17
-SEQ ID NO:20
-图3所示质粒pGBFINPRT-1(作为CBS118680保藏)的XhoI/HindIII片段
-图19所示质粒pGBPRT-1(作为CBS118681保藏)中含有的prtTcDNA
-或这些序列中任何一种的片段,优选地,由SEQ ID NO:2的核酸序列的碱基对编号1267至碱基对编号1302构成的片段,
-它们的互补链。
低至中等至高严谨度条件表示:于42℃在5×SSPE、0.3%SDS、200pg/ml经剪切和变性的鲑鱼精DNA以及对于低至中等至高严谨度而言分别为25%、35%或50%的甲酰胺中进行预杂交和杂交。随后,杂交反应体系被洗三次,每次30分钟,使用2×SSC、0.2%SDS以及对于低至中等至高严谨度而言55℃、65℃或75℃下来进行。
设计的探针较之完整序列可短得多,但应当为至少15,优选至少25,更优选至少40个核苷酸长。此外,此类探针可用于通过PCR扩增DNA。DNA、RNA和肽核酸(PNA)探针可用于杂交。此类探针被本发明所包括。典型地,对探针加以标记,用于探测相应的基因(例如,用32P、33P、3H、35S、生物素、亲和素或荧光标记来标记)。例如,可使用x射线胶片或Phospho-Image分析来探测与32P、33P、3H或35S标记的寡核苷酸探针杂交的分子。
核酸序列的变体还可以是蛋白酶启动子转录活化因子的共生同源体(paralogous)。在本发明的上下文中,共生同源体指从A.niger或A.oryzae或A.fumigatus或P.chrysogenum获得的、SEQ ID NO:2、SEQ IDNO:2的核酸序列的碱基对编号1267至碱基对编号1302构成的核酸序列、SEQ ID NO:14、SEQ ID NO:17或SEQ ID NO:20的核酸序列同源物。
例如,可通过Northern印迹杂交分析,针对编码蛋白酶启动子转录活化因子的同源核酸序列,对Aspergillus菌株加以筛选。一旦探测到与根据本发明的核酸序列同源的转录本,即可使用本领域普通技术人员公知的标准技术,从由合适的菌株分离的RNA来构建cDNA文库。或者,可使用能与根据本发明的核酸序列杂交的探针,对全基因组DNA文库加以筛选。
用于反应的模板可以是通过对从已知或推测能表达根据本发明的核酸序列的菌株制备的mRNA进行逆转录获得的cDNA。可对PCR产物进行亚克隆以及测序,以确保扩增出的序列代表了蛋白酶启动子的新的转录活性因子或其功能等同物的核酸序列。然后可通过多种已知方法将PCR片段用于分离全长cDNA克隆。
PCR技术还可用于从其它生物分离全长cDNA序列。例如,可按照标准程序从合适的细胞或组织来源分离RNA。然后可使用标准末端转移酶反应,对得到的RNA/DNA杂交体进行“加尾”(例如,用鸟嘌呤),可用RNase H来消化杂交体,然后可引导第二链合成(例如用poly-C引物)。关于有用的克隆策略的综述,见,例如Sambrook et al.,1989;and Ausubclet al.,Current Protocols in Molecular Biology,Wiley lnterscience Publishers,1995。
根据另一种优选的实施方式,核酸变体是等位基因变体。等位基因变体指占据同一染色体基因座的基因的两种或多种可替换形式的任何一种。等位基因变异通过突变天然产生,其可导致种群内的表型多态性。基因突变可以是沉默的(即,编码的多肽没有变化),或者可编码具有改变的氨基酸序列的多肽。在一种优选的实施方式中,编码本发明蛋白酶启动子的转录活化因子的核酸序列是本说明书前文定义的核酸序列之一的等位基因变体。
核酸变体还可以是由于遗传密码的简并性不同于
-SEQ ID NO:2
-SEQ ID NO:14
-SEQ ID NO:17
-SEQ ID NO:20
-(图3所示)质粒pGBFINPRT-1(作为CBS118680保藏)的XhoI/HindIII片段
-图19所示质粒pGBPRT-1(作为CBS118681保藏)中含有的prtTcDNA
的核酸序列。
核酸变体还可以是包含下述片段的变体的核酸序列,所述片段由SEQID NO:2的核酸序列的碱基对编号1267至碱基对编号1302构成。变体被赋予与本节前文所述同样的含义。
用于分离或克隆编码多肽的核酸序列的技术是本领域已知的,其包括从基因组DNA分离,从cDNA制备或其组合。从上述基因组DNA对本发明的核酸序列的克隆可例如通过使用下述方法来进行,所述方法基于聚合酶链式反应(PCR)或对表达文库进行的抗体筛选(以探测具有共同结构特征的被克隆的DNA片段)(见,例如lnnis etal.,1990,PCR:A Guide toMethods and Application,Academic Press,New York.)。可以使用其它核酸扩增方法,例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于核酸序列的扩增(NASBA)。
在另一种优选的实施方式中,核酸序列编码下述多肽,所述多肽包含SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ ID NO:21的氨基酸序列或其片段,所述多肽具有针对蛋白酶启动子的转录活化活性。在另一种优选的实施方式中,核酸序列编码下述多肽,所述多肽包含SEQ ID NO:4或SEQ ID NO:25或SEQ ID NO:26或SEQ ID NO:27和/或SEQ ID NO:22的氨基酸序列。
根据另一种优选的实施方式,本发明涉及具有SEQ ID NO:16和SEQ ID NO:19的核酸序列。这些核酸序列是分别来自A.fumigatus和P.chrysogenum的基因组核酸序列。
序列错误
本文提供的序列信息不应被狭义地理解为需要包括进错误鉴定的碱基。本文公开的特定序列可容易地用于从有丝真菌,特别是A.niger中分离出完整基因,接着还可以容易地对其进行进一步序列分析由此鉴定出序列错误。
除非另有指明,本文中通过对DNA分子测序测得的所有核苷酸序列都是用自动DNA测序仪测得的,本文中,测定的DNA分子编码的多肽的所有氨基酸序列都是通过对上文测定的DNA序列进行翻译推断出来的。因此,如本领域技术人员针对通过该自动方法测得的任何DNA序列已知的那样,本文测定的任何核苷酸序列可能含有一些错误。典型地,通过自动方法测定的核苷酸序列与被测序的DNA的实际核苷酸序列至少大约90%相同,更典型地,至少大约95%至至少大约99.9%相同。可以通过其它方法,包括本领域公知的手动DNA测序方法对实际序列进行更为精确的测定。本领域还已知,较之实际序列,测得的核苷酸序列中的单个插入或缺失将导致对核苷酸序列的翻译中出现读码框位移,这会使得测得的核苷酸序列编码的预期氨基酸序列从上述插入或缺失的点开始就完全不同于被测序的DNA序列实际编码的氨基酸序列。
本领域技术人员能鉴定出此类被错误鉴定的碱基,并且知道如何更正此类错误。
应当理解,本发明不包含WO 01/68864中公开的、分别具有SEQ IDNO:1或48和2或49的prtT核酸序列和PrtT多肽序列。
核酸构建体
本发明的另一方面涉及核酸构建体,其包含编码本发明蛋白酶启动子转录活化因子的核酸序列,所述转录活化因子是分离出的,或是具有减效的或增强的针对蛋白酶启动子的转录活性的,所述核酸序列与一种或多种控制序列可操作地相连,所述控制序列指导在合适的表达宿主中对蛋白酶启动子的转录活化因子的生产。在一种优选的实施方式中,核酸序列是SEQ ID NO:2、SEQ ID NO:14、SEQ ID NO:17或SEQ ID NO:20,它们分别编码SEQ ID NO:3、SEQ ID NO:15、SEQ ID NO:18或SEQID NO:21所示的多肽。
表达应被理解为包括对多肽的生产中涉及的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
在插入到载体之前对编码多肽的核酸序列的操作可能是人们想要的或必需的,这取决于表达载体。用于利用克隆方法修饰核酸序列的技术是本领域公知的。
“核酸构建体”在本文中被定义为单链或双链的核酸分子,其是从天然存在的基因分离出的,或已经过修饰以含有以自然界中不存在的方式组合及并置的核酸片断。当核酸构建体含有编码序列表达所需的所有控制序列时,术语核酸构建体与术语表达盒同义。术语“编码序列”在本文中被定义为:能转录成mRNA并翻译成本发明蛋白酶启动子转录活化因子的序列。编码序列的边界通常通过mRNA 5’末端的ATG起始密码子和mRNA3’末端终止开放读码框的翻译终止密码子序列来界定。编码序列可包括但不限于DNA、cDNA和重组核酸序列。
术语“控制序列”在本文中被定义为包括对于多肽表达来说必须或有利的所有组分。每种控制序列可以是编码多肽的核酸序列天然的或外源的。此类控制序列包括但不限于,引导序列、最优翻译起始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870所述)、聚腺苷化序列、前肽(pro-peptide)序列、前原肽(pre-pro-peptide)序列、启动子、信号序列和转录终止子。就最小程度而言,控制序列包括启动子以及转录和翻译终止信号。
就引入特异性限制性位点以协助控制序列与编码多肽的核酸序列的编码区域连接的目的而言,控制序列可与连接子(linker)一起提供。术语“可操作地相连”在本文中被定义为下述构型,其中,控制序列以相对于DNA序列的编码序列的下述位置被合适地放置,所述位置使得控制序列能指导多肽的生产。
控制序列可以是合适的启动子序列,这是能被宿主细胞识别用于表达核酸序列的核酸序列。启动子序列含有能介导多肽表达的转录控制序列。启动子可以是在细胞中显示出转录活性的任何核酸序列,其包括突变体、截短的和杂交启动子,其可从编码对细胞来说同源或异源的细胞外或细胞内多肽的基因获得。
控制序列还可以是合适的转录终止子序列,这是能被有丝真菌细胞识别用来终止转录的序列。终止子序列与编码多肽的核酸序列的3’末端可操作地相连。在细胞中具有功能的任何终止子可用于本发明。
优选用于有丝真菌细胞的终止子可从编码A.oryzae TAKA-淀粉酶、A.niger葡糖淀粉酶(glucoamylase,glaA)、A.nidulans邻氨基苯甲酸盐/酯合酶、A.niger alpha葡糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶类似蛋白酶的基因获得。
控制序列还可以是合适的引导序列,这是mRNA的非翻译区域,其对于通过有丝真菌细胞的翻译来说是重要的。引导序列与编码多肽的核酸序列的5’末端可操作地相连。在细胞中具有功能的任何引导序列都可用于本发明。
优选用于有丝真核细胞的引导序列可从编码A.oryzae TAKA-淀粉酶和A.nidulans丙糖磷酸酯异构酶和A.niger glaA的基因获得。
其它控制序列可从青霉菌IPNS基因或pcbC基因、beta微管蛋白基因获得。WO 01/021779中提到的所有控制序列通过引用并入本文。
控制序列还可以是聚腺苷化序列,这是与核酸序列3’末端可操作地相连,并且当被转录时能被有丝真菌细胞作为信号识别以向经转录mRNA加上聚腺苷残基的序列。在细胞中具有功能的任何聚腺苷化序列都可用于本发明。
优选用于有丝真核细胞的聚腺苷化序列从编码A.oryzae TAKA-淀粉酶、A.niger葡糖淀粉酶、A.nidulans邻氨基苯甲酸盐/酯合酶、Fusariumoxysporum胰蛋白酶类似蛋白酶和A.niger alpha葡糖苷酶的基因获得。
表达载体
本发明还涉及重组表达载体,其包含本发明的核酸序列、启动子以及转录和翻译终止信号。上文所述的多种核酸和控制序列可连接到一起,产生重组表达载体,其中可包括一个或多个方便的限制性位点,以允许在此类位点对编码多肽的核酸序列进行插入或取代。
或者,编码多肽的核酸序列可通过将所述序列或包含所述序列的核酸构建体插入到合适的用于表达的载体中来表达。在制造表达载体的过程中,编码序列以下述方式放置于载体中,所述方式使得编码序列与用于表达以及可能的分泌的合适的控制序列可操作地相连。
重组表达载体可以是能方便地经历重组DNA过程并能导致编码多肽的核酸序列表达的任何载体(例如质粒或病毒)。典型地,对载体的选择将取决于载体与载体将被引入到其中的有丝真菌细胞之间的相容性。载体可以是线性的或闭合环状的质粒。载体可以是自主复制载体,即作为其复制不依赖染色体复制的染色体外主体存在的载体,例如,质粒、染色体外元件、微型染色体或人工染色体。自主保持的克隆载体可包含AMA1-序列(见,例如Aleksenko and Clutterbuck(1997),Fungal Genet.Biol.21:373-397)。
或者,载体可以是下述载体,当其被引入有丝真菌细胞时,其整合进基因组,与其已整合进的染色体一起复制。整合型克隆载体可在有丝真菌宿主的染色体中随机整合或在预定目标基因座整合。在本发明的一种优选的实施方式中,整合型克隆载体包含下述DNA片段,该片段与有丝真菌宿主细胞基因组中预定目标基因座中的、用于将克隆载体整合到预定基因座上的DNA序列同源。为促进定位整合,优选在转化宿主细胞之前对克隆载体进行线性化。线性化优选进行至如下程度:使得克隆载体的至少一端,但优选任意一端,侧翼有与目标基因座同源的序列。目标基因座侧翼的同源序列的长度优选为至少30bp,优选地,至少50bp,优选地,至少0.1kb,进一步优选地,至少0.2kb,更优选地,至少0.5kb,进一步更优选地,至少1kb,最优选地,至少2kb。优选地,克隆载体中与目标基因座同源的DNA序列是从高度表达的基因座获得的,这意味着,其是从能在有丝真菌宿主细胞中高水平表达的基因获得的。能高水平表达的基因,即,高度表达的基因在本文中被定义为其mRNA占细胞总mRNA的至少0.5%(w/w)的基因,例如,在诱导条件下的,或者其基因产物占细胞总蛋白的至少1%(w/w)的基因,或者,在分泌出的基因产物的情况下,可分泌至至少0.1g/l的水平(如EP 357 127 B1所述)。大量优选的高度表达的真菌基因的例子是:来自Aspergilli或Trichoderm的淀粉酶、葡糖淀粉酶、醇脱氢酶、木聚糖酶、磷酸甘油醛脱氢酶或纤维二糖水解酶(cellobiohydrolase,cbh)基因。用于这些目的的最优选的高度表达的基因是葡糖淀粉酶基因(优选A.niger葡糖淀粉酶基因)、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、Trichoderma reesei cbh基因(优选地,cbh1)。根据另一种优选的实施方式,高度表达的基因是SEQ IDNO:1、SEQ ID NO:13、SEQ ID NO:16或SEQ ID NO:19的基因座。可向宿主细胞中插入编码多肽的核酸序列的超过一个拷贝,以增加基因产物的生产。这可以通过下述方法来进行,优选地,通过将DNA序列的多个拷贝整合进其基因组,更优选地,通过将DNA序列的整合定位于前文定义的高度表达的基因座之一处。或者,这可以通过将可扩增的选择标记基因加入核酸序列来进行,其中可通过在合适的选择试剂存在的情况下培养所述细胞来对含有选择标记基因的扩增拷贝以及由此核酸序列的额外拷贝的细胞加以选择。为进一步增多将被过量表达的DNA序列的拷贝数,可以使用WO98/46772所述的基因转化技术。
载体系统可以是单个载体或质粒,或两个或多个载体或质粒,它们一起含有将被引入到有丝真菌细胞中的总DNA或转座子。
载体优选含有一种或多种选择标记,其允许对经转化的细胞进行容易的选择。选择标记是提供杀生物剂或病毒抗性、对重金属的抗性、针对营养缺陷型的原营养型等的产品的基因。用于有丝真菌细胞的选择标记可选自包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦转移酶)、bleA(脉霉素结合)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5′-磷酸脱羧酶)、sC(硫酸腺苷转移酶)和trpC(邻氨基苯甲酸盐/酯合酶)以及来自其它物种的等同物的组。用于Aspergillus和Penicillium细胞的优选者是A.nidulans或A.oryzae的amdS(EP 635574 B1、WO 97/06261)和pyrG基因,以及Streptomyces hygroscopicus的bar基因。更优选地,使用amdS基因,进一步更优选地,使用来自A.nidulans或A.niger的amdS基因。最优选的选择标记基因为与A.nidulans gpdA启动子融合的A.nidulans amdS编码序列(见EP 635574 B1)。来自其它有丝真菌的amdS基因也可使用(WO97/06261)。
用于将上述元件连接起来以构建本发明的重组表达载体的方法是本领域技术人员公知的(见,例如,上文所述的Sambrook et al.,1989)。
宿主细胞
本发明的所有转录活化因子优选用于设计两种类型的宿主细胞:
-第一种类型的宿主细胞将高度适合用于生产想要的多肽,所述想要的多肽对蛋白酶降解敏感,以及
-第二种类型的宿主细胞将高度适合用于生产下述多肽,所述多肽处于本发明转录活化因子的控制下。
可选地,两种类型的宿主细胞额外包含表达构建体或核酸构建体,所述构建体包含编码将被生产的多肽的核酸序列,所述多肽为对蛋白酶降解敏感的多肽或处于转录活化因子控制下的多肽或转录活化因子本身。
可选地,宿主细胞包含提高的解折叠蛋白应答(UPR),以增加对目标多肽的生产能力。可通过US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2所述的技术来增加UPR。更具体地,HAC1和/或IRE1和/或PTC2的蛋白水平已被调节,用于获得具有提高的UPR的宿主细胞。
本发明中对宿主细胞的选择将很大程度上取决于编码将被生产的目标多肽的核酸序列的来源。优选地,宿主细胞是前文关于编码蛋白酶启动子转录活化因子的核酸序列章节所定义的,或WO 01/68864或WO 00/20596所定义的有丝真菌。
将表达载体或核酸构建体引入有丝真菌细胞可能涉及下述方法,所述方法由以本身已知的手段进行的原生质体形成、对原生质体的转化以及细胞壁重建构成。用于转化Aspergillus细胞的合适方法见EP 238 023和Yelton etal.,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474所述。用于转化Fusarium的种的方法由Malardier et.al.,1989,Gene 78:147156或WO 96/00787所述。可使用的表达载体或核酸构建体已在相关章节下被描述。
在一种更为优选的实施方式中,本发明的蛋白酶启动子转录活化因子从A.niger菌株获得,更优选地,从Aspergillus niger AB4.1(vanHartingsveldt,W.,et al.,1987.MoI.Gen.Genet.206:71-75)获得,最优选地,从携带有,例如,具有SEQ ID NO:3的氨基酸序列的多肽的A.nigerCBS 513.88或其突变体获得。
根据另一种优选的实施方式,本发明的蛋白酶启动子转录活化因子从携带有,例如,分别具有SEQ ID NO:15、SEQ ID NO:18和SEQ IDNO:21的氨基酸序列的多肽的下述被保藏菌株之一获得:A.oryzae ATCC20423、IFO4177、ATCC1011、ATCC9576、ATCC14488-14491、ATCC11601、ATCC12892、A.fumigatus Af 293(CBS101355)或P.chrysogenumCBS455.95。
适合用于生产对蛋白酶降解敏感的多肽的宿主细胞
根据一种优选的实施方式,本发明涉及可用于生产对蛋白酶降解敏感的多肽的有丝真菌宿主细胞,其是亲本有丝真菌细胞的突变体,其中,所述亲本细胞包含编码蛋白酶的一种或多种核酸(DNA)序列,所述序列的转录受到本发明转录活化因子的激活,在同样条件下培养时突变体细胞较之亲本细胞产生较少的转录活化因子和/或蛋白酶,这优选通过本说明书前文或下文所述的蛋白酶活性试验来测量。
用于测量宿主细胞中蛋白酶活性的优选方法在本文中关于使用牛血清清蛋白(BSA)作为底物测定酸性内切蛋白酶活性的实施例章节中有所描述。对该方法的详细描述还见van den Hombergh et al.,Current Genetics 28:299-308(1995)。对蛋白酶的测量还可使用其它已知方法来进行试验。在一种此类方法中,将48小时培养物介质的小份与3H标记的抹香鲸肌红蛋白在pH4.0一起培养,测量TCA可溶部分的放射活性(van Noort,J.M.,ctal.,1991.Anal.Biochem 198:385-390)。还描述了用于鉴定的其它方法,例如,A.niger的天冬氨酸蛋白酶A(Takahashi,K.,1991.Meth.in Enzymol.248:146-155)、内肽酶(Morihara,K.,1995.Meth.in Enzymol.248:242-253)、羧肽酶(Reminton,J.,and Breddam,K.,1994.Meth.in Enzymol.244:231-248)、二肽酰肽酶(Ikehara,Y.,et al.,244:215-227)和氨肽酶(Little,G.,et al.,1976.Meth.in Enzymol.45:495-503)。或者,也可使用其它蛋白酶试验,例如WO 02/068623中所述的。或者,使用的试验可以是本文还描述过的northern印迹杂交(Molecular Cloning:A LaboratoryManual,Sambrook et al1989),对蛋白酶启动子控制下的报道基因的使用,或western印迹杂交或DNA阵列分析(Eisen,M.B.and Brown,P.O.DNA arrays for analysis of gene expression.Methods Enzymol.1999:303:179-205)。
根据一种优选的实施方式,突变体细胞具有:经修饰的或失活的、蛋白酶启动子的内源转录活化因子,或已被减效转录活化因子置换的内源转录活化因子。根据另一种优选的实施方式,突变体表达转录活性已被调节的蛋白酶启动子转录活化因子。
根据另一种优选的实施方式,通过给定试验中任何一种进行测量时,突变体细胞A.niger较之被保藏的细胞CBS 513.88产生更少的转录活化因子和/或更少的蛋白酶。根据另一种优选的实施方式,突变体细胞Aspergillus oryzae较之前面提到的被保藏的A.oryzae产生更少的转录活化因子和/或更少的蛋白酶。根据另一种优选的实施方式,突变体细胞Penicillium chrysogenum较之CBS 455.95产生更少的转录活化因子和/或更少的蛋白酶。根据另一种优选的实施方式,突变体细胞Aspergillusfumigatus较之Aspergillus fumigatus AF293(CBS101355)产生更少的转录活化因子和/或更少的蛋白酶。
此类突变体细胞可通过用下述技术之一或其组合进行遗传操作来获得:
a.使用重组遗传操作技术,
b.对有丝真菌进行诱变。
或者,或与上述技术组合,根据另一种优选的实施方式,可通过向有丝真菌施加抑制性化合物/组合物来获得突变体。
随后可通过对本发明核酸序列和/或已知处于本发明转录活化因子控制下的任何蛋白酶的核酸序列的表达水平加以监测,来对获得的有丝真菌进行选择。可选地,随后通过对将在宿主细胞中表达的给定目标基因的表达水平加以测量来对有丝真菌进行选择。
更优选地,采用重组遗传操作技术(例如步骤a中定义的,用于获得重组有丝真菌的)来制造突变体。最优选地,步骤a包含:使编码转录活化因子的DNA序列缺失,进一步最优选地,缺失的DNA序列被其非功能性变体置换,进一步更优选地,缺失和置换通过基因置换来进行,优选如EP 367127B中所述的。
在一种优选的实施方式中,通过对细胞中存在的、对于转录活化因子的表达来说必要的核酸序列加以修饰或失活,来获得突变体细胞。
在另一种优选的实施方式中,通过对转录活化因子表达所需要的控制序列进行修饰或失活,来获得在突变体细胞中转录活化因子和/或蛋白酶的降低表达。术语“控制序列”在前文中题为“核酸构建体”的章节中被定义。在一种更优选的实施方式中,突变体细胞中的控制序列是启动子序列或其功能性部分,即,足以影响核酸序列表达的部分。用于可能的修饰的其它控制序列包括但不限于:引导序列、聚腺苷化序列、调控序列和转录终止子。
在又一种优选的实施方式中,突变体细胞中转录活化因子和/或蛋白酶的降低表达是通过将起始密码子(ATG)修饰为次优起始密码子来获得的。
对编码本发明转录活化因子的核酸序列的修饰或失活可通过下述方法来进行:对亲本细胞进行诱变,选出其中生产转录活化因子的能力较之亲本细胞已有降低的突变体细胞。可进行特异性或随机诱变,例如通过使用合适的物理或化学诱变剂,通过使用合适的寡核苷酸,或者通过对DNA序列进行PCR产生的诱变来进行。此外,诱变可通过使用这些诱变剂的任何组合来进行。
适合本发明目的的物理或化学诱变剂的例子包括紫外(UV)照射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、0-甲基羟胺、亚硝酸、甲基磺酸乙酯(EMS)、亚硫酸氢钠、蚁酸和核苷酸类似物。
使用此类试剂时,典型地,通过下述方法来进行诱变:在存在选用的诱变剂的情况下,在合适条件下培养待诱变亲本细胞,以及选出展示出基因的降低表达的突变体细胞。
或者,可通过使用与基因核酸序列互补的核苷酸序列进行已建立起来的反义技术,来进行对基因的修饰或失活。更具体地,可通过引入与核酸序列互补的核苷酸序列(其可在细胞中转录,并且能与细胞中产生的mRNA杂交)来降低或去除有丝真菌细胞对基因的表达。在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译出的蛋白质的量由此减少或消失。表达反义RNA的例子展示于Appl Environ Microbiol.2000Feb;66(2):775-82.(Characterization of a foldase,protein disulfide isomerase A,in the protein secretory pathway of Aspergillus niger.Ngiam C,Jeenes DJ,PuntPJ,Van Den Hondel CA,Archer DB)或(Zrenner R,Willmitzer L,Sonnewald U.Analysis of the expression of potato uridinediphosphate-glucosepyrophosphorylase and its inhibition by antisense RNA.Planta.(1993);190(2):247-52.)中。
此外,可通过RNA干扰(RNAi)技术(FEMS Microb.Lett.237(2004):317-324)来获得对基因的修饰、负调或失活。在该方法中,核苷酸序列(其表达待受到影响的)的同样的正义或反义部分被依次克隆,中间是核苷酸间隔,并且插入到表达载体中。此种分子转录后,小的921-230核苷酸片段的形成将导致待受影响的mRNA的定位降解。对特定mRNA的去除可进行至多种不同的程度。WO2005/05672A1和/或WO2005/026356A1描述的RNA干扰技术可用于对基因的负调、修饰或失活。
在另一种优选的实施方式中,有丝真菌突变体细胞携带有下述核酸序列,所述核酸序列已用上文所述的方法修饰或失活,并且,使用与上文所定义的相同的试验进行测量时,在同样的条件下培养时,较之有丝真菌亲本细胞,能产生更少的蛋白酶或蛋白酶组合。使用与上文所定义的相同的试验,在同样的条件下培养时,较之有丝真菌亲本细胞,突变体细胞优选产生少至少大约25%的蛋白酶或蛋白酶组合,更优选地,少至少大约50%,进一步更优选地,少至少大约75%,进一步更优选地,少至少大约95%。根据一种优选的实施方式,使用上文所定义的相同的试验,在同样的条件下培养时,有丝真菌Aspergillus niger或Aspergillus oryzae或Aspergillus fumigatus或Penicillium chrysogenum突变体细胞较之前文提到的相应已保藏有丝真菌细胞而言,产生更少的蛋白酶或蛋白酶组合。
在一种进一步更优选的实施方式中,使用与上文所定义的相同的试验,在同样的条件下培养时,较之亲本细胞,有丝真菌突变体产生基本无法探测到的量的蛋白酶或蛋白酶组合。
在一种最优选的实施方式中,使用前文定义及引用的下述试验进行测量,在与上文所述同样的条件下培养时,较之亲本细胞,有丝真菌突变体产生更少的、或基本无法探测到的量的蛋白酶或蛋白酶组合,所述试验是用于测定酸性内切蛋白酶活性的,其中使用牛血清清蛋白(BSA)作为底物。
在另一种优选的实施方式中,有丝真菌突变体细胞具有下述核酸序列的至少一个拷贝,所述核酸序列编码感兴趣的多肽(见生产多肽的章节)。
适合用于蛋白酶生产的宿主细胞
根据另一种优选的实施方式,本发明涉及一种宿主细胞,其高度适合用于生产多肽,其中,所述宿主细胞是亲本细胞的突变体,其中,所述突变体(a)用与前述章节所定义的相同的试验,在同样的条件下培养时,较之亲本细胞,生产更多的本发明的转录活化因子;以及(b)包含编码多肽的DNA序列,该序列的转录由所述转录活化因子激活。
根据另一种优选的实施方式,用与前述章节所定义的给定试验之一进行测量的情况下,在同样的条件下培养时,较之被保藏的细胞CBS513.88,突变体细胞A.niger能生产更多的转录活化因子和/或更多的蛋白酶。用于测量宿主细胞中蛋白酶活性的一种优选方法在本文实施例章节中关于使用牛血清清蛋白(BSA)作为底物测定酸性内切蛋白酶活性的部分有所描述。根据另一种优选的实施方式,用与前述章节所定义的给定试验之一进行测量的情况下,在同样的条件下培养时,较之前文提到的被保藏的A.oryzae,突变体细胞Aspergillus oryzae能生产更多的转录活化因子和/或更多的蛋白酶。根据另一种优选的实施方式,用与前述章节所定义的给定试验之一进行测量的情况下,在同样的条件下培养时,较之CBS455.95,突变体细胞Penicillium chrysogenum能生产更多的转录活化因子和/或更多的蛋白酶。根据另一种优选的实施方式,用与前述章节所定义的给定试验之一进行测量的情况下,在同样的条件下培养时,较之前文提到的被保藏的A.fumigatus,突变体细胞Aspergillus fumigatus能生产更多的转录活化因子和/或更多的蛋白酶。
在一种优选的实施方式中,在同样的条件下培养时,有丝真菌宿主细胞较之亲本细胞和/或前文提到的任何被保藏的亲本细胞生产更多的转录活化因子,这是通过向亲本细胞引入下述物质的一个或多个拷贝来实现的(i)核酸序列,其编码经分离的或具有对蛋白酶启动子的增强的转录活性的蛋白酶启动子转录活化因子,(ii)核酸构建体,包含编码蛋白酶启动子转录活化因子的核酸序列,(iii)前文“表达载体”章节所定义的表达载体。
在一种更优选的实施方式中,编码转录活化因子的核酸序列与下述启动子或其功能性部分可操作地相连,所述启动子比有丝真菌亲本细胞的相应的启动子更强。在一种进一步更优选的实施方式中,启动子或其功能性部分介导编码细胞外蛋白酶(例如,A.oryzae碱性蛋白酶、A.oryzae中性金属蛋白酶、A.niger曲霉蛋白酶(aspergillopepsin protease)、Fusariumoxysporum胰蛋白酶类似蛋白酶或F.venenatum胰蛋白酶)的基因的表达。
本发明还涉及可用于生产多肽的有丝真菌宿主细胞,其中,所述有丝真菌宿主细胞是亲本有丝真菌宿主细胞的突变体,其中,所述突变体包含
a)对本发明转录活化因子或其调控序列的修饰或失活,以及
b)(i)与编码本发明转录活化因子的核酸序列可操作地相连的可诱导启动子,以及(ii)转录活化因子可结合到其上的启动子序列,其与编码所述多肽的核酸序列可操作地相连,其中,(i)和(ii)可被同时或顺序引入。
上文(a)中的转录活性因子的失活形式可按照前文章节所述来获得。
上文(b)中的可诱导启动字序列可以是任何启动子序列或其功能性部分,其中所述启动子的转录启始活性可根据发酵条件被诱导。优选地,诱导通过碳或氮分解代谢产物介导。在一种优选的实施方式中,启动子是A.nidulans或A.oryzae的amdS启动子、A.nidulans或A.niger的niaD启动子、A.oryzae或A.niger、Aspergillus的种的niiA启动子、Aspergillus sp.的碱性磷酸酶启动子、Aspergillus sp.的酸性磷酸酶启动子或A.niger的alcA启动子、A.tubingensis木聚糖酶(xlnA)启动子。
在另一种优选的实施方式中,有丝真菌宿主细胞还包含下述启动字序列,其中,所述启动子序列可被转录活化因子激活,并且与编码多肽的核酸序列可操作地相连。
被本发明的转录活化因子激活的启动子序列可以是任何启动子序列或其功能性部分。优选地,启动子来自蛋白酶基因。更优选地,启动子选自下述的组,所述组包括但不限于从编码A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性alpha-淀粉酶、A.niger酸稳定alpha-淀粉酶、A.niger或A.awamori葡糖淀粉酶(glaA)、R.miehei脂酶、A.oryzae碱性蛋白酶、A.oryzae丙糖磷酸异构酶、A.nidulans乙酰胺酶的基因获得的启动子、NA2-tpi启动子(来自编码A.niger中性alpha-淀粉酶和A.oryzae丙糖磷酸异构酶的基因的启动子杂交体)以及它们的突变体、截短的和杂交体启动子。用于有丝真菌细胞的特别优选的启动子是来自蛋白酶基因的启动子或其功能性部分;例如,是来自F.oxysporum胰蛋白酶类似蛋白酶基因(U.S.4,288,627)、A.oryzae碱性蛋白酶基因(a/p)、A.niger pacA基因、A.oryzae碱性蛋白酶基因、A.oryzae中性金属蛋白酶基因、A.niger曲霉蛋白酶pepA基因、或F.venenatum胰蛋白酶基因、A.niger天冬氨酸蛋白酶pepB基因的。
在另一种优选的实施方式中,有丝真菌宿主细胞具有编码多肽的核酸序列的至少一个拷贝。
可按照前文“宿主细胞”章节所述的任何方法,将本文所述的核酸构建体引入亲本真菌细胞,以获得可用于生产多肽的宿主细胞。
应当理解,本发明的方法不被限制为特定的顺序,以获得有丝真菌细胞。对第二条核酸序列的修饰可在构建用于生产多肽的细胞中的任何步骤引入亲本细胞中。
生产多肽
本发明的另一个方面涉及在本发明的有丝真菌宿主细胞中生产多肽的方法,所述方法包括:
(a)在适合生产所述多肽的营养培养基中,对具有编码多肽的基因的有丝真菌宿主细胞加以培养;以及可选地,
(b)从有丝真菌宿主细胞的营养培养基回收所述多肽。
根据第一种优选的实施方式,生产的多肽是本发明的转录活化因子。
根据第二种优选的实施方式,生产的多肽是对蛋白酶降解敏感的多肽。在这种情况下,将使用宿主细胞的第一种形式(如“适合用于生产对蛋白酶降解敏感的多肽的宿主细胞”中所述的)。
根据第三种优选的实施方式,将被生产的多肽是其表达会被本发明转录活化因子激活的多肽。在这种情况下,将使用宿主细胞的第二种形式(如“适合用于蛋白酶生产的宿主细胞”中所述的)。
使用本领域已知的方法,在适合用于生产感兴趣多肽的营养培养基中对本发明的有丝真菌宿主细胞加以培养。例如,可通过在合适的培养基中、允许多肽被表达和/或分离的条件下进行摇瓶培养、实验室或工业发酵罐中的小规模或大规模的发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。培养发生于包含碳源和氮源以及无机盐的合适营养培养基中,使用本领域已知的方法来进行(见,例如Bennett,J.W.and LaSure,L.,eds.,More Gene Manipulations in Fungi,Academic Press,CA,1991)。合适的培养基可从商业供货商处获得,或者使用公开的组合物(例如,American Type Culture Collection目录中的)来制备。如果多肽分泌进营养培养基,可直接从培养基回收多肽。如果多肽不分泌,从细胞裂解物回收多肽。
可通过本领域已知的方法来分离得到的多肽。例如,可通过传统方法,包括但不限于,离心、过滤、萃取、喷雾干燥、蒸发或沉淀,从营养培养基分离多肽。然后可通过本领域已知的大量方法对经分离的多肽加以进一步纯化,所述方法包括但不限于,色谱(例如,离子交换、亲和、疏水、层析聚焦和尺寸排除)、电泳方法(例如制备等电聚焦、差异溶解度(例如硫酸铵沉淀)或萃取(见,例如Protein Purification,J.-C.Jansonand Lars Ryden,editors,VCH Publishers,New York,1989)。
可使用特异于多肽的本领域已知方法来探测多肽。这些探测方法可包括,使用特异性抗体、形成酶产物、酶底物的消失或SDS PAGE。例如,酶试验可被用于测定多肽的活性。对很多酶来说,用于测定酶活性的方法是本领域已知的。
在本发明的方法中,使用给定的试验之一的情况下,在同样的条件下进行培养时,较之相应的亲本细胞,有丝真菌宿主细胞生产的多肽多至少大约20%,优选多至少大约50%,更优选多至少大约100%,进一步更优选多至少大约200%,最优选多至少大约300%。更优选地,所述亲本细胞是前文提到的被保藏的菌株。
多肽可以是对有丝真菌细胞来说天然或异源的任何多肽。术语“异源多肽”在本文中被定义为野生型有丝真菌细胞不生产的多肽。术语“多肽”在本文中不用来指特定长度的被编码产品,因此其包括肽、寡肽和蛋白。多肽还可以是重组多肽,这是对于细胞来说天然的多肽,其通过下述核酸序列编码,所述核酸序列包含对于该核酸序列来说外源的、在对多肽的生产中涉及的一种或多种控制序列。多肽可以是野生型多肽或其变体。多肽还可以是杂交体多肽,其含有从至少两种不同多肽获得的部分或完整多肽序列的组合,其中,多肽中的一种或多种可能与细胞是异源的。多肽还包括上述多肽的天然存在的等位基因和经工程改造变异。
在一种优选的实施方式中,多肽是抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调控蛋白、结构蛋白、报道蛋白或转运蛋白、细胞内蛋白、分泌过程涉及的蛋白、折叠过程涉及的蛋白、伴侣分子、肽氨基酸转运蛋白、糖基化因子、转录因子。在一种优选的实施方式中,多肽是细胞外分泌的。
在一种更优选的实施方式中,酶是氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、葡聚糖酶和酯酶。
在一种更优选的实施方式中,酶是碳水化合物酶,例如,纤维素酶,如内葡聚糖酶,β-葡聚糖酶,纤维二糖水解酶或β-葡糖苷酶,半纤维素酶或胶质水解(pectinolytic)酶,如木聚糖酶,木糖苷酶,甘露聚糖酶,半乳糖酶,半乳糖苷酶,胶质甲酯酶,胶质裂解酶,果胶酸盐/酯裂解酶,内聚半乳糖醛酸酶,外聚半乳糖醛酸酶,鼠李半乳糖醛酸酶,阿拉伯聚糖酶,阿拉伯呋喃糖苷酶,阿拉伯木聚糖水解酶,半乳糖醛酸酶,裂解酶或淀粉水解酶;水解酶,异构酶或连接酶,磷酸酶(例如,植酸酶),酯酶(例如脂肪酶),蛋白水解酶,氧化还原酶(例如氧化酶),转移酶或异构酶。更优选地,目标基因编码植酸酶。在进一步更优选的实施方式中,多肽是氨肽酶、淀粉酶、碳水化合物酶、羧肽酶、内切蛋白酶、金属蛋白酶、丝氨酸蛋白酶、过氧化氢酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、alpha-半乳糖苷酶、beta-半乳糖苷酶、葡糖淀粉酶、alpha-葡糖苷酶、beta-葡糖苷酶、卤素过氧化物酶、蛋白水解酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变构酶(mutanase)、氧化镁、胶质水解酶、过氧化物酶、磷脂酶、多酚氧化酶、核糖核酸酶、转谷氨酰胺酶或葡萄糖氧化酶、己糖氧化酶、单加氧酶。
在另一种更为优选的实施方式中,多肽是人胰岛素或其类似物、人生长因子、促红细胞生成素、组织血纤维蛋白溶酶原活化因子(tPA)或促胰岛素生成素(insulinotropin)。
编码异源多肽的核酸序列可从任何原核、真核或其它来源获得。
或者,多肽可以是细胞内蛋白或酶,例如伴侣分子、蛋白酶或转录因子。这方面的一个例子在Appl Microbiol Biotechnol.1998 Oct;50(4):447-54(″Analysis of the role of the gene bipA,encoding the major endoplasmicreticulum chaperone protein in the secretion of homologous and heterologousproteins in black Aspergilli.Punt PJ,van Gemeren IA,Drint-Kuijvenhoven J,Hessing JG,van Muijlwijk-Harteveld GM,Beijersbergen A,Verrips CT,vanden Hondel CA)中有所描述。这可用于,例如提高宿主细胞作为蛋白生产者的效率,如果该多肽,例如伴侣分子、蛋白酶或转录因子已知是蛋白生产中限制性因素的话。
就本发明的目的而言,术语“从……获得”在本文中与给定的来源一起使用时将表示,多肽是通过该来源或通过已插入了来自该来源的基因的细胞生产的。
在本发明的方法中,有丝真菌细胞还可用于对对细胞来说是天然的多肽的重组生产。可通过例如将编码多肽的基因放置于不同启动子的控制下,以增强多肽的表达、通过使用信号序列加速目标天然多肽向细胞外的运输以及增加编码细胞正常生产的多肽的基因的拷贝数,来重组生产天然多肽。在术语“异源多肽”的范围内,本发明还包括,对对细胞来说天然的多肽的上述重组生产,此类表达涉及使用对细胞并非天然的遗传元件,或者使用天然元件,但这些元件已被操作,以按照并非正常存在于有丝真菌细胞中的方式发挥功能。用于分离或克隆编码异源多肽的核酸序列的技术是本领域已知的,其包括从基因组DNA的分离,从cDNA的制备及其组合。
在本发明的方法中,异源多肽还可包括融合的或杂交体多肽,其中,另一个多肽在多肽或其片段的N末端或C末端融合。融合的多肽是通过将编码一种多肽的核酸序列(或其一部分)与编码另一种多肽的核酸序列(或其一部分)融合产生的。
用于生产融合多肽的技术是本领域已知的,其包括,将编码多肽的编码序列连接起来,使得它们在符合读码框原则,并且使得融合的多肽的表达处于同样的启动子和终止子的控制之下。杂交体多肽可包含从至少两种不同多肽获得的部分或全部多肽序列的组合,其中,所述多肽中的一条或多条对突变体真菌细胞来说可能是异源的。可通过多种方法,对编码感兴趣的异源多肽的经分离的核酸序列进行操作,以提供所述多肽的表达。表达应当被理解为包括生产多肽过程所涉及的任何步骤,其包括但不限于,转录、转录后修饰、翻译、翻译后修饰和分泌。在其插入到载体之前,对编码多肽的核酸序列的操作可能是想要的或必需的,这取决于表达载体。用于利用克隆方法修饰核酸序列的技术是本领域公知的。
本发明还将由下述实施例加以描述,所述实施例不应被理解为限制本发明的范围。
实施例
实验信息
菌株
WT1:该A.niger菌株被用作为野生型菌株。该菌株被保藏于CBSInstitute,保藏号为CBS 513.88。
WT2:该A.niger菌株是包含编码葡糖淀粉酶的基因(glaA)缺失的WT1菌株。WT2是通过使用EP0635574B1所述的“MARKER-GENEFREE”方法构建的。在该专利中描述了如何在CBS 513.88基因组中缺失glaA特定DNA序列的方法。该方案产生了不含标记基因的ΔglaA重组A.niger CBS513.88菌株,该菌株不具有任何外源DNA序列。
WT3:该Penicillium chrysogenum菌株被用作为野生型菌株。该菌株被保藏于CBS Institute,保藏号为CBS 455.95。
质粒
pGBFINPRT-1:该prtT表达构建体(如图3所示)被保藏于CBSInstitute,保藏号为CBS118680。
pGBPRT-1:该prtT cDNA载体(如图19所示)被保藏于CBSInstitute,保藏号为CBS118681。
A.niger摇瓶发酵
按照WO 99/32617中实施例“Aspergillus niger摇瓶发酵”小节所述,在20ml预培养基中对A.niger菌株进行预培养。按照WO 99/32617所述,过夜培养后,将10ml该培养物转移到含有7%葡萄糖的发酵培养基1(FM1)中。该FM1每升含有:25g酪蛋白水解产物、12.5g酵母提取物、1g KH2PO4、2g K2SO4、0.5g MgSO4·7H2O、0.03g ZnCl2、0.02gCaCl2、0.01g MnSO4·4H2O、0.3g FeSO4·7H2O、10ml Pen-Strep(5000IU/ml Pen-5mg/ml Strep),用4N H2SO4调节至pH5.6。发酵在含100ml发酵培养液的500ml带挡板的烧瓶中,于34℃和170rpm,进行指定的天数。
为诱导蛋白酶,在FM1中培养16-24小时后收获菌丝体,在室温用诱导培养基(IM)洗,并将其转移至含有上文指出的碳源的IM。
诱导培养基(IM)每升含有:
6g NaNO3、0.5g KCl、1.5g KH2PO4、1.13ml 4M KOH、0.5gMgSO4·7H2O、0.01%(w/v)酪蛋白氨酸、0.1%(w/v)酵母提取物、1ml微量元素贮液(每升贮液中的微量元素:22g ZnSO4·7H2O、11gH3BO3、5g FeSO4·7H2O、1.7g CoCl2·6H2O、1.6g CuSO4·5H2O、5gMnCl2·4H2O、1.5g Na2MoO4·2H2O、50g EDTA(用4M KOH调节pH至6.5),过滤灭菌,并避光储存于4℃)、10ml维生素贮液(每升贮液中的维生素:200mg核黄素、200mg硫胺·HCl、200mg烟碱、100mg吡哆醇·HCl、20mg泛酸、0.4mg生物素,用4M NaOH调节至pH6,过滤灭菌,并避光储存于4℃),并调节至pH5.6。发酵培养基2(FM2)用于PLA2发酵,其每升含有:82.5g葡萄糖·1H2O、25gMaldex 15(Boom Meppel,Netherlands)、2g柠檬酸、4.5gNaH2PO4·1H2O、9g KH2PO4、15g(NH4)2SO4、0.02g ZnCl2、0.1gMnSO4·1H2O、0.015g CuSO4·5H2O、0.015g CoCl2·6H2O、1gMgSO4·7H2O、0.1g CaCl2·2H2O、0.3g FeSO4·7H2O、30g MES(2-[N-吗啉代]乙磺酸),pH=6。
寡核苷酸序列
用于实验的所有引物被描述于序列表中SEQ ID号5-12和23-24。
蛋白酶活性试验
培养物上清液中总的内切蛋白酶活性作为降解的BSA的含量被测定。450μl 0.1M NaAc pH 4.0中的1%(w/v)BSA与50μl培养物上清液一起在37摄氏度孵育不同的时间间隔。在孵育期的终点,用500μl 10%(w/v)三氯乙酸(TCA)沉淀剩余BSA,接着再在冰上孵育10分钟。沉淀在Eppendorf离心管中于13000rpm离心10分钟。在280nm测量上清液的吸光度。一个单位的蛋白酶活性被定义为,280nm处的每小时吸光度单位的改变(Anson试验)。关于此方法的更为详细的描述和文献还由van den Hombergh et al.,Current Genetics 28:299-308(1995)描述过。
使用与发色基团(对硝基苯胺(pNA)或3-(2-呋喃)丙烯酰(FA))结合的特定肽来测定培养物上清液中外切蛋白酶的活性。外切蛋白酶活性从肽上释放pNA或FA,其导致吸光度的变化。将450μl 0.2mM底物水溶液与50μl培养物上清液在室温下一起孵育。在405nm处测量pNA-底物(pH6-7);在332nm处测量FA-底物(~pH5)。pNA-底物的吸光度随着pNA-基团的释放增加;FA-底物的吸光度随着FA-基团的释放降低。以单位计的蛋白酶活性被计算为每小时吸光度的变化。
通常用到的不同的蛋白酶活性和试验用蛋白水解酶活性见WO02/068623所述。
蛋白酶平板试验
为针对增强的或降低的蛋白酶表达加以筛选,按照Mattem et al.(Mol.Gen.Genet.1992,234:332-336)所述,使用含有经透析脱脂奶的最小程度培养基平板。在30℃培养4天后,A.niger WT1和WT在该培养基上产生清晰的环。
PLA2磷脂酶活性
为通过分光光度方法测定Aspergillus niger培养物中的磷脂酶PLA2活性(PLA2),使用人工底物:1,2-二硫代二辛酰磷脂酰胆碱(diC8,底物)。PLA2水解A2位置的硫键,分离出硫代辛酸。硫代辛酸与4,4-二硫代吡啶(着色剂,4-DTDP)发生反应,形成4-硫代吡啶酮。4-硫代吡啶酮与4-巯基吡啶处于互变异构平衡,后者吸收具有334nm波长的辐射。测量该波长处的消光变化。一个单位是:于37℃,pH4.0时,每分钟从1,2-二硫代二辛酰磷脂酰胆碱释放出1nmol硫代辛酸的酶的量。
通过将1g diC8晶体溶解于每66ml乙醇加164ml乙酸盐缓冲液来制备底物溶液。乙酸盐缓冲液包含:pH3.85的、含有0.2%Triton-X100的0.1M乙酸盐缓冲液。着色剂是11mM的4,4-二硫代吡啶溶液。其是通过下述方法制备的:在2ml eppendorf样品杯中称量出5.0mg 4,4-二硫代吡啶,将其溶于1.00ml乙醇。加入1.00ml milli-Q水。
实施例1  构建A.niger cDNA表达文库以及分离prtT cDNA克隆
本实施例描述了在表达载体中对表达文库的构建。从在针对蛋白酶活性的诱导条件下生长的从菌丝体分离出mRNA的库。构建之后,表达文库被用于分离prtT cDNA克隆。
1.1构建针对蛋白酶活性被诱导的cDNA文库
在下述实施例中,通过测量培养液中大量的蛋白水解活性来测定对A.niger中蛋白水解体系的诱导。
按照本文所述,将A.niger菌株WT1用于在100ml培养基中进行摇瓶实验,这在34℃,170rpm下,使用500ml带挡板摇瓶于温育振荡器中进行的。将A.niger WT1预培养过夜,随后将菌丝体转移至发酵培养基1(FM1)。20小时的培养之后,将菌丝体转移至诱导培养基(IM),其中含有1%(w/v)胶原或2%(w/v)脱脂豆粉(见实验信息)。培养继续进行4天。收集样品,按照上文所述测定蛋白酶活性。在图1中给出了针对豆粉培养物的内切蛋白酶活性。对内切蛋白酶的清楚的诱导展示于豆粉上进行的培养上。针对胶原培养物也发现了类似的情况(数据未示出)。
此外,针对两种C源,针对不同的时间点,测量了外切蛋白酶活性。对于胶原和豆粉而言,在2天的培养后都发现了对外切蛋白酶的清楚的诱导(数据未示出)。
在转移到含有1%(w/v)胶原或2%(w/v)脱脂豆粉的IM之后18、28和48小时后收获的菌丝体被用于提取RNA。RNA提取和mRNA分离都按照WO99/32671的详细描述来进行。对cDNA表达文库的构建(包含a.o.cDNA合成、连接子的连接和对E.coli的转化)也在WO99/32671中描述了。用于cDNA反应的连接子由HindIII和XhoI限制性位点构成。将得到的cDNA库连接进HindIII-XhoI消化过的pGBFIN-23载体,其构建和用途描述于WO99/32671中。pGBFIN-23的物理图谱可在图2中找到。连接混合物被用于转化DH10B电感受态细胞(Invitrogen),这导致从经豆粉和胶原诱导的菌丝体获得的每份cDNA文库产生超过105个菌落。对两个文库中每个取96个克隆进行随机测序,显示没有插入的载体百分比低。被测序克隆的插入大小在0.5-4.7kb之间,平均为1.7kb。为获得高效筛选格式,将文库构建为103个克隆的库。对这些库的每一个而言,制备甘油贮液,贮藏起来以作后用。
1.2用表达文库转化A.niger WT2
对cDNA文库的20个库而言(10个来自豆粉诱导的文库,10个来自胶原诱导的文库),按照已知方法和常规质粒分离技术(Sambrook,J.etal.,1989)来分离质粒DNA。对于每一个库而言,取5μg总质粒DNA,在37℃用NotI(20U)消化4小时,以除去从E.coli获得的质粒序列。
就20个库中的每一个而言,使用不含E.coli的线性片段(其中含有A.niger cDNA克隆)来进行对A.niger WT2的转化。对每个库而言,在含有乙酰胺的选择性培养基上纯化1000个菌落,并将其转移至96孔微滴定板的各个孔中,所有这些都按照WO99/32671所述来进行。
1.3对A.niger表达文库的分析
使用前文所述的蛋白酶平板试验来检验所有的个体转化子。将各个转化子的分生孢子转移至含有经透析脱脂奶的最小程度培养基。在30℃培养2-3天后,29个菌落可观察到环的形成,这表明了增加的蛋白质降解。对于所有其它转化子而言,环在4-6天后开始出现。第5天时,针对上述29个菌落的环较之WT2尺寸也更大。
29个被鉴定为阳性的转化子产生自从文库的14个不同的库。为能分析独立的转化子,分离出来自14个阳性转化子(来自表达文库的不同的库)的分生孢子,将其用于接种PDA平板。
按照EP 635 574 B1中更为详细的描述,对菌株WT2和14个选出的转化子进行摇瓶实验。简言之,使用500ml带挡板摇瓶,在温育振荡器中,于34℃和170rpm下,在100ml培养基中对菌丝体加以培养。在发酵2和4天后,取样以按照实验信息章节所述来测定蛋白酶活性。对所有选出的转化子而言,在检查的两个时间点,总的酸性细胞外蛋白酶活性较之WT2都有所提高(数据未示出)。
1.4分离含有蛋白酶转录活化因子PrtT的cDNA表达克隆
简言之,用于构建表达文库的基于pGBFIN-23的表达载体(图2)在E.coli载体中包含葡糖淀粉酶启动子、与启动子可操作相连的可变cDNA编码序列和葡糖淀粉酶终止子区域(侧翼有3’和3”glaA定位位点)和amdS选择标记。因此,可使用PCR和两条葡糖淀粉酶特异性引物,来鉴定携带有内源葡糖淀粉酶区域缺失的、WT2转化子中特定但未知的cDNA序列。一条引物基于标准葡糖淀粉酶启动子,另一条基于葡糖淀粉酶终止子区域。使用100ng基因组DNA,对14个选出的A.niger转化子进行PCR,其中使用示为SEQ ID NO:23和SEQ ID NO:24葡糖淀粉酶特异性寡核苷酸。对于转化子中的11个,使用PCR可扩增出条带。这些条带被克隆进pCR2.1-TOPO(Invitrogen),并被测序。cDNA克隆中的六个含有相同的cDNA序列。该cDNA序列的ORF展示于序列表中SEQ IDNO:2。SEQ ID NO:2编码的多肽序列已被编号为SEQ ID NO:3。使用六个阳性库的10ng质粒DNA和示为SEQ ID NO:5和SEQ ID NO:6的cDNA特异性寡核苷酸,被检验的所有库都被发现是阳性的,使用PCR时其展示大约500bp的条带的存在。
随后,针对大量阳性库的甘油贮液被用于涂布菌落。通过菌落杂交和500bp的探针来筛选这些菌落,按照Sambrook et al.,1989(见上文)所述的标准技术,分离出含有名为prtT的杂交插入的克隆。在图3中,展示了针对代表性经分离克隆(名为pGBFINPRT-1)的物理图谱。对通过对pGBFINPRT质粒进行测序获得的若干prtT克隆的序列进行比对(数据未示出)。比对显示,所有被测序的质粒都含有编码相同蛋白PrtT(示为SEQ ID NO:3)的cDNA插入(示为SEQ ID NO:2)。
实施例2  鉴定prtT基因
对A.niger WT1和P.chrysogenum WT3菌株的基因组DNA进行测序和分析。在针对这些基因组的检索中使用SEQ ID NO:2,确定出A.nigerprtT和P.chrysogenum prtT基因的基因组序列。A.nigerprtT基因组序列编号为SEQ ID NO:1,P.chrysogenum prtT基因组序列编号为SEQ IDNO:19。A.niger prtT基因座的基因组序列包含ORF和大约3000bp的5’非翻译区(UTR)和1700bp的3’UTR,P.chrysogenum基因组序列含有ORF和574bp的5’UTR和238bp的3’UTR。编码P.chrysogenum PrtT蛋白的核苷酸序列示为序列表中的SEQ ID NO:20。SEQ ID NO:20的翻译序列编号为SEQ ID NO:21,其代表P.chrysogenum WT3的转录活化因子PrtT的氨基酸序列。
实施例3  对新颖的cDNA序列和被编码蛋白的比对
实施例3.1  对多肽序列和SEQ ID NO:3的PrtT多肽进行的比对
用SEQ ID NO:2对核苷酸序列专利数据库进行检索。鉴定出了使用PrtT的两份公开文献(WO 00/20596和WO 01/68864)。为检测PrtT蛋白之间的序列同一性程度,将上文提到的公开文献中描述的A.niger和A.oryzae的PrtT多肽序列与本发明的PrtT序列SEQ ID NO:3加以比对(见图4和图5)。令人吃惊地,从比对清楚地显示,A.niger WT1的prtT的SEQ ID NO:3与之前公开的两条多肽序列都不一样。图4中的比对鉴定出了A.niger WT1 PrtT序列与WO 00/20596和WO 01/68864公开的A.niger多肽序列之间的45个氨基酸不同。这些不同是N末端部分的一处氨基酸取代以及鉴定出的ORF中的不同导致的,即,A.niger WT1 prtT序列在编码序列的3’包含额外的内含子,并且A.niger WT1 prtT序列没有WO00/20596和WO 01/68864的A.niger prtT序列中鉴定出的最后一个外显子。在A.niger WT1和WO 01/68864公开的A.oryzae PrtT序列之间发现了更多实质性不同(见图5)。用CDA方法(Huang,1994)和文本中描述的设定进行鉴定时,图4中的多肽序列具有93%的匹配百分比,即同一性,而图5中的序列具有49%的匹配百分比,即同一性。更多细节见图5。
实施例3.2  对A.niger PrtT多肽进行的计算机分析
为获得对A.niger WT1的PrtT转录活化因子的功能结构域的预测,使用多种网络结构域数据库对SEQ ID NO:3加以分析:预测出了两个区域:
(i)使用Pfam(Sonnhamer EL et al,(1997),Pfam:a comprehensivedatabase of protein families based on seed alignments.Proteins.28:405-420),发现了与Zn(II)2-Cys6双核簇DNA结合基元(motif)具有相似性的基元,并且
(ii)使用Prosite(Bairoch A,et al,(1996),The PROSITE database,itsstatus in 1995.Nucleic Acids Res.,24:189-196),发现了亮氨酸拉链基元(见图4)。
后一基元已知是作用于二聚过程的功能结构域,其在多种转录活化因子家族中被发现(Bauer-Bornberg,E.,Rivals,E.,and Vingron,M.(1998)Nucl.Acid Res.26(11):2740-2746)。A.niger WT1的PrtT转录活化因子的预测的Zn(II)2-Cys6双核簇DNA结合结构域被编号为SEQ ID NO:4。
实施例4  通过用pGBFINPRT-1构建体进行转化,在A.niger中过量表达 prtT基因
在下述实施例中,通过转化将表达构建体引入真核宿主细胞。
为将pGBFINPRT-1载体(图3)引入A.niger WT2,按照WO98/46772和WO99/32617所述进行转化和随后对转化子的选择。原理上,分离出载体pGBFINPRT-1的线性DNA,用其转化A.niger。按照标准方法,在乙酰胺培养基上选择转化子,对菌落加以纯化。针对在glaA基因座处的整合以及拷贝数对生长中的菌落加以判断。这方面的一个例子展示于图6中。选出具有相似的估计拷贝数的pGBFINPRT-1转化子,将它们命名为PRTT。
此外,本发明的基因和选择标记基因可在两个构建体上。带有本发明基因的载体可与含有amdS选择标记基因的载体(被命名为pGBAAS-1,按照EP 635574B1所述构建)共转化。两个载体都包含与A.niger宿主菌株glaA基因座同源的两个DNA结构域,以指导向WT2中截短的glaA基因座的定位。在共转化的情况下,将转化子的孢子涂布于氟乙酰胺培养基上,以选择丢失了amdS标记的菌株。
实施例5  prtT转化子中较之WT菌株的增强的蛋白表达
在下述实施例中,测定代表性cDNA prtT克隆(pGBFINPRT-1)的过量表达对蛋白酶谱(spectrum)的活性的影响,所述克隆包含SEQ IDNO:2示出的序列。
在培养液上测定选出的大量PRTT转化子(实施例4中产生的)的蛋白酶活性,将其与WT菌株相比较。
在第一个步骤中,通过对A.niger WT2的大量PRTT转化子进行Northern印迹杂交分析来验证prtT过量表达,将prtT mRNA水平与A.niger WT1和WT2相比较。从按照上文所述和EP 635 574 B1中更为详细的描述,使用500ml带挡板摇瓶,在温育振荡器中于34℃和170rpm下,100ml培养基中培养的菌丝体获得RNA样品。发酵2和4天后,收集菌丝体,将其用于分离RNA(方案见实施例1)以及按照Northern印迹杂交分析的标准方案进行Northern印迹杂交分析(Sambrook et al.,1989)。在可视化Northern印迹杂交之后,对大量的PRTT转化子都看到了增加的prtT表达(数据未示出)。
具有增加的prtT表达的WT2 PRTT转化子和WT1和WT2菌株被用于按照上文所述来进行摇瓶实验。发酵2、3、4和5天后,取样,按照实验信息所述来测定蛋白酶活性。结果示于图7中。在检测的几乎所有时间点,选出的WT2 PRTT转化子的总酸性细胞外蛋白酶活性都较WT1和WT2增加。此外,在SDS-PAGE凝胶上对通过将BSA和培养物上清液一起孵育获得的样品进行了分析(数据未示出)。这些数据清楚显示,在PRTT转化子样品中BSA的降解增加,导致形成低分子量的肽。
数据证明,pGBFINPRT-1的cDNA prtT克隆编码了功能性的蛋白酶转录活化因子。因此,SEQ ID NO:2中提供的核苷酸序列编码功能性转录活化因子蛋白PrtT。
实施例6  在Aspergillus niger中对prtT基因的失活
按照已知的原理,设计出用于prtT基因(编码本发明的蛋白酶调控因子)的基因置换载体,根据常规克隆方法来构建它(Sambrook et al.(1989))。简言之,这些载体包含大约1000-3000bp的prtT ORF侧翼区域,用于在预定的基因组基因座进行同源重组。此外,其含有双向amdS选择标记、在中间的正向重复。对这些缺失载体的常规设计以前被描述于EP635574B和WO 98/46772中。
按照上文所述,对A.niger WT1的基因组DNA加以测序和分析。使用示为SEQ ID NO:11和示为SEQ ID NO:12的寡核苷酸,用A.nigerWT2的基因组DNA作为模板,用PCR来扩增1.5kb的prtT下游侧翼区域,并且在末端引入KpnI和XmaI限制性位点,以允许在pGBDEL(图8)中克隆。用KpnI和XmaI对该1.5kb的prtT下游侧翼片段进行消化,将其引入用KpnI和XmaI消化过的载体pGBDEL中,产生pGBDEL-PRT1。
使用示为SEQ ID NO:17和示为SEQ ID NO:18的寡核苷酸,用A.niger WT2的基因组DNA作为模板,通过PCR扩增出3kb的prtT上游侧翼区域,其被称为片段A。此外,将BstBI限制性位点加入到片段A的5’末端,将prtT下游区域的重叠序列加入到片段A的3’末端。使用示为SEQ ID NO:9和示为SEQ ID NO:10的寡核苷酸,用A.niger WT2的基因组DNA作为模板,通过PCR扩增出500kb的prtT下游侧翼区域,其被称为片段B。使用示为SEQ ID NO:7和示为SEQ ID NO:10的寡核苷酸以及片段A和B进行PCR,通过序列重叠延伸(SOE-PCR,as described inGene.1989 Apr 15;77(1):51-9.Ho SN,Hunt HD,Horton RM,Pullen JK,Pease LR″Site-directed mutagenesis by overlap extension using the polymerasechain reaction″),将得到的两条片段,A和B融合起来;产生3.5kb的片段C。用BstBI和AscI消化该片段C,将其引入用BstBI和AscI消化过的载体pGBDEL-PRT1中,产生pGBDEL-PRT2(图9)。通过序列分析,验证了引入的PCR片段的序列包含prtT基因的上游和下游区域。
分离出用BstBI/XmaI消化过的缺失载体pGEDEL-PRT2的线性DNA,将其用于转化A.niger WT2。该线性DNA可在prtT基因座处整合进基因组,由此用含有amdS的构建体取代prtT编码序列(见图10)。按照标准方法,在乙酰胺培养基上选择转化子,对菌落加以纯化。针对在prtT基因座处的整合通过PCR对生长中的菌落加以判断。可通过具有特异于pGBDEL-PRT2插入的大小的条带的扩增以及特异于野生型prtT基因座的条带的丢失来检测prtT基因的缺失。将孢子涂布于氟乙酰胺培养基上以选择出丢失了amdS标记的菌株。使用Southern印迹杂交分析,针对prtT基因的正确缺失来检验候选菌株。菌株dPRTT作为具有被失活prtT基因的代表性菌株被选出(见图10)。
实施例7  对WT2和dPRTT A.niger菌株中蛋白酶的生产进行比较
选出的dPRTT菌株(WT2的正确pGBDEL-PRT2转化子,实施例6中分离的)和菌株A.niger WT2被用于进行摇瓶实验,该实验在100mlEP635 574 B1所述的培养基中,34℃和170rpm下在温育振荡器中使用500ml带挡板摇瓶进行。发酵1、3、6和8天后,取样以测定内切蛋白酶活性。在图11中,显示了WT2和dPRTT菌株的内切蛋白酶活性。在测量的所有时间点,选出的WT2 dPRTT转化子中的内切蛋白酶活性较A.nigerWT2的活性明显地降低。我们推断,对蛋白酶调控因子PrtT的失活是成功的,其导致了细胞外蛋白酶的表达的降低。
实施例8  在dPRTT A.niger菌株中对蛋白酶敏感性蛋白的增加的生产
在A.niger中过量表达(异源)蛋白时,蛋白水解降解是公知的问题。本实施例展示了如何通过破坏prtT操作A.niger的蛋白酶谱来获得感兴趣蛋白的增加的产量。
猪磷脂酶A2(PLA2)蛋白被选用为模式蛋白。之前已显示,该蛋白对蛋白酶降解敏感(Roberts I.N.,Jeenes D.J.,MacKenzie D.A.,WilkinsonA.P.,Sumner I.G.and Archer D.B.(1992).Heterologous gene expression inAspergillus niger:a glucoamylase-porcine pancreatic phospholipase A2 fusionprotein is secreted and processed to yield mature enzyme.Gene 122:155-161..)。按照Roberts et al.(1992)所述的原理,制备用于过量表达PLA2的片段,该片段被制为proPLA2与A.niger的天然葡糖淀粉酶A基因的融合体。使用与实施例2.1所述相同的技术,将该glaA-pla2融合基因克隆进pGBFIN23,得到pGBFIN-PLA2(图12)。为将pGBFIN-PLA2载体引入A.niger WT2和A.niger dPRTT菌株(实施例6中构建的),按照WO98/46772和WO99/32617所述进行转化和随后对转化子的选择。原理上,分离出载体pGBFIN-PLA2的线性DNA,用其转化A.niger。按照标准方法,在乙酰胺培养基上选择转化子,对菌落加以纯化。针对在glaA基因座处的整合以及拷贝数对生长中的菌落加以判断。这方面的一个例子展示于图6中。选出在glaA基因座处整合进pGBFIN-PLA2质粒的一个拷贝的若干A.niger WT2和A.niger dPRTT转化子,用其进行摇瓶实验,该实验在实验方法中所述的100ml发酵培养基2(FM2)中,于34℃和170rpm下在温育振荡器中使用500ml带挡板摇瓶进行。9天的培养之后收集培养物,按照上文所述测量PLA2活性。图13显示了在A.niger dPRTTpGBFIN-PLA2转化子和A.niger WT2 pGBFIN-PLA2转化子中测量的PLA2活性。在prtT基因缺失的菌株中,清楚看到PLA2活性的明显增加,而在具有完整prtT拷贝的菌株中,几乎没有测量到PLA2活性。
实施例9  通过在核苷酸序列数据库中进行TBlastn检索来分离出编码与A. niger PrtT具有相似性的蛋白的核苷酸序列
在本实施例中,我们展示了如何将A.niger PrtT蛋白序列(SEQ IDNO:3)用于鉴定其它生物中的功能性同源体。我们提供了两种检索的数据——(i)在例如GENESEQTM(Aapergillus oryzae的情况下)的核苷酸序列专利数据库中的检索,和(ii)在例如可通过National Centrum forBiotechnology Information(NCBI)(Aspergillus fumigatus的情况下)获得的核苷酸序列数据库中进行。
(i)SEQ ID NO:3的PrtT序列被用于针对核苷酸序列专利数据库进行TBlastn(对已翻译数据库进行蛋白查询)检索。鉴定出了624个氨基酸的蛋白序列,其与A.nigerPrtT序列SEQ ID NO:3具有71%的匹配百分比,即同一性(见图14)。将相应的cDNA序列编号为SEQ ID NO:14,其描述了编码A.oryzae PrtT蛋白酶转录活化因子的核苷酸序列。推断出的蛋白质序列描述于SEQ ID NO:15中,基因组序列示为SEQ IDNO:13。令人吃惊地,使用功能性A.niger WT1 PrtT蛋白鉴定出的SEQID NO:15不同于WO 01/68864的作者描述的A.oryzae蛋白,不同之处在于C末端部分以及蛋白的N末端部分的一个氨基酸取代(见图15)。我们之前已展示了SEQ ID NO:3的功能性(实施例5),因此,以SEQ IDNO:15展示的A.oryzae PrtT蛋白序列应代表A.niger PrtT在A.oryzae中的功能性同源体。
(ii)我们针对真核核苷酸序列数据库进行了与上述相似的检索。在A.fumigatus中鉴定出了与A.niger的PrtT具有高匹配百分比(即同一性)的多肽序列(621个氨基酸)(见图16)。A.fumigatus的PrtT序列与A.niger PrtT SEQ ID NO:3具有66%的匹配百分比(即同一性)。A.nigerPrtT同源体的A.fumigatus序列具有SEQ ID NO:18,编码该多肽的cDNA为SEQ ID NO:17,A.fumigatus的prtT基因组序列为SEQ IDNO:16。
使用CLUSTAL W来比对本发明的四条真菌PrtT基因组序列(参照前文所述)。在比对中,所有序列都显示出了高度的氨基酸同一性(见图17中氨基酸序列的保守方框)。本实施例进一步加强了下述事实:SEQ IDNO:15、SEQ ID NO:18和SEQ ID NO:21所述的经分离PrtT多肽确实编码蛋白酶转录调控因子A.niger PrtT的功能性同源体。A.oryzae、A.fumigatus和P.chrysogenum的PrtT多肽的锌双核簇Zn(II)2-Cys6 DNA结合结构域分别编号为SEQ ID NO:25、SEQ ID NO:26和SEQ ID NO:27。
图18描述了若干PrtT多肽序列在其C末端部分的不同:在具有SEQID NO:22的、从本发明的功能性A.niger PrtT多肽获得的12个氨基酸上进行了比对。进行对下述PrtT的比对:申请WO 00/20596和WO 01/68864的A.niger和A.oryzae PrtT序列以及本发明的PrtT多肽。我们发现,申请WO 01/68864的A.oryzae PrtT序列提前终止。如图17下划线所示,该PrtT多肽的该提前终止与亮氨酸拉链结构域邻近,因此其可能影响其功能性。申请WO 01/68864的A.oryzae PrtT序列完全丢失了亮氨酸拉链结构域。此外,WO 00/20596和WO 01/68864申请的A.niger PrtT序列在该区域包含17个额外的氨基酸,这是前文实施例3.1中提到的未被识别的内含子序列导致的。该插入可能影响蛋白结构域的拓扑学(例如,图4所示的之后的亮氨酸拉链)以及由此影响PrtT蛋白的功能性。
本文描述和要求保护的本发明不限于本文公开的具体实施方式的范围,因为这些实施方式仅用于阐述本发明的若干方面。任何等同的实施方式都在本发明的范围之内。事实上,除了本文所展示和描述的之外,本领域技术人员可从前述说明书明显获得对本发明的多种改变。此类改变也在所附权利要求的范围内。在有冲突的情况下,以本文的公开内容为准,包括定义。
序列表
<110>帝斯曼知识产权资产管理有限公司
<120>在生产多肽的方法中有用的真菌转录活化因子
<130>24295WO
<160>27
<170>PatentIn version 3.1
<210>1
<211>6837
<212>DNA
<213>Aspergillus niger
<220>
<221>外显子
<222>(2998)..(3224)
<223>
<220>
<221>内含子
<222>(3225)..(3336)
<223>
<220>
<221>外显子
<222>(3337)..(3738)
<223>
<220>
<221>内含子
<222>(3739)..(3796)
<223>
<220>
<221>外显子
<222>(3797)..(4222)
<223>
<220>
<221>内含子
<222>(4223)..(4272)
<223>
<220>
<221>外显子
<222>(4273)..(4502)
<223>
<220>
<221>内含子
<222>(4503)..(4553)
<223>
<220>
<221>外显子
<222>(4554)..(5140)
<223>
<400>1
tggctaggtg tcgattttga gtacctaatt gctaggcatg ttatggagca cttggaaggg     60
gccaggggga accgtagcat tgacatataa agtggacacc atctgctgtt gttggtggaa    120
gtgaagcttc aattaagaaa gagcagaaac gactttggtt gaaggaaaat acagaagaaa    180
gttgatcgac tgcaaaacga cgccatcaga ttccggcaac gaacaaaaca gacaaaacag    240
acaaactgcg cataaggcgt gaccggcgat catgtgtcta caaagaactt gctggatcgt    300
cgcggcctca ttattctcca gctccctccc ctcctttact tcctcggtat actcatgaac    360
acatgcctac gattgtcaat tcccagcctg tcgctatcat gttctcgcag ggatcatggt    420
ctggccgttg aactcccctg attatcctgc ctgagagcct acgtcttccg atgacgacgt    480
gtccggtggc cgaaccgcca tccgatatta acctgcagcc gggaatagcc atggacagac    540
aaacctagga ggctagctaa aagttagtgt atgaggtgag caaggatata ctcggcgttc    600
cctcttgggc tttccgaaat ccataaggga gtccgccaaa cagttcatta tgatcttatt    660
aagccgagtt aatttagctg caggtacggc ttcgataagg atgggatacg gactcctacg    720
acctggcatt tcggagatat ccgaccatca cacgtcttcc aacaaagagt aatatgagca    780
atgaagtggc ccgcagtacg gagaagttgc ctctatcgtt ggcttctcgt gtcgagcgcg    840
ctcatggcta ataacgttaa aacattgaca catcaattca tgataactaa caagtgagac    900
atttgccact cattcccgaa tgcaaccact ctatcaggcc agtggggaac gcacggctag    960
cctcgtcgac ctccgatggt tggtttctct gatctgagtt tcctactggg ccatctcagg   1020
aaggtggaaa aagcaatggc accatttacc gatacaaagc gcagtgttgg ctgccaattt   1080
ttacttttcc acccctcacc cgctcttctt gcctactggc gcctggaagt gaaatcctgg   1140
agcaggagaa aggaacggta attggcaagc gctaaccaac ttgcgccttg tactttggag   1200
ccggcgctgc gagccgacgc gccccattcc caaaatggcc taacggccgt gaagccgagg   1260
ttcagggtgt ccctacttgc aatgcttaac aatggacgga ataatattca acagccccag   1320
cgtcgcgctg gtcaaaaatc tagaagcagc aaatttgggc ctgaagccta gatggcgatg   1380
ccaatcaatc ctttctgtga aatgatttag ttactaatga gggggtgctg attcgctgtg   1440
gtatatgtga tgtctgtgtc gaaggcccca ggcagctcgt ccactccccc cgagaacaag   1500
ccttgctcag acaatccagg ctccaccgcg tgctgggtcc accactgctg ctgaccttaa    1560
cgcgggtgcc tgtcgattat gggtcgacca gccaatattg gaccgatatg cctcctccgt    1620
cccggattgt gaacatatga taaggaatga tgtgataagg aggaaaaaga cggtatgatc    1680
taaaagcatt gtacggacat aacaacaggg atgaagtggg ccagtaggag ctccgccatg    1740
atcctggtgg ctcgaatcag tcctgaggat cccccacggg ctgctgttgt ggaagacacc    1800
tgggcacact ggcaccacaa acgctggacc tgcatagaat atgctttgct ggcttcgggt    1860
ctagacatgg attgggataa tatcaatgtg catccttgct ataatccaac aatatttccg    1920
ttgatagccg acagggcagg cattcaatgt cgcattgcag catgcgccgt caagtgtaga    1980
gactagagag tgagacaaga gagaaaattt ttctctcctt ggtgctggaa agcccatttg    2040
agggatctta taaggtaatt gcctatgttc agtcgcctat ggtcttgtcg agagaaactc    2100
tttctcgtta agatctacat gatcgctttt gattttctct gggttcacgc ggttactttc    2160
tccccgtcaa tccccaaccg ctgttgtgcc tgaccatcaa tgtggaacgg ataaggggac    2220
aagagaaatt gaaggagcga tcataaaaag ctaattttgg tttattattt tttttttttc    2280
ttataaaact caaaaaagaa aacgaaaacg aaaaaggaaa aaagaaaagg taaaatggaa    2340
aaagaaaggc ggtcatcact tccaataacc atcagccaaa gatacagacg agttactgac    2400
cttcttatcc tggacttccg cccgatccat atcttcatga taagcaggga accgaacaaa    2460
tcaacgccaa cttcagcggc agttcctcac taatttccca cttcccaccg gcgtcatttt    2520
ggtcccaacc ccctccctgg aagcagcggg atttagttac gatccggttt acatcggaga    2580
ctcggaaaat accatagcgc atgccaatca aaacccctcc cagggtgact ggccagtatc    2640
acgacccatt gtttctatct ttctagaaga cctgcaggga catggattgg ctggccgccg    2700
tgctgccgtc cattagcgtc taccccaggt caagaacgga ctggacggac ccataaccaa    2760
tctaaccaaa gccaatttcg tcaattccca gctggcgagc acaatcccat tcccagggtt    2820
ggccgccaac tgttaaaagg cactatgtgt ctctccacct gcccgccccc ctcgatggcc    2880
tgcgcgtaat aactattcta ctgctttttg cctcttactt gcctcattat tagtatttta    2940
ctctactctc cagattgcct gccagcaatt ggtccaaagt ggactttgtt tgatgac       2997
atg act cga acc gtg gac gag atc aaa tac gaa acg cct tct tca tgg      3045
gag cac aag agc ttg gac gtt gcc gag gat ggc agg cga cta gct ccc      3093
cat tcc gac act gct cgt ccg aaa ggc cgc ata cga cga tcg atg act      3141
gcc tgt cac aca tgt cgg aag ctt aaa act aga tgt gat cta gat ccg      3189
cgc ggt cat gcg tgc cgt cgc tgt cta tct cta ag  gtcagaggca           3234
ctacctacct gccagttgaa gctttgtcct tctgaacgcg acatgatact agtcgtggaa    3294
tataactgtc ccaactttgc tgacagtcca caatatcttt ag a atc gat tgt aag     3349
ctg cct gaa acg acc gac cgc ttc caa gac agt gct gcg atg tgg cca      3397
gac gcc acc tcg gca att ccc tcc atc gag gag cgc ctc acc tcc cta      3445
gaa aga tgc atg agg gag atg acg ggc atg atg cga cag atg cta gat      3493
cac tcc cca ggt ttc gca aat gcc tcg gtt ccg cat ttg acc aaa agc      3541
atc atc acg gat gaa aac gcc tcg atg gag gga agc ccg tcg tcc ccc      3589
ttc ctg cct aag ccc gtt cgc ctc att cag gac ctc cag tcc gac ttc      3637
ttc gga gaa gca gag act tcc ccc gtt gac tcc cct ctc tcc agc gat      3685
ggt aac gcc aag ggc gct atc gac tct aag cta tcc ctc aaa ttg ttg      3733
caa ac  gtatgggtat acctgattga caattaccaa aaagctgcta atccttggcg       3788
caaatcag g ttt gtc gat cac ttt ggc gct tgc gtt tcc att tac aat       3836
ctc tcc gac atc cac aac gac atg aaa gcc ccc gac tct tta ctg tat      3884
aat act gca tgc ctt cta gct tca cgc tat gta ccg ggg ata ccg aca      3932
tct acc gtg cat gct ata tac ctt caa gtg cga cat gca gta gtc aat    3980
att ttg tgg gaa aaa cca ccc ctg aag tat gag acc ctc caa gca ctt    4028
gca ctt ctc tgt ctc tgg cca gca acc gcc cag aaa gag cca ccc atg    4076
gac agc tgg ctg ctg agt ggt atc tca att aac cat gca att atc gcg    4124
ctc gat ttc cta aac tat gcg ccc tcg gaa gtc atg gtg gac aat gaa    4172
acg gct gcg cag ctg cgg cta tgg aat aca tat tgc ttg aca cag cta    4220
ca  gtgggtttca tctaagatct cccgtccaga agatagctaa caagctttag t ttt   4276
gcg gtc ggg aat gcg cgt cct ttc cat atc cag caa aga tac ctt gac    4324
cac tgc cca cgg ata ctg gag cac cca gca gca act ctg gag gac gca    4372
agg gtt gta gca gaa ata cag ttg tat ttg atg aca ttg cgg ctc cag    4420
agc aat agc agt cga atg cgg ttg gcg gac ctt gac tat gag gaa ata    4468
gag cga tgg aag agg gag tgg gct cac ctt ttc t gtaagaagcc           4512
tgttcttgtt tcccggggac taccactgac gagagcaaca g ct  ggg gaa agt tcc  4567
aca ttg gag ctg agc ctt tgg ttc tgc cag aca ctc ctt cac cgc aca    4615
gca atg agg ctt cag ccc aga tcc gac agg ctc gca tct gag gtt ctg    4663
caa acc tca cgt ctg ata ata tcg cgg ttc ctc cag atc cgg tac tct    4711
acc gca tta agc ctt gtc gac caa gtc tat ttc att gtc ggc tac gct    4759
gca ctg aat ctg tgc gat ttc aat ctt atg gac ccg ctt atc gag caa    4807
gtg cag atg ttc ctg ctg cat ctc tcc ccg aac gaa gac cac atc gcc    4855
tac cgg ttt tcg tgc atg gtc gcc gag ttc aag cgg cga tgt ggc agt    4903
gcg gaa tgc aat gac cca tca tcc act gtc aag ggg tct ccg tta tca    4951
tcc tac ggc gac agt cgt aag atg agc atg ggg caa gca ccg ttc atg    4999
cca ccg ctc atg gat ggc atg atc gag ggg tac ggc ttc gag caa ctg    5047
atg cca gaa gtc atg ccg agt tcc ttt ccg gat ggg ata ctc aac gga    5095
atg cct gtg act ggg cta gca gcg tat cgg tca gcg acg ctg taa        5140
gtaatcgaga tcgggttgga aaggacatga gtgggggtgg tggtggtagt agcagtaaca  5200
ccagggatga taacctgcag cggtggttta gttcctgccc atgggctgaa ctaaaacccc  5260
gaacctagca tgatgacgtg caacgaaagg atcataacca aggccaagta aatactaaaa  5320
taaaataata taattccaca cgatccacta ccaccaccac caccggatcc atcaggttgc  5380
cttcctgcac aggcctattt agttagaggg cccgtgccac gaaacatcac gtaattgagc  5440
gcttttgctt ccttgcaact taaacaaccc catagacact ctcacattca catgccaaac  5500
tactaactcc tactgaccac cagctgcagg aagccagcca gccaccattt cctaatcgga  5560
tatatctccg aaacgtacgc tttcctcctt tgttcggacc gttccgtgcc tccgcggaga  5620
gttgaacgag tcagaacaca ttcttttcgt ttctatcgtt tcttttccaa ggcagcagag  5680
agacgaacaa gtcagtgctt gctaactaac ttacccctca gcattttagt aaactactat  5740
ttaggaaaga gtaatcattc atcgaagaca agatgtttat ttctccgatc gaccaaacaa  5800
aaacgttcag gtagactaag tagtagtagt agtatgtctt tgaccccttt actccactat  5860
ccgttgactg cacatagtag taagtaacta tctaaccagt tgccgaggag aggaaagtga  5920
gtgggtggga gccggaggat gccgccgaga attattaagt cgatcattgc tagttagtta  5980
tcttttcatg atgaggagag gaaggagagg ggggacggga ttagagaaat aaacttttct  6040
ctccaattaa ttatctggat taattaaaac ttggagagga gggtagggga gttgggtatt  6100
gttatgttgc tgtgaatgta ggtgtaactt ttggaaggaa attgacggga tgatgctact  6160
atgctgcagg cagtaggagg tgttgttcat ctcgcttgcc ccgcccgtag atggttgggt  6220
tcggatgtag atacttgatg gagataagta ggggtttttg tttcttttct ttccttttct  6280
ttttttatga tgaagtatat ttctctagta tgtttgtatg atgcagaggt tgaggttgaa  6340
tttactattg gtctgctgtt gttggtattg gctgggtgtc aatagaaata agtttactcc  6400
gtcgtttcgt gaggttgtag tgactgtggc tttgagacac taaggactag gtacaactac  6460
tacgtcggtg gtagtgattt tatccatact tactttgcag gcaaatgaat actgtggata  6520
ctaataatat aaaatgatct tgaagaatcc attacacata gaatcatcac gtcacctaat  6580
aatatatact gtcatctgag acatcctaat cacgtcatta tagcaataag cacctgagcg  6640
aaaattctac aaattgaagt cagcatctgg atcacgatca caggggtcat cgtctagtgg  6700
ccatgatatg atctgataca cttacacagt gtagctaaag aacaacacgc ctcctcctgc  6760
atccttgaaa acagtgatcg cagagcctgt gcgaatgtat cagttgatca atccataaag  6820
aatcaatgcg atggacg                                                 6837
<210>2
<211>1872
<212>DNA
<213>Aspergillus niger
<220>
<221>外显子
<222>(1)..(227)
<223>
<220>
<221>外显子
<222>(228)..(629)
<223>
<220>
<221>外显子
<222>(630)..(1055)
<223>
<220>
<221>外显子
<222>(1056)..(1285)
<223>
<220>
<221>外显子
<222>(1286)..(1872)
<223>
<400>2
atg act cga acc gtg gac gag atc aaa tac gaa acg cct tct tca tgg    48
gag cac aag agc ttg gac gtt gcc gag gat ggc agg cga cta gct ccc     96
cat tcc gac act gct cgt ccg aaa ggc cgc ata cga cga tcg atg act    144
gcc tgt cac aca tgt cgg aag ctt aaa act aga tgt gat cta gat ccg    192
cgc ggt cat gcg tgc cgt cgc tgt cta tct cta ag  a atc gat tgt aag  240
ctg cct gaa acg acc gac cgc ttc caa gac agt gct gcg atg tgg cca    288
gac gcc acc tcg gca att ccc tcc atc gag gag cgc ctc acc tcc cta    336
gaa aga tgc atg agg gag atg acg ggc atg atg cga cag atg cta gat    384
cac tcc cca ggt ttc gca aat gcc tcg gtt ccg cat ttg acc aaa agc    432
atc atc acg gat gaa aac gcc tcg atg gag gga agc ccg tcg tcc ccc    480
ttc ctg cct aag ccc gtt cgc ctc att cag gac ctc cag tcc gac ttc    528
ttc gga gaa gca gag act tcc ccc gtt gac tcc cct ctc tcc agc gat    576
ggt aac gcc aag ggc gct atc gac tct aag cta tcc ctc aaa ttg ttg    624
caa ac  g ttt gtc gat cac ttt ggc gct tgc gtt tcc att tac aat ctc  672
tcc gac atc cac aac gac atg aaa gcc ccc gac tct tta ctg tat aat    720
act gca tgc ctt cta gct tca cgc tat gta ccg ggg ata ccg aca tct    768
acc gtg cat gct ata tac ctt caa gtg cga cat gca gta gtc aat att    816
ttg tgg gaa aaa cca ccc ctg aag tat gag acc ctc caa gca ctt gca    864
ctt ctc tgt ctc tgg cca gca acc gcc cag aaa gag cca ccc atg gac    912
agc tgg ctg ctg agt ggt atc tca att aac cat gca att atc gcg ctc    960
gat ttc cta aac tat gcg ccc tcg gaa gtc atg gtg gac aat gaa acg   1008
gct gcg cag ctg cgg cta tgg aat aca tat tgc ttg aca cag cta ca  t 1056
ttt gcg gtc ggg aat gcg cgt cct ttc cat atc cag caa aga tac ctt   1104
gac cac tgc cca cgg ata ctg gag cac cca gca gca act ctg gag gac   1152
gca agg gtt gta gca gaa ata cag ttg tat ttg atg aca ttg cgg ctc   1200
cag agc aat agc agt cga atg cgg ttg gcg gac ctt gac tat gag gaa   1248
ata gag cga tgg aag agg gag tgg gct cac ctt ttc t ct  ggg gaa agt 1296
tcc aca ttg gag ctg agc ctt tgg ttc tgc cag aca ctc ctt cac cgc   1344
aca gca atg agg ctt cag ccc aga tcc gac agg ctc gca tct gag gtt   1392
ctg caa acc tca cgt ctg ata ata tcg cgg ttc ctc cag atc cgg tac   1440
tct acc gca tta agc ctt gtc gac caa gtc tat ttc att gtc ggc tac   1488
gct gca ctg aat ctg tgc gat ttc aat ctt atg gac ccg ctt atc gag   1536
caa gtg cag atg ttc ctg ctg cat ctc tcc ccg aac gaa gac cac atc   1584
gcc tac cgg ttt tcg tgc atg gtc gcc gag ttc aag cgg cga tgt ggc   1632
agt gcg gaa tgc aat gac cca tca tcc act gtc aag ggg tct ccg tta   1680
tca tcc tac ggc gac agt cgt aag atg agc atg ggg caa gca ccg ttc   1728
atg cca ccg ctc atg gat ggc atg atc gag ggg tac ggc ttc gag caa   1776
ctg atg cca gaa gtc atg ccg agt tcc ttt ccg gat ggg ata ctc aac   1824
gga atg cct gtg act ggg cta gca gcg tat cgg tca gcg acg ctg taa   1872
<210>3
<211>623
<212>PRT
<213>Aspergillus niger
<400>3
Met Thr Arg Thr Val Asp Glu Ile Lys Tyr Glu Thr Pro Ser Ser Trp
1               5                   10                  15
Glu His Lys Ser Leu Asp Val Ala Glu Asp Gly Arg Arg Leu Ala Pro
            20                  25                  30
His Ser Asp Thr Ala Arg Pro Lys Gly Arg Ile Arg Arg Ser Met Thr
        35                  40                  45
Ala Cys His Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu Asp Pro
    50                  55                  60
Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile Asp Cys Lys
65                  70                  75                  80
Leu Pro Glu Thr Thr Asp Arg Phe Gln Asp Ser Ala Ala Met Trp Pro
                85                  90                  95
Asp Ala Thr Ser Ala Ile Pro Ser Ile Glu Glu Arg Leu Thr Ser Leu
            100                 105                 110
Glu Arg Cys Met Arg Glu Met Thr Gly Met Met Arg Gln Met Leu Asp
        115                 120                 125
His Ser Pro Gly Phe Ala Asn Ala Ser Val Pro His Leu Thr Lys Ser
    130                 135                 140
Ile Ile Thr Asp Glu Asn Ala Ser Met Glu Gly Ser Pro Ser Ser Pro
145                 150                 155                 160
Phe Leu Pro Lys Pro Val Arg Leu Ile Gln Asp Leu Gln Ser Asp Phe
                165                 170                 175
Phe Gly Glu Ala Glu Thr Ser Pro Val Asp Ser Pro Leu Ser Ser Asp
            180                 185                 190
Gly Asn Ala Lys Gly Ala Ile Asp Ser Lys Leu Ser Leu Lys Leu Leu
        195                 200                 205
Gln Thr Phe Val Asp His Phe Gly Ala Cys Val Ser Ile Tyr Asn Leu
    210                 215                 220
Ser Asp Ile His Asn Asp Met Lys Ala Pro Asp Ser Leu Leu Tyr Asn
225                 230                 235                 240
Thr Ala Cys Leu Leu Ala Ser Arg Tyr Val Pro Gly Ile Pro Thr Ser
                245                 250                 255
Thr Val His Ala Ile Tyr Leu Gln Val Arg His Ala Val Val Asn Ile
            260                 265                 270
Leu Trp Glu Lys Pro Pro Leu Lys Tyr Glu Thr Leu Gln Ala Leu Ala
        275                 280                 285
Leu Leu Cys Leu Trp Pro Ala Thr Ala Gln Lys Glu Pro Pro Met Asp
    290                 295                 300
Ser Trp Leu Leu Ser Gly Ile Ser Ile Asn His Ala Ile Ile Ala Leu
305                 310                 315                 320
Asp Phe Leu Asn Tyr Ala Pro Ser Glu Val Met Val Asp Asn Glu Thr
                325                 330                 335
Ala Ala Gln Leu Arg Leu Trp Asn Thr Tyr Cys Leu Thr Gln Leu His
            340                 345                 350
Phe Ala Val Gly Asn Ala Arg Pro Phe His Ile Gln Gln Arg Tyr Leu
        355                 360                 365
Asp His Cys Pro Arg Ile Leu Glu His Pro Ala Ala Thr Leu Glu Asp
    370                 375                 380
Ala Arg Val Val Ala Glu Ile Gln Leu Tyr Leu Met Thr Leu Arg Leu
385                 390                 395                 400
Gln Ser Asn Ser Ser Arg Met Arg Leu Ala Asp Leu Asp Tyr Glu Glu
                405                 410                 415
Ile Glu Arg Trp Lys Arg Glu Trp Ala His Leu Phe Ser Gly Glu Ser
            420                 425                 430
Ser Thr Leu Glu Leu Ser Leu Trp Phe Cys Gln Thr Leu Leu His Arg
        435                 440                 445
Thr Ala Met Arg Leu Gln Pro Arg Ser Asp Arg Leu Ala Ser Glu Val
    450                 455                 460
Leu Gln Thr Ser Arg Leu Ile Ile Ser Arg Phe Leu Gln Ile Arg Tyr
465                 470                 475                 480
Ser Thr Ala Leu Ser Leu Val Asp Gln Val Tyr Phe Ile Val Gly Tyr
                485                 490                 495
Ala Ala Leu Asn Leu Cys Asp Phe Asn Leu Met Asp Pro Leu Ile Glu
            500                 505                 510
Gln Val Gln Met Phe Leu Leu His Leu Ser Pro Asn Glu Asp His Ile
        515                 520                 525
Ala Tyr Arg Phe Ser Cys Met Val Ala Glu Phe Lys Arg Arg Cys Gly
    530                 535                 540
Ser Ala Glu Cys Asn Asp Pro Ser Ser Thr Val Lys Gly Ser Pro Leu
545                 550                 555                 560
Ser Ser Tyr Gly Asp Ser Arg Lys Met Ser Met Gly Gln Ala Pro Phe
                565                 570                 575
Met Pro Pro Leu Met Asp Gly Met Ile Glu Gly Tyr Gly Phe Glu Gln
            580                 585                 590
Leu Met Pro Glu Val Met Pro Ser Ser Phe Pro Asp Gly Ile Leu Asn
        595                 600                 605
Gly Met Pro Val Thr Gly Leu Ala Ala Tyr Arg Ser Ala Thr Leu
    610                 615                 620
<210>4
<211>42
<212>PRT
<213>Aspergillus niger
<220>
<221>ZN_FING
<222>(1)?(42)
<400>4
Met Thr Ala Cys His Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu
1               5                   10                  15
Asp Pro Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile Asp
            20                  25                  30
Cys Lys Leu Pro Glu Thr Thr Asp Arg Phe
        35                  40
<210>5
<211>25
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>5
gggagtgggc tcaccttttc tctgg                                       25
<210>6
<211>22
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>6
atgaacggtg cttgccccat gc                                          22
<210>7
<211>29
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>7
cggcttcgaa tggctaggtg tcgattttg                                   29
<210>8
<211>41
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>8
ggtagtggat cgtgtggaat tggcaggcaa tctggagagt a                     41
<210>9
<211>21
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>9
aattccacac gatccactac c                                           21
<210>10
<211>32
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>10
actaggcgcg cctttgtttg gtcgatcgga ga                               32
<210>11
<211>31
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>11
ttgaggtacc aattccacac gatccactac c                                31
<210>12
<211>30
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>12
tcatcccggg cgtccatcgc attgattctt                                  30
<210>13
<211>2931
<212>DNA
<213>Aspergillus oryzae
<220>
<221>外显子
<222>(795)..(1027)
<223>
<220>
<221>内含子
<222>(1028)..(1135)
<223>
<220>
<221>外显子
<222>(1136)..(1537)
<223>
<220>
<221>内含子
<222>(1538)..(1591)
<223>
<220>
<221>外显子
<222>(1592)..(2017)
<223>
<220>
<221>内含子
<222>(2018)..(2066)
<223>
<220>
<221>外显子
<222>(2067)..(2295)
<223>
<220>
<221>内含子
<222>(2296)..(2347)
<223>
<220>
<221>外显子
<222>(2348)..(2931)
<223>
<400>13
gatatctcat gatctgcgtg atcggcttgc ctcctatctt agatcacccg ggcttcttca   60
aatcagcaac aacgctcaga catgtcccct gagaggtgat ccaaatcata cacgagagaa  120
cgcggaaacg caaattaagg atgagcgaaa aagagaaaaa aatccgttgt tcctgagtca  180
tgacgaatga gcaaaagtca aacacacctt ctgcttttgg ggggtatgcc cgatcacaat  240
cttcaacccg ccatgataag agacacacgc tatcgacaaa tcaccggagg tcaagattag  300
tggcagtcct tagctaattt caggtcggcg tcaaccttag ccaacccaac ccaaccccct  360
catggaagcg ggactcccta tggagccggc ttacatcggg cgcactgcaa tggcgcacgt  420
caatcaaccc ctctcttgtt gcagtgccta gtatgccaaa ccaccctttc tattcttcta  480
gaaaccacac cctagagact cggatctaca cggattggtt ggaatgctcc gattagttgg  540
catttacccc aggtcaaaat ggataatcaa tctaacggag tctatttcgt caactgcctg  600
ccagctagca caatctcctc ttcacgcccg gccgtgggct gttaaaaggg tcaattccct  660
ccccacctgt gtggattctc tatgatttgc acgggatctg acttggtttc cacaattctt  720
cttgctctca gcttgttcta ctcgccgatt attcttttca tcaacgcggc acactacccc  780
cgttgtctga tgtc atg act aga act act gtt gaa cct atc aaa tat gag    830
gcc cct tcg tgg gag cat aag agc gtg cat gtg tcc gac gac cac agg    878
aga atc atc ccc aat gtc ggc gac gac gcg acg cgc cca aag ggc cgc    926
att aga cgt tca atg acc gct tgt aat acc tgc cgc aag ctt aaa act    974
cgg tgc gat ctt gat cca cga ggg cat gca tgc cgg cgg tgt cta tct    1022
tta ag  gtcgggtgcc accgttatcc actttgtcaa atctcttacg tcaaaatggg     1077
ggatcccatg tcctgccaag accaaataag cctttcttga gtactaatgt ttctatag g  1136
atc gac tgt cag ctc ccc gag acg agt gag cgc ttt cag gac agt act    1184
cca atg tgg tca gac gca acg aca gct atc ccc tcc atc gag gag cgt    1232
ctc act tcc cta gag agg agt atg aga gag atg acc ggc atg ctt cgg    1280
cag atc ttg aat caa tca cca agc gtc tct aat atc tcc gtc cct ccg    1328
cta gct cgg agt gtt cat acg gaa gaa acg gcc tcc att gaa gga aac    1376
tca ttc ggt cct ttc cta cct aaa ccc gtt cgg cta att cag gac ctc    1424
caa tct gag ttt ttt ggg gag aca aac cgc atc cct gtt gaa tct cct    1472
ttc ttg ggt aac agt ttt gag aag ggt atc tta gat tct aag ttg tct    1520
ctc aag ttg gta cag ct  gtatggtcac tcgtcatgtc catctgcctc           1567
tatagccgct aatgcttgag ctag a ttt gtg gat aat ttc ggc cct tta gtg   1619
tcc ata aat aat cag tcg gac ttc cac aac gag atg agg aac acc gat    1667
tcg ttg tta tat agt act gcc tgt ctt ctg gcc tcc cga tat gtg cca    1715
ggc ata eca cca ccg att gtc cat acc atg aac ctc caa gtt cga cat    1763
aag gca gtc aat ctg ctg tgg gaa gaa ccg cct ttg aaa tac gaa tcg    1811
ctc cag gca ctc gcc ctt ctt tgt tta tgg cca gcg gcg ggt caa aag    1859
gag ttc ccc ata gat ggc tgg tta ctg agc ggg act gca atc aat cat    1907
gcc ctc gtc tcc ttt gac ttc ctc aat cat gtg cct tca gag ctt ctc    1955
att gat aac gat atc gcc gct caa ttg cgg ctc tgg aac gct ttc tgt    2003
tta aca cag tta ca  gtaggtacaa catttccggc ttaactccaa cttgctaatg    2057
cagaaatag t ttc gct gtt ggc aac gca cgt cca ttc cat tta cca cag    2106
aga tat ctc gat tat tgc cca cga ctt ctt gag cac ccc gct gca aca    2154
gtt gag gat ggc aag gtc gta gca gag atc cag ttg tac ttg atc aca    2202
ttg cga ctc caa gcc aac gag caa cgt atg cga ttc gcg gag gtt gaa    2250
tac gaa gag att gaa cga tgg aaa gtt gaa tgg gcc cat ctt ctt        2295
ggtaaggtta agcaacgagg accatctcat ataaatgcta actattcaac ag ctg gtg  2353
atg aaa att caa cat ttg agc tta gtc tct ggt tct gtc aaa tcc tcc    2401
tgc atc gga cag caa tga ggt tcc aag cgg agt ctg aga gac tca cgt    2449
cgg aaa ttc tcc aag gat cgc gct tga tca tct cga aat tcc tgc aac    2497
tcc gat ttg tca ccg ctc taa gag tgg tcg atc agg cgt act tca tcg    2545
tcg gtt atg ccg ctc taa atc ttt gcg act tca act tcc tcg acc ccc    2593
tca ttg acc aga tcc aga tgt ttc tgc tgc atc tgt cgc caa acg aag    2641
acc aca tcg cat acc ggt ttt cgt gca tga tag ccg agt tca agc gtc    2689
gct gtg ccg aat gca acg acc ctt gca gcg cag tcg acg gtt ctc aat    2737
gct cgt tcg gag atg ccc gga aga tga gca tgg aac agg tac aat tcg    2785
tgc cac cac tag tag ata gca tga ttg ggg gat ata gcg ctc tgg aac    2833
agc tga tcc ctg agg tca tgc cac act cat ttc cgg aaa gtg tca taa    2881
gtg gca tgg ctg tga ctg aag cca tcc ctg tgg gat cgg cgc cat act    2929
ag                                                                 2931
<210>14
<211>1875
<212>DNA
<213>Aspergillus oryzae
<220>
<221>外显子
<222>(1)..(233)
<223>
<220>
<221>外显子
<222>(234)..(635)
<223>
<220>
<221>外显子
<222>(636)..(1061)
<223>
<220>
<221>外显子
<222>(1062)..(1291)
<223>
<220>
<221>外显子
<222>(1292)..(1875)
<223>
<400>14
atg act aga act act gtt gaa cct ate aaa tat gag gcc cct tcg tgg     48
gag cat aag agc gtg cat gtg tcc gac gac cac agg aga atc atc ccc     96
aat gtc ggc gac gac gcg acg cgc cca aag ggc cgc att aga cgt tca    144
atg acc gct tgt aat acc tgc cgc aag ctt aaa act cgg tgc gat ctt    192
gat cca cga ggg cat gca tgc cgg cgg tgt cta tct tta ag  g atc gac  240
tgt cag ctc ccc gag acg agt gag cgc ttt cag gac agt act cca atg    288
tgg tca gac gca acg aca gct atc ccc tcc atc gag gag cgt ctc act    336
tcc cta gag agg agt atg aga gag atg acc ggc atg ctt cgg cag atc    384
ttg aat caa tca cca agc gtc tct aat atc tcc gtc cct ccg cta gct    432
cgg agt gtt cat acg gaa gaa acg gcc tcc att gaa gga aac tca ttc    480
ggt cct ttc cta cct aaa ccc gtt cgg cta att cag gac ctc caa tct    528
gag ttt ttt ggg gag aca aac cgc atc cct gtt gaa tct cct ttc ttg    576
ggt aac agt ttt gag aag ggt atc tta gat tct aag ttg tct ctc aag    624
ttg gta cag ct  a ttt gtg gat aat ttc ggc cct tta gtg tcc ata aat  672
aat cag tcg gac ttc cac aac gag atg agg aac acc gat tcg ttg tta     720
tat agt act gcc tgt ctt ctg gcc tec cga tat gtg cca ggc ata cca     768
cca ccg att gtc cat acc atg aac ctc caa gtt cga cat aag gca gtc     816
aat ctg ctg tgg gaa gaa ccg cct ttg aaa tac gaa tcg ctc cag gca     864
ctc gcc ctt ctt tgt tta tgg cca gcg gcg ggt caa aag gag ttc ccc     912
ata gat ggc tgg tta ctg agc ggg act gca atc aat cat gcc ctc gtc     960
tcc ttt gac ttc ctc aat cat gtg cct tca gag ctt ctc att gat aac    1008
gat atc gcc gct caa ttg cgg ctc tgg aac gct ttc tgt tta aca cag    1056
tta ca  t ttc gct gtt ggc aac gca cgt cca ttc cat tta cca cag aga  1104
tat ctc gat tat tgc cca cga ctt ctt gag cac ccc gct gca aca gtt    1152
gag gat ggc aag gtc gta gca gag atc cag ttg tac ttg atc aca ttg    1200
cga ctc caa gcc aac gag caa cgt atg cga ttc gcg gag gtt gaa tac    1248
gaa gag att gaa cga tgg aaa gtt gaa tgg gcc cat ctt ctt g ct  ggt  1296
gat gaa aat tca aca ttt gag ctt agt ctc tgg ttc tgt caa atc ctc    1344
ctg cat cgg aca gca atg agg ttc caa gcg gag tct gag aga ctc acg    1392
tcg gaa att ctc caa gga tcg cgc ttg atc atc tcg aaa ttc ctg caa    1440
ctc cga ttt gtc acc gct cta aga gtg gtc gat cag gcg tac ttc atc    1488
gtc ggt tat gcc gct cta aat ctt tgc gac ttc aac ttc ctc gac ccc    1536
ctc att gac cag atc cag atg ttt ctg ctg cat ctg tcg cca aac gaa    1584
gac cac atc gca tac cgg ttt tcg tgc atg ata gcc gag ttc aag cgt    1632
cgc tgt gcc gaa tgc aac gac cct tgc agc gca gtc gac ggt tct caa    1680
tgc tcg ttc gga gat gcc cgg aag atg agc atg gaa cag gta caa ttc    1728
gtg cca cca cta gta gat agc atg att ggg gga tat agc gct ctg gaa    1776
cag ctg atc cct gag gtc atg cca cac tca ttt ccg gaa agt gtc ata    1824
agt ggc atg gct gtg act gaa gcc atc cct gtg gga tcg gcg cca tac    1872
tag                                                                1875
<210>15
<211>624
<212>PRT
<213>Aspergillus oryzae
<400>15
Met Thr Arg Thr Thr Val Glu Pro Ile Lys Tyr Glu Ala Pro Ser Trp
1               5                   10                  15
Glu His Lys Ser Val His Val Ser Asp Asp His Arg Arg Ile Ile Pro
            20                  25                  30
Asn Val Gly Asp Asp Ala Thr Arg Pro Lys Gly Arg Ile Arg Arg Ser
        35                  40                  45
Met Thr Ala Cys Asn Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu
    50                  55                  60
Asp Pro Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile Asp
65                  70                  75                  80
Cys Gln Leu Pro Glu Thr Ser Glu Arg Phe Gln Asp Ser Thr Pro Met
                85                  90                  95
Trp Ser Asp Ala Thr Thr Ala Ile Pro Ser Ile Glu Glu Arg Leu Thr
            100                 105                 110
Ser Leu Glu Arg Ser Met Arg Glu Met Thr Gly Met Leu Arg Gln Ile
        115                 120                 125
Leu Asn Gln Ser Pro Ser Val Ser Asn Ile Ser Val Pro Pro Leu Ala
    130                 135                 140
Arg Ser Val His Thr Glu Glu Thr Ala Ser Ile Glu Gly Asn Ser Phe
145                 150                 155                 160
Gly Pro Phe Leu Pro Lys Pro Val Arg Leu Ile Gln Asp Leu Gln Ser
                165                 170                 175
Glu Phe Phe Gly Glu Thr Asn Arg Ile Pro Val Glu Ser Pro Phe Leu
            180                 185                 190
Gly Asn Ser Phe Glu Lys Gly Ile Leu Asp Ser Lys Leu Ser Leu Lys
        195                 200                 205
Leu Val Gln Leu Phe Val Asp Asn Phe Gly Pro Leu Val Ser Ile Asn
    210                 215                 220
Asn Gln Ser Asp Phe His Asn Glu Met Arg Asn Thr Asp Ser Leu Leu
225                 230                 235                 240
Tyr Ser Thr Ala Cys Leu Leu Ala Ser Arg Tyr Val Pro Gly Ile Pro
                245                 250                 255
Pro Pro Ile Val His Thr Met Asn Leu Gln Val Arg His Lys Ala Val
            260                 265                 270
Asn Leu Leu Trp Glu Glu Pro Pro Leu Lys Tyr Glu Ser Leu Gln Ala
        275                 280                 285
Leu Ala Leu Leu Cys Leu Trp Pro Ala Ala Gly Gln Lys Glu Phe Pro
    290                 295                 300
Ile Asp Gly Trp Leu Leu Ser Gly Thr Ala Ile Asn His Ala Leu Val
305                 310                 315                 320
Ser Phe Asp Phe Leu Asn His Val Pro Ser Glu Leu Leu Ile Asp Asn
                325                 330                 335
Asp Ile Ala Ala Gln Leu Arg Leu Trp Asn Ala Phe Cys Leu Thr Gln
            340                 345                 350
Leu His Phe Ala Val Gly Asn Ala Arg Pro Phe His Leu Pro Gln Arg
        355                 360                 365
Tyr Leu Asp Tyr Cys Pro Arg Leu Leu Glu His Pro Ala Ala Thr Val
    370                 375                 380
Glu Asp Gly Lys Val Val Ala Glu Ile Gln Leu Tyr Leu Ile Thr Leu
385                 390                 395                 400
Arg Leu Gln Ala Asn Glu Gln Arg Met Arg Phe Ala Glu Val Glu Tyr
                405                 410                 415
Glu Glu Ile Glu Arg Trp Lys Val Glu Trp Ala His Leu Leu Ala Gly
            420                 425                 430
Asp Glu Asn Ser Thr Phe Glu Leu Ser Leu Trp Phe Cys Gln Ile Leu
        435                 440                 445
Leu His Arg Thr Ala Met Arg Phe Gln Ala Glu Ser Glu Arg Leu Thr
    450                 455                 460
Ser Glu Ile Leu Gln Gly Ser Arg Leu lle Ile Ser Lys Phe Leu Gln
465                 470                 475                 480
Leu Arg Phe Val Thr Ala Leu Arg Val Val Asp Gln Ala Tyr Phe Ile
                485                 490                 495
Val Gly Tyr Ala Ala Leu Asn Leu Cys Asp Phe Asn Phe Leu Asp Pro
            500                 505                 510
Leu Ile Asp Gln Ile Gln Met Phe Leu Leu His Leu Ser Pro Asn Glu
        515                 520                 525
Asp His Ile Ala Tyr Arg Phe Ser Cys Met Ile Ala Glu Phe Lys Arg
    530                 535                 540
Arg Cys Ala Glu Cys Asn Asp Pro Cys Ser Ala Val Asp Gly Ser Gln
545                 550                 555                 560
Cys Ser Phe Gly Asp Ala Arg Lys Met Ser Met Glu Gln Val Gln Phe
                565                 570                 575
Val Pro Pro Leu Val Asp Ser Met Ile Gly Gly Tyr Ser Ala Leu Glu
            580                 585                 590
Gln Leu Ile Pro Glu Val Met Pro His Ser Phe Pro Glu Ser Val Ile
        595                 600                 605
Ser Gly Met Ala Val Thr Glu Ala Ile Pro Val Gly Ser Ala Pro Tyr
    610                 615                 620
<210>16
<211>3467
<212>DNA
<213>Aspergillus fumigatus
<220>
<221>外显子
<222>(811)..(1046)
<223>
<220>
<221>内含子
<222>(1047)..(1163)
<223>
<220>
<221>外显子
<222>(1164)..(1565)
<223>
<220>
<221>内含子
<222>(1566)..(1633)
<223>
<220>
<221>外显子
<222>(1634)..(2059)
<223>
<220>
<221>内含子
<222>(2060)..(2114)
<223>
<220>
<221>外显子
<222>(2115)..(2344)
<223>
<220>
<221>内含子
<222>(2345)..(2395)
<223>
<220>
<221>外显子
<222>(2396)..(2967)
<223>
<400>16
ctatttgggt tggccatact aaatttaact gtatggtctc tttcaaaccc acaagggtga   60
tagcgaaaca gaagagacaa gtgaagggaa atttgattaa ggatgattag acgggaccag  120
acagaggccc atcgatatcg ctgctccact gtggaaaatt taagactcaa ccgccatgat  180
gcacatccag accctccgca agattaccat cttggatgtt caagataagc aacgttgttt  240
atcaacaaat cagaatgtcc cggacaatgt cttccaacta attgcgtgct ggtgctactt  300
tcctcctttt ctttccatcg ctaaaatcaa acccctcatt gctctgaaag cgggaatttc  360
agagaacccg gttctcatcg gatgcaggag gatcaagatg gcgcatgtca gtcaacccct  420
ctttgactgc agccagcaaa gtatcgttac caccttcttc cgcctgtttc tacttttcta  480
gaagcccgct agaggcgcct cttggtggca tcgcgcccct gattagcttt taccccaggt  540
tcaagatagg ttggccggcc gtggcggcgc agaacaccta actaccagtg gagtctattt  600
cgtcaacggc tagcaagcta acaccatttc attcccctag cccatcatgg cctgttaaaa  660
aggcaattgt ctcgctccac atgtccaagc tacttaatga tttgcgctgg atcttttgtt   720
ttctggattc ccacacccgt ccgttccctc tccgcctatt agatagtcat ttgtcggctg   780
ctgatccatc agtgcccata ctctgaggcc atg acg cgc acc act tct gtt gaa    834
gat gtc aaa ttt gag atc ccc gcg tgg gac aac tcg aat gtt gat gtc     882
gct gac ggc agc ggc cga cca gaa tcc agt acc agc ggc gac aca ata     930
cgt cca aaa ggt cgc ata cga cga tca atg acg gct tgt aat act tgt     978
cgc aag ctg aag acc cgg tgc gat tta gat cca cgc ggt cat gct tgc    1026
cgc cgc tgt ctc tcc ttg ag  gttcgtacca tagagactct acactgaagg       1076
atacgagacg ttcaaaatcc cgaagatctc tgttgcttca attggccggc tgggatcgaa  1136
tttttgctga acatgctttc ctcgcag g ata gag tgc aag ctg cct gag aca    1188
gct gag cgc ttt caa gat aat gct tca atg tgg tcg gat gcc aca gca    1236
gct att ccg tcc att gaa gag cgc ctc atc tcg ctg gaa cga agt atg    1284
aca gaa atg acc agc atg atg cga cgg atg atg gac cgg tca ccc agt    1332
ata tct ggc agc tcg gta tcc atg ctg aca agg agt ggt atc act gat    1380
gag acc gct tcg atc gaa ggg agt caa tcg tcc tcc ttc gct cct aga    1428
cct atc cgt ctc ttt cag gac ctg cag tcc gac ttc acg ggt gag gca    1476
aat gtc cta cct gcg gat tca agg tca ctc ggt gat ctt ttc acc aag    1524
gga att atc gac cct aaa tta tct cag aaa tta att cag tt             1565
gtatgcaacc tttctcgtct gattttgatc cgtctgagga tctctccgct aatctactca  1625
ttccaaag g ttt gtt gat cat ttt ggg atc tgg atc tcg gtc gac aat     1673
cca tca gat att cat aat gag ttg aga gct aca gat ccg ctg ctc tat    1721
agt aca gct tgt ctg tta gca tct cgc tac gtc ccc ggt ata cca tta    1769
tcc gta atc cat gct atg tat ctt cag ata cgg cat gca aca gtc aat    1817
gtt ctc tgg aat aag aca ccc ctc aag cac gaa act ctt cag gct ctt    1865
gct ctt ctt gcc tta tgg cct aca gca gta caa aag gag act ccg atg    1913
gat agt tgg ttg ctg agc ggg atc tcg atc aac cac gct atc att tcc    1961
ttt gac ttt ctc aac cat gct ccg tcc gat ctt att gtg gac aat gac    2009
atg gtc gcg aaa ctc cgc gtg tgg aat gct cta tgc ctg act cag tta    2057
ca  gtatgtattc accgtattca agggtttaca cggcatttgc taagtaggcc tctag   2114
g tct gcc att gga aac gct cgc ccc ttt cac ata cag cag agg tac ctc  2163
gag cat tgt cca cga ctg ctt gag cac cca gct gct aca ttt gaa gac    2211
gga aaa att gtg gca gag atc cag tta tat ctg atc gcc cta aag ttg    2259
cag aat ttc agc cac cgt atg cgg ctg gga gac ttt gaa tac gag gaa    2307
atc gaa cgt tgg aag atg gag tgg gca cat ctc tta a gtaaataacc       2354
accgaagtct gtcacaggag gtgccctaac tgattgagca g ct  ggc gag caa cat  2409
tcg aca tta gag ctt agc ctc tgg tat tgc caa cta cta ctc  tat cga   2457
acc gca atg agg ttc cat tgg gag tcc gaa cac ctc atc tca gaa atc    2505
ctt cga aat tcg cgc ctc atc ctc tca aaa ttc cta ttg gtc cgg ttt    2553
ccg aac gca ctc gcc ttc cca gat cag ata tac tac atc gtg ggc tac    2601
gcc gcc cta aat ctc tgc gac ttt agc ccg atg gat ccg ctt atc gac    2649
caa gtc caa acc ttc ctg ctg cat ctg tca ccg aac gaa gat cac atc    2697
gcc tac cgc ttc tca tat aca atc aca gag ctc aag cgc cgc tgc gca    2745
aca ggg cct aac ccc cac aat gta gtc aaa ggt gcg ttc ggg gat act    2793
cgg aaa ctg agc atg gga cag cag ata ccc ttc atg aat cca ttg atg    2841
gat acc atg atg ggg gag tac ggt ggc tta gag cat ctc ata ccc gaa    2889
gtt cct cca aac tcc ttg ccc gac atg ctc acc agt gta gct ggt gag    2937
ctg caa gcg ttt cgt aca gcg att ctt tga tattgtcaat catacatgga      2987
attcttgcat gcaccgtgac caatacggat gcgcctcgtg tgcgaacagc cgtccgtaca  3047
gcgcggcatt aatgtattta gttatctctt tccacagcgt gaagcaggct tcacctccct  3107
gcgtcgggcg attttcaacc ctgtttttaa ctccatttcg tcaatttaat tgtgaaaccc  3167
gctctggctt cctggcgcta ggtttcattg ggtgtaatca tagacgtttt aaagtcgatc  3227
gatgcttcgt ttggaggcgt aacgactgag gtaggtagga gactttagtc gtttaggctg  3287
tagtggccat agtctttgaa tcctctttga aagccaaata ggcacgaacg tctgaacctc  3347
gatcgcaagg ggtccattgt ccaacaatga accctcgagg gtcacttggt cctcactgag  3407
atatatgtta ttcttccgcg atatacattc tactgtagca gtgctagccc tattaatcga  3467
<210>17
<211>1866
<212>DNA
<213>Aspergillus fumigatus
<220>
<221>外显子
<222>(1)..(236)
<223>
<220>
<221>外显子
<222>(237)..(638)
<223>
<220>
<221>外显子
<222>(639)..(1064)
<223>
<220>
<221>外显子
<222>(1065)..(1293)
<223>
<220>
<221>外显子
<222>(1294)..(1866)
<223>
<400>17
atg acg cgc acc act tct gtt gaa gat gtc aaa ttt gag atc ccc gcg      48
tgg gac aac tcg aat gtt gat gtc gct gac ggc agc ggc cga cca gaa      96
tcc agt acc agc ggc gac aca ata cgt cca aaa ggt cgc ata cga cga     144
tca atg acg gct tgt aat act tgt cgc aag ctg aag acc cgg tgc gat     192
tta gat cca cgc ggt cat gct tgc cgc cgc tgt ctc tcc ttg ag  g ata   240
gag tgc aag ctg cct gag aca gct gag cgc ttt caa gat aat gct tca     288
atg tgg tcg gat gcc aca gca gct att ccg tcc att gaa gag cgc ctc     336
atc tcg ctg gaa cga agt atg aca gaa atg acc agc atg atg cga cgg     384
atg atg gac cgg tca ccc agt ata tct ggc agc tcg gta tcc atg ctg     432
aca agg agt ggt atc act gat gag acc gct tcg atc gaa ggg agt caa     480
tcg tcc tcc ttc gct cct aga cct atc cgt ctc ttt cag gac ctg cag     528
tcc gac ttc acg ggt gag gca aat gtc cta cct gcg gat tca agg tca     576
ctc ggt gat ctt ttc acc aag gga att atc gac cct aaa tta tct cag     624
aaa tta att cag tt  g ttt gtt gat cat ttt ggg atc tgg atc tcg gtc   672
gac aat cca tca gat att cat aat gag ttg aga gct aca gat ccg ctg     720
ctc tat agt aca gct tgt ctg tta gca tct cgc tac gtc ccc ggt ata     768
cca tta tcc gta atc cat gct atg tat ctt cag ata cgg cat gca aca     816
gtc aat gtt ctc tgg aat aag aca ccc ctc aag cac gaa act ctt cag     864
gct ctt gct ctt ctt gcc tta tgg cct aca gca gta caa aag gag act     912
ccg atg gat agt tgg ttg ctg agc ggg atc tcg atc aac cac gct atc     960
att tcc ttt gac ttt ctc aac cat gct ccg tcc gat ctt att gtg gac    1008
aat gac atg gtc gcg aaa ctc cgc gtg tgg aat gct cta tgc ctg act    1056
cag tta ca  g tct gcc att gga aac gct cgc ccc ttt cac ata cag cag  1104
agg tac ctc gag cat tgt cca cga ctg ctt gag cac cca gct gct aca    1152
ttt gaa gac gga aaa att gtg gca gag atc cag tta tat ctg atc gcc    1200
cta aag ttg cag aat ttc agc cac cgt atg cgg ctg gga gac ttt gaa    1248
tac gag gaa atc gaa cgt tgg aag atg gag tgg gca cat ctc tta act    1296
ggc gag caa cat tcg aca tta gag ctt agc ctc tgg tat tgc caa cta    1344
cta ctc tat cga acc gca atg agg ttc cat tgg gag tcc gaa cac ctc    1392
atc tca gaa atc ctt cga aat tcg cgc ctc atc ctc tca aaa ttc cta    1440
ttg gtc cgg ttt ccg aac gca ctc gcc ttc cca gat cag ata tac tac    1488
atc gtg ggc tac gcc gcc cta aat ctc tgc gac ttt agc ccg atg gat    1536
ccg ctt atc gac caa gtc caa acc ttc ctg ctg cat ctg tca ccg aac    1584
gaa gat cac atc gcc tac cgc ttc tca tat aca atc aca gag ctc aag    1632
cgc cgc tgc gca aca ggg cct aac ccc cac aat gta gtc aaa ggt gcg    1680
ttc ggg gat act cgg aaa ctg agc atg gga cag cag ata ccc ttc atg    1728
aat cca ttg atg gat acc atg atg ggg gag tac ggt ggc tta gag cat    1776
ctc ata ccc gaa gtt cct cca aac tcc ttg ccc gac atg ctc acc agt    1824
gta gct ggt gag ctg caa gcg ttt cgt aca gcg att ctt tga            1866
<210>18
<211>621
<212>PRT
<213>Aspergillus fumigatus
<400>18
Met Thr Arg Thr Thr Ser Val Glu Asp Val Lys Phe Glu Ile Pro Ala
1               5                   10                  15
Trp Asp Asn Ser Asn Val Asp Val Ala Asp Gly Ser Gly Arg Pro Glu
            20                  25                  30
Ser Ser Thr Ser Gly Asp Thr Ile Arg Pro Lys Gly Arg Ile Arg Arg
        35                  40                  45
Ser Met Thr Ala Cys Asn Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp
    50                  55                  60
Leu Asp Pro Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile
65                  70                  75                  80
Glu Cys Lys Leu Pro Glu Thr Ala Glu Arg Phe Gln Asp Asn Ala Ser
                85                  90                  95
Met Trp Ser Asp Ala Thr Ala Ala Ile Pro Ser Ile Glu Glu Arg Leu
            100                 105                110
Ile Ser Leu Glu Arg Ser Met Thr Glu Met Thr Ser Met Met Arg Arg
        115                 120                 125
Met Met Asp Arg Ser Pro Ser Ile Ser Gly Ser Ser Val Ser Met Leu
    130                 135                 140
Thr Arg Ser Gly Ile Thr Asp Glu Thr Ala Ser Ile Glu Gly Ser Gln
145                 150                 155                 160
Ser Ser Ser Phe Ala Pro Arg Pro Ile Arg Leu Phe Gln Asp Leu Gln
                165                 170                 175
Ser Asp Phe Thr Gly Glu Ala Asn Val Leu Pro Ala Asp Ser Arg Ser
            180                 185                 190
Leu Gly Asp Leu Phe Thr Lys Gly Ile Ile Asp Pro Lys Leu Ser Gln
        195                 200                 205
Lys Leu Ile Gln Leu Phe Val Asp His Phe Gly Ile Trp Ile Ser Val
    210                 215                 220
Asp Asn Pro Ser Asp Ile His Asn Glu Leu Arg Ala Thr Asp Pro Leu
225                 230                 235                 240
Leu Tyr Ser Thr Ala Cys Leu Leu Ala Ser Arg Tyr Val Pro Gly Ile
                245                 250                 255
Pro Leu Ser Val Ile His Ala Met Tyr Leu Gln Ile Arg His Ala Thr
            260                 265                 270
Val Asn Val Leu Trp Asn Lys Thr Pro Leu Lys His Glu Thr Leu Gln
        275                 280                 285
Ala Leu Ala Leu Leu Ala Leu Trp Pro Thr Ala Val Gln Lys Glu Thr
    290                 295                 300
Pro Met Asp Ser Trp Leu Leu Ser Gly Ile Ser Ile Asn His Ala Ile
305                 310                 315                 320
Ile Ser Phe Asp Phe Leu Asn His Ala Pro Ser Asp Leu Ile Val Asp
                325                 330                 335
Asn Asp Met Val Ala Lys Leu Arg Val Trp Asn Ala Leu Cys Leu Thr
            340                 345                 350
Gln Leu Gln Ser Ala Ile Gly Asn Ala Arg Pro Phe His Ile Gln Gln
        355                 360                 365
Arg Tyr Leu Glu His Cys Pro Arg Leu Leu Glu His Pro Ala Ala Thr
    370                 375                 380
Phe Glu Asp Gly Lys Ile Val Ala Glu Ile Gln Leu Tyr Leu Ile Ala
385                 390                 395                 400
Leu Lys Leu Gln Asn Phe Ser His Arg Met Arg Leu Gly Asp Phe Glu
                405                 410                 415
Tyr Glu Glu Ile Glu Arg Trp Lys Met Glu Trp Ala His Leu Leu Thr
            420                 425                 430
Gly Glu Gln His Ser Thr Leu Glu Leu Ser Leu Trp Tyr Cys Gln Leu
        435                 440                 445
Leu Leu Tyr Arg Thr Ala Met Arg Phe His Trp Glu Ser Glu His Leu
    450                 455                 460
Ile Ser Glu Ile Leu Arg Asn Ser Arg Leu Ile Leu Ser Lys Phe Leu
465                 470                 475                 480
Leu Val Arg Phe Pro Asn Ala Leu Ala Phe Pro Asp Gln Ile Tyr Tyr
                485                 490                 495
Ile Val Gly Tyr Ala Ala Leu Asn Leu Cys Asp Phe Ser Pro Met Asp
            500                 505                 510
Pro Leu Ile Asp Gln Val Gln Thr Phe Leu Leu His Leu Ser Pro Asn
        515                 520                 525
Glu Asp His Ile Ala Tyr Arg Phe Ser Tyr Thr Ile Thr Glu Leu Lys
    530                 535                 540
Arg Arg Cys Ala Thr Gly Pro Asn Pro His Asn Val Val Lys Gly Ala
545                 550                 555                 560
Phe Gly Asp Thr Arg Lys Leu Ser Met Gly Gln Gln Ile Pro Phe Met
                565                 570                 575
Asn Pro Leu Met Asp Thr Met Met Gly Glu Tyr Gly Gly Leu Glu His
            580                 585                 590
Leu Ile Pro Glu Val Pro Pro Asn Ser Leu Pro Asp Met Leu Thr Ser
        595                 600                 605
Val Ala Gly Glu Leu Gln Ala Phe Arg Thr Ala Ile Leu
    610                 615                 620
<210>19
<211>3000
<212>DNA
<213>Penicillium chrysogenum
<220>
<221>外显子
<222>(575)..(792)
<223>
<220>
<221>内含子
<222>(793)..(890)
<223>
<220>
<221>外显子
<222>(891)..(1283)
<223>
<220>
<221>内含子
<222>(1284)..(1336)
<223>
<220>
<221>外显子
<222>(1337)..(1750)
<223>
<220>
<221>内含子
<222>(1751)..(1803)
<223>
<220>
<221>外显子
<222>(1804)..(2033)
<223>
<220>
<221>内含子
<222>(2034)..(2102)
<223>
<220>
<221>外显子
<222>(2103)..(2761)
<223>
<400>19
taagacaaac tagtcaagaa tcaaacgaaa aaggatgtac ctagtataga tcgcgccact    60
cagccccctc aaaccccctc tcctacggtt ttcgtcgggg aaatcggctc aggggggtag   120
ttaatacgac attatcaacc cctcttgaaa gtatgcaccg acaatcgcta cctttctaga   180
agccaacggg aagttgtcgg attggtggat gcatattcga ttaccccagg tccgccatgg   240
tccgctataa tccgccatga acaggatatg tatgttgtac ctgcgcggac gcttcgatat   300
cgtcagtaat cggtttcttg tcgcaattgg ctcaatctcc tcacccagcc tagtggccct   360
aatgacccgc tattataagg cttggatctc cctgatagac atgagatgat cttcaggttg   420
tttgatttgg tctttgctta agggtctaat tgttgatcag cctttccttc ctattttcca   480
acttctcaac cttcccggtc gatcaggcat agacgatccc ctaaacagta catacctcca   540
gtacacttac agtaaccatt caacctccga taca atg acg aga act ggc cct cca   595
att aat cct atc tcg tgg gac acc aag act att gtt cca gat gat ggc     643
agc aga atc gat tcg gtc gct tgc cag gat gcg agg cca aaa ggg cgc     691
atc cga cga tca atg act gct tgt cat acc tgt cgc aag ctc aag act     739
cgc tgt gat gtt gat ccc cgt ggt cat tct tgc cgt cgc tgt ttg tca     787
ctt ag  gttggtttcg cctttttatt catgtgtttg acatatcccc gatttttact      842
ctttttgaag tctcccgttt ctctatatgc tgactattgt cataaaag g ctt gac      897
tgc gag ctc ccc gag aca aca gag cgg ttc cag gac aat gca tca acc     945
tgg tct gac gcc acc gct gta ccc tcg att gag gaa cgg ctc gtc tct     993
ctc gaa cga gga atg ggg gag atg ata cat ctg atg cgg cag ata gtg    1041
aaa agc tcc ccc agc atg ccc tgc agc cca acc ttc caa act aga aac    1089
cac agc ata gat gga aca tct tca agt gat agc atg tcc tca tct ttc    1137
tat ccg ctc aag cca gcg cag ctc att cgg gac ctg caa gcc gaa tgc    1185
ttc ggc gag aga gct cac ttc tcc gat gct gac atc ctc ggg gat atc    1233
gtc acc cag ggc atc gta gat tcc aag ctt tcc gtg aag ctg att gaa    1281
ct  gtgtgtctga ttgtgtgtct gtcactggat cgccctgcta atgatctcgc cag t   1337
ttt gtc gaa cat ttc ggc cac tgg gtc tca ata aat cac tcg tcc agc    1385
ctt caa cgg tcg aat aca ctc ctt ttc aat act gca tgt ctc ctg gct    1433
tcg cgc tat atg cct ggc cta cca caa cac act gtc cgc gat atc tca    1481
ctc tat gta caa cat gcc gtc gcg aag gtg ttg tgg aag ccc ccg ccc    1529
atg aca agc gat atg ctg cag gcc ttg acc ttg ctt tgt ctc tat tcc    1577
act tct att cac aaa gaa ggc ctg atg gac gac tgg ttg ctg agc ggg    1625
atc tcg atc aac cat gcc ctc atc tct ttt aac ttt ctc aat act ttg    1673
cca gga gac aat tta agt cca gac gaa ctc ctt gct cag ttg cgt ttg    1721
tgg aat aca ctc tgt gca acc caa cta ca  gtatgtcctg cccaacaatt      1770
cgtcaggtat acaatctaac accaatccaa cag c tcc gcc ctc gca aac ggc     1822
cgc act gtc aac atc caa caa caa tac atc aac caa tgt ccc cgc atc    1870
cta gag cat gca ggt gcc aca cca gaa gac gga aga atc gtc gca gag    1918
att caa cta tac cgc atc gcc ctc cga ctc caa cac agc cag agc cgc    1966
ctc caa ttt gca gaa tct gaa tac gaa gaa ctg gag cgc tgg aga atg    2014
gag tgg gca cat ctc cta a gtacatcaac cctcccctat atgcccagcc         2063
actgcaatcc caatccaaat ctaacagcga cacccacag cc  acc aac gga gac     2116
tca act ctc aac cta aac ctc tgg ttc tgc caa ctc ctc cta cac cga    2164
acc gcc gcg cgc ctc caa cca gac age gag cgc ctc ctc cca gaa ata    2212
tgc ggc acc gcc cgc cta ata ata acc caa ttc ctt caa acg cgc ttc    2260
acg tcc gca ccc gct cta atc gac cac gtc tac ttc atc gtc ggc tac    2308
gcc gcg ctc aca ctc tgc gac tac acg ctc acc gac cca tta atc aac    2356
caa gtg cgc ggc ttc cta ctg cac ctc gcg cca ggc ggc gac aac ctc    2404
tcc tac cgg atc gcg tgt att gtc ggc gaa gtg cag cgg cgc tac tca    2452
gag gcg act gct gtt gtg gcg gcg ggg tcg cat tcg tcg tcg ccg gtt    2500
gcc gag gtc aag ggc gcg cag atg ttc ggt tca tcg cac cat cat cgt    2548
acc ggt atg gag ctc tcg cag ctg atg tct agc ccc gag ggc ttg gat    2596
tcc ctt gtt gag gga tat aat tgt ctt gag cag atg atg cct ggg tat    2644
gcg gct tcg cag cct gca ttt gag gcg ccg gat ttg ttt cat cat tct    2692
cct acg act ggt gtt act ggt ggg gct atg cct att ggt ctc gtg ccc    2740
agg gct ttg cat gat tgg tga tgaggttatg ggttggtctt ttggttctag       2791
attattggag ttggtgcatg ttgaactaat accgaggttg gatttgggat ttgggtgttg  2851
tgttatgttt ctttttactt gaggatcgta ataacaaaag tacaaatgga aatttgtcct  2911
gacttcttca actggcttct ctgtttcgtg ttgctattca tcaaagtaat atatattacc  2971
tatagctgga ttcaaattgt attaccttg                                    3000
<210>20
<211>1914
<212>DNA
<213>Penicillium chrysogenum
<220>
<221>外显子
<222>(1)..(218)
<223>
<220>
<221>外显子
<222>(219)..(611)
<223>
<220>
<221>外显子
<222>(612)..(1025)
<223>
<220>
<221>外显子
<222>(1026)..(1255)
<223>
<220>
<221>外显子
<222>(1256)..(1914)
<223>
<400>20
atg acg aga act ggc cct cca att aat cct atc tcg tgg gac acc aag      48
act att gtt cca gat gat ggc agc aga atc gat tcg gtc gct tgc cag      96
gat gcg agg cca aaa ggg cgc atc cga cga tca atg act gct tgt cat     144
acc tgt cgc aag ctc aag act cgc tgt gat gtt gat ccc cgt ggt cat     192
tct tgc cgt cgc tgt ttg tca ctt ag  g ctt gac tgc gag ctc ccc gag   240
aca aca gag cgg ttc cag gac aat gca tca acc tgg tct gac gcc acc     288
gct gta ccc tcg att gag gaa cgg ctc gtc tct ctc gaa cga gga atg     336
ggg gag atg ata cat ctg atg cgg cag ata gtg aaa agc tcc ccc agc     384
atg ccc tgc agc cca acc ttc caa act aga aac cac agc ata gat gga     432
aca tct tca agt gat agc atg tcc tca tct ttc tat ccg ctc aag cca     480
gcg cag ctc att cgg gac ctg caa gcc gaa tgc ttc ggc gag aga gct     528
cac ttc tcc gat gct gac atc ctc ggg gat atc gtc acc cag ggc atc     576
gta gat tcc aag ctt tcc gtg aag ctg att gaa ct  t ttt gtc gaa cat   624
ttc ggc cac tgg gtc tca ata aat cac tcg tcc agc ctt caa cgg tcg     672
aat aca ctc ctt ttc aat act gca tgt ctc ctg gct tcg cgc tat atg     720
cct ggc cta cca caa cac act gtc cgc gat atc tca ctc tat gta caa     768
cat gcc gtc gcg aag gtg ttg tgg aag ccc ccg ccc atg aca agc gat     816
atg ctg cag gcc ttg acc ttg ctt tgt ctc tat tcc act tct att cac     864
aaa gaa ggc ctg atg gac gac tgg ttg ctg agc ggg atc tcg atc aac     912
cat gcc ctc atc tct ttt aac ttt ctc aat act ttg cca gga gac aat     960
tta agt cca gac gaa ctc ctt gct cag ttg cgt ttg tgg aat aca ctc    1008
tgt gca acc caa cta ca  c tcc gcc ctc gca aac ggc cgc act gtc aac  1056
atc caa caa caa tac atc aac caa tgt ccc cgc atc cta gag cat gca    1104
ggt gcc aca cca gaa gac gga aga atc gtc gca gag att caa cta tac    1152
cgc atc gcc ctc cga ctc caa cac agc cag agc cgc ctc caa ttt gca    1200
gaa tct gaa tac gaa gaa ctg gag cgc tgg aga atg gag tgg gca cat    1248
ctc cta a cc  acc aac gga gac tca act ctc aac cta aac ctc tgg ttc  1296
tgc caa ctc ctc cta cac cga acc gcc gcg cgc ctc caa cca gac agc    1344
gag cgc ctc ctc cca gaa ata tgc ggc acc gcc cgc cta ata ata acc    1392
caa ttc ctt caa acg cgc ttc acg tcc gca ccc gct cta atc gac cac    1440
gtc tac ttc atc gtc ggc tac gcc gcg ctc aca ctc tgc gac tac acg    1488
ctc acc gac cca tta atc aac caa gtg cgc ggc ttc cta ctg cac ctc    1536
gcg cca ggc ggc gac aac ctc tcc tac cgg atc gcg tgt att gtc ggc    1584
gaa gtg cag cgg cgc tac tca gag gcg act gct gtt gtg gcg gcg ggg    1632
tcg cat tcg tcg tcg ccg gtt gcc gag gtc aag ggc gcg cag atg ttc    1680
ggt tca tcg cac cat cat cgt acc ggt atg gag ctc tcg cag ctg atg    1728
tct agc ccc gag ggc ttg gat tcc ctt gtt gag gga tat aat tgt ctt    1776
gag cag atg atg cct ggg tat gcg gct tcg cag cct gca ttt gag gcg    1824
ccg gat ttg ttt cat cat tct cct acg act ggt gtt act ggt ggg gct    1872
atg cct att ggt ctc gtg ccc agg gct ttg cat gat tgg tga            1914
<210>21
<211>637
<212>PRT
<213>Penicillium chrysogenum
<400>21
Met Thr Arg Thr Gly Pro Pro Ile Asn Pro Ile Ser Trp Asp Thr Lys
1               5                   10                  15
Thr Ile Val Pro Asp Asp Gly Ser Arg Ile Asp Ser Val Ala Cys Gln
            20                  25                  30
Asp Ala Arg Pro Lys Gly Arg Ile Arg Arg Ser Met Thr Ala Cys His
        35                  40                  45
Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Val Asp Pro Arg Gly His
    50                  55                  60
Ser Cys Arg Arg Cys Leu Ser Leu Arg Leu Asp Cys Glu Leu Pro Glu
65                  70                  75                  80
Thr Thr Glu Arg Phe Gln Asp Asn Ala Ser Thr Trp Ser Asp Ala Thr
                85                  90                  95
Ala Val Pro Ser Ile Glu Glu Arg Leu Val Ser Leu Glu Arg Gly Met
            100                 105                 110
Gly Glu Met Ile His Leu Met Arg Gln Ile Val Lys Ser Ser Pro Ser
        115                 120                 125
Met Pro Cys Ser Pro Thr Phe Gln Thr Arg Asn His Ser Ile Asp Gly
    130                 135                 140
Thr Ser Ser Ser Asp Ser Met Ser Ser Ser Phe Tyr Pro Leu Lys Pro
145                 150                 155                 160
Ala Gln Leu Ile Arg Asp Leu Gln Ala Glu Cys Phe Gly Glu Arg Ala
                165                 170                 175
His Phe Ser Asp Ala Asp Ile Leu Gly Asp Ile Val Thr Gln Gly Ile
            180                 185                 190
Val Asp Ser Lys Leu Ser Val Lys Leu Ile Glu Leu Phe Val Glu His
        195                 200                 205
Phe Gly His Trp Val Ser Ile Asn His Ser Ser Ser Leu Gln Arg Ser
    210                 215                 220
Asn Thr Leu Leu Phe Asn Thr Ala Cys Leu Leu Ala Ser Arg Tyr Met
225                 230                 235                 240
Pro Gly Leu Pro Gln His Thr Val Arg Asp Ile Ser Leu Tyr Val Gln
                245                 250                 255
His Ala Val Ala Lys Val Leu Trp Lys Pro Pro Pro Met Thr Ser Asp
            260                 265                 270
Met Leu Gln Ala Leu Thr Leu Leu Cys Leu Tyr Ser Thr Ser Ile His
        275                 280                 285
Lys Glu Gly Leu Met Asp Asp Trp Leu Leu Ser Gly Ile Ser Ile Asn
    290                 295                 300
His Ala Leu Ile Ser Phe Asn Phe Leu Asn Thr Leu Pro Gly Asp Asn
305                 310                 315                 320
Leu Ser Pro Asp Glu Leu Leu Ala Gln Leu Arg Leu Trp Asn Thr Leu
                325                 330                 335
Cys Ala Thr Gln Leu His Ser Ala Leu Ala Asn Gly Arg Thr Val Asn
            340                 345                 350
Ile Gln Gln Gln Tyr Ile Asn Gln Cys Pro Arg Ile Leu Glu His Ala
        355                 360                 365
Gly Ala Thr Pro Glu Asp Gly Arg Ile Val Ala Glu Ile Gln Leu Tyr
    370                 375                 380
Arg Ile Ala Leu Arg Leu Gln His Ser Gln Ser Arg Leu Gln Phe Ala
385                 390                 395                 400
Glu Ser Glu Tyr Glu Glu Leu Glu Arg Trp Arg Met Glu Trp Ala His
                405                 410                 415
Leu Leu Thr Thr Asn Gly Asp Ser Thr Leu Asn Leu Asn Leu Trp Phe
            420                 425                 430
Cys Gln Leu Leu Leu His Arg Thr Ala Ala Arg Leu Gln Pro Asp Ser
        435                 440                 445
Glu Arg Leu Leu Pro Glu Ile Cys Gly Thr Ala Arg Leu Ile Ile Thr
    450                 455                 460
Gln Phe Leu Gln Thr Arg Phe Thr Ser Ala Pro Ala Leu Ile Asp His
465                 470                 475                 480
Val Tyr Phe Ile Val Gly Tyr Ala Ala Leu Thr Leu Cys Asp Tyr Thr
                485                 490                 495
Leu Thr Asp Pro Leu Ile Asn Gln Val Arg Gly Phe Leu Leu His Leu
            500                 505                 510
Ala Pro Gly Gly Asp Asn Leu Ser Tyr Arg Ile Ala Cys Ile Val Gly
        515                 520                 525
Glu Val Gln Arg Arg Tyr Ser Glu Ala Thr Ala Val Val Ala Ala Gly
    530                 535                 540
Ser His Ser Ser Ser Pro Val Ala Glu Val Lys Gly Ala Gln Met Phe
545                 550                 555                 560
Gly Ser Ser His His His Arg Thr Gly Met Glu Leu Ser Gln Leu Met
                565                 570                 575
Ser Ser Pro Glu Gly Leu Asp Ser Leu Val Glu Gly Tyr Asn Cys Leu
            580                 585                 590
Glu Gln Met Met Pro Gly Tyr Ala Ala Ser Gln Pro Ala Phe Glu Ala
        595                 600                 605
Pro Asp Leu Phe His His Ser Pro Thr Thr Gly Val Thr Gly Gly Ala
    610                 615                 620
Met Pro Ile Gly Leu Val Pro Arg Ala Leu His Asp Trp
625                 630                 635
<210>22
<211>12
<212>PRT
<213>Aspergillus niger
<400>22
Glu Trp Ala His Leu Phe Ser Gly Glu Ser Ser Thr
1               5                   10
<210>23
<211>25
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>23
ctctgcagga attcaagcta gatgc                                       25
<210>24
<211>24
<212>DNA
<213>人工序列
<220>
<223>被设计为PCR引物以在聚合酶链式反应中产生DNA片段的寡核苷酸
<400>24
ttatgcacac ccactacata catg                                        24
<210>25
<211>42
<212>PRT
<213>Aspergillus oryzae
<220>
<221>ZN_FING
<222>(1)?(42)
<400>25
Met Thr Ala Cys Asn Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu
1               5                   10                  15
Asp Pro Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile Asp
            20                  25                  30
Cys Gln Leu Pro Glu Thr Ser Glu Arg Phe
        35                  40
<210>26
<211>42
<212>PRT
<213>Aspergillus fumigatus
<220>
<221>ZN_FING
<222>(1)?(42)
<400>26
Met Thr Ala Cys Asn Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu
1               5                   10                  15
Asp Pro Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile Glu
            20                  25                  30
 Cys Lys Leu Pro Glu Thr Ala Glu Arg Phe
         35                  40
<210>27
<211>42
<212>PRT
<213>Penicillium chrysogenum
<220>
<221>ZN_FING
<222>(1)?(42)
<400>27
Met Thr Ala Cys His Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Val
1               5                   10                  15
Asp Pro Arg Gly His Ser Cys Arg Arg Cys Leu Ser Leu Arg Leu Asp
            20                  25                    30
Cys Glu Leu Pro Glu Thr Thr Glu Arg Phe
        35                  40
PCT/RO/134表
申请人或代理人文件参考编号24295WO 国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)
A.下文说明涉及英文说明书第12页14行提到的微生物
B.保藏证明                                                    还有其它保藏记载于附页上(是)
保藏单位名称CENTRAAL BUREAU VOOR SCHIMMEL CULTURES
保藏单位地址(包括邮政编码和国家)Uppsalalaan 8P.O.Box 85167NL-3508 AD UtrechtThe Netherlands
保藏日期10-08-1988 编号CBS513.88
C.其它说明(如不适用则留空白)        该信息还有附页继续说明()
我方通知贵方,根据Rule 13bis PCT,在国家专利授权公告公开之前,上述微生物,仅可由请求人指定的专家获得样品,如果该申请被驳回、撤回或视为撤回,这条规定将从申请日起算二十年内有效。
D.说明适用的指定国家和地区(如果说明不是针对所有国家和地区的话)
E.对说明的单独补充(如不适用则留空白)
下述说明将随后提交至国际局(指明说明的常见性质,例如“保藏号”)
接收局专用()该表随国际申请收到 国际局专用(X)该表于下述日期被国际局收到:28-12-2005
负责官员 负责官员(签名)
申请人或代理人文件参考编号24295WO 国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)
A.下文说明涉及Word文档说明书第6页10行首次提到的微生物
B.保藏证明                                                    还有其它保藏记载于附页上(是)
保藏单位名称CENTRAAL BUREAU VOOR SCHIMMEL CULTURES
保藏单位地址(包括邮政编码和国家)Uppsalalaan 8P.O.Box 85167NL-3508 AD UtrechtThe Netherlands
保藏日期2005年10月10日 编号CBS118680
C.其它说明(如不适用则留空白)         该信息还有附页继续说明()
我方通知贵方,根据Rule 13bis PCT,在国家专利授权公告公开之前,上述微生物,仅可由请求人指定的专家获得样品,如果该申请被驳回、撤回或视为撤回,这条规定将从申请日起算二十年内有效。
D.说明适用的指定国家和地区(如果说明不是针对所有国家和地区的话)
E.对说明的单独补充(如不适用则留空白)
下述说明将随后提交至国际局(指明说明的常见性质,例如“保藏号”)
接收局专用()该表随国际申请收到 国际局专用(X)该表于下述日期被国际局收到:2005年12月28日
负责官员 负责官员(签名)
申请人或代理人文件参考编号24295WO 国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)
A.下文说明涉及Word文档说明书第6页11行首次提到的微生物
B.保藏证明                                                    还有其它保藏记载于附页上(是)
保藏单位名称CENTRAAL BUREAU VOOR SCHIMMEL CULTURES
保藏单位地址(包括邮政编码和国家)Uppsalalaan 8P.O.Box 85167NL-3508 AD UtrechtThe Netherlands
保藏日期2005年10月10日 编号CBS118681
C.其它说明(如不适用则留空白)         该信息还有附页继续说明()
我方通知贵方,根据Rule 13bis PCT,在国家专利授权公告公开之前,上述微生物,仅可由请求人指定的专家获得样品,如果该申请被驳回、撤回或视为撤回,这条规定将从申请日起算二十年内有效。
D.说明适用的指定国家和地区(如果说明不是针对所有国家和地区的话)
E.对说明的单独补充(如不适用则留空白)
下述说明将随后提交至国际局(指明说明的常见性质,例如“保藏号”)
接收局专用()该表随国际申请收到 国际局专用(X)该表于下述日期被国际局收到:2005年12月28日
负责官员 负责官员(签名)
申请人或代理人文件参考编号24295WO 国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)
A.下文说明涉及英文说明书第12页16行及后文提到的微生物
B.保藏证明                                                    还有其它保藏记载于附页上(是)
保藏单位名称CENTRAAL BUREAU VOOR SCHIMMEL CULTURES
保藏单位地址(包括邮政编码和国家)Uppsalalaan 8P.O.Box 85167NL-3508 AD UtrechtThe Netherlands
保藏日期02-06-1995 编号CBS455.95
C.其它说明(如不适用则留空白)         该信息还有附页继续说明()
我方通知贵方,根据Rule 13bis PCT,在国家专利授权公告公开之前,上述微生物,仅可由请求人指定的专家获得样品,如果该申请被驳回、撤回或视为撤回,这条规定将从申请日起算二十年内有效。
D.说明适用的指定国家和地区(如果说明不是针对所有国家和地区的话)
E.对说明的单独补充(如不适用则留空白)
下述说明将随后提交至国际局(指明说明的常见性质,例如“保藏号”)
接收局专用()该表随国际申请收到 国际局专用(X)该表于下述日期被国际局收到:28-12-2005
负责官员 负责官员(签名)

Claims (36)

1.具有针对蛋白酶启动子的转录活性的多肽,其中所述多肽选自如下多肽构成的组:
(a)具有下述氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ ID NO:21的氨基酸序列具有至少50%的匹配百分比,即同一性;或
(b)包含下述肽片段的多肽,所述肽片段与SEQ ID NO:22或SEQID NO:4或SEQ ID NO:25或SEQ ID NO:26或SEQ ID NO:27具有至少50%的匹配百分比,即同一性;或
(c)包含下述肽片段的多肽,所述肽片段与SEQ ID NO:22和SEQID NO:4两者,或与SEQ ID NO:22和SEQ ID NO:25两者,或与SEQID NO:22和SEQ ID NO:26两者,或与SEQ ID NO:22和SEQ IDNO:27两者均具有至少50%的匹配百分比;或
(d)具有根据(a)和(b)或(a)和(c)的氨基酸序列的多肽;或
(e)具有下述氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ ID NO:21的氨基酸序列具有至少50%的匹配百分比,即同一性,并且,所述多肽还包括下述肽片段,所述肽片段具有下述氨基酸序列:EWAHL(X)5-20ST,其中“X”代表任何氨基酸,范围5-20代表发现的“X”的数量,或者,
(f)(a)或(b)或(c)或(d)或(e)的变体。
2.如权利要求1所述的多肽,包含具有下述氨基酸序列的多肽,其中,所述匹配百分比,即同一性为至少大约60%,优选至少大约70%,更优选至少大约80%,进一步更优选至少大约90%,进一步更优选至少大约93%,进一步更优选至少大约95%,进一步更优选至少大约96%,进一步更优选至少大约97%,进一步更优选至少大约98%,进一步最优选至少大约99%。
3.如权利要求1至2中任意一项所述的多肽,其中,所述多肽具有SEQ ID NO:3或SEQ ID NO:15或SEQ ID NO:18或SEQ ID NO:21,或可通过对作为CBS118680保藏的pGBFINPRT-1中含有的prtTcDNA的表达获得的多肽或可通过对作为CBS118681保藏的pGBPRT-1中含有的prtT cDNA的表达获得的多肽。
4.如权利要求1至3中任意一项所述的多肽,其中,所述多肽从有丝真菌菌株获得。
5.如权利要求4所述的多肽,其中,所述有丝真菌细胞是Aspergillus、Fusarium、Penicillium或Trichoderma的菌株。
6.如权利要求5所述的多肽,其中,所述Aspergillus菌株是Aspergillus niger或Aspergillus oryzae或Aspergillus sojae或Aspergillusfumigatus或其各自的异名体或有性型的菌株。
7.如权利要求5所述的多肽,其中,所述Penicillium菌株是Penicillium chrysogenum或其各自的异名体或有性型的菌株。
8.编码权利要求1至7中任意一项定义的多肽的核酸序列。
9.如权利要求8所述的核酸序列,其中,核酸序列选自下述序列构成的组:
(a)一种核酸序列,其与SEQ ID NO:2或SEQ ID NO:14或SEQID NO:17或SEQ ID NO:20的核酸序列具有至少50%的匹配百分比,即同一性;或
(b)一种核酸序列,其包含下述片段,所述片段与SEQ ID NO:2的核酸序列的碱基对编号1267至碱基对编号1302构成的片段具有至少45%的匹配百分比,即同一性;或
(c)一种核酸序列,其与SEQ ID NO:2或SEQ ID NO:14或SEQID NO:17或SEQ ID NO:20的核酸序列具有至少50%的匹配百分比,即同一性,并且所述核酸序列包含(b)所定义的片段;或
(d)(a)、(b)或(c)的变体;或
(e)(a)、(b)、(c)或(d)的亚序列。
10.如权利要求9所述的核酸序列,其中,所述匹配百分比,即同一性为至少大约60%,优选至少大约70%,更优选至少大约80%,进一步更优选至少大约90%,进一步更优选至少大约93%,进一步更优选至少大约95%,进一步更优选至少大约96%,进一步更优选至少大约97%,进一步更优选至少大约98%,进一步最优选至少99%。
11.如权利要求8至10中任意一项所述的核酸序列,其具有SEQ IDNO:2或SEQ ID NO:14或SEQ ID NO:17或SEQ ID NO:20的核酸序列,或作为CBS118680保藏的质粒pGBFINPRT-1的XhoI/HindIII片段或作为CBS118681保藏的质粒pGBPRT-1中含有的prtT cDNA。
12.核酸构建体,其中包含编码权利要求1至7中任意一项所述的多肽的权利要求8至11中任意一项所述的核酸序列,所述核酸序列与一种或多种控制序列可操作地相连,所述控制序列指导在合适的表达宿主中对所述多肽的生产。
13.表达载体,其包含权利要求12的核酸构建体、启动子、转录和翻译终止信号。
14.宿主细胞,其包含权利要求12的核酸构建体或权利要求13的表达载体。
15.可用于生产多肽的真菌宿主细胞,其中所述细胞:
a)是亲本真菌细胞的突变体,其中,所述亲本细胞包含编码蛋白酶的一种或多种DNA序列,所述序列的转录受权利要求8至11中任意一项的核酸序列编码的转录活化因子的激活;以及
b)同样条件下培养时较之所述亲本细胞产生较少的所述转录活化因子和/或蛋白酶。
16.如权利要求15所述的宿主细胞,其中,通过对细胞中存在的、对所述转录活化因子的表达来说必要的核酸序列加以修饰或失活,来获得对所述转录活化因子和/或蛋白酶的减少的生产。
17.如权利要求15或16所述的宿主细胞,其中,通过对所述转录活化因子的表达必需的控制序列加以修饰或失活,来获得对所述转录活化因子和/或蛋白酶的减少的生产。
18.如权利要求17所述的宿主细胞,其中,所述控制序列是启动子序列或其功能性部分。
19.如权利要求15至18中任意一项所述的宿主细胞,其中,待被修饰或失活的所述核酸序列是权利要求8至11中任意一项所定义的序列。
20.如权利要求15至19中任意一项所述的宿主细胞,其中,所述修饰或失活通过下述方法来进行:特异性或随机诱变、定点诱变、PCR产生的诱变、核苷酸插入和/或缺失和/或取代、基因打断或基因置换技术,反义技术、RNAi技术或其组合。
21.可用于生产多肽的真菌宿主细胞,其中,所述宿主细胞是亲本细胞的突变体,其中,所述突变体
(a)在同样的条件下培养时,较之所述亲本细胞,生产更多的由权利要求8至11中任意一项的核酸序列编码的转录活化因子;以及
(b)包含编码所述多肽的DNA序列,所述该序列的转录由所述转录活化因子激活。
22.如权利要求21所述的宿主细胞,其中,在同样的条件下培养时,所述宿主细胞较之所述亲本细胞生产更多的所述转录活化因子,这是通过向所述亲本细胞中引入一个或多个拷贝的下述物质来实现的:
(i)权利要求8至11中任意一项的核酸序列,
(ii)权利要求12的核酸构建体,或
(iii)权利要求13的表达载体。
23.如权利要求21或22所述的宿主细胞,其中,编码所述转录活化因子的核酸序列与比所述亲本细胞的相应启动子更强的启动子可操作地相连。
24.如权利要求21至23中任意一项所述的宿主细胞,可用于生产下述多肽,所述多肽是细胞外蛋白酶,优选是Aspergillus oryzae碱性蛋白酶、A.oryzae中性金属蛋白酶或A.niger曲霉蛋白酶。
25.可用于生产多肽的真菌宿主细胞,其中,所述宿主细胞是亲本细胞的突变体,其中,所述突变体包含:
a)对由权利要求8至11中任意一项所述的天然核酸序列编码的转录活化因子或其调控序列的修饰或失活,以及
b)(i)与权利要求8至11中任意一项所述的核酸序列可操作地相连的可诱导启动子,以及(ii)可与由权利要求8至11中任意一项所述的核酸序列编码的转录活化因子结合的启动子序列,其与编码所述多肽的核酸序列可操作地相连,其中,(i)和(ii)可被同时或顺序引入。
26.如权利要求25所述的宿主细胞,其中,通过特异性或随机诱变、定点诱变、PCR产生的诱变、核苷酸插入和/或缺失和/或取代、基因打断或基因置换技术,反义技术、RNAi技术或其组合对所述天然核酸序列或其调控序列加以修饰或失活。
27.如权利要求25或26所述的宿主细胞,其中,所述可诱导的启动子选自其中诱导被碳或氮分解代谢产物介导的组。
28.如权利要求21至27中任意一项所述的宿主细胞,其还包含下述启动子序列,其中,所述启动子序列可被所述转录活化因子激活,并且与编码所述多肽的所述核酸序列可操作地相连。
29.如权利要求28所述的宿主细胞,其中所述启动子序列或其功能性部分来自蛋白酶基因。
30.如权利要求29所述的宿主细胞,其中,所述蛋白酶基因是Fusarium oxysporum胰蛋白酶类似蛋白酶基因、Aspergillus oryzae碱性蛋白酶基因、Aspergillus niger pacA基因、Aspegillus oryzae碱性蛋白酶基因、A.oryzae中性金属蛋白酶基因、A.niger曲霉蛋白酶基因、或F.venenatum胰蛋白酶基因。
31.如权利要求15至30中任意一项所述的宿主细胞,其中所述宿主细胞包含编码所述多肽的核酸序列的至少一个拷贝。
32.如权利要求15至20中任意一项所述的宿主细胞,其中,在同样的条件下培养时,所述宿主细胞较之所述亲本细胞生产更少的天然蛋白酶或天然蛋白酶的组合。
33.如权利要求15至32中任意一项所述的宿主细胞,其中,所述蛋白酶的活性是通过使用牛血清清蛋白(BSA)作为底物的蛋白酶活性来检验的。
34.一种生产多肽的方法,其包括:
(a)在适合生产所述多肽的营养培养基中,培养权利要求15至33中任意一项所述的宿主细胞,其中所述宿主细胞具有编码所述多肽的基因,以及,可选地;
(b)从所述突变体细胞的所述营养培养基中回收所述的多肽。
35.如权利要求34所述的方法,其中所述多肽是亲本细胞天然的。
36.如权利要求34所述的方法,其中所述多肽是与亲本细胞异源的。
CN200580034648.XA 2004-10-12 2005-10-11 在生产多肽的方法中有用的真菌转录活化因子 Expired - Fee Related CN101094919B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04105001 2004-10-12
EP04105001.4 2004-10-12
PCT/EP2005/055145 WO2006040312A2 (en) 2004-10-12 2005-10-11 Fungal transcriptional activators useful in methods for producing a polypeptide

Publications (2)

Publication Number Publication Date
CN101094919A true CN101094919A (zh) 2007-12-26
CN101094919B CN101094919B (zh) 2014-09-03

Family

ID=36013377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580034648.XA Expired - Fee Related CN101094919B (zh) 2004-10-12 2005-10-11 在生产多肽的方法中有用的真菌转录活化因子

Country Status (4)

Country Link
US (2) US7794974B2 (zh)
EP (1) EP1799827A2 (zh)
CN (1) CN101094919B (zh)
WO (1) WO2006040312A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110358781A (zh) * 2019-07-31 2019-10-22 湖北大学 一种酸性哺乳动物几丁质酶编码基因和应用

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006040312A2 (en) * 2004-10-12 2006-04-20 Dsm Ip Assets B.V. Fungal transcriptional activators useful in methods for producing a polypeptide
EP1954812B1 (en) 2005-11-29 2012-11-21 DSM IP Assets B.V. Dna binding site of a transcriptional activator useful in gene expression
JP5250850B2 (ja) 2006-06-29 2013-07-31 ディーエスエム アイピー アセッツ ビー.ブイ. 改善されたポリペプチド発現を達成する方法
EP2406386B1 (en) 2009-03-10 2019-01-23 DSM IP Assets B.V. Method for improving the yield of a polypeptide
CA2768608A1 (en) 2009-07-22 2011-01-27 Dsm Ip Assets B.V. Improved host cell for the production of a compound of interest
EP2531590A2 (en) 2010-02-04 2012-12-12 DSM IP Assets B.V. Process for preparing filamentous fungal strains having a sexual cycle and a process for preparing sexually crossed filamentous fungal strains
FI20105634A0 (fi) * 2010-06-04 2010-06-04 Valtion Teknillinen Proteiinien parannettu tuotto rihmamaisilla sienillä
US8945898B2 (en) 2010-07-01 2015-02-03 Dsm Ip Assets B.V. Recombinant host cell with deficiency in non-ribosomal peptide synthase production
WO2012123429A1 (en) 2011-03-11 2012-09-20 Dsm Ip Assets B.V. Vector-host system
EP2760997A4 (en) 2011-09-30 2015-02-11 Codexis Inc MUSHROOM PROTEASE
BR112014016587A2 (pt) 2012-01-05 2020-10-27 Novartis Ag células fúngicas filamentosas deficientes de protease e métodos de uso das mesmas
EP2852610B1 (en) 2012-05-23 2018-07-11 Glykos Finland Oy Production of fucosylated glycoproteins
EP2875119B1 (en) 2012-07-19 2017-12-20 DSM IP Assets B.V. Agse-deficient strain
CN104640990B (zh) 2012-09-19 2017-12-26 帝斯曼知识产权资产管理有限公司 使用必需基因作为标记并任选地将其再循环的细胞修饰方法
PL3686280T3 (pl) 2013-02-04 2022-09-19 Dsm Ip Assets B.V. Polipeptyd degradujący węglowodany i jego zastosowania
WO2014202624A2 (en) 2013-06-19 2014-12-24 Dsm Ip Assets B.V. Rasamsonia gene and use thereof
WO2014202622A2 (en) 2013-06-19 2014-12-24 Dsm Ip Assets B.V. Rasamsonia gene and use thereof
WO2014202620A2 (en) 2013-06-19 2014-12-24 Dsm Ip Assets B.V. Rasamsonia gene and use thereof
WO2014202621A1 (en) 2013-06-20 2014-12-24 Dsm Ip Assets B.V. Carbohydrate degrading polypeptide and uses thereof
CA2916905A1 (en) 2013-07-10 2015-01-15 Novartis Ag Multiple proteases deficient filamentous fungal cells and methods of use thereof
EP3077517B1 (en) 2013-12-02 2018-10-17 DSM IP Assets B.V. Ice structuring protein
SG11201700446XA (en) 2014-07-21 2017-02-27 Glykos Finland Oy Production of glycoproteins with mammalian-like n-glycans in filamentous fungi
EP3242950B1 (en) 2015-01-06 2021-10-06 DSM IP Assets B.V. A crispr-cas system for a filamentous fungal host cell
AU2016221605B2 (en) 2015-02-20 2019-12-05 Roal Oy Methods for controlling protease production
EP3302076A1 (en) 2015-06-02 2018-04-11 DSM IP Assets B.V. Use of ice structuring protein afp19 expressed in filamentous fungal strains for preparing food
US20180215797A1 (en) * 2015-08-13 2018-08-02 Glykos Finland Oy Regulatory Protein Deficient Trichoderma Cells and Methods of Use Thereof
US10913938B2 (en) 2016-07-29 2021-02-09 Dsm Ip Assets B.V. Polypeptides having cellulolytic enhancing activity and uses thereof
CA3046153A1 (en) 2016-12-21 2018-06-28 Dsm Ip Assets B.V. Lipolytic enzyme variants
WO2018114912A1 (en) 2016-12-21 2018-06-28 Dsm Ip Assets B.V. Lipolytic enzyme variants
EP3559222A1 (en) 2016-12-21 2019-10-30 DSM IP Assets B.V. Lipolytic enzyme variants
WO2018114938A1 (en) 2016-12-21 2018-06-28 Dsm Ip Assets B.V. Lipolytic enzyme variants
US20200063166A1 (en) 2017-03-13 2020-02-27 Dsm Ip Assets B.V. Zinc binuclear cluster transcriptional regulator-deficient strain
BR112020025589A2 (pt) 2018-06-19 2021-03-23 Dsm Ip Assets B.V. variantes de enzima lipolítica
US20220389458A1 (en) 2019-11-04 2022-12-08 Dsm Ip Assets B.V. Low volume transfection
US20230212634A1 (en) 2020-01-14 2023-07-06 The Protein Brewery B.V. Expression of Ovalbumin and its Natural Variants
WO2023222614A1 (en) 2022-05-16 2023-11-23 Dsm Ip Assets B.V. Lipolytic enzyme variants
WO2023242273A1 (en) 2022-06-14 2023-12-21 Newmilkbuzz B.V. Expression of milk caseins in filamentous fungi

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0909273B1 (en) * 1996-07-05 2005-10-26 Novozymes A/S Alpha-amylase transcription factor
US6806062B1 (en) * 1998-10-05 2004-10-19 Novozymes A/S Fungal transcriptional activator useful in methods for producing polypeptides
DE69934596T2 (de) * 1998-10-05 2007-10-04 Novozymes A/S Transkriptionsaktivator prtt aus dem pilz aspergillus niger verwendbar in verfahren zur herstellung von polypeptiden
CN102174535B (zh) * 2000-03-14 2014-04-09 诺维信公司 在制备多肽的方法中有效的真菌转录激活因子
CN100547078C (zh) * 2003-03-31 2009-10-07 诺维信股份有限公司 在缺乏酶的黑曲霉突变体中生产生物物质的方法
WO2006040312A2 (en) * 2004-10-12 2006-04-20 Dsm Ip Assets B.V. Fungal transcriptional activators useful in methods for producing a polypeptide

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110358781A (zh) * 2019-07-31 2019-10-22 湖北大学 一种酸性哺乳动物几丁质酶编码基因和应用
CN110358781B (zh) * 2019-07-31 2022-01-28 湖北大学 一种酸性哺乳动物几丁质酶编码基因和应用

Also Published As

Publication number Publication date
US20080108105A1 (en) 2008-05-08
CN101094919B (zh) 2014-09-03
WO2006040312A3 (en) 2006-07-27
EP1799827A2 (en) 2007-06-27
US20110165656A1 (en) 2011-07-07
US8642290B2 (en) 2014-02-04
US7794974B2 (en) 2010-09-14
WO2006040312A2 (en) 2006-04-20

Similar Documents

Publication Publication Date Title
CN101094919B (zh) 在生产多肽的方法中有用的真菌转录活化因子
US9657301B2 (en) Filamentous fungal mutants with improved homologous recombination efficiency
CN101146820B (zh) 通过提高的分泌来生产多肽的方法
EP1266011B1 (en) Fungal transcriptional activator useful in methods for producing polypeptides
CN101454455A (zh) 在基因表达中有用的转录激活因子的dna结合位点
CN103459600A (zh) 用于生产感兴趣的化合物的方法
JP2007532124A (ja) 真菌細胞において遺伝子を発現させるための真菌プロモーター
US20080070277A1 (en) Homologous Amds Genes as Selectable Marker
US20130189733A1 (en) Production of secreted proteins by filamentous fungi
US8415119B2 (en) Method for increasing expression yield of a protein of interest
US8017341B2 (en) Transcription factors
CN101198697A (zh) 作为选择性标记的同源amds基因
CN101248181A (zh) 用于在真菌细胞中表达基因的曲霉启动子

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140903

Termination date: 20191011