CN1969041A - 用于生产多肽的信号肽 - Google Patents

用于生产多肽的信号肽 Download PDF

Info

Publication number
CN1969041A
CN1969041A CNA2005800195723A CN200580019572A CN1969041A CN 1969041 A CN1969041 A CN 1969041A CN A2005800195723 A CNA2005800195723 A CN A2005800195723A CN 200580019572 A CN200580019572 A CN 200580019572A CN 1969041 A CN1969041 A CN 1969041A
Authority
CN
China
Prior art keywords
nucleotide sequence
ala
polypeptide
ser
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800195723A
Other languages
English (en)
Other versions
CN1969041B (zh
Inventor
松井知子
亨丽埃特·德拉伯格
斯特芬·丹尼尔森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1969041A publication Critical patent/CN1969041A/zh
Application granted granted Critical
Publication of CN1969041B publication Critical patent/CN1969041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/036Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及包括使用信号肽生产多肽的方法,涉及含有编码信号肽的第一核苷酸序列和相对于第一核苷酸序列是外源的编码多肽的第二核苷酸序列。另外,还涉及含有所述核酸构建体的表达载体和宿主细胞。

Description

用于生产多肽的信号肽
发明领域
本发明涉及生产多肽的方法,包括使用相对于该多肽为外源的信号肽,含有编码该信号肽和该多肽的第一和第二核苷酸序列的核酸构建体和含有所述核酸构建体的表达载体和宿主细胞。
发明背景
在真菌宿主细胞,特别是诸如曲霉属(Aspergillus)的丝状真菌细胞或诸如酵母属(Saccharomyces)的酵母细胞中重组生产异源蛋白可提供更合适的载体用于以商品相应量生产该蛋白。
重组生产异源性蛋白一般通过构建表达盒实现,其中将编码该蛋白的DNA置于从适合于该宿主细胞的调控基因切下的启动子表达控制下。将该表达盒导入宿主细胞中。然后通过在表达盒所含的启动子正常发挥功能所必需的诱导条件下培养转化的宿主细胞实现该异源蛋白的生产。
改进蛋白质的重组生产一般需要获得适合于控制蛋白质在宿主细胞中表达的新调控序列。
本发明的目的是使用信号肽序列提供在真菌宿主细胞中生产多肽的改进方法。
本发明的概述
本发明提供了生产分泌多肽的方法,包括:
(a)在有助于多肽生产的培养基中培养真菌宿主细胞,其中该宿主细胞包含核酸构建体,该核酸构建体包含与编码该多肽的第二核苷酸序列可操作地相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列相对于第二核苷酸序列是外源的,第一核苷酸序列的3′端紧接着第二核苷酸序列的上游,且第一核苷酸序列选自如下组成的组中:
(i)编码具有与SEQ ID NO:1有至少70%同一性的氨基酸序列的信号肽的核苷酸序列;
(ii)与SEQ ID NO:2具有至少70%同源性的核苷酸序列;和
(iii)在严格条件下与SEQ ID NO:2的核苷酸,或其互补链杂交的核苷酸序列,其中严格条件定义为在低于计算的Tm 5℃至10℃的0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP,和每ml 0.2mg酵母RNA中进行预杂交、杂交和杂交后洗涤,并在低于计算的Tm 5℃至10℃下,在加0.1%SDS的6X SCC中洗涤15分钟一次,使用6X SSC洗涤两次各15分钟;和
(b)从培养基中分离分泌的多肽。
另外,本发明提供了含有与编码多肽的第二核苷酸序列可操作地相连的编码信号肽的第一核苷酸序列的核酸构建体,其中第一核苷酸序列相对于第二核苷酸序列是外源的,第一核苷酸序列的3′端紧接着第二核苷酸序列的上游,且第一核苷酸序列选自如下组成的组中:
(i)编码具有与SEQ ID NO:1有至少70%同一性的氨基酸序列的信号肽的核苷酸序列;
(ii)与SEQ ID NO:2具有至少70%同源性的核苷酸序列;和
(iii)在严格条件下与SEQ ID NO:2的核苷酸,或其互补链杂交的核苷酸序列,其中严格条件定义为预杂交,杂交,和杂交后洗涤,其是在低于计算的Tm 5℃至10℃的0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP,和每ml 0.2mg酵母RNA中进行,并在加0.1%SDS的6X SCC中洗涤15分钟一次和使用6X SSC洗涤两次各15分钟,其是在低于计算的Tm 5℃至10℃下进行。
本发明还提供了含有所述核酸构建体的表达载体和宿主细胞。
本发明的详细描述
定义
术语“变异体”当用于与另一多肽或核苷酸序列对照时在本发明的上下文中应理解为与另一多肽相比包含一个或多个氨基酸或核苷酸的取代,缺失,和/或插入的多肽或核苷酸序列(即,它是与其比较的多肽/核苷酸序列的变异体)。具体地说,该改变可以属于次要性质,例如不会明显影响多肽活性的保守氨基酸取代或导致保守氨基酸取代的核苷酸序列改变;或者依赖于发生该改变的多肽大小,一般1到大约20个氨基酸的小缺失。
保守取代的例子是在碱性氨基酸(精氨酸,赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),极性氨基酸(谷氨酰胺和天冬酰胺),疏水氨基酸(亮氨酸,异亮氨酸和缬氨酸),芳香氨基酸(苯丙氨酸,色氨酸和酪氨酸),和小氨基酸(甘氨酸,丙氨酸,丝氨酸,苏氨酸和甲硫氨酸)的组内。一般不会改变特异性活性的氨基酸取代是本领域已知的且参见,例如,H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,New York。最常见的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu,和Asp/Gly及其反向交换。
本发明的方法
本发明涉及生产分泌多肽的方法,包括:(a)在有助于多肽生产的培养基中培养真菌宿主细胞,其中该宿主细胞包含核酸构建体,该核酸构建体包含与编码该多肽的第二核苷酸序列可操作地相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列相对于第二核苷酸序列是外源的,第一核苷酸序列的3′端紧接着第二核苷酸序列的上游,且第一核苷酸序列选自如下组成的组中:(i)编码具有与SEQ ID NO:1有至少70%同一性的氨基酸序列的信号肽的核苷酸序列;(ii)与SEQ ID NO:2具有至少70%同源性的核苷酸序列;和(iii)在严格条件下与SEQ ID NO:2的核苷酸,或其互补链杂交的核苷酸序列,其中严格条件定义为在低于计算的Tm 5℃至10℃的0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP,和每ml 0.2mg酵母RNA中预杂交、杂交和杂交后洗涤,并在低于计算的Tm 5℃至10℃下,在加0.1%SDS的6X SCC中洗涤15分钟一次和使用6X SSC洗涤两次各15分钟;和(b)从培养基中分离分泌的多肽。
在本发明的方法中,真菌宿主细胞在有助于生产该多肽的培养基,即,在适合于使用本领域已知的方法生产该多肽的营养培养基中培养。例如,可通过在合适的培养基中和在允许表达和/或分离该多肽的条件下进行摇瓶培养,或在实验室或工业发酵罐中小规模或大规模发酵(包括连续,分批,补料分批,或固态发酵)来培养该细胞。培养可在包含碳和氮源和无机盐的合适营养培养基中使用本领域已知的方法进行。合适的培养基可从商品供应商获得或者可根据公开的配方(例如,参见美国典型培养物保藏中心的产品目录)制备。
使用对该多肽具有特异性的本领域已知的方法可检测该多肽。该检测方法可包括使用特异性抗体,酶产物的形成,或酶底物的消失。
在本发明的方法中,该真菌宿主细胞相对于含有与编码该多肽的核苷酸序列可操作地相连的天然信号肽序列的真菌细胞在相同生产条件下培养时生产具体地说多至少大约25%,更具体地说多至少大约50%,更具体地说多至少大约75%,更具体地说多至少大约100%,甚至更具体地说多至少大约200%,最具体地说多至少大约300%,且甚至最具体地说多至少大约400%的多肽。
所得的分泌多肽可通过本领域已知的方法从培养基中直接回收。例如,该多肽可通过包括,但不限于,离心,过滤,提取,喷雾干燥,蒸发,或沉淀的常规方法从营养培养基中回收。
该多肽可通过本领域已知的各种方法纯化,包括,但不限于,色谱法(例如,离子交换,亲和,疏水,色谱聚焦,和大小排阻),电泳方法(例如,制备型等电聚焦),差别溶解度(例如,硫酸铵沉淀),SDS-PAGE,或提取(参见,例如,Protein Purification,J.-C.Janson and Lars Ryden,editors,VCHPublishers,New York,1989)。
信号肽
本发明的第一核苷酸序列编码本发明的信号肽。术语“信号肽”或“信号肽序列”在此定义为通常存在于新合成的分泌型或膜多肽N-末端的肽序列,它指导该多肽通过或者进入该细胞的细胞膜(原核生物的质膜和真核生物的内质网膜)。它通常在随后被去掉。具体地说,该信号肽能够指导该多肽进入细胞的分泌途径。
术语“可操作地相连”在此定义为这样一种结构,即其中调控序列,例如信号肽序列,相对于编码序列放在合适的位置上,使得该调控序列指导生产由该编码序列编码的多肽。
术语“编码序列”在此定义为当放在合适的调控序列控制下时翻译成多肽的核苷酸序列。编码序列的边界一般由位于阅读框开始(5’端)的起始密码子和位于阅读框3’端的终止密码子确定。编码序列可包括,但不限于,基因组DNA,cDNA,RNA,半合成,合成,和重组核苷酸序列。
本发明的多肽的编码序列5’端可含有与编码该多肽的成熟(或前体形式)的核苷酸序列片断天然相连的编码信号肽的天然核苷酸序列。在这种情况下本发明的信号肽可取代该天然信号肽。作为选择,本发明的多肽可没有天然信号肽。在本文中,术语“天然”试图理解为天然存在。
在本发明的方法中,该信号肽相对于编码目的多肽的核苷酸序列是外源的,但是该信号肽序列或核苷酸序列相对于该真菌宿主细胞可以是天然的。在本文中,术语“外源”试图理解为该信号肽相对于该多肽不是天然的,即,它来源于异于该多肽的另一基因。
在一个实施方案中,第一核苷酸序列编码具有与SEQ ID NO:1有至少70%,具体地说至少大约75%,更具体地说至少大约80%,更具体地说至少大约85%,甚至更具体地说至少大约90%,最具体地说至少大约95%,且甚至最具体地说至少大约97%同一性的氨基酸序列的信号肽,它具有指导多肽进入或通过细胞膜,例如进入细胞的分泌途径的能力(下文称为“同源信号肽”)。在一个具体方面中,该同源信号肽具有与SEQ ID NO:1有5个氨基酸,具体地说4个氨基酸,更具体地说3个氨基酸,甚至更具体地说2个氨基酸,且最具体地说1个氨基酸的差别的氨基酸序列。为达到本发明的目的,两个氨基酸序列之间的同一性或同一性程度可通过Clustal方法(Higgins,1989,CABIOS 5:151-153)使用LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)用同一性表(identity table)和下列多序列对比参数:缺口罚分(gap penalty)为10和缺口长度罚分(gap length penalty)为10来确定。逐对序列对比参数为Ktuple=1,缺口罚分=3,窗口(windows)=5,且对角线(diagonals)=5。
具体地说,第一核苷酸序列可编码信号肽,其包含SEQ ID NO:1的氨基酸序列,或其等位变异体;或其具有指导该多肽进入或通过细胞膜,例如,进入细胞分泌途径的能力的片断。在更具体的一个方面中,本发明的第一核苷酸序列编码包含SEQ ID NO:1的氨基酸序列的信号肽。在另一具体的方面,第一核苷酸序列编码由SEQ ID NO:1的氨基酸序列或其片断组成的信号肽,其中该信号肽片断具有指导多肽进入或通过细胞膜,例如,进入细胞分泌途径的能力。在另一更具体的方面中,本发明的核苷酸序列编码由SEQID NO:1的氨基酸序列组成的信号肽。
本发明还包含这样的第一核苷酸序列,它编码具有SEQ ID NO:1的氨基酸序列的信号肽,且它由于遗传密码的简并性而不同于SEQ ID NO:2。本发明还涉及编码具有指导多肽进入或通过细胞膜,例如,进入细胞分泌途径的能力的SEQ ID NO:1的片断的SEQ ID NO:2的子序列或片断。
SEQ ID NO:2的子序列是SEQ ID NO:2包含的核酸序列,除了从5’和/或3’端删除了一个或多个核苷酸。具体地说,子序列含有至少30个核苷酸,例如至少35个核苷酸或至少40个核苷酸或至少45个核苷酸或至少50个核苷酸或至少52个核苷酸或至少53个核苷酸。SEQ ID NO:1的片断是从该氨基酸序列的氨基和/或羧基末端删除了一个或多个氨基酸的多肽。具体地说,一个片断含有至少10个氨基酸残基,例如至少12个氨基酸残基或至少13个氨基酸残基或至少14个氨基酸残基或至少15个氨基酸残基或至少16个氨基酸残基或至少17个氨基酸残基。具体地说,如果第一和第二核苷酸序列在酵母宿主细胞中表达时,该信号肽可含有SEQ ID NO:1的氨基酸残基1-16,因为本发明的发明人观察到在酵母中该信号肽在氨基酸残基16和17之间被切割(在AA↓LP),而如果该宿主细胞是丝状真菌,该信号肽具体可包含SEQ IDNO:1的18个氨基酸残基,因为本发明的发明人观察到在米曲霉(Aspergillusoryzae)中该信号肽的切割发生在SEQ ID NO:1的氨基酸残基18后。这表明在酵母和丝状真菌之间,被识别为信号序列切割的切割位点的序列可能不同。
等位基因变异体表示占据相同染色体基因座的基因的两种或多种任选形式中的任一种。等位基因变异由突变天然产生,且可导致群体内的多态性。基因突变可以是沉默的(在编码的信号肽中无改变)或者可编码有氨基酸序列改变的信号肽。信号肽的等位基因变异体是由基因的等位基因变异体编码的肽。
在一个具体方面,第一核苷酸序列是Humicola insolens DSM 1800中所含的角质酶(cutinase)基因的信号肽编码序列(SEQ ID NO:1)。
在第二个方面,编码信号肽的本发明的第一核苷酸序列与SEQ ID NO:2具有至少大约70%的同源性程度,具体地说至少大约75%,更具体地说至少大约80%,更具体地说至少大约85%,甚至更具体地说至少大约90%的同源性,最具体地说至少大约95%的同源性,且甚至最具体地说至少大约97%的同源性,其编码信号肽;或等位基因变异体和编码具有指导多肽进入或通过细胞膜,例如,进入细胞分泌途径的能力的信号肽片断的SEQ IDNO:2的子序列。为了达到本发明的目的,两个核酸序列之间的同源性程度可通过Wilbur-Lipman方法(Wilbur和Lipman,1983,Proceedings of theNational Academy of Science USA 80:726-730)使用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)用同一性表和下列多序列对比参数:缺口罚分为10且缺口长度罚分为10来测定。逐对序列对比参数为Ktuple=3,缺口罚分=3,且窗口=20。
在第三个方面,本发明的第一核苷酸序列编码信号肽,其中所述的第一核苷酸序列在严格条件下与SEQ ID NO:2,或其互补链的核苷酸杂交(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,Molecular Cloning,A LaboratoryManual,第2版,纽约冷泉港)。
SEQ ID NO:2的核苷酸序列或其子序列,以及SEQ ID NO:1的氨基酸序列或其片断可用于设计核酸探针以便根据本领域熟知的方法从不同属或种的菌株鉴定和克隆编码信号肽的DNA。具体地说,该探针可用于按标准Southern印迹方法与感兴趣的属或种的基因组或cDNA杂交,以便鉴定和分离其中的相应基因。该探针可以比完整序列短很多,但可以具体地说长至少15,例如至少25,或更具体地说至少35个核苷酸。DNA和RNA探针都可使用。一般可标记该探针用于检测相应的基因(例如,用32P,3H,35S,生物素,或抗生物素蛋白)。本发明包含该探针。
因此,可筛选从其它生物制备的基因组DNA或cDNA文库中与上述探针杂交且编码信号肽的DNA。可通过琼脂糖或聚丙烯酰胺凝胶电泳,或其它分离技术分离其它生物的基因组或其它DNA。文库DNA或分离的DNA可转移到并固定在硝酸纤维素或其它合适的载体材料上。为了鉴定与SEQ IDNO:2或其子序列同源的克隆或DNA,该载体材料可用于Southern印迹。为了达到本发明的目的,杂交表示该核酸序列在本文定义的严格条件下与相应于SEQ ID NO:2所示的核酸序列,其互补链,或其子序列的标记核酸探针杂交。使用X-射线胶片可检测在这些条件下核酸探针与其杂交的分子。
在一个具体的方面中,该核酸探针是编码SEQ ID NO:1的信号肽,或其子序列的核苷酸序列。在另一具体的方面,该核酸探针是SEQ ID NO:2。在另一具体方面,该核酸探针是Humicola insolens DSM 1800所含的角质酶基因的信号肽序列(WO 96/13580中的SEQ ID NO:2)。
对于长度大约15个核苷酸到大约60个核苷酸的短探针,严格条件定义为:按照标准Southern印迹方法,在低于根据Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 48:1390)的算法计算的Tm 5℃至10℃下,在0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP和每ml 0.2mg酵母RNA中进行预杂交,杂交,和杂交后洗涤。
对于长度为大约15个核苷酸到大约60个核苷酸的短探针,该载体材料在低于计算的Tm 5℃至10℃下,在加0.1%SDS的6X SCC中洗涤15分钟一次并使用6X SSC洗涤两次各15分钟。
在第四方面,第一核苷酸序列可编码包含一个或多个氨基酸的取代,缺失,和/或插入的具有SEQ ID NO:1的氨基酸序列的信号肽的变异体。
该变异体信号肽的氨基酸序列与SEQ ID NO:1的氨基酸序列区别可在于一个或多个氨基酸残基的插入或缺失和/或用不同氨基酸残基取代一个或多个氨基酸残基。具体地说,氨基酸改变可以属于次要性质,例如不会明显影响信号肽活性的保守氨基酸取代;或者一般1到大约5个氨基酸的小缺失。
保守取代的例子是在碱性氨基酸(精氨酸,赖氨酸和组氨酸),酸性氨基酸(谷氨酸和天冬氨酸),极性氨基酸(谷氨酰胺和天冬酰胺),疏水氨基酸(亮氨酸,异亮氨酸和缬氨酸),芳香氨基酸(苯丙氨酸,色氨酸和酪氨酸),和小氨基酸(甘氨酸,丙氨酸,丝氨酸,苏氨酸和甲硫氨酸)的组内。一般不会改变特异性活性的氨基酸取代是本领域已知的且参见,例如,H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,New York。最常见的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu,和Asp/Gly及其反向交换。
多肽
本发明的第二核苷酸序列编码本发明编码的多肽。所述的多肽相对于生产它的真菌宿主细胞可以是天然的或异源的。
术语“多肽”本文不是指特定长度的编码产物,因此,它包含肽,寡肽,和蛋白质。术语“异源多肽”在此定义为不是该真菌细胞天然的多肽,进行了修饰以改变天然序列的天然多肽,或由于通过重组DNA技术改造编码该多肽的基因而定量改变其表达的天然多肽。真菌细胞可含有一个或多个拷贝的编码该多肽的核苷酸序列。
具体地说,该多肽可以是激素或激素变异体,酶,受体或其部分,抗体或其部分,过敏原或报道分子。在一个具体方面,该多肽可以是来自Dermatophagoides pteronyssinus,Dermatophagoides farinae,Dermatophagoides siboney,Dermatophagoides microceaus,Blomia tropicalis和Euroglyphus maynei的过敏原,或后来被修饰的一种所述生物的过敏原。更具体地说,所述过敏原可以是Der p 1,例如,来自Dermantophagoidespteronyssinus的Der p 1(SEQ ID NO:3)。具体地说,该多肽可以是SEQ ID NO:3中氨基酸19-320的序列。在一个更具体的实施方案中,该多肽可以是SEQID NO:3的氨基酸19-320的多肽序列的变异体。更具体地说,该变异体可以是S54X或N52X,其中“X”表示任何氨基酸,如所述的破坏Der p 1的N-糖基化位点,具体地说该变异体可以是S54N或N52Q。然而,Der p 1的其它变异体是可预料得到的。
在另一具体实施方案中,该多肽可以是酶,例如,氧化还原酶,转移酶,水解酶,裂合酶,异构酶,或连接酶。在一个更具体的方面,该多肽可以是氨肽酶,淀粉酶,糖酶,羧肽酶,过氧化氢酶,纤维素酶,纤维二糖水解酶,几丁质酶,角质酶,环糊精糖基转移酶,脱氧核糖核酸酶,内切葡聚糖酶,酯酶,α-半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,α-葡糖苷酶,β-葡糖苷酶,转化酶,漆酶,脂肪酶,甘露糖苷酶,变位酶mutanase,氧化酶,果胶降解酶,过氧化物酶,磷脂酶,植酸酶,多酚氧化酶,蛋白水解酶,核糖核酸酶,转谷氨酰胺酶,木聚糖酶,或β-木糖苷酶。有关纤维素酶的例子包括但不限于来自Mucor cicinellides,例如,M.cicinellidesIFO4554的纤维素酶(SEQ ID NO:4)。有关蛋白水解酶的例子包括但不限于半胱氨酸蛋白酶,例如,来自白车轴草(Trifolium repens L)的半胱氨酸蛋白酶5(SEQ ID NO:5),特别是编码成熟肽的SEQ ID NO:5的氨基酸109-327,或胰蛋白酶,例如来自尖孢镰孢(Fusarium oxysporium)的胰蛋白酶(SEQ IDNO:7)。有关植酸酶的例子包括但不限于来自Peniophora lycii,例如,P.lyciiCBS 686.96的植酸酶(SEQ ID NO:9)。
编码本发明的多肽的第二核苷酸序列可从任何原核生物,真核生物,或其它来源获得。为了达到本发明的目的,本文与给定来源相联系使用的术语“从...获得”是指该多肽由该来源产生或者由插入了该来源的基因的细胞产生。
用于分离或克隆编码目的多肽的核苷酸序列的技术是本领域熟知的且包括从基因组DNA分离,从cDNA制备,或其组合。通过例如,使用熟知的聚合酶链式反应(PCR)可实现从该基因组DNA克隆第二核苷酸序列。参见,例如,Innis等,1990,PCR Protocols:A Guide to Methods and Application,Academic Press,New York。克隆方法可包括切出和分离含有编码该多肽的核苷酸序列的所需核苷酸片断,将该片断插入载体分子中,并将重组载体纳入突变型真菌细胞中,其中可复制多个拷贝或克隆的该核苷酸序列。第二核苷酸序列可以是基因组,cDNA,RNA,半合成,合成来源,或其任意组合。
在本发明的方法中,该多肽也可以是融合或杂合多肽,其中另一多肽融合在该多肽或其片断的N-末端或C-末端。融合多肽通过将编码一种多肽的核苷酸序列(或其部分)融合到编码本发明的多肽的第二核苷酸序列(或其部分)上来产生。产生融合多肽的技术是本领域已知的,且包括,连接编码这些多肽的编码序列,使得它们共阅读框且该融合多肽的表达在相同启动子和终止子的调控下。杂合多肽可包括从至少两种不同多肽获得的部分或完整多肽序列的组合,其中一种或多种多肽对于突变型真菌细胞可以是异源的。
核酸构建体
本发明还涉及含有与编码本发明的多肽的第二核苷酸序列可操作地相连的编码本发明的信号肽的第一核苷酸序列的核酸构建体。
“核酸构建体”在此定义为单链或双链的核苷酸分子,它从天然存在的基因分离或者被修饰成含有以在天然情况下不存在的方式组合和并列的核酸片断。当核酸构建体含有编码序列和表达该编码序列所需的所有调控序列时,术语核酸构建体与术语表达盒同义。
编码多肽的第二核苷酸序列还可以用各种方法进行操作以提供该多肽的表达。在该核苷酸序列插入载体前对其改造可能是期望的或必需的,取决于该表达载体。使用重组DNA方法修饰核苷酸序列的技术是本领域熟知的。
在本发明的方法中,该核酸构建体包含一种或多种天然调控序列或者用对于该核酸构建体的第一和/或第二核苷酸序列为外源的一种或多种调控序列取代一种或多种天然调控序列以提高编码多肽的第二核苷酸序列在宿主细胞中的表达。
术语“调控序列”在此定义为包括表达第二核苷酸序列编码的多肽必需或有利的所有元件。各调控序列相对于编码该多肽的第二核苷酸序列可以是天然的或外源的。该调控序列包括,但不限于,前导序列,多聚腺苷化序列,前肽序列,本发明的信号肽序列,和转录终止子。在最少的情况下,该调控序列包括本发明的信号肽序列,和转录和翻译终止信号。调控序列备有接头用于导入有利于将该调控序列与编码该多肽的第二核苷酸序列连接的特定限制性位点。
调控序列可以是被宿主细胞识别以表达该核苷酸序列的合适启动子序列。该启动子序列含有介导该多肽表达的转录调控序列。该启动子可以是在选定宿主细胞中表现出转录活性的任何序列,包括突变的,截短的和杂合的启动子,且可从与该宿主细胞同源或异源的编码细胞外或细胞内多肽的基因获得。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的例子是从米曲霉TAKA淀粉酶,米赫毛霉(Rhizomucor miehei)天冬氨酸蛋白酶,黑曲霉中性α-淀粉酶,黑曲霉酸稳定性α-淀粉酶,黑曲霉或泡盛曲霉葡糖淀粉酶(glaA),米赫毛霉脂肪酶,米曲霉碱性蛋白酶,米曲霉丙糖磷酸异构酶,构巢曲霉乙酰胺酶,Fusarium venenatum淀粉葡糖苷酶,尖孢镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787),Trichodermareesei纤维二糖水解酶I,Trichoderma reesei纤维二糖水解酶II,Trichodermareesei内切葡聚糖酶I,Trichoderma reesei内切葡聚糖酶II,Trichoderma reesei内切葡聚糖酶III,Trichoderma reesei内切葡聚糖酶IV,Trichoderma reesei内切葡聚糖酶V,Trichoderma reesei木聚糖酶I,Trichoderma reesei木聚糖酶II和Trichoderma reeseiβ-木糖苷酶的基因获得的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);或其突变型,截短型,和杂合型启动子。
在酵母宿主中,有用的启动子包括但不限于从酿酒酵母(Saccharomycescerevisiae)烯醇化酶(ENO-1),酿酒酵母半乳糖激酶(GAL1),酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP),酿酒酵母丙糖磷酸异构酶(TPI),酿酒酵母金属硫蛋白(CUP1),和酿酒酵母3-磷酸甘油酸激酶的基因获得的那些启动子。用于酵母宿主细胞的其它有用的启动子参见Romanos等,1992,Yeast 8:423-488的描述。
调控序列可以是被宿主细胞识别以终止转录的合适转录终止子序列。该终止子序列可操作地连接到编码该多肽的核苷酸序列的3′端。在选定宿主细胞中起作用的任何终止子都可用于本发明。
用于丝状真菌宿主细胞的合适终止子的例子包括但不限于从米曲霉TAKA淀粉酶,黑曲霉葡糖淀粉酶,构巢曲霉邻氨基苯甲酸合酶,黑曲霉α-葡糖苷酶,和尖孢镰孢胰蛋白酶样蛋白酶的基因获得的那些终止子。
用于酵母宿主细胞的合适终止子的例子包括但不限于从酿酒酵母烯醇化酶,酿酒酵母细胞色素C(CYC1),和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得的那些终止子。用于酵母宿主细胞的其它有用的终止子参见Romanos等,1992,出处同上的描述。
该调控序列也可以是合适的前导序列,即对于宿主细胞翻译重要的mRNA的非翻译区。该前导序列一般可操作地连接到编码多肽的核苷酸序列的5′端。在选定宿主细胞中起作用的任何前导序列都可用于本发明。
用于丝状真菌宿主细胞的合适的前导序列的例子包括但不限于从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的那些前导序列。
用于酵母宿主细胞的合适的前导序列包括但不限于从酿酒酵母烯醇化酶(ENO-1),酿酒酵母3-磷酸甘油酸激酶,酿酒酵母α-因子,和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得的那些前导序列。
该调控序列也可以是多聚腺苷化序列,它与编码多肽的核苷酸序列的3′端可操作地连接且转录时作为给转录的mRNA添加多聚腺苷酸残基的信号被宿主细胞识别。在选定宿主细胞中起作用的任何多聚腺苷化序列都可用于本发明。
用于丝状真菌宿主细胞的合适多聚腺苷化序列的例子包括但不限于从米曲霉TAKA淀粉酶,黑曲霉葡糖淀粉酶,构巢曲霉邻氨基苯甲酸合酶,尖孢镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基因获得的那些多聚腺苷化序列。
用于酵母宿主细胞的有用多聚腺苷化序列包括但不限于Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990所述的那些序列。
调控序列也可以是编码位于多肽氨基末端的一个氨基酸序列的前肽编码区。所得的多肽称为酶原(proenzyme)或多肽原(或在某些情况下称为酶原(zymogen))。多肽原一般无活性,而且通过从多肽原催化或自体催化切割前肽,多肽原可以转变为成熟的活性多肽。前肽编码区的例子包括但不限于可从Dermantophagoides pteronyssinus Der p 1的基因,或者从Dermantophagoides获得的其它基因,尖孢镰孢胰蛋白酶,酿酒酵母α-因子,米赫毛霉天冬氨酸蛋白酶,和嗜热毁丝霉(Myceliophthora thermophila)漆酶(WO 95/33836)的基因获得的那些前肽。
如果信号肽和前肽区都存在于多肽的氨基末端,则该前肽区紧接着多肽的氨基末端且信号肽区紧接着该前肽区的氨基末端。如果存在前肽,则在一个实施方案中在前肽和成熟多肽之间可存在一个切割位点。术语“切割位点”应理解为被能够在该位点切割该多肽的蛋白水解酶识别的氨基酸序列。该位点的例子包括kex-位点,特别是kex-II位点。
也可能需要添加允许调节与宿主细胞生长相关的多肽表达的调节序列。调节系统的例子是与化学或物理刺激,包括调控化合物的存在反应引起基因表达打开或关闭的那些系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可使用TAKA α-淀粉酶启动子,黑曲霉葡糖淀粉酶启动子,和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它例子是允许基因扩增的那些序列。在真核系统中,它们包括在氨甲蝶呤存在时扩增的二氢叶酸还原酶基因,和重金属扩增的金属硫蛋白基因。在这些情况下,编码该多肽的核苷酸序列可与该调控序列可操作地相连。
表达载体
本发明还涉及含有本发明的核酸构建体的重组表达载体。除了包含分别编码本发明的信号肽和多肽的第一和第二核苷酸序列外,所述的表达载体可具体包含转录和翻译终止信号。上述各种核苷酸和调控序列可连接起来以产生重组表达载体,它可包括一个或多个方便的限制性位点以允许在该位点插入或取代该启动子和/或编码该多肽的核苷酸序列。作为选择,该核酸构建体可插入合适的载体以表达由第二核苷酸序列编码的多肽。在构建的表达载体中,编码本发明多肽的第二核苷酸序列位于该载体中以便所述的序列与本发明的信号肽序列和一个或多个合适的表达调控序列可操作地相连。
重组表达载体可以是可按常规进行重组DNA操作且可导致该核苷酸序列表达的任何载体(例如,质粒或病毒)。载体的选择一般依赖于载体与该载体所导入的宿主细胞的相容性。该载体可以是线性或闭合环状质粒。
本发明的载体可具体含有允许转化细胞容易选择的一个或多个可选择的标记。选择标记是其产物提供杀生物剂或病毒抗性,重金属抗性,营养缺陷型原养化等的基因。酵母宿主细胞的合适标记包括,但不限于,ADE2,HIS3,LEU2,LYS2,MET3,TRP1,和URA3。用于丝状真菌宿主细胞的选择标记包括,但不限于,amdS(乙酰胺酶),argB(鸟氨酸氨甲酰基转移酶),bar(膦丝菌素乙酰转移酶),hygB(潮霉素磷酸转移酶),niaD(硝酸盐还原酶),pyrG(乳清酸核苷-5′-磷酸脱羧酶),sC(硫酸腺苷酰转移酶),trpC(邻氨基苯甲酸合酶),及其等同物。具体用于曲霉属细胞的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
该载体可以是自主复制型载体,即,作为染色体外实体存在的载体,其复制不依赖于染色体复制,例如,质粒,染色体外因子,微型染色体,或人工染色体。该载体可含有保证自我复制的任何工具。作为选择,该载体可以是在导入宿主细胞时整合进基因组并与其整合进的染色体一起复制的载体。此外,可使用单个载体或质粒或一起含有需要导入宿主细胞基因组的总DNA的两个或多个载体或质粒,或转座子。
本发明的载体可具体含有允许该载体稳定整合进宿主细胞基因组或该载体在细胞中不依赖于基因组自主复制的元件。
为了整合进宿主细胞基因组,该载体可依靠编码该多肽的第二核苷酸序列或该载体的任何其它元件来通过同源或非同源重组将该载体稳定整合进基因组的。作为选择,该载体可含有指导通过同源重组整合进宿主细胞基因组的额外核苷酸序列。该额外核苷酸序列可使得该载体能够在染色体的精确位置整合进宿主细胞基因组。为了增加在精确位置整合的可能性,该整合元件应具体包含与相应靶序列高度同源的足够数量的核苷酸,例如100至1,500个碱基对,优选400到1,500个碱基对,且最优选800到1,500个碱基对以提高同源重组的概率。整合元件可以是与宿主细胞基因组中靶序列同源的任何序列。另外,整合元件可以是非编码或编码核苷酸序列。在另一方面,该载体可通过非同源重组整合进宿主细胞基因组。
对于自主复制,该载体可进一步包含使得该载体在所述宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制因子。术语“复制起点”或“质粒复制因子”本文定义为使得质粒或载体能够在体内复制的核苷酸序列。
用于酵母宿主细胞的复制起点的例子是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4与CEN6的组合。复制起点可以是具有突变使其在宿主细胞中起作用的能力具有温度敏感性的复制起点(参见,例如,Ehrlich,1978,Proceedings of the National Academy of Sciences USA 75:1433)。
用于丝状真菌宿主细胞的复制起点的例子是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。AMA1基因的分离和含有该基因的质粒或载体的构建可根据WO 00/24883公开的方法完成。
可将超过1拷贝的编码多肽的核苷酸序列插入宿主细胞中以增加该基因产物的产量。核苷酸序列拷贝数的增加可以这样实现:将至少一个额外拷贝的序列整合进宿主细胞基因组;或者通过将该核苷酸序列与可扩增的选择标记基因包含在一起,通过在合适的选择剂存下下培养细胞,可以选择含有扩增拷贝的选择标记基因,从而也就含有增加拷贝的该核苷酸序列的细胞,。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域的技术人员所熟知的(参见,例如,Sambrook等,1989,出处同上)。
宿主细胞
本发明涉及在真菌宿主细胞中生产多肽的方法和含有本发明的核酸构建体的重组宿主细胞。
将含有与编码多肽的第二核苷酸序列可操作地相连的编码本发明的信号肽的第一核苷酸序列的载体导入真菌宿主细胞使得该载体如前所述作为染色体整合体或者作为自我复制型染色体外载体维持。术语“宿主细胞”包含由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上依赖于编码该多肽的基因及其来源。
宿主细胞可以是用于本发明方法的任何真菌细胞。本文使用的“真菌”包括子囊菌门(Acomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(由Hawksworth等定义,参见,Ainsworth and Bisby′s Dictionary of The Fungi,第8版,1995,CABInternational,University Press,Cambridge,UK)以及卵菌门(Oomycota)(参见Hawksworth等,1995,出处同上,第171页)或所有有丝分裂孢子真菌(Hawksworth等,1995,出处同上)。
在一个具体方面,该真菌宿主细胞是酵母细胞。本文使用的“酵母”包括包括产子囊(ascosporogenous)酵母(内孢霉目(Endomycetales))、产担孢子(basidiosporogenous)酵母和属于不完全真菌(Fungi Imperfecti)的酵母(芽生菌纲Blastomycetes)。由于酵母的分类在今后可能改变,为了本发明的目的,酵母将定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.SymposiumSeries No.9,1980)中所述。
在一个更具体的方面,酵母宿主细胞是假丝酵母属(Candida),汉逊氏酵母属(Hansenula),克鲁维氏酵母属(Kluyveromyces),毕赤氏酵母属(Pichia),酵母属(Saccharomyces),裂殖酵母属(Schizosaccharomyces),或Yarrowia属细胞。
在一个最具体的方面,酵母宿主细胞是卡尔斯伯酵母(Saccharomycescarlsbergensis)、酿酒酵母例如S.cerevisiae YNG318、糖化酵母(Saccharomyces diastaticus)、道拉斯酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺第酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)、乳克鲁维氏酵母(Kluyveromyces lactis)或Yarrowia lipolytica细胞。
在另一具体方面,该真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门亚门(定义参见Hawksworth等,1995,出处同上)的所有丝状类型。丝状真菌的特征在于菌丝壁由几丁质,纤维素,葡聚糖,壳聚糖,甘露聚糖,和其它复合多糖组成。无性生长是通过菌丝伸长且碳代谢是专性需氧的。相反,诸如酿酒酵母的酵母无性生长是通过单细胞菌体出芽,且碳代谢可以是发酵性的。
在一个更具体的方面,丝状真菌宿主细胞是,但不限于是,支顶孢属(Acremonium),曲霉属,镰孢属(Fusarium),腐质霉属(Humicola),毛霉属(Mucor),毁丝霉属(Myceliophthora),脉孢菌属(Neurospora),青霉属,Thielavia,Tolypocladium,或木霉属(Trichoderma)。
在甚至更具体的一个方面,该丝状真菌宿主细胞是泡盛曲霉、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉或米曲霉细胞。在一个更具体的方面,丝状真菌宿主细胞是杆孢状镰孢(Fusariumbactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporium)、合欢木镰孢(Fusarium negundi)、尖孢镰孢、多枝镰孢(Fusarium reticulatum)、玫瑰色镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusariumtrichothecioides或Fusarium venenatum细胞。在另一个更具体的方面,丝状真菌宿主细胞是Humicola insolens、Humicola lanuginosa、Magnaporthe grisea、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、Thielavia terrestris、Trichoderma harzianum、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichodermareesei或绿色木霉(Trichoderma viride)细胞。
在一个最具体的方面,该Fusarium venenatum细胞是FusariumvenenatumA3/5,它最初作为Fusarium graminearum ATCC 20334保藏,且最近由Yoder和Christianson,1998,Fungal Genetics and Biology 23:62-80和O′Donnell等,1998,Fungal Genetics and Biology 23:57-67重新分类为Fusarium venenatum;以及Fusarium venenatum的分类学等同物,不管它们目前已知为何种名。在另一具体方面,该Fusarium venenatum细胞是如WO97/26330中公开的Fusarium venenatumA3/5或Fusarium venenatumATCC20334的形态学突变体。
在另一最具体的方面,该木霉属细胞是Trichoderma reeseiATCC56765,Trichoderma reeseiATCC 13631,Trichoderma reeseiCBS 526.94,Trichoderma reeseiCBS 529.94,Trichoderma longibrachiatumCBS 528.94,Trichoderma longibrachiatum ATCC 2106,Trichoderma longibrachiatumCBS592.94,绿色木霉NRRL 3652,绿色木霉CBS 517.94,或绿色木霉NIBHFERM/BP 447。
真菌细胞可以通过包含原生质体形成,原生质体转化和细胞壁再生的方法转化,方式本身是已知的。用于曲霉属宿主细胞转化的合适方法在EP238 023和Yelton等,1984,Proceedings of the National Academy of SciencesUSA 81:1470-1474中描述。用于转化Trichoderma reesei宿主细胞的合适方法在Penttila等,1987,Gene 61:155-164,和Gruber等,1990,Curr Genet.18(1):71-6中描述。用于转化镰孢菌种的合适方法由Malardier等,1989,Gene78:147-156和WO 96/00787描述。酵母可使用Becker和Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,第182-187页,Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163;和Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920所述的方法转化。
材料和方法
菌株和质粒
菌株
大肠杆菌DH12S(可从Gibco BRL获得)用于酵母质粒拯救。
酿酒酵母YNG318:MATa Dpep4[cir+]ura3-52,leu2-D2,his 4-539在J.Biol.Chem.272(15),9720-9727,1997)中描述。
质粒
所有酵母表达载体都是从WO 00/10038所述的pJC039构建的,在TPI启动子控制下的酿酒酵母和大肠杆菌穿梭载体。
基因
Der p 1来自Dermatophagoides pteronyssinus:NCBI登录号:P08176,氨基酸序列在SEQ ID NO:3中显示。
来自白车轴草(Trifolium repens L)的半胱氨酸蛋白酶基因是以EMBL:AY192363登录的序列。
α-因子(酵母接合所需的信息素)基因是来自Invitrogen的商业上可获得的pPICZαA载体中的序列。
来自尖孢镰孢的胰蛋白酶基因是以EMBL:S63827登录的序列,其cDNA序列在SEQ ID NO:6中显示。
来自Peniophora lycii菌株CBS 686.96的植酸酶基因是以EMBL:PLY310696登录的序列且其cDNA序列在SEQ ID NO:8中显示。
引物
对于卷枝毛霉(Mucor circinellides)纤维素酶的表达
对于cDNA克隆:
MCE-BC1 F(44mer):
5’-CAACTGGTGATCACCACCATGAAGTTCACCGTTGCTATTACTTC-3’
MCE-Nru R(39mer):
5’-TCTCGAGCTCGCGATTACTTTCTTTCGCAACCTGAGCGAG-3’
对于酵母载体构建:
M61 F(50mer):
5’-CCAGCTTCCGCAAACAAAGTCGCCAACATGAAGTTCACCGTTGCTATTAC-3’
M61 Cutisig F(50mer):
5’-CGCCAGCCTTGTTGCTGCTCTCCCCGCCGCTTCTTGCAGCTCTGTCTATG-3’
C-term R61 R(49mer):
5’-TAATTACATGATGCGGCCCTCTAGATTACTTTCTTTCGCAACCTGAGCG-3’
对于白车轴草半胱氨酸蛋白酶的表达
α-信号-MunI(49mer):
5’-ATAAACGACGGGACCCGGGGATCCAATTGATGAGATTCCCATCAATTTT-3’
α-信号-CysPro R(42mer):
5’-GCCCACGATGGAGAAATCGCGAGCTTCAGCTTCTCTTTTCTC-3’
α-信号-CysPro F(42mer):
5’-GAAAAAAGAGAAGCTGAAGCTCGCGATTTCTCCATCGTGGGC-3’
Spe-CysPro R(50mer):
5’-ACTAATTACATGATGCGGCCCACTAGTTCATTTCTTCTTAGTAGGATAAG-3’
Cuti-Sig-CysPro(50mer):
5’-GCACCGCCAGCCTTGTTGCTGCTCTCCCCCGCGATTTCTCCATCGTGGGC-3’
CysPro C-term(50mer):
5’-TAATTACATGATGCGGCCCGCGGCCGCTCATTTCTTCTTAGTAGGATAAG-3’
对于镰孢胰蛋白酶的表达
酵母-F(43mer):
5’-ACGACGGTACCCGGGGATCAAGCTTATGGTCAAGTTCGCTTCC-3’
酵母-R(43mer):
5’-AACTAATTACATGATGCGGCCCTCTAGATTAAGCATAGGTGTC-3’
cuti-pre(45mer):
5’-CGTTCCTGAACTTGTTGCCCGGGTTGGTGGCACTTCTGCCAGCGC-3’
TP2-Kex F(32mer):
5’-GTTCCTGAACTTGTTCGGCGGGTTGGTGGCAC-3’
TP2-Kex R(32mer):
5’-GTGCCACCAACCCGCCGAACAAGTTCAGGAAC-3’
Cuti-pre F(29mer):
5’-GTTGCTGCTCTCCCCGTTGGTGGCACTTC-3’
Cuti-pre R(29mer):
5’-GAAGTGCCACCAACGGGGAGAGCAGCAAC-3’
CUTIpre-TPpro F(42mer):
5’-TCCTCAGGAGATCCCCAACATTGTTGGTGGCACTTCTGCCAG-3’
CUTIpre-TPpro R(40mer):
5’-GTTGGGGATCTCCTGAGGAGCGGGGAGAGCAGCAACAAGG-3’
对于隔孢伏革菌(Peniophora)植酸酶的表达
PP 1F(50mer):
5’-AAACGACGGTACCCGGGGATCAAGCTTATGGTTTCTTCGGCATTCGCACC-3’
PP R(50mer):
5’-ACTAATTACATGATGCGGCCCTCTAGACTATTCCGACGGAACAAAGCCGC-3’
PP 2F(50mer):
5’-CCGCCAGCCTTGTTGCTGCTCTCCCCCAGCTACCTATCCCCGCACAAAAC-3’
培养基和底物
RS-25:40g/L大豆粉,40g/L葡萄糖,10g/L KH2PO4,0.25g/L MgSO4,0.01g/L FeSO4,2.5g/L NH4NO3;pH6
YPD:20g/L葡萄糖,20g/L蛋白胨和10g/L酵母提取物
10X基础溶液:66.8g/l酵母氮碱基无(w/o)氨基酸(DIFCO),100g/l琥珀酸盐和60g/l NaOH。
SC-葡萄糖(或SC-培养基):100ml/l 20%葡萄糖(即,2%的终浓度=2g/100ml),4ml/l 5%苏氨酸,10ml/l 1%色氨酸,25ml/l 20%酪蛋白氨基酸和100ml/l 10X基础溶液。该溶液使用0.20微米孔径的滤膜灭菌。琼脂和H2O(大约761ml)一起高压灭菌,并将单独灭菌的SC-葡萄糖溶液加入琼脂溶液中。
PEG/LiAc溶液:50ml 40%PEG4000(高压灭菌)和1ml 5M醋酸锂(高压灭菌)。
方法
酵母转化
该方法在实施例2-5中使用。
为了转化酵母,使用体内重组机制,其中如果载体序列和PCR片断都具有相同的侧翼区,则酵母可能通过该机制体内重组载体序列和PCR片断以产生表达载体。
通过将0.5微升载体(EcoRI-NotI消化)与1微升PCR片断混合制备DNA混合物。酿酒酵母YNG318感受态细胞在冰上融解。将100微升该细胞与该DNA混合物和10微升载体DNA(Clontech)在12ml聚丙烯试管(Falcon 2059)中混合。向其中加入0.6ml PEG/LiAc溶液并轻轻混合,然后在30℃和200rpm下温育30分钟。随后在42℃温育30分钟(热休克),之后转移进eppendorf管并离心5秒。去掉上清并分散在3ml YPD中。然后将该细胞悬液以200rpm在30℃下温育45分钟,之后倾倒在SC-葡萄糖平板上。
PCR反应
除非另有说明,在下列条件下进行PCR反应:
PCR反应包含38.9微升H2O,5微升10×反应缓冲液,1微升Klen TaqLA(Clontech),4微升10mM dNTPs,0.3微升×2100pmol/微升的引物和0.5微升模板DNA且在下列条件下进行:30个循环的98℃下10秒和68℃下90秒,和最后在68℃下10分钟。
夹心ELISA
免疫平板(Nunc Maxisorb;Nunc-Nalgene)在4℃下用合适剂量的多克隆兔抗Der p 1抗体包被过夜。然后用含0.05%Tween 20的0.15M磷酸盐缓冲液(PBS)(PBST)彻底洗涤平板,并用含2%脱脂奶粉的PBS在室温下封闭剩下的结合位点1小时。以合适剂量或剂量范围加入样品,它可以是纯化的,半纯化的重组1型螨多肽变异体过敏原或含有目的蛋白的粗制培养液。然后用0.15M PBST彻底洗涤平板,之后通过用生物素标记的单克隆抗Der p 1抗体(INDOOR)在室温下温育1小时检测该过敏原。然后在0.15M PBST中再次洗涤平板,之后与链霉抗生物素蛋白:辣根过氧化物酶复合物(Kierkegaard &Perry)在室温下结合1小时。重复洗涤步骤,然后平板通过加入3,3’,5,5’-四甲基联苯胺过氧化氢(TMB Plus,Kem-En-Tec)显色,之后通过加入0.2MH2SO4终止反应。在450nm下的光密度(OD)反映了与免疫球蛋白结合的过敏原,然后可检测且也可通过与从ELISA中包含的已知浓度剂量范围的天然Der p 1(可从Indoor biotechnologies,NA-DP1获得)获得的数据进行比较来测定结合的过敏原的量。
其它方法
通过电穿孔(BIO-RAD Gene Pulser)进行大肠杆菌转化以拯救酵母质粒。
DNA质粒用Qiagen质粒试剂盒制备。DNA片断通过Qiagen凝胶提取试剂盒从琼脂糖凝胶中回收。
PCR用PTC-200 DNA Engine进行。
ABI PRISMTM 310遗传分析仪用于所有DNA序列的测定。酵母总DNA通过在Nucleic acids research vol.20,No.14(1992)3790中所述的Robzyk和Kassir’s方法提取。
酶测定法
半胱氨酸蛋白酶测定法
96孔微量滴定板测定法:
向各孔中加入下列成份:10微升0.5M醋酸钠缓冲液(pH 5),10微升2MNaCl(含有700微升巯基乙醇/100ml),45微升D.W.(蒸馏水)和10微升酶样品。然后平板在室温下温育5-10分钟(用于肽酶的成熟),之后加入25微升40μM的Z-Phe-Arg-MCA(0.1%DMSO)。最后,在荧光计中测量460nm下MCA(4-甲基-香豆酸酰-7-酰胺)的发射。
胰蛋白酶测定法(镰孢胰蛋白酶的PNA测定法)
底物:
将50mg Nα-苯甲酰基-DL-精氨酸-对-N-硝酰苯胺(Nitroanilide)(BAPNA,Sigma B-4875)溶于1ml DMSO且保存在-20℃。该溶液在即将使用前在测定缓冲液中稀释100倍。
测定缓冲液:
50mM 硼酸盐-NaOH(pH10.5)+2mM CaCl2
方法:
将20微升样品和200微升测定缓冲液在96-孔微量滴定盘中混合并在405nm下测量Delta OD/min 5分钟。
植酸酶测定法
将10微升稀释的酶样品(在0.1M乙酸钠,0.01%Tween20,pH 5.5中稀释)加入250微升含5mM植酸钠(Sigma)的0.1M乙酸钠,0.01%Tween20,pH5.5(溶解植酸钠后调节的pH;预热底物)中并在37℃下温育30分钟。通过加入250微升10%TCA终止反应并通过加入500微升将7.3g FeSO4溶于100ml钼酸盐试剂(2.5g(NH4)6Mo7O24.4H2O溶于8ml H2SO4中稀释至250ml)所得的溶液来测量游离磷酸盐。在96孔微量滴定板中测量200微升样品在750nm下的吸光度。包含底物和酶空白对照。也包含磷酸盐标准曲线(0-2mM磷酸盐)。1U等于在给定条件下释放1微摩尔磷酸盐/分钟的酶量。
实施例
实施例1
在酿酒酵母中表达Der p 1
来自Dermantophagoides pteronyssinus的Der p 1半胱氨酸蛋白酶(其氨基酸序列在SEQ ID NO:3中描述)编码基因位于载体pSteD212中,该载体来自酵母表达载体pYES 2.0(Invitrogen,Kofod等,1994 J.Biol.Chem.269:29182-29189和Christgau等,1994,Biochem.Mol.Biol.Int.33:917-925)。
该质粒在大肠杆菌和酿酒酵母中都复制。在酿酒酵母中从该质粒表达Der p 1。
重组体Der p 1以Der p 1前肽表达且具有破坏成熟序列内唯一N-糖基化基序的突变S54N或N52Q。
为了在酵母中分泌,通过将两个不同的信号肽导入编码pro-Der p 1基因的上游检测了它们的表达效率。通过克隆DNA片断制备含有信号肽的表达构建体(Sambrook等,Molecular Cloning:A Laboratory Manual,第二版,冷泉港,1989)。一个信号肽是具有氨基酸序列MKIVLAIASLLALSAVYA的天然存在的Dermantophagoides pteronyssinus Der p 1信号肽且另一信号肽来自Humicula insolens角质酶并具有氨基酸序列MKFFTTILSTASLVAALP(SEQ ID NO:1)。具有尘螨(dust mite)Der p 1信号肽的酵母菌株和构建体称为pre-pro-Der p 1且具有角质酶信号肽的酵母菌株和构建体称为cuti-pro-Der p1。
将构建体转化进酿酒酵母。为了筛选表达Der p 1的酵母转化子,将转化溶液涂布在SC-琼脂板上用于在30℃形成菌落3天。将菌落接种在50ml无菌塑料管中,每管含有10mL SC培养基。试管在含有100ml SC培养基的500ml有挡板的锥形瓶中30℃,250rpm发酵4天。发酵培养液用于夹心ELISA实验以测定表达蛋白的浓度。
通过上面方法部分所述的夹心ELISA测定pre-pro Der p1 S54N和pre-proDer p1 N52Q转化子中Der p 1的表达水平为相同的水平±8%。可推断具有pre-pro-Der p 1的两个菌株的表达水平不依赖于使用两个突变S54N和N52Q中的哪一个。
在另一实验中,4.5L pre-pro-Der p 1(N52Q)和cuti-pro-Der p 1(S54N)的培养液发酵4天,发酵期间每天取样并通过上述夹心ELISA测量Der p 1的量以追踪表达水平。cuti-pro-Der p 1和pre-pro-Der p 1表达产量之间的比率显示如下。
  发酵天数   表达产量(cuti-pro Der p 1/pre-pro-Der p 1)
  第1天   8
  第2天   10
  第3天   8
  第4天   6
发酵的每天中cuti-pro-Der p 1比pre-pro-Der p 1多表达6-10倍的Der p1,表明pro-Der p 1前面的角质酶信号肽与使用天然尘螨Der p 1信号肽比较增加了pro-Der p 1蛋白的表达水平。
实施例2
在酿酒酵母中表达卷枝毛霉的纤维素酶
卷枝毛霉IFO4554在含有RS-25+0.5%乳糖培养基的摇瓶中30℃下培养1天。收集菌丝体并用于mRNA制备,随后将该mRNA逆转录成cDNA。使用MCE-BC1 F和MCE-Nru R引物对和下列PCR条件通过PCR从该cDNA扩增大约1kb的片断:94℃下2分钟;35个循环的94℃下1分钟,45℃下1分钟和72℃下2.5分钟;最后在72℃下8分钟。将扩增的片断克隆进T-载体(Novagene)。
用引物对M61 F和C-末端R61 R,和M61 Cutisig F和C-末端R61 R再扩增T-载体中的片断(毛霉纤维素酶基因),其中前一引物对用于含原始信号序列(毛霉纤维素酶基因的信号序列)的构建体,且后一引物对用于构建含有H.insolens角质酶信号序列(SEQ ID NO:2)和毛霉纤维素酶基因的核酸序列。
通过将所得的PCR片断与用HindIII和XbaI,和PvuII与XbaI分别消化的pJC039载体一起导入酿酒酵母YNG318中转化酵母。
所得的转化子在含有YPD培养基的24孔平板中在30℃和180rpm下培养3天。将培养物上清上样到含有0.2%CMC(羧甲基纤维素),pH 8.5的琼脂板的孔中。在下表中列出了围绕含有酵母细胞培养上清的孔的晕环大小,该酵母细胞表达含H.insolens角质酶信号肽或含毛霉纤维素酶基因信号肽的毛霉纤维素酶。由于该纤维素酶能够降解CMC从而产生晕环,因此晕环的大小相关于放入特定孔中的培养上清中存在的纤维素酶的量。因此,大晕环表明纤维素酶的含量高而小晕环表明纤维素酶的含量低。
 CMC板的孔环大小
  含H.insolens角质酶信号肽的毛霉纤维素酶  +++++
  含有其自身信号肽的毛霉纤维素酶  (+)
该结果表明用H.insolens角质酶基因的信号肽序列表达时毛霉纤维素酶在酵母中的表达水平比用其自身信号肽序列(毛霉纤维素酶基因)表达时高得多。
实施例3
在酿酒酵母中表达白车轴草半胱氨酸蛋白酶
为了构建含有α-因子信号肽和白车轴草半胱氨酸蛋白酶的表达载体,用引物对α-信号-MunI和α-信号-CysProR再次扩增编码α-因子信号肽的DNA片断。用引物对,α-信号-CysPro F和Spe-Cys ProR并使用EMBL:AY192363序列作为模板再次扩增编码白车轴草半胱氨酸蛋白酶前体成熟区的基因。通过将这两个PCR片断与用Hind III和Xba I消化的pJC039载体混合在一起并导入酿酒酵母YNG318中转化酵母。
为了构建包含H.insolens角质酶信号肽和白车轴草半胱氨酸蛋白酶的表达载体,用引物对Cuti-Sig-CysPro和CysPro C-term再次扩增编码白车轴草半胱氨酸蛋白酶前体成熟区的基因。通过将获得的PCR片断与用Hind III和XbaI消化的pJC039载体混合并导入酿酒酵母YNG318中转化酵母。获得的转化子在含1ml YPD的24孔平板中27℃下培养3天,然后按方法部分所述检测上清的半胱氨酸蛋白酶活性。半胱氨酸蛋白酶活性的测量值在下表中显示。
  半胱氨酸蛋白酶活性(荧光发射/分钟)
  含H.insolens角质酶信号肽的半胱氨酸蛋白酶   4.446×106
  含α-因子信号肽的半胱氨酸蛋白酶   4.073×105
结果表明当用H.insolens角质酶信号肽表达时白车轴草半胱氨酸蛋白酶在酵母中的表达水平比用α-因子信号肽高10倍。
实施例4
在酿酒酵母中表达镰孢胰蛋白酶
用引物对酵母-F和酵母-R,以及cuti-pre和酵母-R使用EMBL:S63827序列作为模板再次扩增镰孢胰蛋白酶基因,即SEQ ID NO:6所示的cDNA序列。酵母-F/酵母-R引物对用于构建包含编码胰蛋白酶基因信号肽、前肽区(pro-region)和成熟部分的核酸序列的序列,而cuti-pre/酵母-R引物对用于构建包含H.insolens角质酶信号肽和前肽区和镰孢成熟胰蛋白酶基因的核酸序列。将所得的PCR片断与用HindIII和XbaI,以及PvuII和XbaI消化的pJC039载体一起导入酿酒酵母YNG318中转化酵母。
获得的转化子(pTM-TP1和pTM-TP2)在含有YPD培养基的24孔平板中在30℃,180rpm下培养3天。
pTM-TP1:镰孢胰蛋白酶信号+镰孢胰蛋白酶前肽+成熟胰蛋白酶
pTM-TP2:H.insolens角质酶信号+H.insolens角质酶前肽+成熟胰蛋白酶
按上文方法部分所述测量胰蛋白酶活性。即使加入Neutrase TM(作为成熟酶)在两种培养物上清中都没有观察到活性。然而,用pTM-TP2通过Western印迹检测到胰蛋白酶的前体形式(角质酶前肽+成熟胰蛋白酶)。
因此,制备下列构建体:
pTM-TP2-Kex:H.insolens角质酶信号肽+H.insolens角质酶前肽区+KexII位点+成熟镰孢胰蛋白酶
pTM-TP2w/o pro:H.insolens角质酶信号肽+成熟镰孢胰蛋白酶
pTM-TP2 TPpro:H.insolens角质酶信号肽+镰孢胰蛋白酶前肽区+镰孢成熟胰蛋白酶
各引物对,TP2-Kex F和R,Cuti-pre F和R以及CUTIpre-TPpro F和R,分别通过将它们与用EagI消化的pTM-TP2载体混合并将该混合物导入酿酒酵母YNG318中用于制备pTM-TP2-Kex,pTM-TP2w/o pro和pTM-TP2 Tppro。
获得的转化子在含有YPD培养基的24孔平板中在30℃,180rpm下培养3天。
  构建体   信号肽   前肽区   活性w/oNeutrase (作为成熟酶)   含Neutrase的活性  细胞提取物(细胞内)的Western印迹  上清(细胞外)的Western印迹
  pTM-TP1   胰蛋白酶   胰蛋白酶   -   -  前体形式  -
  pTM-TP1Kex   胰蛋白酶   胰蛋白酶(+kex位点)   -   -  前体形式  -
  pTM-TP2   角质酶   角质酶   -   -  -  前体形式
  pTM-TP2K   角质酶   角质酶   -   -  N.T.  N.T.
  ex   (+kex位点)
  pTM-TP2w/o pro   角质酶   无 -   - -   比成熟酶更大
  pTM-TP2TPpro   角质酶   胰蛋白酶 -   + -   前体形式
其中“-”是指在Western印迹中检测不到活性或无结合带,“+”是指可检测到胰蛋白酶活性,“前体形式”是指可检测到胰蛋白酶的前体形式,“N.T.”是指“没有检测”且对于pTM-TP2 w/o pro是指可检测到比成熟酶更大的蛋白质,然而该构建体设计成不包含前肽区,因此它不是前体形式。
当向上清中加入Neutrase时(终浓度0.5AU/ml)用pTM-TP2TPpro载体检测到胰蛋白酶活性。结果表明镰孢胰蛋白酶自身信号肽在酵母中不能有效工作以表达胰蛋白酶,而H.insolens角质酶信号肽则可以。镰孢胰蛋白酶的前肽区(也称为前肽序列)(7个氨基酸)似乎对于该胰蛋白酶的正确折叠和活化是必需的。
实施例5
在酿酒酵母中表达隔孢伏革菌植酸酶
用引物对(PP1 F和PP R,PP2 F和PPR)使用EMBL:PLY310696序列作为模板扩增隔孢伏革菌的植酸酶基因,即,SEQ ID NO:8所示的cDNA序列。PP1 F/PP R引物对用于构建编码隔孢伏革菌植酸酶基因信号肽和隔孢伏革菌植酸酶成熟蛋白的核酸序列,而PP2 F/PPR引物对用于构建编码H.insolens角质酶基因信号肽和成熟隔孢伏革菌植酸酶蛋白的核酸序列。通过将所得的PCR片断与用HindIII和XbaI,以及PvuII和XbaI消化的pJC039载体一起导入酿酒酵母YNG318中转化酵母。
获得的转化子在含有YPD培养基的24孔平板和500ml摇瓶中在30℃,180rpm下培养3天。
pTMPP1构建体包含隔孢伏革菌植酸酶的原有信号肽序列,而pTMPP2构建体包含H.insolens角质酶信号肽序列。按方法部分所述测量在24孔平板或摇瓶中培养的包含pTMPP1或pTMPP2构建体的转化子培养物上清中的植酸酶活性。结果如下所示。
  24-孔   摇瓶
  pTMPP1(植酸酶信号肽)   1.8U/ml   1U/ml
  pTMPP2(角质酶信号肽)   6.9U/ml   13U/ml
结果表明包含pTMPP2构建体的转化子比包含pTMPP1构建体的转化子表达更高的植酸酶活性,表明H.insolens信号肽与植酸酶自身信号肽相比增加在酵母中的植酸酶表达。
实施例6
在米曲霉中表达隔孢伏革菌的植酸酶
使用实施例5所述的包含具有其自身信号肽序列的植酸酶基因和具有H.insolens角质酶信号肽序列的植酸酶基因的构建体来构建曲霉属的表达载体并按Lassen等,(2001),Applied and Environmental Micorbiology,67,4701-4707中所述转化曲霉。对于每个构建体,分离49个菌株,纯化并通过在摇瓶中培养所述转化子按上文方法部分所述测量植酸酶的产量。当比较来自两组构建体的表达最高水平植酸酶的菌株时,发现包含具有角质酶信号肽的构建体的菌株比包含植酸酶信号肽的菌株表达的植酸酶多大约1.4倍。同样,当比较每组中表达最大量植酸酶的5个菌株的植酸酶平均表达量时,包含具有角质酶信号肽的构建体的菌株比包含具有植酸酶信号肽的构建体的菌株表达的植酸酶多大约1.3倍。
                                序列表
<110>诺维信公司(Novozymes A/S)
<120>用于生产多肽的信号肽
<130>10656
<160>9
<170>PatentIn version 3.2
<210>1
<211>18
<212>PRT
<213>Humicola insolens
<400>1
Met Lys Phe Phe Thr Thr Ile Leu Ser Thr Ala Ser Leu Val Ala Ala
1               5                   10                  15
Leu Pro
<210>2
<211>54
<212>DNA
<213>Humicola insolens
<400>2
atgaagttct tcaccaccat cctcagcacc gccagccttg ttgctgctct cccc       54
<210>3
<211>320
<212>PRT
<213>Dermatophagoides pteronyssinus
<220>
<221>SIGNAL
<222>(1)..(18)
<220>
<221>PROPEP
<222>(19)..(98)
<220>
<221>mat_peptide
<222>(99)..(320)
<400>3
Met Lys Ile Val Leu Ala Ile Ala Ser Leu Leu Ala Leu Ser Ala Val
            -95                 -90                 -85
Tyr Ala Arg Pro Ser Ser Ile Lys Thr Phe Glu Glu Tyr Lys Lys Ala
        -80                 -75                 -70
Phe Asn Lys Ser Tyr Ala Thr Phe Glu Asp Glu Glu Ala Ala Arg Lys
    -65                 -60                 -55
Asn Phe Leu Glu Ser Val Lys Tyr Val Gln Ser Asn Gly Gly Ala Ile
-50                 -45                 -40                 -35
Asn His Leu Ser Asp Leu Ser Leu Asp Glu Phe Lys Asn Arg Phe Leu
                -30                 -25                 -20
Met Ser Ala Glu Ala Phe Glu His Leu Lys Thr Gln Phe Asp Leu Asn
            -15                 -10                 -5
Ala Glu Thr Asn Ala Cys Ser Ile Asn Gly Asn Ala Pro Ala Glu Ile
    -1  1               5                   10
Asp Leu Arg Gln Met Arg Thr Val Thr Pro Ile Arg Met Gln Gly Gly
15                  20                  25                  30
Cys Gly Ser Cys Trp Ala Phe Ser Gly Val Ala Ala Thr Glu Ser Ala
                35                  40                  45
Tyr Leu Ala Tyr Arg Asn Gln Ser Leu Asp Leu Ala Glu Gln Glu Leu
            50                  55                  60
Val Asp Cys Ala Ser Gln His Gly Cys His Gly Asp Thr Ile Pro Arg
        65                  70                  75
Gly Ile Glu Tyr Ile Gln His Asn Gly Val Val Gln Glu Ser Tyr Tyr
    80                  85                  90
Arg Tyr Val Ala Arg Glu Gln Ser Cys Arg Arg Pro Asn Ala Gln Arg
95                  100                 105                 110
Phe Gly Ile Ser Asn Tyr Cys Gln Ile Tyr Pro Pro Asn Val Asn Lys
                115                 120                 125
Ile Arg Glu Ala Leu Ala Gln Thr His Ser Ala Ile Ala Val Ile Ile
            130                 135                 140
Gly Ile Lys Asp Leu Asp Ala Phe Arg His Tyr Asp Gly Arg Thr Ile
        145                 150                 155
Ile Gln Arg Asp Asn Gly Tyr Gln Pro Asn Tyr His Ala Val Asn Ile
    160                 165                 170
Val Gly Tyr Ser Asn Ala Gln Gly Val Asp Tyr Trp Ile Val Arg Asn
175                 180                 185                 190
Ser Trp Asp Thr Asn Trp Gly Asp Asn Gly Tyr Gly Tyr Phe Ala Ala
                195                 200                 205
Asn Ile Asp Leu Met Met Ile Glu Glu Tyr Pro Tyr Val Val Ile Leu
            210             215                     220
<210>4
<211>316
<212>PRT
<213>卷枝毛霉(Mucor circinellides)
<220>
<221>mat_peptide
<222>(1)..(316)
<400>4
Ala Ser Cys Ser Ser Val Tyr Gly Gln Cys Gly Gly Ile Gly Trp Ser
1               5                   10                  15
Gly Pro Thr Cys Cys Gln Ser Gly Ser Thr Cys Val Ala Gln Glu Gly
            20                  25                  30
Asn Lys Tyr Tyr Ser Gln Cys Leu Pro Gly Ser His Ser Asn Asn Ala
        35                  40                  45
Gly Asn Ala Ser Ser Thr Lys Lys Thr Ser Thr Lys Ser Ser Thr Thr
    50                  55                  60
Thr Ala Lys Ala Thr Ala Thr Val Thr Thr Lys Thr Val Thr Lys Thr
65                  70                  75                  80
Thr Thr Lys Thr Thr Thr Lys Thr Ser Thr Thr Ala A1a Ala Ser Thr
                85                  90                  95
Ser Thr Ser Ser Ser Ala Gly Tyr Lys Val Ile Ser Gly Gly Lys Ser
            100                 105                 110
Gly Ser Gly Ser Thr Thr Arg Tyr Trp Asp Cys Cys Lys Ala Ser Cys
        115                 120                 125
Set Trp Pro Gly Lys Ala Ser Val Thr Gly Pro Val Asp Thr Cys Ala
    130                 135                 140
Ser Asn Gly Ile Ser Leu Leu Asp Ala Asn Ala Gln Ser Gly Cys Asn
145                 150                 155                 160
Gly Gly Asn Gly Phe Met Cys Asn Asn Asn Gln Pro Trp Ala Val Asn
                165                 170                 175
Asp Glu Leu Ala Tyr Gly Phe Ala Ala Ala Ser Ile Ala Gly Ser Asn
            180                 185                 190
Glu Ala Gly Trp Cys Cys Gly Cys Tyr Glu Leu Thr Phe Thr Set Gly
        195                 200                 205
Ala Ala Ser Gly Lys Lys Met Val Val Gln Val Thr Asn Thr Gly Gly
    210                 215                 220
Asp Leu Gly Ser Asn His Phe Asp Leu Gln Met Pro Gly Gly Gly Val
225                 230                 235                 240
Gly Ile Phe Asn Gly Cys Ala Ala Gln Trp Gly Ala Pro Asn Asp Gly
                245                 250                 255
Trp Gly Ala Arg Tyr Gly Gly Val Ser Ser Val Ser Asp Cys Ala Ser
            260                 265                  270
Leu Pro Ser Ala Leu Gln Ala Gly Cys  Lys Trp Arg Phe Asn Trp Phe
        275                 280                  285
Lys Asn Ser Asp Asn Pro Thr Met Thr Phe Lys Glu Val Thr Cys Pro
    290                 295                 300
Ala Glu Leu Thr Thr Arg Ser Gly Cys Glu Arg Lys
305                 310                 315
<210>5
<211>327
<212>PRT
<213>白车轴草(Trifolium repens L)
<220>
<221>mat_peptide
<222>(109)..(327)
<400>5
Arg Asp Phe Ser Ile Val Gly Tyr Ser Ser Glu Asp Leu Lys Ser Met
            -105                -100                -95
Asp Lys Leu Ile Glu Leu Phe Glu Ser Trp Met Ser Arg His Gly Lys
        -90                 -85                 -80
Ile Tyr Glu Thr Ile Glu Glu Lys Leu Leu Arg Phe Glu Val Phe Lys
    -75                 -70                 -65
Asp Asn Leu Lys His Ile Asp Asp Arg Asn Lys Val Val Ser Asn Tyr
-60                 -55                 -50                 -45
Trp Leu Gly Leu Asn Glu Phe Ala Asp Leu Ser His Gln Glu Phe Lys
                -40                 -35                 -30
Asn Lys Tyr Leu Gly Leu Lys Val Asp Leu Ser Gln Arg Arg Glu Ser
            -25                 -20                 -15
Ser Asn Glu Glu Glu Phe Thr Tyr Arg Asp Val Asp Leu Pro Lys Ser
        -10                 -5              -1  1
Val Asp Trp Arg Lys Lys Gly Ala Val Thr Pro Val Lys Asn Gln Gly
5                   10                  15                  20
Gln Cys Gly Ser Cys Trp Ala Phe Ser Thr Val Ala Ala Val Glu Gly
                25                  30                  35
Ile Asn Gln Ile Val Thr Gly Asn Leu Thr Ser Leu Ser Glu Gln Glu
            40                  45                  50
Leu Ile Asp Cys Asp Thr Thr Tyr Asn Asn Gly Cys Asn Gly Gly Leu
        55                  60                  65
Met Asp Tyr Ala Phe Ser Phe Ile Val Gln Asn Gly Gly Leu His Lys
    70                  75                  80
Glu Asp Asp Tyr Pro Tyr Ile Met Glu Glu Ser Thr Cys Glu Met Lys
85                  90                  95                  100
Lys Glu Glu Thr Gln Val Val Thr Ile Asn Gly Tyr His Asp Val Pro
                105                 110                 115
Gln Asn Asn Glu Gln Ser Leu Leu Lys Ala Leu Ala Asn Gln Pro Leu
            120                 125                 130
Ser Val Ala Ile Glu Ala Ser Ser Arg Asp Phe Gln Phe Tyr Ser Gly
        135                 140                 145
Gly Val Phe Asp Gly His Cys Gly Ser Asp Leu Asp His Gly Val Ser
    150                 155                 160
Ala Val Gly Tyr Gly Thr Ser Lys Asn Leu Asp Tyr Ile Ile Val Lys
165                 170                 175                 180
Asn Ser Trp Gly Ala Lys Trp Gly Glu Lys Gly Phe Ile Arg Met Lys
                185                 190                 195
Arg Asn Ile Gly Lys Pro Glu Gly Ile Cys Gly Leu Tyr Lys Met Ala
            200                 205                 210
Ser Tyr Pro Thr Lys Lys Lys
        215
<210>6
<211>998
<212>DNA
<213>尖孢镰孢(Fusarium oxysporum)
<220>
<221>CDS
<222>(58)..(804)
<400>6
atcatcaacc actcttcact cttcaactct cctctcttgg atatctatct cttcacc       57
atg gtc aag ttc gct tcc gtc gtt gca ctt gtt gct ccc ctg gct gct     105
Met Val Lys Phe Ala Ser Val Val Ala Leu Val Ala Pro Leu Ala Ala
1               5                   10                  15
gcc gct cct cag gag atc ccc aac att gtt ggt ggc act tct gcc agc     153
Ala Ala Pro Gln Glu Ile Pro Asn Ile Val Gly Gly Thr Ser Ala Ser
            20                  25                  30
gct ggc gac ttt ccc ttc atc gtg agc att agc cgc aac ggt ggc ccc     201
Ala Gly Asp Phe Pro Phe Ile Val Ser Ile Ser Arg Asn Gly Gly Pro
        35                  40                  45
tgg tgt gga ggt tct ctc ctc aac gcc aac acc gtc ttg act gct gcc     249
Trp Cys Gly Gly Ser Leu Leu Asn Ala Asn Thr Val Leu Thr Ala Ala
    50                  55                  60
cac tgc gtt tcc gga tac gct cag agc ggt ttc cag att cgt gct ggc     297
His Cys Val Ser Gly Tyr Ala Gln Ser Gly Phe Gln Ile Arg Ala Gly
65                  70                  75                  80
agt ctg tct cgc act tct ggt ggt att acc tcc tcg ctt tcc tcc gtc     345
Ser Leu Ser Arg Thr Ser Gly Gly Ile Thr Ser Ser Leu Ser Ser Val
                85                  90                  95
aga gtt cac cct agc tac agc gga aac aac aac gat ctt gct att ctg     393
Arg Val His Pro Ser Tyr Ser Gly Asn Asn Asn Asp Leu Ala Ile Leu
            100                 105                 110
aag ctc tct act tcc atc ccc tcc ggc gga aac atc ggc tat gct cgc     441
Lys Leu Ser Thr Ser Ile Pro Ser Gly Gly Asn Ile Gly Tyr Ala Arg
        115                 120                 125
ctg gct gct tcc ggc tct gac cct gtc gct gga tct tct gcc act gtt     489
Leu Ala Ala Ser Gly Ser Asp Pro Val Ala Gly Ser Ser Ala Thr Val
    130                 135                 140
gct ggc tgg ggc gct acc tct gag ggc ggc agc tct act ccc gtc aac     537
Ala Gly Trp Gly Ala Thr Ser Glu Gly Gly Ser Ser Thr Pro Val Asn
145                 150                 155                 160
ctt ctg aag gtt act gtc cct atc gtc tct cgt gct acc tgc cga gct     585
Leu Leu Lys Val Thr Val Pro Ile Val Ser Arg Ala Thr Cys Arg Ala
                165                 170                 175
cag tac ggc acc tcc gcc atc acc aac cag atg ttc tgt gct ggt gtt     633
Gln Tyr Gly Thr Ser Ala Ile Thr Asn Gln Met Phe Cys Ala Gly Val
            180                 185                 190
tct tcc ggt ggc aag gac tct tgc cag ggt gac agc ggc ggc ccc atc     681
Ser Ser Gly Gly Lys Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Ile
        195                 200                 205
gtc gac agc tcc aac act ctt atc ggt gct gtc tct tgg ggt aac gga     729
Val Asp Ser Ser Asn Thr Leu Ile Gly Ala Val Ser Trp Gly Asn Gly
    210                 215                 220
tgt gcc cga ccc aac tac tct ggt gtc tat gcc agc gtt ggt gct ctc     777
Cys Ala Arg Pro Asn Tyr Ser Gly Val Tyr Ala Ser Val Gly Ala Leu
225                 230                 235                 240
cgc tct ttc att gac acc tat gct taa ataccttgtt ggaagcgtcg           824
Arg Ser Phe Ile Asp Thr Tyr Ala
                245
agatgttcct tgaatattct ctagcttgag tcttggatac gaaacctgtt tgagaaatag   884
gtttcaacga gttaagaaga tatgagttga tttcagttgg atcttagtcc tggttgctcg   944
taatagagca atctagatag cccaaattga atatgaaatt tgatgaaaat attc         998
<210>7
<211>248
<212>PRT
<213>尖孢镰孢(Fusarium oxysporum)
<400>7
Met Val Lys Phe Ala Ser Val Val Ala Leu Val Ala Pro Leu Ala Ala
1               5                   10                  15
Ala Ala Pro Gln Glu Ile Pro Asn Ile Val Gly Gly Thr Ser Ala Ser
            20                  25                  30
Ala Gly Asp Phe Pro Phe Ile Val Ser Ile Ser Arg Asn Gly Gly Pro
        35                  40                  45
Trp Cys Gly Gly Ser Leu Leu Asn Ala Asn Thr Val Leu Thr Ala Ala
    50                  55                  60
His Cys Val Ser Gly Tyr Ala Gln Ser Gly Phe Gln Ile Arg Ala Gly
65                  70                  75                  80
Ser Leu Ser Arg Thr Ser Gly Gly Ile Thr Ser Ser Leu Ser Ser Val
                85                  90                  95
Arg Val His Pro Ser Tyr Ser Gly Asn Asn Asn Asp Leu Ala Ile Leu
            100                 105                 110
Lys Leu Ser Thr Ser Ile Pro Ser Gly Gly Asn Ile Gly Tyr Ala Arg
        115                 120                 125
Leu Ala Ala Ser Gly Ser Asp Pro Val Ala Gly Ser Ser Ala Thr Val
    130                 135                 140
Ala Gly Trp Gly Ala Thr Ser Glu Gly Gly Ser Ser Thr Pro Val Asn
145                 150                 155                 160
Leu Leu Lys Val Thr Val Pro Ile Val Ser Arg Ala Thr Cys Arg Ala
                165                 170                 175
Gln Tyr Gly Thr Ser Ala Ile Thr Asn Gln Met Phe Cys Ala Gly Val
            180                 185                 190
Ser Ser Gly Gly Lys Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro Ile
        195                 200                 205
Val Asp Ser Ser Asn Thr Leu Ile Gly Ala Val Ser Trp Gly Asn Gly
    210                 215                 220
Cys Ala Arg Pro Asn Tyr Ser Gly Val Tyr Ala Ser Val Gly Ala Leu
225                 230                 235                 240
Arg Ser Phe Ile Asp Thr Tyr Ala
                245
<210>8
<211>1568
<212>DNA
<213>peniophora lycii
<220>
<221>CDS
<222>(111)..(1427)
<220>
<221>sig_peptide
<222>(111)..(197)
<220>
<221>mat_peptide
<222>(198)..(1427)
<400>8
catcttctgc tctgacctcc atctcgctga gcggccgacg agaacctagg ggctctaagt      60
ccacgtacta tcgccgcgcc tgtgaaggcc ccataccagc ccttatcgat atg gtt        116
                                                       Met Val
tct tcg gca ttc gca cct tcc atc cta ctt agc ttg atg tcg agt ctt       164
Ser Ser Ala Phe Ala Pro Ser Ile Leu Leu Ser Leu Met Ser Ser Leu
        -25                 -20                 -15
gct ttg agc acg cag ttc agc ttt gtt gcg gcg cag cta cct atc ccc       212
Ala Leu Ser Thr Gln Phe Ser Phe Val Ala Ala Gln Leu Pro Ile Pro
    -10                 -5              -1  1               5
gca caa aac aca agt aat tgg ggg cct tac gat ccc ttc ttt ccc gtc       260
Ala Gln Asn Thr Ser Asn Trp Gly Pro Tyr Asp Pro Phe Phe Pro Val
                10                  15                  20
gaa ccg tat gca gct ccg ccg gaa ggg tgc aca gtg aca cag gtc aac       308
Glu Pro Tyr Ala Ala Pro Pro Glu Gly Cys Thr Val Thr Gln Val Asn
            25                  30                  35
ctg att cag agg cac ggc gcg cgt tgg ccc aca tcc ggc gcg cgg tcg       356
Leu Ile Gln Arg His Gly Ala Arg Trp Pro Thr Ser Gly Ala Arg Ser
        40                  45                  50
cgg cag gtc gcc gcc gta gcg aag ata caa atg gcg cga cca ttc acg       404
Arg Gln Val Ala Ala Val Ala Lys Ile Gln Met Ala Arg Pro Phe Thr
    55                  60                  65
gat ccc aag tat gag ttc ctc aac gac ttc gtg tac aag ttc ggc gtc       452
Asp Pro Lys Tyr Glu Phe Leu Asn Asp Phe Val Tyr Lys Phe Gly Val
70                  75                  80                  85
gcc gat ctg cta ccg ttc ggg gct aac caa tcg cac caa acc ggc acc       500
Ala Asp Leu Leu Pro Phe Gly Ala Asn Gln Ser His Gln Thr Gly Thr
                90                  95                  100
gat atg tat acg cgc tac agt aca cta ttt gag ggc ggg gat gta ccc       548
Asp Met Tyr Thr Arg Tyr Ser Thr Leu Phe Glu Gly Gly Asp Val Pro
            105                 110                 115
ttt gtg cgc gcg gct ggt gac caa cgc gtc gtt gac tcc tcg acg aac       596
Phe Val Arg Ala Ala Gly Asp Gln Arg Val Val Asp Ser Ser Thr Asn
        120                 125                 130
tgg acg gca ggc ttt ggc gat gct tct ggc gag act gtt ctc ccg acg       644
Trp Thr Ala Gly Phe Gly Asp Ala Ser Gly Glu Thr Val Leu Pro Thr
    135                 140                 145
ctc cag gtt gtg ctt caa gaa gag ggg aac tgc acg ctc tgc aat aat     692
Leu Gln Val Val Leu Gln Glu Glu Gly Asn Cys Thr Leu Cys Asn Asn
150                 155                 160                 165
atg tgc ccg aat gaa gtg gat ggt gac gaa tcc aca acg tgg ctg ggg     740
Met Cys Pro Asn Glu Val Asp Gly Asp Glu Ser Thr Thr Trp Leu Cly
                170                 175                 180
gtc ttt gcg ccg aac atc acc gcg cga ttg aac gct gct gcg ccg agt     788
Val Phe Ala Pro Asn Ile Thr Ala Arg Leu Asn Ala Ala Ala Pro Ser
            185                 190                 195
gcc aac ctc tca gac agc gac gcg ctc act ctc atg gat atg tgc ccg     836
Ala Asn Leu Ser Asp Ser Asp Ala Leu Thr Leu Met Asp Met Cys Pro
        200                 205                 210
ttc gac act ctc agc tcc ggg aac gcc agc ccc ttc tgt gac cta ttt     884
Phe Asp Thr Leu Ser Ser Gly Asn Ala Ser Pro Phe Cys Asp Leu Phe
    215                 220                 225
acc gcg gag gag tat gtg tcg tac gag tac tac tat gac ctc gac aag     932
Thr Ala Glu Glu Tyr Val Ser Tyr Glu Tyr Tyr Tyr Asp Leu Asp Lys
230                 235                 240                 245
tac tat ggc acg ggc ccc ggg aac gct ctc ggt cct gtc cag ggc gtc     980
Tyr Tyr Gly Thr Gly Pro Gly Asn Ala Leu Gly Pro Val Gln Gly Val
                250                 255                 260
gga tac gtc aat gag ctg ctt gca cgc ttg acc ggc caa gcc gtt cga    1028
Gly Tyr Val Asn Glu Leu Leu Ala Arg Leu Thr Gly Gln Ala Val Arg
            265                 270                 275
gac gag acg cag acg aac cgc acg ctc gac agc gac cct gca aca ttc    1076
Asp Glu Thr Gln Thr Asn Arg Thr Leu Asp Ser Asp Pro Ala Thr Phe
        280                 285                 290
ccg ctg aac cgt acg ttc tac gcc gac ttc tcg cat gat aac acc atg    1124
Pro Leu Asn Arg Thr Phe Tyr Ala Asp Phe Ser His Asp Asn Thr Met
    295                 300                 305
gtg ccc atc ttt gcg gcg ctc ggg ctc ttc aac gcc acc gcc ctc gac    1172
Val Pro Ile Phe Ala Ala Leu Gly Leu Phe Asn Ala Thr Ala Leu Asp
310             315                     320                 325
ccg ctg aag ccc gac gag aac agg ttg tgg gtg gac tct aag ctg gta    1220
Pro Leu Lys Pro Asp Glu Asn Arg Leu Trp Val Asp Ser Lys Leu Val
            330                     335                 340
ccg ttc tct gga cat atg acg gtc gag aag ctg gca tgt tct ggg aag    1268
Pro Phe Ser Gly His Met Thr Val Glu Lys Leu Ala Cys Ser Gly Lys
        345                     350                 355
gag gcg gtc agg gtg ctc gtg aac gac gcg gtg cag ccg ctg gag ttc    1316
Glu Ala Val Arg Val Leu Val Asn Asp Ala Val Gln Pro Leu Glu Phe
    360                     365                 370
tgc gga ggt gtt gat ggg gtg tgc gag ctt tcg gct ttc gta gag agc    1364
Cys Gly Gly Val Asp Gly Val Cys Glu Leu Ser Ala Phe Val Glu Ser
    375                 380                 385
cag acg tat gcg cgg gag aat ggg caa ggc gac ttc gcc aag tgc ggc    1412
Gln Thr Tyr Ala Arg Glu Asn Gly Gln Gly Asp Phe Ala Lys Cys Gly
390                 395                 400                 405
ttt gtt ccg tcg gaa tagcgggaga ccgtctatgc tacacagtaa ttgtgtactc    1467
Phe Val Pro Ser Glu
                410
tatagcactg tagctgtact tacaagtcgt agggtacgat cgtacttacg ctcgtttatt  1527
gatccttcct ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa a                      1568
<210>9
<211>439
<212>PRT
<213>peniophora lycii
<400>9
Met Val Ser Ser Ala Phe Ala Pro Ser Ile Leu Leu Ser Leu Met Ser
                -25                 -20                 -15
Ser Leu Ala Leu Ser Thr Gln Phe Ser Phe Val Ala Ala Gln Leu Pro
            -10                 -5              -1  1
Ile Pro Ala Gln Asn Thr Ser Asn Trp Gly Pro Tyr Asp Pro Phe Phe
    5                   10                  15
Pro Val Glu Pro Tyr Ala Ala Pro Pro Glu Gly Cys Thr Val Thr Gln
20                  25              30                      35
Val Asn Leu Ile Gln Arg His Gly Ala Arg Trp Pro Thr Ser Gly Ala
                40                  45                  50
Arg Ser Arg Gln Val Ala Ala Val Ala Lys Ile Gln Met Ala Arg Pro
            55                  60                  65
Phe Thr Asp Pro Lys Tyr Glu Phe Leu Asn Asp Phe Val Tyr Lys Phe
        70                  75                  80
Gly Val Ala Asp Leu Leu Pro Phe Gly Ala Asn Gln Ser His Gln Thr
    85                  90                  95
Gly Thr Asp Met Tyr Thr Arg Tyr Ser Thr Leu Phe Glu Gly Gly Asp
100                 105                 110                 115
Val Pro Phe Val Arg Ala Ala Gly Asp Gln Arg Val Val Asp Ser Ser
                120                 125                 130
Thr Asn Trp Thr Ala Gly Phe Gly Asp Ala Ser Gly Glu Thr Val Leu
            135                 140                 145
Pro Thr Leu Gln Val Val Leu Gln Glu Glu Gly Asn Cys Thr Leu Cys
        150                 155                 160
Asn Asn Met Cys Pro Asn Glu Val Asp Gly Asp Glu Ser Thr Thr Trp
    165                 170                 175
Leu Gly Val Phe Ala Pro Asn Ile Thr Ala Arg Leu Asn Ala Ala Ala
180                 185                 190                 195
Pro Ser Ala Asn Leu Ser Asp Ser Asp Ala Leu Thr Leu Met Asp Met
                200                 205                 210
Cys Pro Phe Asp Thr Leu Ser Ser Gly Asn Ala Ser Pro Phe Cys Asp
            215                 220                 225
Leu Phe Thr Ala Glu Glu Tyr Val Ser Tyr Glu Tyr Tyr Tyr Asp Leu
        230                 235                 240
Asp Lys Tyr Tyr Gly Thr Gly Pro Gly Asn Ala Leu Gly Pro Val Gln
    245                 250                 255
Gly Val Gly Tyr Val Asn Glu Leu Leu Ala Arg Leu Thr Gly Gln Ala
260                 265                 270                 275
Val Arg Asp Glu Thr Gln Thr Asn Arg Thr Leu Asp Ser Asp Pro Ala
                280                 285                 290
Thr Phe Pro Leu Asn Arg Thr Phe Tyr Ala Asp Phe Ser His Asp Asn
            295                 300                 305
Thr Met Val Pro Ile Phe Ala Ala Leu Gly Leu Phe Asn Ala Thr Ala
        310                 315                 320
Leu Asp Pro Leu Lys Pro Asp Glu Asn Arg Leu Trp Val Asp Ser Lys
    325                 330                 335
Leu Val Pro Phe Ser Gly His Met Thr Val Glu Lys Leu Ala Cys Ser
340                 345                 350                 355
Gly Lys Glu Ala Val Arg Val Leu Val Asn Asp Ala Val Gln Pro Leu
                360                 365                 370
Glu Phe Cys Gly Gly Val Asp Gly Val Cys Glu Leu Ser Ala Phe Val
            375                 380                 385
Glu Ser Gln Thr Tyr Ala Arg Glu Asn Gly Gln Gly Asp Phe Ala Lys
        390                 395                 400
Cys Gly Phe Val Pro Ser Glu
    405                 410

Claims (20)

1.生产分泌多肽的方法,包括:
(a)在有助于生产多肽的培养基中培养真菌宿主细胞,其中该宿主细胞包含核酸构建体,该核酸构建体包含与编码该多肽的第二核苷酸序列可操作地相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列相对于第二核苷酸序列是外源的,第一核苷酸序列的3′端紧接着第二核苷酸序列的上游,且第一核苷酸序列选自如下组成的组中:
(i)编码具有与SEQ ID NO:1有至少70%同一性的氨基酸序列的信号肽的核苷酸序列;
(ii)与SEQ ID NO:2具有至少70%同源性的核苷酸序列;和
(iii)在严格条件下与SEQ ID NO:2的核苷酸,或其互补链杂交的核苷酸序列,其中严格条件定义为在低于计算的Tm 5℃至10℃的0.9M NaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP和每ml 0.2mg酵母RNA中预杂交、杂交和杂交后洗涤,并在低于计算的Tm 5℃至10℃下,在加0.1%SDS的6XSCC中洗涤15分钟一次并使用6X SSC洗涤两次各15分钟;和
(b)从培养基中分离分泌的多肽。
2.权利要求1的方法,其中第一核苷酸序列编码包含SEQ ID NO:1的氨基酸序列的信号肽。
3.权利要求1的方法,其中第一核苷酸序列编码由SEQ ID NO:1的氨基酸序列组成的信号肽,或其保留指导该多肽进入或通过细胞膜例如进入细胞分泌途径的能力的肽片断。
4.权利要求1的方法,其中第一核苷酸序列由SEQ ID NO:2,或其编码保留指导该多肽进入或通过细胞膜,例如,进入细胞分泌途径的能力的信号肽的子序列组成。
5.根据任一前面权利要求的方法,其中第二核苷酸序列编码对该真菌宿主细胞为天然的多肽。
6.根据权利要求1-4中任一项的方法,其中第二核苷酸序列编码对该真菌宿主细胞为异源的多肽。
7.根据任一前面权利要求的方法,其中该真菌宿主细胞含有一个或多个拷贝的第二核苷酸序列。
8.根据任一前面权利要求的方法,其中第二核苷酸序列编码激素或激素变异体,酶,受体或其部分,抗体或其部分,过敏原或报道分子。
9.根据权利要求8的方法,其中该酶是氧化还原酶,转移酶,水解酶,裂合酶,异构酶,或连接酶。
10.根据权利要求9的方法,其中该酶是氨肽酶,淀粉酶,糖酶,羧肽酶,过氧化氢酶,纤维素酶,纤维二糖水解酶,几丁质酶,角质酶,环糊精糖基转移酶,脱氧核糖核酸酶,内切葡聚糖酶,酯酶,α-半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,α-葡糖苷酶,β-葡糖苷酶,转化酶,漆酶,脂肪酶,甘露糖苷酶,mutanase,氧化酶,果胶降解酶,过氧化物酶,磷脂酶,植酸酶,多酚氧化酶,蛋白水解酶,核糖核酸酶,转谷氨酰胺酶,木聚糖酶,或β-木糖苷酶。
11.根据权利要求8的方法,其中第二核苷酸序列编码过敏原,例如,来自Dermantophagoides pteronyssinus的Der p 1,特别是SEQ ID NO:3中氨基酸19-320或其变异体。
12.根据任一前面权利要求的方法,其中该真菌宿主细胞是丝状真菌宿主细胞,例如曲霉属细胞,例如米曲霉。
13.根据权利要求1-11中任一项的方法,其中该真菌宿主细胞是酵母细胞,例如酵母属细胞,例如,酿酒酵母。
14.核酸构建体,包含与编码多肽的第二核苷酸序列可操作地相连的编码信号肽的第一核苷酸序列,其中第一核苷酸序列相对于第二核苷酸序列是外源的,且第一核苷酸序列的3′端紧接着第二核苷酸序列的上游,且第一核苷酸序列选自如下组成的组中:
(i)编码具有与SEQ ID NO:1有至少70%同一性的氨基酸序列的信号肽的核苷酸序列;
(ii)与SEQ ID NO:2具有至少70%同源性的核苷酸序列;和
(iii)在严格条件下与SEQ ID NO:2的核苷酸,或其互补链杂交的核苷酸序列,其中严格条件定义为在低于计算的Tm 5℃至10℃的0.9M NaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP,和每ml 0.2mg酵母RNA中预杂交、杂交和杂交后洗涤,并在低于计算的Tm 5℃至10℃下,在加0.1%SDS的6XSCC中洗涤15分钟一次并使用6X SSC洗涤两次各15分钟。
15.根据权利要求14的核酸构建体,其中第一核苷酸序列编码包含SEQID NO:1的氨基酸序列的信号肽。
16.根据权利要求15的核酸构建体,其中第一核苷酸序列编码由SEQ IDNO:1的氨基酸序列组成的信号肽,或其保留指导该多肽进入或通过细胞膜例如进入细胞分泌途径的能力的肽片断。
17.根据权利要求14的核酸构建体,其中第一核苷酸序列由SEQ IDNO:2,或其编码保留指导该多肽进入或通过细胞膜例如进入细胞分泌途径的能力的信号肽的子序列组成。
18.含有权利要求14-17中任一项的核酸构建体的重组表达载体。
19.含有权利要求14-17任一项的核酸构建体或权利要求18的表达载体的重组宿主细胞。
20.信号肽用于生产多肽的用途,其中该信号肽由第一核苷酸序列编码且多肽由相对于第一核苷酸序列是外源的第二核苷酸序列编码,且第一核苷酸序列的3′端紧接着第二核苷酸序列的上游,且其中第一核苷酸序列选自如下组成的组中:
(i)编码具有与SEQ ID NO:1有至少70%同一性的氨基酸序列的信号肽的核苷酸序列;
(ii)与SEQ ID NO:2具有至少70%同源性的核苷酸序列;和
(iii)在严格条件下与SEQ ID NO:2的核苷酸,或其互补链杂交的核苷酸序列,其中严格条件定义为在低于计算的Tm 5℃至10℃的0.9M NaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP,和每ml 0.2mg酵母RNA中预杂交、杂交和杂交后洗涤,并在低于计算的Tm 5℃至10℃下,在加0.1%SDS的6X SCC中洗涤15分钟一次并使用6X SSC洗涤两次各15分钟。
CN2005800195723A 2004-06-14 2005-06-14 用于生产多肽的信号肽 Active CN1969041B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DKPA200400917 2004-06-14
DKPA200400917 2004-06-14
PCT/DK2005/000387 WO2005121333A1 (en) 2004-06-14 2005-06-14 Signal peptide for producing a polypeptide

Publications (2)

Publication Number Publication Date
CN1969041A true CN1969041A (zh) 2007-05-23
CN1969041B CN1969041B (zh) 2012-06-20

Family

ID=34956242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2005800195723A Active CN1969041B (zh) 2004-06-14 2005-06-14 用于生产多肽的信号肽

Country Status (7)

Country Link
EP (1) EP1756273B1 (zh)
JP (1) JP4809347B2 (zh)
CN (1) CN1969041B (zh)
AT (1) ATE445009T1 (zh)
DE (1) DE602005017034D1 (zh)
DK (1) DK1756273T3 (zh)
WO (1) WO2005121333A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103443278A (zh) * 2011-03-23 2013-12-11 诺维信公司 生产分泌型多肽的方法
CN105802989A (zh) * 2014-12-31 2016-07-27 江苏众红生物工程创药研究院有限公司 毕赤酵母表达重组蛋白的载体、基因、方法及应用
CN105934514A (zh) * 2013-12-11 2016-09-07 诺维信公司 角质酶变体以及对其进行编码的多核苷酸
CN112205512A (zh) * 2019-07-11 2021-01-12 江南大学 一种低致敏性植物蛋白肉的制备方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2319489B1 (es) * 2007-07-11 2010-02-10 Universidade Da Coruña Cepas de levadura capaces de secretar beta-galactosidasa al medio y su uso para la produccion de biomasa, etanol, beta-galactosidasa y proteinas de interes.
CN103483423B (zh) * 2010-09-17 2015-04-29 上海凯茂生物医药有限公司 一种人工合成的信号肽及其应用
AR085253A1 (es) 2011-02-23 2013-09-18 Danisco Metodo para producir una clorofilasa
CN103930544A (zh) * 2011-11-08 2014-07-16 诺维信公司 酵母中生产古细菌蛋白酶的方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
JP2791418B2 (ja) * 1987-12-02 1998-08-27 株式会社ミドリ十字 異種蛋白質の製造方法、組換えdna、形質転換体
ATE206460T1 (de) 1994-06-03 2001-10-15 Novo Nordisk Biotech Inc Gereinigte myceliophthora laccasen und nukleinsäuren dafür kodierend
ATE294871T1 (de) 1994-06-30 2005-05-15 Novozymes Biotech Inc Nicht-toxisches, nicht-toxigenes, nicht- pathogenes fusarium expressionssystem und darin zu verwendende promotoren und terminatoren
AU3697995A (en) * 1994-10-26 1996-05-23 Novo Nordisk A/S An enzyme with lipolytic activity
ZA9610456B (en) * 1995-12-20 1997-06-20 Novo Nordisk As N-terminally extended proteins expressed in yeast
EP0877801B1 (en) 1996-01-19 2005-04-27 Novozymes Biotech, Inc. Morphological mutants of filamentous fungi
US6292282B1 (en) 1998-08-10 2001-09-18 Templex Technology, Inc. Time-wavelength multiple access optical communication systems and methods
WO2000024883A1 (en) 1998-10-26 2000-05-04 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
CN101676400A (zh) * 2000-07-31 2010-03-24 比洛克西治疗公司 在浮萍中表达生物活性多肽
EP1375664B1 (en) * 2001-03-30 2009-11-04 Ajinomoto Co., Inc. Method for the secretion and production of protein
GB0116460D0 (en) * 2001-07-05 2001-08-29 Celltech R&D Ltd Biological products

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103443278A (zh) * 2011-03-23 2013-12-11 诺维信公司 生产分泌型多肽的方法
CN103443278B (zh) * 2011-03-23 2017-07-04 诺维信公司 生产分泌型多肽的方法
CN105934514A (zh) * 2013-12-11 2016-09-07 诺维信公司 角质酶变体以及对其进行编码的多核苷酸
CN105802989A (zh) * 2014-12-31 2016-07-27 江苏众红生物工程创药研究院有限公司 毕赤酵母表达重组蛋白的载体、基因、方法及应用
CN112205512A (zh) * 2019-07-11 2021-01-12 江南大学 一种低致敏性植物蛋白肉的制备方法

Also Published As

Publication number Publication date
JP4809347B2 (ja) 2011-11-09
EP1756273A1 (en) 2007-02-28
ATE445009T1 (de) 2009-10-15
WO2005121333A1 (en) 2005-12-22
DK1756273T3 (da) 2010-02-01
DE602005017034D1 (de) 2009-11-19
JP2008502354A (ja) 2008-01-31
EP1756273B1 (en) 2009-10-07
CN1969041B (zh) 2012-06-20

Similar Documents

Publication Publication Date Title
CN1262639C (zh) 新的宿主细胞和生产蛋白质的方法
CN1253574C (zh) 来自米曲霉的areA基因和其中areA基因已被修饰的真菌
CN1197965C (zh) 在丝状真菌细胞内构建和筛选目的dna文库
CN1179041C (zh) 改进的植酸酶
CN1128875C (zh) 制备多肽变异体的方法
CN1798848A (zh) 在缺乏酶的黑曲霉突变体中生产生物物质的方法
CN1969041A (zh) 用于生产多肽的信号肽
CN1117151C (zh) 真菌中的核黄素生物合成
CN1526821A (zh) 新的葡糖淀粉酶及编码它的核酸序列
CN1509330A (zh) 具有纤维二糖酶活性的多肽和编码其的多核苷酸
CN1902310A (zh) 具有β-葡糖苷酶活性的多肽和编码所述多肽的多核苷酸
CN1890367A (zh) 耐表面活性剂的纤维素酶及其修饰方法
CN1161461C (zh) 碱性磷酸酶在酵母中的表达
CN1231579C (zh) trichodiene合成酶及其制备方法
CN1836038A (zh) 制备分泌型多肽的方法
CN1195058C (zh) 草酰乙酸水解酶缺陷型真菌宿主细胞
CN1225550C (zh) 表达降低水平的金属蛋白酶的宿主细胞和在蛋白质产生中使用该宿主细胞的方法
CN1852983A (zh) 蛋白质从酵母的分泌
CN1816627A (zh) 生产葡糖淀粉酶的方法及其用途
CN1160465C (zh) 其中areA、pepC和/或pepE基因已被灭活的真菌
CN1329667A (zh) 在制备多肽的方法中有效的真菌转录激活因子
CN1253575C (zh) 用共有翻译起始区序列制备多肽的方法
CN1592785A (zh) 酵母中来自Tritirachium album的重组蛋白酶K的表达
CN1268746C (zh) 用于在真菌细胞中生产多肽的方法
CN1269838C (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant