CN102414323B - 用于生产感兴趣的重组多肽的方法 - Google Patents

用于生产感兴趣的重组多肽的方法 Download PDF

Info

Publication number
CN102414323B
CN102414323B CN201080017888.XA CN201080017888A CN102414323B CN 102414323 B CN102414323 B CN 102414323B CN 201080017888 A CN201080017888 A CN 201080017888A CN 102414323 B CN102414323 B CN 102414323B
Authority
CN
China
Prior art keywords
amino acid
seq
variant
ala
acid whose
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201080017888.XA
Other languages
English (en)
Other versions
CN102414323A (zh
Inventor
诺埃尔·尼古拉斯·玛丽亚·伊丽莎白·佩吉·范
约翰尼斯·安德列什·劳博斯
阿恩·斯达姆
彼得·约瑟夫·艾达·沃恩德沃尔特·范德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN102414323A publication Critical patent/CN102414323A/zh
Application granted granted Critical
Publication of CN102414323B publication Critical patent/CN102414323B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2417Alpha-amylase (3.2.1.1.) from microbiological source
    • C12N9/242Fungal source
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/03Oxidoreductases acting on the CH-OH group of donors (1.1) with a oxygen as acceptor (1.1.3)
    • C12Y101/03004Glucose oxidase (1.1.3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01001Alpha-amylase (3.2.1.1)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及用于生产感兴趣的重组多肽的方法,通过所述方法获得的多肽,重组多核苷酸,表达载体,表达构建体,以及特定信号肽用于生产感兴趣的重组多肽的用途和编码所述特定信号肽的多核苷酸用于生产感兴趣的重组多肽的用途。

Description

用于生产感兴趣的重组多肽的方法
发明领域
本发明涉及用于生产感兴趣的重组多肽的方法,通过所述方法获得的多肽,重组多核苷酸、表达载体、表达构建体,以及特定信号肽用于生产感兴趣的重组多肽的用途和编码所述特定信号肽的多核苷酸用于生产感兴趣的重组多肽的用途。
发明背景
丝状真菌宿主细胞中重组多肽的生产是本领域已知的。目前多肽的生产以多种方式进行。
用于生产重组多肽的现有技术方法是通过发酵包含表达构建体的宿主细胞进行的,所述表达构建体包含与编码感兴趣的多肽的多核苷酸可操作地连接的启动子等等。为了将感兴趣的多肽导向宿主细胞的分泌途径,感兴趣的多肽包含信号序列。在Broekhuijsen et al(Journal of Biotechnology,31(1993)135-145,Broekhuijsen et al;Secretion of heterologous proteins byAspergillus niger:Production of active human interleukin-6 in a proteasedeficient mutant by KEX2-like processing of a glucoamylase-hIL6 fusion protein)中,使用分泌型多肽葡糖淀粉酶的信号序列在Aspergillus niger中表达重组蛋白质。
在工业背景下,需要生产的多肽的高产量。
可以通过提高分泌效率来增强感兴趣的重组多肽的生产产量。
因此,为了增强感兴趣的多肽的生产产量,需要改进分泌效率。
本发明的一个目的是提供改进的用于生产重组多肽的方法。
附图说明
图1描绘了表达载体pGBFINFUA-1(描述于WO2008/000632中)的质粒图谱。pGBFINFUA-1对于质粒pGBFINFUA-3和pGBFINFUA-21来说也是代表性的。相对于amyB启动子序列和编码引入了变体信号序列的α-淀粉酶的A.niger amyB cDNA序列,标出了glaA侧翼区。转化A.niger菌株之前,可以通过用限制性酶NotI消化来去除E.coli DNA。
图2描绘了表达载体pGBFINFUA-6(构建描述于实施例1中)的质粒图谱。pGBFINFUA-6对于质粒pGBFINFUA-8、pGBFINFUA-11、pGBFINFUA-12、pGBFINFUA-13、pGBFINFUA-15、pGBFINFUA-16和pGBFINFUA-18来说也是代表性的。相对于glaA启动子和编码引入了变体信号序列的α-淀粉酶的A.niger amyB cDNA序列,标出了glaA侧翼区。转化A.niger菌株之前,可以通过用限制性酶NotI消化来去除E.coliDNA。
图3描绘了通过单同源重组整合的图示。表达载体包含可选择的amdS标记物,和与amyB基因连接的启动子,所述启动子含有变体信号序列。这些特征侧翼是指导在基因组glaA基因座处整合的glaA基因座的同源区(分别为3’glaA和3”glaA)。
图4描绘了表达不同amyB构建体的A.niger菌株培养液中的α-淀粉酶活性,所有amyB构建体均位于glaA启动子的控制下。描绘了表达amyB构建体的A.niger菌株发酵液中的α-淀粉酶活性,其中不同构建体中的信号序列已被修饰。关于不同构建体的细节可见表1。以相对α-淀粉酶单位[AU]为单位描述α-淀粉酶活性,其中第3天FUA6组3个菌株的FUA-6单拷贝菌株的均值被设为100%。对指出的所有转化体组而言,分离并独立培养三个转化体。
图5描绘了表达两种不同的amyB构建体的A.niger菌株培养液中的α-淀粉酶活性,所述两种不同的amyB构建体均位于amyB启动子的控制下。描述了表达天然amyB构建体(pGBFINFUA-3)的A.niger菌株发酵液中的α-淀粉酶活性,其中根据本发明的方法将amyB信号序列修饰成了经密码子优化的pmeA信号序列(pGBFINFUA-21)。关于两种构建体的细节可见表2。以相对α-淀粉酶单位[AU]为单位描述α-淀粉酶活性,以第3天FUA3组3个菌株的FUA-3-1单拷贝菌株的均值设为100%。对指出的两个转化体组而言,分离并独立培养三个转化体。
图6描述了表达编码P.chrysogenum葡萄糖氧化酶GoxA的两种不同的构建体的A.niger菌株培养液中的葡萄糖氧化酶活性,所述两种不同的构建体均位于glaA启动子的控制下。描述了表达天然goxA构建体(GOX-1-#)的A.niger菌株发酵液中的葡萄糖氧化酶活性,其中根据本发明的方法将经密码子优化的goxA信号序列修饰成了经密码子优化的pmeA信号序列(GOX-2-#)。以相对葡萄糖氧化酶单位[AU]为单位描述葡萄糖氧化酶活性。对指出的两个转化体组而言,分离并独立培养五个转化体。
发明详述
令人惊讶地,我们确定,可以通过使用特定的信号序列改进感兴趣的重组多肽的生产。因此,本发明在第一方面提供了用于生产感兴趣的重组多肽的方法,所述方法包括:
(i)在有助于生产所述多肽的条件下培养丝状真菌宿主细胞,所述丝状真菌宿主细胞包含以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码选自下组的信号肽,所述组由:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
d)SEQ ID NO:39,
e)15到23个氨基酸的SEQ ID NO:39的变体,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同,
f)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
g)SEQ ID NO:44,
h)15到23个氨基酸的SEQ ID NO:44的变体,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同,
i)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
j)SEQ ID NO:34,
k)15到23个氨基酸的SEQ ID NO:34的变体,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同,
l)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸构成,
(ii)以及任选地,从培养基分离所述多肽。
上文所述方法在本文中被称作根据本发明的方法。
根据一个实施方案,在本发明的方法中,信号肽是SEQ ID NO:25。
根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。
根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,在本发明的方法中,信号肽是SEQ ID NO:39。
根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO:39的变体,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。
根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,在本发明的方法中,信号肽是SEQ ID NO:44。
根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO:44的变体,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。
根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,在本发明的方法中,信号肽是SEQ ID NO:34。
根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO:34的变体,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。
根据另一个实施方案,在本发明的方法中,信号肽是15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,在根据本发明的方法中,当信号肽是以下时:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,或
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
优选地,编码SEQ ID NO:25时,第一多核苷酸是根据SEQ ID NO:29的多核苷酸。优选地,编码SEQ ID NO:39时,第一多核苷酸是根据SEQ ID NO:38的多核苷酸。优选地,编码SEQ ID NO:44时,第一多核苷酸是根据SEQ ID NO:43的多核苷酸。优选地,编码SEQ ID NO:34时,第一多核苷酸是根据SEQ ID NO:33的多核苷酸。
优选地,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:25变体是下述变体,其中至少9个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:25变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala。
优选地,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:39的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:39的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2、3和/或5位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:44的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:44的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:34的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:34的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
c)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
e)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
f)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
g)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
h)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Ala,
i)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,
j)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,
k)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,
l)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,
m)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Leu,
n)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
o)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu、Ala,
p)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Ala,
q)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,
r)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,
s)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,
t)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,
u)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Leu。
在上述SEQ ID NO:25的变体(a)到(d)、SEQ ID NO:39的变体(a)和(b),SEQ ID NO:44的变体(a)和(b)和SEQ ID NO:34的变体(a)到(u)中,连续串优选地为10个氨基酸,更优选地为9个氨基酸,进一步更优选地为8个氨基酸,最优选地为7个氨基酸。
在上述SEQ ID NO:25的变体(a)到(d)、SEQ ID NO:39的变体(a)和(b),SEQ ID NO:44的变体(a)和(b)和SEQ ID NO:34的变体(a)到(u)中,氨基酸的连续串优选地包含至少5个选自Ala或Leu的氨基酸,更优选地包含至少6个选自Ala或Leu的氨基酸,最优选地包含至少7个选自Ala或Leu的氨基酸。
15到23个氨基酸的SEQ ID NO:25、SEQ ID NO:39、SEQ ID NO:44或SEQ ID NO:34的变体可包含15个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸或23个氨基酸。
由上文所述第一多核苷酸编码的信号肽在本文中被称作根据本发明的信号肽。
“肽”或“寡肽”在本文中是指由至少两个氨基酸组成的分子,所述至少两个氨基酸在线性链中排列,并通过相邻氨基酸残基羧基与氨基之间的肽键接合在一起。术语“肽”和“寡肽”被认为是同义的(如所公认的那样),并且每个术语可以根据上下文的需要可交换地使用。“多肽”在本文中是指包含至少40个氨基酸的分子。
在本发明的上下文中,术语“信号肽”在本文中被定义为引导多肽进入宿主细胞分泌途径的肽。信号序列通常但不必须存在于多肽的氨基端,与多肽以符合读码框的方式融合。信号肽和多肽的氨基端之间可存在前肽(propeptide)。信号序列通常但不必须在分泌过程期间从多肽上被切下,得到成熟的多肽。本领域技术人员已知如何鉴定信号序列。可以获得多种工具和大量文献。不应理解为本发明的限制的例子是:
A new method for predicting signal sequence cleavage sites.von Heijne G.Nucleic Acids Res.1986 Jun 11;14(11):4683-90.
Identification of prokaryotic and eukaryotic signal peptides and predictionof their cleavage sites.Henrik Nielsen,Jacob Engelbrecht,Brunak andGunnar von Heijne.Protein Engineering,10:1-6,1997.
Locating proteins in the cell using TargetP,SignalP,and related tools.OlofEmanuelsson,Brunak,Gunnar von Heijne,Henrik Nielsen.NatureProtocols 2,953-971(2007).
网站:http://www.cbs.dtu.dk/services/SignalP/
术语“前肽”在本文中被定义为与多肽氨基端以符合读码框的方式融合的肽。得到的多肽已知为前多肽,并且可以通过从前多肽上催化切割或自动催化切割前肽而被转化为成熟的多肽。
信号肽和前肽一起在本文中被称作“前肽原(prepropeptide)”,信号序列以符合读码框的方式与前肽融合,前肽以符合读码框的方式与多肽的氨基端融合。
信号肽、前肽和前肽原在本领域中有时被称作“前导序列”。
术语“成熟多肽”在本文中被定义为在翻译、翻译后修饰(例如N-端加工、C-端加工、糖基化、磷酸化和任选的通过切割去除前导序列)之后为最终形式的多肽。
在本发明的上下文中,术语“多肽”和“蛋白质”是相同的,并且在本发明的说明书通篇中可以互换理解。
在本发明的上下文中,“重组体”是指不排外地涉及天然存在的过程的任何遗传修饰和/或通过对宿主细胞进行随机诱变诱导的遗传修饰。因此,重组体和天然存在的过程和/或通过对宿主细胞进行随机诱变诱导的遗传修饰的组合被认为是重组体。优选地,重组体遗传修饰不涉及天然存在的过程和/或通过对宿主细胞进行随机诱变诱导的遗传修饰。
术语“可操作地连接”在本文中被定义为一种构型,其中控制序列相对于编码序列被置于适当的位置上,使得控制序列指导编码序列的表达。
术语“编码序列”在本文中被定义为下述序列,所述序列被转录成mRNA并翻译成根据本发明的多肽。编码序列的界限通常由mRNA 5’-侧的ATG或其他起始密码子和mRNA 3′-侧终止开放读码框的翻译终止密码子序列决定。编码序列可包括但不限于DNA、cDNA和重组核酸序列。
术语“变体肽”或“变体多肽”在本文中被定义为分别在肽或多肽的一个或多个特定位置上包含一个或多个改变(例如一个或多个特定氨基酸残基的取代、插入、缺失和/或截短)的肽或多肽。相应地,变体信号肽是在信号肽的一个或多个特定位置上包含一个或多个改变(例如一个或多个特定氨基酸残基的取代、插入、缺失和/或截短)的信号肽。
根据本发明的变体信号肽的相应位置由与参照序列例如信号肽SEQID NO:25、SEQ ID NO:39、SEQ ID NO:44或SEQ ID NO:34的比对决定。适用时,可以使用本领域中已知的方法进行肽、多肽或多核苷酸的比对或多重比对。此类方法包括但不限于ClustalW(Thompson et al,1994,Nucleic Acid Research 22,4673-4680),BLAST,GAP,MAP,MultiBLAST,andSmith Waterman。
术语“多核苷酸”与术语“核酸分子”相同,并且在本文中可互换理解。该术语是指多核苷酸分子,其为单链或双链的核糖核酸(RNA)或脱氧核糖核酸(DNA)分子。多核苷酸可以分离形式存在,或者可包含在重组核酸分子或载体中,或包含在宿主细胞中。
术语“变体多核苷酸”在本文中被定义为在多核苷酸中一个或多个特定位置上包含一个或多个改变(例如一个或多个核苷酸的取代、插入、缺失和/或截短)的多核苷酸。
根据本发明的信号肽可以与第二多核苷酸编码的感兴趣的多肽天然结合,或者可以对第二多核苷酸编码的感兴趣的多肽而言是外源的。优选地,根据本发明的信号肽对第二多核苷酸编码的感兴趣的多肽而言是外源的。变体信号肽在本文中被定义为对第二多核苷酸编码的感兴趣的多肽而言是外源的。
可以通过使用本领域已知的标准分子克隆技术,通过用根据本发明的信号肽物理替换编码天然结合的信号肽的多核苷酸,将与感兴趣的多肽天然结合的信号肽替换为根据本发明的信号肽。所述方法详尽描述于Sambrook & Russell,Molecular Cloning:A Laboratory Manual,3rd Ed.,CSHLPress,Cold Spring Harbor,NY,2001和Ausubel et al.,Current Protocols inMolecular Biology,Wiley InterScience,NY,1995中。
或者,可以使用本领域已知的方法(见例如上文Sambrook &Russel),通过编码天然结合的信号肽的位点特异性诱变,将与感兴趣的多肽天然结合的信号肽转化为根据本发明的信号肽。
根据本发明的信号肽对丝状真菌宿主细胞而言可以是天然的或外源的。优选地,根据本发明的信号肽对丝状真菌宿主细胞而言是天然的。
优选地,在相同条件下培养时,与由与编码其天然信号肽的多核苷酸以符合翻译读码框的方式连接的第二多核苷酸编码的感兴趣的多肽相比,根据本发明的方法生产了至少多10%、更优选地至少多25%、进一步更优选地至少多50%、进一步更优选地至少多75%、进一步更优选地至少多100%、进一步更优选地至少多200%、最优选地至少多500%的由与编码根据本发明的信号肽的第一多核苷酸以符合翻译读码框的方式连接的第二多核苷酸编码的感兴趣的重组多肽。
可以通过本领域技术人员已知的一般方法提供编码感兴趣的多肽的第二多核苷酸。此类方法详尽描述于上文Sambrook & Russell中。所述方法的例子如下。当第二多核苷酸的序列已知时,或所编码的感兴趣的多肽的序列已知时,可以从天然表达所述多核苷酸的宿主细胞中分离所述多核苷酸。或者,可以化学合成多核苷酸。例如下文所述的密码子优化方法可被用于适应所选择的宿主细胞的密码子使用。如果多肽的序列未知,则可首先使用本领域已知的方法确定序列(上文Sambrook & Russel)。
组合或单独的本文多核苷酸(即以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码信号肽;或单独的第一多核苷酸或单独的第二多核苷酸)可以是合成的多核苷酸。合成的多核苷酸可以按照密码子使用被优化,优选地根据WO2006/077258和/或PCT/EP2007/055943中所述的方法被优化,所述参考文献通过引用并入本文。PCT/EP2007/055943介绍了密码子对优化。密码子对优化是这样一种方法:其中编码多肽的核苷酸序列根据其密码子使用、尤其是使用的密码子对而被修饰,以获得编码多肽的核苷酸序列经改进的表达和/或所编码的多肽的经改进的生产。密码子对被定义为编码序列中一组两个连续的三联体(密码子)。
组合或单独的本文多核苷酸(即以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码信号肽;或单独的第一多核苷酸或单独的第二多核苷酸)可包含一个或多个内含子。
将多核苷酸以符合翻译读码框的方式彼此连接的方法在本领域中已知为一般克隆技术(Sambrook & Russell,上文)。例子是消化、连接、PCR、化学合成等等。因此,可以通过本领域已知的此类方法孔昂第一多核苷酸与第二多核苷酸以符合翻译读码框的方式连接。
可以使用本领域已知的方法构建下述丝状真菌宿主细胞,所述丝状真菌宿主细胞包含以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据本发明的信号肽。优选地,通过下述方法构建所述丝状真菌宿主细胞,所述方法包括:
-提供合适的丝状真菌宿主细胞,和
-用以符合翻译读码框的方式与所述第二多核苷酸连接的所述第一多核苷酸转化所述宿主细胞。
优选地通过本领域公知的技术(见Sambrook & Russell;Ausubel,上文),通过将多核苷酸、表达载体或核酸构建体引入细胞中,来进行宿主细胞的转化。转化可涉及由以下组成的方法:以本身已知的方式形成原生质体、转化原生质体和再生细胞壁。用于转化Aspergillus细胞的合适程序描述于EP 238 023和Yelton et al.,1984,Proceedings of the NationalAcademy of Sciences USA 81:1470-1474中。使用Agrobacterium tumefaciens转化Aspergillus和其他丝状真菌宿主细胞的合适步骤描述于例如De Grootet al.,Agrobacterium tumefaciens-mediated transformation of filamentous fungi.Nat Biotechnol.1998,16:839-842.Erratum in:Nat Biotechnol 1998 16:1074中。转化Fusarium物种的合适方法由Malardier et al.,1989,Gene78:147156描述或描述于WO 96/00787中。可以应用其他方法,例如使用如描述于Christiansen et al.,Biolistic transformation of the obligate plantpathogenic fungus,Erysiphe graminis f.sp.hordei.1995,Curr Genet.29:100-102中的生物射弹转化。可以使用Becker and Guarente,In Abelson,J.N.andSimon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methodsin Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito et al.,1983,Journal of Bacteriology 153:163;和Hinnen et al.,1978,Proceedings of the National Academy of Sciences USA 75:1920中描述的步骤转化酵母。
使用本领域已知的方法,在适合生产感兴趣的重组多肽的营养培养基中培养根据本发明的丝状真菌宿主细胞。例如,可以在合适的培养基中和允许多肽表达和/或分离的条件下,通过在实验室或工业发酵罐中进行的摇瓶培养、小规模或大规模发酵(包括连续、分批、进料分批或固体状态发酵)来培养细胞。使用本领域已知的程序(见例如Bennett,J.W.andLaSure,L.,eds.,More Gene Manipulations in Fungi,Academic Press,CA,1991),在包含碳源和氮源和无机盐的合适营养培养基中进行培养。合适的培养基可来自商业供应商,或者可以使用(例如American Type CultureCollection产品目录中)公开的组合物制备。如果多肽被分泌进营养培养基中,则多肽可从培养基中直接回收。如果多肽不被分泌,则从细胞裂解物中回收。
可以通过本领域已知的方法从培养基中回收生产的感兴趣的重组多肽。例如,可以通过常规步骤从培养基中回收多肽,所述常规步骤包括但不限于离心、过滤、萃取、喷雾干燥、蒸发或沉淀。
可以通过本领域已知的多种程序纯化感兴趣的重组多肽,所述程序包括但不限于色谱法(例如离子交换、亲合、疏水、色谱聚焦和尺寸排除)、电泳程序(例如制备的等电位聚焦)、差异溶解度(例如硫酸铵沉淀)、SDS-PAGE或萃取(见例如Protein Purification,J.-C.Janson and LarsRyden,editors,VCH Publishers,New York,1989)。
可以使用本领域已知的对多肽特异性的方法来检测感兴趣的重组多肽。这些检测方法可包括使用特异性抗体、高效液相色谱、毛细色谱、电泳、酶产物的形成、或酶底物的消失。
根据本发明的宿主细胞是丝状真菌宿主细胞。“丝状真菌”包括(如Hawksworth et al.,In,Ainsworth and Bisby′s Dictionary of The Fungi,8thedition,1995,CAB International,University Press,Cambridge,UK所定义的)Eumycota和Oomycota亚门的所有丝状形式。丝状真菌的特征是由甲壳质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝壁。营养生长通过菌丝伸长进行,并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、Sporotrichum、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium和Trichoderma的菌株。
优选的丝状真菌细胞属于Acremonium、Aspergillus、Chrysosporium、Myceliophthora、Penicillium、Sporotrichum、Talaromyces、Thielavia或Trichoderma属的种,最优选地属于Acremonium alabamensis、Aspergillusniger、Aspergillus awamori、Aspergillus foetidus、Aspergillus sojae、Aspergillus fumigatus、Aspergillus oryzae、Chrysosporium lucknowense、Myceliophthora thermophila、Sporotrichum cellulophilum、Thielaviaterrestris、Trichoderma reesei、Talaromyces emersonii或Penicilliumchrysogenum的种。
丝状真菌的若干菌株是公众能够容易地从大量培养物保藏机构例如American Type Culture Collection(ATCC)、Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH(DSM)、Centraalbureau VoorSchimmelcultures(CBS)和Agricultural Research Service Patent CultureCollection,Northern Regional Research Center(NRRL)获得的,Aspergillusniger CBS 513.88、Aspergillus oryzae ATCC 20423、IFO 4177、ATCC1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892,P.chrysogenum CBS 455.95,Penicillium citrinum ATCC 38065,Penicilliumchrysogenum P2,Acremonium chrysogenum ATCC 36225或ATCC 48272,Trichoderma reesei ATCC 26921或ATCC 56765或ATCC 26921,Aspergillus sojae ATCC11906,Chrysosporium lucknowense ATCC44006,Talaromyces emersonii CBS393.64或CBS814.70及其衍生物。
任选地,宿主细胞包含与野生型细胞相比提高的解折叠蛋白应答(UPR),以增强感兴趣的多肽的生产能力。可以通过US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2和/或WO2005/123763中描述的技术提高UPR。更特定地,为了获得具有提高的UPR的宿主细胞,调控了HAC1和/或IRE1和/或PTC2的蛋白质水平,和/或改造了SEC61蛋白质。
或者,或与提高的UPR组合,对宿主细胞进行遗传修饰,以获得与野生型细胞相比展示更低蛋白酶表达和/或蛋白酶分泌的表型,从而增强感兴趣的多肽的生产能力。此类表型可以通过蛋白酶表达的转录调节子的缺失和/或修饰和/或失活来获得。此类转录调节子可以是例如prtT。通过调控prtT来降低蛋白酶的表达可以通过US2004/0191864A1中描述的技术进行。
或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌的表型组合,宿主细胞展示了草酸盐缺陷型表型,从而增强感兴趣的多肽的生产产量。草酸盐缺陷型表型可以通过WO2004/070022A2中描述的技术获得。
或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型组合,宿主细胞展示了与野生型相比的表型差异的组合,以增强感兴趣的多肽的生产产率。这些差异可包括但不限于,降低的葡糖淀粉酶和/或中性α-淀粉酶A和/或中性α-淀粉酶B蛋白酶和草酸水解酶的表达。宿主细胞展示的所述表型差异可以通过根据US2004/0191864A1中所述技术的遗传修饰获得。
或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型和与野生型相比为了增强感兴趣的多肽生产产率的表型差异的组合相组合,宿主细胞展示毒素基因的缺陷,使得丝状真菌宿主细胞失去表达毒素的能力。此类毒素包括但不限于,赭曲毒素,烟曲霉毒素,环并偶氮酸(cyclapiazonic acid),3-硝基丙酸,布洛芬,畸形素,黄曲霉毒素和黑麦酸。此类缺陷优选地例如描述于WO2000/039322中。
感兴趣的多肽可以是具有感兴趣的生物活性的任何多肽。多肽对宿主细胞而言可以是天然的或异源的。异源的多肽在本文中被定义为对宿主细胞而言并非天然的多肽,或者其中进行了结构修饰以改变多肽的天然多肽。多肽可以是胶原或明胶,或其变体或杂种(hybrid)。多肽可以是任何抗体或其部分,抗原,凝血因子,酶,激素或激素变体,受体或其部分,调节蛋白,结构蛋白,报告蛋白,或转运蛋白,天然涉及分泌过程的蛋白质,涉及折叠过程的蛋白质,伴侣蛋白,肽氨基酸转运蛋白,糖基化因子,转录因子,寡肽,天然是细胞内的蛋白质。天然是细胞内的蛋白质可以是酶例如蛋白酶、神经酰胺酶、环氧化物水解酶、氨肽酶、酰基转移酶、醛缩酶、羟化酶、氨肽酶、脂肪酶。感兴趣的重组多肽优选地是细胞外分泌的酶。此类酶可属于氧化还原酶、转移酶、水解酶、裂合酶、异构酶、连接酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、聚糖酶、酯酶的组。酶可以是糖酶,例如纤维素酶如内切葡聚糖酶,β-葡聚糖酶,纤维二糖水解酶或β-葡糖苷酶,半纤维素酶或果胶分解酶如木聚糖酶,木糖苷酶,甘露聚糖酶,半乳聚糖酶,半乳糖苷酶,果胶甲基酯酶,果胶裂合酶,果胶酸裂合酶,内切多聚半乳糖醛酸酶,外切多聚半乳糖醛酸酶,鼠李半乳糖醛酸酶,阿拉伯聚糖酶,阿拉伯呋喃糖苷酶(arabinofuranosidases),阿拉伯木聚糖水解酶,半乳糖醛酸酶,裂合酶,或淀粉酶;水解酶,异构酶,或连接酶,磷酸酶如植酸酶,酯酶如脂肪酶,蛋白水解酶,氧化还原酶如氧化酶,转移酶,或异构酶。酶可以是植酸酶。酶可以是天冬酰胺酶,氨肽酶,淀粉酶,糖酶,羧肽酶,内切蛋白酶,金属蛋白酶,丝氨酸-蛋白酶接触酶,几丁质酶,角质酶,环糊精糖基转移酶,脱氧核糖核酸酶,酯酶,α-半乳糖苷酶,β-半乳糖苷酶,葡萄糖淀粉酶,α-葡糖苷酶,β-葡糖苷酶,卤素过氧化物酶(haloperoxidase),蛋白水解酶,转化酶,漆酶,脂肪酶,甘露糖苷酶,变构酶,氧化酶,果胶分解酶,过氧化物酶,磷脂酶,多酚氧化酶,核糖核酸酶,转谷氨酰胺酶,或葡萄糖氧化酶,己糖氧化酶,单加氧酶。
多肽还包括上述多肽的天然存在的等位基因变异和经改造的变异。
根据本发明,感兴趣的多肽也可以是融合的多肽或杂种多肽,另一多肽在所述多肽或其片段的N-端或C-端与之融合。融合的多肽通过将编码一种多肽的核酸序列与编码另一多肽的核酸序列(或其部分)融合来生产。
杂种多肽可包含得自至少两种不同多肽的部分或全部多肽序列的组合,其中所述至少两种不同多肽中的一种或多种对宿主细胞而言可以是异源的。
根据本发明的方法被便利地用于生产感兴趣的重组多肽。
因此,在第二方面中,本发明涉及通过根据本发明第一方面的方法生产的感兴趣的重组多肽。优选地,所述多肽是如上文所述的酶。
本发明还涉及中间产物,即由于第二多核苷酸以符合翻译读码框的方式连接的第一多核苷酸编码的感兴趣的多肽,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据本发明的信号肽。感兴趣的多肽优选地是本发明第一方面中描述的感兴趣的多肽。
优选地,信号肽是选自下组的信号肽,所述组由:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
d)SEQ ID NO:39,
e)15到23个氨基酸的SEQ ID NO:39的变体,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同,
f)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
g)SEQ ID NO:44,
h)15到23个氨基酸的SEQ ID NO:44的变体,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同,
i)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
j)SEQ ID NO:34,
k)15到23个氨基酸的SEQ ID NO:34的变体,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同,
l)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸构成。
根据一个实施方案,在中间产物中,信号肽是SEQ ID NO:25。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,在中间产物中,信号肽是SEQ ID NO:39。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:39的变体,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,在中间产物中,信号肽是SEQ ID NO:44。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:44的变体,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,在中间产物中,信号肽是SEQ ID NO:34。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:34的变体,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,在中间产物中,当信号肽是以下时:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,或
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
优选地,编码SEQ ID NO:25时,第一多核苷酸是根据SEQ ID NO:29的多核苷酸。优选地,编码SEQ ID NO:39时,第一多核苷酸是根据SEQ ID NO:38的多核苷酸。优选地,编码SEQ ID NO:44时,第一多核苷酸是根据SEQ ID NO:43的多核苷酸。优选地,编码SEQ ID NO:34时,第一多核苷酸是根据SEQ ID NO:33的多核苷酸。
优选地,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:25的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:25的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala。
优选地,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:39的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:39的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2、3和/或5位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:44的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:44的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:34的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:34的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
c)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
e)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
f)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
g)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
h)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Ala,
i)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,
j)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,
k)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,
l)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,
m)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Leu,
n)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
o)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu、Ala,
p)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Ala,
q)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,
r)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,
s)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,
t)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,
u)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Leu。
在上述SEQ ID NO:25的变体(a)到(d)、SEQ ID NO:39的变体(a)和(b),SEQ ID NO:44的变体(a)和(b)和SEQ ID NO:34的变体(a)到(u)中,连续串优选地为10个氨基酸,更优选地为9个氨基酸,进一步更优选地为8个氨基酸,最优选地为7个氨基酸。
在上述SEQ ID NO:25的变体(a)到(d)、SEQ ID NO:39的变体(a)和(b),SEQ ID NO:44的变体(a)和(b)和SEQ ID NO:34的变体(a)到(u)中,氨基酸的连续串优选地包含至少5个选自Ala或Leu的氨基酸,更优选地包含至少6个选自Ala或Leu的氨基酸,最优选地包含至少7个选自Ala或Leu的氨基酸。
15到23个氨基酸的SEQ ID NO:25、SEQ ID NO:39、SEQ ID NO:44或SEQ ID NO:34变体可包含15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸或23个氨基酸。
在第三方面中,本发明涉及包含以下的重组表达构建体:以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据本发明的信号肽。感兴趣的多肽优选地是本发明第一方面中描述的感兴趣的多肽。
优选地,当信号肽是以下时:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,或
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
优选地,编码SEQ ID NO:25时,第一多核苷酸是根据SEQ ID NO:29的多核苷酸。优选地,编码SEQ ID NO:39时,第一多核苷酸是根据SEQ ID NO:38的多核苷酸。优选地,编码SEQ ID NO:44时,第一多核苷酸是根据SEQ ID NO:43的多核苷酸。优选地,编码SEQ ID NO:34时,第一多核苷酸是根据SEQ ID NO:33的多核苷酸。
本发明还涉及还包含以下的所述重组表达构建体:与以符合读码框的方式与第二多核苷酸连接的第一多核苷酸可操作地连接的启动子,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据本发明的信号肽。感兴趣的多肽优选地是本发明第一方面中描述的感兴趣的多肽。
本发明还涉及包含上文所述的表达构建体的重组表达载体。
术语“核酸构建体”在本文中是指单链或双链的核酸分子,其与天然存在的基因分离,或者已被修饰为含有下述核酸区段,所述核酸区段以天然不会存在的方式组合和并置。当核酸构建体含有表达编码序列所需的所有控制序列(其中所述控制序列与所述编码序列可操作地连接)时,术语“核酸构建体”与术语“表达盒”同义。
术语“控制序列”在本文中被定义为包括对mRNA和/或多肽的体外表达或在宿主细胞中的表达而言必需的或有利的所有组件。每种控制序列对编码多肽的核酸序列而言可以是内源的或外源的。此类控制序列可包括,但不限于Shine-Delgarno序列、最适翻译起始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870中所述)、多聚腺苷酸化序列、启动子和转录终止子。控制序列至少包括启动子以及转录和翻译终止信号。可以针对其特定的用途优化控制序列。优选地,DNA构建体包含启动子DNA序列,与所述启动子DNA序列可操作地连接的编码序列,和控制序列例如:
-一个选自以下序列列表的由5’朝向3’方向的翻译终止序列:TAAG、TAGA和TAAA,优选地TAAA,和/或
-一个选自以下序列列表的由5’朝向3’方向的翻译起始子编码序列:GCTACCCCC;GCTACCTCC;GCTACCCTC;GCTACCTTC;GCTCCCCCC;GCTCCCTCC;GCTCCCCTC;GCTCCCTTC;GCTGCCCCC;GCTGCCTCC;GCTGCCCTC;GCTGCCTTC;GCTTCCCCC;GCTTCCTCC;GCTTCCCTC;和GCTTCCTTC,优选地GCT TCC TTC,和/或
-选自以下序列列表的翻译起始子序列:5’-mwChkyCAAA-3’;5’-mwChkyCACA-3’或5’-mwChkyCAAG-3’,使用核苷酸的模糊编码:m(A/C);w(A/T);y(C/T);k(G/T);h(A/C/T),优选地5’-CACCGTCAAA-3’或5’-CGCAGTCAAG-3’。
在本发明的上下文中,术语“翻译起始子编码序列”被定义为DNA编码序列开放读码框起始子或起始密码子紧下游的9个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG,但是也可以是任何功能性起始密码子如GTG。
在本发明的上下文中,术语“翻译终止序列”被定义为从开放读码框或核苷酸编码序列3’端的翻译终止密码子开始并按5’到3’方向的四个核苷酸。
在本发明的上下文中,术语“翻译起始子序列”被定义为编码多肽的DNA序列开放读码框的起始子或起始密码子紧上游的十个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG,但是也可以是任何功能性起始密码子如GTG。本领域公知在RNA中尿嘧啶U代替脱氧核苷酸胸腺嘧啶T。
可以为了引入特定的限制性位点而对控制序列提供连接子,所述特定的限制性位点有助于将控制序列与编码多肽的核酸序列的编码区连接。控制序列可以是合适的启动子序列,启动子序列是被宿主细胞识别用于表达核酸序列的核酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子可以是在细胞中显示转录活性的任何核酸序列,包括突变、截短和杂种的启动子,并且可得自编码对细胞而言同源或异源的细胞外或细胞内多肽的基因。
控制序列也可以是合适的转录终止子序列,这是被丝状真菌细胞识别为终止转录的序列。终止子序列与编码多肽的核酸序列的3′-端可操作地连接。本发明中可以使用在细胞中发挥功能的任何终止子。
对丝状真菌细胞而言优选的终止子得自编码以下的基因:A.oryzaeTAKA淀粉酶、A.niger葡糖淀粉酶(glaA)、A.nidulans邻氨基苯甲酸合酶、A.niger α-葡糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶样蛋白酶。
控制序列也可以是多聚腺苷酸化序列,这是与核酸序列3′-端可操作地连接的序列,其转录后被丝状真菌细胞识别为对所转录的mRNA添加多聚腺苷残基的信号。本发明中可以使用在细胞中有功能的任何多聚腺苷酸化序列。
对丝状真菌细胞而言优选的多聚腺苷酸化序列得自编码以下的基因:A.oryzae TAKA淀粉酶、A.niger葡糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、Fusarium oxysporum胰蛋白酶样蛋白酶和A.niger α-葡糖苷酶。
术语“启动子”在本文中被定义为结合RNA聚合酶并指导聚合酶到达编码生物化合物的核酸序列的正确下游转录起始位点处从而起始转录的DNA序列。RNA聚合酶有效地催化与编码区的适当DNA链互补的信使RNA的装配。术语“启动子”还可被理解为包括在转录成mRNA后用于翻译的5′-非编码区(启动子和翻译起点之间),顺式作用转录控制元件如增强子,和能够与转录因子相互作用的其他核苷酸序列。启动子可以是适用于真核或原核宿主细胞的任何合适的启动子序列,其显示转录活性,包括突变、截短和杂种的启动子,并且可得自编码对细胞而言同源(天然)或异源(外源)的细胞外或细胞内多肽的基因。启动子可以是组成型或诱导型启动子。可以使用的诱导型启动子的例子是淀粉诱导型启动子、铜诱导型启动子、油酸诱导型启动子。启动子可选自下组,所述组包括但不限于下述启动子,所述启动子得自编码以下的基因:A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸稳定性α-淀粉酶、A.niger或A.awamori葡糖淀粉酶(glaA)、R.miehei脂肪酶、A.oryzae碱性蛋白酶、A.oryzae磷酸丙糖异构酶、A.nidulans乙酰胺酶、NA2-tpi启动子(来自编码A.niger中性α-淀粉酶和A.oryzae磷酸丙糖异构酶的基因的启动子的杂种),及其突变、截短和杂种的启动子。在丝状真菌细胞中使用的尤其优选的启动子是来自蛋白酶基因的启动子或其功能性部分;例如来自F.oxysporum胰蛋白酶样蛋白酶基因(U.S.4,288,627)、A.oryzae碱性蛋白酶基因(alp)、A.niger pacA基因、A.oryzae碱性蛋白酶基因、A.oryzae中性金属蛋白酶基因、A.niger曲霉肽酶蛋白酶pepA基因或F.venenatum胰蛋白酶基因、A.niger天冬氨酸蛋白酶pepB基因。其他优选的启动子是WO2006/092396和WO2005/100573中描述的启动子,所述参考文献通过引用并入本文。
当感兴趣的重组多肽是由两个或更多多肽(部分)组成的嵌合多肽时,本领域技术人员已知如何使用本领域已知的方法构建这些和其他嵌合多核苷酸构建体。
为了促进表达和/或翻译,根据本发明的多核苷酸或核酸构建体可包含在表达载体中,使得本发明的多核苷酸与用于在体外、或原核或真核宿主细胞中表达和/或翻译的适当控制序列可操作地连接。
重组表达载体可以是任何载体(例如质粒或病毒),可对其便利地进行重组DNA程序,并且可导致编码多肽的核酸序列的表达。载体的选择典型地应取决于载体与引入所述载体的宿主细胞的相容性。载体可以是线性或闭合环状质粒。载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微型染色体、或人工染色体。自主维持的克隆载体可包含AMA1-序列(见例如Aleksenko and Clutterbuck(1997),Fungal Genet.Biol.21:373-397)。
或者,载体可以是在引入宿主细胞后被整合进基因组中并与整合了所述载体的染色体一起复制的载体。整合型克隆载体可在宿主细胞染色体中随机整合,或在预定的靶基因座处整合。在本发明的一个优选的实施方案中,整合型克隆载体包含与宿主细胞基因组中预定的靶基因座中的DNA序列同源的DNA片段,从而将克隆载体整合至该预定的基因座。为了促进定向整合,在转化细胞之前优选地将克隆载体线性化。优选地以下述方式进行线性化,所述方式使得克隆载体的至少一端,优选地任一端的侧翼是与靶基因座同源的序列。靶基因座侧翼的同源序列的长度优选地至少为30bp,优选地至少为50bp,优选地至少为0.1kb,进一步优选地至少为0.2kb,更优选地至少为0.5kb,进一步更优选地至少为1kb,最优选地至少2kb。优选地,通过宿主细胞增强的同源重组能力提高了定向整合进宿主细胞基因组中(即在预定的靶基因座中整合)的效率。细胞的此类表型优选地涉及如WO2005/095624中所述的缺陷型ku70基因。WO2005/095624公开了获得包含提高的定向整合效率的丝状真菌细胞的一种优选的方法。优选地,克隆载体中与靶基因座同源的同源侧翼DNA序列源自高度表达的基因座,即它们源自能够在宿主细胞中具有高表达水平的基因。能够具有高表达水平的基因(即高度表达的基因)在本文中被定义为例如在被诱导的条件下,其mRNA能够组成总细胞mRNA的至少0.5%(w/w)的基因,或者其基因产物能够组成总细胞蛋白质的至少1%(w/w)的基因,或者在分泌型基因产物的情况下,可以分泌到至少0.1g/l的水平(如EP 357 127 B1中所述)。通过举例给出了大量优选的高度表达的真菌基因:来自Aspergilli或Trichoderma的淀粉酶、葡糖淀粉酶、醇脱氢酶、木聚糖酶、磷酸甘油醛脱氢酶或纤维二糖水解酶(cbh)基因。用于这些目的的最优选的高度表达的基因是葡糖淀粉酶基因,优选地为A.niger葡糖淀粉酶基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、Trichoderma reesei cbh基因,优选地为cbh1。
可以向细胞中插入多于一个拷贝的核酸序列,以提高基因产物的生产。这可以如下完成:优选地通过向其基因组中整合进多个拷贝的DNA序列来完成,更优选地通过将DNA序列的整合靶向至在前一段中定义的高度表达的基因座之一处来完成。或者这可以如下完成:包括可扩增的可选择标记物基因与核酸序列,其中含有被扩增的可选择标记物基因拷贝、从而存在额外的核酸序列拷贝的细胞可以通过在存在适当的可选择试剂时培养细胞而被选择。为了进一步提高要过表达的DNA序列的拷贝数,可以使用如WO98/46772中所述的基因转化基因。
载体系统可以是单个载体或质粒,或两个或更多的载体或质粒,它们一起含有要被引入宿主细胞基因组中的总DNA,或是转座子。
载体优选地含有一个或多个可选择标记物,所述可选择标记物允许容易地选择被转化的细胞。可选择标记物是一种基因,其产物提供杀生物性或病毒抗性、对重金属的抗性、对营养缺陷型的自养型等等。丝状真菌细胞中使用的可选择标记物可选自下组,所述组包括但不限于:amdS(乙酰胺酶),argB(鸟氨酸氨甲酰转移酶),bar(膦丝菌素乙酰转移酶),bleA(腐草霉素结合),hygB(潮霉素磷酸转移酶),niaD(硝酸还原酶),pyrG(乳清酸核苷-5′-磷酸脱羧酶),sC(硫酸腺嘌呤基转移酶)和trpC(邻氨基苯甲酸合酶),以及来自其他物种的等同物。优选用于Aspergillus和Penicillium细胞中的是A.nidulans或A.oryzae的amdS(EP635574B1,WO 97/06261)和pyrG基因,和Streptomyces hygroscopicus的bar基因。更优选地使用amdS基因,进一步更优选地使用来自A.nidulans或A.niger的amdS基因。最优选的选择标记物基因是与A.nidulans gpdA启动子融合的A.nidulans amdS编码序列(见EP 635574B1)。其他优选的AmdS标记物是WO2006/040358中所述的那些。也可以使用来自其他丝状真菌的AmdS基因(WO 97/06261)。
用于连接上文所述元件从而构建本发明的重组表达载体的程序是本领域技术人员公知的(见例如Sambrook & Russell,上文)。
在第四方面中,本发明涉及包含根据本发明第三方面的表达构建体或包含根据本发明第三方面的表达载体的重组丝状真菌宿主细胞。所述丝状真菌宿主细胞优选地是如本文先前所述的细胞。所述丝状真菌宿主细胞可使用本领域已知的方法构建。优选地,所述丝状真菌宿主细胞通过下述方法构建,所述方法包括:
-提供合适的丝状真菌宿主细胞,和
-用根据本发明第三方面的表达构建体或用根据本发明第三方面的表达载体转化所述宿主细胞。
丝状真菌宿主细胞的转化优选地如本文之前所述进行。
在第五方面中,本发明涉及根据本发明的信号肽用于生产感兴趣的重组多肽的方法。
因此,信号肽优选地选自由以下组成的组:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
d)SEQ ID NO:39,
e)15到23个氨基酸的SEQ ID NO:39的变体,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同,
f)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
g)SEQ ID NO:44,
h)15到23个氨基酸的SEQ ID NO:44的变体,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同,
i)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
j)SEQ ID NO:34,
k)15到23个氨基酸的SEQ ID NO:34的变体,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同,
l)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据一个实施方案,信号肽是SEQ ID NO:25。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,信号肽是SEQ ID NO:39。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:39的变体,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,信号肽是SEQ ID NO:44。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:44的变体,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,信号肽是SEQ ID NO:34。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:34的变体,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,当信号肽是以下时:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,或
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
优选地,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:25的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:25的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala。
优选地,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:39的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:39的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2、3和/或5位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:44的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:44的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:34的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:34的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
c)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
e)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
f)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
g)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
h)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Ala,
i)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,
j)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,
k)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,
l)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,
m)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Leu,
n)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
o)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu、Ala,
p)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Ala,
q)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,
r)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,
s)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,
t)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,
u)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Leu。
在上述SEQ ID NO:25的变体(a)到(d)、SEQ ID NO:39的变体(a)和(b),SEQ ID NO:44的变体(a)和(b)和SEQ ID NO:34的变体(a)到(u)中,连续串优选地为10个氨基酸,更优选地为9个氨基酸,进一步更优选地为8个氨基酸,最优选地为7个氨基酸。
在上述SEQ ID NO:25的变体(a)到(d)、SEQ ID NO:39的变体(a)和(b),SEQ ID NO:44的变体(a)和(b)和SEQ ID NO:34的变体(a)到(u)中,氨基酸的连续串优选地包含至少5个选自Ala或Leu的氨基酸,更优选地包含至少6个选自Ala或Leu的氨基酸,最优选地包含至少7个选自Ala或Leu的氨基酸。
15到23个氨基酸的SEQ ID NO:25、SEQ ID NO:39、SEQ ID NO:44或SEQ ID NO:34变体可包含15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸或23个氨基酸。
在第六方面中,本发明涉及编码根据本发明的信号肽的多核苷酸用于生产感兴趣的重组多肽的用途。因此,信号肽优选地选自由以下组成的组:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
d)SEQ ID NO:39,
e)15到23个氨基酸的SEQ ID NO:39的变体,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同,
f)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
g)SEQ ID NO:44,
h)15到23个氨基酸的SEQ ID NO:44的变体,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同,
i)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
j)SEQ ID NO:34,
k)15到23个氨基酸的SEQ ID NO:34的变体,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同,
l)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据一个实施方案,信号肽是SEQ ID NO:25。
根据另一个实施方案,在中间产物中,信号肽是15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,信号肽是SEQ ID NO:39。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:39的变体,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,信号肽是SEQ ID NO:44。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:44的变体,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:44变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
根据另一个实施方案,信号肽是SEQ ID NO:34。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:34的变体,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。
根据另一个实施方案,信号肽是15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,当信号肽是以下时:
a)SEQ ID NO:25,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同,或
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
感兴趣的多肽不是果胶甲基酯酶,更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。更优选地,当信号肽是(b)或(c)时,感兴趣的多肽不是果胶甲基酯酶,进一步更优选地感兴趣的多肽不是来自Erwinia chrysanthemi的果胶甲基酯酶。
优选地,编码SEQ ID NO:25时,第一多核苷酸是根据SEQ ID NO:29的多核苷酸。优选地,编码SEQ ID NO:39时,第一多核苷酸是根据SEQ ID NO:38的多核苷酸。优选地,编码SEQ ID NO:44时,第一多核苷酸是根据SEQ ID NO:43的多核苷酸。优选地,编码SEQ ID NO:34时,第一多核苷酸是根据SEQ ID NO:33的多核苷酸。
优选地,其中至少8个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:25的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:25的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:25的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
c)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d)15到23个氨基酸的SEQ ID NO:25的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala。
优选地,其中至少8个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:39变体是下述的变体,其中至少9个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:39的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:39的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2、3和/或5位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:39的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,其中至少8个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:44的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:44的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:44的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Val或Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:44的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸。
优选地,其中至少8个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同的、15到23个氨基酸的SEQ ID NO:34的变体是下述变体,其中至少9个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。更优选地,10个氨基酸与SEQ ID NO:34的前10个氨基酸在相应位置上相同。
优选地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸的、15到23个氨基酸的SEQ ID NO:34的变体是选自下组的变体:
a)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
b)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
c)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2、3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
d)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
e)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
f)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
g)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu和Ala,
h)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Ala,
i)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,
j)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,
k)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,
l)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,
m)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10个氨基酸的连续串包含至少5个Leu,
n)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,
o)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10个氨基酸的连续串包含至少5个选自Ala或Leu的氨基酸,并且其中变体最后三个位置上的氨基酸是Ala、Leu、Ala,
p)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Ala,
q)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少4个Ala和1个Leu,
r)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少3个Ala和2个Leu,
s)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少2个Ala和3个Leu,
t)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少1个Ala和4个Leu,
u)15到23个氨基酸的SEQ ID NO:34的变体,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10个氨基酸的连续串包含至少5个Leu。
在上述SEQ ID NO:25的变体(a)到(d)、SEQ ID NO:39的变体(a)和(b),SEQ ID NO:44的变体(a)和(b)和SEQ ID NO:34的变体(a)到(u)中,连续串优选地为10个氨基酸,更优选地为9个氨基酸,进一步更优选地为8个氨基酸,最优选地为7个氨基酸。
在上述SEQ ID NO:25的变体(a)到(d)、SEQ ID NO:39的变体(a)和(b),SEQ ID NO:44的变体(a)和(b)和SEQ ID NO:34的变体(a)到(u)中,氨基酸的连续串优选地包含至少5个选自Ala或Leu的氨基酸,更优选地包含至少6个选自Ala或Leu的氨基酸,最优选地包含至少7个选自Ala或Leu的氨基酸。
15到23个氨基酸的SEQ ID NO:25、SEQ ID NO:39、SEQ ID NO:44或SEQ ID NO:34的变体可包含15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸或23个氨基酸。
本文提供的序列信息不应被狭窄地理解为要求包括错误鉴定的碱基。本文公开的特定序列可容易地被用于从各个宿主细胞中分离完整的基因,所述完整的基因可随后被容易地进行序列分析,从而鉴定序列错误。
除非另有说明,本文通过测序DNA分子测定的所有核苷酸序列都使用自动化DNA测序仪测定,由本文测定的DNA分子编码的多肽的所有氨基酸序列都通过翻译如上文测定的核酸序列来预测。因此,如本领域针对通过该自动化途径测定的任何DNA序列所已知的,本文测定的任何核苷酸序列可含有一些错误。通过自动化测定的核苷酸序列可典型地与被测序的DNA分子的实际核苷酸序列至少约90%相同,更典型地至少约95%到至少约99.9%相同。实际序列可通过其他途径更精确地测定,包括本领域中公知的手动DNA测序方法。还如本领域所已知的,与实际序列相比被测定的核苷酸序列中的单个插入或缺失会在核苷酸序列翻译中引起移码,使得所预测的由测定的核苷酸序列编码的氨基酸序列与被测序的DNA分子实际编码的氨基酸序列从此类插入或缺失点开始完全不同。
本领域技术人员能够鉴定此类被错误鉴定的碱基,并且知道如何纠正此类错误。
本文所描述和要求保护的发明在范围上不受本文公开的特定实施方案的限制,因为这些实施方案旨在阐述本发明的若干方面。任何等同的实施方案旨在落入本发明的范围内。事实上,除了本文所展示盒描述的以外,本领域技术人员根据前述说明书能够明白对本发明的多种修饰。此类修饰也旨在落入附带的权利要求书的范围内。在冲突的情况下,采取包括定义在内的本公开作为指导。
本发明通过以下实施例进一步说明。
实施例
菌株
WT 1:该A.niger菌株被用作野生型菌株。该菌株以保藏号CBS513.88保藏于CBS Institute。
WT 2:该A.niger菌株是包含编码葡糖淀粉酶的基因(glaA)缺失的WT 1菌株。如EP 0 635 574 B1中所述通过使用“MARKER-GENE FREE”途径构建WT 2。在该专利中详尽地描述了如何在CBS 513.88的基因组中缺失glaA特异的DNA序列。所述程序导致MARKER-GENE FREE ΔglaA重组体A.niger CBS 513.88菌株,所述菌株最终完全不具有外来DNA序列。
WT 3:该A.niger菌株是包含下述缺失的WT 2菌株,所述缺失导致草酸盐/酯缺陷型A.niger菌株。通过使用EP1157100和US6,936,438中所述的方法构建WT 3,其中通过缺失编码草酰乙酸水解酶的oahA基因获得草酸盐/酯缺陷型菌株,菌株WT 3被选择为在WT 2菌株背景中失活了oahA基因的代表性菌株。
或者,在EP1590444中详尽地描述了如何筛选草酸盐/酯缺陷型突变体A.niger菌株。根据EP1590444的实施例1和2,描述了如何获得WT 2的草酸盐/酯缺陷型突变体菌株。
WT 4:该A.niger菌株是包含在三个后续步骤中编码α-淀粉酶的三个基因(amyB、amyBI和amyBII)缺失的WT 3菌株。缺失载体的构建和这三个基因的基因组缺失已详细描述于WO2005095624中。描述于WO2005095624中的载体pDEL-AMYA、pDEL-AMYBI和pDEL-AMYBII已根据EP 0 635 574 B1中所述的“MARKER-GENE FREE”途径使用。上述程序得到草酸盐/酯缺陷型的,MARKER-GENE FREE ΔglaA、ΔamyA、ΔamyBI和ΔamyBII淀粉酶阴性重组体A.niger CBS 513.88菌株,所述菌株最终完全不具有外来DNA序列。这样,WT 4具有低淀粉酶背景,并且与WT 1相比针对α-淀粉酶表达和表达检测更加优化。
分子生物学技术
在这些菌株中,使用本领域技术人员已知的分子生物学技术(见Sambrook & Russell,Molecular Cloning:A Laboratory Manual,3rd Ed.,CSHLPress,Cold Spring Harbor,NY,2001),如下文所述过表达了若干基因,并下调了其它基因。用于基因过表达和破坏的表达载体,用于下调、转化的载体的一般设计的例子,标记物和选择培养基的使用可参见WO199846772、WO199932617、WO2001121779、WO2005095624、EP635574B和WO2005100573。
A.niger摇瓶发酵
如WO 99/32617的实施例“Aspergillus niger shake flaskfermentations”部分中所述,在20ml预培养培养基中预培养A.niger菌株。过夜生长后,将10ml该培养物转移至发酵培养基(FM)中。
每升发酵培养基(FM)含有:82.5g Glucose.1H2O,25g Maldex 15(荷兰Boom Meppel),2g柠檬酸,4.5g NaH2PO4.1H2O,9gKH2PO4,15g(NH4)2SO4,0.02g ZnCl2,0.1g MnSO4.1H2O,0.015gCuSO4.5H2O,0.015g CoCl2.6H2O,1g MgSO4.7H2O,0.1gCaCl2.2H2O,0.3g FeSO4.7H2O,30g MES(2-[N-吗啉代]乙磺酸),pH=6。
在FM中的发酵于34℃和170rpm下在含有100ml发酵液的500ml带挡板烧瓶中进行指示的天数,一般如WO99/32617中所述。
真菌α-淀粉酶活性
为了在A.niger培养液中测定α-淀粉酶活性,根据供应商的说明使用Megazyme谷物α-淀粉酶试剂盒(Megazyme,CERALPHA α淀粉酶测定试剂盒,产品目录编号K-CERA,2000-2001年)。所测量的活性以存在过量葡糖淀粉酶和α-葡糖苷酶时非还原性末端阻断的ρ-硝基苯基麦芽庚糖苷(ρ-nitrophenyl maltoheptaoside)的水解为基础。形成的ρ-硝基苯酚是样品中存在的α-淀粉酶活性的度量。
葡萄糖氧化酶活性
为了在A.niger培养液中测定葡萄糖氧化酶活性,如Witteveen et al.1990(“Glucose oxidase overproducing and negative mutants of Aspergillusniger”,Appl.Microbiol.Biotechnol 33:683-686)所述使用邻联二茴香胺(o-dianisidine),在450nm处用分光光度计测量葡萄糖氧化酶。
实施例1
针对A.nigerα-淀粉酶AmyB和P.chrysogenum葡萄糖氧化酶goxA构建 经修饰的Aspergillus表达构建体
编码α-淀粉酶蛋白质的amyB基因的DNA序列可在登记号XM_001395712.1、XM_001390741.1或CAK46324下得自EMBLNucleotide Sequence Database(http://www.ebi.ac.uk/embl/index.html)。天然A.niger amyB基因的基因组序列作为SEQ ID NO.1展示。amyB的相应编码序列或cDNA序列作为SEQ ID NO.2展示。SEQ ID NO.2经翻译的序列被命名为SEQ ID NO.3,代表了A.niger α-淀粉酶蛋白质AmyB。该序列也与A.oryzae α-淀粉酶蛋白质具有100%的相似性(Wirsel S.,LachmundA.,Wildhardt G.,Ruttkowski E.,″Three alpha-amylase genes of Aspergillusoryzae exhibit identical intron-exon organization″(1989)Mol.Microbiol.3:3-14)。天然的分泌型A.niger成熟α-淀粉酶肽被命名为SEQ ID NO.4。如下文详述的,用经优化的amyB cDNA序列和静改进的表达载体进行根据本发明方法的优化。
为了进行Aspergillus物种中A.niger amyB构建体变体的表达分析,amyB编码序列包含编码α-淀粉酶的amyB基因的经密码子优化的(CO)编码序列(如WO2008/000632中详述的)。使用基于pGBFIN-的表达构建体,使用强A.niger葡糖淀粉酶glaA启动子和α-淀粉酶amyB启动子二者进行A.niger中α-淀粉酶的过表达(如WO1999/32617和WO2006/077258中所述)。在所有随后产生的amyB表达构建体中,葡糖淀粉酶glaA和α-淀粉酶amyB启动子的翻译起始序列已被修饰成5’-CACCGTCAAA ATG-3’(也详述于WO2006/077258中)。在一些载体中去除存在于天然α-淀粉酶amyB启动子中的BstX1位点(5’-CCANNNNN/NTGG-3’),以便于克隆信号序列变体。另外,使用最适的翻译终止序列,因此在所有表达构建体中,野生型amyB 5’-TGA-3’翻译终止序列被替换为5’-TAAA-3’(如WO2006/077258中所详述)。
在两端引入适当的限制性位点,以允许在表达载体中克隆。在5’-端引入XhoI位点,在3’-端引入PacI位点。包含经修饰的基因组glaA或amyB启动子和经优化的amyB cDNA序列的参照构建体的DNA片段被完全合成、亚克隆,并通过序列分析进行序列验证。
使用两种合成的片段端部的XhoI-PacI限制性位点,从而允许在经XhoI和PacI消化的pGBFINFUA-1表达载体(pGBFINFUA-1载体还描述于WO2006/077258和WO2008/000632中)的大载体片段中克隆,分别产生pGBFINFUA-6和pGBFINFUA-3。
根据本发明的方法在信号序列中a.o.变化的经修饰的AmyB序列的所有DNA片段被设计、完全合成为EcoRI-PacI或EcoRI-BstX1片段,亚克隆并进行序列验证。使用所有合成的片段端部的EcoRI-PacI/BstX1限制性位点,从而允许在经EcoRI和PacI/BstX1消化的pGBFINFUA-3或经EcoRI和PacI消化的pGBFINFUA-6表达载体的大载体片段中克隆,产生变体pGBFINFUA-表达载体。对各个载体进行序列验证后,如下文表1和表2中所述对变体表达构建体命名。对所有pGBFINFUA-构建体的各个序列的所有特征和参照可从表1和表2中推出。
表1:用于A.niger中位于glaA启动子控制下的α-淀粉酶AmyB表达的经修饰的表达构建体
在本文实施例1的所有表中,所有pGBFIN质粒的EcoRI-PacI部分的序列在“SEQ ID NO”下指出,全基因编码序列和编码序列被翻译的序列分别是根据“编码序列SEQ ID NO”和“蛋白质SEQ ID NO”中所示的氨基酸序列,使用的信号序列的核苷酸和被翻译的氨基酸序列在“信号序列编码序列SEQ ID NO”和“氨基酸信号序列SEQ ID NO”下指出。pGBFINFUA-6和衍生的载体的一般设置可见图2,而载体pGBFINFUA-1、pGBFINFUA-3和pGBFINFUA-21的设置可见图1。
表2:用于A.niger中位于amyB启动子控制下的α-淀粉酶AmyB表达的经修饰的表达构建体
基因编号为Pc20g09560并且编码Penicillium chrysogenum葡萄糖氧化酶蛋白的goxA基因的DNA序列可在登记号AM920435.1下得自EMBLNucleotide Sequence Database(http://www.ebi.ac.uk/embl/index.html)。Pc20g09560被翻译的序列被命名为SEQ ID NO.49,其代表了P.chrysogenum葡萄糖氧化酶蛋白GoxA。
用如上文所详述的经改进的表达载体进行goxA基因或基因片段的表达,用经密码子对优化的goxA cDNA序列(被命名为SEQ ID NO.48)进行根据本发明的优化。
根据本发明的方法在信号序列中a.o.变化、并且在其他中包含glaA启动子和静优化的GoxA cDNA序列的、经修饰的GoxA构建体的两条DNA片段被设计、完全合成为EcoRI-PacI片段,亚克隆并进行序列验证。使用合成片段端部的EcoRI-PacI限制性位点,从而允许在经EcoRI和PacI消化的pGBFINFUA-6表达载体的大载体片段中克隆,产生变体pGBFINGOX-表达载体。对各个载体进行序列验证后,如下文表3中所述对变体表达构建体命名。两种pGBFINGOX-构建体的各个序列的所有特征和参照可从表3中推出。
表3:用于A.niger中P.chrysogenum葡萄糖氧化酶表达的经修饰的表达构建体
实施例2
在A.niger中表达A.niger α-淀粉酶和P.chrysogenum葡萄糖氧化酶的野 生型和经修饰的表达构建体
如下文所述并根据图3中所示的策略,将实施例1(上文)中制备的pGBFINFUA-和pGBFFINGOX-表达构建体通过转化引入A.niger中。
为了在WT 4中引入不同的pGBFINFUA-载体(表1和表2)和两种不同的pGBFINGOX-载体(表3),如WO1998/46772和WO1999/32617中所述进行转化和随后的转化体选择。简言之,分离pGBFINFUA-和pGBFINGOX-构建体的线性DNA,并用于转化A.niger WT4。在乙酰胺培养基上选择转化体,并根据标准程序纯化菌落。使用PCR,针对glaA基因座处的整合和拷贝数来诊断菌落。选择具有相似的估计拷贝数(推定为单拷贝)的每种pGBFINFUA-构建体的三个独立的转化体,并使用转化质粒的编号命名,例如分别为FUA-3-1、FUA-3-2、FUA-3-3、FUA-6-1等。
类似地,选择具有相似的估计拷贝数(推定为单拷贝)的每种pGBFINGOX-构建体的五个独立的转化体,并使用转化质粒的编号命名,例如分别为GOX-1-1、GOX-1-2、GOX-1-3、……、GOX-2-1、GOX-2-2、GOX-2-3等。
使用所选择的FUA-和GOX-菌株和A.niger WT 1和WT 4,如上文所述使用500ml带挡板的摇瓶,在摇床培养箱中于34℃和170rpm下,在100ml培养基中进行摇瓶实验。发酵3天和4天火4天和5天后,采样,分别测定α-淀粉酶活性或葡萄糖氧化酶活性。
在培养上清液中测量含有不同构建体的不同A.niger FUA-转化体的转化体对α-淀粉酶的生产。使用进行或未进行密码子对优化的内源amyB信号序列,或使用经优化的葡糖淀粉酶信号序列时,未发现对α-淀粉酶生产和表达的正面影响。令人惊讶的是,使用葡糖淀粉酶启动子时,观察到使用本发明经修饰的和最适的信号序列对α-淀粉酶生产的清楚的正面影响,如从图4中可以看出。本发明的多种最适信号序列对α-淀粉酶的生产给予了正面的影响,以果胶甲基酯酶(即pGBFINFUA-12/13中的pmeA)为最佳。在图5中,还观察到与α-淀粉酶amyB启动子组合时,使用本发明的pmeA信号序列对α-淀粉酶生产的清楚的正面影响。
在两种不同的A.niger GOX-转化体的五个转化体中测量P.chrysogenum葡萄糖氧化酶GoxA的生产。此处也观察到本发明的信号序列(即pmeA)对葡萄糖氧化酶生产的清楚的正面影响,如图6所示。
因此,发现与强α-淀粉酶amyB和葡糖淀粉酶glaA启动子组合时,使用最适信号序列和更特定地使用根据本发明方法的pmeA信号序列具有正面影响。另外,与goxA葡萄糖氧化酶编码酶融合的根据本发明方法的pmeA信号序列导致清楚地提高了的细胞外GoxA酶生产。另外,观察到使用经修饰的翻译起始位点、经密码子优化的编码序列和/或翻译终止序列的本发明方法的组合对α-淀粉酶生产的正面影响。这些结果清楚地指出本发明的修饰语针对表达构建体鉴定的其他序列优化的累加效应。
这些例子清楚地展示了本发明的方法(例如与天然α-淀粉酶或葡萄糖氧化酶序列融合的pmeA信号序列)如何被用于A.niger中α-淀粉酶或葡萄糖氧化酶或丝状真菌中任何其他感兴趣的蛋白质的经改进的分泌和生产。另外,这些结果表明,本发明的方法可被广泛应用以改进宿主中的蛋白质表达,尽管表达构建体和宿主已经具有若干其他优化,例如针对蛋白质表达的强启动子、经改进的翻译起始序列、经改进的翻译终止序列、经优化的密码子和密码子对使用和/或经改进的宿主。
  申请人或代理人文件参考编号27250-WO-PCT   国际申请号:
与被保藏的微生物相关的说明
(PCT Rule 13bis)

Claims (2)

1.用于生产感兴趣的重组多肽的方法,所述方法包括:
(i)在有助于生产所述多肽的条件下培养丝状真菌宿主细胞,所述丝状真菌宿主细胞包含以符合翻译读码框的方式与第二多核苷酸连接的第一多核苷酸,所述第二多核苷酸编码感兴趣的多肽,所述第一多核苷酸编码根据SEQ ID NO:25的信号肽,
(ii)以及,任选地,从培养基分离所述多肽,
并且所述感兴趣的多肽不是果胶甲基酯酶。
2.根据SEQ ID NO:25的信号肽用于生产感兴趣的重组多肽的用途,所述感兴趣的多肽不是果胶甲基酯酶。
CN201080017888.XA 2009-04-22 2010-04-14 用于生产感兴趣的重组多肽的方法 Expired - Fee Related CN102414323B (zh)

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
EP09158541.4 2009-04-22
EP09158538 2009-04-22
EP09158538.0 2009-04-22
EP09158542 2009-04-22
EP09158542.2 2009-04-22
EP09158540.6 2009-04-22
EP09158539 2009-04-22
EP09158539.8 2009-04-22
EP09158540 2009-04-22
EP09158541 2009-04-22
PCT/EP2010/054890 WO2010121933A1 (en) 2009-04-22 2010-04-14 Process for the production of a recombinant polypeptide of interest

Publications (2)

Publication Number Publication Date
CN102414323A CN102414323A (zh) 2012-04-11
CN102414323B true CN102414323B (zh) 2015-07-08

Family

ID=42153715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080017888.XA Expired - Fee Related CN102414323B (zh) 2009-04-22 2010-04-14 用于生产感兴趣的重组多肽的方法

Country Status (7)

Country Link
US (1) US20120041171A1 (zh)
EP (1) EP2421986A1 (zh)
JP (1) JP2012524530A (zh)
CN (1) CN102414323B (zh)
AU (1) AU2010241099A1 (zh)
CA (1) CA2758404A1 (zh)
WO (1) WO2010121933A1 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2588616B1 (en) 2010-07-01 2018-11-14 DSM IP Assets B.V. A method for the production of a compound of interest
MX357484B (es) * 2012-07-19 2018-07-11 Dsm Ip Assets Bv Cepa con deficit de amilasa.
MX357482B (es) 2012-07-19 2018-07-11 Dsm Ip Assets Bv Cepa deficiente en agse.
EP2796547B1 (en) * 2013-04-24 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Novel glucose oxidase variants
US10487125B2 (en) 2013-12-02 2019-11-26 Dsm Ip Assets B.V. Ice structuring protein
WO2015091455A1 (en) 2013-12-17 2015-06-25 Dpx Holdings B.V. Bioreactor
EP3146043B1 (en) 2014-05-19 2019-06-26 DSM IP Assets B.V. Proline-specific endoprotease
WO2015177152A1 (en) 2014-05-19 2015-11-26 Dsm Ip Assets B.V. Proline-specific endoprotease
WO2015177153A1 (en) 2014-05-19 2015-11-26 Dsm Ip Assets B.V. Proline-specific endoprotease
US20170265483A1 (en) 2014-08-21 2017-09-21 Dsm Ip Assets B.V. Use of penicillium glucose oxidase in the baking industry for replacing bromate or azodicarbonamide
EP3242949B1 (en) 2015-01-06 2021-11-03 DSM IP Assets B.V. A crispr-cas system for a yeast host cell
US10590436B2 (en) 2015-01-06 2020-03-17 Dsm Ip Assets B.V. CRISPR-CAS system for a lipolytic yeast host cell
WO2016110453A1 (en) 2015-01-06 2016-07-14 Dsm Ip Assets B.V. A crispr-cas system for a filamentous fungal host cell
ES2856766T3 (es) 2015-04-10 2021-09-28 Dsm Ip Assets Bv Método de preparación de una masa
AU2016273208B2 (en) 2015-06-02 2021-01-21 Dsm Ip Assets B.V. Use of ice structuring protein AFP19 expressed in filamentous fungal strains for preparing food
WO2017050652A1 (en) 2015-09-25 2017-03-30 Dsm Ip Assets B.V. Asparaginase
CA3025596A1 (en) 2016-06-10 2017-12-14 Dsm Ip Assets B.V. Mutant lipase and use thereof
EP3484994A4 (en) 2016-07-13 2020-01-22 DSM IP Assets B.V. CRISPR-CAS-SYSTEM FOR AN ALGENE CELL
CN109715804A (zh) 2016-09-23 2019-05-03 帝斯曼知识产权资产管理有限公司 用于宿主细胞的指导rna表达系统
US10918113B2 (en) 2016-12-21 2021-02-16 Dsm Ip Assets B.V. Lipolytic enzyme variants
CA3046153A1 (en) 2016-12-21 2018-06-28 Dsm Ip Assets B.V. Lipolytic enzyme variants
WO2018114938A1 (en) 2016-12-21 2018-06-28 Dsm Ip Assets B.V. Lipolytic enzyme variants
WO2018114912A1 (en) 2016-12-21 2018-06-28 Dsm Ip Assets B.V. Lipolytic enzyme variants
WO2018166943A1 (en) 2017-03-13 2018-09-20 Dsm Ip Assets B.V. Zinc binuclear cluster transcriptional regulator-deficient strain
CN107353327A (zh) 2017-03-30 2017-11-17 南京百斯杰生物工程有限公司 植酸酶在黑曲霉中表达
CN110462044A (zh) 2017-04-06 2019-11-15 帝斯曼知识产权资产管理有限公司 自引导整合构建体(sgic)
WO2019063849A1 (en) 2017-12-20 2019-04-04 Dsm Ip Assets B.V. PURIFICATION OF A POLYPEPTIDE OF INTEREST
US20200392513A1 (en) 2017-12-20 2020-12-17 Dsm Ip Assets B.V. A method for genome editing in a host cell
CN112088215A (zh) 2018-05-09 2020-12-15 帝斯曼知识产权资产管理有限公司 Crispr瞬时表达构建体(ctec)
MX2020014191A (es) 2018-06-19 2021-03-09 Dsm Ip Assets Bv Variantes de enzimas lipoliticas.
US20220056460A1 (en) 2018-12-05 2022-02-24 Dsm Ip Assets B.V. Crispr guide-rna expression strategies for multiplex genome engineering
DK3715464T3 (da) 2019-03-28 2021-07-26 Dsm Ip Assets Bv Drivhusgasforbedret fermentering
WO2021228880A1 (en) 2020-05-14 2021-11-18 Dsm Ip Assets B.V. Fed-batch fermentation process
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
WO2023222614A1 (en) 2022-05-16 2023-11-23 Dsm Ip Assets B.V. Lipolytic enzyme variants

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6627429B1 (en) * 1998-09-16 2003-09-30 Danisco A/S Process for enzymatically modifying pectin

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4288627A (en) 1980-02-12 1981-09-08 Phillips Petroleum Company Oxidation of thiols employing cobalt molybdate/triethylamine catalyst
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
CA1341226C (en) 1988-08-16 2001-05-01 Wim Van Hartingsveldt Gene replacement as a tool for the construction of aspergillus strains
US5571697A (en) * 1989-05-05 1996-11-05 Baylor College Of Medicine Texas Medical Center Expression of processed recombinant lactoferrin and lactoferrin polypeptide fragments from a fusion product in Aspergillus
ES2198410T3 (es) 1993-07-23 2004-02-01 Dsm Ip Assets B.V. Cepas recombinantes de hongos filamentosos libres de gen marcador de seleccion: un metodo para obtener dichas cepas y su utilizacion.
ATE294871T1 (de) 1994-06-30 2005-05-15 Novozymes Biotech Inc Nicht-toxisches, nicht-toxigenes, nicht- pathogenes fusarium expressionssystem und darin zu verwendende promotoren und terminatoren
GB9426458D0 (en) * 1994-12-31 1995-03-01 Procter & Gamble A detergent compositions comprising cellulytic enzyme
DE69637784D1 (de) 1995-08-03 2009-02-05 Dsm Ip Assets Bv amdS-Gen aus Aspergillus niger für eine Acetamidase kodierend
AU7294396A (en) * 1995-10-13 1997-04-30 Gist-Brocades B.V. Protein detection
PL336345A1 (en) 1997-04-11 2000-06-19 Dsm Nv Genic conversion as a tool for constructing recombined filiform fungi
DK1042461T3 (da) 1997-12-22 2007-09-24 Dsm Ip Assets Bv Ekspressionskloning i filiforme svampe
AU1774000A (en) 1998-12-23 2000-07-31 Novozymes A/S Methods for producing polypeptides in aspergillus mutant cells
AU2658200A (en) 1999-02-22 2000-09-14 Novozymes A/S Oxaloacetate hydrolase deficient fungal host cells
US6544765B1 (en) 1999-02-22 2003-04-08 Novozymes, A/S Oxaloacetate hydrolase deficient fungal host cells
WO2001021779A2 (en) 1999-09-17 2001-03-29 Dsm N.V. Penicillium chrysogenum transcriptional activator blar, a pathway specific regulator of beta-lactam biosynthesis, and uses therof
WO2001072783A2 (en) 2000-03-24 2001-10-04 Genencor International, Inc. Production of secreted proteins by recombinant eukaryotic cells
HUP0300469A2 (hu) * 2000-04-13 2003-06-28 Emalfarb, Mark Aaron Új, expressziós szabályzó szekvenciák és expressziós termékek fonalas gombákban
US20060127976A1 (en) 2003-02-05 2006-06-15 Wenzel Thibaut J Use of oxalate deficient aspergillus niger strains for producing a polypeptide
ATE441664T1 (de) 2003-03-31 2009-09-15 Novozymes Inc Verfahren zur produktion biologischer substanzen in enzymmangelmutanten von aspergillus niger
ES2350048T3 (es) 2004-04-02 2011-01-17 Dsm Ip Assets B.V. Mutantes fúngicos filamentosos con eficiencia mejorada de recombinación homóloga.
AU2005233326B2 (en) 2004-04-16 2010-09-23 Dsm Ip Assets B.V. Fungal promoters for expressing a gene in a fungal cell
JP4896013B2 (ja) 2004-06-16 2012-03-14 ディーエスエム アイピー アセッツ ビー.ブイ. 改良された分泌によるポリペプチドの製造
CA2583460A1 (en) 2004-10-15 2006-04-20 Dsm Ip Assets B.V. Homologous amds genes as selectable marker
DK2410048T3 (en) 2005-01-24 2016-11-28 Dsm Ip Assets Bv A process for the preparation of a compound of interest in a filamentous fungal cell
JP2008531031A (ja) 2005-03-01 2008-08-14 ディーエスエム アイピー アセッツ ビー.ブイ. 真菌細胞中で遺伝子を発現させるためのアスペルギルス(Aspergillus)プロモーター
EA015925B1 (ru) 2006-06-29 2011-12-30 ДСМ АйПи АССЕТС Б.В. Способ получения полипептидов

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6627429B1 (en) * 1998-09-16 2003-09-30 Danisco A/S Process for enzymatically modifying pectin

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Genome sequencing and analysis of the versatile cell factory Aspergillus niger CBS 513.88;Herman J Pel;《Nature Biotechnology》;20070201;第25卷(第2期);表格3 *
Longhi,S..Accession Number:CAK38387,pectinesterase pmeA-Aspergillus niger.《Genbank》.2007, *

Also Published As

Publication number Publication date
AU2010241099A1 (en) 2011-10-27
US20120041171A1 (en) 2012-02-16
CA2758404A1 (en) 2010-10-28
EP2421986A1 (en) 2012-02-29
WO2010121933A1 (en) 2010-10-28
CN102414323A (zh) 2012-04-11
JP2012524530A (ja) 2012-10-18

Similar Documents

Publication Publication Date Title
CN102414323B (zh) 用于生产感兴趣的重组多肽的方法
CN102597241B (zh) 用于生产感兴趣的化合物的经改进的宿主细胞
US9790532B2 (en) Methods for producing polypeptides in enzyme-deficient mutants of Fusarium venentatum
CN101094919B (zh) 在生产多肽的方法中有用的真菌转录活化因子
EP2875119B1 (en) Agse-deficient strain
CN101107354B (zh) 用于在有丝真菌细胞中生产感兴趣化合物的方法
US9745563B2 (en) Amylase-deficient strain
CN103459600A (zh) 用于生产感兴趣的化合物的方法
CN103596970A (zh) 载体-宿主系统
EP4023757A1 (en) Methods for generating selection marker-free transformants of heterokaryotic organisms
CN105102471A (zh) 具有选择性自噬途径的灭活组分的丝状真菌细胞及其使用方法
US20220267783A1 (en) Filamentous fungal expression system
CN103339259B (zh) 用于在真菌细胞中表达基因的启动子
CN113056552A (zh) 经修饰的丝状真菌宿主细胞

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150708

Termination date: 20190414

CF01 Termination of patent right due to non-payment of annual fee