CN113056554A - 重组酵母细胞 - Google Patents

重组酵母细胞 Download PDF

Info

Publication number
CN113056554A
CN113056554A CN201980075647.1A CN201980075647A CN113056554A CN 113056554 A CN113056554 A CN 113056554A CN 201980075647 A CN201980075647 A CN 201980075647A CN 113056554 A CN113056554 A CN 113056554A
Authority
CN
China
Prior art keywords
acid sequence
seq
nucleic acid
yeast cell
recombinant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980075647.1A
Other languages
English (en)
Inventor
谭旭秋
钟静萍
M·A·斯克兰顿
D·李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF SE
Original Assignee
BASF SE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF SE filed Critical BASF SE
Publication of CN113056554A publication Critical patent/CN113056554A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • C12N9/20Triglyceride splitting, e.g. by means of lipase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/03Oxidoreductases acting on the CH-OH group of donors (1.1) with a oxygen as acceptor (1.1.3)
    • C12Y101/03013Alcohol oxidase (1.1.3.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/01Carboxylic ester hydrolases (3.1.1)
    • C12Y301/01003Triacylglycerol lipase (3.1.1.3)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/036Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/645Fungi ; Processes using fungi
    • C12R2001/85Saccharomyces

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Mycology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Botany (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及用于高产率蛋白质表达的重组酵母细胞。本发明进一步涉及关于所述重组酵母细胞的细胞培养、关于培养所述重组酵母细胞的蛋白质制备方法以及所述重组酵母细胞的用途。

Description

重组酵母细胞
相关申请的交叉引用
本申请要求于2018年11月19日提交的美国申请第62/769,169号的优先权权益,所述美国申请的内容通过引用整体并入本文。
序列表
本申请包含根据“按照专利合作条约(PCT)在国际专利申请中呈现核苷酸和氨基酸序列表的标准(Standard for the Presentation of Nucleotide and Amino AcidSequence Listings in International Patent Applications Under the PatentCooperation Treaty(PCT))”ST.25以ASC II文本(.txt)文件呈计算机可读形式(CRF)的核苷酸和氨基酸序列表。序列表在以下鉴别出,并且以全文引用的方式并且出于所有目的并入本申请的本说明书中。
文件名 创建日期 大小(字节)
180262US01_SequenceListing.txt 11/16/2018 29.4KB(30,172个字节)
技术领域
本发明涉及用于高产率蛋白质表达的重组酵母细胞。本发明进一步涉及关于所述重组酵母细胞的细胞培养、关于培养所述重组酵母细胞的蛋白质制备方法以及所述重组酵母细胞的用途。
背景技术
法夫驹形氏酵母(Komagataella phaffii)(以前被称为巴斯德毕赤酵母(Pichiapastoris))是一种易于操作和培养的单细胞微生物。法夫驹形氏酵母是一种真核生物,其能够进行由高级真核细胞进行的许多翻译后修饰,如蛋白水解加工、折叠、二硫键形成和糖基化。因此,相比于无法像真核细胞那样进行翻译后修饰的细菌系统,优选法夫驹形氏酵母系统作为表达宿主细胞。进一步地,在细菌系统中,如果蛋白质在无活性的包涵体中产生,则蛋白质可能会丢失。已经证明,与许多细菌系统相比,法夫驹形氏酵母系统可提供更高的蛋白质表达水平。因此,可以将需要翻译后修饰的外来蛋白质产生为法夫驹形氏酵母中的生物活性分子,并且法夫驹形氏酵母已被用于产生多种重组蛋白。
现有技术中公开的表达菌株包含CBS7435(Küberl等人(2011)《生物技术杂志(JBiotechnol)》154:312-320;)、GS115(DeSchutter等人(2009)《自然生物技术(NatBiotechnol)》27:561-566)和DSMZ 70382(Mattanovich等人(2009)《微生物细胞工厂(Microb Cell Factories)》8:29)。
尽管如此,仍需要优化的重组酵母细胞以允许高产率的蛋白质表达和有效的蛋白质回收。
发明内容
本发明人已经开发了一种重组酵母细胞,由于启动子和前导肽的特定组合,所述重组酵母细胞能够实现高产率的蛋白质表达。
具体地说,本发明涉及一种包括至少第一表达盒的重组酵母细胞,所述第一表达盒包括
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或其功能片段或与根据SEQ ID No:1到8中任一个所述的核酸序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
所述重组酵母细胞可以进一步包括第二表达盒,所述第二表达盒包括
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或其功能片段或与根据SEQ ID No:1到8中任一个所述的核酸序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码所述重组蛋白的核酸序列。
所述重组酵母细胞可能缺乏至少一个标志物基因,并且可以包括编码所述标志物的重组核酸序列。
在一个实施例中,所述标志物基因是营养缺陷型标志物基因,其可以选自由以下组成的组:ura3、his4、ade2、arg4、ade1、ura5、met2、lys2、pro3和tyr1。
在一个实施例中,所述标志物基因是抗生素抗性标志物基因,其可以选自由以下组成的组:博莱霉素抗性基因、卡那霉素抗性基因、新霉素抗性基因、G418抗性基因和潮霉素抗性基因。
所述重组酵母细胞可能缺乏第一标志物基因和第二标志物基因,并且可以包括编码所述第一标志物的重组核酸序列和编码所述第二标志物的重组核酸序列。
在一个实施例中,所述第一表达盒和任选的所述第二表达盒被稳定整合到所述酵母细胞的基因组中。
所述第一标志物基因和所述第二标志物基因可以独立的选自营养缺陷型标志物基因,所述营养缺陷型标志物基因可以独立地选自由以下组成的组:ura3、his4、ade2、arg4、ade1、ura5、met2、lys2、pro3和tyr1。
所述第一标志物基因和所述第二标志物基因可以独立的选自抗生素抗性标志物基因,所述抗生素抗性标志物基因可以独立地选自由以下组成的组:博莱霉素抗性基因、卡那霉素抗性基因、新霉素抗性基因、G418抗性基因和潮霉素抗性基因。
第一营养缺陷型标志物基因可以是his4,而第二营养缺陷型标志物基因可以是ura3。
在一个实施例中,ura3的缺乏是由于部分或全部ura3基因的缺失。
在一个实施例中,编码所述第一营养缺陷型标志物的核酸序列选自由以下组成的组:
(a)根据SEQ ID No:25所述的核酸序列;
(b)与根据SEQ ID No:25所述的核酸序列具有至少65%同一性的核酸序列;
(c)编码根据SEQ ID No:27所述的多肽的核酸序列;以及
(d)编码与根据SEQ ID No:27所述的多肽具有至少80%同一性的多肽的核酸序列;和/或
其中编码所述第二营养缺陷型标志物的核酸序列选自由以下组成的组:
(a)根据SEQ ID No:26所述的核酸序列;
(b)与根据SEQ ID No:26所述的核酸序列具有至少65%同一性的序列;
(c)编码根据SEQ ID No:28所述的多肽的核酸序列;以及
(d)编码与根据SEQ ID No:28所述的多肽具有至少80%同一性的多肽的核酸序列。
所述重组蛋白可以是酶、肽、抗体或其抗原结合片段、蛋白质抗生素、融合蛋白、疫苗或疫苗样蛋白质或颗粒、生长因子、激素或细胞因子,并且所述酶可以是脂肪酶、蛋白酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、木聚糖酶、甘露聚糖酶、葡聚糖酶、纤维素酶或植酸酶。
在一个实施例中,所述脂肪酶选自:
(a)具有根据SEQ ID No:23所述的氨基酸序列的脂肪酶;
(b)具有与根据SEQ ID No:23所述的氨基酸序列具有至少80%序列同一性的氨基酸序列的脂肪酶;
(c)在对应于SEQ ID NO:23的位置23、33、82、83、84、85、160、199、254、255、256、258、263、264、265、268、308或311的位置上具有一个或多个氨基酸取代的脂肪酶;
(d)由根据SEQ ID No:24所述的核酸序列编码的脂肪酶;以及
(e)由编码与根据SEQ ID No:23所述的多肽序列具有至少80%序列同一性的脂肪酶的任何核酸序列编码的脂肪酶。
所述酵母细胞可以来自甲基营养型酵母物种,或者可以是法夫驹形氏酵母细胞。
本发明进一步涉及一种包括本文所述的重组酵母细胞的培养物。
本发明进一步涉及一种用于产生重组蛋白的方法,所述方法包括以下步骤:
(a)在合适的培养基中培养如本文所述的重组酵母细胞;以及
(b)获得所述重组蛋白。
本发明进一步涉及如本文所述的重组酵母细胞用于产生重组蛋白的用途。
附图说明
图1)具有法夫驹形氏酵母表达盒的表达载体,所述表达盒包括启动子、信号肽、所关注的基因(GOI)和终止子。
图2)在发酵条件下,在用不同法夫驹形氏酵母表达盒(1-4)转化的菌株中表达了各种脂肪酶。菌株1和菌株2在甲醇诱导条件下生长,而菌株3和菌株4在无甲醇条件下生长。示出了来自最终发酵液的上清液中的蛋白质染色凝胶。
在菌株1中,表1所示的脂肪酶LIP062在根据SEQ ID No:8所述的启动子的控制下表达,并与根据SEQ ID No:14所述的信号序列融合。
在菌株2中,表1所示的脂肪酶LIP167在根据SEQ ID No:8所述的启动子的控制下表达,并与根据SEQ ID No:15所述的信号序列融合。
在菌株3中,表1所示的脂肪酶LIP134在根据SEQ ID No:1所述的启动子的控制下表达,并与根据SEQ ID No:10所述的信号序列融合。
在菌株4中,表1所示的脂肪酶LIP173在根据SEQ ID No:1所述的启动子的控制下表达,并与根据SEQ ID No:10所述的信号序列融合。
具体实施方式
尽管将针对特定实施例描述本发明,但是该描述不应被理解为限制性的。
在详细描述本发明的示例性实施例之前,给出对于理解本发明而言重要的定义。除非另有说明或从定义的性质显而易见,否则这些定义适用于本文所述的所有方法和用途。
如在本说明书和所附权利要求书中所使用的,单数形式的“一个/种(a/an)”也包含各自的复数,除非上下文另外明确指出。在本发明的上下文中,术语“约(about)”和“大约(approximately)”表示本领域技术人员将理解以仍然确保所讨论特征的技术效果的精度范围。该术语通常表示与所指示的数值的偏差为±20%,优选地为±15%,更优选地为±10%,并且甚至更优选地为±5%。
应当理解,术语“包括”不是限制性的。出于本发明的目的,术语“由...组成”被认为是术语“包括”的优选实施例。如果在下文中组被定义为包括至少一定数量的实施例,则这意味着还涵盖优选地仅由这些实施例组成的组。
此外,说明书和权利要求书中的术语“第一”、“第二”、“第三”或“(a)”“(b)”“(c)”“(d)”等用于区分相似要素,而不一定用于描述顺序或时间次序。应该理解的是,如此使用的术语在适当情况下是可互换的,并且本文描述的本发明的实施例能够以不同于本文描述或说明的其它顺序操作。在术语“第一”、“第二”、“第三”或“(a)”“(b)”“(c)”“(d)”、“i”、“ii”等涉及方法或用途或测定的步骤的情况下,步骤之间不存在时间或时间间隔的连贯性,即,这些步骤可以同时执行,或者在这些步骤之间可能存在几秒钟、几分钟、几小时、几天、几周、几个月甚至几年的时间间隔,除非在上文或下文中提出的申请中另有说明。
应当理解,本发明不限于本文描述的特定方法、方案、试剂等,因为这些可以变化。还应理解,本文所使用的术语仅出于描述特定实施例的目的,并不旨在限制本发明的范围,本发明的范围仅由所附权利要求书限制。除非另外定义,否则本文所使用的所有技术术语和科学术语具有与本领域普通技术人员通常所理解的含义相同的含义。
术语“酵母细胞”具有其典型含义。合适的酵母细胞可以选自由以下组成的属组:毕赤酵母属(Pichia)、假丝酵母属(Candida)、球拟酵母属(Torulopsis)、阿克氏酵母属(Arxula)、汉逊酵母属(Hansenula)、汉逊酵母属(Ogatea)、耶氏酵母属(Yarrowia)、克鲁维酵母属(Kluyveromyces)、酿酒酵母属(Saccharomyces)和驹形氏酵母属(Komagataella)。优选地,酵母细胞来自驹形氏酵母属。
在一个实施例中,酵母细胞是甲基营养型酵母细胞。如本文所使用的,术语“甲基营养型酵母”包含但不限于例如可以使用还原的一碳化合物(如甲醇或甲烷)以及不具有碳键的多碳化合物(如二甲基醚和二甲胺)的酵母物种。例如,这些物种可以使用甲醇作为细胞生长的唯一碳源和能量源。不受限制地,甲基营养型酵母物种可以包含例如甲烷八叠球菌属(Methanoscacina)、荚膜甲基球菌(Methylococcus capsulatus)、多形汉逊酵母(Hansenula polymorpha)、博伊丁假丝酵母(Candida boidinii)、巴斯德驹形氏酵母(Komagataella pastoris)和法夫驹形氏酵母(Komagataella phaffii)。优选地,宿主细胞是法夫驹形氏酵母细胞。
如本文所使用的,术语“重组酵母细胞”是指酵母细胞含有至少一种核酸序列,其不天然存在于细胞中或天然存在于酵母细胞中,但与在酵母细胞中未天然连接的序列相连,如与编码蛋白质的核酸序列未天然连接的启动子。在本发明的上下文中,重组酵母细胞与天然存在的酵母细胞的不同之处在于,其含有至少一个在天然存在的细胞中不存在的表达盒。
已经用至少第一表达盒转化了本发明的重组酵母细胞,即通过转化过程将第一表达盒引入了酵母细胞。重组宿主细胞中至少第一表达盒的存在可以通过用如PCR或Southern Blot等方法检测启动子的核酸序列的存在来检测。另外或可替代地,可以通过用如蛋白质印迹或免疫荧光等方法检测前导肽或重组蛋白的表达来检测重组宿主细胞中至少第一第二表达盒的存在。
在一个实施例中,用至少第一表达盒转化的酵母细胞缺乏至少一种营养缺陷型标志物。在这种情况下,第一表达盒可以包括编码所述营养缺陷型标志物的核酸序列。可以使用所述营养缺陷型标志物选择重组酵母细胞。
用于转化酵母细胞(具体地说,法夫驹形氏酵母细胞)的合适方法是技术人员已知的,并描述于以下文献中:例如,《毕赤酵母方案(Pichia Protocols)》,第2版,2007,编者:James M.Cregg,ISBN:978-1-58829-429-6。
表达盒通常存在于表达载体中,除表达盒外,所述表达载体还包括使其能够在细菌细胞中进行繁殖和选择的另外的元件,如在细菌细胞中起作用的复制起点和在细菌中起作用的抗生素抗性基因,从而选择转化的细菌。在转化之前,可以用合适的限制酶切割表达载体,以释放表达盒,从而将其转化到酵母细胞中。
在一个实施例中,用第一表达盒和第二表达盒转化重组酵母细胞。第一表达盒和第二表达盒可以分别转化到酵母细胞中。例如,可以将第一表达盒转化到酵母细胞中,并且可以使用第一营养缺陷型标志物来选择转化的细胞,然后将第二表达盒转化到已经用第一表达盒转化的酵母细胞中,并使用第二营养缺陷型标志物选择转化的细胞。
在一个实施例中,在一个转化反应中,将第一表达盒和第二表达盒一起转化到酵母细胞中。在这种情况下,可以同时使用第一营养缺陷型标志物和第二营养缺陷型标志物来选择转化的细胞。
本发明的重组酵母细胞可能缺乏至少第一营养缺陷型标志物基因和任选的第二营养缺陷型标志物基因。缺乏营养缺陷型标志物基因的酵母细胞在编码某种代谢途径所需的酶/因子的基因中具有突变。因此,缺乏某些营养缺陷型标志物基因的酵母细胞不能合成特定的生化产物,因此需要将生化产物补充到生长培养基中。当用包括编码所述营养缺陷型标志物的核酸序列的表达盒转化缺乏一个或多个营养缺陷型标志物基因的酵母细胞时,恢复了在未添加生化产物的培养基中生长的能力。因此,这种营养缺陷型标志物可以用于选择用期望产物转化的酵母细胞。
用于酵母细胞的营养缺陷型标志物基因包含但不限于ura3、his4、ade2、arg4、ade1、ura5、aox1、met2、lys2、pro3和tyr1。
缺乏两个营养缺陷型标志物基因的酵母细胞可以用两个表达盒转化,每个表达盒均包括一个营养缺陷型标志物基因。可以通过筛选在未添加相应生化产品的培养基中生长的细胞来选择转化的细胞。因此,可以选择用两个表达盒转化的酵母细胞。
在一个实施例中,第一营养缺陷型标志物基因是his4。His4缺陷型细胞需要在其生长培养基中存在组氨酸才能生长。因此,用编码His4的核酸序列转化的细胞能够在没有组氨酸的培养基上生长。His4缺陷型法夫驹形氏酵母菌株GS115可从Life TechnologiesTM商购获得。另一种his4缺陷型菌株CBS7435 his4描述于以下文献中:
Figure BDA0003068552100000051
等人(2012)PloS One 7:e39720。
在一个实施例中,第二营养缺陷型标志物基因是ura3。ura3缺陷型细胞JC254描述于以下文献中:Cregg等人(1998)《分子生物学方法(Methods Mol.Biol.)》103:17-26。ura3缺陷型细胞需要在其生长培养基中存在尿嘧啶或尿苷才能生长。因此,用编码Ura3的核酸序列转化的细胞能够在没有尿嘧啶或尿苷的培养基上生长。ura3缺陷型细胞JC254描述于以下文献中:Cregg等人(1998)《分子生物学方法》103:17-26。
在本发明的上下文中,ura3缺陷型菌株可以是具有部分或全部ura3基因缺失的菌株。
在一个实施例中,重组酵母菌株是缺乏ura3的GS115菌株。优选地,重组酵母菌株是具有部分ura3基因缺失的GS115菌株。
术语“核酸”、“核酸序列”或“核酸分子”具有其通常的含义,并且可以包含但不限于例如多核苷酸(如脱氧核糖核酸(DNA)或核糖核酸(RNA))、寡核苷酸、通过聚合酶链反应(PCR)生成的片段以及通过连接、切割、核酸内切酶作用和核酸外切酶作用中的任何一种生成的片段。糖修饰包含例如用卤素、烷基、胺和叠氮基代替一个或多个羟基,或者糖可以被官能化为醚或酯。此外,整个糖部分可以被空间上和电子上相似的结构代替,如氮杂糖和碳环糖类似物。碱基部分的修饰的实例包含烷基化的嘌呤和嘧啶、酰化的嘌呤或嘧啶或其它众所周知的杂环取代基。核酸单体可以通过磷酸二酯键或此类连接的类似物连接。磷酸二酯键的类似物包含硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、硫代苯胺磷酸酯、苯胺磷酸酯、氨基磷酸酯等。核酸可以是单链或双链的。
术语“分离的核酸分子”是指已经与其天然缔合的环境(如基因组)分离的核酸分子。
本发明中使用的核酸序列进一步涵盖密码子优化的序列。通过系统地改变重组DNA中的密码子来优化核酸,以使其在不同于分离核酸的细胞的宿主细胞中表达,使得密码子与用于表达的生物体中的密码子使用模式相匹配,从而增强被表达的蛋白质的产率。然而,密码子优化的序列编码具有与天然蛋白相同的氨基酸序列的蛋白。
如本文所使用的,术语“编码(coding for)或(encoding)”具有其通常的含义,并且可以包含但不限于例如多核苷酸(如基因、cDNA或mRNA)中的核苷酸特定序列的性质,以用作合成其它大分子(如确定的氨基酸序列)的模板。因此,如果对应于基因的mRNA的转录和翻译在细胞或其它生物系统中产生蛋白质,则该基因编码该蛋白质。
如本文所使用的,术语“前导肽”是指指导蛋白质分泌的肽。从细胞分泌的蛋白质的前导肽位于蛋白质的N端,一旦新生蛋白质链跨过粗糙的内质网开始输出,该前导肽就会从成熟的蛋白质上被切割下来。前导肽使被表达的蛋白质能够运输到质膜或穿过质膜,从而易于分离和纯化被表达的蛋白质。通常,在蛋白质被转运到质膜上或穿过质膜后,前导肽通过专门的细胞肽酶从蛋白质上被切割下来。
在一个实施例中,前导肽包括SEQ ID No:9到15中任一个所示的氨基酸序列。在一个实施例中,前导肽是根据SEQ ID No:9到15中任一个所述的前导肽的功能变体。如果变体前导肽与蛋白质的融合导致重组宿主细胞将所述蛋白质分泌到上清液中(与未修饰的前导肽与所述蛋白质的融合基本上相同),则前导肽的功能变体与未修饰的序列具有基本上相同的前导活性。基本上相同的分泌是指表达前导肽的功能变体的宿主细胞的上清液中蛋白质的量是表达未修饰的前导肽的宿主细胞的上清液中蛋白质的量的至少50%或60%,优选地,至少70%或75%,更优选地,至少80%或85%,并且最优选地,至少90%、92%、95%或98%。在一个实施例中,前导肽包括SEQ ID No:9所示的氨基酸序列。
本发明中使用的前导肽可以由根据SEQ ID No:16到22中任一个所述的核酸序列编码,或由与根据SEQ ID NO:16到22中任一个所述的核酸序列具有至少80%同一性且编码根据SEQ ID NO:9到15中任一个所述的前导肽的功能变体的核酸序列编码。
“序列同一性”、“%序列同一性”、“%同一性”、“%一致性”或“序列比对”是指第一氨基酸序列与第二氨基酸序列的比较或第一核酸序列与第二核酸序列的比较,并基于该比较计算为百分比。这一计算结果可以描述为“一致百分比”或“ID百分比”。
通常,序列比对可用于通过两种不同方法之一来计算序列同一性。在第一种方法中,在最终序列同一性计算中,将单个位置的不匹配项和单个位置的空位均计为不一致位置。在第二种方法中,在最终序列同一性计算中,将单个位置的不匹配项计为不一致位置;然而,在最终序列同一性计算中,单个位置的空位不计为(忽略)不一致位置。换句话说,在第二种方法中,在最终序列同一性计算中忽略空位。这两种方法之间的差异(即,将空位计为不一致位置而不是忽略空位)可能会导致两个序列之间的序列同一性值发生变化。
序列同一性由程序确定,所述程序产生比对,并且在最终序列同一性计算中将单个位置的不匹配项和单个位置的空位均计为不一致位置,从而计算同一性。例如程序Needle(EMBOS),所述程序已实现Needleman和Wunsch的算法(Needleman和Wunsch,1970,《分子生物学杂志(J.Mol.Biol.)》48:443-453),并且所述程序如下根据默认设置计算序列同一性:首先在第一个序列和第二个序列之间产生比对,然后计算比对长度上相同位置的数目,然后将相同残基的数目除以比对长度,然后将该数目乘以100来生成序列同一性百分比[序列同一性百分比=(相同残基数/比对长度)x 100)]。
可以根据成对的比对计算出序列同一性,所述成对的比对显示全长上的两个序列,因此显示出其全长上的第一序列和第二序列(“全局序列同一性”)。举例来说,程序Needle(EMBOSS)产生这样的比对;序列同一性百分比=(相同残基数/比对长度)x 100)]。
可以根据仅显示第一序列或第二序列的局部区域的成对的比对计算序列同一性(“局部同一性”)。举例来说,程序Blast(NCBI)产生这样的比对;序列同一性百分比=(相同残基数/比对长度)x 100)]。
优选地通过使用Needleman和Wunsch的算法(《分子生物学杂志》(1979)48,第443-453页)产生序列比对。优选地,将程序“NEEDLE”(欧洲分子生物学开放软件套件(EMBOSS))与程序的默认参数一起使用(空位开放=10.0,空位延伸=0.5,对于蛋白质,矩阵=EBLOSUM62,而对于核苷酸,矩阵=EDNAFULL)。然后,可以根据比对计算出序列同一性,所述比对显示全长上的两个序列,因此显示出其全长上的第一序列和第二序列(“全局序列同一性”)。举例来说:序列同一性百分比=(相同残基数/比对长度)x 100)]。
如本文所使用的,“变体核酸序列”是指与各个亲本序列的核酸序列具有至少n%同一性的核酸序列,其中“n”是介于80和100之间的整数。变体核酸序列包含与亲本核酸序列的全长序列相比具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。变体核酸序列编码具有与亲本核酸序列编码的蛋白质基本上相同的活性的蛋白质。
如本文所使用的,“变体氨基酸序列”是指与各个亲本序列的氨基酸序列具有至少n%同一性的氨基酸序列,其中“n”是介于80和100之间的整数。变体氨基酸序列包含与亲本氨基酸序列的全长序列相比具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。具有变体氨基酸序列的蛋白质具有与亲本氨基酸序列基本上相同的活性。
术语“表达盒”是指含有蛋白质的编码序列和控制序列(如例如可操作连接的启动子)的核酸分子,使得用这些序列转化或转染的宿主细胞能够产生被编码的蛋白质。表达盒可以进一步包括编码标志物(如营养缺陷型标志物)的核酸序列。表达盒可以是载体的一部分或可以整合到宿主细胞染色体中。
表达盒可以进一步含有与编码蛋白质的核酸序列可操作地连接的合适的终止子序列。合适的终止子序列包含但不限于AOX1(醇氧化酶)终止子、CYC1(细胞色素c)终止子和TEF(翻译延伸因子)终止子。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9所述的氨基酸序列或与根据SEQ ID No:9所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:11所述的氨基酸序列或与根据SEQ ID No:11所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:12所述的氨基酸序列或与根据SEQ ID No:12所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:13所述的氨基酸序列或与根据SEQ ID No:13所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:14所述的氨基酸序列或与根据SEQ ID No:14所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:2所述的核酸序列或与根据SEQ IDNo:2中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:3所述的核酸序列或与根据SEQ IDNo:3中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:4所述的核酸序列或与根据SEQ IDNo:4中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:5所述的核酸序列或与根据SEQ IDNo:5中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:6所述的核酸序列或与根据SEQ IDNo:6中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:7所述的核酸序列或与根据SEQ IDNo:7中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:14所述的氨基酸序列或与根据SEQ ID No:14所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:2所述的核酸序列或与根据SEQ IDNo:2所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:3所述的核酸序列或与根据SEQ IDNo:3所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:4所述的核酸序列或与根据SEQ IDNo:4所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:6所述的核酸序列或与根据SEQ IDNo:6所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:14所述的氨基酸序列或与根据SEQ ID No:14所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85T和D265S和T268G。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和T268G。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的核酸序列。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和D265T。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和D265A。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I254L和D265T。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:15所述的氨基酸序列或与根据SEQ ID No:15所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:2所述的核酸序列或与根据SEQ IDNo:2所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:8所述的核酸序列或与根据SEQ IDNo:8所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:1所述的核酸序列或与根据SEQ IDNo:1所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和T268G。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:3所述的核酸序列或与根据SEQ IDNo:3所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:4所述的核酸序列或与根据SEQ IDNo:4所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:6所述的核酸序列或与根据SEQ IDNo:6所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:I255A和D265S。
在一个实施例中,重组酵母细胞包括一个表达盒,所述表达盒包括:
(a)启动子,所述启动子包括根据SEQ ID No:6所述的核酸序列或与根据SEQ IDNo:6所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:10所述的氨基酸序列或与根据SEQ ID No:10所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码根据SEQ ID No:23所述的脂肪酶的变体的核酸序列,与SEQ ID No:23的氨基酸序列相比,其包括以下氨基酸取代:S83H、I85L和T268G。
在一个实施例中,重组酵母细胞包括第一表达盒和第二表达盒。在一个实施例中,第一表达盒和第二表达盒编码相同的重组蛋白,即,由第一表达盒编码的重组蛋白与由第二表达盒编码的重组蛋白相同。
在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码第一营养缺陷型标志物的核酸序列。
在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码HIS4的核酸序列。
在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和根据SEQ ID No:25所述的核酸序列或与其具有80%同一性的编码HIS4的核酸序列。
在一个实施例中,第一表达盒包括根据SEQ ID No:1所述的启动子序列、编码重组蛋白的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:25所述的核酸序列。
在一个实施例中,第一表达盒包括根据SEQ ID No:1所述的启动子序列、编码根据SEQ ID No:9所述的前导肽的核酸序列、编码重组脂肪酶的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:25所述的核酸序列。
在一个实施例中,第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码第二营养缺陷型标志物的核酸序列。
在一个实施例中,第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码URA3的核酸序列。
在一个实施例中,第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和根据SEQ ID No:26所述的核酸序列或与其具有80%同一性的编码URA3的核酸序列。
在一个实施例中,第二表达盒包括根据SEQ ID No:1所述的启动子序列、编码重组蛋白的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:26所述的核酸序列。
在一个实施例中,第二表达盒包括根据SEQ ID No:1所述的启动子序列、编码根据SEQ ID No:9所述的前导肽的核酸序列、编码重组脂肪酶的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:26所述的核酸序列。
在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码第一营养缺陷型标志物的核酸序列,并且第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码第二营养缺陷型标志物的核酸序列。
在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码HIS4的核酸序列,并且第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和编码URA3的核酸序列。
在一个实施例中,第一表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和根据SEQ ID No:25所述的核酸序列或与其具有80%同一性的编码HIS4的核酸序列,并且第二表达盒包括与根据SEQ ID No:1到8中任一个所述的启动子序列具有至少80%同一性的启动子序列、编码重组蛋白的核酸序列和根据SEQ ID No:26所述的核酸序列或与其具有80%同一性的编码URA3的核酸序列。
在一个实施例中,第一表达盒包括根据SEQ ID No:1所述的启动子序列、编码重组蛋白的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:25所述的核酸序列,并且第二表达盒包括根据SEQ ID No:1所述的启动子序列、编码重组蛋白的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:26所述的核酸序列。
在一个实施例中,第一表达盒包括根据SEQ ID No:1所述的启动子序列、编码根据SEQ ID No:9所述的前导肽的核酸序列、编码重组脂肪酶的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:25所述的核酸序列,并且第二表达盒包括根据SEQ ID No:1所述的启动子序列、编码根据SEQ ID No:9所述的前导肽的核酸序列、编码重组脂肪酶的核酸序列、终止子序列和与合适的启动子和终止子可操作地连接的根据SEQ ID No:26所述的核酸序列。
在本发明的酵母细胞中表达的重组蛋白可以是任何蛋白质,如任何真核、原核和合成蛋白质。该蛋白质可以与宿主细胞同源,即其可以由宿主细胞天然表达,或者可以与宿主细胞异源,即其可以不由宿主细胞天然表达。该蛋白质可以包含但不限于酶、肽、抗体及其抗原结合片段和重组蛋白。市场上已存在的通过在法夫驹形氏酵母中异源表达而获得的蛋白质包含植酸酶、胰蛋白酶、硝酸还原酶、磷脂酶C、胶原蛋白、蛋白酶K、艾卡拉肽(ecallantide)、奥克纤溶酶(ocriplasmin)、人胰岛素、菌丝霉素肽衍生物NZ2114、弹性蛋白酶抑制剂、重组细胞因子和生长因子、人胱抑素C、HB-EGF、干扰素-α2b、人血清白蛋白和人血管抑素。
在一个实施例中,重组蛋白是酶。该酶可以选自由以下组成的组:脂肪酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、蛋白酶、木聚糖酶、葡聚糖酶、纤维素酶、甘露聚糖酶和植酸酶。
在一个实施例中,由第一表达盒和第二表达盒编码的重组蛋白是脂肪酶。脂肪酶可以具有与SEQ ID No:23的氨基酸序列具有至少80%序列同一性的氨基酸序列。在一个实施例中,脂肪酶具有根据SEQ ID No:23所述的氨基酸序列。脂肪酶由与SEQ ID No:24的核酸序列具有至少80%序列同一性的核酸序列编码。在一个实施例中,脂肪酶由根据SEQ IDNo:24所述的核酸序列编码。具有与SEQ ID No:23的氨基酸序列具有至少80%同一性的氨基酸序列或由与SEQ ID No:24的核酸序列具有至少80%同一性的核酸序列编码的蛋白质具有脂肪酶活性。术语“脂肪酶活性”是指蛋白质可以切割脂质中的酯键。通过将蛋白质与合适的脂肪酶底物(如PNP-辛酸酯、1-油精、半乳糖脂、磷脂酰胆碱和三酰基甘油)一起孵育并确定相对于对照脂肪酶的脂肪酶活性,可以确定蛋白质的脂肪酶活性。
在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括一个或多个氨基酸插入、缺失或取代。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,氨基酸插入、缺失或取代位于选自氨基酸残基23、33、82、83、84、85、160、199、254、255、256、258、263、264、265、268、308和311的氨基酸残基处。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,氨基酸取代选自由以下组成的组:Y23A、K33N、S82T、S83D、S83H、S83I、S83N、S83R、S83T、S83Y、S84S、S84N、I85A、I85C、I85F、I85H、I85L、I85M、I85P、I85S、I85T、I85V、I85Y、K160N、P199I、P199V、I254A、I254C、I254E、I254F、I254G、I254L、I254M、I254N、I254R、I254S、I2454V、I254W、I254Y、I255A、I255L、A256D、L258A、L258D;L258E、L258G、L258H、L258N、L258Q、L258R、L258S、L258T、L258V、D263G、D263K、D263P、D263R、D263S;T264A、T264D、T264G、T264I、T264L、T264N、T264S、D265A、D265G、D265K、D265L、D265N、D265S、D265T、T268A、T268G、T268K、T268L、T268N、T268S、D308A和Y311E。在一个实施例中,与SEQID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I85L和T268G。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:I255A和D265S。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I254L和D265T。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I85L和D265T。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I85L和D265A。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:I255A。在一个实施例中,与SEQ ID No:23的氨基酸序列相比,脂肪酶包括以下氨基酸取代:S83H、I85T和D265S和T268G。
下表1中示出了与根据SEQ ID No:23所述的序列相比具有一个或多个氨基酸取代或插入的另外的合适的脂肪酶,其中LIP062是指根据SEQ ID No:23所述的脂肪酶。
表:1
Figure BDA0003068552100000161
表:1
Figure BDA0003068552100000171
表:1
Figure BDA0003068552100000181
表:1
Figure BDA0003068552100000191
表:1
Figure BDA0003068552100000201
表:1
Figure BDA0003068552100000211
表:1
Figure BDA0003068552100000221
表:1
Figure BDA0003068552100000231
如本文所使用的,术语“启动子”是指指导结构基因转录的核苷酸序列。在一些实施例中,启动子位于基因的5'非编码区中,最接近结构基因的转录起始位点。在启动转录中起作用的启动子内的序列元件也可以通过共有核苷酸序列来表征。这些启动子元件包含RNA聚合酶结合位点、TATA序列、CAAT序列、分化特异性元件(DSE;McGehee等人,《分子内分泌学(Mol.Endocrinol.)》7:551(1993))、环状AMP反应元件(CRE)、血清反应元件(SRE;Treisman,《癌症生物学研讨会(Seminars in Cancer Biol.)》1:47(1990))、糖皮质激素应答元件(GRE)和其它转录因子的结合位点,如CRE/ATF(O'Reilly等人,《生物化学杂志(J.Biol.Chem.)》267:19938(1992))、AP2(Ye等人,《生物化学杂志》269:25728(1994))、SP1、cAMP反应元件结合蛋白(CREB;Loeken,《基因表达(Gene Expr.)》3:253(1993))和八聚体因子(一般参见,编者:Watson等人,《基因的分子生物学(Molecular Biology of theGene)》,第4版(本杰明/卡明斯出版公司(The Benjamin/Cummings Publishing Company,Inc.)1987;)以及Lemaigre和Rousseau,《生物化学杂志(Biochem.J.)》303:1(1994))。
在本发明的上下文中,在第一表达盒和任选的第二表达盒中用于表达重组蛋白的启动子序列包括选自由以下组成的组的核酸序列:SEQ ID No:1-8(pSD001(SEQ ID No:1)、pSD002(SEQ ID No:2)、pSD003(SEQ ID No:3)、pSD004(SEQ ID No:4)、pSD005(SEQ ID No:5)、pSD007(SEQ ID No:6)、pSD008(SEQ ID No:7)和AOX(SEQ ID No:8)。
在一个实施例中,启动子包括与SEQ ID No:1-7中任一个或其片段具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的核酸序列,并在不存在甲醇的情况下驱动酵母细胞中的蛋白质表达。在一些实施例中,序列同一性在至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个、1150个或更多个残基的区域或核酸的全长上。在一些实施例中,SEQ ID No:1-7中任一个的片段在至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个、1150个或更多个残基的区域或核酸的全长上,并在不存在甲醇的情况下驱动酵母细胞中的蛋白质表达。
在一个实施例中,启动子包括根据SEQ ID No:1-7中任一个所述的核酸序列的功能片段。功能片段包括根据SEQ ID No:1-7中任一个所述的序列中的任何序列的至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个或1150个连续核苷酸。术语“功能”旨在表示该启动子可用于独立于甲醇来驱动蛋白质表达,其中该启动子在无甲醇的培养基中驱动蛋白质表达。
在一些实施方案中,启动子是可用于独立于甲醇来驱动蛋白质表达的启动子,其中该启动子驱动无甲醇的培养基中的蛋白质表达。这意味着该启动子在不存在甲醇的情况下是有活性的。表述“在不存在甲醇的情况下是有活性的启动子”在本文中可以与“启动子独立于甲醇来驱动蛋白质表达”和“在不存在甲醇的情况下允许蛋白质表达增加的启动子”互换使用。
在一个实施例中,启动子序列包括根据SEQ ID No:1所述的核酸序列。在一个实施例中,启动子包括与SEQ ID No:1或其片段具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的核酸序列,并且所述启动子在不存在甲醇的情况下驱动酵母细胞中的蛋白质表达。
在一个实施例中,启动子包括与SEQ ID No:8或其片段具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的核酸序列,并在存在甲醇的情况下驱动酵母细胞中的蛋白质表达。在一些实施例中,序列同一性在至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个、1150个或更多个残基的区域或核酸的全长上。在一些实施例中,SEQ ID No:8的片段在至少50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、2050个、1100个、1150个或更多个残基的区域或核酸的全长上,并在存在甲醇的情况下驱动酵母细胞中的蛋白质表达。
启动子可以可操作地连接至编码前导肽的核酸分子和编码重组蛋白的核酸分子,使得启动子能够影响前导肽和重组蛋白的表达。
在一个实施例中,彼此可操作地连接的核酸序列被立即连接,即在启动子与编码蛋白质和前导肽的核酸序列之间没有另外的元件或核酸序列。
在一个实施例中,第一表达盒包括编码第一营养缺陷标志物HIS4(组蛋白醇脱氢酶)的核酸序列。在一个实施例中,编码HIS4的核酸序列来自酿酒酵母。在一个实施例中,编码HIS4的核酸序列是根据SEQ ID No:25所述的核酸序列或其功能变体,所述功能变体与根据SEQ ID No:25所述的核酸序列具有至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一个实施例中,核酸序列编码与根据SEQ ID No:27所述的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的多肽。根据SEQ ID No:25所述的核酸序列的功能变体编码具有组蛋白醇脱氢酶活性的蛋白质。因此,功能变体能够补充酵母细胞的his4缺陷表型,并允许酵母细胞在不包括组氨酸的培养基上生长。
在一个实施例中,第二表达盒包括编码第二营养缺陷标志物URA3(乳清酸核苷5'磷酸脱羧酶)的核酸序列。在一个实施例中,编码URA3的核酸序列来自酿酒酵母。在一个实施例中,编码URA3的核酸序列是根据SEQ ID No:26所述的核酸序列或其功能变体,所述功能变体与根据SEQ ID No:26所述的核酸序列具有至少65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一个实施例中,核酸序列编码与根据SEQ ID No:28所述的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高序列同一性的多肽。根据SEQ ID No:26所述的核酸序列的功能变体编码具有乳清酸核苷5'磷酸脱羧酶活性的蛋白质。因此,功能变体能够补充酵母细胞的ura3缺陷表型,并允许酵母细胞在不包括尿嘧啶或尿苷的培养基上生长。
第一表达盒和任选的第二表达盒被稳定地整合到酵母细胞(优选地,法夫驹形氏酵母细胞)的基因组中。这意味着第一表达盒和任选的第二表达盒与酵母细胞的基因组一起复制,并且在细胞分裂过程中不会丢失。
术语“载体”是指在合适的宿主生物体中克隆的重组核苷酸序列(即重组基因)的转录及其mRNA翻译所需的DNA序列。表达载体包括表达盒,并且通常另外地包括宿主细胞或基因组整合位点中自主复制的起点、一个或多个可选择标志物(例如氨基酸合成基因或赋予对抗生素(如博莱霉素、卡那霉素、G418或潮霉素)的抗性的基因)、多个限制酶切割位点、合适的启动子序列和转录终止子,这些组分可操作地连接在一起。
如本文所使用的,术语“载体”包含自主复制性核苷酸序列以及基因组整合性核苷酸序列。载体包含但不限于质粒、小环、酵母整合质粒、附加型质粒、着丝粒质粒、人工染色体和病毒基因组。可用的商业载体是本领域技术人员已知的。商业载体可从例如欧洲分子生物学实验室和Atum获得。
在优选的实施例中,表达载体是适合以每细胞单拷贝或多拷贝整合到宿主细胞基因组中的质粒。编码启动子、重组蛋白和营养缺陷型标志物的核酸序列也可以以每个细胞单拷贝或多拷贝提供在自主复制质粒上。优选的质粒是真核表达载体,优选地,酵母表达载体。表达载体可以是能够在宿主生物体的基因组中复制或整合到宿主生物体的基因组中的任何载体。优选地,载体在酵母细胞(如法夫驹形氏酵母细胞)中有功能。
载体可以通过本领域已知的任何方法产生。例如,连接编码蛋白质的核酸序列并将连接的序列插入合适的载体中的程序是已知的并描述于以下文献中:例如Green和Sambrook(2012)《分子克隆(Molecular Cloning)》,第4版,冷泉港实验室出版社(ColdSpring Harbor Laboratory Press)。
在一个实施例中,提供了一种在本发明的重组酵母细胞中产生重组蛋白的方法。根据所述方法,在获得蛋白质之前,在合适的条件下培养酵母细胞。合适的条件是允许蛋白质表达和分泌的那些条件,并且是本领域技术人员众所周知的。所述条件包含以分批模式、分批进料模式和连续模式进行培养。
可以以工业规模培养宿主细胞,所述工业规模可以采用至少10升(优选地,至少50升,最优选地,至少100升)的培养基体积。
可以在生长条件下培养宿主细胞以获得至少1g/L细胞干重(更优选地,至少10g/L细胞干重,优选地,至少20g/L细胞干重)的细胞密度。
用于细胞培养的营养发酵液可以包括至少一种碳源。在一些实施例中,至少一种碳源选自由以下组成的组:右旋糖、麦芽糖、葡萄糖、糊精、甘油、山梨糖醇、甘露糖醇、乳酸、乙酸盐、木糖或其它部分水解的淀粉及其任何混合物。在一些实施例中,至少一种碳源的浓度为0.0g/l、0.5g/L、1g/L、2g/L、4g/L、6g/L、8g/L、10g/L、11g/L、12g/L、13g/L、14g/L、15g/L、16g/L、18g/L、20g/L、22g/L、24g/L、26g/L、28g/L、30g/L、35g/L、40g/L、45g/L、50g/L、55g/L或60g/L(由上述任何两个值定义的范围内的任何浓度)。在一些实施例中,所述方法进一步包括通过脉冲或连续进料添加至少一种碳源。
宿主细胞产生的蛋白质可以通过任何已知的用于分离和纯化蛋白质的工艺获得。这些工艺包含但不限于盐析和溶剂沉淀、超滤、凝胶电泳、离子交换色谱、亲和色谱、反相高效液相色谱、疏水相互作用色谱、混合模式色谱、羟基磷灰石色谱和等电聚焦。
重组酵母细胞上清液中重组蛋白的效价为0.2到15.5g/l或0.5到15.5g/l或1.0到15.5g/l或1.5到15.5g/l或2.0到15.5g/l或2.5到15.5g/l或3.0到15.5g/l或3.5到15.5g/l或4.0到15.5g/l或4.5到15.5g/l或5.0到15.5g/l或5.3到15.5g/l。重组酵母细胞上清液中重组蛋白的效价为0.8g/l到15.5g/l或0.8g/l到15.0g/l或0.8g/l到14.5g/l或0.8g/l到14.0g/l或0.8g/l到13.5g/l或0.8g/l到13.0g/l或0.8g/l到12.5g/l或0.8g/l到12.0g/l或0.8g/l到11.5g/l或0.8g/l到11.0g/l或0.8g/l到10.5g/l或0.8g/l到10.0g/l或0.8g/l到9.5g/l或0.8g/l到9.0g/l或0.8g/l到8.5g/l或0.8g/l到8.0g/l或0.8g/l到7.5g/l或0.8g/l到7.0g/l或0.8g/l到6.5g/l或0.8g/l到6.0g/l。重组酵母细胞上清液中重组蛋白的效价为3.8到5.4g/l或0.9到8.8g/l或1.7到2.5g/l或1.1到11.8g/l或2.8到9.0g/l或3.5到13.7g/l或1.8到2.7g/l或5.3到5.7g/l或3.2到6.1g/l或0.2到3.5g/l或4.4到15.5g/l或0.9到12.8g/l或0.8到5.2g/l或0.6到11.1g/l或1.6到2.5g/l或0.8到1.9g/l或3.1到6.9g/l或2.9到4.9g/l。
在一个实施例中,本发明提供了一种缺乏第一营养缺陷型标志物和第二营养缺陷型标志物的重组法夫驹形氏酵母细胞,其中用以下各项转化重组酵母细胞:
(a)第一表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码所述第一营养缺陷型标志物的核酸序列;以及
(b)第二表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码所述重组蛋白的核酸序列和编码所述第二营养缺陷型标志物的核酸序列。
在一个实施例中,本发明提供了一种缺乏第一营养缺陷型标志物和第二营养缺陷型标志物的重组法夫驹形氏酵母细胞,其中用以下各项转化重组酵母细胞:
(a)第一表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码重组脂肪酶的核酸序列和编码所述第一营养缺陷型标志物的核酸序列;以及
(b)第二表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码所述重组脂肪酶的核酸序列和编码所述第二营养缺陷型标志物的核酸序列。
在一个实施例中,本发明提供了一种缺乏第一营养缺陷型标志物和第二营养缺陷型标志物的重组法夫驹形氏酵母细胞,其中用以下各项转化重组酵母细胞:
(a)第一表达盒,其包括与编码前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码所述第一营养缺陷型标志物的核酸序列;以及
(b)第二表达盒,其包括与编码前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码所述重组蛋白的核酸序列和编码所述第二营养缺陷型标志物的核酸序列。
在一个实施例中,本发明提供了一种缺乏第一营养缺陷型标志物和第二营养缺陷型标志物的重组法夫驹形氏酵母细胞,其中用以下各项转化重组酵母细胞:
(a)第一表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码所述第一营养缺陷型标志物的核酸序列;以及
(b)第二表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码所述重组蛋白的核酸序列和编码所述第二营养缺陷型标志物的核酸序列。
在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:
(a)第一表达盒,其包括与启动子可操作地连接的编码重组蛋白的核酸序列,所述核酸序列与根据SEQ ID No:1-8中任一个所述的序列具有至少80%的同一性,和编码HIS4的核酸序列;以及
(b)第二表达盒,其包括与启动子可操作地连接的编码所述重组蛋白的核酸序列,所述核酸序列与根据SEQ ID No:1-8中任一个所述的序列具有至少80%的同一性,和编码URA3的核酸序列。
在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:
(a)第一表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码HIS4的核酸序列;以及
(b)第二表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码URA3的核酸序列。
在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:
(a)第一表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码脂肪酶的核酸序列和编码HIS4的核酸序列;以及
(b)第二表达盒,其包括与根据SEQ ID No:1所述的启动子可操作地连接的编码脂肪酶的核酸序列和编码URA3的核酸序列。
在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:
(a)第一表达盒,其包括与编码前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码HIS4的核酸序列;以及
(b)第二表达盒,其包括与编码前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码URA3的核酸序列。
在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:
(a)第一表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码HIS4的核酸序列;以及
(b)第二表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和编码URA3的核酸序列。
在一个实施例中,本发明提供了一种缺乏his4和ura3的重组法夫驹形氏酵母细胞,其中用以下各项转化所述细胞:
(a)第一表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和根据SEQ IDNo:25所述的核酸序列或与其具有80%同一性的编码HIS4的核酸序列;以及
(b)第二表达盒,其包括与编码根据SEQ ID No:9所述的前导肽的核酸序列融合并与根据SEQ ID No:1所述的启动子可操作地连接的编码重组蛋白的核酸序列和根据SEQ IDNo:26所述的核酸序列或与其具有80%同一性的编码URA3的核酸序列。
提供以下实例用于说明性目的。因此,应当理解,这些实例不应解释为限制性的。技术人员将显然能够设想对本文提出的原理的进一步修改。
实例
1)毕赤酵母表达载体的构建和筛选方法
将基因部分克隆到pPICz或pAO815表达载体(Invitrogen)中。通过限制性消化使表达载体线性化,并使用凝胶电泳和纯化分离载体主链。通过使用GeneArt Seamless克隆和装配试剂盒(Invitrogen)进行无缝连接或通过使用T4连接酶(ThermoFischer)进行限制性连接将新的DNA部分(如启动子、编码信号肽的核酸序列、重组蛋白或选择标志物)克隆到载体主链中。
将克隆的构建体转化到大肠杆菌克隆宿主中,如One Shot TOP10(Invitrogen)或XL1-blue(Agilent),进行序列验证,然后纯化质粒。通过限制性消化使纯化的表达载体质粒线性化,并通过电穿孔将其转化为法夫驹形氏酵母。通过博莱霉素选择或通过在最小培养基上进行选择,筛选转化体以进行转化。在发酵罐中生长之前,首先在微量滴定板上筛选单个菌落的表达。
2)发酵条件
将表达载体转化到巴斯德毕赤酵母(法夫驹形氏酵母)中,并将所得菌株如下所述生长。
对于脉冲进料葡萄糖的发酵条件,将初始批次的法夫驹形氏酵母细胞用分批培养物接种,pH大于pH 4.0,并且温度在20-35℃之间。每天两次对发酵进行采样,持续140小时,第一次采样是在接种后的24小时。初始批次补充有15g/L的葡萄糖(玉米糖浆)。在初始葡萄糖受DO控制而耗尽后,给予细胞1g/L的葡萄糖脉冲。
对于葡萄糖受限的发酵条件,将初始批次的法夫驹形氏酵母细胞用分批培养物接种,pH大于pH 4.0,并且温度在20-35℃之间。每天两次对发酵进行采样,持续140小时,第一次采样是在接种后的24小时。初始批次补充有15g/L的葡萄糖(玉米糖浆)。初始葡萄糖耗尽后,给予细胞1G/L的葡萄糖脉冲,直至OD600超过200,然后连续补充葡萄糖。
根据本领域已知的方法,用甲醇处理用携带有AOX启动子的表达载体转化的巴斯德毕赤酵母培养物,以诱导基因表达。
3)蛋白质定量
通过将全发酵液与作为底物的对辛酸酯一起在50mM HEPES pH 7.5中于26℃下孵育10分钟,通过脂肪酶活性来测量全发酵液中的脂肪酶蛋白滴度。将全发酵液特异性脂肪酶活性与已经通过氨基酸分析(AAA)定量的脂肪酶金标准进行比较。另外,对蛋白质样品进行SDS PAGE分析。
表2示出了用不同酵母菌株获得的全发酵液滴度:
启动子 信号肽 全发酵液滴度(g/L) 发酵时间(小时)
LIP62 SEQ ID No:8 SEQ ID No:14 3.8-5.4 146±-168
LIP62 SEQ ID No:8 SEQ ID No:15 0.9-8.8 141-189
LIP117 SEQ ID No:8 SEQ ID No:15 1.7-2.5 118
LIP120 SEQ ID No:8 SEQ ID No:15 1.1-11.8 118-214
LIP62 SEQ ID No:8 SEQ ID No:10 2.8-9.0 124-145
LIP134 SEQ ID No:8 SEQ ID No:10 3.5-13.7 145-189
LIP160 SEQ ID No:8 SEQ ID No:15 1.8-2.7 118
LIP157 SEQ ID No:8 SEQ ID No:15 1,4 118
LIP167 SEQ ID No:8 SEQ ID No:15 5.3-5.7 118
LIP173 SEQ ID No:8 SEQ ID No:15 3.2-6.1 118-142
LIP134 SEQ ID No:2 SEQ ID No:10 0.2-3.5 145-189
LIP134 SEQ ID No:1 SEQ ID No:10 4.4-15.5 108-142
LIP173 SEQ ID No:8 SEQ ID No:10 0.9-12.8 140-142
LIP173 SEQ ID No:1 SEQ ID No:10 0.8-5.2 116-117
LIP120 SEQ ID No:1 SEQ ID No:10 0.6-11.1 85-142
LIP173 SEQ ID No:3 SEQ ID No:10 1.6-2.5 116-117
LIP173 SEQ ID No:4 SEQ ID No:10 0.8-1.9 116-117
LIP173 SEQ ID No:6 SEQ ID No:10 3.1-6.9 116-117
LIP120 SEQ ID No:6 SEQ ID No:10 2.9-4.9 118
序列表
<110> 巴斯夫股份公司(BASF SE)
<120> 重组酵母细胞
<130> 180262US01
<160> 26
<170> PatentIn 3.5版
<210> 1
<211> 1501
<212> DNA
<213> 人工
<220>
<223> 启动子pSD001
<400> 1
tccagtgtag cactaaaatc taatatcttc ggctttatac ttttttgttc atccgaaagc 60
ttacgaacaa ttctttctcc tgttttattg tggatataga caatttcgtc agtttcttgg 120
agagaagagt tatttccggt tttggctggc cctataaacg ggttcttgga tttggatcta 180
gtaataaaaa tgtcactgtc attctcggag ctgaactttg tgttgtacga agatgggttg 240
ttccactgtt ttgccagctc ttcattgatg attttcttag tgggtgttct tggaggttca 300
cgttgcctat aatcttgacg ttcttcttca tcactatcga tgccatcaaa attaagcgtc 360
cttattgcag gcttttgtga tttcaactgc aatccttcta tctcttcatc agagctttcg 420
aactgaatac tatcactcaa aactggcgac attgcacatt tccgcaaacc atttcgggaa 480
tctatgctag ctcttctaga cgataaagaa cgaccggaac caatacgggg ttgtgcaggt 540
gggaataaat atgttggttt ggattcttga cgtgaagaag gtattctagt cgatgaagtg 600
gttgataagg atatggcgtc actgagttgt tttcttttcc tatgttgcgg tgttgggtca 660
ggagttaatt gattcacctc cataactctg gaatttcttg aatgtggggt tttcagatgg 720
gcatctttct tgacggggtt gtgagtaacg gaggaacctg gtgtcttggg tgtgaacggt 780
gtttgagcct gtacgcggtt acttctgggc ggagtactcg gagtcatgag agccattgat 840
tagaaggtga atgagggagt caccactcta agcaaacaaa atgaggtcga agcaaaaaat 900
aaagtaaagt agcacttctg gcaggttaga tcaaagagtg acgggagatt tgaagatggc 960
tggtttttcc ttagtcttgg aagaggtttg tgtgggtatc agcgaatatt ccccgattag 1020
gcaaattagt tgcattgaaa ttaacacgac atggtgattt gtggtaacaa atatctattg 1080
gtggttggtg tgtgggtgta atagtggtcg tgtcatgatg atggtgttca ggtgttgtca 1140
tagatcggtc ttcagtaaga gaaggaagct tggtgacgat cacagctatg atgtaataga 1200
aattgctaag caattgtgag gtgtgatgta ttttgcagag caattgtgcg gtacaacggg 1260
gtgttattgt cttcacaagg catttattgc gaatttcgta gttgaaagaa tattttagca 1320
cagggtgctt gacccctatt gttgctcgct aaaccatgat tgctaaatga tgacatagca 1380
atcactttac taagattgct ataaggacac ctttcttagt ataaatggac actcttttcc 1440
cctgctaaac ttcttttatt tttcacactt aaacagttac aaaacacaaa cacaactaga 1500
a 1501
<210> 2
<211> 1501
<212> DNA
<213> 人工
<220>
<223> 启动子pSD002
<400> 2
gtgctaaaat ctgaggttta caagctgtga tgttccccta agatctcaca atcgaacaat 60
cgcgaagcca atgcaagttg tttaagggga aacgactcac tattcctgaa attagtattc 120
aaaacttggt ccggaagaac aatgaggcgg ccgttaaaat actcacgtaa acggtgtcta 180
caagcgcatt aaaatccgtt tgaattcaag caaaagccac cagaggctta tgcttggtta 240
tacccagcat tgacctttgg tatgagcatc tgaaaaacaa ccaggtgttg caaagttaaa 300
catccttctt tgttcatata gaacccacta ttcatggtac tccccaatcg aatttcacat 360
tctggttttg aaattacaca ccacgttagc ttataagatt tcatataact tattgatata 420
cggtttccat tgttcgaata gttgaggttg tatgtaattc gattgaaggg gccatttttg 480
tttcctactt ttcctgggag cttatccgat gcgcttcaaa gctggaattg taaatataga 540
gaaaaagaag gatgttgttt tattcttgaa agagtataat tttacttcta gcaactctcc 600
cacttcgctt gacttcattt atttcttggg cacataggcg tagtaatcta gaccaacaga 660
taatttgccg gaatgatata gcgattggaa aatgaactga aattttttgc tgtctttcaa 720
tttgacgggc agttcatcag tgaccgacca tataaatacg ttgagaatgt tattcttcct 780
cgtagttgaa gtggcttcat aatttcagaa ctcaatagat aaactaggat gttttaaagc 840
aattaatgct cacaagtaag gagcgactct cttgcttttc gaatactaaa agtatcgtcc 900
caacccagaa aaaaagacct cttaactgca aaataaactc tatatatttc ttctaaaaca 960
gtttcaggtt ggatagtatc gcattctcat cacttctaac tagtaggcca tgagatatat 1020
taacgtttac ttgagttcta agttctccga attagatgca cagcacaaac aagattaggt 1080
ttcacttggt acaaaatacg aacagagttt aaggtcgtaa tttcatttcg ttattgatcc 1140
ccacaatcta ttcttatcac agtcatcaga tagtcgcgaa aaagcatgca gaaaaggggg 1200
tcgtccctat ctaagttgta gcattacaac aaatatgact acactcagtg tcgcaatcgg 1260
tatagccaac gctgcaaaat ggattctact gagaatggta tgatgatccc aggatcaatt 1320
tcccaaaaat taaaaaaagt aaaataaaaa gcatcagata ttagggaggt ggtaagattg 1380
ctctgcaagc gatcacgaga ttttaggttt tcctttatgt actatataaa gcgcagattg 1440
gatgccgctt ttccctcctg ggctatgata atatagcgaa cgaaatacac gccaaaataa 1500
a 1501
<210> 3
<211> 1500
<212> DNA
<213> 人工
<220>
<223> 启动子pSD003
<400> 3
tcacattcat agcatctctc gcctgcaata gcttccacga taggaatatc tgtgaaagtg 60
aacatgctat ttcgatgata taagacttta agatctggca tgtttgtgtt ggaggttacc 120
ctggggtcaa taaccctaat tatctccttc actaaaaatg atgaagattc ttcggattcg 180
tttttgaaca gagttaatgc catttcttcg tcaatagaaa aatcaatatc tggtatctca 240
tcttttacat attgaggatt tagttttctt ccctttggat agtacattat gatcaatgta 300
ttcctgtctt tattgataaa gtattggcat tctgcttctt gtacaccttt gaattgtttg 360
tctggaagtg actgacattt ttccacattg ctaacggttt ggcacgaatt acatctaaat 420
aaaatgtctt ctccggattc gtgtattaag tgatactcca atgataaatc cccacctatc 480
gaaccagaat cggcattggc cacagtcaca ggtaacttta ggtcttgaaa aatccttcta 540
taggcttcat tgacattgtc ataagactta agaccatctt ctttggtcaa gtcaaaagaa 600
taggcatctt tcatgagaaa ctctcgtcct ctcaacaaac ctcccctagg tctcaactca 660
tctctatatt tgcgggaaat ttggtacacg agaaggggta aatctttata tgacgaacat 720
aagtcaccaa ctaagtttgt gatttcctct tcacaagttg gcactaaaca gtagtctcta 780
tccttggagt ctttgaactt gaacaattca ttgttgtccc atctcttagt tctctcccat 840
aaatgcttgg aagacaggct acttaattcc atttccagcc caccagcctg atccattctt 900
ttcctaatta cattttgaag ctttttatag gtacggagtc ctaatggaag ccagtgaact 960
attcctgctg caggctggta aataaacctt gattgaagga gcatatcatg agtagtaagg 1020
tcctttacag aaaatagttt acttccttga agagaagtag aataaaacct catgttgggt 1080
ctccatgaaa ggttcaaagg cattgatcct ttaggtactt caggatgttt aagtcatcaa 1140
actgtccatc aaaggtagta tagtatttac catctagata gtgatgtatg ggtgtaacac 1200
aacatttaaa tgttgtaaat taacattagg actgagtccg gagatgctat tgtcacctaa 1260
atctattaga aagcacttca gttatatcat cgatagaggt ttgaagataa acctattgtt 1320
gataaataac cccattaccc gtttacgtag caaggttcaa aaatttgctt agatcggagc 1380
taaaaattcg actgacttct ttcgaaaatg tggattatgc aagcaacgtt gctatcggaa 1440
tagtatataa ggtcgatctg ccccattaca aattgtaaag caacaaacat cctacgcaaa 1500
<210> 4
<211> 1500
<212> DNA
<213> 人工
<220>
<223> pSD004
<400> 4
tcagtttcac ggttatgtga gctgtctccg cgtgaggcag taacctctgt gtcatggata 60
caggctggta cacatttggc agtaggaaca caatctggtt tagttgaaat atgggacgcc 120
acgacgtcca aatgtacaag atcaatgact gggcattcgg cccgaacctc agcgctgagt 180
tggaaccgtc atgttttgag ttctggttca agagatcgca gtatcttaca tcgggatgta 240
cgtgcagcag ctcactatac aagtcgcatt gttgaacacc gccaagaggt ttgtggctta 300
cgttggaacg tggatgaaaa caagctggcc agtggttcca atgataaccg tatgatggta 360
tgggatgcac tgcgtgtaga acagcccctt atgaaagttg aagagcatac tgcggctgtt 420
aaggcgttgg catggtcacc tcatcaacgt ggaatactgg cttcgggtgg aggtactgct 480
gacagacgta tcaaggtgtg gaatacttta acaggatcca agctgcacga tgttgatact 540
ggatctcaag tttgtaatct cttgtggtct cgcaattcta atgaattggt aagtactcat 600
ggatattctc gaaaccaagt cgttatttgg aaatatccgc aaatgaagca actagcatct 660
ttgactggtc atacttatcg agtcctttac ctttccatgt cacctgatgg aactacagtc 720
gtaacggggg ctggagacga aactttaaga ttttggaact gtttcgagaa gtcacgacaa 780
agcggaggag gatcaatatt actagacgct tttagtcagc ttcgttaaat taccaccaaa 840
tttggtgcaa aagggcccat atggtgctac aaccaaagga actttctaat tttgataatg 900
atgtcatttc tctcatcggg atgaaaatag aagtcgaaag gatttttgtc actatttcaa 960
gccccacctg cagctggcag catttctatt gtttatgcat tgtcatttat gggaaaacta 1020
agaaagttcc tctccacccg gactccactg gtaaatatgc gatatcggaa tcatgaccaa 1080
cccatatttt gatcctaatc atttcggttc tagtctccga tcggactccg taaaactgcg 1140
gagtgaactc caacggagaa tactgcagcc aatctcatat ttcatttgtt atttgtccct 1200
caactgtctc gataaggtca tctgtgtttg actagatgtt cgtcattggc atgtcaaaca 1260
aggctagacc ttacaatcat ctcttacgaa tgtaagtgaa tgtaactata ttttccttgc 1320
tactttaacg aggttaacca acccccgcac atccccacac caccgctctt gataagcatc 1380
tccgaaaatg catgacgcga caacttcaag catgttgtat ttactgagtt ttcagcctca 1440
ctatcgatac ctctataaat agaggcactt tcgtctcttc tccctcccca caagaaacca 1500
<210> 5
<211> 1500
<212> DNA
<213> 人工
<220>
<223> 启动子pSD005
<400> 5
agaagtactg ttatgaatcg atcgacgtga catgttgttg atggttctga cttcttgatg 60
tccgcgtttt ctgtctctca atagtggtgt tcgggggaag tatggttcta atacttaaca 120
ggtaagatgg ttgcaatgag cacctggtaa agcaacttga atttcctgcc ctgtctccgt 180
taagttatat tcgactcaag gtccttgctt cctgtctgtt ctgtaaaact tccctttggt 240
gtcttctata tcaactttaa aaacaaggta gtgtgtcgag cgatagtact gtgtcttttt 300
ccctatgaaa aaaatcgcac catccaagac ttctcacctt caacagcttc aacatcatgt 360
tcggtccttt tagagctacg ctggtcgatc taggaggtct gctatggaaa cgtccttgga 420
gaatgtccaa accacagaaa tatagactcc gcaaaagaat gcaacttgta gactccaata 480
tcgacattat ttaccaggga ctgactgagg agggtctgtc ttgcaaagtg atagataact 540
tgaaacaaaa cttcccaaag gagcatgaag tgctccccaa aaacaagtat accgtgttta 600
acaagacagc caaaaactat agaaagggtg ttcatttggt tccaaaatgg accaagaagt 660
ctttgagaga gaaccccgag ttcttctaat tgcacatttc ttcctgttca tagattatcc 720
cacacatagt tgctcacaaa aaaatcacta taattttcct ccaccggcag tatatcacta 780
acacctttat ctttattgta gattataatc tgatctttat ccttagatgt atctatcatc 840
aaccccatgc tcttgaaaag cttgagtctt aacactgtcg aatcgtagtt ttcttgtaga 900
tcattcgata tcactgcttt ttcttgctct tctaattcgt tgagattctg ggtcaaacta 960
gagattgaat tctgaaggtg attcatgttc atctccagat ctgttattga ttttgctaat 1020
ttaaattttt cgtgttcaag ctcttcgata ctctttaggg tctgttgacg gtcttctgtt 1080
tccaataatt gcttgttgaa ctctttaagt tcgtctctct gtttactgat acgtgacaac 1140
aaatctagct ggtgatcgag tttaagtttc cgtttggagc tcaacagaga aagattttca 1200
ttaatttggt tgatagtttg cacgtccggt tcgatctgaa aattctctat agtcgacctg 1260
attaaggaca cagtctcttg aagatcggac attggattta tggagaaggg agatcaaagc 1320
ggaaccagtt gcactgttta cctttccagt cgagatactt atcccacagg gccctcactt 1380
tccaggcaga agtcacctag gaggcgcatc cctccgtttg cttccctcgc gacaaactcc 1440
cctgtaaaag aaaacttcac tgaatcgtac acctaatcat acgacactaa cacagatata 1500
<210> 6
<211> 1500
<212> DNA
<213> 人工
<220>
<223> 启动子pSD007
<400> 6
gtcctttcca aatttttggt tgaaggcatc gcttaaatta tgagcaggat cggtggaaat 60
aagcaggtat ttcttgttag gattgtgaag ggcaagctgg atagatatag aagaagatgt 120
cgtggtttta ccgacacccc ccttacctcc aacaaagatc cacttcagcg attcgtggtt 180
cacaattgat cgcaaacttg gctctgcctc aatatccatg gttgatgtct agttgagtgg 240
cgtttgtggt ctcttgatga gttcaaggcg aaagaatatg ataggaaagc atggtttgaa 300
cttttcgcga aagaaggaat actgttccgc gagaaactcc ccggtgccag aaccttccat 360
tgaggttaat cggtgggagg tgttcgaatg acaatgtcag acaaggcgaa cacgtcttgt 420
gacaccagct ggactaagaa gattcggtat gcaccgaaga agaaggccgt gtctcaattg 480
gcaactttgc aacaaactac ggaggaaaag tctcacaagc ttttaaccaa gttgaatcac 540
gacgacaacg ataaagaaat cctcaaccat ctaacacatg aagtacaaag tagaaatgtg 600
atcttattgg acaaactaga ggagctcaac aaggaactgg gctggattaa agaccgaaaa 660
tgaggaacca tgagcactgg gcgtttccag aaaaactgca accaacgatg ggaaaatgat 720
accacactac tatggtcacc ccacattgtg aaatttcaaa ccaaaaaaga tcaaccccat 780
aattccccag agggttttcc caacaatttt ccaacggact tgataatgag tcagatcatt 840
tgagcatatt catcttaccc cttattccgt gacaatttac ctattccatt caaagcatac 900
ggtatcccgt gaccttctca tggagatcat tctccaccga tacagcatat acacagatat 960
acccaactaa tatcaattgg accttgatat ggtcgacctt gatggtcccg tccaacctta 1020
aaacttagtt taatgctata ctttcgcctt gaaccaaatc tgtctccccc tcaatcatct 1080
ctatgcaaga aggtcaacac tgattacgtg agcaacagcc agcaatcgtt cgagtccccg 1140
ccaaaaaagg cggagttact gctccttgtg accacacccc ctgagaccac gtccctaaac 1200
gatccttgtc ggttccttcg tccaattggc aattgccacg catacgtgaa tcgttattgt 1260
ttcgcctacc ttgcgtcatt cgttccagaa tgttcgacat actcctctag aacataccgt 1320
cacaccacca tcttaagtta tcttcacgtg accatgacgt acattgtagt tgactacccc 1380
attctcatca ttccgatgcg gccaaaaatc tctatataaa gaccgtatcc cctaatattc 1440
tcttcttgtt aagacattaa cttagttaat tcaccaatta ctcacttata aacaaacaaa 1500
<210> 7
<211> 1500
<212> DNA
<213> 人工
<220>
<223> 启动子pSD008
<400> 7
gtttctcttg gggagatact tttttcgcgt gctcctccgt gcggaacttc cttctgagct 60
tctacctctc agattagtct aatcgcatca ggaataagac tgagaatgct tttaaggaga 120
ggcttgagat tggctaattg cgttccgaag tactctttca aaaggagtta tacccctctc 180
aactacgatt ctctaaagaa ttatcgtagg catgctcagg cgcctcaacc ccatcagttt 240
gacgccacta gatgggacca acaaccagtt actaatgagc aaggagtaat actcccatcc 300
gactcaattg caaacattct gagacaacca actctggtca tagaacggca aatggaaatg 360
atgaatatat ttttaggatt tgagcaggcg aaccgatatg ttatcatgga tcctacagga 420
agtattttgg gttacatgct agaaagggat ctgggcatca ccaaagctat attgagacag 480
atctaccgtt tgcatcgacc ttttacagtg gatgtaatgg atactgcagg aaatgtatta 540
atgacaatca agaggccgtt tagtttcatc aattcgcaca tcaaagctat attaccccct 600
ttcaggaaca gcgacccaga cgaacatgta attggagaat ccgttcaaag ctggcatcct 660
tggagacgaa gatacaatct atttacagca caaattggcg aaaaggacac tgtctacgat 720
cagttcgggt acattgacgc accgtttctt tcctttgagt ttcctgtact ttcagaatct 780
aggcaaacgc taggtgctgt ctctagaaac ttcgtgggct ttgcaagaga gcttttcaca 840
gatacaggag tttacatcat ccgtatgggg cctgaatctt ttgtagggct agaagggaac 900
tacgggaaca atgtggccca acatgccctt acgctggacc aaagggctgt attattagcc 960
aatgccgttt caattgactt tgattacttt tctaggcact cgtcacacag tggtggcttc 1020
attgggtttg aggaatagac agggtctcgt caactcagct cctgccacca aaccaatcat 1080
tgatcaacga gcacactttt gtccacgtga gatcgctttc gcttgcagaa agagcaatgc 1140
atgaaaacgg caaacgcaaa acgagcaaaa aaacgagtaa ataactacaa tttcaccacc 1200
aacagggtca aagagctttt gagacactat aaaaggggcc ctttcccccc aggttccttg 1260
aaatcctcat tcaattatgt tttttactca taatttgact caattggcat cttcttcttt 1320
gttcatatac agtaattgat atgacgctta gtcattatta gtgttctcga ctagcagtgg 1380
cgaaaaaagg gggagttatt ttctagaacc gaccgcaaac tataaaagaa agctgcccct 1440
catatacctt tcgaattctt tattttctgt gtttcttccc tatttaacat ctacacaaaa 1500
<210> 8
<211> 940
<212> DNA
<213> 法夫驹形氏酵母(Komagataella phaffii)
<400> 8
agatctaaca tccaaagacg aaaggttgaa tgaaaccttt ttgccatccg acatccacag 60
gtccattctc acacataagt gccaaacgca acaggagggg atacactagc agcagaccgt 120
tgcaaacgca ggacctccac tcctcttctc ctcaacaccc acttttgcca tcgaaaaacc 180
agcccagtta ttgggcttga ttggagctcg ctcattccaa ttccttctat taggctacta 240
acaccatgac tttattagcc tgtctatcct ggcccccctg gcgaggttca tgtttgttta 300
tttccgaatg caacaagctc cgcattacac ccgaacatca ctccagatga gggctttctg 360
agtgtggggt caaatagttt catgttcccc aaatggccca aaactgacag tttaaacgct 420
gtcttggaac ctaatatgac aaaagcgtga tctcatccaa gatgaactaa gtttggttcg 480
ttgaaatgct aacggccagt tggtcaaaaa gaaacttcca aaagtcggca taccgtttgt 540
cttgtttggt attgattgac gaatgctcaa aaataatctc attaatgctt agcgcagtct 600
ctctatcgct tctgaacccc ggtgcacctg tgccgaaacg caaatgggga aacacccgct 660
ttttggatga ttatgcattg tctccacatt gtatgcttcc aagattctgg tgggaatact 720
gctgatagcc taacgttcat gatcaaaatt taactgttct aacccctact tgacagcaat 780
atataaacag aaggaagctg ccctgtctta aacctttttt tttatcatca ttattagctt 840
actttcataa ttgcgactgg ttccaattga caagcttttg attttaacga cttttaacga 900
caacttgaga agatcaaaaa acaactaatt attcgaaacg 940
<210> 9
<211> 32
<212> PRT
<213> 人工
<220>
<223> 前导肽
<220>
<221> misc_feature
<222> (13)..(13)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (31)..(31)
<223> Xaa可以是任何天然存在的氨基酸
<400> 9
Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Xaa Ala Ala Ser
1 5 10 15
Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Arg Xaa Arg
20 25 30
<210> 10
<211> 31
<212> PRT
<213> 腐皮镰刀菌(Fusarium solani)
<400> 10
Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Thr Ala Ala Ser
1 5 10 15
Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Lys Arg
20 25 30
<210> 11
<211> 31
<212> PRT
<213> 腐皮镰刀菌(Fusarium solani)
<400> 11
Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Ala Ala Ala Ser
1 5 10 15
Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Thr Arg
20 25 30
<210> 12
<211> 31
<212> PRT
<213> 人工
<220>
<223> 前导肽的变体
<400> 12
Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Ala Ala Ala Ser
1 5 10 15
Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Lys Arg
20 25 30
<210> 13
<211> 31
<212> PRT
<213> 人工
<220>
<223> 前导肽的变体
<400> 13
Met Arg Leu Leu Pro Leu Leu Ser Val Val Thr Leu Thr Ala Ala Ser
1 5 10 15
Pro Ile Ala Ser Val Gln Glu Tyr Thr Asp Ala Leu Glu Thr Arg
20 25 30
<210> 14
<211> 87
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 14
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Glu Ala
85
<210> 15
<211> 61
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 15
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Leu Glu Gly
20 25 30
Asp Phe Asp Val Ala Val Leu Pro Phe Ser Ala Ser Ile Ala Ala Lys
35 40 45
Glu Glu Gly Val Ser Leu Glu Lys Arg Glu Ala Glu Ala
50 55 60
<210> 16
<211> 93
<212> DNA
<213> 人工
<220>
<223> 编码前导肽的变体的核酸序列
<220>
<221> misc_feature
<222> (37)..(39)
<223> n为a、c、g或t
<220>
<221> misc_feature
<222> (88)..(90)
<223> n为a、c、g或t
<400> 16
atgaggctgc ttccactgtt gtccgtcgtt acattgnnng ccgcttcccc aatcgcctct 60
gtccaggaat acaccgacgc tttggaannn aga 93
<210> 17
<211> 93
<212> DNA
<213> 腐皮镰刀菌(Fusarium solani)
<400> 17
atgaggctgc ttccactgtt gtccgtcgtt acattgactg ccgcttcccc aatcgcctct 60
gtccaggaat acaccgacgc tttggaaaaa aga 93
<210> 18
<211> 93
<212> DNA
<213> 腐皮镰刀菌(Fusarium solani)
<400> 18
atgaggctgc ttccactgtt gtccgtcgtt acattggctg ccgcttcccc aatcgcctct 60
gtccaggaat acaccgacgc tttggaaaca aga 93
<210> 19
<211> 93
<212> DNA
<213> 人工
<220>
<223> 编码前导肽变体的核酸
<400> 19
atgaggctgc ttccactgtt gtccgtcgtt acattggctg ccgcttcccc aatcgcctct 60
gtccaggaat acaccgacgc tttggaaaaa aga 93
<210> 20
<211> 93
<212> DNA
<213> 人工
<220>
<223> 编码前导肽变体的核酸
<400> 20
atgaggctgc ttccactgtt gtccgtcgtt acattgactg ccgcttcccc aatcgcctct 60
gtccaggaat acaccgacgc tttggaaaca aga 93
<210> 21
<211> 261
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 21
atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60
ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120
tactcagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180
aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240
tctctcgaga aaagagaggc t 261
<210> 22
<211> 171
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 22
atgagatttc cttcaatttt tactgctgtt ttattcgcag catcctccgc attagctgct 60
ccagtcaaca ctacaacaga agatgaatta gaaggggatt tcgatgttgc tgttttgcca 120
ttttccgcca gcattgctgc taaagaagaa ggggtatctc tcgagaaaag a 171
<210> 23
<211> 317
<212> PRT
<213> 腐皮镰刀菌(Fusarium solani)
<400> 23
Ala Ile Thr Ala Ser Gln Leu Asp Tyr Glu Asn Phe Lys Phe Tyr Ile
1 5 10 15
Gln His Gly Ala Ala Ala Tyr Cys Asn Ser Glu Thr Ala Ser Gly Gln
20 25 30
Lys Ile Thr Cys Ser Asp Asn Gly Cys Lys Gly Val Glu Ala Asn Asn
35 40 45
Ala Ile Ile Val Ala Ser Phe Val Gly Lys Gly Thr Gly Ile Gly Gly
50 55 60
Tyr Val Ser Thr Asp Asn Val Arg Lys Glu Ile Val Leu Ser Ile Arg
65 70 75 80
Gly Ser Ser Asn Ile Arg Asn Trp Leu Thr Asn Val Asp Phe Gly Gln
85 90 95
Ser Ser Cys Ser Tyr Val Arg Asp Cys Gly Val His Thr Gly Phe Arg
100 105 110
Asn Ala Trp Asp Glu Ile Ala Gln Arg Ala Arg Asp Ala Val Ala Lys
115 120 125
Ala Arg Thr Met Asn Pro Ser Tyr Lys Val Ile Ala Thr Gly His Ser
130 135 140
Leu Gly Gly Ala Val Ala Thr Leu Gly Ala Ala Asp Leu Arg Ser Lys
145 150 155 160
Gly Thr Ala Val Asp Ile Phe Thr Phe Gly Ala Pro Arg Val Gly Asn
165 170 175
Ala Glu Leu Ser Ala Phe Ile Thr Ala Gln Ala Gly Gly Glu Phe Arg
180 185 190
Val Thr His Gly Arg Asp Pro Val Pro Arg Leu Pro Pro Ile Val Phe
195 200 205
Gly Tyr Arg His Thr Ser Pro Glu Tyr Trp Leu Ala Gly Gly Ala Ser
210 215 220
Thr Lys Thr Asp Tyr Thr Val Asn Asp Ile Lys Val Cys Glu Gly Ala
225 230 235 240
Ala Asn Leu Ala Cys Asn Gly Gly Thr Leu Gly Leu Asp Ile Ile Ala
245 250 255
His Leu Arg Tyr Phe Gln Asp Thr Asp Ala Cys Thr Ala Gly Gly Ile
260 265 270
Ser Trp Lys Arg Gly Asp Lys Ala Lys Arg Asp Glu Ile Pro Lys Arg
275 280 285
Gln Glu Gly Met Thr Asp Glu Glu Leu Glu Gln Lys Leu Asn Asp Tyr
290 295 300
Val Ala Met Asp Lys Glu Tyr Val Glu Ser Asn Lys Met
305 310 315
<210> 24
<211> 954
<212> DNA
<213> 腐皮镰刀菌(Fusarium solani)
<400> 24
gccattactg cttctcaatt ggactacgaa aacttcaagt tttacatcca gcacggtgcc 60
gctgcttact gtaactccga aactgcctct ggtcaaaaga tcacttgttc cgacaacggt 120
tgcaaaggtg tcgaagctaa caacgctatt attgtcgcct ctttcgttgg aaaaggtact 180
ggtattggtg gttacgtttc tactgataac gttagaaagg agatcgtttt gtctattaga 240
ggttcttcca acattcgtaa ctggttgact aacgtcgact tcggacaatc ctcttgttct 300
tacgttagag attgtggagt tcacactggt ttcagaaatg cttgggacga gattgcccaa 360
agagctagag acgctgtcgc taaagctaga actatgaacc catcttacaa ggttatcgct 420
actggtcact ctttgggtgg tgctgttgcc actttgggtg ctgctgattt gagatccaag 480
ggtactgccg tcgatatctt tacttttggt gccccaagag ttggtaacgc tgagttgtcc 540
gctttcatca ctgctcaggc tggtggtgag ttcagagtta ctcacggacg tgatccagtt 600
ccacgtttgc cacctatcgt cttcggttac agacacacct ctccagagta ctggttggct 660
ggtggtgctt ccaccaagac tgattatact gttaacgata tcaaggtttg tgaaggtgcc 720
gctaacttgg cctgtaatgg tggtactttg ggattggata tcattgctca tttgagatac 780
ttccaagaca ctgacgcctg tactgctggt ggtatctcct ggaagagagg tgacaaagct 840
aagagagatg agattccaaa aagacaagaa ggaatgactg atgaggagtt ggaacaaaaa 900
ctgaacgact atgtcgccat ggataaggag tacgttgagt ccaacaagat gtaa 954
<210> 25
<211> 2400
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 25
atggttttgc cgattctacc gttaattgat gatctggcct catggaatag taagaaggaa 60
tacgtttcac ttgttggtca ggtacttttg gatggctcga gcctgagtaa tgaagagatt 120
ctccagttct ccaaagagga agaagttcca ttggtggctt tgtccttgcc aagtggtaaa 180
ttcagcgatg atgaaatcat tgccttcttg aacaacggag tttcttctct gttcattgct 240
agccaagatg ctaaaacagc cgaacacttg gttgaacaat tgaatgtacc aaaggagcgt 300
gttgttgtgg aagagaacgg tgttttctcc aatcaattca tggtaaaaca aaaattctcg 360
caagataaaa ttgtgtccat aaagaaatta agcaaggata tgttgaccaa agaagtgctt 420
ggtgaagtac gtacagaccg tcctgacggt ttatatacca ccctagttgt cgaccaatat 480
gagcgttgtc tagggttggt gtattcttcg aagaaatcta tagcaaaggc catcgatttg 540
ggtcgtggcg tttattattc tcgttctagg aatgaaatct ggatcaaggg tgaaacttct 600
ggcaatggcc aaaagctttt acaaatctct actgactgtg attcggatgc cttaaagttt 660
atcgttgaac aagaaaacgt tggattttgc cacttggaga ccatgtcttg ctttggtgag 720
ttcaagcatg gtttggtggg gctagaatct ttactaaaac aaaggctaca ggacgctcca 780
gaggaatctt atactagaag actattcaac gactctgcat tgttagatgc caagatcaag 840
gaagaagctg aagaactgac tgaggcaaag ggtaagaagg agctttcttg ggaggctgcc 900
gatttgttct actttgcact ggccaaatta gtggccaacg atgtttcatt gaaggacgtc 960
gagaataatc tgaatatgaa gcatctgaag gttacaagac ggaaaggtga tgctaagcca 1020
aagtttgttg gacaaccaaa ggctgaagaa gaaaaactga ccggtccaat tcacttggac 1080
gtggtgaagg cttccgacaa agttggtgtg cagaaggctt tgagcagacc aatccaaaag 1140
acttctgaaa ttatgcattt agtcaatccg atcatcgaaa atgttagaga caaaggtaac 1200
tctgcccttt tggagtacac agaaaagttt gatggtgtaa aattatccaa tcctgttctt 1260
aatgctccat tcccagaaga atactttgaa ggtttaaccg aggaaatgaa ggaagctttg 1320
gacctttcaa ttgaaaacgt ccgcaaattc catgctgctc aattgccaac agagactctt 1380
gaagttgaaa cccaacctgg tgtcttgtgt tccagattcc ctcgtcctat tgaaaaagtt 1440
ggtttgtata tccctggtgg cactgccatt ttaccaagta ctgcattaat gcttggtgtt 1500
ccagcacaag ttgcccaatg taaggagatt gtgtttgcat ctccaccaag aaaatctgat 1560
ggtaaagttt cacccgaagt tgtttatgtc gcagaaaaag ttggcgcttc caagattgtt 1620
ctagctggtg gtgcccaagc cgttgctgct atggcttacg ggacagaaac tattcctaaa 1680
gtggataaaa tcttgggtcc aggtaatcaa tttgtgactg ccgccaaaat gtatgttcaa 1740
aatgacactc aagctctatg ttccattgat atgccagctg gcccaagtga agttttggtt 1800
attgccgatg aagatgccga tgtggatttt gttgcaagtg atttgctatc gcaagctgaa 1860
cacggtattg actcccaagt tatccttgtt ggtgttaact tgagcgaaaa gaaaattcaa 1920
gagattcaag atgctgtcca caatcaagct ttacaactgc cacgtgtgga tattgttcgt 1980
aaatgtattg ctcacagtac gatcgttctt tgtgacggtt acgaagaagc ccttgaaatg 2040
tccaaccaat atgcaccaga acatttgatt ctacaaatcg ccaatgctaa cgattatgtt 2100
aaattggttg acaatgcagg gtccgtattt gtgggtgctt acactccaga atcgtgcggt 2160
gactattcaa gtggtactaa ccatacatta ccaacctatg gttacgctag gcagtacagt 2220
ggtgccaaca ctgcaacctt ccaaaagttt atcactgccc aaaacattac ccctgaaggt 2280
ttagaaaaca tcggtagagc tgttatgtgc gttgccaaga aggagggtct agacggtcac 2340
agaaacgctg tgaaaatcag aatgagtaag cttgggttga tcccaaagga tttccagtag 2400
<210> 26
<211> 804
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 26
atgtcgaaag ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag 60
ctatttaata tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc 120
accaaggaat tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca 180
catgtggata tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta 240
tccgccaagt acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca 300
gtcaaattgc agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat 360
gcacacggtg tggtgggccc aggtattgtt agcggtttga agcaggcggc agaagaagta 420
acaaaggaac ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctatct 480
actggagaat atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc 540
ggctttattg ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg 600
acacccggtg tgggtttaga tgacaaggga gacgcattgg gtcaacagta tagaaccgtg 660
gatgatgtgg tctctacagg atctgacatt attattgttg gaagaggact atttgcaaag 720
ggaagggatg ctaaggtaga gggtgaacgt tacagaaaag caggctggga agcatatttg 780
agaagatgcg gccagcaaaa ctaa 804

Claims (24)

1.一种包括至少第一表达盒的重组酵母细胞,所述第一表达盒包括
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或其功能片段或与根据SEQ ID No:1到8中任一个所述的核酸序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码重组蛋白的核酸序列。
2.根据权利要求1所述的重组酵母细胞,其进一步包括第二表达盒,所述第二表达盒包括
(a)启动子,所述启动子包括根据SEQ ID No:1到8中任一个所述的核酸序列或其功能片段或与根据SEQ ID No:1到8中任一个所述的序列具有至少80%同一性的核酸序列,其可操作地连接至
(b)编码前导肽的核酸序列,所述前导肽包括根据SEQ ID No:9到15中任一个所述的氨基酸序列或与根据SEQ ID No:9到15中任一个所述的序列具有至少80%同一性的氨基酸序列;以及
(c)编码所述重组蛋白的核酸序列。
3.根据权利要求1或2所述的重组酵母细胞,其中所述重组酵母细胞缺乏至少一个标志物基因,并且可以包括编码所述标志物的重组核酸序列。
4.根据权利要求3所述的重组酵母细胞,其中所述标志物基因是营养缺陷型标志物基因。
5.根据权利要求4所述的重组酵母细胞,其中所述营养缺陷型标志物基因选自由以下组成的组:ura3、his4、ade2、arg4、ade1、ura5、met2、lys2、pro3和tyr1。
6.根据权利要求3所述的重组酵母细胞,其中所述标志物基因是抗生素抗性标志物基因。
7.根据权利要求6所述的重组酵母细胞,其中所述抗生素抗性标志物基因选自由以下组成的组:博莱霉素抗性基因、卡那霉素抗性基因、新霉素抗性基因、G418抗性基因和潮霉素抗性基因。
8.根据权利要求1到3中任一项所述的重组酵母细胞,其中所述重组酵母细胞缺乏第一标志物基因和第二标志物基因,并且包括编码所述第一标志物的重组核酸序列和编码所述第二标志物的重组核酸序列。
9.根据权利要求1到8中任一项所述的重组酵母细胞,其中所述第一表达盒和任选的所述第二表达盒被稳定整合到所述酵母细胞的基因组中。
10.根据权利要求8或9所述的重组酵母细胞,其中所述第一标志物基因和所述第二标志物基因独立地选自营养缺陷型标志物基因。
11.根据权利要求10所述的重组酵母细胞,其中所述第一标志物基因和所述第二标志物基因独立地选自由以下组成的组:ura3、his4、ade2、arg4、ade1、ura5、met2、lys2、pro3和tyr1。
12.根据权利要求8或9所述的重组酵母细胞,其中所述第一标志物基因和所述第二标志物基因独立地选自抗生素抗性标志物基因。
13.根据权利要求12所述的重组酵母细胞,其中所述第一抗生素抗性标志物基因和所述第二抗生素抗性标志物基因独立地选自由以下组成的组:博莱霉素抗性基因、卡那霉素抗性基因、新霉素抗性基因、G418抗性基因和潮霉素抗性基因。
14.根据权利要求10或11所述的重组酵母细胞,其中所述第一营养缺陷型标志物基因是his4并且所述第二营养缺陷型标志物基因是ura3。
15.根据权利要求14所述的重组酵母细胞,其中ura3的缺乏是由于部分或全部ura3基因的缺失。
16.根据权利要求10或11所述的重组酵母细胞,其中编码所述第一营养缺陷型标志物的核酸序列选自由以下组成的组:
(a)根据SEQ ID No:25所述的核酸序列;
(b)与根据SEQ ID No:25所述的核酸序列具有至少65%同一性的核酸序列;
(c)编码根据SEQ ID No:27所述的多肽的核酸序列;以及
(d)编码与根据SEQ ID No:27所述的多肽具有至少80%同一性的多肽的核酸序列;和/或
其中编码所述第二营养缺陷型标志物的核酸序列选自由以下组成的组:
(a)根据SEQ ID No:26所述的核酸序列;
(b)与根据SEQ ID No:26所述的核酸序列具有至少65%同一性的序列;
(c)编码根据SEQ ID No:28所述的多肽的核酸序列;以及
(d)编码与根据SEQ ID No:28所述的多肽具有至少80%同一性的多肽的核酸序列。
17.根据前述权利要求中任一项所述的重组酵母细胞,其中所述重组蛋白是酶、肽、抗体或其抗原结合片段、蛋白质抗生素、融合蛋白、疫苗或疫苗样蛋白质或颗粒、生长因子、激素或细胞因子。
18.根据权利要求17所述的重组酵母细胞,其中所述酶是脂肪酶、蛋白酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、木聚糖酶、甘露聚糖酶、葡聚糖酶、纤维素酶或植酸酶。
19.根据权利要求18所述的重组酵母细胞,其中所述脂肪酶选自:
(a)具有根据SEQ ID No:23所述的氨基酸序列的脂肪酶;
(b)具有与根据SEQ ID No:23所述的氨基酸序列具有至少80%序列同一性的氨基酸序列的脂肪酶;
(c)在对应于SEQ ID NO:23的位置23、33、82、83、84、85、160、199、254、255、256、258、263、264、265、268、308或311的位置上具有一个或多个氨基酸取代的脂肪酶;
(d)由根据SEQ ID No:24所述的核酸序列编码的脂肪酶;以及
(e)由编码与根据SEQ ID No:23所述的多肽序列具有至少80%序列同一性的脂肪酶的任何核酸序列编码的脂肪酶。
20.根据前述权利要求中任一项所述的重组酵母细胞,其中所述酵母细胞来自甲基营养型酵母物种。
21.根据前述权利要求中任一项所述的重组酵母细胞,其中所述酵母细胞是法夫驹形氏酵母细胞。
22.一种包括根据前述权利要求中任一项所述的重组酵母细胞的培养物。
23.一种用于产生重组蛋白的方法,其包括以下步骤:
(a)在合适的培养基中培养根据权利要求1到21中任一项所述的重组酵母细胞;以及
(b)获得所述重组蛋白。
24.一种根据权利要求1到21中任一项所述的重组酵母细胞用于产生重组蛋白的用途。
CN201980075647.1A 2018-11-19 2019-11-18 重组酵母细胞 Pending CN113056554A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862769169P 2018-11-19 2018-11-19
US62/769,169 2018-11-19
PCT/US2019/061929 WO2020106599A1 (en) 2018-11-19 2019-11-18 A recombinant yeast cell

Publications (1)

Publication Number Publication Date
CN113056554A true CN113056554A (zh) 2021-06-29

Family

ID=68887132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980075647.1A Pending CN113056554A (zh) 2018-11-19 2019-11-18 重组酵母细胞

Country Status (4)

Country Link
US (1) US20220002738A1 (zh)
EP (1) EP3884037A1 (zh)
CN (1) CN113056554A (zh)
WO (1) WO2020106599A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113564166A (zh) * 2021-07-26 2021-10-29 浙江大学 毕赤酵母来源的生长依赖型启动子及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1309712A (zh) * 1998-07-16 2001-08-22 诺沃挪第克公司 在转化的酵母细胞中生产蛋白质的方法
CN101679992A (zh) * 2007-04-20 2010-03-24 波利门科学生物免疫研究有限公司 酵母菌表达系统
CN103981197A (zh) * 2014-04-21 2014-08-13 中国科学院广州能源研究所 一种含有新型前导肽的米黑根毛霉脂肪酶基因及其在毕赤酵母中的表达

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2177528T3 (es) * 1991-04-01 2002-12-16 Merck & Co Inc Genes que influyen en la actividad proteolitica de pichia y usoso de los mismos.
CA2058820C (en) * 1991-04-25 2003-07-15 Kotikanyad Sreekrishna Expression cassettes and vectors for the secretion of human serum albumin in pichia pastoris cells
ITPD20120107A1 (it) * 2012-04-10 2013-10-11 Food Res And Innovation F R I S R L Metodo di preparazione e purificazione di una proteina vegetale impiegabile come dolcificante
US20140244228A1 (en) * 2012-09-19 2014-08-28 Agency For Science, Technology And Research Codon optimization of a synthetic gene(s) for protein expression
EP3419427B1 (en) * 2016-02-19 2022-04-20 Basf Se Baking lipases
EP3494129A1 (en) * 2016-08-05 2019-06-12 Cargill, Incorporated Leader-modified glucoamylase polypeptides and engineered yeast strains having enhanced bioproduct production

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1309712A (zh) * 1998-07-16 2001-08-22 诺沃挪第克公司 在转化的酵母细胞中生产蛋白质的方法
CN101679992A (zh) * 2007-04-20 2010-03-24 波利门科学生物免疫研究有限公司 酵母菌表达系统
CN103981197A (zh) * 2014-04-21 2014-08-13 中国科学院广州能源研究所 一种含有新型前导肽的米黑根毛霉脂肪酶基因及其在毕赤酵母中的表达

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113564166A (zh) * 2021-07-26 2021-10-29 浙江大学 毕赤酵母来源的生长依赖型启动子及其应用

Also Published As

Publication number Publication date
US20220002738A1 (en) 2022-01-06
WO2020106599A1 (en) 2020-05-28
EP3884037A1 (en) 2021-09-29

Similar Documents

Publication Publication Date Title
JP6833812B2 (ja) プロモーター変異体
AU2013382370B2 (en) Constitutive promoter
EP2106447B1 (en) Method for methanol independent induction from methanol inducible promoters in pichia
JP7061234B2 (ja) 組換え宿主細胞内での炭素源調節タンパク質産生
CN108603213B (zh) 酵母细胞
CN113015782A (zh) 用于酵母的前导序列
US4940661A (en) Metallothionein transcription control sequences and use thereof
CN113056554A (zh) 重组酵母细胞
JP5997140B2 (ja) 生産細胞株
CN113316641A (zh) 串联蛋白表达
CN112004931A (zh) 真菌伴侣蛋白
TWI853878B (zh) 重組宿主細胞中的碳源調控蛋白質製造
US8703444B2 (en) Pichia pastoris deficient in endogenous secreted protease
KR100977446B1 (ko) 분비 스트레스 반응을 조절하는 한세눌라 폴리모르파의신규한 유전자 및 상기 유전자를 이용하여 재조합 단백질의분비 발현 효율을 증가시키는 방법
CN114026239A (zh) Mut-甲醇营养型酵母
WO2022144374A2 (en) Novel yeast strains

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination