CN112955547A - 通过使用转录因子来增加蛋白质表达的手段和方法 - Google Patents

通过使用转录因子来增加蛋白质表达的手段和方法 Download PDF

Info

Publication number
CN112955547A
CN112955547A CN201980056449.0A CN201980056449A CN112955547A CN 112955547 A CN112955547 A CN 112955547A CN 201980056449 A CN201980056449 A CN 201980056449A CN 112955547 A CN112955547 A CN 112955547A
Authority
CN
China
Prior art keywords
amino acid
seq
transcription factor
acid sequence
host cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980056449.0A
Other languages
English (en)
Inventor
R·察尔
J·博加德
K·鲍曼
D·玛塔诺维克
B·加塞尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Valladogan Co ltd
Boehringer Ingelheim RCV GmbH and Co KG
Validogen GmbH
Lonza AG
Original Assignee
Valladogan Co ltd
Boehringer Ingelheim RCV GmbH and Co KG
Lonza AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Valladogan Co ltd, Boehringer Ingelheim RCV GmbH and Co KG, Lonza AG filed Critical Valladogan Co ltd
Publication of CN112955547A publication Critical patent/CN112955547A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/50Immunoglobulins specific features characterized by immunoglobulin fragments
    • C07K2317/56Immunoglobulins specific features characterized by immunoglobulin fragments variable (Fv) region, i.e. VH and/or VL
    • C07K2317/569Single domain, e.g. dAb, sdAb, VHH, VNAR or nanobody®
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明属于重组生物技术领域,特别属于蛋白质表达领域。本发明一般涉及一种通过过表达编码本发明的至少一种转录因子(优选Msn4/2)的至少一种多核苷酸来增加真核宿主细胞(优先酵母菌)中目标蛋白(POI)的产量的方法。本发明进一步涉及一种用于制备POI的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,以及所述宿主细胞用于制备POI的用途。

Description

通过使用转录因子来增加蛋白质表达的手段和方法
相关专利申请的交叉引用
本申请要求于2018年6月27日提交的欧洲专利申请No.18 180 164.8的优先权的权益,该申请的内容以引用的方式全文并入本文用于全部目的。
技术领域
本发明属于重组生物技术领域,特别属于蛋白质表达领域。本发明一般涉及一种通过过表达编码本发明的至少一种转录因子(优选Msn4/2)的至少一种多核苷酸来增加真核宿主细胞(优选酵母菌)中目标蛋白(POI)的产量的方法。本发明进一步涉及一种用于制备POI的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,以及所述宿主细胞用于制备POI的用途。
背景技术
已经采用原核和真核宿主完成了目标蛋白(POI)的成功生产。最突出的实例是如大肠杆菌(Escherichia coli)的细菌,如酿酒酵母(Saccharomyces cerevisiae)、巴斯德毕赤酵母(Pichia pastoris)或多形汉森酵母(Hansenula polymorpha)的酵母菌,如泡盛曲霉(Aspergillus awamori)或里氏木霉(Trichoderma reesei)的丝状真菌,或如CHO细胞的哺乳动物细胞。虽然某些蛋白质产量容易以高效率实现,但是很多其它蛋白质仅以相对低的水平生产。
一般而言,异源蛋白质合成可受到不同水平的限制。可能的限制是靶蛋白的转录和翻译、蛋白质折叠和(若适用)分泌、二硫键形成和糖基化以及聚集和降解。通过利用强启动子或增加异源基因的拷贝数可以增强转录。然而,这些措施明显达到了平台期,表明转录下游的其它瓶颈限制了表达。
宿主细胞中高水平的蛋白质产量可在一个或多个不同步骤如折叠、二硫键的形成、糖基化、细胞内转运或从细胞中释放时受到限制。基于目前本领域最先进的知识,甚至当宿主生物体的全部基因组的DNA序列可获得时,许多涉及的机制仍然不能被完全理解且不能预测。此外,以高产量产生重组蛋白的细胞的表型可以是降低的生长速率、降低的生物质形成和整体降低的细胞适应性。
在本领域中进行了各种尝试以期改善目标蛋白的产量,比如使应促进蛋白质折叠、氨基酸的外部补充等的分子伴侣过表达。
然而,仍然需要改善宿主细胞生产和/或分泌目标蛋白的能力的方法。本发明要解决的技术问题是满足这种需要。
上述技术问题的方案是提供手段(比如工程化的宿主细胞)、应用所述手段的方法和用途以通过在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸从而增加真核宿主细胞中重组目标蛋白的产量。这些手段、方法和用途将在本文中详述、在权利要求中列出、在实施例中示例性阐述并在附图中说明。
因此,本发明提供增加重组蛋白在宿主细胞中的产量的新方法和用途,所述方法和用途是简单且有效的并适用于在工业方法中使用。本发明还提供实现上述目的的宿主细胞。
必须指出的是,除非上下文另有明确说明,本文所用单数形式“一(a)”、“一种(an)”和“所述/该(the)”包括所提及的复数且反之亦然。因此,例如,提及的“一种宿主细胞”或“一种方法”分别包括一种或多种此类宿主细胞或方法,并且提及的“所述方法”包括本领域普通技术人员已知的可被修饰或置换的等效步骤和方法。类似地,例如,提及的“方法(methods)”或“宿主细胞(host cells)”分别包括“一种宿主细胞”或“一种方法”。
除非另有说明,一系列元素之前的术语“至少”将被理解为是指该系列中的每一元素。本领域技术人员将承认或仅采用常规实验能够确定,本文所述的本发明的具体实施方案的许多等效方案。本发明旨在涵盖这种等效方案。
术语“和/或”无论在本文何处使用均包括“和”、“或”和“由所述术语连接的元素的全部或任意其它组合”的含义。例如,A、B和/或C的含义是A、B、C、A+B、A+C、B+C和A+B+C。
本文所用术语“约(about)”或“大约(approximately)”意指在给定值或范围的20%内,优选地10%内,和更优选地5%内。其还包括具体数目,如,约20包括20。
术语“少于”、“多于”或“大于”包括具体数目。例如,少于20意指≤20,多于20意指≥20。
本说明书及权利要求或项目全文中,除非上下文有其它要求,词语“包括/包含(comprise)”以及诸如“包括/包含(comprises)”和“包括/包含(comprising)”的变形词语将被理解为意指包括陈述的整数(或步骤)或整数(或步骤)的集合。其并不排除任何其它的整数(或步骤)或整数(或步骤)的集合。当本文使用时,术语“包括/包含(comprising)”能够以术语“含有(containing)”、“由…组成(composed of)”、“包含(including)”、“具有(having)”或“携带(carrying)”替换,且反之亦然,比如术语“具有(having)”能够以术语“包括/包含(comprising)”替换。当本文使用时,“由…组成”排除了未在权利要求/项目中规定的任何整数或步骤。当本文使用时,“本质上由…组成”并不排除实质上不影响权利要求/项目的基本特征和新特征的整数或步骤。
另外,在描述本发明的代表性实施方案时,本说明书可能将本发明的方法和/或过程体现为特定的步骤顺序。然而,就方法或过程并不依赖于本文所陈述的特定步骤顺序来说,该方法或过程不应限于所描述的特定步骤顺序。本领域的普通技术人员能够理解,其他步骤的顺序也是可能的。因此,在本说明书中所描述的步骤的具体顺序,不应被解释为对权利要求的限制。此外,涉及本发明的方法和/或过程的权利要求也不应被限制于以所记载次序的其步骤的操作,而且本领域的技术人员能够容易地理解,这些顺序可以是变化的并且仍然被包含在本发明的精神和范围之内。
应该理解的是,本发明并不限于本文所述的具体的方法学、方案、材料、试剂和物质等。本文所使用的名词只用于描述特定实施方案的目的,其并不意在限定本发明的范围,本发明的范围仅由权利要求/项目限定。
本说明书全文所引用的所有的出版物和专利(包括所有的专利、专利申请、科学出版物、制造商的说明书、指导书等),无论在前还是在后,均以其全文通过引入并入本文。本文无任何内容能被解释为承认本发明无权凭借在先发明而早于这样的公开内容。就通过引入并入的材料与本说明书矛盾或不一致来说,本说明书将取代任何这样的材料。
发明内容
本发明人的发现是相当令人惊讶的,因为就直到本发明之前的所有知识而言,本发明的转录因子与增加真核宿主细胞(特别是真菌宿主细胞)中目标蛋白的产量无关。
本发明包含一种增加真核宿主细胞中重组目标蛋白的产量的方法,所述方法包括在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加,其中所述转录因子至少包含:a)DNA结合结构域,其包含:i)SEQ ID NO:1所示的氨基酸序列,或ii)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和b)激活结构域。
本发明的方法可包括:
i)将所述宿主细胞工程化以过表达编码至少一种转录因子的至少一种多核苷酸,所述转录因子至少包含:
a)DNA结合结构域,其包含:
a1)SEQ ID NO:1所示的氨基酸序列,或
a2)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和
b)激活结构域,
ii)将所述宿主细胞工程化以包含编码所述目标蛋白的多核苷酸,
iii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白,可选地
iv)从细胞培养物中分离所述目标蛋白,和可选地
v)纯化所述目标蛋白。
此外,本发明设想一种通过真核宿主细胞制备重组目标蛋白的方法,所述方法包括:
i)提供被工程化以过表达编码至少一种转录因子的至少一种多核苷酸的宿主细胞,其中所述宿主细胞进一步包含编码目标蛋白的多核苷酸,其中所述转录因子至少包含:
a)DNA结合结构域,其包含:
a1)SEQ ID NO:1所示的氨基酸序列,或
a2)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和
b)激活结构域,
ii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白,可选地
iii)从细胞培养物中分离所述目标蛋白,和可选地
iv)纯化所述目标蛋白,和可选地
v)修饰所述目标蛋白,和可选地
vi)配制所述目标蛋白。
本发明的方法可包括与工程化之前的宿主细胞相比,所述转录因子的过表达使模型蛋白scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)的产量增加。
进一步地,本发明还可包含本发明的方法,其中将所述编码至少一种转录因子的多核苷酸整合在所述宿主细胞的基因组中或包含在未整合至所述宿主细胞的基因组中的载体或质粒中。
本发明还可涵盖本发明的方法,其中所述真核宿主细胞为真菌宿主细胞,优选地为选自巴斯德毕赤酵母(Pichia pastoris)(syn.Komagataella spp)、多形汉森酵母(Hansenula polymorpha)(syn.H.angusta)、里氏木霉(Trichoderma reesei)、黑曲霉(Aspergillus niger)、酿酒酵母(Saccharomyces cerevisiae)、乳酸克鲁维酵母(Kluyveromyces lactis)、解脂耶氏酵母(Yarrowia lipolytica)、甲醇毕赤酵母(Pichiamethanolica)、博伊丁假丝酵母(Candida boidinii)、孔玛氏酵母属种(Komagataellaspp.)和粟酒裂殖酵母(Schizosaccharomyces pombe)的酵母宿主细胞。已将多形汉森酵母重新分类为Ogataeas属(Yamada等,1994.Biosci Biotechnol Biochem.58(7):1245-57)。Ogataea angusta、Ogataea polymorpha和Ogataea parapolymorpha是近期彼此分开的近缘物种(Kurtzman等,2011.Antonie Van Leeuwenhoek.100(3):455-62)。
本发明还设想本发明的方法,其中所述重组目标蛋白为酶、治疗性蛋白、食品添加剂或饲料添加剂。
另外,本发明还可包含本发明的方法,所述方法进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少一种ER辅助蛋白的至少一种多核苷酸。
优选地,所述ER辅助蛋白具有SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性。
本发明考虑的可以是本发明的方法,所述方法进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少两种ER辅助蛋白的至少两种多核苷酸。
优选地,第一ER辅助蛋白具有SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性,和第二ER辅助蛋白可具有:
i)SEQ ID NO:37所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ IDNO:37所示的氨基酸序列具有至少25%的序列同一性,或
ii)SEQ ID NO:47所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ IDNO:47所示的氨基酸序列具有至少20%的序列同一性。
可选地第三ER辅助蛋白具有SEQ ID NO:55所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:55所示的氨基酸序列具有至少25%的序列同一性。
此外,本发明可包含本发明的方法,所述方法进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码一种另外的转录因子的至少一种多核苷酸。
优选地,所述另外的转录因子至少包含:
a)DNA结合结构域,其包含:
a1)SEQ ID NO:65所示的氨基酸序列,或
a2)SEQ ID NO:65所示的氨基酸序列的功能同系物,其与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性,和
b)激活结构域。
本发明还包含一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,其中所述转录因子至少包含:
a)DNA结合结构域,其包含:
i)SEQ ID NO:1所示的氨基酸序列,或
ii)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和
b)激活结构域。
本发明还考虑上述重组真核宿主细胞用于制备重组目标蛋白的用途。
附图说明
图1:在小规模筛选培养中vHH分泌(效价和产量)的改善。
在小规模筛选中使巴斯德毕赤酵母中vHH分泌增加的过表达基因或基因组合的概述。在括号内的基因或基因组合的下列示出了用于工程化宿主细胞以过表达这些基因或基因组合的一种或多种质粒。小规模筛选的倍数改变值是多达20个克隆/转化体的算术平均值。
图2:在分批进料生物反应器培养中vHH分泌(效价和产量)的改善。
在分批进料培养中使巴斯德毕赤酵母中vHH分泌增加的过表达基因或基因组合的概述。在括号内的基因或基因组合的下列示出了用于工程化宿主细胞以过表达这些基因或基因组合的一种或多种质粒。分批进料培养的倍数改变值是单个选定克隆的倍数改变值。
图3:在小规模筛选培养中scFv分泌(效价和产量)的改善。
在小规模筛选中使巴斯德毕赤酵母中scFv分泌增加的过表达基因或基因组合的概述。在括号内的基因或基因组合的下列示出了用于工程化宿主细胞以过表达这些基因或基因组合的一种或多种质粒。小规模筛选的倍数改变值是多达20个克隆/转化体的算术平均值。
图4:在分批进料生物反应器培养中scFv分泌(效价和产量)的改善。
在分批进料培养中使巴斯德毕赤酵母中scFv分泌增加的过表达基因或基因组合的概述。在括号内的基因或基因组合的下列示出了用于工程化宿主细胞以过表达这些基因或基因组合的一种或多种质粒。分批进料培养的倍数改变值是单个选定克隆的倍数改变值。
图5:在分批进料生物反应器培养中,通过过表达来自其他物种的MSN2/4同系物来改善scFv分泌(效价和产量)。
图6:不同来源的Msn4p转录因子的比对概述。
锌指的蛋白结构基序清楚地显示出强的保守性(图6中的方框),其被称为酿酒酵母中得到充分表征的转录因子Msn4p和Msn2p的DNA结合结构域(ScMsn4/2)。
图7:Msn4-样C2H2锌指DNA结合结构域的氨基酸共有序列。
图8:巴斯德毕赤酵母MSN4/2的序列比对。
通过采用EMBOSS Needle算法的整体配对序列比对来评估巴斯德毕赤酵母的全长Msn4p与其它生物体的各同系物的配对序列相似性/同一性。还研究了巴斯德毕赤酵母的Msn4p的DNA-结合结构域与其它生物体的各同系物的DNA-结合结构域的配对序列相似性/同一性。
图9:与巴斯德毕赤酵母KAR2的序列同一性。
采用BLASTp评估序列同一性。
图10:与巴斯德毕赤酵母LHS1的序列同一性。
采用BLASTp评估序列同一性。
图11:与巴斯德毕赤酵母SIL1的序列同一性。
采用BLASTp评估序列同一性。
图12:与巴斯德毕赤酵母ERJ5的序列同一性。
采用BLASTp评估序列同一性。
图13:巴斯德毕赤酵母HAC1的序列比对。
通过采用EMBOSS Needle算法的整体配对序列比对来评估巴斯德毕赤酵母的全长Hac1p与其它生物体的各同系物的配对序列相似性/同一性。还研究了巴斯德毕赤酵母的Hac1p的DNA-结合结构域与其它生物体的各同系物的DNA-结合结构域的配对序列相似性/同一性。
图14:与MSN4/2-DNA结合结构域的共有序列的序列同一性。
通过采用EMBOSS Needle算法的整体配对序列比对研究了Msn4p/Msn2p的DNA结合结构域(DBD)的共有序列与其它生物体的各同系物的DNA-结合结构域的配对序列相似性/同一性。
发明详述
本发明部分地基于这一惊人的发现,即发现本文所述的至少一种转录因子的过表达使重组目标蛋白的产量增加。特别地,本发明包含一种增加真核宿主细胞中重组目标蛋白的产量的方法,所述方法包括在所述宿主细胞中过表达编码本发明的至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加。
术语“增加宿主细胞中重组目标蛋白的产量”意指与在相同培养条件下表达相同目标蛋白(POI)但是不含被过表达的编码转录因子的多核苷酸或未被工程化以过表达编码转录因子的多核苷酸的相同细胞相比,POI的产量增加了。
在本上下文中,术语“产量”是指本文所述的POI或模型蛋白、特别是scFv即单链可变片段(SEQ ID NO:13)和vHH(或VHHV)即单结构域抗体片段(SEQ ID NO.14)的量,其分别是例如从工程化宿主细胞中收获的,并且增加的产量可归因于宿主细胞内生产的量增加或由宿主细胞分泌的POI增加。术语“产量”还指每细胞本文所述的POI或模型蛋白的量并可以以mg POI/g宿主细胞的生物质(以干细胞重量或湿细胞重量来度量)表示。当本文使用时,术语“效价”类似地指生产的POI或模型蛋白的量,以mg POI/L培养上清液或全细胞培养液(broth)表示。本发明还可包含一种增加重组目标蛋白的效价的方法,其中使本发明的转录因子在真核宿主细胞中过表达。当从工程化宿主细胞中获得的产量与从工程化之前的宿主细胞(即从未工程化的宿主细胞)中获得的产量相比较时,可以测定产量的增加。优选地,当将“产量”用于本文所述的模型蛋白的上下文中时,其是按照实施例3、4和5的描述测定的。例如,术语“产量”可以指整个浸入培养(submersion cultivation)中一定量生物质产生的POI的量。在该培养中,重组POI可以在细胞内产生并积累或分泌到培养上清液中。术语“增加宿主细胞中重组目标蛋白的产量”是指使细胞内产生的或由细胞产生的POI的量增加和/或使从细胞中分泌的POI的量增加。
如本领域技术人员将理解的,已经表明本发明的转录因子的过表达使POI(特别是重组POI)的产量以及效价增加。
如本文所用的术语“目标蛋白”(POI)通常指任何蛋白,但优选地指“异源蛋白”或“重组蛋白”,优选地指模型蛋白scFv(SEQ ID NO:13)和/或vHH(SEQ ID NO.14)。本发明的POI的具体实例在本文其他地方指出。如本文所用,“重组(的)”是指通过人为干预的遗传材料的改变。通常,重组是指通过分子生物学(重组DNA技术)方法(包括克隆和重组)对病毒、细胞、质粒或载体中DNA或RNA的操作。典型地可以参考重组蛋白与天然存在的对应物(“野生型”)如何相区别来描述重组蛋白。优选地,由本发明的真核宿主细胞表达的重组目标蛋白来自不同的生物体。优选地,POI不是转录因子,即所述转录因子与POI不同。重组蛋白还可以是同源蛋白。在该情况下,通过遗传操作将一个或多个拷贝的编码同源蛋白的多核苷酸引入宿主细胞中。
术语“表达多核苷酸”是指当将多核苷酸转录成mRNA且将mRNA翻译成多肽时。术语“过表达”通常是指大于参考标准品(如在相同培养条件下的未被工程化以过表达编码蛋白的多核苷酸的相同宿主细胞)显示的表达水平的任何量。在本发明中术语“过表达(的)”是指基因产物或多肽以高于宿主细胞遗传改变之前的或在限定条件下未被遗传改变的相当的宿主中的相同基因产物或多肽的表达的水平表达。在本发明中,包含SEQ ID NO:15-27中任一个所示的氨基酸序列的转录因子或其功能同系物过表达。若宿主细胞不包含给定基因产物,将该基因产物引入所述宿主细胞用于表达是可能的;在这种情况下,术语“过表达”包括任何可检测的表达。在优选的实施方案中,“过表达”意指如下所述的“工程化以过表达”。对于本文所述的与“过表达”有关的任何实施方案均可以考虑此类优选的实施方案。
如本文所用的“多核苷酸”是指任意长度的聚合非分支形式的核苷酸(核糖核苷酸或脱氧核糖核苷酸或它们的组合)。优选地,多核苷酸是指任意长度的聚合非分支形式的脱氧核糖核苷酸。在此,核苷酸由戊糖(脱氧核糖)、含氮碱基(腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶)和磷酸基组成。术语“多核苷酸”、“核酸序列”在本文可互换使用。
如本文所用,术语“编码至少一种转录因子的至少一种多核苷酸”是指编码一种转录因子的一种多核苷酸,编码两种转录因子的两种多核苷酸,编码三种转录因子的三种多核苷酸,编码四种转录因子的四种多核苷酸等。优选地,本发明包含编码一种转录因子的一种多核苷酸。更优选地,本发明包含编码一种转录因子的一种多核苷酸和编码一种另外的转录因子的一种多核苷酸。
术语“转录因子”是指一种蛋白质,其通过(优选地以其DNA结合结构域)结合至特定的DNA序列来控制遗传信息从DNA向信使RNA的转录速率。它们的功能是调节和/或激活基因,以便确保这些基因在正确的时间并以正确的量在正确的细胞中表达。例如,转录因子可以响应于诸如饥饿或热休克的刺激而启动特定基因的转录。在本发明中,Msn4p转录因子是指包含DNA结合结构域的SEQ ID NO:15-27和是指这类转录因子,它们包含SEQ ID NO:1所示的氨基酸序列或SEQ ID NO:1所示的氨基酸序列的功能同系物以及任意激活结构域(如:本发明的转录因子或如本文其他地方所述的任何物种的其他转录因子的合成的、病毒的或激活结构域),所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与本文所述的SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,优选地所述激活结构域可示于SEQ ID NO:83。根据技术人员的知识可以实施并可以以任何顺序实施本文所述的本发明的转录因子的所述DNA结合结构域与任意激活结构域的排布。本发明的转录因子的DNA结合结构域可以由技术人员在C-或N-末端,优选在C-末端排布。在进一步的实施方案中,也可将本发明的合成形式的转录因子(如:synMSN4)用在本发明中(比如SEQ ID NO:27)。合成形式的转录因子可包括合成的DNA结合结构域(比如SEQ ID NO:12)。此外,本发明的合成形式的转录因子可包括任意激活结构域(如:本发明的转录因子或如本文其他地方所述的任何物种的其他转录因子的合成的、病毒的或激活结构域),优选地所述激活结构域可示于SEQ ID NO:84。再次,根据技术人员的知识可以实施并可以以任何顺序实施本文所述的本发明的转录因子的所述DNA结合结构域与任意激活结构域的排布。本发明的合成的转录因子的DNA结合结构域可以由技术人员在C-或N-末端,优选在C-末端排布。
在本发明中,转录因子是指Msn4/2蛋白(Msn4/2p或MSN4/2)。Msn4p是经历了全基因组复制事件的酵母菌(比如酿酒酵母及其近亲)中的Msn2p的同系物。大多数其他酵母菌和真菌物种仅含有Msn-型转录因子,并且这些物种中的这些转录因子无法合理区分。由于此功能冗余,这些转录因子可以成为Msn2或Msn4或Msn4/2。由于具有高度同源性,因此Msn4p与Msn2p极有可能是可互换的,即转录因子是冗余的。Msn2-与Msn4-依赖性表达之间无本质区别,且Msn4p和Msn2p的结构是非常相似的。巴斯毕赤酵母仅具有一个同系物,名为Msn4p。此外,在若干其它酵母菌中,Msn4/2仅有一个同系物,可能具有不同的名称。在黑曲霉中,Msn4/2的同系物称为Seb1。在酿酒酵母中,Msn4/2的同系物称为Com2。
MSN4(比如MSN2)编码调节一般应激反应的转录因子。在酿酒酵母中,Msn4p(比如Msn2p)通过位于C-末端的Msn4p(比如Msn2p)锌指结合结构域与位于~200个基因的启动子中的STRE元件(5'-CCCCT-3')结合来调控这些基因的表达以响应多种应激,包括热休克、渗透压休克、氧化应激、低pH、葡萄糖饥饿、山梨酸和高乙醇浓度。在它们的N-末端,Msn4p(比如Msn2p)含有转录活化结构域和核输出序列(nuclear export sequence)。此外,Msn4p(比如Msn2p)包含核定位信号,其被PKA磷酸化抑制并被蛋白磷酸酶1去磷酸化激活。在非应激条件下,Msn4p(比如Msn2p)位于细胞质中。细胞质定位部分地受TOR信号传导的调节。在应激条件下,Msn4p(比如Msn2p)被过度磷酸化,重新定位到细胞核,然后展示出周期性的核-质穿梭行为。
优选地,本发明的转录因子包含SEQ ID NOs:15-27所示的氨基酸序列。
迄今为止,还没有发现转录因子Msn4p参与增加重组POI的产量/效价,或者通常参与真核宿主细胞的重组POI的分泌。因此,令人惊讶的是,在本发明中,在真核宿主细胞中Msn4p的过表达增加了重组POI的产量/效价。
在本发明中,转录因子最初是从巴斯德毕赤酵母(Komagataella phaffi)CBS7435菌株(CBS-KNAW菌种保藏)中分离的。可以设想,转录因子可以在广泛的宿主细胞中过表达。因此,转录因子序列可以取自或衍生自其它原核生物或真核生物,而不是采用种或属的天然序列,优选地,转录因子序列可以取自或衍生自真菌宿主细胞,更优选地取自或衍生自比如巴斯德毕赤酵母(syn.Komagataella spp)、多形汉森酵母(syn.H.angusta)、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种和粟酒裂殖酵母的酵母宿主细胞。优选地,转录因子衍生自巴斯德毕赤酵母(Komagataella spp)、酿酒酵母、解脂耶氏酵母或黑曲霉,更优选地,衍生自巴斯德毕赤酵母(Komagataella spp)。此外,可以使用本发明的转录因子的合成形式。如本文所用,Komagataella spp包含Komagataella属的全部种。在优选的实施方案中,转录因子衍生自Komagataella pastoris、Komagataella pseudopastoris或Komagataella phaffii。在甚至更优选的实施方案中,转录因子衍生自Komagataella pastoris或Komagataellaphaffii。
优选地,在本发明的方法、重组宿主细胞和重组宿主细胞的用途中使用的转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母、特别是Komagataella phaffi或Komagataella pastoris的Msn4p的DNA结合结构域)。因此优选地,本发明的方法、重组宿主细胞和用途在巴斯德毕赤酵母(Komagataella spp)中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸序列。还优选地,所述至少包括包含SEQ ID NO:1所示的氨基酸序列的DNA结合结构域和激活结构域的转录因子在多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种或粟酒裂殖酵母中过表达。
在本发明的方法、重组宿主细胞和重组宿主细胞的用途中使用的转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)的功能同系物。此外,本发明还考虑在本发明的方法、重组宿主细胞和重组宿主细胞的用途中使用的转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)的功能同系物。优选地,在本发明的方法、重组宿主细胞和重组宿主细胞的用途中使用的转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)的功能同系物。因此,本发明的方法、重组宿主细胞和用途可进一步包括在巴斯德毕赤酵母中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列的功能同系物。因此,本发明的方法、重组宿主细胞和用途可进一步包括在多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种或粟酒裂殖酵母中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列的功能同系物。
优选地,与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列的功能同系物具有SEQ ID NOs:2、3、4、5、6、7、8、9、10、11和12所示的氨基酸序列。
因此,本发明的方法、重组宿主细胞和用途可进一步包括过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NOs:1、2、3、4、5、6、7、8、9、10、11和12所示的氨基酸序列。
另外,本发明的方法、重组宿主细胞和用途可进一步涵盖在巴斯德毕赤酵母中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NOs:1、2、3、4、5、6、7、8、9、10、11和12所示的氨基酸序列。因此,本发明的方法、重组宿主细胞和用途可包括在多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种或粟酒裂殖酵母中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NOs:1、2、3、4、5、6、7、8、9、10、11和12所示的氨基酸序列。
如本文所用的“DNA结合结构域”或“结合结构域”是指与转录因子所调控基因的DNA结合的转录因子的结构域。优选地,本发明的DNA结合结构域选自SEQ ID NOs:1或与SEQID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列的功能同系物(比如SEQ ID NOs:2、3、4、5、6、7、8、9、10、11和12)。最优选地为SEQ ID NO:1所示的DNA结合结构域。因此,本发明还可包含SEQ ID NO:12所示的合成的DNA结合结构域。
如本文所用,SEQ ID NO:87是指MSN4/2-样C2H2型锌指蛋白DNA结合结构域的共有序列(参见图6)。如实施例6中所述,采用软件CLC Main Workbench(QIAGENBioinformatics)进行不同来源的MSN4/2转录因子的比对。在本文中,将酿酒酵母中已知的Msn4p/Msn2p的DNA结合结构域用于在其它生物体中获得相同的功能,酿酒酵母是一种在实验中经常使用的模型生物,它经过了全基因组复制(WGD,因此具有两个同系物Msn4p和Msn2p。在酿酒酵母的Msn2/4中的锌指蛋白具有C2H2-样折叠,其具有氨基酸序列基序X2-C-X2,4-C-X12-H-X3,4,5-H(参见图7)。Msn4/2DNA结合结构域(SEQ ID NO:87)的共有序列具有如下序列:
Figure BDA0002953325880000161
其中位置10处的K可以与R互换;
位置11处的R可以与K互换;
位置15处的Xaa可以是Q或S;
位置19处的K可以与R互换;
位置22处的Xaa可以是任何天然存在的氨基酸;
位置25处的Xaa可以是V或L;
位置27处的S可以与T互换;
位置28处的Xaa可以是任何天然存在的氨基酸;
位置30处的K可以与R互换;
位置33处的Xaa可以是任何天然存在的氨基酸;
位置35-36处的Xaa可以是任何天然存在的氨基酸;
位置38处的Xaa可以是任何天然存在的氨基酸;
位置40处的K可以与R互换;
位置44处的S可以与T互换;
位置48处的Xaa可以是任何天然存在的氨基酸;
位置52处的R可以与K互换。
粗体字母是高度保守的,带下划线的字母是C2H2型锌指的一部分。
如本文所用,本发明的转录因子的或转录因子的结合结构域的“同源物”或“同系物”意指在其一级、二级或三级结构的相应位置处具有相同或保守性残基的多肽。该术语还延伸至编码同源多肽的两个或更多个核苷酸序列。当此类同系物作为转录因子的功能或作为转录因子的结合结构域的功能被验证时,该同系物称为“功能同系物”。功能同系物与其所源自的转录因子或转录因子的结合结构域履行相同或基本相同的功能。在核苷酸序列的情况下,“功能同系物”优选意指具有与原始核苷酸序列不同的序列的核苷酸序列,但是由于简并遗传密码的使用,该核苷酸序列仍然编码相同的氨基酸序列。可以通过置换蛋白质、特别是转录因子或转录因子的结合结构域的一个或多个氨基酸来获得蛋白质、特别是转录因子或转录因子的结合结构域的功能同系物,这种氨基酸置换保留了蛋白质、特别是转录因子或转录因子的结合结构域的功能。特别地,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性和/或与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约60%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约61%的氨基酸序列同一性和与SEQID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约62%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约63%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约64%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约65%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约66%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约67%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约68%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约69%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约70%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约71%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约72%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约73%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约74%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约75%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约76%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约77%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约78%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约79%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约80%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约81%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约82%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约83%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约84%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约85%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约86%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约87%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约88%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约89%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约90%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约91%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约92%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约93%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约94%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约95%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约96%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约97%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约98%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约99%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有约100%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。
一般而言,可采用本领域已知的任何诱变程序,如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组(shuffling)等等,来制备同系物。定点诱变是一项在编码亲本的多核苷酸上的一个或多个限定位点处引入一个或多个(如若干)突变的技术。可以通过涉及包含所需突变的寡核苷酸引物的应用的PCR在体外完成定点诱变。还可通过盒式诱变在体外来实施定点诱变,所述盒式诱变涉及通过限制性酶在包含编码亲本的多核苷酸的质粒中的位点上的切割和随后在该多核苷酸上的包含所述突变的寡核苷酸的连接。通常,消化所述质粒和所述寡核苷酸的限制性酶是相同的,从而允许质粒的粘性末端和插入物彼此相连。参见,如Scherer和Davis,1979,Proc.Natl.Acad.Sci.USA 76:4949-4955;和Barton等,1990,Nucleic Acids Res.18:7349-4966。还可通过本领域已知的方法在体内完成定点诱变。参见,如美国专利申请公开文本No.2004/0171 154;Storici等,2001,NatureBiotechnol.19:773-776;Kren等,1998,Nat.Med.4:285-290;和Calissano和Macino,1996,Fungal Genet.Newslett.43:15-16。合成基因构建需要体外合成设计的多核苷酸分子来编码目标多肽。可利用多种技术,如由Tian等(2004,Nature 432:1050-1054)描述的基于多路微芯片的技术及其中将寡核苷酸合成并装配至电流可编程的微流体芯片(photo-programmable microfluidic chip)上的类似技术,来实施基因合成。采用已知的诱变、重组和/或改组的方法,随后是相关的筛选程序,如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413或WO 95/22625公开的那些,可以完成并测试单个或多个氨基酸置换、缺失和/或插入。其它可用的方法包括易出错(error-prone)PCR、噬菌体展示(如,Lowman等,1991,Biochemistry30:10832-10837;美国专利No.5,223,409;WO 92/06204)和定区域诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。可以将诱变/改组方法与高通量、自动筛选方法组合,以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology 17:893-896)。可自宿主细胞中回收编码活性多肽的诱变的DNA分子并采用本领域已知的标准方法对其快速测序。这些方法允许快速确定单个氨基酸残基在多肽中的重要性。通过将合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的各个方面组合来完成半合成基因构建。半合成构建以利用合成的多核苷酸片段的过程与PCR技术组合为特征。因此,限定区域的基因可以被从头合成,而其它区域可以采用位点特异性诱变引物扩增,而还有其它区域可以经受易出错PCR或无错PCR扩增。然后,将多核苷酸子序列改组。可选地,可以从天然来源,如通过筛选其它生物的cDNA文库,或通过在核酸数据库中进行同源性搜索获得同系物,优选地为近亲或相关生物的同系物,所述近亲或相关生物比如Komagataella pastoris、Komagataella pseudopastoris或Komagataella phaffii、孔玛氏酵母属种(Komagataella spp.)、多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种(Komagataellaspp.)或粟酒裂殖酵母。因此,SEQ ID NOs:2-12为SEQ ID NO:1所示的转录因子的结合结构域的功能同系物,和SEQ ID NOs:16-27为SEQ ID NO:15所示的转录因子的功能同系物。
如本文所公开的与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的DNA结合结构域的氨基酸序列的同系物(比如SEQ ID NOs:2、3、4、5、6、7、8、9、10、11和12)的功能,或与SEQ ID NO:15所示的氨基酸序列具有至少11%的序列同一性的SEQ ID NO:15所示的转录因子的氨基酸序列的同系物(比如SEQ ID Nos:16、17、18、19、20、21、22、23、24、25、26、27)的功能,或与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性的SEQID NO:65所示的另外的转录因子的DNA结合结构域的氨基酸序列的同系物(比如SEQ IDNOs:66-73)的功能,或与SEQ ID NO:74所示的氨基酸序列具有至少20%的序列同一性的SEQ ID NO:74所示的另外的转录因子的氨基酸序列的同系物的功能可以通过如下测定:提供表达盒,该表达盒中已经插入了包含SEQ ID NO:1所示的DNA结合结构域的氨基酸序列的同系物和激活结构域(如SEQ ID NO:83或84等)以及核定位信号(NLS)(如SEQ ID NO:85或86等)的转录因子,或包含SEQ ID NO:65所示的DNA结合结构域的氨基酸序列的同系物和激活结构域以及核定位信号(NLS)的另外的转录因子,或SEQ ID NO:15所示的转录因子的氨基酸序列的同系物或SEQ ID NO:74所示的转录因子的氨基酸序列的同系物,转化携带编码测试蛋白(比如实施例部分所用的模型蛋白之一或另一POI)的序列的宿主细胞,以及确定在相同条件下模型蛋白或POI的产量差异。
术语“氨基酸”是指天然存在的和合成的氨基酸,以及以与天然存在的氨基酸类似的方式发挥功能的氨基酸类似物(analog)和氨基酸模拟物(mimetic)。天然存在的氨基酸是由遗传密码编码的那些,以及之后修饰的那些氨基酸,如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物是指与天然存在的氨基酸具有相同的基础化学结构的化合物,即,将碳连接至氢、羧基、氨基和R基,如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。这些类似物具有修饰的R基(如正亮氨酸)或修饰的肽骨架,但是保留与天然存在的氨基酸相同的基础化学结构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构、但是以与天然存在的氨基酸类似的方式发挥功能的化学化合物。
“序列同一性”或“%同一性”是指使用标准化算法比对的至少两个多肽或多核苷酸序列之间的残基匹配的百分数。为了使两个序列之间的比对最佳,这种算法可以以标准化的和可重现的方式在被比较的序列中插入空位(gap),因此达到两个序列的更加有意义的比较。本发明中使用的序列同一性是指至少两个多肽序列(氨基酸序列)之间具有相同氨基酸的百分数。本发明中所列的序列相似性是指至少两个多肽序列(氨基酸序列)之间具有相似氨基酸(按照其侧链和电荷分组)的百分数。对于本发明的目的,采用NCBI BLAST程序2.2.29版本(2014年1月6日)(Altschul等,Nucleic Acids Res.(1997)25:3389-3402)测定两个氨基酸序列或核苷酸序列之间的序列同一性。可以采用设定如下参数的blastp测定两个氨基酸序列的序列同一性:矩阵:BLOSUM62,字长:3;期望值:10;空位成本:存在=11,延伸=1;过滤=低复杂性失活的;组合调整(Compositional adjustment):有条件的组合评分矩阵调整。对于本发明的目的,采用设定如下示例性参数的blastn的NCBI BLAST程序2.2.29版本(2014年1月6日)测定两个核苷酸序列之间的序列同一性:字长:28;期望值:10;空位成本:线性;过滤=低复杂性激活的;匹配/失配得分:1,-2。对于本发明的目的,还可采用BLAST和EMBOSS Needle算法测定两个氨基酸序列或核苷酸序列之间的序列同一性。通过采用EMBOSS Needle算法的所述整体配对序列比对来评估DNA结合结构域的序列同一性。将采用默认设置(矩阵:BLOSUM62;空位开放:10;空位延伸:0.5;末端空位罚分:错(false);末端空位开放:10;末端空位延伸:0.5)的EMBOSS Needle webserver(https://www.ebi.ac.uk/Tools/psa/emboss_needle/)用于配对蛋白序列比对。EMBOSS Needle读取两个输入序列,并将它们的最佳整体序列比对写入文件。其采用Needleman-Wunsch比对算法在两个序列的整体长度上寻找最佳比对(包括空位)。通过BLAST确定与巴斯德毕赤酵母KAR2、LHS1、SIL1和ERJ5的序列同一性。
如本文所用,术语“激活结构域”是指任何能够激活转录的结构域。作为激活结构域,可以将本领域技术人员已知的来自任何生物体的任何转录因子的每个激活结构域用在本发明中。优选地,对于本发明的转录因子,可以使用本文中任何限定物种的本发明的转录因子的任何激活结构域,优选地使用SEQ ID NO:83所示的激活结构域。对于另外的转录因子,也可以使用本文中任何限定物种的另外的转录因子的任何激活结构域。在进一步的实施方案中,也可以将合成的(比如SEQ ID NO:84)或病毒(如VP64)激活结构域用在本发明中以用于本发明的转录因子或用于另外的转录因子。可以通过本领域已知的方法,如通过允许检测活酵母细胞中的相互作用蛋白的酵母-2-杂交(Y2H)技术,来测量激活结构域的功能。因此,在本发明的方法、重组宿主细胞和用途中使用的转录因子至少包含DNA结合结构域和激活结构域。可优选SEQ ID NO:83或SEQ ID NO:84所示的激活结构域。还预期可以使用来自功能同系物的激活结构域。具体用于巴斯德毕赤酵母的MSN4的激活结构域可以是SEQ ID NO:83的一部分。
本发明进一步提供一种增加宿主细胞中重组目标蛋白的产量的方法,所述方法包括:i)将所述宿主细胞工程化以过表达编码本发明的至少一种转录因子的至少一种多核苷酸,所述转录因子至少包含DNA结合结构域和激活结构域,ii)将所述宿主细胞工程化以包含编码所述目标蛋白的多核苷酸,iii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白,可选地iv)从细胞培养物中分离所述目标蛋白,和可选地v)纯化所述目标蛋白。
应注意,在(i)和(ii)陈述的步骤不必以所陈述的顺序实施。可以首先实施在(ii)陈述的步骤,然后实施(i)。在步骤(i)中,可以将所述宿主细胞工程化以过表达编码本发明的至少一种转录因子的至少一种多核苷酸,所述转录因子包含DNA结合结构域,所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸或SEQ ID NO:1所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQID NO:87所示的氨基酸序列的具有至少60%的序列同一性。
当宿主细胞被“工程化以过表达”给定蛋白时,操作该宿主细胞以使得该宿主细胞具有表达、优选地过表达本发明的转录因子或其功能同系物的能力,由此与操作之前的相同条件下的宿主细胞相比,给定蛋白如POI或模型蛋白的表达增加。在一个实施方案中,“工程化以过表达”暗指对宿主细胞进行遗传改变以便增加蛋白的表达,如将细胞(有意地)基因工程化以过表达此类蛋白。
当将“工程化之前”或“操作之前”用于本发明的宿主细胞的上下文中时,是指这种宿主细胞没有被使用编码本发明的转录因子或其功能同系物的多核苷酸工程化。因此,所述术语还指不过表达编码本发明的转录因子或其功能同系物的多核苷酸的宿主细胞或没有被工程化以过表达编码本发明的转录因子或其功能同系物的多核苷酸的宿主细胞。因此,“工程化之前的宿主细胞”或“操作之前的宿主细胞”或“不过表达编码转录因子的多核苷酸的宿主细胞”是一种不过表达编码本发明的转录因子或其功能同系物的多核苷酸的宿主细胞或一种未工程化以过表达编码本发明的转录因子或其功能同系物的宿主细胞。此外,“工程化之前的宿主细胞”或“操作之前的宿主细胞”或“不过表达编码转录因子的多核苷酸的宿主细胞”是与其比较所述重组目标蛋白的产量增加但未过表达编码本发明的转录因子或其功能同系物的多核苷酸或未工程化以过表达编码本发明的转录因子或其功能同系物的多核苷酸的相同的宿主细胞。
如本文所用的术语“将所述宿主细胞工程化以包含编码所述目标蛋白的多核苷酸”意指用编码目标蛋白的多核苷酸装备本发明的宿主细胞,即,本发明的宿主细胞被工程化以包含编码目标蛋白的多核苷酸。这可以通过如转化或转染或用于将多核苷酸引入宿主细胞的任何其它本领域已知的适宜技术来实现。
本领域技术人员熟知用于操作如编码转录因子和/或POI的多核苷酸序列、启动子、增强子、前导区(leader)等的程序,如J.Sambrook等,Molecular Cloning:ALaboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,New York(2001)描述的。
可通过多种手段,如通过同源重组或通过采用特异性靶向在整合位点处的序列的混合重组酶(hybrid recombinase),将外源或靶多核苷酸(如编码过表达的转录因子或POI的多核苷酸)插入染色体中。典型地,上述外源或靶多核苷酸存在于载体(“插入载体”)中。典型地,在用于同源重组之前,这些载体是环状的和线性的。作为一种选择,所述外源或靶多核苷酸可以是之后被重组至宿主细胞中的通过融合PCR连接的DNA片段或合成构建的DNA片段。除了同源臂之外,载体还含有适于选择或筛选的标记、复制起点和其它元件。还可以使用实现随机或非靶向整合的异源重组。异源重组是指DNA分子与显著不同的序列之间的重组。本领域已知重组的方法,例如在Boer等,Appl Microbiol Biotechnol(2007)77:513–523中描述的。对于酵母细胞的遗传操作还可参考Primrose和Twyman的Principles ofGene Manipulation and Genomics(第七版,Blackwell Publishing2006)。
编码过表达的转录因子和/或POI的多核苷酸还可存在于表达载体上。这些载体是本领域已知的。在表达载体中,启动子置于编码异源蛋白的基因的上游,并调控所述基因的表达。由于多克隆载体的多克隆位点,其是特别有用的。对于表达,通常将启动子置于多克隆位点的上游。既可通过首先制备含有编码转录因子和/或POI的完整DNA序列的DNA构建体,并随后将这一构建体插入适宜的表达载体中,也可以通过顺序地插入含有个体元件(如,DNA结合结构域,激活结构域)遗传信息的DNA片段,然后连接,来构建用于编码转录因子和/或POI的多核苷酸的整合的载体。作为片段的限制和连接的替代,可把基于附着位点(att)的重组方法和重组酶用于将DNA序列插入载体中。这些方法由例如Landy(1989)Ann.Rev.Biochem.58:913-949描述,并是本领域技术人员已知的。
可通过将包含靶多核苷酸序列的载体或质粒引入细胞来获得根据本发明的宿主细胞。本领域熟知用于转染或转化真核细胞或者转化原核细胞的技术。这些技术可以包括脂质囊泡介导的摄取、热休克介导的摄取、磷酸钙介导的转染(磷酸钙/DNA共沉淀)、病毒感染(特别是使用经修饰的病毒诸如例如经修饰的腺病毒)、显微注射和电穿孔。对于原核转化,技术可以包括热休克介导的摄取、与完整细胞的细菌原生质体融合、显微注射和电穿孔。用于植物转化的技术包括土壤杆菌(Agrobacterium)介导的转移(诸如通过根瘤土壤杆菌(A.tumefaciens))、被快速推进的钨或金微弹、电穿孔、显微注射和聚乙二醇介导的摄取。DNA可以是单链的或双链的、线性的或环状的、松弛的或超螺旋的DNA。对于用于转染哺乳动物细胞的多种技术,参见例如Keown等(1990)Processes in Enzymology185:527-537。
短语“在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白”是指在适合或足够获得所需化合物(POI)生产或获得或过表达本发明的转录因子的条件(如温度、压力、pH、诱导、生长速率、培养基、持续时间等)下维持和/或生长(growing)真核宿主细胞。
通过用转录因子基因和/或POI基因转化获得的根据本发明的宿主细胞可优选首先在这样的条件下培养,所述条件允许宿主细胞在没有表达重组蛋白的负担下高效生长至大的细胞数量。当细胞准备进行POI表达时,选择并优化适宜的培养条件以产生POI。
作为示例,使用针对一种或多种转录因子和一种或多种POI的不同启动子和/或拷贝和/或整合位点,可关于与一种或多种POI的表达有关的时间点和诱导强度来控制一种或多种转录因子的表达。例如,在POI表达的诱导之前,可首先表达转录因子。这样做具有如下优势:在POI翻译开始时所述转录因子已经存在。可选地,可在同一时间诱导转录因子和一种或多种POI。
可使用一施加诱导刺激就会被激活的诱导型启动子来指导在该启动子控制下的基因的转录。在有诱导刺激的生长条件下,细胞通常比在正常条件下生长得慢,但因为培养物已经在前一阶段生长至大的细胞数量,培养系统整体产生大量的重组蛋白。诱导刺激优选是适当试剂(如针对AOX-启动子的甲醇)的添加或适当营养物(如针对MET3-启动子的甲硫氨酸)的消耗。此外,乙醇、甲胺、镉或铜的添加以及热或渗透压增加剂也可诱导启动子依赖性表达,所述启动子可操作地与转录因子和一种或多种POI连接。
优选将根据本发明的宿主在生物反应器中在优化的生长条件下培养以获得至少1g/L、更优选至少10g/L细胞干重、更优选至少50g/L细胞干重的细胞密度。不仅在实验室规模中,而且在中试或工业规模中,实现这样的生物分子产量是有益的。
根据本发明,由于至少一种转录因子的过表达,即使当生物质保持较低时,仍可高产量地获得POI。因此高单位产量(specific yield)以mg POI/g干生物质衡量,在实验室、中试和工业规模中达到1至200的范围,如50至200,如100至200是可行的。当与无至少一种转录因子过表达情况下的产物表达相比时,根据本发明的生产宿主细胞的单位产量优选提供至少1.1倍,更优选至少1.2倍,至少1.3或至少1.4倍的增加,在一些情况下可以显示超过2倍的增加。
通过使用标准试验,如ELISA、活性检验、HPLC、表面等离子体共振(Biacore)、蛋白质印迹、毛细管电泳(Caliper)或SDS-Page,通过测量细胞培养上清液或细胞匀浆化后的细胞的细胞匀浆中目标蛋白的效价来测试根据本发明的宿主细胞的表达/分泌能力或产量。
优选将宿主细胞培养在含有合适碳源的矿物质培养基中,由此进一步显著地简化分离过程。作为示例,所述矿物质培养基含有可利用碳源(例如葡萄糖、甘油或甲醇)、含有常量元素(macro element)(钾、镁、钙、铵、氯化物、硫酸盐、磷酸盐)和痕量元素(铜、碘、锰、钼酸盐、钴、锌和铁盐以及硼酸)的盐。
在酵母细胞的情况下,可以用上述一种或多种表达载体中的一种或多种转化所述细胞,使这些细胞交配(mated)以形成二倍体菌株,并在被修饰为适合诱导启动子、选择转化体或扩增编码所需序列的基因的常规营养培养基中培养。本领域已知许多适于酵母菌生长的最低限度培养基。根据需要,可向这些培养基的任一种中补充盐(如氯化钠、钙、镁和磷酸盐)、缓冲液(如HEPES、柠檬酸和磷酸盐缓冲液)、核苷(如腺嘌呤和胸腺嘧啶)、抗生素、痕量元素、维生素和葡萄糖或等效能源。还可包括以适当浓度的任何其它必须的补充物,这是本领域技术人员已知的。所述培养条件(如温度、pH等)是之前与被选择用于表达的宿主细胞一起使用的条件,并且是普通技术人员已知的。针对其它类型宿主细胞的细胞培养条件也是已知的并可由技术人员容易地确定。对各种微生物的培养基的描述例如涵盖在美国生物学会(American Society for Bacteriology)的“Manual of Methods for GeneralBacteriology”手册(华盛顿D.C,USA,1981)中。
可以通过常规的培养方法,例如静止培养、试管培养、振荡培养(例如旋转振荡培养、摇瓶培养等)、掺气旋动培养(aeration spinner culture)或发酵,优选地连续或间歇地在液体培养基中培养(例如维持和/或生长)宿主细胞。在一些实施方案中,在摇瓶或深孔板中培养细胞。在另一些实施方案中,在生物反应器中(例如在生物反应器培养过程中)培养细胞。培养过程包括、但不限于,分批培养、分批进料培养和连续培养方法。术语“分批过程”和“分批培养”是指一个封闭的系统,该系统中的培养基组成、营养物、补充添加剂等在培养开始时已设定,并在培养期间不经受改变;但是,可尝试控制如pH和氧浓度的因素来阻止过度培养基酸化和/或细胞死亡。术语“分批进料过程”和“分批进料培养”是指具有以下例外的一种分批培养:随着培养的进行,添加(例如,以增量或连续方式添加)一种或多种底物或补充物。术语“连续过程”和“连续培养”是指一种系统,在该系统中将限定的培养基连续地添加至生物反应器,并同时将等量的用过的或“条件化”的培养基移除,例如用于回收所需产物。已经开发了多种这样的过程并且这些过程是本领域熟知的。
在一些实施方案中,将宿主细胞培养约12至24小时,在另一些实施方案中,将宿主细胞培养约24至36小时,约36至48小时,约48至72小时,约72至96小时,约96至120小时,约120至144小时,或培养持续时间大于144小时。在又一些实施方案中,培养持续一段足以达到POI的所需生产产量的时间。
上述提及的方法可进一步包括分离表达的POI的步骤。若所述POI是从细胞中分泌出来的,则该POI可采用现有技术从培养基中分离并纯化。POI从细胞中分泌出来通常是优选的,因为产物可以从培养上清液中回收,而不是从当细胞被破坏以释放胞内蛋白时产生的复杂蛋白混合物中回收。蛋白酶抑制剂,如苯基甲基磺酰氟(PMSF),在抑制纯化过程中的蛋白质降解可能是有益的,且可包括抗生素以阻止外来污染物的生长。可采用本领域已知的方法将组合物浓缩、过滤、透析等。可以采用分离器或管式离心机使发酵/培养后的细胞培养物离心,从而将细胞与培养物上清液分离。然后可以通过使用正切流动过滤将上清液过滤浓缩。可选地,培养的宿主细胞也可以通过超声波或机械法(如高压均质)、酶法或化学法来破裂以得到含有所需POI的细胞提取物,从该细胞提取物中可以分离和纯化到POI。
用于获得POI的分离和纯化方法可以基于利用溶解度差异的方法,比如盐析、溶剂沉淀、热沉淀;利用分子量差异的方法,比如尺寸排阻色谱、超滤和凝胶电泳;利用电荷差异的方法,比如离子交换色谱;利用特异亲和性的方法,比如亲和色谱;利用疏水性差异的方法,比如疏水相互作用色谱和反相高效液相色谱;利用等电点差异的方法,比如可以使用等电点聚集;以及利用某些氨基酸的方法,比如IMAC(固定金属离子亲和色谱)。如果将POI表达为失活的可溶性包涵体,则需要使该溶解性包涵体重新折叠。
分离和纯化的POI可以通过常规方法,比如蛋白质印迹或对POI活性的特异性检验来鉴定。纯化POI的结构可以通过氨基酸分析、氨基-末端肽测序、一级结构分析(例如通过质谱)、RP-HPLC、离子交换HPLC、ELISA等来确定。优选可以大量和高纯度水平获得POI,这样即可满足作为药物组合物中的活性成分或者作为饲料或食品添加剂的必要要求。
如本文所用,术语“分离的”是指处于自然界中未出现的形式或环境的物质。分离的物质的非限制性实例包括:(1)任何非天然存在的物质;(2)至少部分地从其在自然界中相关的天然存在的成分中的一种或多种或全部中取出的任何物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅助因子;(3)相对于自然界中发现的物质,经由人工修饰的任何物质,如从mRNA制备的cDNA;或(4)通过相对于其天然相关的其他组分增加物质的量来修饰的任何物质(如,在宿主细胞中的重组生产;编码所述物质的基因的多个拷贝;和使用与编码所述物质的基因天然相关的启动子相比更强的启动子)。
本发明进一步提供一种通过真核宿主细胞制备重组目标蛋白的方法,所述方法包括:(i)提供被工程化以过表达编码至少一种转录因子的至少一种多核苷酸的宿主细胞,其中所述宿主细胞进一步包含编码目标蛋白的多核苷酸,其中本发明的转录因子至少包含DNA结合结构域和激活结构域,(ii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子或其功能同系物的至少一种多核苷酸并过表达所述目标蛋白,和可选地(iii)从细胞培养物中分离所述目标蛋白,和可选地(iv)纯化所述目标蛋白,和可选地(v)修饰所述目标蛋白,和可选地(vi)配制所述目标蛋白。
优选地,在步骤(i)中,将所述宿主细胞工程化以过表达编码本发明的至少一种转录因子的至少一种多核苷酸,所述转录因子包含DNA结合结构域,所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸序列或SEQ ID NO:1所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性。
在本上下文中,本文所用术语“通过真核宿主细胞或在真核宿主细胞中制备重组目标蛋白”意指可以通过采用真核宿主细胞以形成重组宿主细胞来制备重组目标蛋白。由此,该真核宿主细胞可在细胞内部产生重组目标蛋白并使重组POI保持在细胞内部(细胞内的)或将该重组POI分泌至在其中培养宿主细胞的培养基中(细胞外的)。因此,可以从所述细胞培养基(细胞培养物的上清液)中或从细胞匀浆化后的细胞的细胞匀浆中分离所述POI。
在本上下文中,术语“修饰所述目标蛋白”意指该POI是经化学修饰的。本领域已知许多修饰蛋白的方法。可以将蛋白质与碳水化合物或脂质偶联。可以将POI PEG化(将POI与聚乙二醇化学偶联)或HES化(将POI与羟乙基淀粉化学偶联)以延长半衰期。还可将POI与其它部分,比如针对如人血清白蛋白的亲和结构域偶联,以延长半衰期。还可以通过蛋白酶或在水解条件下处理POI以进行剪切(cleavage),以从预序列形成活性成分或切下标签(比如用于纯化的亲和标签)。还可以将POI与其他部分,例如毒素、放射性部分或任何其它部分偶联。可以在形成二聚体、三聚体等的条件下进一步处理POI。
此外,术语“配制所述目标蛋白”是指使POI处于这样的条件下,在该条件下POI可以长时间存储。本领域已知许多不同方法均可用于稳定蛋白质。通过在纯化和/或修饰后交换其中存在POI的缓冲液,可以将POI置于它在其中更稳定的条件下。可以使用本领域已知的不同缓冲物质和添加剂,如蔗糖、温和的洗涤剂、稳定剂等。也可以通过冻干从而使POI稳定。对于一些POI,可以通过形成POI与脂质或脂蛋白的复合物(比如人工合成多聚物(polyplex)等)来进行配制。也可以将一些蛋白质与其它蛋白质共同配制。
与工程化之前的宿主细胞相比,在本发明的方法、重组宿主细胞和用途中使用的本发明的所述Msn4p转录因子(参见SEQ ID NOs:15-27)的过表达可以使模型蛋白scFv(SEQID NO.13)和/或vHH(SEQ ID NO.14)的产量增加。可以使上述模型蛋白的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。如本文所用,术语“0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%等”是指“1-倍、1.1-倍、1.2-倍、1.3-倍、1.4-倍、1.5-倍、1.6-倍、1.7-倍、1.8-倍、1.9-倍、2-倍、3-倍、4-倍、5-倍、6-倍等”。后缀“-倍”是指倍数。“1倍”表示一个整体,“2倍”表示两倍,“3倍”表示三倍。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然转录因子Msn4p的过表达可使模型蛋白(优选scFv(SEQ ID NO.13))的产量增加至少10%,如20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成的转录因子synMsn4p的过表达可使模型蛋白(优选vHH(SEQ ID NO.14))的产量增加至少10%,如20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。
优选地将编码在本发明的方法、重组宿主细胞和用途中使用的转录因子的多核苷酸和/或编码在本发明的方法、重组宿主细胞和用途中使用的POI的多核苷酸整合至所述宿主细胞的基因组中。术语“基因组”通常是指以DNA(或对于某些病毒物种以RNA)编码的生物体的全部遗传信息。基因组可存在于染色体中、质粒或载体中或两者兼有。优选地,将编码转录因子的多核苷酸整合至所述细胞的染色体中。
可以通过将相关基因各自连接(ligating)至一个载体中,使编码转录因子和POI的多核苷酸重组于所述宿主细胞中。可以构建携带所述基因的单一载体,或两个单独的载体,其中一个携带转录因子基因而另一个携带POI基因。可通过采用一种或多种所述载体转化宿主细胞,将这些基因整合至所述宿主细胞的基因组中。在一些实施方案中,将编码POI的基因整合在所述基因组中,而将编码转录因子的基因整合在质粒或载体中。在一些实施方案中,将编码转录因子的基因整合在所述基因组中,而将编码POI的基因整合在质粒或载体中。在一些实施方案中,将编码POI和转录因子的基因均整合在所述基因组中。在一些实施方案中,将编码POI和转录因子的基因整合在质粒或载体中。若采用编码POI的多个基因,则可将编码POI的一些基因整合在所述基因组中,而将另一些基因整合在相同或不同的质粒或载体中。若采用编码转录因子的多个基因,则可将编码转录因子的一些基因整合在所述基因组中,而将另一些基因整合在相同或不同的质粒或载体中。
可以将编码转录因子或其功能同系物的多核苷酸整合在其天然基因座上。“天然基因座”是指在特定染色体上的位置,其中编码转录因子的多核苷酸位于例如编码本发明的转录因子的基因的天然基因座。然而,在另一个实施方案中,存在于宿主细胞的基因组中的编码转录因子的多核苷酸未在它们的天然基因座上,而是被异位地整合。术语“异位的整合”是指在微生物基因组中不是其通常染色体基因座的位点处的核酸的插入,即预定的或随机的整合。在另一个实施方案中,可以将编码转录因子或其功能同系物的多核苷酸整合在其天然基因座上和异位地整合。
对于酵母细胞,可以将编码转录因子的多核苷酸和/或编码POI的多核苷酸插入所需的基因位,比如但不限于AOX1、GAP、ENO1、TEF、HIS4(Zamir等,Proc.NatL Acad.Sci.USA(1981)78(6):3496-3500)、HO(Voth等,Nucleic Acids Res.2001June 15;29(12):e59)、TYR1(Mirisola等,Yeast 2007;24:761–766)、His3、Leu2、Ura3(Taxis等,BioTechniques(2006)40:73-78)、Lys2、ADE2、TRP1、GAL1、ADH1、RGI1或核糖体RNA基因座。
在其它实施方案中,可以将编码至少一种转录因子的多核苷酸和/或编码POI的多核苷酸整合在质粒或载体中。术语“质粒”和“载体”包括自主复制的核苷酸序列以及基因组整合的核苷酸序列。技术人员能够依据所使用的宿主细胞选用合适的质粒或载体。
优选地,所述质粒是真核表达载体,优选为酵母表达载体。
质粒可用于在适宜的宿主生物体中克隆的重组核苷酸序列(即重组基因)的转录和它们mRNA的翻译。质粒还可用于通过本领域已知的方法,如J.Sambrook等,MolecularCloning:A Laboratory Manual(3rd edition),Cold Spring Harbor Laboratory,ColdSpring Harbor Laboratory Press,New York(2001)描述的方法,将靶多核苷酸整合至宿主细胞基因组中。“质粒”通常包括用于自主复制的起点、选择标记、多个限制性酶切割位点、适宜的启动子序列和转录终止子,所述组份可操作地连接在一起。将编码多肽的目标序列可操作地连接至在宿主细胞中提供多肽表达的转录和翻译调控序列。
当核酸被置于与相同核酸分子上的另一核酸序列的功能关系中时,该核酸是“可操作地连接”的。例如,当启动子能够作用于重组基因的编码序列的表达时,该启动子与该重组基因的编码序列是可操作地连接的。
在每个细菌细胞中,大多数质粒以仅一个拷贝存在。但是,一些质粒以较多拷贝数存在。例如,对于大肠杆菌的每条染色体,质粒ColE1通常以10至20个质粒拷贝存在。如果质粒中包含本发明的核苷酸序列,则每个宿主细胞中,该质粒可具有1-10、10-20、20-30、30-100或更多的拷贝数。使用高拷贝数的质粒,可以通过细胞过表达转录因子。
本领域技术人员已知大量适宜的质粒或载体,并且很多质粒或载体是商购可获得的。Sambrook等编辑,Molecular Cloning:A Laboratory Manual(2nd Ed.),Vols.1-3,Cold Spring Harbor Laboratory(1989),和Ausubel等编辑,Current Protocols inMolecular Biology,John Wiley&Sons,Inc.,New York(1997)中提供了适宜的载体的实例。
本发明的载体或质粒涵盖包含端粒(telomeric)、着丝粒(centromeric)和复制的起点(复制起点)序列的酵母人工染色体,所述酵母人工染色体是指可以被遗传修饰为含有异源DNA序列(如,大到3000kb的DNA序列)的DNA构建体。
本发明的载体或质粒还涵盖包含复制的起点序列(Ori)并可包含一个或多个解旋酶(如parA、parB和parC)的细菌人工染色体(BAC),所述细菌人工染色体是指可以被遗传修饰为含有异源DNA序列(如,大到300kb的DNA序列)的DNA构建体。
将酵母作为宿主的质粒的实例包括YIp型载体、YEp型载体、YRp型载体、YCp型载体(在如Romanos等,1992,Yeast.8(6):423-488中描述了Yxp载体)、pGPD-2(在Bitter等,1984,Gene,32:263-274中进行了描述)、pYES、pAO815、pGAPZ、pGAPZα、pHIL-D2、pHIL-S1、pPIC3.5K、pPIC9K、pPICZ、pPICZα、pPIC3K、pPINK-HC、pPINK-LC(均可自Thermo FisherScientific/Invitrogen获得)、pHWO10(在Waterham等,1997,Gene,186:37-44中进行了描述)、pPZeoR、pPKanR、pPUZZLE和比如pPM2d、pPM2aK21或pPM2eH21的pPUZZLE-衍生物(在Stadlmayr等,2010,J Biotechnol.150(4):519-29.;Marx等,2009,FEMS Yeast Res.9(8):1260-70.中进行了描述);GoldenPiCS系统(由骨架BB1、BB2和BB3aK/BB3eH/BB3rN组成);pJ-载体(如pJAN、pJAG、pJAZ及其衍生物;均可自BioGrammatics,Inc获得)、pJexpress-载体、pD902、pD905、pD915、pD912及其衍生物、pD12xx、pJ12xx(均可自ATUM/DNA2.0获得)、pRG质粒(在Gnügge等,2016,Yeast 33:83–98中进行了描述)2μm质粒(在如Ludwig等,1993,Gene 132(1):33-40中进行了描述)。这些载体是已知的,并且例如描述在Cregg等,MolBiotechnol.(2000)16(1):23-52或Ahmad等,2014.,Appl Microbiol Biotechnol.98(12):5301-17中。通过例如由Lee等,2015,ACS Synth Biol.4(9):975-986;Agmon等,2015,ACSSynth.Biol.,4(7):853–859或Wagner和Alper,2016,Fungal Genet Biol.89:126-136描述的先进的模块化克隆技术可以容易地产生其他合适的载体。另外,这些以及其它适宜的载体还可以自Addgene,Cambridge,MA,USA获得。
优选地,将GoldenPiCS系统的BB1质粒用于通过采用特异性限制性酶引入本发明的转录因子的基因片段(表1)。然后如Prielhofer等,2017所述,可以将携带各自编码序列的组装的BB1进一步在GoldenPiCS系统中进行处理以创建所需的BB3整合质粒。
编码在本发明的方法、重组宿主细胞和用途中使用的至少一种转录因子的多核苷酸可编码异源或同源转录因子。
如本文所用,术语“异源(的)”意指源自具有不同基因组背景的细胞或生物体(优选酵母)或合成序列。因此,“异源转录因子”是源自外源(或物种,例如酿酒酵母的Msn4p或synMsn4p)的一种,并将其用于除外源以外的来源(或物种,例如巴斯德毕赤酵母)中。术语“同源(的)”意指源自具有相同基因组背景的相同细胞或生物体。因此,“同源转录因子”是源自相同来源(或物种,例如巴斯德毕赤酵母的Msn4p)的一种,并将其用于相同的来源(或物种,例如巴斯德毕赤酵母)。
一般而言,可通过如下详细描述的本领域技术人员已知的任何方法实现过表达。可通过提高基因的转录/翻译,如通过提高所述基因的拷贝数或者改变或修饰调控序列来实现过表达。例如,可以通过引入一个或多个拷贝的与调控序列(如启动子)可操作地连接的编码转录因子或其功能同系物的多核苷酸序列,实现过表达。例如,为了达到高表达水平,可将所述基因可操作地连接至强的组成型启动子。这种启动子可以是内源性启动子或重组启动子。可选地,可以将调控序列移除从而使表达变为组成型的。人们可以用增加基因表达的或导致基因组成型表达的异源启动子替换给定基因的天然启动子。例如,与工程化之前的并在相同条件下培养的宿主细胞相比,所述宿主细胞可以大于10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%或大于300%过表达转录因子。此外,还可通过以下方式实现过表达,例如修饰特定基因的染色体位置;改变与特定基因相邻的核酸序列,所述特定基因如核糖体结合位点或转录终止子;修饰与所述基因的转录和/或与所述基因产物的翻译相关的蛋白(如,调控蛋白、抑制子、增强子、转录激活因子等等);或任何其它本领域常规的使特定基因表达失调的常规技术(包括但不限于,反义核酸分子的应用,例如以阻断阻遏蛋白的表达,或者缺失或突变通常抑制需要过表达的基因的表达的转录因子的基因)。延长mRNA的寿命也可提高表达水平。例如,某些终止子区可用于延长mRNA的半衰期(Yamanishi等,Biosci.Biotechnol.Biochem.(2011)75:2234和US 2013/0244243)。若包括多个拷贝的基因,这些基因既可以位于可变拷贝数的质粒中,也可以是在染色体中整合的并扩增的。若所述宿主细胞不包含编码转录因子的基因,则可以将该基因引入宿主细胞用于表达。此时,“过表达”是指采用本领域技术人员已知的任何方法表达所述基因产物。
本领域技术人员将在Martin等(Bio/Technology 5,137-146(1987))、Guerrero等(Gene 138,35-41(1994))、Tsuchiya和Morinaga(Bio/Technology 6,428-430(1988))、Eikmanns等(Gene 102,93-98(1991))、EP 0 472 869、US 4,601,893、Schwarzer和
Figure BDA0002953325880000451
(Bio/Technology 9,84-87(1991))、Reinscheid等(Applied and EnvironmentalMicrobiology 60,126-132(1994))、LaBarre等(Journal of Bacteriology 175,1001-1007(1993))、WO 96/15246、Malumbres等(Gene 134,15-24(1993))、JP-A-10-229891、Jensen和Hammer(Biotechnology and Bioengineering 58,191-195(1998))和Makrides(Microbiological Reviews 60,512-538(1996))中,特别是在公知的遗传和分子生物教科书中发现相关说明。
因此,可以通过交换或修饰与编码异源转录因子的多核苷酸可操作地连接的调控序列来实现编码在本发明的方法、重组宿主细胞和用途中使用的异源转录因子的所述多核苷酸的过表达。在本上下文中,“调控序列(元件)”是核酸分子的片段,其能够增加或降低生物体内特定基因的表达。正调控序列能够增加表达,而负调控序列能够降低表达。调控序列(元件)包括例如启动子、增强子、沉默子、多腺苷酸化信号、转录终止子(终止子序列)、编码序列,内部核糖体进入位点(IRES)等。正调控序列可包括但不限于增强子。负调控序列可包括但不限于沉默子。在本上下文中提及交换调控序列,是指用更有效的终止子序列交换所述异源转录因子的天然终止子序列,或用密码子优化的编码序列交换所述异源转录因子的编码序列(所述密码子优化根据所述宿主细胞的密码子选择(codon-usage)进行),或用更有效的调控元件交换所述异源转录因子的天然正调控元件。
可以通过将处于启动子控制下的一个或多个拷贝的编码异源转录因子的多核苷酸引入宿主细胞,来进一步实现编码在本发明的方法、重组宿主细胞和用途中使用的异源转录因子的多核苷酸的过表达。
本文所用术语“启动子”是指有助于特定基因的转录的区域。与无启动子存在时所表达的重组产物的量相比,启动子通常使从核苷酸序列表达的重组产物的量增加。可利用源自一个生物体的启动子来增强从源自另一生物体的序列的重组产物表达。可以通过采用本领域已知的方法的同源重组来将启动子整合至宿主细胞染色体中(如,Datsenko等,Proc.Natl.Acad.Sci.U.S.A.,97(12):6640-6645(2000))。此外,一个启动子元件能够增加串联连接的多个序列所表达的产物的量。因此,一个启动子元件能够增强一种或多种重组产物的表达。可以通过启动子的转录效率来评估启动子活性。可通过测量从该启动子的mRNA转录的量来直接地测定启动子活性,如通过RNA印迹法、定量PCR,或通过测量自该启动子表达的基因产物的量来间接地测定启动子活性。
启动子可以是“诱导型启动子”或“组成型启动子”。“诱导型启动子”是指可以被某些因子的存在或缺少诱导的启动子,“组成型启动子”是指允许启动子的一种或多种相关基因连续转录的不受诱导而始终具有活性的启动子。
在优选的实施方案中,编码转录因子的核苷酸序列和编码POI的核苷酸序列的转录均被诱导型启动子驱动。在另一优选的实施方案中,编码转录因子的核苷酸序列和编码POI的核苷酸序列的转录均被组成型启动子驱动。在还一优选的实施方案中,编码转录因子的核苷酸序列的转录被组成型启动子驱动,编码POI的核苷酸序列的转录被诱导型启动子驱动。在另又一优选的实施方案中,编码转录因子的核苷酸序列的转录被诱导型启动子驱动,编码POI的核苷酸序列的转录被组成型启动子驱动。例如,编码转录因子的核苷酸序列的转录可以被组成型GAP启动子驱动,编码POI的核苷酸序列的转录可以被诱导型AOX启动子驱动。在一个实施方案中,就启动子活性、启动子调控和/或表达行为,编码转录因子和POI的核苷酸序列的转录被相同的启动子或相似的启动子驱动。在另一实施方案中,就启动子活性、启动子调控和/或表达行为,编码转录因子和POI的核苷酸序列的转录被不同的启动子驱动。
在Mattanovich等,Methods Mol.Biol.(2012)824:329-58中描述了与酵母宿主细胞一起使用的适宜的启动子序列,包括如磷酸丙糖异构酶(TPI)、3-磷酸甘油酸激酶(PGK)、葡萄糖-6-磷酸异构酶(PGI)、甘油醛-3-磷酸脱氢酶(GAPDH或GAP)的糖酵解酶及其变体的启动子,乳糖酶(LAC)和半乳糖苷酶(GAL)的启动子、翻译延伸因子启动子(PTEF),和巴斯德毕赤酵母烯醇化酶1(ENO1)、磷酸丙糖异构酶(TPI)、核糖体亚基蛋白(PRPS2、PRPS7、PRPS31、PRPL1)的启动子,醇氧化酶启动子(AOX)或其具有修饰特性的变体,甲醛脱氢酶启动子(FLD),异柠檬酸裂合酶启动子(ICL),α-酮异己酸脱羧酶启动子(THI),热休克蛋白家族成员(SSA1、HSP90、KAR2)、6-磷酸葡糖酸脱氢酶(GND1)、磷酸甘油酸变位酶(GPM1)、转酮酶(TKL1)、磷脂酰肌醇合成酶(PIS1)、铁-O2-氧化还原酶(ferro-O2-oxidoreductase)(FET3)、高亲和力铁通透酶(FTR1)、抑制性碱性磷酸酶(PHO8)、N-肉豆蔻酰基转移酶(NMT1)、信息素应答转录因子(MCM1)、泛素(UBI4)、单链DNA核酸内切酶(RAD2)的启动子、线粒体内膜的主要ADP/ATP载体的启动子(PET9)(WO2008/128701)和甲酸脱氢酶(FMD)启动子。Prielhofer等,2017(BMC Syst Biol.11(1):123.)、Gasser等,2015(Microb CellFact.14:196.)、Portela等,2017.(ACS Synth Biol.6(3):471-484.)或Vogl等,2016(ACSSynth Biol.5(2):172-86.)描述了其它适宜的启动子。AOX启动子可被甲醇诱导和被如葡萄糖抑制。
适宜的启动子的进一步实例包括酿酒酵母烯醇化酶(ENO-1)、半乳糖激酶(GAL1)、醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、丙糖磷酸异构酶(TPI)、金属硫蛋白(CUP1)、3-磷酸甘油酸激酶(PGK)的启动子和麦芽糖酶基因启动子(MAL)。
Romanos等,1992,Yeast 8:423-488描述了酵母宿主细胞的其它有用启动子。
本发明的异源转录因子(如synMsn4p)的每个编码序均可以与GAP启动子组合至整合质粒(优选BB3)中。
可以通过使用驱动编码同源转录因子的多核苷酸表达的启动子来实现编码在本发明的方法、重组宿主细胞和用途中使用的同源转录因子的所述多核苷酸的过表达。为了实现高表达水平,可以用另一个更强的启动子替换可操作地连接至内源性同源转录因子的内源性/天然启动子。这种启动子可以是诱导型的或组成型的。可以通过采用本领域已知的方法的突变或同源重组来实施内源性启动子的修饰和/或替换。
本发明的同源转录因子(如若在巴斯德毕赤酵母中表达,为巴斯德毕赤酵母的天然Msn4p)的每个编码序均可以与强组成型或诱导型启动子(比如GAP启动子、pTHI11、pSBH17或pPOR1等)组合至整合质粒(比如BB3)中。
可通过本领域已知的其它方法,例如通过如Marx等,2008(Marx,H.,Mattanovich,D.和Sauer,M.Microb Cell Fact 7(2008):23)和Pan等,2011(Pan等,FEMS Yeast Res.(2011)May;(3):292-8)描述的遗传修饰转录因子的内源性调控区域来实现编码转录因子的多核苷酸的过表达,这种方法包括,例如增加转录因子表达的重组启动子的整合。转化描述于Cregg等,(1985)Mol.Cell.Biol.5:3376-3385。
因此,本发明可包括,进一步通过交换或修饰可操作地连接至编码同源转录因子的多核苷酸的调控序列来实现编码在本发明的方法、重组宿主细胞和用途中使用的同源转录因子的所述多核苷酸的过表达。
在本上下文中提及交换调控序列,是指例如用更有效的终止子序列交换所述同源转录因子的天然终止子序列,或用密码子优化的编码序列交换所述同源转录因子的编码序列(所述密码子优化根据所述宿主细胞的密码子选择进行),或用更有效的正调控元件交换所述同源转录因子的天然正调控元件。
如在本上下文使用的,术语“修饰调控序列”意指另一正调控序列的添加或负调控序列的缺失。因此,修饰调控序列是指引入/添加所述同源/异源转录因子(元件)的天然表达盒中不存在的另一正调控序列,或使所述同源/异源转录因子的天然表达盒中通常存在的负调控序列(元件)缺失。天然表达盒是指编码蛋白质的序列,其包括参与所述蛋白质表达的负或正调控的5'和3'侧翼序列,比如启动子、终止子、多腺苷酸化信号等,其天然存在于细胞中且不是人利用重组基因技术人工产生的。可能存在异源以及同源天然表达盒。如果将来自一个物种的表达盒转移到另一物种并且仍然导致由所述天然表达盒编码的蛋白质的表达,则将该天然表达盒看作是异源天然表达盒。
可以通过将处于启动子控制下的一个或多个拷贝的编码同源转录因子的多核苷酸引入宿主细胞,来进一步实现编码在本发明的方法、重组宿主细胞和用途中使用的同源转录因子的多核苷酸的过表达。
编码在本发明的方法、重组宿主细胞和用途中使用的至少一种转录因子的多核苷酸的过表达通过如下实现:i)用与编码同源转录因子的多核苷酸可操作地连接的不同启动子(如更强的启动子)交换所述同源转录因子的天然启动子,ii)用更有效的终止子序列交换所述异源和/或同源转录因子的天然终止子序列,iii)用密码子优化的编码序列(比如优化了mRNA稳定性或半衰期或使用最频繁的密码子等)交换所述异源和/或同源转录因子的编码序列,所述密码子优化根据所述宿主细胞的密码子选择进行,iv)用更有效的调控元件交换所述异源和/或同源转录因子的天然正调控元件,v)引入另一正调控元件,所述正调控元件不存在于所述同源转录因子的天然表达盒中,vi)使负调控元件缺失,所述负调控元件通常存在于所述同源转录因子的天然表达盒中,或vii)引入一个或多个拷贝的编码异源和/或同源转录因子的多核苷酸,或其组合。
本发明可进一步包括在本发明的方法、重组宿主细胞和用途中使用的转录因子,所述转录因子包含SEQ ID NOs:15-27所示的氨基酸序列或SEQ ID NO:15所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:15所示的氨基酸序列具有至少11%的序列同一性。在进一步的实施方案中,本发明可进一步包括在本发明的方法、重组宿主细胞和用途中使用的转录因子,所述转录因子包含SEQ ID NOs:15-27所示的氨基酸序列或SEQ IDNO:15所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:15所示的氨基酸序列具有至少11%,比如15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或甚至100%的序列同一性。
在本发明的方法、重组宿主细胞和用途中使用的转录因子可另外包含任何核定位信号(NLS)。因此,本发明的转录因子可包含如本文其它地方所述的DNA结合结构域、本文其它地方所述的任何激活结构域以及任何NLS。在具体上下文中的任何NLS可包括本文所述的合成NLS(比如SEQ ID NO:86)或病毒NLS或本发明的转录因子或任何物种的其它蛋白的NLS。NLS是一种“标记”蛋白质的氨基酸序列,该蛋白质通过核转运进入细胞核。典型地,NLS由暴露于蛋白质表面的带正电荷的赖氨酸或精氨酸的一个或多个短序列组成。优选地将SEQ ID NO:85(预测的巴斯德毕赤酵母的Msn4p的NLS:EPRKKETKQRKRAK;根据SeqNLS的最佳预测(得分>0.89);http://mleg.cse.sc.edu/seqNLS/MainProcess.cgi)或SEQ ID NO:86(synMsn4p的NLS:PKKKRKV)所示的氨基酸序列用作本发明的NLS。
核定位信号可以是同源或异源NLS。在本上下文中,术语“异源NLS”是指源自外源(或物种,例如源自酿酒酵母的NLS或人NLS,还参见Weninger等,2015.FEMS Yeast Res.15:7)的NLS或合成序列,并将其用于除外源以外的来源(或物种,例如巴斯德毕赤酵母)中。术语“同源NLS”是源自相同来源(或物种,如巴斯德毕赤酵母的NLS)的一种,并将其用于相同的来源(或物种,如巴斯德毕赤酵母)。
本发明可进一步包括在本发明的方法、重组宿主细胞和用途中使用的转录因子,其中所述转录因子不刺激用于表达目的蛋白的启动子。由此,其意味着本发明的转录因子对POI的启动子无影响。相反,它对除POI以外的其他蛋白质的启动子有影响。在本上下文中,术语“不刺激”或“无刺激”意指完全不影响POI的启动子或对POI的启动子有轻微影响,由此导致POI的产量少量增加约10%或更少,比如所述POI的产量增加1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。
本发明的方法、重组宿主细胞和用途采用真核细胞作为宿主细胞。如本文所用,“宿主细胞”是指能够表达蛋白质和可选地能够分泌蛋白质的细胞。此类宿主细胞应用在本发明的方法中。基于此目的,对于过表达编码至少一种转录因子的至少一种多核苷酸的宿主细胞,编码所述转录因子的多核苷酸序列存在于该细胞中或被引入了该细胞中。真核细胞的实例包括、但不限于:脊椎动物细胞、哺乳动物细胞、人细胞、动物细胞、无脊椎动物细胞、植物细胞、线虫细胞、昆虫细胞、干细胞、真菌细胞或酵母细胞。
优选地,真核宿主细胞为真菌细胞。更优选地为酵母宿主细胞。酵母细胞的实例包括但不限于:酵母属(如酿酒酵母、克鲁维酵母(Saccharomyces kluyveri)、葡萄汁酵母菌(Saccharomyces uvarum))、Komagataella属(Komagataella pastoris、Komagataellapseudopastoris或Komagataella phaffii)、克鲁维酵母属(如,乳酸克鲁维酵母、马克思克鲁维酵母(Kluyveromyces marxianus))、假丝酵母属(如产朊假丝酵母(Candina utilis)、可可假丝酵母(Candida cacaoi))、地霉属(如,发酵地霉(Geotrichum fermentans))以及多形汉森酵母和解脂耶氏酵母。
在优选的实施方案中,毕赤酵母属是特别感兴趣的。毕赤酵母属包含许多种,包括巴斯德毕赤酵母(Pichia pastoris)种、甲醇毕赤酵母(Pichia methanolica)种、克鲁维毕赤酵母(Pichia kluyveri)种和安格斯毕赤酵母(Pichia angusta)种。最优选的是巴斯德毕赤酵母种。
已将前巴斯德毕赤酵母种分类并重新命名为Komagataella pastoris、Komagataella phaffii和Komagataella pseudopastoris。因此巴斯德毕赤酵母与Komagataella pastoris、Komagataella phaffii和Komagataella pseudopastoris是同义词。
用于本发明的巴斯德毕赤酵母菌株的实例是X33及其亚型GS115、KM71、KM71H;CBS7435(mut+)及其亚型CBS7435 muts、CBS7435mutsΔArg、CBS7435 mutsΔHis、CBS7435mutsΔArgΔHis、CBS7435 muts PDI+、CBS704(=NRRL Y-1603=DSMZ 70382)、CBS2612(=NRRL Y-7556)、CBS9173-9189和DSMZ 70877及其突变体。这些酵母菌株可从工业供应商或细胞储存库比如American Tissue Culture Collection(ATCC)、德国布伦瑞克的“Deutsche Sammlung von Mikroorganismen und Zellkulturen”(DSMZ)或荷兰乌特勒支的Dutch“Centraalbureau voor Schimmelcultures”(CBS)处获得。
根据进一步优选的实施方案,酵母宿主细胞选自巴斯德毕赤酵母(Komagataellaspp)、多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种(Komagataella spp)和粟酒裂殖酵母(Schizosaccharomyces pombe)。这些酵母菌株可从细胞储存库比如American TissueCulture Collection(ATCC)、德国布伦瑞克的“Deutsche Sammlung von Mikroorganismenund Zellkulturen”(DSMZ)或荷兰乌特勒支的Dutch“Centraalbureau voorSchimmelcultures”(CBS)处获得。
本发明进一步包括在本发明的方法、重组宿主细胞和用途中使用的重组目标蛋白可以是酶。优选的酶是可用于如制备洗涤剂、淀粉、燃料、纺织品、纸浆和纸、油、个人护理产品或如烘烤、有机合成等工业应用的那些(参见Kirk等,Current Opinion inBiotechnology(2002)13:345-351)。
本发明进一步包括重组目标蛋白可以是治疗性蛋白。POI可以是但不限于适合作为如抗原结合蛋白的生物制药物质的蛋白,比如本文更详细描述的例如抗体或抗体片段、或抗体衍生的骨架、单结构域抗体及其衍生物,其它非抗体衍生亲和骨架,比如抗体模拟物、生长因子、激素、疫苗等。
这些治疗性蛋白包括但不限于:胰岛素、胰岛素样生长因子、hGH、tPA、细胞因子,如诸如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18的白细胞介素、干扰素(IFN)α、IFNβ、IFNγ、IFNω或IFNτ、肿瘤坏死因子(TNF)TNFα和TNFβ、TRAIL;G-CSF、GM-CSF、M-CSF、MCP-1和VEGF。
治疗性蛋白的进一步实例包括凝血因子(VII、VIII、IX)、镰刀菌属碱性蛋白酶、降钙素、CD4受体达贝泊汀(darbepoetin)、DNA酶(囊性纤维化)、促红细胞生成素、eutropin(人生长激素衍生物)、促卵泡激素(促滤泡素)、明胶、胰高血糖素、葡糖脑苷脂酶(戈谢病)、源自黑曲霉(A.niger)的葡糖淀粉酶、源自黑曲霉的葡萄糖氧化酶、促性腺激素、生长因子(GCSF、GMCSF)、生长激素(生长激素(somatotropine))、乙肝疫苗、水蛭素、人抗体片段、人载脂蛋白AI、人降钙素前体、人胶原酶IV、人表皮生长因子、人胰岛素样生长因子、人白细胞介素6、人层粘连蛋白、人前脱脂蛋白AI、人血清白蛋白、胰岛素、胰岛素和突变蛋白、胰岛素、干扰素α和突变蛋白、干扰素β、干扰素γ(突变蛋白)、白细胞介素2、促黄体生成激素、单克隆抗体5T4、小鼠胶原蛋白、OP-1(成骨的,神经保护因子)、奥普瑞白介素(白细胞介素11-激动剂)、有机磷酸水解酶(organophosphohydrolase)、PDGF-激动剂、肌醇六磷酸酶、血小板衍化生长因子(PDGF)、重组血纤溶酶原激活剂G、葡萄球菌激酶、干细胞因子、破伤风毒素片段C、组织型纤溶酶原激活物和肿瘤坏死因子(参见Schmidt,Appl MicrobiolBiotechnol(2004)65:363-372)。
优选地,治疗性蛋白是抗原结合蛋白。更优选地,治疗性蛋白包含抗体、抗体片段或抗体模拟物。甚至更优选地,治疗性蛋白是抗体或抗体片段。
在优选的实施方案中,所述蛋白是抗体片段。术语“抗体”旨在包括含有具有适合并识别表位的特异性形状的分子结构的任何多肽链,其中一个或多个非共价结合相互作用稳定该分子结构与所述表位之间的复合物。原型的抗体分子是免疫球蛋白,且来自所有来源(如人、啮齿动物、兔、牛、羊、猪、狗、其它哺乳动物、鸡、其它禽类等)的所有类型的免疫球蛋白(IgG、IgM、IgA、IgE、IgD、IgY等)都被认为是“抗体”。例如,抗体片段可包括但不限于:Fv(一种包含VL和VH的分子)、单链Fv(scFV)(一种包含由肽连接子连接的VL和VH的分子)、Fab、Fab'、F(ab')2、单结构域抗体(sdAb)(包含单可变结构域和3CDR的分子)和它们的多价存在形式(presentation)。所述抗体或其片段可以是鼠、人、人源化或嵌合的抗体或其片段。治疗性蛋白的实例包括:抗体、多克隆抗体、单克隆抗体、重组抗体、抗体片段,比如Fab'、F(ab')2、Fv、scFv、di-scFv、bi-scFv、串联scFv、双特异性串联scFv、sdAb、纳米抗体、VH和VL,或人抗体、人源化抗体、嵌合抗体、IgA抗体、IgD抗体、IgE抗体、IgG抗体、IgM抗体、胞内抗体(intrabody)、双抗体、四抗体、微抗体或单抗体(monobody)。优选地,抗体片段为scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)。抗体模拟物是指结合抗原但在结构上与抗体无关的有机化合物。此类抗体模拟物是指具有约3至20kDA的摩尔量的人工肽或蛋白质,比如现有技术中已知的亲和体分子、affilin、affimer、affitin、α体、anticalin、avimer、DARPin、单体(monobody)、纳米CLAMP。
目标蛋白可进一步为食品添加剂。食品添加剂是如在食品、饲料或化妆品中使用的用作营养的、膳食的(dietary)、消化的、补充剂的蛋白。所述食品可以是,例如,肉汤、甜点、谷物棒、糕饼(confectionery)、运动饮料、膳食产品或其他营养产品。“食品”是指旨在或适合用于人食用、摄入、消化的任何天然或人工饮食膳食等或这些膳食的组份。
目标蛋白可进一步为饲料添加剂。可用作饲料添加剂的酶的实例包括植酸酶、木聚糖酶和β-葡聚糖酶。
本发明的方法、重组宿主细胞和用途可进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少一种ER辅助蛋白的至少一种多核苷酸。在本上下文中,术语“ER”是指“内质网”。优选地,通过进一步在所述宿主细胞中过表达编码至少一种ER辅助蛋白的至少一种多核苷酸,使与过表达编码至少一种转录因子的至少一种多核苷酸但不过表达编码至少一种ER辅助蛋白的至少一种多核苷酸的宿主细胞相比,重组目标蛋白的产量增加。
如本文所用,术语“编码至少一种ER辅助蛋白的至少一种多核苷酸”意指编码一种ER辅助蛋白的一种多核苷酸,编码至少两种ER辅助蛋白的两种多核苷酸,编码三种ER辅助蛋白的三种多核苷酸等。
术语“ER辅助蛋白”是指伴侣分子、辅助伴侣分子和/或核苷酸交换因子。本文所用术语“伴侣分子”是指协助其他多肽的折叠、解折叠、装配或解装配的多肽。伴侣分子是指这样的蛋白质,其参与新翻译的真核胞质蛋白和分泌蛋白的正确折叠或解折叠和转运。有许多不同的伴侣分子家族,每个家族以不同的方式协助蛋白质折叠。有ER伴侣分子和胞质伴侣分子。
酵母细胞中的胞质伴侣分子包括但不限于Ssa1p、Ssa2p、Ssa3p、Ssa4p、Ssb1p、Ssb2p、Sse1p、Sse2p,它们是指Hsp70系统。Ssa1-4p参与新合成蛋白质的折叠以及中间蛋白质向ER和线粒体的转运。Ssb1p和Ssb2p参与核糖体结合的初生链的折叠,Sse1p和Sse2p作为Ssap和Ssbp的核苷酸交换因子。Ydj1p和Sis1p属于酵母中的Hsp40系统,它们作为辅助伴侣分子与触发Ssa1-4p水解ATP的非天然多肽相互作用,并参与跨膜的蛋白质运输。Snl1p、Fes1p、Cns1p是Ssa1-4p的其他辅助伴侣分子(Chang等,Cell 128(2007))。在本上下文中,术语“辅助伴侣分子”是指在蛋白质折叠和其他功能上协助伴侣分子的蛋白质。辅助伴侣分子是非受辅者结合分子(non-client binding molecule),其协助由Hsp70和Hsp90介导的蛋白质折叠。
酵母细胞中ER伴侣分子包括但不限于例如Kar2p,其是指Hsp70系统或Pdi1p。Kar2p参与蛋白质向ER的易位,与未装配/错误折叠的ER蛋白亚基结合并调节未折叠的蛋白应答(UPR)。Kar2p与其辅助伴侣分子(比如Lhs1p、Sil1p、Erj5p、Sec63p、Scj1p、Jem1p或本领域已知的其它种类)相互作用。Lhs1p和Sil1p是指Kar2p的核苷酸交换因子,并属于Hsp70系统(Chang等,Cell 128(2007))。在本上下文中,术语“核苷酸交换因子”是指一种刺激核苷二磷酸(ADP、GDP)交换(替换)为与其他蛋白质(优选伴侣分子)结合的核苷三磷酸(ATP、GTP)的蛋白质。Erj5p、Sec63和Scj1属于Hsp40型蛋白这一组。例如,Erj5p是具有J结构域的I型膜蛋白;其是保持内质网的折叠能力所需要的;非必需的ERJ5基因的缺失会导致组成型地诱导的未折叠蛋白应答(Mehnert等,Molecular biology of the cell,26(2014))。
可以将取自巴斯德毕赤酵母(Komagataella pastoris或Komagataellaphaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母、黑曲霉,优选地取自巴斯德毕赤酵母(Komagataella pastoris或Komagataellaphaffii)的至少一种ER辅助蛋白用于另外的过表达或用于工程化宿主细胞以另外地过表达。还可以将来自其他真核物种的最接近的同系物用作所述至少一种ER辅助蛋白。
优选地,另外地在所述宿主细胞中过表达的本发明的所述ER辅助蛋白具有SEQ IDNO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列(巴斯德毕赤酵母的Kar2p)具有至少70%,比如至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。优选地,SEQ ID NO:28的功能同系物为SEQ ID NOs:29-36。因此,另外地在所述宿主细胞中过表达的本发明的所述ER辅助蛋白具有SEQ ID NOs:28-36所示的氨基酸序列。优选具有SEQ IDNO:28所示的氨基酸序列的ER辅助蛋白。优选地,所述辅助蛋白与上文所提及的本发明的转录因子不同且与目标蛋白不同。
当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外的ER辅助蛋白的多核苷酸整合在同一载体或质粒中处于同一启动子控制下或处于不同启动子控制下(Msn4p处于一个启动子控制下,而Kar2p处于不同启动子控制下)。当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外的ER辅助蛋白的多核苷酸同时或连续地(一个接一个)整合在不同的载体或质粒中。如果可以将编码至少一种转录因子的多核苷酸和编码另外的ER辅助蛋白的多核苷酸引入不同的载体或质粒,则优选使用仅携带至少一种转录因子的一个质粒和携带用于至少一种另外的ER辅助蛋白的过表达盒的另一质粒。
当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外的ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(一个或多个拷贝的Msn4p处于一个启动子控制下,而一个或多个拷贝的Kar2p处于不同启动子控制下)。当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外的ER辅助蛋白的多核苷酸同时或连续地(一个接一个)整合在不同的载体或质粒中。
据推测,另外的ER辅助蛋白的过表达可确保POI在ER中正确折叠,由此甚至进一步增加POI的产量。
与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白的过表达可以使模型蛋白的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然(同系物)转录因子Msn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p的过表达可以使模型蛋白(优选vHH(SEQ ID NO:14))的产量增加至少40%,比如50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成转录因子synMsn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p的过表达可以使模型蛋白(优选vHH(SEQ ID NO:14))的产量增加至少30%,比如40%、50%、60%、70%、80%、90%、100、120、130、140%、150%、160%、170%、180%、190%、200%、250%、300%、350%、400%或500%。
本发明的方法、重组宿主细胞和用途可进一步包含在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少两种ER辅助蛋白的至少两种多核苷酸。
若本发明提及两种另外的ER辅助蛋白,这意味着“第一ER辅助蛋白”和“第二ER辅助蛋白”。若本发明提及三种另外的ER辅助蛋白,这意味着“第一ER辅助蛋白”、“第二ER辅助蛋白”和“第三ER辅助蛋白”。优选地,与过表达编码至少一种转录因子的至少一种多核苷酸但不进一步过表达编码至少两种ER辅助蛋白的至少两种多核苷酸的宿主细胞相比,通过在所述宿主细胞中进一步过表达编码至少两种ER辅助蛋白的至少两种多核苷酸,所述重组目标蛋白的产量增加。还优选的是,与过表达编码至少一种转录因子的至少一种多核苷酸且过表达编码至少一种另外的ER辅助蛋白的至少一种多核苷酸但不过表达编码至少两种ER辅助蛋白的至少两种多核苷酸的宿主细胞相比,通过在所述宿主细胞中进一步过表达编码至少两种ER辅助蛋白的至少两种多核苷酸,所述重组目标蛋白的产量增加。
优选地,所述第一ER辅助蛋白具有如上所述的SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列(巴斯德毕赤酵母的Kar2p)具有至少70%,比如71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。优选地,在所述转录因子之外另外过表达的作为第一ER辅助蛋白的SEQ ID NO:28的功能同系物为SEQ ID NOs:29-36。因此,在所述宿主细胞中另外过表达的本发明的所述第一ER辅助蛋白具有SEQ ID NOs:28-36所示的氨基酸序列。优选将SEQ ID NO:28用作第一ER辅助蛋白。
优选地,第二ER辅助蛋白具有SEQ ID NO:37所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:37所示的氨基酸序列(巴斯德毕赤酵母的Lhs1p)具有至少25%,比如26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。因此,本发明包含本发明的转录因子与根据SEQ ID NO:28(巴斯德毕赤酵母的Kar2p)的第一辅助蛋白或其功能同系物和根据SEQ ID NO:37(巴斯德毕赤酵母的Lhs1p)的第二辅助蛋白或其功能同系物的组合的过表达。优选地,在所述转录因子和所述第一ER辅助蛋白之外另外过表达的作为第二ER辅助蛋白的SEQ ID NO:37的功能同系物为SEQ ID NOs:38-46。
可以将取自巴斯德毕赤酵母(Komagataella pastoris或Komagataellaphaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母、粟酒裂殖酵母、黑曲霉,优选地取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)的具有SEQ ID NO:37所示的氨基酸序列或其功能同系物的第二ER辅助蛋白用于另外的过表达或用于工程化宿主细胞以另外地过表达。
与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白和所述第二Lhs1p辅助蛋白的过表达可使模型蛋白(优选scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14))的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然转录因子Msn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p和巴斯德毕赤酵母的所述第二辅助蛋白Lhs1p的过表达可使模型蛋白(优选vHH(SEQ ID NO.14))的产量增加至少60%,比如70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成转录因子synMsn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p和巴斯德毕赤酵母的所述第二辅助蛋白Lhs1p的过表达可使模型蛋白(优选scFv(SEQID NO.13))的产量增加至少80%,比如90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。
本发明包含本发明的转录因子与根据SEQ ID NO:28的第一辅助蛋白或其功能同系物和根据SEQ ID NO:47的另一第二ER辅助蛋白或其功能同系物的组合的另一种过表达。
优选地,其它第二ER辅助蛋白具有SEQ ID NO:47所示的氨基酸序列或其同系物,其中所述同系物与SEQ ID NO:47所示的氨基酸序列(巴斯德毕赤酵母的Sil1p)具有至少20%,比如21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。优选地,在所述转录因子和所述第一ER辅助蛋白之外另外过表达的作为其它第二ER辅助蛋白的SEQ ID NO:47的功能同系物为SEQ ID NOs:48-56。
可以将取自巴斯德毕赤酵母(Komagataella pastoris或Komagataellaphaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母,优选地取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)的具有SEQ ID NO:47所示的氨基酸序列或其功能同系物的第二辅助蛋白用于另外的过表达或用于工程化宿主细胞以另外地过表达。还可以将来自其他真核物种的最接近的同系物用作所述至少一种ER辅助蛋白。具有SEQ ID NO:47所示的氨基酸序列或其功能同系物。
与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白以及所述第二Sil1p辅助蛋白的过表达可以使模型蛋白(优选scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14))的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。
当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外两种ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(a)Msn4p处于一个启动子控制下,Kar2p处于不同启动子控制下,而Lhs1p或Sil1p处于另一不同启动子控制下;b)Msn4p和Kar2p处于同一启动子控制下,而Lhs1p或Sil1p处于不同启动子控制下;或c)Msn4p处于一个启动子控制下,而Kar2p和Lhs1p或Sil1p处于另一启动子控制下)。当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外两种ER辅助蛋白的多核苷酸(一个多核苷酸编码第一ER辅助蛋白,另一多核苷酸编码第二ER辅助蛋白)同时或连续地(一个接一个)整合在单独的载体或质粒中(一个载体/质粒包含编码至少一种转录因子的多核苷酸,另一载体/质粒包含编码第一和第二ER辅助蛋白的多核苷酸)。作为实例,如果可以将编码至少一种转录因子的多核苷酸和编码另外至少两种ER辅助蛋白的多核苷酸引入单独的载体或质粒,则可以使用仅携带处于启动子控制下的至少一种转录因子的整合质粒BB3和携带另外两种ER辅助蛋白(比如处于一个启动子控制下的Kar2p和处于另一启动子控制下的Lhs1p或Sil1p)的另一整合质粒BB3。
当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码一个或多个拷贝的至少两种另外的ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(a)一个或多个拷贝的Msn4p处于一个启动子控制下,一个或多个拷贝的Kar2p处于不同启动子控制下,而一个或多个拷贝的Lhs1p或Sil1p处于另一不同启动子控制下;b)一个或多个拷贝的Msn4p和Kar2p处于同一启动子控制下,而一个或多个拷贝的Lhs1p或Sil1p处于不同启动子控制下;或c)一个或多个拷贝的Msn4p处于一个启动子控制下,而一个或多个拷贝的Kar2p和Lhs1p或Sil1p处于另一启动子控制下)。当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将一个或多个拷贝的编码另外两种ER辅助蛋白的多核苷酸(一个多核苷酸编码第一ER辅助蛋白,另一多核苷酸编码第二ER辅助蛋白)同时或连续地(一个接一个)整合在另一不同的载体或质粒中(一个载体/质粒包含编码至少一种转录因子的多核苷酸,另一载体/质粒包含编码第一和第二ER辅助蛋白的多核苷酸)。
两种另外的ER辅助蛋白(Kar2p和Lhs1p或Kar2p和Sil1p)的过表达可确保POI在ER中正确折叠,由此甚至进一步增加POI的产量/效价。在该实施方案中,当折叠POI时,所述第二辅助蛋白(如Lhs1p或Sil1p)可以作为辅助伴侣分子与第一ER辅助蛋白(比如Kar2p)相互作用。
通过本领域技术人员已知的任何手段实现所述另外的ER辅助蛋白(比如Kar2p、Lhs1p或Sil1p)的过表达或工程化所述宿主细胞以过表达另外的ER辅助蛋白(比如Kar2p、Lhs1p或Sil1p),正如本文之前针对本发明的同源转录因子或针对本发明的异源转录因子所描述的。
本发明包含本发明的转录因子与根据SEQ ID NO:28的第一ER辅助蛋白或其功能同系物和根据SEQ ID NO:37/SEQ ID NO:47的另一第二ER辅助蛋白或其功能同系物和可选地根据SEQ ID NO:55的第三ER辅助蛋白或其功能同系物的组合的另一种过表达。
优选地,所述第三ER辅助蛋白具有SEQ ID NO:55所示的氨基酸序列或其功能同系物,其中所述同系物与SEQ ID NO:55所示的氨基酸序列(巴斯德毕赤酵母的Erj5p)具有至少25%,比如26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。优选地,在所述转录因子、所述第一ER辅助蛋白和所述第二ER辅助蛋白之外另外过表达的第三ER辅助蛋白SEQ ID NO:55的功能同系物为SEQ IDNOs:56-64。
具有SEQ ID NO:55所示的氨基酸序列的第三ER辅助蛋白或其功能同系物取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母、粟酒裂殖酵母、黑曲霉,优选地取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)。
当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码另外三种ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下。当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码另外三种ER辅助蛋白的多核苷酸(一个多核苷酸编码第一ER辅助蛋白,另一多核苷酸编码第二ER辅助蛋白和再一多核苷酸编码第三ER辅助蛋白)同时或连续地(一个接一个)整合在另一不同的载体或质粒中(一个载体/质粒包含编码至少一种转录因子的多核苷酸,另一载体/质粒包含编码第一、第二和第三ER辅助蛋白的多核苷酸)。示例性地,如果可以将编码至少一种转录因子的多核苷酸和编码另外三种ER辅助蛋白的多核苷酸引入不同的载体或质粒,则可以使用仅携带处于启动子控制下的至少一种转录因子的整合质粒BB3和携带另外三种ER辅助蛋白(比如处于一个启动子控制下的Kar2p和处于另一启动子控制下的Lhs1p或Sil1p和处于再另一启动子控制下的Erj5p)的另一整合质粒BB3。
当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码一个或多个拷贝的另外三种ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下。当通过载体或质粒引入处于启动子控制下的一个或多个拷贝的编码至少一种(同源或异源)转录因子的多核苷酸时,则将一个或多个拷贝的编码另外三种ER辅助蛋白的多核苷酸(一个多核苷酸编码第一ER辅助蛋白,另一多核苷酸编码第二ER辅助蛋白和再一多核苷酸编码第三ER辅助蛋白)同时或连续地(一个接一个)整合在另一不同的载体或质粒中(一个载体/质粒包含编码至少一种转录因子的多核苷酸,另一载体/质粒包含编码第一、第二和第三ER辅助蛋白的多核苷酸)。
与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白和所述第二Lhs1p辅助蛋白和所述第三Erj5p辅助蛋白的过表达可以使模型蛋白(优选scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14))的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然转录因子Msn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p和巴斯德毕赤酵母的所述第二ER辅助蛋白Lhs1p和巴斯德毕赤酵母的所述第三ER辅助蛋白Erj5p的过表达可以使模型蛋白(优选vHH(SEQ ID NO.14))的产量增加至少110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成转录因子synMsn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p和巴斯德毕赤酵母的所述第二ER辅助蛋白Lhs1p和巴斯德毕赤酵母的所述第三ER辅助蛋白Erj5p的过表达可以使模型蛋白(优选vHH(SEQ ID NO.14))的产量增加至少70%,比如80%、90%、100%、110%、120%、130%、140%、150%、160、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。
与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白和所述第二Lhs1p辅助蛋白和所述第三Erj5p辅助蛋白的过表达可以使模型蛋白scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。
本发明的方法、重组宿主细胞和用途可进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码一种另外的转录因子的至少一种多核苷酸。因此,所述宿主细胞过表达编码本发明的至少一种转录因子的至少一种多核苷酸和编码一种另外的转录因子的至少一种多核苷酸。优选地,与过表达编码至少一种转录因子的至少一种多核苷酸但不过表达编码至少一种另外的转录因子的至少一种多核苷酸的宿主细胞相比,通过在所述宿主细胞中进一步过表达编码至少一种另外的转录因子的至少一种多核苷酸,所述重组目标蛋白的产量增加。
另外的转录因子最初是从巴斯德毕赤酵母(Komagataella phaffi)CBS7435菌株(CBS-KNAW菌种保藏)中分离的。设想转录因子可以在广泛的宿主细胞中过表达。因此,转录因子序列可以取自或衍生自其它原核生物或真核生物,而不是采用种或属的天然序列,优选地,将取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母和黑曲霉的转录因子用于另外的过表达或用于工程化宿主细胞以另外地过表达。
在本发明中,另外的Hac1转录因子是指包含DNA结合结构域的SEQ ID NO:74-82,所述DNA结合结构域包含SEQ ID NO:65所示的氨基酸序列或SEQ ID NO:65所示的氨基酸序列的功能同系物以及任何激活结构域(合成的、病毒的或如本文其他地方所述的任何物种的另外的转录因子的激活结构域),所述功能同系物与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性。根据技术人员的知识可以实施和可以以任何顺序实施本文所述的另外的它转录因子的所述DNA结合结构域和任何激活结构域的排布。
优选地,另外的转录因子至少包含DNA结合结构域和激活结构域,其中所述DNA结合结构域包含SEQ ID NO:65所示的氨基酸序列(巴斯德毕赤酵母的Hac1p的DNA结合结构域)。
优选地,所述另外的转录因子至少包含DNA结合结构域和激活结构域,其中所述DNA结合结构域包含SEQ ID NO:65所示的氨基酸序列的功能同系物,所述功能同系物与SEQID NO:65所示的氨基酸序列具有至少50%,比如至少51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。
优选地,与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性的SEQ IDNO:65所示的氨基酸序列的功能同系物为SEQ ID NOs:66-73。
因此,本发明的方法、重组宿主细胞和用途可进一步包括过表达另外的转录因子,所述另外的转录因子包含至少一种含有SEQ ID NOs:65-73所示的氨基酸序列的DNA结合结构域和激活结构域。
HAC1编码参与未折叠蛋白应答的碱性亮氨酸拉链(bZIP)家族的转录因子(Mori K等,Genes Cells 1(9):803-17,1996,和Cox JS和Water P,Cell87(3):391-404,1996)。热应激、药物处理、分泌蛋白中的突变或野生型分泌蛋白的过表达可以导致未折叠蛋白在ER中聚积,从而触发未折叠蛋白应答(UPR)。HAC1在正常生长条件下不是必需的,但在触发UPR的条件下是必需的。Hac1p与UPR调控的基因(如KAR2、PDI1、EUG1、FKB2)的启动子中被称为UPR元件(UPRE)的DNA序列结合。Hac1p的丰度由HAC1 mRNA的剪切调控。与未剪切的转录本相比,剪切的HAC1 mRNA的翻译效率更高。Hac1p诱导编码ER伴侣分子(如Kar2p)的基因的转录,例如参与UPR。UPR的关键特征是增加了编码可溶性ER驻留蛋白(包括例如ER伴侣分子)的基因的转录。此外,Hac1p增加了蛋白质折叠所需的ER驻留蛋白的合成。
当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码另外的转录因子的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(Msn4p处于一个启动子控制下的,Hac1p处于不同启动子控制下)。若可以将编码至少一种转录因子的多核苷酸和编码另外的转录因子的多核苷酸引入同一载体或质粒,则优选使用整合质粒BB3,其中编码至少一种转录因子的多核苷酸处于一个启动子控制下,而编码至少一种另外的转录因子的多核苷酸处于不同启动子控制下。当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码另外的转录因子的多核苷酸同时或连续地(一个接一个)整合在不同的载体或质粒中。作为实例,若可以将编码至少一种转录因子的多核苷酸和编码另外的转录因子的多核苷酸引入不同的载体或质粒中,则可以使用仅携带至少一种转录因子的整合质粒BB3和仅携带至少一种另外的转录因子的另一整合质粒BB3。
当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将一个或多个拷贝的编码另外的转录因子的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(一个或多个拷贝的Msn4p处于一个启动子控制下,一个或多个拷贝的Hac1p处于不同启动子控制下)。当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将一个或多个拷贝的编码另外的转录因子的多核苷酸同时或连续地(一个接一个)整合在不同的载体或质粒中。
另外的转录因子的过表达可导致ER伴侣分子(例如作为UPR的关键特征的Kar2p)的过表达,由此甚至进一步增加POI的产量。
与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述Hac1p另外的转录因子的过表达可以使模型蛋白scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然转录因子Msn4p和巴斯德毕赤酵母的所述Hac1p另外的转录因子的过表达可以使模型蛋白(优选vHH(SEQ ID NO:14))的产量增加至少60%,比如70%、80%、90%、100%、110%、120%、130%、140%、150、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成的转录因子synMsn4p和巴斯德毕赤酵母的所述Hac1p另外的转录因子的过表达可以使模型蛋白(优选vHH(SEQ ID NO:14))的产量增加至少80%,比如90%、100%、110%、120%、130%、140%、150、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。
所述编码至少一种另外的转录因子的至少一种多核苷酸编码异源或同源另外的转录因子。如上文针对本发明的同源转录因子或针对本发明的异源转录因子所讨论的实现所述另外的转录因子(Hac1p)的过表达或工程化宿主细胞以过表达所述另外的转录因子(Hac1p)。
在本发明的方法、重组宿主细胞和用途中使用的另外的转录因子可包含SEQ IDNOs:74-82所示的氨基酸序列或SEQ ID NO:74所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:74所示的氨基酸序列具有至少20%的序列同一性。在进一步的实施方案中,在本发明的方法、重组宿主细胞和用途中使用的另外的转录因子可包含SEQ ID NOs:74-82所示的氨基酸序列或SEQ ID NO:74所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:74所示的氨基酸序列具有至少20%,比如25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或甚至100%的序列同一性。所述另外的转录因子可另外地包含核定位信号(NLS)。
本发明进一步设想一种增加真核宿主细胞的重组目标蛋白的分泌的方法,所述方法包括在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加,其中所述转录因子至少包含含有SEQ ID NO:1所示的氨基酸序列的DNA结合结构域和激活结构域。
此外,本发明进一步设想一种增加真核宿主细胞的重组目标蛋白的分泌的方法,所述方法包括在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加,其中所述转录因子至少包含含有SEQ ID NO:1所示的氨基酸序列的功能同系物的DNA结合结构域和激活结构域,所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性。
本发明还提供一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸。
优选地,本发明提供一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,其中所述转录因子至少包含DNA结合结构域和激活结构域,其中所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸序列。
此外,本发明提供一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,其中所述转录因子至少包含含有SEQ ID NO:1所示的氨基酸序列的功能同系物的DNA结合结构域和激活结构域,所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQID NO:87所示的氨基酸序列具有至少60%的序列同一性。
“重组细胞”或“重组宿主细胞”是指这样一种细胞或宿主细胞,所述细胞或宿主细胞已经被遗传改变从而包含了对所述细胞而言为非天然的核酸序列。
本发明进一步涵盖所述重组真核宿主细胞用于制备重组目标蛋白的用途。可将宿主细胞有利地用于引入编码一个或多个POI的多肽,并随后可在合适的条件下培养以表达POI。
实施例
提出下述实施例以向本领域普通技术人员提供如何制备和使用本发明的完整公开和描述,并且下述实施例不是要限制被认为是本发明的且权利要求中限定的内容的范围。已经尝试保证所使用的数字(例如量、温度、浓度等)的准确性,但应该允许一些实验误差和偏差。除非另外说明,份是重量份,分子量是平均分子量,温度是摄氏度,并且压力是大气压或接近大气压。
以下实施例将证明,基于它/它们的过表达,新鉴定的辅助蛋白分别增加了重组蛋白的效价(以mg/L表示的每体积的产物)和产量(以mg/g生物质表示的每生物质的产物,生物质以干细胞重量或湿细胞重量来度量)。作为实例,在巴斯德毕赤酵母中重组抗体单链可变片段(scFv,vHH)的产量增加。在振荡培养(在摇瓶或深孔板中进行)和实验室规模的分批进料培养中显示出了积极作用。
实施例1:分泌抗体片段scFv&vHH的巴斯德毕赤酵母菌株的构建和选择
将巴斯德毕赤酵母CBS7435muts变体(由Sturmberger等,2016对其基因组测序)用作宿主菌株。pPM2d_pGAP和pPM2d_pAOX表达载体是WO2008/128701A2中描述的pPuzzle_ZeoR质粒骨架的衍生物,其包含pUC19细菌复制起点和博来霉素(Zeocin)抗生素抗性盒。异源基因的表达分别由巴斯德毕赤酵母甘油醛-3-磷酸脱氢酶(GAP)启动子或醇氧化酶(AOX)启动子和酿酒酵母CYC1转录终止子介导。所述质粒已经含有N-末端酿酒酵母α交配因子pre-pro前导序列。将scFv和vHH的基因通过DNA2.0进行密码子优化并以合成DNA获得。将His6-标签C-末端地融合至所述基因用于检测。在用XhoI和BamHI(针对scR)或EcoRV(针对vHH)的限制性消化后,将每个基因连接至用XhoI和BamHI或EcoRV消化的质粒pPM2d_pGAP和pPM2d_pAOX。
在电穿孔(采用描述于Gasser等,2013.Future Microbiol.8(2):191-208中的标准的转化方案)至巴斯德毕赤酵母中之前,分别采用AvrII限制性酶(针对pPM2d_pGAP)或PmeI限制性酶(针对pPM2d_pAOX)将质粒线性化。在含有100μg/mL博来霉素(Zeocin)的YPD板(每升:10g酵母提取物、20g蛋白胨、20g葡萄糖、20g琼脂-琼脂)上实施阳性转化体的筛选。
将全部转化方法的单一菌落(总共~120)自转化板中挑选至96-深孔板的单个孔中。在初始生长阶段产生生物质后,通过补充含甲醇的培养基制剂(总共4次)来诱导始自AOX1启动子的表达。从第一次甲醇诱导开始72小时后,将所有深孔板离心,并将所有孔的上清液收集到储备(stock)微量滴定板中以待后续分析。在初始生长阶段后的指定时间点(即每天两次,共2天)补充葡萄糖,以继续始自GAP启动子的表达。从初始接种开始总共经过110小时后,如上所述收获培养物。
将在小规模筛选(实施例3)和分批进料培养(实施例4)中具有最高生产能力的克隆选为基础生产菌株以用于进一步的工程化。将克隆CBS7435 mutS pAOX scR 4E3选做scFv分泌的基础生产菌株。将克隆CBS7435 mutS pAOX vHH 14G8选做vHH分泌的基础生产菌株。
实施例2:过表达辅助基因的工程化菌株的产生
为了研究对scFv和vHH分泌的阳性作用,在两个基础生产菌株:CBS7435 mutSpAOX scR(scFv)4E3和CBS7435 mutS pAOX vHH(vHH)14G8(它们的产生参见实施例1)中过表达推定的辅助基因。
a)所选择的潜在分泌辅助基因的扩增和克隆的一般方案
将选择用于过表达的基因通过PCR(
Figure BDA0002953325880000721
High-Fidelity DNA Polymerase,NewEngland Biolabs)从起始密码子到终止密码子扩增,或将其分成两个若干片段。GoldenPiCS系统(Prielhofer等,2017.BMC Systems Biol.doi:10.1186/s12918-017-0492-3)需要在某些编码序列中引入沉默突变。这通过从一个编码序列中扩增若干片段来完成。可选地,可以从商业供应商(包括Integrated DNA Technology IDT,Geneart和ATUM)处获得gBlocks或合成的密码子优化的基因。可以将扩增的编码序列克隆至基于pPUZZLE的表达质粒pPM2aK21或pPM2eH21,或GoldenPiCS系统(由骨架BB1、BB2和BB3aK/BB3eH/BB3rN组成)。通过使用限制性酶BsaI将表1所列的基因片段引入GoldenPiCS系统的BB1中。在Prielhofer等,2017.(BMC Systems Biol.doi:10.1186/s12918-017-0492-3)中描述了用于在BB2或BB3骨架中组装表达盒的所有启动子和终止子。pPM2aK21和BB3aK允许向3′-AOX1基因组区域的整合并含有用于在大肠杆菌和酵母中进行选择的KanMX选择标记盒。pPM2eH21和BB3eH含有5′-ENO1基因组整合区域和用于在潮霉素上选择的HphMX选择标记盒。BB3rN含有5′-RGI1基因组整合区域和用于在诺尔丝菌素上选择的NatMX选择标记盒。全部质粒均含有大肠杆菌复制的起点(pUC19)。将来自巴斯德毕赤酵母菌株CBS7435 mutS或gBlocks(Integrated DNA Technologies)的基因组DNA用作PCR模板。
表1列出了使用限制性酶BsaI将其引入GoldenPiCS系统的BB1所需的基因片段。然后如Prielhofer等,2017所述,可以将携带各自编码序列的组装的BB1进一步在GoldenPiCS系统中进行处理以创建所需的BB3整合质粒。带下划线的核苷酸标记了创建GoldenPiCS兼容基因片段所需的第一个正向和最后一个反向引物,起始密码子和终止密码子用粗体标记。
Figure BDA0002953325880000731
Figure BDA0002953325880000741
Figure BDA0002953325880000751
Figure BDA0002953325880000761
Figure BDA0002953325880000771
Figure BDA0002953325880000781
Figure BDA0002953325880000791
Figure BDA0002953325880000801
Figure BDA0002953325880000811
Figure BDA0002953325880000821
Figure BDA0002953325880000831
Figure BDA0002953325880000841
b)创建天然的和合成的MSN4过表达菌株
将一个沉默突变引入巴斯德毕赤酵母MSN4的天然编码序列中以移除BsaI限制性位点。将该编码序列引入GoldenPiCS系统的BB1。通过将转录激活结构域(VP64)和核定位(SV40)序列与来自核苷酸编号883至1071的MSN4的天然DNA结合结构域融合来装配合成的MSN4编码序列。通过与Nicholls等,2004(Eukaryot Cell.doi:10.1128/EC.3.5.1111–1123.2004)公开的氨基酸序列的序列同源性来识别DNA结合结构域。将该合成的编码序列(synMSN4)引入GoldenPiCS系统的BB1。分别从酿酒酵母CEN.PK、黑曲霉CBS513.88和解脂耶氏酵母DSMZ的基因组DNA扩增酿酒酵母MSN2、酿酒酵母MSN4、黑曲霉MSN4同系物Seb1和解脂耶氏酵母MSN4同系物,并将它们引入BB1中。
将每个MSN4编码序列与甘油醛-3-磷酸脱氢酶(GAP)启动子和酿酒酵母CYC1转录终止子组合到整合质粒BB3rN中(如针对天然巴斯德毕赤酵母MSN4的189_BB3rN或142_BB3eH)。还将巴斯德毕赤酵母MSN4与THI11启动子和IDP1终止子(253_BB3eH)或POR1启动子和IDP1终止子(254_BB3eH)组合。另外地将synMSN4编码序列与THI11启动子(Landes等,2016.Biotechnol Bioeng.doi:10.1002/bit.26041)和IDP1转录终止子(258_BB3eH)或SBH17启动子和TDH3终止子(191_BB3aK)组合。还将synMSN4编码序列与GAP启动子和TDH3转录终止子组合至整合质粒208_BB3aK中。在将整合质粒用于转化基础生产菌株之前,采用AscI限制性酶将全部质粒线性化。在小规模筛选中确定过表达MSN4或合成MSN4的克隆的效价和产量(每湿细胞重量的效价)并将其与亲本基础生产菌株比较(实施例3)。
c)创建(合成的)MSN4+KAR2过表达菌株
将仅含有KAR2的过表达盒装配在整合质粒BB3eH(219_BB3eH)中。该质粒源自将BB1质粒与KAR2编码序列和GAP启动子以及RPS3终止子组合。
在用实施例2b的相应质粒转化,并进一步用SmaI线性化的KAR2整合质粒219_BB3eH转化后,根据在小规模筛选(实施例3)中确定的产物产量来选择过表达MSN4或合成MSN4的最佳克隆。最终产生了具有两个不同的过表达盒的克隆,所述两个过表达盒是通过用两个不同的整合质粒进行两个顺序转化而引入的。
d)创建(合成的)MSN4+HAC1(i)过表达菌株
通过移除根据Guerfal等2010(Microb Cell Fact.doi:10.1186/1475-2859-9-49)的自核苷酸编号857至1178的可选的内含子来创建HAC1(i)编码序列的诱导(i)形式。将该编码序列引入BB1。另外地将密码子优化的HAC1(i)序列用于Hac1(i)的过表达。进一步将其与启动子FDH1和终止子RPL2A组合在BB2质粒中。其它BB2构建体包含在MDH3启动子和RPL2A终止子,或ADH2启动子和RPL2A终止子控制下的HAC1。
通过将实施例2d的BB2与含有MSN4表达盒的BB2质粒(实施例2b)组合来创建处于不用启动子控制下的携带MSN4+HAC1(i)组合的整合质粒243_BB3eH、253_BB3eH、254_BB3eH和257_BB3eH。通过采用仅携带MSN4(189_BB3rN)的整合质粒BB3rN与具有FDH1启动子和RPL2A终止子的仅携带HAC1(i)的整合质粒BB3eH(234_BB3eH)顺序转化来产生相同的组合。对于在整合质粒(258_BB3eH)中携带synMSN4+HAC1(i)组合的质粒,将实施例2d的BB2与这样一种BB2质粒组合,该种BB2质粒衍生自与THI11启动子和IDP1转录终止子组合的具有synMSN4的BB1质粒(实施例2b)。在将其用于转化基础生产菌株之前,用限制性酶SmaI将两个整合质粒线性化。
e)创建(合成的)MSN4+KAR2和/或LHS1、(合成的)MSN4+KAR2和/或SIL、(合成的)MSN4+KAR2+LHS1或SIL1和ERJ5过表达菌株
将KAR2(需要7个沉默突变)、LHS1(需要1个沉默突变)、SIL1(无突变)和ERJ5(需要1个沉默突变)的编码序列引入GoldenPiCS系统的BB1中。整合质粒219_BB3eH含有具有GAP启动子和RPS3转录终止子的KAR2。将KAR2与LHS1组合的过表达装配在整合质粒174_BB3eH中,该整合质粒衍生自两个BB2;一个BB2含有具有GAP启动子和RPS3转录终止子的KAR2,和另一个BB2含有具有POR1启动子和IDP1转录终止子的LHS1。将KAR2与SIL1组合的过表达装配在整合质粒078_BB3eH中,该整合质粒衍生自两个BB2;一个BB2含有具有GAP启动子和RPS3转录终止子的KAR2,和另一个BB2含有具有POR1启动子和IDP1转录终止子的SIL1。将KAR2与LHS1和ERJ5组合的过表达装配在整合质粒052_BB3eH中,该整合质粒衍生自三个BB2;第一个BB2含有具有GAP启动子和酿酒酵母CYC1转录终止子的KAR2,第二个BB2含有具有POR1启动子和IDP1转录终止子的LHS1,和第三个BB2含有具有MDH3启动子和TDH1转录终止子的ERJ5。
在用实施例2b的相应质粒转化,并进一步用上文提及的相应SmaI线性化的BB3eH整合质粒转化后,根据在小规模筛选(实施例3)中确定的产量(每生物质的效价)来选择最佳克隆。最终产生了具有两个不同的过表达盒的克隆,所述两个过表达盒是通过用两个不同的整合质粒进行两个顺序转化而引入的。
实施例3:筛选增加的scFv或vHH分泌
在小规模筛选中,在转化后测试每个过表达组合的多达20个转化体。通过比较上清液中转化体的scFv或vHH效价、其湿细胞重量(离心且移除上清液后的生物质)以及其scFv或vHH产量(每湿细胞重量的效价)与相应亲本基础生产菌株的上述参数来评估转化体。对于每个过表达组合,确定效价、产量和湿细胞重量的平均倍数改变以评估分泌的改善。通过如下计算效价、产量和湿细胞重量的平均倍数改变:用全部转化体的效价、产量和湿细胞重量的算数平均值除以在同一深孔板上培养的基础生产菌株的四个生物重复的效价、产量和湿细胞重量的算数平均值。
a)scFv或vHH生产菌株的小规模筛选培养
将巴斯德毕赤酵母克隆的单一菌落接种于2mL含有10g/L葡萄糖和50μg/mL博来霉素(Zeocin),或50μg/mL博来霉素和500μg/mL G418和/或200μg/mL潮霉素和/或100μg/mL诺尔丝菌素(根据工程化菌株的整合质粒确定)的YP-培养基(10g/L酵母提取物,20g/L蛋白胨),并在25℃下生长过夜。将这些培养物转移到2mL补充有葡萄糖饲料片(Kuhner,Switzerland;CAT#SMFB63319)或x%的酶(m2p培养基发展试剂盒)的合成筛选培养基M2或ASMv6(在下面给出培养基的组成)中,并于25℃下以280rpm在24深孔板中温育1至25小时。将这些培养物的等分试样(对应于终OD600为4或8)转移至2mL合成筛选培养基M2或ASMv6中(在具有m2p培养基发展试剂盒的ASMv6的情况下,其在新鲜的24深孔板中)。首先添加0.5vol%的纯甲醇,并在19小时、27小时和43小时后重复添加1vol%的纯甲醇。48小时后,在室温下以2500xg离心10分钟而收获细胞并准备用于分析。通过测量1mL细胞悬浮液的细胞重量来测定生物质,而在上清液中重组分泌蛋白的测定在以下实施例3b-3c中描述。
每升合成筛选培养基M2含有:22.0g柠檬酸一水合物、3.15g(NH4)2HPO4、0.49gMgSO4*7H2O、0.80g KCl、0.0268g CaCl2*2H2O、1.47mL PTM1痕量金属、4mg生物素;用KOH(固体)将pH设定至5。
每升合成筛选培养基ASMv6含有:44.0g柠檬酸一水合物、12.60g(NH4)2HPO4、0.98gMgSO4*7H2O、5.28g KCl、0.1070g CaCl2*2H2O、2.94mL PTM1痕量金属、8mg生物素;用KOH(固体)将pH设定至6.5。
b)SDS-PAGE&蛋白质印迹分析
采用
Figure BDA0002953325880000871
Bis-Tris系统进行蛋白质凝胶分析,其使用12%Bis-Tris凝胶和MOPS运行缓冲液或4-12%Bis-Tris凝胶和MES运行缓冲液(均来自Invitrogen)。电泳后,蛋白质或是通过胶体考马斯染色而显色,或是被转移至硝酸纤维素膜用于蛋白质印迹分析。因此,采用连同立即可用的膜和滤纸以及微型凝胶程序Turbo(7分钟)的BioradTrans-
Figure BDA0002953325880000872
转移系统,将蛋白质电印迹到硝酸纤维素膜上。在封闭后,用以下抗体探测蛋白质印迹:采用以下抗体检测His-标记的scFv和vHH:抗-聚组氨酸-过氧化物酶抗体(A7058,Sigma),以1:2,000稀释。
采用化学发光Super Signal West Chemiluminescent Substrate(ThermoScientific)进行HRP缀合物的检测。
c)通过微流体毛细管电泳(mCE)进行定量
将‘LabChip GX/GXII System’(PerkinElmer)用于培养上清液中分泌的蛋白效价的定量分析。使用消耗品‘Protein Express Lab Chip’(760499,PerkinElmer)和‘ProteinExpress Reagent Kit’(CLS960008,PerkinElmer)。简言之,使用基于微流体的电泳系统,对所有培养上清液的若干μL进行荧光标记,并根据蛋白质大小进行分析。内标物使得能够以kDa为单位进行大小的大致分配,以及大致估计检测到的信号的浓度。
实施例4:分批进料培养
在小规模筛选培养(实施例3)后,选择工程化菌株的克隆(实施例2)。通过分批进料生物反应器培养以更大的培养体积进一步评估选择的克隆。验证了小规模筛选中的分泌改善,这种改善也出现在分批进料生物反应器培养中。
a)分批进料生物反应器培养的方案
将相应的菌株接种到装有50mL YPhyG的宽颈、带挡板(baffled)、有盖的300mL振荡摇瓶中,并在28℃下以110rpm振荡过夜(预培养物1)。从预培养物1中以OD600(在600nm处测量的光密度)在下午晚些时候(倍增时间:约2小时)达到约20(针对YPhyG培养基测量)的方式接种预培养物2(宽颈、带挡板、有盖的1000mL振荡摇瓶中的100mL YPhyG)。预培养物2的温育也在28℃,110rpm下进行。
分批进料在0.8L工作体积的生物反应器(Minifors,Infors,Switzerland)中进行。将所有生物反应器(装有400mL pH约为5.5的BSM-培养基)从预培养物2分别接种至OD600为2.0。一般而言,巴斯德毕赤酵母在甘油上生长以产生生物质,并且所述培养物随后经受甘油进料,随后是甲醇进料。
在初始分批阶段,将温度设定为28℃。在开始生产阶段之前的最后一小时期间,将其降至24℃并在整个剩余过程中保持在该水平,同时pH降至5.0并保持在该水平。将整个过程(级联控制:搅拌器,流量,氧补充)的氧饱和度设定为30%。以700至1200rpm施加搅拌并选择1.0-2.0L/min的流量范围(空气)。使用25%铵实现pH为5.0的控制。根据需要通过加入消泡剂Glanapon 2000控制发泡。
在分批阶段,生成生物质(μ~0.30/h)直至约110-120g/L的湿细胞重量(WCW)。经典的分批阶段(生物质产生)将持续约14小时。以由方程2.6+0.3*t(g/h)定义的速率进行甘油进料,因此在8小时内补充了总共30g甘油(60%)。第一个取样点选为20小时(0小时诱导时间)。
在接下来的18个小时(从过程时间20至38小时),使用甘油/甲醇混合进料:以由方程2.5+0.13*t(g/h)定义的甘油进料速度,提供66g甘油(60%),和以由方程0.72+0.05*t(g/h)定义的甲醇进料速度,添加21g甲醇。
在接下来的72-74小时(从过程时间38至110-112小时),以由方程2.2+0.016*t(g/L)定义的进料速度进料甲醇。
YphyG预培养基(每升)含有:20g植物蛋白胨-蛋白胨,10g Bacto-酵母提取物,20g甘油
分批培养基:修饰的基础盐培养基(BSM)(每升)含有:13.5mL H3PO4(85%)、0.5gCaCl·2H2O、7.5g MgSO4·7H2O、9g K2SO4、2g KOH、40g甘油、0.25g NaCl、4.35mL PTM1、0.1mL Glanapon 2000(消泡剂)
PTM1痕量元素(每升)含有:0.2g生物素、6.0g CuSO4·5H2O、0.09g KI、3.00gMnSO4·H2O、0.2g Na2MoO4·2H2O、0.02g H3BO3、0.5g CoCl2、42.2g ZnSO4·7H2O、65.0gFeSO4·7H2O和5.0mL H2SO4(95%-98%)。
进料-溶液甘油(每kg)含有:600g甘油、12mL PTM1
进料-溶液甲醇含有:纯甲醇。
b)分批进料生物反应器培养的样品分析
采用以下程序,在多个时间点取样:将取样的培养液(broth)(用注射器)的第一个3mL弃去。将1mL的新鲜采集样品(3-5mL)转移至1.5mL离心管中,并在13,200rpm(16,100g)下旋转5分钟。将上清液迅速转移至一个单独的小瓶中并储存在4℃下或冷冻直至分析。
将1mL的培养液在去皮的Eppendorf小瓶中以13,200rpm(16,100g)离心5分钟,然后将所得的上清液准确地移除。将小瓶称重(精确度0.1mg),并减去空瓶的皮重以获得湿细胞重量。
采用针对BSA或纯化标准材料(scR-GG-6xHIS和vHH-GG-6xHIS)的mCE(微流体毛细管电泳,GXII,Perkin-Elmer)分析每个生物反应器培养的各个采样点的上清液。
实施例5:通过过表达转录因子和辅助基因改善重组蛋白生产和分泌
参照相应未工程化的基础生产菌株(实施例1),通过效价和产量倍数改变值衡量分泌改善。
a)通过单独过表达转录因子或过表达与辅助基因的组合的转录因子来改善vHH蛋白分泌产量-结果来自小规模筛选
图1列出了在小规模筛选(实施例3)中,增加巴斯德毕赤酵母中vHH分泌的过表达的基因或基因组合。小规模筛选的倍数改变值为高达20个克隆/转化体的算数平均值(参见实施例3)。
通过转录因子Msn4的过表达使vHH的分泌增加(图1)。天然和合成的Msn4变体均可使vHH的效价和产量增加至相似水平。出乎意料的是,单独伴侣分子Kar2或与辅助伴侣分子Lhs1组合的伴侣分子Kar2的过表达未增加vHH分泌。仅当它们与转录因子Msn4或synMsn4共过表达时,才观察到vHH效价和产量增加。Hsp40蛋白(例如Erj5)的进一步共表达导致vHH分泌的进一步增加。
Msn4或synMsn4与Hac1的共表达也导致vHH分泌增强,并且超过单个Hac1的过表达。由此,无论两个转录因子是从同一载体表达还是从两个单独的载体表达,均独立获得相似的增强水平。此外,当将不同的启动子对用于两种转录因子的表达时,也没有显著差异。
b)通过单独过表达转录因子或过表达与辅助基因组合的转录因子来改善vHH蛋白分泌产量-结果来自分批进料生物反应器培养
图2列出了在分批进料培养(实施例4)中,增加巴斯德毕赤酵母中vHH分泌的过表达的基因或基因组合。分批进料培养的倍数改变值为单个选择的克隆的倍数改变值。
在筛选中观察到的过表达转录Msn4对重组蛋白生产的积极影响也被受控的生物反应器培养证实(图2)。与筛选中一样,Msn4或synMsn4与伴侣分子或其他转录因子的组合过表达显著超过了仅过表达后者因子的菌株的性能。关于对vHH分泌的有益效果,在天然和合成形式的Msn4的过表达之间未见明显差异。
c)通过单独过表达转录因子或过表达与辅助基因的组合的转录因子来改善scFv蛋白分泌产量-结果来自小规模筛选
图3列出了在小规模筛选(实施例3)中,增加巴斯德毕赤酵母中scFv分泌的过表达的基因或基因组合。小规模筛选的倍数改变值为高达20个克隆/转化体的算数平均值(参见实施例3)。
Msn4的过表达也增强了scFv的分泌水平,scFv代表了另一模型POI(图3)。与对于vHH一样,通过将Msn4或synMsn4过表达与伴侣分子(如单独的Kar2或与Lhs1组合的Kar2)的过表达组合使得分泌产量和效价进一步增强,并超过了由Kar2和Lhs1过表达但无Msn4获得的改善。Msn4或synMsn4与Hac1过表达的组合也对scFv分泌产生阳性作用。
d)通过单独过表达转录因子或过表达与辅助基因的组合的转录因子来改善scFv蛋白分泌产量-结果来自分批进料生物反应器培养。
图4列出了在分批进料培养(实施例4)中,增加巴斯德毕赤酵母中vHH分泌的过表达的基因或基因组合。分批进料培养的倍数改变值为单个选择的克隆的倍数改变值。
同样对于第二种重组模型蛋白,在受控的类似过程的生物反应器条件下证实了在筛选中获得的结果(图4)。与野生型生产菌株(亲本)相比,单独的Msn4的过表达改善了scFv效价和产量。与单独的伴侣分子或单独的Hac1的过表达相比,Msn4与伴侣分子或其他转录因子(比如Hac1)的共过表达刺激了scFv分泌。
e)在分批进料生物反应器培养中通过过表达来自其它物种的MSN2/4同系物来改善scFv分泌(效价和产量)
图5列出了在分批进料培养(实施例4)中,增加巴斯德毕赤酵母中scFv分泌的过表达的MSN2/4同系物。分批进料培养的倍数改变值为单个选择的克隆的倍数改变值。
来自酿酒酵母的两个Msn4同系物的过表达对scFv分泌具有阳性作用(图5),这证实了来自其他物种的同系物也对巴斯德毕赤酵母中的蛋白分泌具有阳性作用。结合来自天然Msn4巴斯德毕赤酵母和合成Msn4变体的结果,这也表明靶向的Msn4过表达在其他生产宿主中保持了改善重组蛋白产量的作用,并强调了我们方法的广泛适用性。
实施例6:MSN4与PpMSN4的比对和序列同一性
由于酿酒酵母是真核细胞最重要的模型生物,因此MSN2/4的功能知识来源于酿酒酵母。在这种情况下,值得一提的是酿酒酵母经历了全基因组复制(WGD)。这导致酿酒酵母的基因组中具有许多基因的非常相似的拷贝。冗余的转录因子Msn2p和Msn4p就是这种情况。由于这种功能冗余,这些转录因子通常被称为MSN2/4。其他酵母的蛋白质的功能描述来自模型生物酿酒酵母的实验。例如,巴斯德毕赤酵母没有进行WGD,因此仅有一个同系物Msn4p。因为酿酒酵母中Msn2p和Msn4p之间基本上没有功能上的区别,因此在其他酵母中无法合理区分这些转录因子。
采用软件CLC Main Workbench(QIAGEN Bioinformatics)进行比对,且该比对可见于图6。图6的虚线框高亮显示了唯一的强保守性区域,它由锌指的蛋白结构基序组成。这是酿酒酵母中得到充分表征的转录因子Msn4p和Msn2p(ScMSN4/2)的已知DNA结合结构域,很可能可用于在其他生物中发挥相同的功能(Nicholls等,2004)。
酿酒酵母的MSN2/4中的锌指具有C2H2-样折叠。氨基酸序列基序是X2-C-X2,4-C-X12-H-X3,4,5-H,这也描绘在图7中。如果将其放大到序列比对的高度保守区域(图6黑色虚线框),则可以清楚地观察到该基序(图7)。
MSN4-样C2H2型锌指DNA结合结构域的共有序列以灰色高亮示出。以黑色星号(*)标记C2H2基序。共有序列为:
Figure BDA0002953325880000921
通过EMBOSS Needle算法的整体配对序列比对研究了巴斯德毕赤酵母的全长Msn4p与其它生物体的各同系物之间的配对序列相似性/同一性。还研究了巴斯德毕赤酵母的Msn4p的DNA结合结构域与其它生物体的各同系物的DNA结合结构域的配对序列相似性/同一性。将采用默认设置(矩阵:BLOSUM62;空位开放:10;空位延伸:0.5;末端空位罚分:错(false);末端空位开放:10;末端空位延伸:0.5)的EMBOSS Needle webserver(https://www.ebi.ac.uk/Tools/psa/emboss_needle/)用于配对蛋白序列比对。EMBOSS Needle读取两个输入序列,并将它们的最佳整体序列比对写入文件。其采用Needleman-Wunsch比对算法在两个序列的整体长度上寻找最佳比对(包括空位)。
将同一性结果列于图8。如所预期的,全长Msn4的整体序列同一性显示出远低于仅DNA结合结构域的保守性。
还通过EMBOSS Needle算法的整体配对序列比对研究了Msn4p/Msn2p的DNA-结合结构域(DBD)的共有序列与其它生物体的各同系物的DNA-结合结构域的配对序列相似性/同一性(参见图14)。
实施例7:HAC1与PpHAC1的比对和序列相似性
采用软件CLC Main Workbench(QIAGEN Bioinformatics)进行比对。
研究了巴斯德毕赤酵母的全长Hac1p或其DNA结合结构域与其它生物体的各同系物的配对序列相似性/同一性。通过EMBOSS Needle算法的整体配对序列比对评估了整体相似性/同一性(图13)。
序列表
<110> 贝林格尔•英格海姆RCV两合公司
瓦利多根股份有限公司
隆萨有限公司
<120> 通过使用转录因子来增加蛋白质表达的手段和方法
<130> LC20310015P
<150> EP 18 180 164.8
<151> 2018-06-27
<160> 121
<170> PatentIn version 3.5
<210> 1
<211> 54
<212> PRT
<213> Komagataella phaffii / Komagataella pastoris
<400> 1
Lys Gln Phe Arg Cys Thr Asp Cys Ser Arg Arg Phe Arg Arg Ser Glu
1 5 10 15
His Leu Lys Arg His His Arg Ser Val His Ser Asn Glu Arg Pro Phe
20 25 30
His Cys Ala His Cys Asp Lys Arg Phe Ser Arg Ser Asp Asn Leu Ser
35 40 45
Gln His Leu Arg Thr His
50
<210> 2
<211> 54
<212> PRT
<213> 解脂耶氏酵母
<400> 2
Lys Thr Phe Val Cys Thr His Cys Gln Arg Arg Phe Arg Arg Gln Glu
1 5 10 15
His Leu Lys Arg His Phe Arg Ser Leu His Thr Arg Glu Lys Pro Phe
20 25 30
Asn Cys Asp Thr Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala
35 40 45
Gln His Met Arg Thr His
50
<210> 3
<211> 54
<212> PRT
<213> 里氏木霉
<400> 3
Lys Thr Phe Val Cys Asp Leu Cys Asn Arg Arg Phe Arg Arg Gln Glu
1 5 10 15
His Leu Lys Arg His Tyr Arg Ser Leu His Thr Gln Glu Lys Pro Phe
20 25 30
Glu Cys Asn Glu Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala
35 40 45
Gln His Ala Arg Thr His
50
<210> 4
<211> 53
<212> PRT
<213> 粟酒裂殖酵母
<400> 4
Lys Ser Phe Val Cys Pro Glu Cys Ser Lys Lys Phe Lys Arg Ser Glu
1 5 10 15
His Leu Arg Arg His Ile Arg Ser Leu His Thr Ser Glu Lys Pro Phe
20 25 30
Val Cys Ile Cys Gly Lys Arg Phe Ser Arg Arg Asp Asn Leu Arg Gln
35 40 45
His Glu Arg Leu His
50
<210> 5
<211> 54
<212> PRT
<213> 酿酒酵母
<400> 5
Lys Pro Phe Lys Cys Lys Asp Cys Glu Lys Ala Phe Arg Arg Ser Glu
1 5 10 15
His Leu Lys Arg His Ile Arg Ser Val His Ser Thr Glu Arg Pro Phe
20 25 30
Ala Cys Met Phe Cys Glu Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser
35 40 45
Gln His Leu Lys Thr His
50
<210> 6
<211> 54
<212> PRT
<213> 酿酒酵母
<400> 6
Lys Pro Phe His Cys His Ile Cys Pro Lys Ser Phe Lys Arg Ser Glu
1 5 10 15
His Leu Lys Arg His Val Arg Ser Val His Ser Asn Glu Arg Pro Phe
20 25 30
Ala Cys His Ile Cys Asp Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser
35 40 45
Gln His Ile Lys Thr His
50
<210> 7
<211> 54
<212> PRT
<213> 乳酸克鲁维酵母
<400> 7
Lys Pro Phe Lys Cys Asp Gln Cys Asn Lys Thr Phe Arg Arg Ser Glu
1 5 10 15
His Leu Lys Arg His Val Arg Ser Val His Ser Thr Glu Arg Pro Phe
20 25 30
His Cys Gln Phe Cys Asp Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser
35 40 45
Gln His Leu Lys Thr His
50
<210> 8
<211> 54
<212> PRT
<213> 乳酸克鲁维酵母
<400> 8
Lys Pro Phe Gly Cys Glu Tyr Cys Asp Arg Arg Phe Lys Arg Gln Glu
1 5 10 15
His Leu Lys Arg His Ile Arg Ser Leu His Ile Cys Glu Lys Pro Tyr
20 25 30
Gly Cys His Leu Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser
35 40 45
Gln His Leu Lys Thr His
50
<210> 9
<211> 54
<212> PRT
<213> 博伊丁假丝酵母
<400> 9
Lys Pro Phe Arg Cys Ser Leu Cys Glu Lys Ser Phe Lys Arg Gln Glu
1 5 10 15
His Leu Lys Arg His His Arg Ser Val His Ser Gly Glu Lys Pro His
20 25 30
Ile Cys Gln Thr Cys Asp Lys Arg Phe Ser Arg Thr Asp Asn Leu Ala
35 40 45
Gln His Leu Arg Thr His
50
<210> 10
<211> 54
<212> PRT
<213> 黑曲霉
<400> 10
Lys Thr Phe Val Cys Thr Leu Cys Ser Arg Arg Phe Arg Arg Gln Glu
1 5 10 15
His Leu Lys Arg His Tyr Arg Ser Leu His Thr Gln Asp Lys Pro Phe
20 25 30
Glu Cys Asn Glu Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala
35 40 45
Gln His Ala Arg Thr His
50
<210> 11
<211> 54
<212> PRT
<213> 酿酒酵母
<400> 11
Lys Gln Phe Gly Cys Glu Phe Cys Asp Arg Arg Phe Lys Arg Gln Glu
1 5 10 15
His Leu Lys Arg His Val Arg Ser Leu His Met Cys Glu Lys Pro Phe
20 25 30
Thr Cys His Ile Cys Asn Lys Asn Phe Ser Arg Ser Asp Asn Leu Asn
35 40 45
Gln His Val Lys Thr His
50
<210> 12
<211> 57
<212> PRT
<213> 人工序列
<220>
<223> synMSN4
<400> 12
Lys Gln Phe Arg Cys Thr Asp Cys Ser Arg Arg Phe Arg Arg Ser Glu
1 5 10 15
His Leu Lys Arg His His Arg Ser Val His Ser Asn Glu Arg Pro Phe
20 25 30
His Cys Ala His Cys Asp Lys Arg Phe Ser Arg Ser Asp Asn Leu Ser
35 40 45
Gln His Leu Arg Thr His Arg Lys Gln
50 55
<210> 13
<211> 341
<212> PRT
<213> 人工序列
<220>
<223> scFv
<400> 13
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Gln Glu Gln Leu Met Glu Ser Gly Gly Gly Leu
85 90 95
Val Thr Leu Gly Gly Ser Leu Lys Leu Ser Cys Lys Ala Ser Gly Ile
100 105 110
Asp Phe Ser His Tyr Gly Ile Ser Trp Val Arg Gln Ala Pro Gly Lys
115 120 125
Gly Leu Glu Trp Ile Ala Tyr Ile Tyr Pro Asn Tyr Gly Ser Val Asp
130 135 140
Tyr Ala Ser Trp Val Asn Gly Arg Phe Thr Ile Ser Leu Asp Asn Ala
145 150 155 160
Gln Asn Thr Val Phe Leu Gln Met Ile Ser Leu Thr Ala Ala Asp Thr
165 170 175
Ala Thr Tyr Phe Cys Ala Arg Asp Arg Gly Tyr Tyr Ser Gly Ser Arg
180 185 190
Gly Thr Arg Leu Asp Leu Trp Gly Gln Gly Thr Leu Val Thr Ile Ser
195 200 205
Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
210 215 220
Glu Leu Val Met Thr Gln Thr Pro Pro Ser Leu Ser Ala Ser Val Gly
225 230 235 240
Glu Thr Val Arg Ile Arg Cys Leu Ala Ser Glu Phe Leu Phe Asn Gly
245 250 255
Val Ser Trp Tyr Gln Gln Lys Pro Gly Lys Pro Pro Lys Phe Leu Ile
260 265 270
Ser Gly Ala Ser Asn Leu Glu Ser Gly Val Pro Pro Arg Phe Ser Gly
275 280 285
Ser Gly Ser Gly Thr Asp Tyr Thr Leu Thr Ile Gly Gly Val Gln Ala
290 295 300
Glu Asp Val Ala Thr Tyr Tyr Cys Leu Gly Gly Tyr Ser Gly Ser Ser
305 310 315 320
Gly Leu Thr Phe Gly Ala Gly Thr Asn Val Glu Ile Lys Gly Gly His
325 330 335
His His His His His
340
<210> 14
<211> 362
<212> PRT
<213> 人工序列
<220>
<223> VHH
<400> 14
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu
85 90 95
Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg
100 105 110
Thr Phe Thr Ser Phe Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys
115 120 125
Glu Arg Glu Phe Val Ala Ser Ile Ser Arg Ser Gly Thr Leu Thr Arg
130 135 140
Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Val Asp Asn Ala
145 150 155 160
Lys Asn Thr Val Ser Leu Gln Met Asp Asn Leu Asn Pro Asp Asp Thr
165 170 175
Ala Val Tyr Tyr Cys Ala Ala Asp Leu His Arg Pro Tyr Gly Pro Gly
180 185 190
Thr Gln Arg Ser Asp Glu Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val
195 200 205
Thr Val Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly
210 215 220
Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Glu
225 230 235 240
Val Gln Leu Val Glu Ser Gly Gly Ala Leu Val Gln Pro Gly Gly Ser
245 250 255
Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Pro Val Asn Arg Tyr Ser
260 265 270
Met Arg Trp Tyr Arg Gln Ala Pro Gly Lys Glu Arg Glu Trp Val Ala
275 280 285
Gly Met Ser Ser Ala Gly Asp Arg Ser Ser Tyr Glu Asp Ser Val Lys
290 295 300
Gly Arg Phe Thr Ile Ser Arg Asp Asp Ala Arg Asn Thr Val Tyr Leu
305 310 315 320
Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn
325 330 335
Val Asn Val Gly Phe Glu Tyr Trp Gly Gln Gly Thr Gln Val Thr Val
340 345 350
Ser Ser Gly Gly His His His His His His
355 360
<210> 15
<211> 356
<212> PRT
<213> Komagataella phaffii
<400> 15
Met Ser Thr Thr Lys Pro Met Gln Val Leu Ala Pro Asp Leu Thr Glu
1 5 10 15
Thr Pro Lys Thr Tyr Ser Leu Gly Val His Leu Gly Lys Gly Lys Asp
20 25 30
Lys Leu Gln Asp Pro Thr Glu Leu Tyr Ser Met Ile Leu Asp Gly Met
35 40 45
Asp His Ser Gln Leu Asn Ser Phe Ile Asn Asp Gln Leu Asn Leu Gly
50 55 60
Ser Leu Arg Leu Pro Ala Asn Pro Pro Ala Ala Ser Gly Ala Lys Arg
65 70 75 80
Gly Ala Asn Val Ser Ser Ile Asn Met Asp Asp Leu Gln Thr Phe Asp
85 90 95
Phe Asn Phe Asp Tyr Glu Arg Asp Ser Ser Pro Leu Glu Leu Asn Met
100 105 110
Asp Ser Gln Ser Leu Met Phe Ser Ser Pro Glu Lys Ala Pro Cys Gly
115 120 125
Ser Leu Pro Ser Gln His Gln Pro His Ser Gln Val Ala Ala Ala Gln
130 135 140
Gly Thr Thr Ile Asn Pro Arg Gln Leu Ser Thr Ser Ser Ala Ser Ser
145 150 155 160
Phe Val Ser Ser Asp Phe Asp Val Asp Ser Leu Leu Ala Asp Glu Tyr
165 170 175
Ala Glu Lys Leu Glu Tyr Gly Ala Ile Ser Ser Ala Ser Ser Ser Ile
180 185 190
Cys Ser Asn Ser Val Leu Pro Ser Gln Gly Val Thr Ser Gln His Ser
195 200 205
Ser Pro Ile Glu Gln Arg Pro Arg Val Gly Asn Ser Lys Arg Leu Ser
210 215 220
Asp Phe Trp Met Gln Asp Glu Ala Val Thr Ala Ile Ser Thr Trp Leu
225 230 235 240
Lys Ala Glu Ile Pro Ser Ser Leu Ala Thr Pro Ala Pro Thr Val Thr
245 250 255
Gln Ile Ser Ser Pro Ser Leu Ser Thr Pro Glu Pro Arg Lys Lys Glu
260 265 270
Thr Lys Gln Arg Lys Arg Ala Lys Ser Ile Asp Thr Asn Glu Arg Ser
275 280 285
Glu Gln Val Ala Ala Ser Asn Ser Asp Asp Glu Lys Gln Phe Arg Cys
290 295 300
Thr Asp Cys Ser Arg Arg Phe Arg Arg Ser Glu His Leu Lys Arg His
305 310 315 320
His Arg Ser Val His Ser Asn Glu Arg Pro Phe His Cys Ala His Cys
325 330 335
Asp Lys Arg Phe Ser Arg Ser Asp Asn Leu Ser Gln His Leu Arg Thr
340 345 350
His Arg Lys Gln
355
<210> 16
<211> 357
<212> PRT
<213> Komagataella pastoris
<400> 16
Met Ser Thr Thr Lys Pro Met Gln Val Leu Ala Pro Asp Leu Thr Glu
1 5 10 15
Thr Pro Lys Thr Tyr Ser Leu Gly Val His Leu Gly Lys Gly Lys Asp
20 25 30
Lys Leu Gln Asp Pro Thr Glu Leu Tyr Ser Met Ile Leu Asp Gly Met
35 40 45
Asp His Ser Gln Leu Asn Ser Phe Ile Asn Asp Gln Leu Asn Leu Gly
50 55 60
Ser Leu Arg Leu Pro Ala Asn Pro Pro Ala Ala Gly Gly Ala Lys Arg
65 70 75 80
Gly Ala Asn Val Ser Ser Ile Asn Met Asp Asp Leu Gln Thr Phe Asp
85 90 95
Phe Asn Phe Asp Tyr Glu Arg Asp Ser Ser Pro Leu Glu Leu Asn Met
100 105 110
Asp Ser Gln Thr Leu Leu Phe Ser Ser Pro Glu Lys Ala Pro Pro Cys
115 120 125
Gly Ser Leu Pro Ser Gln His Gln Pro His Ser Gln Gly Ala Ala Ala
130 135 140
Gln Gly Thr Thr Ile Asn Pro Arg Gln Leu Ser Thr Ser Ser Ala Ser
145 150 155 160
Ser Phe Val Ser Ser Asp Phe Asp Val Asp Ser Leu Leu Ala Glu Glu
165 170 175
Tyr Ala Glu Lys Leu Glu Tyr Gly Ala Ile Ser Ser Ala Ser Ser Ser
180 185 190
Ile Cys Ser Asn Ser Val Leu Pro Asn Gln Gly Val Thr Ser Gln His
195 200 205
Ser Ser Pro Ile Glu Gln Arg Pro Arg Val Gly Asn Ser Lys Arg Leu
210 215 220
Ser Asp Phe Trp Met Gln Asp Glu Ala Val Thr Ala Ile Ser Thr Trp
225 230 235 240
Leu Lys Ala Glu Ile Pro Ser Ser Leu Ala Thr Pro Ala Pro Thr Val
245 250 255
Thr Lys Ile Ser Ser Pro Thr Leu Ser Thr Pro Glu Pro Arg Lys Lys
260 265 270
Glu Thr Lys Gln Arg Lys Arg Ala Lys Ser Ile Asp Thr Asn Glu Arg
275 280 285
Ser Glu Gln Val Ala Ala Ser Gly Ser Asp Asp Glu Lys Gln Phe Arg
290 295 300
Cys Thr Asp Cys Ser Arg Arg Phe Arg Arg Ser Glu His Leu Lys Arg
305 310 315 320
His His Arg Ser Val His Ser Asn Glu Arg Pro Phe His Cys Ala His
325 330 335
Cys Asp Lys Arg Phe Ser Arg Ser Asp Asn Leu Ser Gln His Leu Arg
340 345 350
Thr His Arg Lys Gln
355
<210> 17
<211> 285
<212> PRT
<213> 解脂耶氏酵母
<400> 17
Met Asp Leu Glu Leu Glu Ile Pro Val Leu His Ser Met Asp Ser His
1 5 10 15
His Gln Val Val Asp Ser His Arg Leu Ala Gln Gln Gln Phe Gln Tyr
20 25 30
Gln Gln Ile His Met Leu Gln Gln Thr Leu Ser Gln Gln Tyr Pro His
35 40 45
Thr Pro Ser Thr Thr Pro Pro Ile Tyr Met Leu Ser Pro Ala Asp Tyr
50 55 60
Glu Lys Asp Ala Val Ser Ile Ser Pro Val Met Leu Trp Pro Pro Ser
65 70 75 80
Ala His Ser Gln Ala Ser Tyr His Tyr Glu Met Pro Ser Val Ile Ser
85 90 95
Pro Ser Pro Ser Pro Thr Arg Ser Phe Cys Asn Pro Arg Glu Leu Glu
100 105 110
Val Gln Asp Glu Leu Glu Gln Leu Glu Gln Gln Pro Ala Ala Leu Ser
115 120 125
Val Glu His Leu Phe Asp Ile Glu Asn Ser Ser Ile Glu Tyr Ala His
130 135 140
Asp Glu Leu His Asp Thr Ser Ser Cys Ser Asp Ser Gln Ser Ser Phe
145 150 155 160
Ser Pro Gln Gln Ser Pro Ala Ser Pro Ala Ser Thr Tyr Ser Pro Leu
165 170 175
Glu Asp Glu Phe Leu Asn Leu Ala Gly Ser Glu Leu Lys Ser Glu Pro
180 185 190
Ser Ala Asp Asp Glu Lys Asp Asp Val Asp Thr Glu Leu Pro Gln Gln
195 200 205
Pro Glu Ile Ile Ile Pro Val Ser Cys Arg Gly Arg Lys Pro Ser Ile
210 215 220
Asp Asp Ser Lys Lys Thr Phe Val Cys Thr His Cys Gln Arg Arg Phe
225 230 235 240
Arg Arg Gln Glu His Leu Lys Arg His Phe Arg Ser Leu His Thr Arg
245 250 255
Glu Lys Pro Phe Asn Cys Asp Thr Cys Gly Lys Lys Phe Ser Arg Ser
260 265 270
Asp Asn Leu Ala Gln His Met Arg Thr His Pro Arg Asp
275 280 285
<210> 18
<211> 534
<212> PRT
<213> 里氏木霉
<400> 18
Met Asp Gly Met Met Ser Gln Pro Met Gly Gln Gln Ala Phe Tyr Phe
1 5 10 15
Tyr Asn His Glu His Lys Met Ser Pro Arg Gln Val Ile Phe Ala Gln
20 25 30
Gln Met Ala Ala Tyr Gln Met Met Pro Ser Leu Pro Pro Thr Pro Met
35 40 45
Tyr Ser Arg Pro Asn Ser Ser Cys Ser Gln Pro Pro Thr Leu Tyr Ser
50 55 60
Asn Gly Pro Ser Val Met Thr Pro Thr Ser Thr Pro Pro Leu Ser Ser
65 70 75 80
Arg Lys Pro Met Leu Val Asp Thr Glu Phe Gly Asp Asn Pro Tyr Phe
85 90 95
Pro Ser Thr Pro Pro Leu Ser Ala Ser Gly Ser Thr Val Gly Ser Pro
100 105 110
Lys Ala Cys Asp Met Leu Gln Thr Pro Met Asn Pro Met Phe Ser Gly
115 120 125
Leu Glu Gly Ile Ala Ile Lys Asp Ser Ile Asp Ala Thr Glu Ser Leu
130 135 140
Val Leu Asp Trp Ala Ser Ile Ala Ser Pro Pro Leu Ser Pro Val Tyr
145 150 155 160
Leu Gln Ser Gln Thr Ser Ser Gly Lys Val Pro Ser Leu Thr Ser Ser
165 170 175
Pro Ser Asp Met Leu Ser Thr Thr Ala Ser Cys Pro Ser Leu Ser Pro
180 185 190
Ser Pro Thr Pro Tyr Ala Arg Ser Val Thr Ser Glu His Asp Val Asp
195 200 205
Phe Cys Asp Pro Arg Asn Leu Thr Val Ser Val Gly Ser Asn Pro Thr
210 215 220
Leu Ala Pro Glu Phe Thr Leu Leu Ala Asp Asp Ile Lys Gly Glu Pro
225 230 235 240
Leu Pro Thr Ala Ala Gln Pro Ser Phe Asp Phe Asn Pro Ala Leu Pro
245 250 255
Ser Gly Leu Pro Thr Phe Glu Asp Phe Ser Asp Leu Glu Ser Glu Ala
260 265 270
Asp Phe Ser Ser Leu Val Asn Leu Gly Glu Ile Asn Pro Val Asp Ile
275 280 285
Ser Arg Pro Arg Ala Cys Thr Gly Ser Ser Val Val Ser Leu Gly His
290 295 300
Gly Ser Phe Ile Gly Asp Glu Asp Leu Ser Phe Asp Asp Glu Ala Phe
305 310 315 320
His Phe Pro Ser Leu Pro Ser Pro Thr Ser Ser Val Asp Phe Cys Asp
325 330 335
Val His Gln Asp Lys Arg Gln Lys Lys Asp Arg Lys Glu Ala Lys Pro
340 345 350
Val Met Asn Ser Ala Ala Gly Gly Ser Gln Ser Gly Asn Glu Gln Ala
355 360 365
Gly Ala Thr Glu Ala Ala Ser Ala Ala Ser Asp Ser Asn Ala Ser Ser
370 375 380
Ala Ser Asp Glu Pro Ser Ser Ser Met Pro Ala Pro Thr Asn Arg Arg
385 390 395 400
Gly Arg Lys Gln Ser Leu Thr Glu Asp Pro Ser Lys Thr Phe Val Cys
405 410 415
Asp Leu Cys Asn Arg Arg Phe Arg Arg Gln Glu His Leu Lys Arg His
420 425 430
Tyr Arg Ser Leu His Thr Gln Glu Lys Pro Phe Glu Cys Asn Glu Cys
435 440 445
Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala Gln His Ala Arg Thr
450 455 460
His Ser Gly Gly Ala Ile Val Met Asn Leu Ile Glu Glu Ser Ser Glu
465 470 475 480
Val Pro Ala Tyr Asp Gly Ser Met Met Ala Gly Pro Val Gly Asp Asp
485 490 495
Tyr Ser Thr Tyr Gly Lys Val Leu Phe Gln Ile Ala Ser Glu Ile Pro
500 505 510
Gly Ser Ala Ser Glu Leu Ser Ser Glu Glu Gly Glu Gln Gly Lys Lys
515 520 525
Lys Arg Lys Arg Ser Asp
530
<210> 19
<211> 582
<212> PRT
<213> 粟酒裂殖酵母
<400> 19
Met Val Phe Phe Pro Glu Ala Met Pro Leu Val Thr Leu Ser Glu Arg
1 5 10 15
Met Val Pro Gln Val Asn Thr Ser Pro Phe Ala Pro Ala Gln Ser Ser
20 25 30
Ser Pro Leu Pro Ser Asn Ser Cys Arg Glu Tyr Ser Leu Pro Ser His
35 40 45
Pro Ser Thr His Asn Ser Ser Val Ala Tyr Val Asp Ser Gln Asp Asn
50 55 60
Lys Pro Pro Leu Val Ser Thr Leu His Phe Ser Leu Ala Pro Ser Leu
65 70 75 80
Ser Pro Ser Ser Ala Gln Ser His Asn Thr Ala Leu Ile Thr Glu Pro
85 90 95
Leu Thr Ser Phe Ile Gly Gly Thr Ser Gln Tyr Pro Ser Ala Ser Phe
100 105 110
Ser Thr Ser Gln His Pro Ser Gln Val Tyr Asn Asp Gly Ser Thr Leu
115 120 125
Asn Ser Asn Asn Thr Thr Gln Gln Leu Asn Asn Asn Asn Gly Phe Gln
130 135 140
Pro Pro Pro Gln Asn Pro Gly Ile Ser Lys Ser Arg Ile Ala Gln Tyr
145 150 155 160
His Gln Pro Ser Gln Thr Tyr Asp Asp Thr Val Asp Ser Ser Phe Tyr
165 170 175
Asp Trp Tyr Lys Ala Gly Ala Gln His Asn Leu Ala Pro Pro Gln Ser
180 185 190
Ser His Thr Glu Ala Ser Gln Gly Tyr Met Tyr Ser Thr Asn Thr Ala
195 200 205
His Asp Ala Thr Asp Ile Pro Ser Ser Phe Asn Phe Tyr Asn Thr Gln
210 215 220
Ala Ser Thr Ala Pro Asn Pro Gln Glu Ile Asn Tyr Gln Trp Ser His
225 230 235 240
Glu Tyr Arg Pro His Thr Gln Tyr Gln Asn Asn Leu Leu Arg Ala Gln
245 250 255
Pro Asn Val Asn Cys Glu Asn Phe Pro Thr Thr Val Pro Asn Tyr Pro
260 265 270
Phe Gln Gln Pro Ser Tyr Asn Pro Asn Ala Leu Val Pro Ser Tyr Thr
275 280 285
Thr Leu Val Ser Gln Leu Pro Pro Ser Pro Cys Leu Thr Val Ser Ser
290 295 300
Gly Pro Leu Ser Thr Ala Ser Ser Ile Pro Ser Asn Cys Ser Cys Pro
305 310 315 320
Ser Val Lys Ser Ser Gly Pro Ser Tyr His Ala Glu Gln Glu Val Asn
325 330 335
Val Asn Ser Tyr Asn Gly Gly Ile Pro Ser Thr Ser Tyr Asn Asp Thr
340 345 350
Pro Gln Gln Ser Val Thr Gly Ser Tyr Asn Ser Gly Glu Thr Met Ser
355 360 365
Thr Tyr Leu Asn Gln Thr Asn Thr Ser Gly Arg Ser Pro Asn Ser Met
370 375 380
Glu Ala Thr Glu Gln Ile Gly Thr Ile Gly Thr Asp Gly Ser Met Lys
385 390 395 400
Arg Arg Lys Arg Arg Gln Pro Ser Asn Arg Lys Thr Ser Val Pro Arg
405 410 415
Ser Pro Gly Gly Lys Ser Phe Val Cys Pro Glu Cys Ser Lys Lys Phe
420 425 430
Lys Arg Ser Glu His Leu Arg Arg His Ile Arg Ser Leu His Thr Ser
435 440 445
Glu Lys Pro Phe Val Cys Ile Cys Gly Lys Arg Phe Ser Arg Arg Asp
450 455 460
Asn Leu Arg Gln His Glu Arg Leu His Val Asn Ala Ser Pro Arg Leu
465 470 475 480
Ala Cys Phe Phe Gln Pro Ser Gly Tyr Tyr Ser Ser Gly Ala Pro Gly
485 490 495
Ala Pro Val Gln Pro Gln Lys Pro Ile Glu Asp Leu Asn Lys Ile Pro
500 505 510
Ile Asn Gln Gly Met Asp Ser Ser Gln Ile Glu Asn Thr Asn Leu Met
515 520 525
Leu Ser Ser Gln Arg Pro Leu Ser Gln Gln Ile Val Pro Glu Ile Ala
530 535 540
Ala Tyr Pro Asn Ser Ile Arg Pro Glu Leu Leu Ser Lys Leu Pro Val
545 550 555 560
Gln Thr Pro Asn Gln Lys Met Pro Leu Met Asn Pro Met His Gln Tyr
565 570 575
Gln Pro Tyr Pro Ser Ser
580
<210> 20
<211> 630
<212> PRT
<213> 酿酒酵母
<400> 20
Met Leu Val Phe Gly Pro Asn Ser Ser Phe Val Arg His Ala Asn Lys
1 5 10 15
Lys Gln Glu Asp Ser Ser Ile Met Asn Glu Pro Asn Gly Leu Met Asp
20 25 30
Pro Val Leu Ser Thr Thr Asn Val Ser Ala Thr Ser Ser Asn Asp Asn
35 40 45
Ser Ala Asn Asn Ser Ile Ser Ser Pro Glu Tyr Thr Phe Gly Gln Phe
50 55 60
Ser Met Asp Ser Pro His Arg Thr Asp Ala Thr Asn Thr Pro Ile Leu
65 70 75 80
Thr Ala Thr Thr Asn Thr Thr Ala Asn Asn Ser Leu Met Asn Leu Lys
85 90 95
Asp Thr Ala Ser Leu Ala Thr Asn Trp Lys Trp Lys Asn Ser Asn Asn
100 105 110
Ala Gln Phe Val Asn Asp Gly Glu Lys Gln Ser Ser Asn Ala Asn Gly
115 120 125
Lys Lys Asn Gly Gly Asp Lys Ile Tyr Ser Ser Val Ala Thr Pro Gln
130 135 140
Ala Leu Asn Asp Glu Leu Lys Asn Leu Glu Gln Leu Glu Lys Val Phe
145 150 155 160
Ser Pro Met Asn Pro Ile Asn Asp Ser His Phe Asn Glu Asn Ile Glu
165 170 175
Leu Ser Pro His Gln His Ala Thr Ser Pro Lys Thr Asn Leu Leu Glu
180 185 190
Ala Glu Pro Ser Ile Tyr Ser Asn Leu Phe Leu Asp Ala Arg Leu Pro
195 200 205
Asn Asn Ala Asn Ser Thr Thr Gly Leu Asn Asp Asn Asp Tyr Asn Leu
210 215 220
Asp Asp Thr Asn Asn Asp Asn Thr Asn Ser Met Gln Ser Ile Leu Glu
225 230 235 240
Asp Phe Val Ser Ser Glu Glu Ala Leu Lys Phe Met Pro Asp Ala Gly
245 250 255
Arg Asp Ala Arg Arg Tyr Ser Glu Val Val Thr Ser Ser Phe Pro Ser
260 265 270
Met Thr Asp Ser Arg Asn Ser Ile Ser His Ser Ile Glu Phe Trp Asn
275 280 285
Leu Asn His Lys Asn Ser Ser Asn Ser Lys Pro Thr Gln Gln Ile Ile
290 295 300
Pro Glu Gly Thr Ala Thr Thr Glu Arg Arg Gly Ser Thr Ile Ser Pro
305 310 315 320
Thr Thr Thr Ile Asn Asn Ser Asn Pro Asn Phe Lys Leu Leu Asp His
325 330 335
Asp Val Ser Gln Ala Leu Ser Gly Tyr Ser Met Asp Phe Ser Lys Asp
340 345 350
Ser Gly Ile Thr Lys Pro Lys Ser Ile Ser Ser Ser Leu Asn Arg Ile
355 360 365
Ser His Ser Ser Ser Thr Thr Arg Gln Gln Arg Ala Ser Leu Pro Leu
370 375 380
Ile His Asp Ile Glu Ser Phe Ala Asn Asp Ser Val Met Ala Asn Pro
385 390 395 400
Leu Ser Asp Ser Ala Ser Phe Leu Ser Glu Glu Asn Glu Asp Asp Ala
405 410 415
Phe Gly Ala Leu Asn Tyr Asn Ser Leu Asp Ala Thr Thr Met Ser Ala
420 425 430
Phe Asp Asn Asn Val Asp Pro Phe Asn Ile Leu Lys Ser Ser Pro Ala
435 440 445
Gln Asp Gln Gln Phe Ile Lys Pro Ser Met Met Leu Ser Asp Asn Ala
450 455 460
Ser Ala Ala Ala Lys Leu Ala Thr Ser Gly Val Asp Asn Ile Thr Pro
465 470 475 480
Thr Pro Ala Phe Gln Arg Arg Ser Tyr Asp Ile Ser Met Asn Ser Ser
485 490 495
Phe Lys Ile Leu Pro Thr Ser Gln Ala His His Ala Ala Gln His His
500 505 510
Gln Gln Gln Pro Thr Lys Gln Ala Thr Val Ser Pro Asn Thr Arg Arg
515 520 525
Arg Lys Ser Ser Ser Val Thr Leu Ser Pro Thr Ile Ser His Asn Asn
530 535 540
Asn Asn Gly Lys Val Pro Val Gln Pro Arg Lys Arg Lys Ser Ile Thr
545 550 555 560
Thr Ile Asp Pro Asn Asn Tyr Asp Lys Asn Lys Pro Phe Lys Cys Lys
565 570 575
Asp Cys Glu Lys Ala Phe Arg Arg Ser Glu His Leu Lys Arg His Ile
580 585 590
Arg Ser Val His Ser Thr Glu Arg Pro Phe Ala Cys Met Phe Cys Glu
595 600 605
Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser Gln His Leu Lys Thr His
610 615 620
Lys Lys His Gly Asp Phe
625 630
<210> 21
<211> 704
<212> PRT
<213> 酿酒酵母
<400> 21
Met Thr Val Asp His Asp Phe Asn Ser Glu Asp Ile Leu Phe Pro Ile
1 5 10 15
Glu Ser Met Ser Ser Ile Gln Tyr Val Glu Asn Asn Asn Pro Asn Asn
20 25 30
Ile Asn Asn Asp Val Ile Pro Tyr Ser Leu Asp Ile Lys Asn Thr Val
35 40 45
Leu Asp Ser Ala Asp Leu Asn Asp Ile Gln Asn Gln Glu Thr Ser Leu
50 55 60
Asn Leu Gly Leu Pro Pro Leu Ser Phe Asp Ser Pro Leu Pro Val Thr
65 70 75 80
Glu Thr Ile Pro Ser Thr Thr Asp Asn Ser Leu His Leu Lys Ala Asp
85 90 95
Ser Asn Lys Asn Arg Asp Ala Arg Thr Ile Glu Asn Asp Ser Glu Ile
100 105 110
Lys Ser Thr Asn Asn Ala Ser Gly Ser Gly Ala Asn Gln Tyr Thr Thr
115 120 125
Leu Thr Ser Pro Tyr Pro Met Asn Asp Ile Leu Tyr Asn Met Asn Asn
130 135 140
Pro Leu Gln Ser Pro Ser Pro Ser Ser Val Pro Gln Asn Pro Thr Ile
145 150 155 160
Asn Pro Pro Ile Asn Thr Ala Ser Asn Glu Thr Asn Leu Ser Pro Gln
165 170 175
Thr Ser Asn Gly Asn Glu Thr Leu Ile Ser Pro Arg Ala Gln Gln His
180 185 190
Thr Ser Ile Lys Asp Asn Arg Leu Ser Leu Pro Asn Gly Ala Asn Ser
195 200 205
Asn Leu Phe Ile Asp Thr Asn Pro Asn Asn Leu Asn Glu Lys Leu Arg
210 215 220
Asn Gln Leu Asn Ser Asp Thr Asn Ser Tyr Ser Asn Ser Ile Ser Asn
225 230 235 240
Ser Asn Ser Asn Ser Thr Gly Asn Leu Asn Ser Ser Tyr Phe Asn Ser
245 250 255
Leu Asn Ile Asp Ser Met Leu Asp Asp Tyr Val Ser Ser Asp Leu Leu
260 265 270
Leu Asn Asp Asp Asp Asp Asp Thr Asn Leu Ser Arg Arg Arg Phe Ser
275 280 285
Asp Val Ile Thr Asn Gln Phe Pro Ser Met Thr Asn Ser Arg Asn Ser
290 295 300
Ile Ser His Ser Leu Asp Leu Trp Asn His Pro Lys Ile Asn Pro Ser
305 310 315 320
Asn Arg Asn Thr Asn Leu Asn Ile Thr Thr Asn Ser Thr Ser Ser Ser
325 330 335
Asn Ala Ser Pro Asn Thr Thr Thr Met Asn Ala Asn Ala Asp Ser Asn
340 345 350
Ile Ala Gly Asn Pro Lys Asn Asn Asp Ala Thr Ile Asp Asn Glu Leu
355 360 365
Thr Gln Ile Leu Asn Glu Tyr Asn Met Asn Phe Asn Asp Asn Leu Gly
370 375 380
Thr Ser Thr Ser Gly Lys Asn Lys Ser Ala Cys Pro Ser Ser Phe Asp
385 390 395 400
Ala Asn Ala Met Thr Lys Ile Asn Pro Ser Gln Gln Leu Gln Gln Gln
405 410 415
Leu Asn Arg Val Gln His Lys Gln Leu Thr Ser Ser His Asn Asn Ser
420 425 430
Ser Thr Asn Met Lys Ser Phe Asn Ser Asp Leu Tyr Ser Arg Arg Gln
435 440 445
Arg Ala Ser Leu Pro Ile Ile Asp Asp Ser Leu Ser Tyr Asp Leu Val
450 455 460
Asn Lys Gln Asp Glu Asp Pro Lys Asn Asp Met Leu Pro Asn Ser Asn
465 470 475 480
Leu Ser Ser Ser Gln Gln Phe Ile Lys Pro Ser Met Ile Leu Ser Asp
485 490 495
Asn Ala Ser Val Ile Ala Lys Val Ala Thr Thr Gly Leu Ser Asn Asp
500 505 510
Met Pro Phe Leu Thr Glu Glu Gly Glu Gln Asn Ala Asn Ser Thr Pro
515 520 525
Asn Phe Asp Leu Ser Ile Thr Gln Met Asn Met Ala Pro Leu Ser Pro
530 535 540
Ala Ser Ser Ser Ser Thr Ser Leu Ala Thr Asn His Phe Tyr His His
545 550 555 560
Phe Pro Gln Gln Gly His His Thr Met Asn Ser Lys Ile Gly Ser Ser
565 570 575
Leu Arg Arg Arg Lys Ser Ala Val Pro Leu Met Gly Thr Val Pro Leu
580 585 590
Thr Asn Gln Gln Asn Asn Ile Ser Ser Ser Ser Val Asn Ser Thr Gly
595 600 605
Asn Gly Ala Gly Val Thr Lys Glu Arg Arg Pro Ser Tyr Arg Arg Lys
610 615 620
Ser Met Thr Pro Ser Arg Arg Ser Ser Val Val Ile Glu Ser Thr Lys
625 630 635 640
Glu Leu Glu Glu Lys Pro Phe His Cys His Ile Cys Pro Lys Ser Phe
645 650 655
Lys Arg Ser Glu His Leu Lys Arg His Val Arg Ser Val His Ser Asn
660 665 670
Glu Arg Pro Phe Ala Cys His Ile Cys Asp Lys Lys Phe Ser Arg Ser
675 680 685
Asp Asn Leu Ser Gln His Ile Lys Thr His Lys Lys His Gly Asp Ile
690 695 700
<210> 22
<211> 694
<212> PRT
<213> 乳酸克鲁维酵母
<400> 22
Met Ala Leu Gly Arg Tyr Glu Ser Gly Asn Arg Gly Ser Tyr Thr Ser
1 5 10 15
Glu Asn Ser Leu Asp Ile Arg Asn Asp Ser Val Ser Thr Asn Tyr Gly
20 25 30
Asp Lys Val Ala Thr Glu Pro Thr Leu Gly Tyr Thr Arg Arg Asn Glu
35 40 45
Ser Thr Gly Ser Thr Pro Pro Ala Val Arg Asn Val Lys Arg Glu Thr
50 55 60
Leu Gln Asn Asn Met Gly Ser Thr Pro Thr Glu Leu Asn Asp Phe Leu
65 70 75 80
Ala Met Leu Asp Asp Lys Thr Thr Tyr Ser Glu Val Val Gln Ser Ala
85 90 95
Glu Pro Arg Leu Gly Phe Glu Asp Arg Gln Lys Ser Thr Glu Tyr His
100 105 110
Thr Gly Ser Glu Leu Ser Gly Asn Ser Asn Gly Ile Ala Leu Ser Gly
115 120 125
Ser Pro Val Asp Ser Tyr Pro Asn Ser Gln Lys Ile Ser Asn His Ser
130 135 140
Ser Arg Asn Asn Thr Leu Asn Tyr Ser Pro Asn Ile Glu Pro Ser Val
145 150 155 160
Met Ser Val Gly Thr Leu Ser Pro Gln Val Ala Asp Ile Ser Ser Arg
165 170 175
Lys Asn Ser Thr Val Gly Asn Ser Leu Asn Ser Asn Ser Ile Gln Glu
180 185 190
Phe Leu Asn Gln Ile Asp Leu Ser His Ser Glu Glu Gln Tyr Ile Asn
195 200 205
Pro Tyr Leu Leu Asn Lys Glu Ser Tyr Ser Thr Asn Asn Asn Thr Asn
210 215 220
Asn Gly His Asn Ser Phe Glu Val Thr His Ser Asp Ser Leu Phe Met
225 230 235 240
Asp Ser Gly Ala Asp Ala Glu Ala Glu Asp His Gly Glu Leu Asn Gln
245 250 255
Leu Asn Glu Asn Pro Leu Leu Leu Asp Asp Val Thr Val Ser Pro Asn
260 265 270
Pro Thr Ser Asp Asp Arg Arg Arg Met Ser Glu Val Val Asn Gly Asn
275 280 285
Ile Ala Tyr Pro Ala His Ser Arg Gly Ser Ile Ser His Gln Val Asp
290 295 300
Phe Trp Asn Leu Gly Ser Gly Asn Pro Ile Ser Ser Asn Gln Asn Gln
305 310 315 320
Ser Ser Asn Ser Gln Val Gln Gln Asp Asn Asn Ser Glu Leu Phe Asp
325 330 335
Leu Met Ser Phe Lys Asn Lys Gly Arg Gln His Leu Gln Gln Gln Leu
340 345 350
Gln Gln Gln Gln Gln Gln Ala Gln Leu Gln Ser Gln Met His Arg Gln
355 360 365
Gln Ile Gln Gln Arg Gln Gln His Gln Gln Gln Gln Ser Gln Gln Arg
370 375 380
His Ser Ala Phe Lys Ile Asp Asn Glu Leu Thr Gln Leu Leu Asn Ala
385 390 395 400
Tyr Asn Met Thr Gln Ser Asn Leu Pro Ser Asn Gly Ser Asn Ile Asn
405 410 415
Thr Asn Lys Leu Arg Thr Gly Ser Phe Thr Gln Ser Asn Val Lys Arg
420 425 430
Ser Asn Ser Ser Asn Gln Glu Ala His Asn Arg Val Gly Lys Gln Arg
435 440 445
Tyr Ser Met Ser Leu Leu Asp Gly Asn Gln Asp Val Ile Ser Lys Leu
450 455 460
Tyr Gly Asp Met Thr Arg Asn Gly Leu Ser Trp Glu Asn Ala Ile Ile
465 470 475 480
Ser Asp Asp Glu Glu Asp Pro Glu Asp His Glu Asp Ala Leu Arg Leu
485 490 495
Arg Arg Lys Ser Ala Leu Asn Arg Ser Thr Gln Val Ala Ser Gln Asn
500 505 510
Pro Thr Glu Thr Ser Ser Ser Gly Arg Phe Ile Ser Pro Gln Leu Leu
515 520 525
Asn Asn Asp Pro Leu Leu Glu Thr Gln Ile Ser Thr Ser Gln Thr Ser
530 535 540
Leu Gly Leu Asp Arg Ala Gly Leu Asn Phe Lys Leu Asn Leu Pro Ile
545 550 555 560
Thr Asn Pro Glu Ala Leu Ile Gly Ser Ser Gln Pro Asp Val Gln Thr
565 570 575
Leu Asn Val Tyr Ser Glu Ser Asn Val Leu Pro Thr Ser Ala Gln Ser
580 585 590
Thr Thr Thr Lys Lys Lys Arg Ser Ser Met Ser Lys Ser Lys Gly Pro
595 600 605
Lys Ser Thr Ser Pro Met Asp Glu Glu Glu Lys Pro Phe Lys Cys Asp
610 615 620
Gln Cys Asn Lys Thr Phe Arg Arg Ser Glu His Leu Lys Arg His Val
625 630 635 640
Arg Ser Val His Ser Thr Glu Arg Pro Phe His Cys Gln Phe Cys Asp
645 650 655
Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser Gln His Leu Lys Thr His
660 665 670
Lys Lys His Gly Asp Ile Thr Glu Leu Pro Pro Pro Arg Arg Val Thr
675 680 685
Asn Ser Ser Asn Lys His
690
<210> 23
<211> 474
<212> PRT
<213> 乳酸克鲁维酵母
<400> 23
Met Asn Pro Thr Met Tyr Gln Asn Asp Phe Val Thr Ile Ser Gln Glu
1 5 10 15
Thr Leu Arg Asp Gly Thr Met Phe Asn Leu Gln Leu Lys Arg Thr Pro
20 25 30
Pro Ala Asp Asn Met Asp Asn Ser Asn Ile Gly Ala Asn Lys Tyr Asn
35 40 45
Gln Trp Gln Phe Asp Tyr Glu Glu Gln Glu Leu Ser Asn Asp Leu Thr
50 55 60
Gly Lys Thr Leu Glu Asp Glu Ile Phe Ser Phe Gln Gln Gly Thr Ser
65 70 75 80
Ile Arg Ala Met Gly Asp Asp Ile Arg Arg Leu Ser Ile Ser Glu Tyr
85 90 95
His Arg Asp Asp Pro Met Tyr Tyr Glu Tyr Glu Phe Phe Asn Lys Asp
100 105 110
Val Met Asn Gly Ser Ser Ser Arg Val Gly Asn Leu Gly Gly Met Gly
115 120 125
Ser Ser Arg Ser Gly Ser Val Phe Ser Asp Glu Asp Asn Glu Phe Asp
130 135 140
Ile Asp Met Asp Gln Glu Ser Ile Phe Val Asn Val Gly Ser Lys Ser
145 150 155 160
Val Asn Asp Ala Thr Gln Thr Val Pro His Thr Thr Asn Ser Met Ala
165 170 175
Leu Leu Leu Ser Gly Leu Asp Glu Asp Val Ser Met Asn Leu Asp Leu
180 185 190
Asp Asp Glu Asn Asp Gly Thr Gly Asn Ser Gly Val Lys Lys Leu Phe
195 200 205
Lys Leu Asn Lys Met Phe Arg Asn Asn Asn Asn Arg Asp Leu Ile Ser
210 215 220
Asp Asp Glu Pro Gln Gln Ile Phe Lys Lys Lys Tyr Phe Trp Ser Arg
225 230 235 240
Lys Pro Thr Val Pro Ile Leu Arg Asn Ser Glu Pro Val Ser Thr Ser
245 250 255
His Gly Ala Gly Leu Pro His Ala His Ala Glu His Ala Pro Ala Thr
260 265 270
Val Ser Ser His Asn Ala Glu Phe Asp Asp Asp Glu Met Thr Asp Val
275 280 285
Glu Thr Gly Asn Pro Ser Met Ala Ala Ala Ile Val Asn Pro Ile Lys
290 295 300
Leu Leu Ala Thr Gly Glu Thr Lys Asn Asp Ser Asp Leu Ile Thr Leu
305 310 315 320
Ser Ser His Ser Thr Lys Ile Asn Ser Leu Glu Pro Asp Leu Ile Leu
325 330 335
Ser Ser Asn Ser Ser Ile Met Ser Ala Val Lys Lys Asn Thr Thr Gly
340 345 350
Ser Arg Ser Ile Ser Ser Ala Ser Ser Ser Leu Leu Ser Pro Pro Pro
355 360 365
Met Val Gln Val Lys Lys Ala Glu Ser Leu Ser Leu Ala Lys Val Ile
370 375 380
Ser Ser Lys Asp Ser Ile Ser Thr Ile Ile Lys Lys Gln Gln Gly Val
385 390 395 400
Pro Lys Thr Arg Gly Arg Lys Pro Ser Pro Ile Leu Asp Ala Ser Lys
405 410 415
Pro Phe Gly Cys Glu Tyr Cys Asp Arg Arg Phe Lys Arg Gln Glu His
420 425 430
Leu Lys Arg His Ile Arg Ser Leu His Ile Cys Glu Lys Pro Tyr Gly
435 440 445
Cys His Leu Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser Gln
450 455 460
His Leu Lys Thr His Thr His Glu Asp Lys
465 470
<210> 24
<211> 1008
<212> PRT
<213> 博伊丁假丝酵母
<400> 24
Met Asn Thr Thr Thr Thr Pro Asn Ser Asn Ser Ser Ser Ser Ser Asn
1 5 10 15
Asn Ser Ile Gly Met Gly Ile Asn Thr Gly Asn Ser Glu Leu Leu Ser
20 25 30
Phe Thr Gln Ser Ile Leu Ser Ser Ser Thr Ser Asp Val Val Ser Asp
35 40 45
Ser Gly Thr Ile Leu Ser Asp Ser Val Ser Thr Ile Lys Asn Tyr Asn
50 55 60
Ile Thr Asn Asn Asn Asn Asn Lys Asn Asn Asn Asn Asn Thr Asn Thr
65 70 75 80
Pro Ser Pro Asn Asn Asn Tyr Lys Leu Ser Asp Thr Tyr Asn Tyr Asn
85 90 95
Thr Asn Thr Ile Pro Asn Asn Thr Ser Tyr Asn Leu Asp Pro Met Ser
100 105 110
Asn Ser Asn Ser Gln Asn Thr Asn Thr Thr Ser Ala Asp Asp Thr Asp
115 120 125
Leu Tyr Ser Ala Ala Ile Gly Ser Val Ser Asn Ser Asn Lys Thr Ile
130 135 140
Thr Thr Asn Asn Asn Asn Asn Ile Asn Asn Asn Asn Lys Leu Asp Tyr
145 150 155 160
Glu Asp Leu Asn Val Leu Ile Asn Tyr Asp Leu Glu Ser Ile Asn Cys
165 170 175
Leu Ala Asp Gln Gln Pro Arg Asp Lys Asp Met Asn Ile Ile Asp Leu
180 185 190
Phe Cys Asp Leu Ala Thr Ser Asn Asp Asn Ile Val Thr Asn Met Ala
195 200 205
Asp Asn Val Ser Ile Thr Asn Thr Ile Thr Thr Asn Asn Thr Ser Thr
210 215 220
Thr Asn Thr Pro Thr Asp Leu Asn Leu Asn Pro Val Phe Gln Thr Phe
225 230 235 240
Pro Ser Pro Ser Ser Val Asn Thr Lys Gln Phe Val His Pro Gln Ser
245 250 255
Ile Arg Lys Ser Asn Lys Gln Phe Ser Ser Gln Tyr His Val Gln Tyr
260 265 270
Ser Pro Gln Gln Gln Gln Gln Gln Leu Gln Gln Leu Gln Phe Gln Gln
275 280 285
Leu Gln Ala Gln Leu Lys Ile Gln Ser Gln Leu Glu Thr His Leu Gln
290 295 300
Gln Gln His Gln Gln Gln Ser Gln Leu Gln Ser Gln Gln Ser Leu Glu
305 310 315 320
Asn Gly Asn Phe Pro Ile Phe Asp Ser Phe Ser Asn Asp Leu Ser Lys
325 330 335
Thr Leu Pro Ser Ala Thr Thr Pro Val Leu Gln Gln Gln Gln Gln Gln
340 345 350
Gln Leu Gln Gln Gln His Leu Gln Gln Gln Ala His Ile Phe Thr Gly
355 360 365
Ser Thr Ser Pro Gly Tyr Thr Pro Ser Leu Leu Ser Gly Ser Asn Phe
370 375 380
Ser Val Ser Ser Lys Arg Ser Ser Phe Ser Ser Asn Ser Asn Asp Ser
385 390 395 400
Pro Asn Pro Asn Pro Tyr His Gln Leu Ser Lys Leu Asn Pro Ser Thr
405 410 415
Asn Asn Asn Asn Thr Asn Ile Asn Ile Asn Gln Ile Ile Ala Asn Glu
420 425 430
Asn Thr Ser Leu Thr Thr Ala Ser Pro Asp Leu Phe Ser Lys Ala Tyr
435 440 445
Met Leu Asp Asp Met Asp Pro Ser Gln Gln Lys Tyr Gln His Gln Arg
450 455 460
Ala Ser Ser Ser Ser Ser Thr Thr Ile Thr Pro Thr Leu Pro Gly Thr
465 470 475 480
Asn Ser Ser Ser Ser Phe Ala Phe Thr Tyr Thr Asp Asp Leu Asp Arg
485 490 495
Leu Arg Lys Glu Ala Glu Leu Asp His Phe Asp Thr Asn Thr Ala Lys
500 505 510
Asp Ala Ile Ile Ser Asn Asn Gln Lys Phe Pro Ser Leu Arg Tyr Pro
515 520 525
Tyr Leu Ser Ser Ile Ile Thr Asn Lys Lys Asn Tyr Asp Arg Thr Ile
530 535 540
Asn Pro Arg Glu Ile Ile Ser Asp Tyr Ser Val Leu Thr Ala Pro Asn
545 550 555 560
Ser Thr Thr Ser Pro Asn Asp Leu Gln Ser Leu Lys Asn Asn Pro Leu
565 570 575
Ile Ser Asn Phe Asp Ser Asn Ala Ser Lys Leu Leu Asp Asn Glu Asn
580 585 590
Glu Ser Val Lys Ser Leu Phe Asn Gln Ser Phe Ala Phe Gly Glu Phe
595 600 605
Asp Gln Thr Ser Asn Asn Asn Ser Ser Thr Thr Ser Asn Asn Asn Thr
610 615 620
Thr Asn Gly Asn Asn Ser Phe Tyr Ser Gly Asn Phe Thr Ala Glu Leu
625 630 635 640
Arg Ser Asn Ser Asn Asn Thr Asn Gln Leu Phe Asn Ala Ile Arg Lys
645 650 655
Asn Pro Asp Leu Trp Asn Ser Tyr Asn Met Asp Asn Asn Asn Asn Asp
660 665 670
Asn Ala Ala Asp Arg Ser Asp Ser Asn Ser Lys Pro Val Met Val Asn
675 680 685
Asn Lys Pro Leu Ile Ser Pro Ser Leu Pro Ser Ser Ser Ser Val Ser
690 695 700
Ser Val Val Ser Ser Val Val Pro Lys Asn Ala Asp Pro Asn Cys Leu
705 710 715 720
Leu Thr Pro Asn Thr Ser Thr Ser Asn Ile Ser Ser Pro Ile Pro Pro
725 730 735
Ser Gln Leu Ser Thr Asn Thr Ser Ser Gly Ser Asn Ser Gln Tyr Ala
740 745 750
Val Asn Leu Gln His Arg Lys Arg Tyr Ser Thr Ser Ser Ile Ile Thr
755 760 765
Asp His Leu Thr Gly Thr Thr Gly Ile Thr Ala Pro Asn Thr Ser His
770 775 780
Pro Asn Arg Ile Ile Asn Pro Arg Ser Arg Ser Arg Ser Arg Ser Arg
785 790 795 800
His Gly Ser Phe Ala Ser Val Ser Asn Glu Arg Pro Thr Leu Ala Leu
805 810 815
Ile Asn Ser Asn Ser Thr Asn Ser Ile Val Asn Ser Asn Asn Ser Ser
820 825 830
Ser Ser Ile Lys Lys Leu Ser His Gly Ser Ile Asn Ser Ser Val Thr
835 840 845
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Asn Asn Ser Ser
850 855 860
Lys Lys Arg Thr Lys Ser Leu Glu Ile Gln Ser Ile Ser Ser Val Asn
865 870 875 880
Ile Arg Asn Ser Leu Leu Ala Ser Leu Lys Gly Asn Pro Ile Asp Glu
885 890 895
Ser Pro Phe Asp Val Glu Asn Ser Asn Ser Gly Gly Gly Gly Asn Ser
900 905 910
Met Ala Gly Gly Gly Ile Thr Arg Leu Arg Ala Ser Ser Gly Ser Thr
915 920 925
Ser Ser Arg Arg Ser Ser Ser Ser Asn Thr Asp Ala Asn Ser Ser Gly
930 935 940
Ile Gly Leu Asp Asp Gly Phe Lys Pro Phe Arg Cys Ser Leu Cys Glu
945 950 955 960
Lys Ser Phe Lys Arg Gln Glu His Leu Lys Arg His His Arg Ser Val
965 970 975
His Ser Gly Glu Lys Pro His Ile Cys Gln Thr Cys Asp Lys Arg Phe
980 985 990
Ser Arg Thr Asp Asn Leu Ala Gln His Leu Arg Thr His Arg Asn Arg
995 1000 1005
<210> 25
<211> 612
<212> PRT
<213> 黑曲霉
<400> 25
Met Asp Gly Thr Tyr Thr Met Ala Pro Thr Ser Val Gln Gly Gln Pro
1 5 10 15
Ser Phe Ala Tyr Tyr Ala Asp Ser Gln Gln Arg Gln His Phe Thr Ser
20 25 30
His Pro Ser Asp Met Gln Ser Tyr Tyr Gly Gln Val Gln Ala Phe Gln
35 40 45
Gln Gln Pro Gln His Cys Met Pro Glu Gln Gln Thr Leu Tyr Thr Ala
50 55 60
Pro Leu Met Asn Met His Gln Met Ala Thr Thr Asn Ala Phe Arg Gly
65 70 75 80
Ala Met Asn Met Thr Pro Ile Ala Ser Pro Gln Pro Ser His Leu Lys
85 90 95
Pro Thr Ile Val Val Gln Gln Gly Ser Pro Ala Leu Met Pro Leu Asp
100 105 110
Thr Arg Phe Val Gly Asn Asp Tyr Tyr Ala Phe Pro Ser Thr Pro Pro
115 120 125
Leu Ser Thr Ala Gly Ser Ser Ile Ser Ser Pro Pro Ser Thr Ser Gly
130 135 140
Thr Leu His Thr Pro Ile Asn Asp Ser Phe Phe Ala Phe Glu Lys Val
145 150 155 160
Glu Gly Val Lys Glu Gly Cys Glu Gly Asp Val His Ala Glu Ile Leu
165 170 175
Ala Asn Ala Asp Trp Ala Arg Ser Asp Ser Pro Pro Leu Thr Pro Val
180 185 190
Phe Ile His Pro Pro Ser Leu Thr Ala Ser Gln Thr Ser Glu Leu Leu
195 200 205
Ser Ala His Ser Ser Cys Pro Ser Leu Ser Pro Ser Pro Ser Pro Val
210 215 220
Val Pro Thr Phe Val Ala Gln Pro Gln Gly Leu Pro Thr Glu Gln Ser
225 230 235 240
Ser Ser Asp Phe Cys Asp Pro Arg Gln Leu Thr Val Glu Ser Ser Ile
245 250 255
Asn Ala Thr Pro Ala Glu Leu Pro Pro Leu Pro Thr Leu Ser Cys Asp
260 265 270
Asp Glu Glu Pro Arg Val Val Leu Gly Ser Glu Ala Val Thr Leu Pro
275 280 285
Val His Glu Thr Leu Ser Pro Ala Phe Thr Cys Ser Ser Ser Glu Asp
290 295 300
Pro Leu Ser Ser Leu Pro Thr Phe Asp Ser Phe Ser Asp Leu Asp Ser
305 310 315 320
Glu Asp Glu Phe Val Asn Arg Leu Val Asp Phe Pro Pro Ser Gly Asn
325 330 335
Ala Tyr Tyr Leu Gly Glu Lys Arg Gln Arg Val Gly Thr Thr Tyr Pro
340 345 350
Leu Glu Glu Glu Glu Phe Phe Ser Glu Gln Ser Phe Asp Glu Ser Asp
355 360 365
Glu Gln Asp Leu Ser Gln Ser Ser Leu Pro Tyr Leu Gly Ser His Asp
370 375 380
Phe Thr Gly Val Gln Thr Asn Ile Asn Glu Ala Ser Glu Glu Met Gly
385 390 395 400
Asn Lys Lys Arg Asn Asn Arg Lys Ser Leu Lys Arg Ala Ser Thr Ser
405 410 415
Asp Ser Glu Thr Asp Ser Ile Ser Lys Lys Ser Gln Pro Ser Ile Asn
420 425 430
Ser Arg Ala Thr Ser Thr Glu Thr Asn Ala Ser Thr Pro Gln Thr Val
435 440 445
Gln Ala Arg His Asn Ser Asp Ala His Ser Ser Cys Ala Ser Glu Ala
450 455 460
Pro Ala Ala Pro Val Ser Val Asn Arg Arg Gly Arg Lys Gln Ser Leu
465 470 475 480
Thr Asp Asp Pro Ser Lys Thr Phe Val Cys Thr Leu Cys Ser Arg Arg
485 490 495
Phe Arg Arg Gln Glu His Leu Lys Arg His Tyr Arg Ser Leu His Thr
500 505 510
Gln Asp Lys Pro Phe Glu Cys Asn Glu Cys Gly Lys Lys Phe Ser Arg
515 520 525
Ser Asp Asn Leu Ala Gln His Ala Arg Thr His Ala Gly Gly Ser Val
530 535 540
Val Met Gly Val Ile Asp Thr Gly Asn Ala Thr Pro Pro Thr Pro Tyr
545 550 555 560
Glu Glu Arg Asp Pro Ser Thr Leu Gly Asn Val Leu Tyr Glu Ala Ala
565 570 575
Asn Ala Ala Ala Thr Lys Ser Thr Thr Ser Glu Ser Asp Glu Ser Ser
580 585 590
Ser Asp Ser Pro Val Ala Asp Arg Arg Ala Pro Lys Lys Arg Lys Arg
595 600 605
Asp Ser Asp Ala
610
<210> 26
<211> 443
<212> PRT
<213> 酿酒酵母
<400> 26
Met Ser Leu Tyr Pro Leu Gln Arg Phe Glu Ser Asn Asp Thr Val Phe
1 5 10 15
Ser Tyr Thr Leu Asn Ser Lys Thr Glu Leu Phe Asn Glu Ser Arg Asn
20 25 30
Asn Asp Lys Gln His Phe Thr Leu Gln Leu Ile Pro Asn Ala Asn Ala
35 40 45
Asn Ala Lys Glu Ile Asp Asn Asn Asn Val Glu Ile Ile Asn Asp Leu
50 55 60
Thr Gly Asn Thr Ile Val Asp Asn Cys Val Thr Thr Ala Thr Ser Ser
65 70 75 80
Asn Gln Leu Glu Arg Arg Leu Ser Ile Ser Asp Tyr Arg Thr Glu Asn
85 90 95
Gly Asn Tyr Tyr Glu Tyr Glu Phe Phe Gly Arg Arg Glu Leu Asn Glu
100 105 110
Pro Leu Phe Asn Asn Asp Ile Val Glu Asn Asp Asp Asp Ile Asp Leu
115 120 125
Asn Asn Glu Ser Asp Val Leu Met Val Ser Asp Asp Glu Leu Glu Val
130 135 140
Asn Glu Arg Phe Ser Phe Leu Lys Gln Gln Pro Leu Asp Gly Leu Asn
145 150 155 160
Arg Ile Ser Ser Thr Asn Asn Leu Lys Asn Leu Glu Ile His Glu Phe
165 170 175
Ile Ile Asp Pro Thr Glu Asn Ile Asp Asp Glu Leu Glu Asp Ser Phe
180 185 190
Thr Thr Val Pro Gln Ser Lys Lys Lys Val Arg Asp Tyr Phe Lys Leu
195 200 205
Asn Ile Phe Gly Ser Ser Ser Ser Ser Asn Asn Asn Ser Asn Ser Leu
210 215 220
Gly Cys Glu Pro Ile Gln Thr Glu Asn Ser Ser Ser Gln Lys Met Phe
225 230 235 240
Lys Asn Arg Phe Phe Arg Ser Arg Lys Ser Thr Leu Ile Lys Ser Leu
245 250 255
Pro Leu Glu Gln Glu Asn Glu Val Leu Ile Asn Ser Gly Phe Asp Val
260 265 270
Ser Ser Asn Glu Glu Ser Asp Glu Ser Asp His Ala Ile Ile Asn Pro
275 280 285
Leu Lys Leu Val Gly Asn Asn Lys Asp Ile Ser Thr Gln Ser Ile Ala
290 295 300
Lys Thr Thr Asn Pro Phe Lys Ser Gly Ser Asp Phe Lys Met Ile Glu
305 310 315 320
Pro Val Ser Lys Phe Ser Asn Asp Ser Arg Lys Asp Leu Leu Ala Ala
325 330 335
Ile Ser Glu Pro Ser Ser Ser Pro Ser Pro Ser Ala Pro Ser Pro Ser
340 345 350
Val Gln Ser Ser Ser Ser Ser His Gly Leu Val Val Arg Lys Lys Thr
355 360 365
Gly Ser Met Gln Lys Thr Arg Gly Arg Lys Pro Ser Leu Ile Pro Asp
370 375 380
Ala Ser Lys Gln Phe Gly Cys Glu Phe Cys Asp Arg Arg Phe Lys Arg
385 390 395 400
Gln Glu His Leu Lys Arg His Val Arg Ser Leu His Met Cys Glu Lys
405 410 415
Pro Phe Thr Cys His Ile Cys Asn Lys Asn Phe Ser Arg Ser Asp Asn
420 425 430
Leu Asn Gln His Val Lys Thr His Ala Ser Leu
435 440
<210> 27
<211> 144
<212> PRT
<213> 人工序列
<220>
<223> synMSN4
<400> 27
Met Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr Pro
1 5 10 15
Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Asp Ala Leu Asp Asp
20 25 30
Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu
35 40 45
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
50 55 60
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Gly Gly
65 70 75 80
Gly Ser Asn Ser Asp Asp Glu Lys Gln Phe Arg Cys Thr Asp Cys Ser
85 90 95
Arg Arg Phe Arg Arg Ser Glu His Leu Lys Arg His His Arg Ser Val
100 105 110
His Ser Asn Glu Arg Pro Phe His Cys Ala His Cys Asp Lys Arg Phe
115 120 125
Ser Arg Ser Asp Asn Leu Ser Gln His Leu Arg Thr His Arg Lys Gln
130 135 140
<210> 28
<211> 678
<212> PRT
<213> Komagataella phaffii
<400> 28
Met Leu Ser Leu Lys Pro Ser Trp Leu Thr Leu Ala Ala Leu Met Tyr
1 5 10 15
Ala Met Leu Leu Val Val Val Pro Phe Ala Lys Pro Val Arg Ala Asp
20 25 30
Asp Val Glu Ser Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr
35 40 45
Tyr Ser Cys Val Gly Val Met Lys Ser Gly Arg Val Glu Ile Leu Ala
50 55 60
Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val Ser Phe Thr Glu
65 70 75 80
Asp Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Leu Ala Ala Ser Asn
85 90 95
Pro Lys Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly Met Lys Tyr
100 105 110
Asp Ala Pro Glu Val Gln Arg Asp Leu Lys Arg Leu Pro Tyr Thr Val
115 120 125
Lys Ser Lys Asn Gly Gln Pro Val Val Ser Val Glu Tyr Lys Gly Glu
130 135 140
Glu Lys Ser Phe Thr Pro Glu Glu Ile Ser Ala Met Val Leu Gly Lys
145 150 155 160
Met Lys Leu Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr His Ala
165 170 175
Val Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr
180 185 190
Lys Asp Ala Gly Leu Ile Ala Gly Leu Thr Val Leu Arg Ile Val Asn
195 200 205
Glu Pro Thr Ala Ala Ala Leu Ala Tyr Gly Leu Asp Lys Thr Gly Glu
210 215 220
Glu Arg Gln Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val
225 230 235 240
Ser Leu Leu Ser Ile Glu Gly Gly Ala Phe Glu Val Leu Ala Thr Ala
245 250 255
Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Tyr Arg Val Val Arg
260 265 270
His Phe Val Lys Ile Phe Lys Lys Lys His Asn Ile Asp Ile Ser Asn
275 280 285
Asn Asp Lys Ala Leu Gly Lys Leu Lys Arg Glu Val Glu Lys Ala Lys
290 295 300
Arg Thr Leu Ser Ser Gln Met Thr Thr Arg Ile Glu Ile Asp Ser Phe
305 310 315 320
Val Asp Gly Ile Asp Phe Ser Glu Gln Leu Ser Arg Ala Lys Phe Glu
325 330 335
Glu Ile Asn Ile Glu Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Gln
340 345 350
Val Leu Lys Asp Ala Gly Val Lys Lys Ser Glu Ile Asp Asp Ile Val
355 360 365
Leu Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Gln Leu Leu Glu
370 375 380
Asp Tyr Phe Asp Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu
385 390 395 400
Ala Val Ala Tyr Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu
405 410 415
Glu Gly Val Asp Asp Ile Val Leu Leu Asp Val Asn Pro Leu Thr Leu
420 425 430
Gly Ile Glu Thr Thr Gly Gly Val Met Thr Thr Leu Ile Asn Arg Asn
435 440 445
Thr Ala Ile Pro Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Ala Asp
450 455 460
Asn Gln Pro Thr Val Leu Ile Gln Val Tyr Glu Gly Glu Arg Ala Leu
465 470 475 480
Ala Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile Pro
485 490 495
Pro Ala Pro Arg Gly Thr Pro Gln Val Glu Val Thr Phe Val Leu Asp
500 505 510
Ala Asn Gly Ile Leu Lys Val Ser Ala Thr Asp Lys Gly Thr Gly Lys
515 520 525
Ser Glu Ser Ile Thr Ile Asn Asn Asp Arg Gly Arg Leu Ser Lys Glu
530 535 540
Glu Val Asp Arg Met Val Glu Glu Ala Glu Lys Tyr Ala Ala Glu Asp
545 550 555 560
Ala Ala Leu Arg Glu Lys Ile Glu Ala Arg Asn Ala Leu Glu Asn Tyr
565 570 575
Ala His Ser Leu Arg Asn Gln Val Thr Asp Asp Ser Glu Thr Gly Leu
580 585 590
Gly Ser Lys Leu Asp Glu Asp Asp Lys Glu Thr Leu Thr Asp Ala Ile
595 600 605
Lys Asp Thr Leu Glu Phe Leu Glu Asp Asn Phe Asp Thr Ala Thr Lys
610 615 620
Glu Glu Leu Asp Glu Gln Arg Glu Lys Leu Ser Lys Ile Ala Tyr Pro
625 630 635 640
Ile Thr Ser Lys Leu Tyr Gly Ala Pro Glu Gly Gly Thr Pro Pro Gly
645 650 655
Gly Gln Gly Phe Asp Asp Asp Asp Gly Asp Phe Asp Tyr Asp Tyr Asp
660 665 670
Tyr Asp His Asp Glu Leu
675
<210> 29
<211> 677
<212> PRT
<213> Komagataella pastoris
<400> 29
Met Gln Ser Leu Lys Pro Ser Trp Leu Thr Leu Ala Ala Leu Leu Tyr
1 5 10 15
Ala Met Leu Met Val Val Val Pro Phe Ala Lys Pro Val Arg Ala Asp
20 25 30
Asp Val Glu Ser Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr
35 40 45
Tyr Ser Cys Val Gly Val Met Lys Ser Gly Arg Val Glu Ile Leu Ala
50 55 60
Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val Ser Phe Thr Glu
65 70 75 80
Asp Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Leu Ala Ala Ser Asn
85 90 95
Pro Lys Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly Met Lys Phe
100 105 110
Asp Ser Pro Glu Val Gln Arg Asp Leu Lys Arg Leu Pro Tyr Ser Val
115 120 125
Lys Ser Lys Asn Gly Gln Pro Ile Val Ser Val Glu Tyr Lys Gly Glu
130 135 140
Glu Lys Ser Phe Thr Pro Glu Glu Ile Ser Ala Met Val Leu Gly Lys
145 150 155 160
Met Lys Leu Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr His Ala
165 170 175
Val Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr
180 185 190
Lys Asp Ala Gly Leu Ile Ala Gly Leu Thr Val Leu Arg Ile Val Asn
195 200 205
Glu Pro Thr Ala Ala Ala Leu Ala Tyr Gly Leu Asp Lys Thr Gly Glu
210 215 220
Glu Arg Gln Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val
225 230 235 240
Ser Leu Leu Ser Ile Glu Gly Gly Ala Phe Glu Val Leu Ala Thr Ala
245 250 255
Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Tyr Arg Val Val Arg
260 265 270
His Phe Val Lys Ile Phe Lys Lys Lys His Asn Ile Asp Ile Ser Asp
275 280 285
Asn Asp Lys Ala Leu Gly Lys Leu Lys Arg Glu Val Glu Lys Ala Lys
290 295 300
Arg Thr Leu Ser Ser Gln Met Thr Thr Arg Ile Glu Ile Asp Ser Phe
305 310 315 320
Val Asp Gly Ile Asp Phe Ser Glu Gln Leu Ser Arg Ala Lys Phe Glu
325 330 335
Glu Ile Asn Ile Glu Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Gln
340 345 350
Val Leu Lys Asp Ala Gly Val Lys Lys Ser Glu Ile Asp Asp Ile Val
355 360 365
Leu Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Gln Leu Leu Glu
370 375 380
Asp Phe Phe Asp Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu
385 390 395 400
Ala Val Ala Tyr Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu
405 410 415
Glu Gly Val Asp Asp Ile Val Leu Leu Asp Val Asn Pro Leu Thr Leu
420 425 430
Gly Ile Glu Thr Thr Gly Gly Val Met Thr Thr Leu Ile Asn Arg Asn
435 440 445
Thr Ala Ile Pro Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Ala Asp
450 455 460
Asn Gln Pro Thr Val Leu Ile Gln Val Tyr Glu Gly Glu Arg Ala Leu
465 470 475 480
Ala Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile Pro
485 490 495
Pro Ala Pro Arg Gly Thr Pro Gln Val Glu Val Thr Phe Val Leu Asp
500 505 510
Ala Asn Gly Ile Leu Lys Val Ser Ala Thr Asp Lys Gly Thr Gly Lys
515 520 525
Ser Glu Ser Ile Thr Ile Asn Asn Asp Arg Gly Arg Leu Ser Lys Glu
530 535 540
Glu Val Asp Arg Met Val Glu Glu Ala Glu Lys Tyr Ala Ala Glu Asp
545 550 555 560
Ala Ala Leu Arg Glu Lys Ile Glu Ala Arg Asn Ala Leu Glu Asn Tyr
565 570 575
Ala His Ser Leu Arg Asn Gln Val Thr Asp Asp Ser Glu Thr Gly Leu
580 585 590
Gly Ser Lys Leu Asp Glu Asp Asp Lys Glu Thr Leu Thr Asp Ala Ile
595 600 605
Lys Asp Thr Leu Glu Phe Leu Glu Asp Asn Phe Asp Thr Ala Thr Lys
610 615 620
Glu Glu Leu Asp Glu Gln Arg Glu Lys Leu Ser Lys Ile Ala Tyr Pro
625 630 635 640
Ile Thr Ser Lys Leu Tyr Gly Ala Pro Glu Gly Gly Ala Pro Pro Gly
645 650 655
Gln Gly Phe Asp Asp Asp Asp Gly Asp Phe Asp Tyr Asp Tyr Asp Tyr
660 665 670
Asp His Asp Glu Leu
675
<210> 30
<211> 670
<212> PRT
<213> 解脂耶氏酵母
<400> 30
Met Lys Phe Ser Met Pro Ser Trp Gly Val Val Phe Tyr Ala Leu Leu
1 5 10 15
Val Cys Leu Leu Pro Phe Leu Ser Lys Ala Gly Val Gln Ala Asp Asp
20 25 30
Val Asp Ser Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr Tyr
35 40 45
Ser Cys Val Gly Val Met Lys Gly Gly Arg Val Glu Ile Leu Ala Asn
50 55 60
Asp Gln Gly Ser Arg Ile Thr Pro Ser Tyr Val Ala Phe Thr Glu Asp
65 70 75 80
Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Gln Ala Ala Asn Asn Pro
85 90 95
Phe Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly Leu Lys Tyr Lys
100 105 110
Asp Glu Ser Val Gln Arg Asp Ile Lys His Phe Pro Tyr Lys Val Lys
115 120 125
Asn Lys Asp Gly Lys Pro Val Val Val Val Glu Thr Lys Gly Glu Lys
130 135 140
Lys Thr Tyr Thr Pro Glu Glu Ile Ser Ala Met Ile Leu Thr Lys Met
145 150 155 160
Lys Asp Ile Ala Gln Asp Tyr Leu Gly Lys Lys Val Thr His Ala Val
165 170 175
Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr Lys
180 185 190
Asp Ala Gly Ile Ile Ala Gly Leu Asn Val Leu Arg Ile Val Asn Glu
195 200 205
Pro Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp His Thr Asp Asp Glu
210 215 220
Lys Gln Ile Val Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val Ser
225 230 235 240
Leu Leu Ser Ile Glu Ser Gly Val Phe Glu Val Leu Ala Thr Ala Gly
245 250 255
Asp Thr His Leu Gly Gly Glu Asp Phe Asp Tyr Arg Val Ile Lys His
260 265 270
Phe Val Lys Gln Tyr Asn Lys Lys His Asp Val Asp Ile Thr Lys Asn
275 280 285
Ala Lys Thr Ile Gly Lys Leu Lys Arg Glu Val Glu Lys Ala Lys Arg
290 295 300
Thr Leu Ser Ser Gln Met Ser Thr Arg Ile Glu Ile Glu Ser Phe Phe
305 310 315 320
Asp Gly Glu Asp Phe Ser Glu Thr Leu Thr Arg Ala Lys Phe Glu Glu
325 330 335
Leu Asn Ile Asp Leu Phe Lys Arg Thr Leu Lys Pro Val Glu Gln Val
340 345 350
Leu Lys Asp Ser Gly Val Lys Lys Glu Asp Val His Asp Ile Val Leu
355 360 365
Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Glu Leu Leu Glu Lys
370 375 380
Phe Phe Asp Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu Ala
385 390 395 400
Val Ala Tyr Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu Asp
405 410 415
Gly Val Glu Asp Ile Val Leu Leu Asp Val Asn Pro Leu Thr Leu Gly
420 425 430
Ile Glu Thr Thr Gly Gly Val Met Thr Lys Leu Ile Asn Arg Asn Thr
435 440 445
Asn Ile Pro Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Val Asp Asn
450 455 460
Gln Ser Thr Val Leu Ile Gln Val Phe Glu Gly Glu Arg Thr Met Ser
465 470 475 480
Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Lys Gly Ile Pro Pro
485 490 495
Ala Pro Arg Gly Val Pro Gln Ile Glu Val Thr Phe Glu Leu Asp Ala
500 505 510
Asn Gly Ile Leu Arg Val Thr Ala His Asp Lys Gly Thr Gly Lys Ser
515 520 525
Glu Thr Ile Thr Ile Thr Asn Asp Lys Gly Arg Leu Ser Lys Asp Glu
530 535 540
Ile Glu Arg Met Val Glu Glu Ala Glu Arg Phe Ala Glu Glu Asp Ala
545 550 555 560
Leu Ile Arg Glu Thr Ile Glu Ala Lys Asn Ser Leu Glu Asn Tyr Ala
565 570 575
His Ser Leu Arg Asn Gln Val Ala Asp Lys Ser Gly Leu Gly Gly Lys
580 585 590
Ile Ser Ala Asp Asp Lys Glu Ala Leu Asn Asp Ala Val Thr Glu Thr
595 600 605
Leu Glu Trp Leu Glu Ala Asn Ser Val Ser Ala Thr Lys Glu Asp Phe
610 615 620
Glu Glu Lys Lys Glu Ala Leu Ser Ala Ile Ala Tyr Pro Ile Thr Ser
625 630 635 640
Lys Ile Tyr Glu Gly Gly Glu Gly Gly Asp Glu Ser Asn Asp Gly Gly
645 650 655
Phe Tyr Ala Asp Asp Asp Glu Ala Pro Phe His Asp Glu Leu
660 665 670
<210> 31
<211> 664
<212> PRT
<213> 里氏木霉
<400> 31
Met Ala Arg Ser Arg Ser Ser Leu Ala Leu Gly Leu Gly Leu Leu Cys
1 5 10 15
Trp Ile Thr Leu Leu Phe Ala Pro Leu Ala Phe Val Gly Lys Ala Asn
20 25 30
Ala Ala Ser Asp Asp Ala Asp Asn Tyr Gly Thr Val Ile Gly Ile Asp
35 40 45
Leu Gly Thr Thr Tyr Ser Cys Val Gly Val Met Gln Lys Gly Lys Val
50 55 60
Glu Ile Leu Val Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val
65 70 75 80
Ala Phe Thr Asp Glu Glu Arg Leu Val Gly Asp Ser Ala Lys Asn Gln
85 90 95
Ala Ala Ala Asn Pro Thr Asn Thr Val Tyr Asp Val Lys Arg Leu Ile
100 105 110
Gly Arg Lys Phe Asp Glu Lys Glu Ile Gln Ala Asp Ile Lys His Phe
115 120 125
Pro Tyr Lys Val Ile Glu Lys Asn Gly Lys Pro Val Val Gln Val Gln
130 135 140
Val Asn Gly Gln Lys Lys Gln Phe Thr Pro Glu Glu Ile Ser Ala Met
145 150 155 160
Ile Leu Gly Lys Met Lys Glu Val Ala Glu Ser Tyr Leu Gly Lys Lys
165 170 175
Val Thr His Ala Val Val Thr Val Pro Ala Tyr Phe Asn Asp Asn Gln
180 185 190
Arg Gln Ala Thr Lys Asp Ala Gly Thr Ile Ala Gly Leu Asn Val Leu
195 200 205
Arg Ile Val Asn Glu Pro Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp
210 215 220
Lys Thr Asp Gly Glu Arg Gln Ile Ile Val Tyr Asp Leu Gly Gly Gly
225 230 235 240
Thr Phe Asp Val Ser Leu Leu Ser Ile Asp Asn Gly Val Phe Glu Val
245 250 255
Leu Ala Thr Ala Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Gln
260 265 270
Arg Ile Ile Asn Tyr Leu Ala Lys Ala Tyr Asn Lys Lys Asn Asn Val
275 280 285
Asp Ile Ser Lys Asp Leu Lys Ala Met Gly Lys Leu Lys Arg Glu Ala
290 295 300
Glu Lys Ala Lys Arg Thr Leu Ser Ser Gln Met Ser Thr Arg Ile Glu
305 310 315 320
Ile Glu Ala Phe Phe Glu Gly Asn Asp Phe Ser Glu Thr Leu Thr Arg
325 330 335
Ala Lys Phe Glu Glu Leu Asn Met Asp Leu Phe Lys Lys Thr Leu Lys
340 345 350
Pro Val Glu Gln Val Leu Lys Asp Ala Asn Val Lys Lys Ser Glu Val
355 360 365
Asp Asp Ile Val Leu Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln
370 375 380
Ser Leu Ile Glu Glu Tyr Phe Asn Gly Lys Lys Ala Ser Lys Gly Ile
385 390 395 400
Asn Pro Asp Glu Ala Val Ala Phe Gly Ala Ala Val Gln Ala Gly Val
405 410 415
Leu Ser Gly Glu Glu Gly Thr Asp Asp Ile Val Leu Met Asp Val Asn
420 425 430
Pro Leu Thr Leu Gly Ile Glu Thr Thr Gly Gly Val Met Thr Lys Leu
435 440 445
Ile Pro Arg Asn Thr Pro Ile Pro Thr Arg Lys Ser Gln Ile Phe Ser
450 455 460
Thr Ala Ala Asp Asn Gln Pro Val Val Leu Ile Gln Val Phe Glu Gly
465 470 475 480
Glu Arg Ser Met Thr Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu
485 490 495
Thr Gly Ile Pro Pro Ala Pro Arg Gly Val Pro Gln Ile Glu Val Ser
500 505 510
Phe Glu Leu Asp Ala Asn Gly Ile Leu Lys Val Ser Ala His Asp Lys
515 520 525
Gly Thr Gly Lys Gln Glu Ser Ile Thr Ile Thr Asn Asp Lys Gly Arg
530 535 540
Leu Thr Gln Glu Glu Ile Asp Arg Met Val Ala Glu Ala Glu Lys Phe
545 550 555 560
Ala Glu Glu Asp Lys Ala Thr Arg Glu Arg Ile Glu Ala Arg Asn Gly
565 570 575
Leu Glu Asn Tyr Ala Phe Ser Leu Lys Asn Gln Val Asn Asp Glu Glu
580 585 590
Gly Leu Gly Gly Lys Ile Asp Glu Glu Asp Lys Glu Thr Ile Leu Asp
595 600 605
Ala Val Lys Glu Ala Thr Glu Trp Leu Glu Glu Asn Gly Ala Asp Ala
610 615 620
Thr Thr Glu Asp Phe Glu Glu Gln Lys Glu Lys Leu Ser Asn Val Ala
625 630 635 640
Tyr Pro Ile Thr Ser Lys Met Tyr Gln Gly Ala Gly Gly Ser Glu Asp
645 650 655
Asp Gly Asp Phe His Asp Glu Leu
660
<210> 32
<211> 682
<212> PRT
<213> 酿酒酵母
<400> 32
Met Phe Phe Asn Arg Leu Ser Ala Gly Lys Leu Leu Val Pro Leu Ser
1 5 10 15
Val Val Leu Tyr Ala Leu Phe Val Val Ile Leu Pro Leu Gln Asn Ser
20 25 30
Phe His Ser Ser Asn Val Leu Val Arg Gly Ala Asp Asp Val Glu Asn
35 40 45
Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val
50 55 60
Ala Val Met Lys Asn Gly Lys Thr Glu Ile Leu Ala Asn Glu Gln Gly
65 70 75 80
Asn Arg Ile Thr Pro Ser Tyr Val Ala Phe Thr Asp Asp Glu Arg Leu
85 90 95
Ile Gly Asp Ala Ala Lys Asn Gln Val Ala Ala Asn Pro Gln Asn Thr
100 105 110
Ile Phe Asp Ile Lys Arg Leu Ile Gly Leu Lys Tyr Asn Asp Arg Ser
115 120 125
Val Gln Lys Asp Ile Lys His Leu Pro Phe Asn Val Val Asn Lys Asp
130 135 140
Gly Lys Pro Ala Val Glu Val Ser Val Lys Gly Glu Lys Lys Val Phe
145 150 155 160
Thr Pro Glu Glu Ile Ser Gly Met Ile Leu Gly Lys Met Lys Gln Ile
165 170 175
Ala Glu Asp Tyr Leu Gly Thr Lys Val Thr His Ala Val Val Thr Val
180 185 190
Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr Lys Asp Ala Gly
195 200 205
Thr Ile Ala Gly Leu Asn Val Leu Arg Ile Val Asn Glu Pro Thr Ala
210 215 220
Ala Ala Ile Ala Tyr Gly Leu Asp Lys Ser Asp Lys Glu His Gln Ile
225 230 235 240
Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Ser
245 250 255
Ile Glu Asn Gly Val Phe Glu Val Gln Ala Thr Ser Gly Asp Thr His
260 265 270
Leu Gly Gly Glu Asp Phe Asp Tyr Lys Ile Val Arg Gln Leu Ile Lys
275 280 285
Ala Phe Lys Lys Lys His Gly Ile Asp Val Ser Asp Asn Asn Lys Ala
290 295 300
Leu Ala Lys Leu Lys Arg Glu Ala Glu Lys Ala Lys Arg Ala Leu Ser
305 310 315 320
Ser Gln Met Ser Thr Arg Ile Glu Ile Asp Ser Phe Val Asp Gly Ile
325 330 335
Asp Leu Ser Glu Thr Leu Thr Arg Ala Lys Phe Glu Glu Leu Asn Leu
340 345 350
Asp Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Lys Val Leu Gln Asp
355 360 365
Ser Gly Leu Glu Lys Lys Asp Val Asp Asp Ile Val Leu Val Gly Gly
370 375 380
Ser Thr Arg Ile Pro Lys Val Gln Gln Leu Leu Glu Ser Tyr Phe Asp
385 390 395 400
Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu Ala Val Ala Tyr
405 410 415
Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu Glu Gly Val Glu
420 425 430
Asp Ile Val Leu Leu Asp Val Asn Ala Leu Thr Leu Gly Ile Glu Thr
435 440 445
Thr Gly Gly Val Met Thr Pro Leu Ile Lys Arg Asn Thr Ala Ile Pro
450 455 460
Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Val Asp Asn Gln Pro Thr
465 470 475 480
Val Met Ile Lys Val Tyr Glu Gly Glu Arg Ala Met Ser Lys Asp Asn
485 490 495
Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile Pro Pro Ala Pro Arg
500 505 510
Gly Val Pro Gln Ile Glu Val Thr Phe Ala Leu Asp Ala Asn Gly Ile
515 520 525
Leu Lys Val Ser Ala Thr Asp Lys Gly Thr Gly Lys Ser Glu Ser Ile
530 535 540
Thr Ile Thr Asn Asp Lys Gly Arg Leu Thr Gln Glu Glu Ile Asp Arg
545 550 555 560
Met Val Glu Glu Ala Glu Lys Phe Ala Ser Glu Asp Ala Ser Ile Lys
565 570 575
Ala Lys Val Glu Ser Arg Asn Lys Leu Glu Asn Tyr Ala His Ser Leu
580 585 590
Lys Asn Gln Val Asn Gly Asp Leu Gly Glu Lys Leu Glu Glu Glu Asp
595 600 605
Lys Glu Thr Leu Leu Asp Ala Ala Asn Asp Val Leu Glu Trp Leu Asp
610 615 620
Asp Asn Phe Glu Thr Ala Ile Ala Glu Asp Phe Asp Glu Lys Phe Glu
625 630 635 640
Ser Leu Ser Lys Val Ala Tyr Pro Ile Thr Ser Lys Leu Tyr Gly Gly
645 650 655
Ala Asp Gly Ser Gly Ala Ala Asp Tyr Asp Asp Glu Asp Glu Asp Asp
660 665 670
Asp Gly Asp Tyr Phe Glu His Asp Glu Leu
675 680
<210> 33
<211> 679
<212> PRT
<213> 乳酸克鲁维酵母
<400> 33
Met Phe Ser Ala Arg Lys Ser Ser Val Gly Trp Leu Val Ser Ser Leu
1 5 10 15
Ala Val Phe Tyr Val Leu Leu Ala Val Ile Met Pro Ile Ala Leu Thr
20 25 30
Gly Ser Gln Ser Ser Arg Val Val Ala Arg Ala Ala Glu Asp His Glu
35 40 45
Asp Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys
50 55 60
Val Ala Val Met Lys Asn Gly Lys Thr Glu Ile Leu Ala Asn Glu Gln
65 70 75 80
Gly Asn Arg Ile Thr Pro Ser Tyr Val Ser Phe Thr Asp Asp Glu Arg
85 90 95
Leu Ile Gly Asp Ala Ala Lys Asn Gln Ala Ala Ser Asn Pro Lys Asn
100 105 110
Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly Leu Gln Tyr Asn Asp Pro
115 120 125
Thr Val Gln Arg Asp Ile Lys His Leu Pro Tyr Thr Val Val Asn Lys
130 135 140
Gly Asn Lys Pro Tyr Val Glu Val Thr Val Lys Gly Glu Lys Lys Glu
145 150 155 160
Phe Thr Pro Glu Glu Val Ser Gly Met Ile Leu Gly Lys Met Lys Gln
165 170 175
Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr His Ala Val Val Thr
180 185 190
Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr Lys Asp Ala
195 200 205
Gly Ala Ile Ala Gly Leu Asn Ile Leu Arg Ile Val Asn Glu Pro Thr
210 215 220
Ala Ala Ala Ile Ala Tyr Gly Leu Asp Lys Thr Glu Asp Glu His Gln
225 230 235 240
Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu
245 250 255
Ser Ile Glu Asn Gly Val Phe Glu Val Gln Ala Thr Ala Gly Asp Thr
260 265 270
His Leu Gly Gly Glu Asp Phe Asp Tyr Lys Leu Val Arg His Phe Ala
275 280 285
Gln Leu Phe Gln Lys Lys His Asp Leu Asp Val Thr Lys Asn Asp Lys
290 295 300
Ala Met Ala Lys Leu Lys Arg Glu Ala Glu Lys Ala Lys Arg Ser Leu
305 310 315 320
Ser Ser Gln Thr Ser Thr Arg Ile Glu Ile Asp Ser Phe Phe Asn Gly
325 330 335
Ile Asp Phe Ser Glu Thr Leu Thr Arg Ala Lys Phe Glu Glu Leu Asn
340 345 350
Leu Ala Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Lys Val Leu Lys
355 360 365
Asp Ser Gly Leu Gln Lys Glu Asp Ile Asp Asp Ile Val Leu Val Gly
370 375 380
Gly Ser Thr Arg Ile Pro Lys Val Gln Gln Leu Leu Glu Lys Phe Phe
385 390 395 400
Asn Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu Ala Val Ala
405 410 415
Tyr Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu Glu Gly Val
420 425 430
Glu Asp Ile Val Leu Leu Asp Val Asn Ala Leu Thr Leu Gly Ile Glu
435 440 445
Thr Thr Gly Gly Val Met Thr Pro Leu Ile Lys Arg Asn Thr Ala Ile
450 455 460
Pro Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Val Asp Asn Gln Lys
465 470 475 480
Ala Val Arg Ile Gln Val Tyr Glu Gly Glu Arg Ala Met Val Lys Asp
485 490 495
Asn Asn Leu Leu Gly Asn Phe Glu Leu Ser Asp Ile Arg Ala Ala Pro
500 505 510
Arg Gly Val Pro Gln Ile Glu Val Thr Phe Ala Leu Asp Ala Asn Gly
515 520 525
Ile Leu Thr Val Ser Ala Thr Asp Lys Asp Thr Gly Lys Ser Glu Ser
530 535 540
Ile Thr Ile Ala Asn Asp Lys Gly Arg Leu Ser Gln Asp Asp Ile Asp
545 550 555 560
Arg Met Val Glu Glu Ala Glu Lys Tyr Ala Ala Glu Asp Ala Lys Phe
565 570 575
Lys Ala Lys Ser Glu Ala Arg Asn Thr Phe Glu Asn Phe Val His Tyr
580 585 590
Val Lys Asn Ser Val Asn Gly Glu Leu Ala Glu Ile Met Asp Glu Asp
595 600 605
Asp Lys Glu Thr Val Leu Asp Asn Val Asn Glu Ser Leu Glu Trp Leu
610 615 620
Glu Asp Asn Ser Asp Val Ala Glu Ala Glu Asp Phe Glu Glu Lys Met
625 630 635 640
Ala Ser Phe Lys Glu Ser Val Glu Pro Ile Leu Ala Lys Ala Ser Ala
645 650 655
Ser Gln Gly Ser Thr Ser Gly Glu Gly Phe Glu Asp Glu Asp Asp Asp
660 665 670
Asp Tyr Phe Asp Asp Glu Leu
675
<210> 34
<211> 670
<212> PRT
<213> 博伊丁假丝酵母
<400> 34
Met Leu Lys Phe Asn Arg Ser Phe Ile Ala Ser Leu Ala Ile Leu Tyr
1 5 10 15
Ser Leu Leu Leu Ile Ile Val Pro Leu Leu Ser Gln Gln Ala His Ala
20 25 30
Glu Asp Glu His Glu Thr Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly
35 40 45
Thr Thr Tyr Ser Cys Val Gly Val Met Lys Ser Gly Lys Val Glu Ile
50 55 60
Leu Ala Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val Ala Phe
65 70 75 80
Thr Asp Glu Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Gln Ala Pro
85 90 95
Ser Asn Pro His Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly His
100 105 110
Ser Tyr Ser Asp Lys Val Val Gln Thr Glu Lys Lys His Leu Pro Tyr
115 120 125
Asn Ile Ile Glu Lys Gln Gly Lys Pro Ala Val Glu Val Lys Phe Gln
130 135 140
Asn Glu Leu Lys Val Phe Thr Pro Glu Glu Ile Ser Ser Met Ile Leu
145 150 155 160
Gly Lys Met Lys Gln Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr
165 170 175
His Ala Val Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln
180 185 190
Ala Thr Lys Asp Ala Gly Thr Ile Ala Gly Leu Asn Val Leu Arg Ile
195 200 205
Val Asn Glu Pro Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp Lys Glu
210 215 220
Gly Glu Arg Gln Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp
225 230 235 240
Val Ser Leu Leu Ala Ile Glu Asn Gly Val Phe Glu Val Leu Ser Thr
245 250 255
Ser Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Phe Arg Val Val
260 265 270
Arg His Phe Ser Lys Ile Phe Lys Lys Lys His Asn Ile Asp Ile Ser
275 280 285
Asp Asn Ala Lys Ala Ile Ser Lys Leu Lys Arg Glu Val Glu Lys Ala
290 295 300
Lys Arg Thr Leu Ser Thr Gln Met Ser Thr Arg Ile Glu Ile Asp Ser
305 310 315 320
Phe Val Asp Gly Ile Asp Phe Ser Glu Thr Leu Ser Arg Ala Lys Phe
325 330 335
Glu Glu Ile Asn Ile Glu Leu Phe Lys Lys Thr Leu Lys Pro Val Gln
340 345 350
Gln Val Leu Asp Asp Ala Gly Leu Lys Ala Ala Glu Ile Asp Asp Ile
355 360 365
Val Leu Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Glu Ile Leu
370 375 380
Glu Asn Phe Phe Ser Gly Lys Lys Ala Thr Lys Gly Ile Asn Pro Asp
385 390 395 400
Glu Ala Val Ala Tyr Gly Ala Ala Val Gln Ala Gly Ile Leu Ser Gly
405 410 415
Ser Glu Gly Ala Ser Asp Val Val Leu Ile Asp Val Asn Pro Leu Thr
420 425 430
Leu Gly Ile Glu Thr Thr Gly Asn Val Met Thr Thr Leu Ile Lys Arg
435 440 445
Asn Thr Pro Ile Pro Thr Lys Lys Thr Gln Val Phe Ser Thr Ala Val
450 455 460
Asp Asn Gln Asp Thr Val Leu Ile Lys Val Tyr Glu Gly Glu Arg Ala
465 470 475 480
Met Ser Thr Asp Asn Asn Leu Leu Gly Ser Phe Glu Leu Lys Gly Ile
485 490 495
Pro Pro Ala Pro Lys Gly Ser Pro Gln Ile Glu Val Thr Phe Ser Leu
500 505 510
Asp Val Asn Gly Ile Leu Arg Val Ser Ala Thr Asp Lys Ser Thr Gly
515 520 525
Lys Ser Asn Ser Ile Thr Ile Ser Asn Asp His Gly Arg Leu Ser Lys
530 535 540
Glu Glu Ile Asp Lys Met Val Glu Asp Gly Glu Lys Tyr Ala Glu Gln
545 550 555 560
Asp Lys Leu Phe Arg Glu Lys Ile Glu Ala Lys Asn Asp Leu Glu Lys
565 570 575
Tyr Ala Leu Gly Leu Lys Thr Gln Leu Ala Asp Glu Ser Val Ala Glu
580 585 590
Lys Leu Ala Glu Asp Glu Ile Glu Thr Val Leu Asp Ala Val Lys Glu
595 600 605
Ala Leu Glu Phe Ile Asp Glu Asn Glu Asp Ala Thr Thr Glu Asp Tyr
610 615 620
Ser Glu Gln Lys Glu Lys Leu Ile Lys Ile Ala Ser Pro Ile Thr Thr
625 630 635 640
Lys Leu Phe Met Gln Pro Gln Gly Gly Glu Ser Ala Asp Glu Asp Asp
645 650 655
Glu Asp Phe Asp Asp Asp Tyr Asp Tyr Gly His Asp Glu Leu
660 665 670
<210> 35
<211> 672
<212> PRT
<213> 黑曲霉
<400> 35
Met Ala Arg Ile Ser His Gln Gly Ala Ala Lys Pro Phe Thr Ala Trp
1 5 10 15
Thr Thr Ile Phe Tyr Leu Leu Leu Val Phe Ile Ala Pro Leu Ala Phe
20 25 30
Phe Gly Thr Ala His Ala Gln Asp Glu Thr Ser Pro Gln Glu Ser Tyr
35 40 45
Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val Gly
50 55 60
Val Met Gln Asn Gly Lys Val Glu Ile Leu Val Asn Asp Gln Gly Asn
65 70 75 80
Arg Ile Thr Pro Ser Tyr Val Ala Phe Thr Asp Glu Glu Arg Leu Val
85 90 95
Gly Asp Ala Ala Lys Asn Gln Tyr Ala Ala Asn Pro Arg Arg Thr Ile
100 105 110
Phe Asp Ile Lys Arg Leu Ile Gly Arg Lys Phe Asp Asp Lys Asp Val
115 120 125
Gln Lys Asp Ala Lys His Phe Pro Tyr Lys Val Val Asn Lys Asp Gly
130 135 140
Lys Pro His Val Lys Val Asp Val Asn Gln Thr Pro Lys Thr Leu Thr
145 150 155 160
Pro Glu Glu Val Ser Ala Met Val Leu Gly Lys Met Lys Glu Ile Ala
165 170 175
Glu Gly Tyr Leu Gly Lys Lys Val Thr His Ala Val Val Thr Val Pro
180 185 190
Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr Lys Asp Ala Gly Thr
195 200 205
Ile Ala Gly Leu Asn Val Leu Arg Val Val Asn Glu Pro Thr Ala Ala
210 215 220
Ala Ile Ala Tyr Gly Leu Asp Lys Thr Gly Asp Glu Arg Gln Val Ile
225 230 235 240
Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Ser Ile
245 250 255
Asp Asn Gly Val Phe Glu Val Leu Ala Thr Ala Gly Asp Thr His Leu
260 265 270
Gly Gly Glu Asp Phe Asp Gln Arg Val Met Asp His Phe Val Lys Leu
275 280 285
Tyr Asn Lys Lys Asn Asn Val Asp Val Thr Lys Asp Leu Lys Ala Met
290 295 300
Gly Lys Leu Lys Arg Glu Val Glu Lys Ala Lys Arg Thr Leu Ser Ser
305 310 315 320
Gln Met Ser Thr Arg Ile Glu Ile Glu Ala Phe His Asn Gly Glu Asp
325 330 335
Phe Ser Glu Thr Leu Thr Arg Ala Lys Phe Glu Glu Leu Asn Met Asp
340 345 350
Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Gln Val Leu Lys Asp Ala
355 360 365
Lys Val Lys Lys Ser Glu Val Asp Asp Ile Val Leu Val Gly Gly Ser
370 375 380
Thr Arg Ile Pro Lys Val Gln Ala Leu Leu Glu Glu Phe Phe Gly Gly
385 390 395 400
Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu Ala Val Ala Phe Gly
405 410 415
Ala Ala Val Gln Gly Gly Val Leu Ser Gly Glu Glu Gly Thr Gly Asp
420 425 430
Val Val Leu Met Asp Val Asn Pro Leu Thr Leu Gly Ile Glu Thr Thr
435 440 445
Gly Gly Val Met Thr Lys Leu Ile Pro Arg Asn Thr Val Ile Pro Thr
450 455 460
Arg Lys Ser Gln Ile Phe Ser Thr Ala Ala Asp Asn Gln Pro Thr Val
465 470 475 480
Leu Ile Gln Val Tyr Glu Gly Glu Arg Ser Leu Thr Lys Asp Asn Asn
485 490 495
Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile Pro Pro Ala Pro Arg Gly
500 505 510
Val Pro Gln Ile Glu Val Ser Phe Asp Leu Asp Ala Asn Gly Ile Leu
515 520 525
Lys Val His Ala Ser Asp Lys Gly Thr Gly Lys Ala Glu Ser Ile Thr
530 535 540
Ile Thr Asn Asp Lys Gly Arg Leu Ser Gln Glu Glu Ile Asp Arg Met
545 550 555 560
Val Ala Glu Ala Glu Glu Phe Ala Glu Glu Asp Lys Ala Ile Lys Ala
565 570 575
Lys Ile Glu Ala Arg Asn Thr Leu Glu Asn Tyr Ala Phe Ser Leu Lys
580 585 590
Asn Gln Val Asn Asp Glu Asn Gly Leu Gly Gly Gln Ile Asp Glu Asp
595 600 605
Asp Lys Gln Thr Ile Leu Asp Ala Val Lys Glu Val Thr Glu Trp Leu
610 615 620
Glu Asp Asn Ala Ala Thr Ala Thr Thr Glu Asp Phe Glu Glu Gln Lys
625 630 635 640
Glu Gln Leu Ser Asn Val Ala Tyr Pro Ile Thr Ser Lys Leu Tyr Gly
645 650 655
Ser Ala Pro Ala Asp Glu Asp Asp Glu Pro Ser Gly His Asp Glu Leu
660 665 670
<210> 36
<211> 665
<212> PRT
<213> Ogataea polymorpha
<400> 36
Met Leu Thr Phe Asn Lys Ser Val Val Ser Cys Ala Ala Ile Ile Tyr
1 5 10 15
Ala Leu Leu Leu Val Val Leu Pro Leu Thr Thr Gln Gln Phe Val Lys
20 25 30
Ala Glu Ser Asn Glu Asn Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly
35 40 45
Thr Thr Tyr Ser Cys Val Gly Val Met Lys Ala Gly Arg Val Glu Ile
50 55 60
Ile Pro Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val Ala Phe
65 70 75 80
Thr Glu Asp Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Gln Ile Ala
85 90 95
Ser Asn Pro Thr Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly His
100 105 110
Arg Phe Asp Asp Lys Val Ile Gln Lys Glu Ile Lys His Leu Pro Tyr
115 120 125
Lys Val Lys Asp Gln Asp Gly Arg Pro Val Val Glu Ala Lys Val Asn
130 135 140
Gly Glu Leu Lys Thr Phe Thr Ala Glu Glu Ile Ser Ala Met Ile Leu
145 150 155 160
Gly Lys Met Lys Gln Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr
165 170 175
His Ala Val Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln
180 185 190
Ala Thr Lys Asp Ala Gly Thr Ile Ala Gly Leu Glu Val Leu Arg Ile
195 200 205
Val Asn Glu Pro Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp Lys Thr
210 215 220
Asp Glu Glu Lys His Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe
225 230 235 240
Asp Val Ser Leu Leu Thr Ile Ala Gly Gly Ala Phe Glu Val Leu Ala
245 250 255
Thr Ala Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Tyr Arg Val
260 265 270
Val Arg His Phe Ile Lys Val Phe Lys Lys Lys His Gly Ile Asp Ile
275 280 285
Ser Asp Asn Ser Lys Ala Leu Ala Lys Leu Lys Arg Glu Val Glu Lys
290 295 300
Ala Lys Arg Thr Leu Ser Ser Gln Met Ser Thr Arg Ile Glu Ile Asp
305 310 315 320
Ser Phe Val Asp Gly Ile Asp Phe Ser Glu Ser Leu Ser Arg Ala Lys
325 330 335
Phe Glu Glu Leu Asn Met Asp Leu Phe Lys Lys Thr Leu Lys Pro Val
340 345 350
Gln Gln Val Leu Asp Asp Ala Lys Met Lys Pro Asp Glu Ile Asp Asp
355 360 365
Val Val Phe Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Glu Leu
370 375 380
Ile Glu Asn Phe Phe Asn Gly Lys Lys Ile Ser Lys Gly Ile Asn Pro
385 390 395 400
Asp Glu Ala Val Ala Phe Gly Ala Ala Val Gln Gly Gly Val Leu Ser
405 410 415
Gly Glu Glu Gly Val Glu Asp Ile Val Leu Ile Asp Val Asn Pro Leu
420 425 430
Thr Leu Gly Ile Glu Thr Ser Gly Gly Val Met Thr Thr Leu Ile Lys
435 440 445
Arg Asn Thr Pro Ile Pro Thr Gln Lys Ser Gln Ile Phe Ser Thr Ala
450 455 460
Ala Asp Asn Gln Pro Val Val Leu Ile Gln Val Tyr Glu Gly Glu Arg
465 470 475 480
Ala Met Ala Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly
485 490 495
Ile Pro Pro Ala Pro Arg Gly Val Pro Gln Ile Glu Val Thr Phe Thr
500 505 510
Leu Asp Ser Asn Gly Ile Leu Lys Val Ser Ala Thr Asp Lys Gly Thr
515 520 525
Gly Lys Ser Asn Ser Ile Thr Ile Thr Asn Asp Lys Gly Arg Leu Ser
530 535 540
Lys Glu Glu Ile Glu Lys Lys Ile Glu Glu Ala Glu Lys Phe Ala Gln
545 550 555 560
Gln Asp Lys Glu Leu Arg Glu Lys Val Glu Ser Arg Asn Ala Leu Glu
565 570 575
Asn Tyr Ala His Ser Leu Lys Asn Gln Ala Asn Asp Glu Asn Gly Phe
580 585 590
Gly Ala Lys Leu Glu Glu Asp Asp Lys Glu Thr Leu Leu Asp Ala Ile
595 600 605
Asn Glu Ala Leu Glu Phe Leu Glu Asp Asn Phe Asp Thr Ala Thr Lys
610 615 620
Asp Glu Phe Asp Glu Gln Lys Glu Lys Leu Ser Lys Val Ala Tyr Pro
625 630 635 640
Ile Thr Ser Lys Leu Tyr Asp Ala Pro Pro Thr Ser Asp Glu Glu Asp
645 650 655
Glu Asp Asp Trp Asp His Asp Glu Leu
660 665
<210> 37
<211> 894
<212> PRT
<213> Komagataella phaffii
<400> 37
Met Arg Thr Gln Lys Ile Val Thr Val Leu Cys Leu Leu Leu Asn Thr
1 5 10 15
Val Leu Gly Ala Leu Leu Gly Ile Asp Tyr Gly Gln Glu Phe Thr Lys
20 25 30
Ala Val Leu Val Ala Pro Gly Val Pro Phe Glu Val Ile Leu Thr Pro
35 40 45
Asp Ser Lys Arg Lys Asp Asn Ser Met Met Ala Ile Lys Glu Asn Ser
50 55 60
Lys Gly Glu Ile Glu Arg Tyr Tyr Gly Ser Ser Ala Ser Ser Val Cys
65 70 75 80
Ile Arg Asn Pro Glu Thr Cys Leu Asn His Leu Lys Ser Leu Ile Gly
85 90 95
Val Ser Ile Asp Asp Val Ser Thr Ile Asp Tyr Lys Lys Tyr His Ser
100 105 110
Gly Ala Glu Met Val Pro Ser Lys Asn Asn Arg Asn Thr Val Ala Phe
115 120 125
Lys Leu Gly Ser Ser Val Tyr Pro Val Glu Glu Ile Leu Ala Met Ser
130 135 140
Leu Asp Asp Ile Lys Ser Arg Ala Glu Asp His Leu Lys His Ala Val
145 150 155 160
Pro Gly Ser Tyr Ser Val Ile Ser Asp Ala Val Ile Thr Val Pro Thr
165 170 175
Phe Phe Thr Gln Ser Gln Arg Leu Ala Leu Lys Asp Ala Ala Glu Ile
180 185 190
Ser Gly Leu Lys Val Val Gly Leu Val Asp Asp Gly Ile Ser Val Ala
195 200 205
Val Asn Tyr Ala Ser Ser Arg Gln Phe Asn Gly Asp Lys Gln Tyr His
210 215 220
Met Ile Tyr Asp Met Gly Ala Gly Ser Leu Gln Ala Thr Leu Val Ser
225 230 235 240
Ile Ser Ser Ser Asp Asp Gly Gly Ile Val Ile Asp Val Glu Ala Ile
245 250 255
Ala Tyr Asp Lys Ser Leu Gly Gly Gln Leu Phe Thr Gln Ser Val Tyr
260 265 270
Asp Ile Leu Leu Gln Lys Phe Leu Ser Glu His Pro Ser Phe Ser Glu
275 280 285
Ser Asp Phe Asn Lys Asn Ser Lys Ser Met Ser Lys Leu Trp Gln Ala
290 295 300
Ala Glu Lys Ala Lys Thr Ile Leu Ser Ala Asn Thr Asp Thr Arg Val
305 310 315 320
Ser Val Glu Ser Leu Tyr Asn Asp Ile Asp Phe Arg Ala Thr Ile Ala
325 330 335
Arg Asp Glu Phe Glu Asp Tyr Asn Ala Glu His Val His Arg Ile Thr
340 345 350
Ala Pro Ile Ile Glu Ala Leu Ser His Pro Leu Asn Gly Asn Leu Thr
355 360 365
Ser Pro Phe Pro Leu Thr Ser Leu Ser Ser Val Ile Leu Thr Gly Gly
370 375 380
Ser Thr Arg Val Pro Met Val Lys Lys His Leu Glu Ser Leu Leu Gly
385 390 395 400
Ser Glu Leu Ile Ala Lys Asn Val Asn Ala Asp Glu Ser Ala Val Phe
405 410 415
Gly Ser Thr Leu Arg Gly Val Thr Leu Ser Gln Met Phe Lys Ala Lys
420 425 430
Gln Met Thr Val Asn Glu Arg Ser Val Tyr Asp Tyr Cys Leu Lys Val
435 440 445
Gly Ser Ser Glu Ile Asn Val Phe Pro Val Gly Thr Pro Leu Ala Thr
450 455 460
Lys Lys Val Val Glu Leu Glu Asn Val Asp Ser Glu Asn Gln Leu Thr
465 470 475 480
Ile Gly Leu Tyr Glu Asn Gly Gln Leu Phe Ala Ser His Glu Val Thr
485 490 495
Asp Leu Lys Lys Ser Ile Lys Ser Leu Thr Gln Glu Gly Lys Glu Cys
500 505 510
Ser Asn Ile Asn Tyr Glu Ala Thr Val Glu Leu Ser Glu Ser Arg Leu
515 520 525
Leu Ser Leu Thr Arg Leu Gln Ala Lys Cys Ala Asp Glu Ala Glu Tyr
530 535 540
Leu Pro Pro Val Asp Thr Glu Ser Glu Asp Thr Lys Ser Glu Asn Ser
545 550 555 560
Thr Thr Ser Glu Thr Ile Glu Lys Pro Asn Lys Lys Leu Phe Tyr Pro
565 570 575
Val Thr Ile Pro Thr Gln Leu Lys Ser Val His Val Lys Pro Met Gly
580 585 590
Ser Ser Thr Lys Val Ser Ser Ser Leu Lys Ile Lys Glu Leu Asn Lys
595 600 605
Lys Asp Ala Val Lys Arg Ser Ile Glu Glu Leu Lys Asn Gln Leu Glu
610 615 620
Ser Lys Leu Tyr Arg Val Arg Ser Tyr Leu Glu Asp Glu Glu Val Val
625 630 635 640
Glu Lys Gly Pro Ala Ser Gln Val Glu Ala Leu Ser Thr Leu Val Ala
645 650 655
Glu Asn Leu Glu Trp Leu Asp Tyr Asp Ser Asp Asp Ala Ser Ala Lys
660 665 670
Asp Ile Arg Glu Lys Leu Asn Ser Val Ser Asp Ser Val Ala Phe Ile
675 680 685
Lys Ser Tyr Ile Asp Leu Asn Asp Val Thr Phe Asp Asn Asn Leu Phe
690 695 700
Thr Thr Ile Tyr Asn Thr Thr Leu Asn Ser Met Gln Asn Val Gln Glu
705 710 715 720
Leu Met Leu Asn Met Ser Glu Asp Ala Leu Ser Leu Met Gln Gln Tyr
725 730 735
Glu Lys Glu Gly Leu Asp Phe Ala Lys Glu Ser Gln Lys Ile Lys Ile
740 745 750
Lys Ser Pro Pro Leu Ser Asp Lys Glu Leu Asp Asn Leu Phe Asn Thr
755 760 765
Val Thr Glu Lys Leu Glu His Val Arg Met Leu Thr Glu Lys Asp Thr
770 775 780
Ile Ser Asp Leu Pro Arg Glu Glu Leu Phe Lys Leu Tyr Gln Glu Leu
785 790 795 800
Gln Asn Tyr Ser Ser Arg Phe Glu Ala Ile Met Ala Ser Leu Glu Asp
805 810 815
Val His Ser Gln Arg Ile Asn Arg Leu Thr Asp Lys Leu Arg Lys His
820 825 830
Ile Glu Arg Val Ser Asn Glu Ala Leu Lys Ala Ala Leu Lys Glu Ala
835 840 845
Lys Arg Gln Gln Glu Glu Glu Lys Ser His Glu Gln Asn Glu Gly Glu
850 855 860
Glu Gln Ser Ser Ala Ser Thr Ser His Thr Asn Glu Asp Ile Glu Glu
865 870 875 880
Pro Ser Glu Ser Pro Lys Val Gln Thr Ser His Asp Glu Leu
885 890
<210> 38
<211> 880
<212> PRT
<213> Komagataella pastoris
<400> 38
Met Lys Thr Gln Lys Ile Val Thr Leu Leu Cys Leu Leu Leu Ser Asn
1 5 10 15
Val Leu Gly Ala Leu Leu Gly Ile Asp Tyr Gly Gln Glu Phe Thr Lys
20 25 30
Ala Val Leu Val Ala Pro Gly Val Pro Phe Glu Val Ile Leu Thr Pro
35 40 45
Asp Ser Lys Arg Lys Asp Asn Ser Met Met Ala Ile Lys Glu Asn Phe
50 55 60
Lys Gly Glu Ile Glu Arg Tyr Tyr Gly Ser Ala Ala Ser Ser Val Cys
65 70 75 80
Ile Arg Asn Pro Glu Ala Cys Leu Asn His Leu Lys Ser Leu Ile Gly
85 90 95
Val Pro Ile Asp Asp Val Ser Thr Ile Glu Tyr Lys Lys Tyr His Ser
100 105 110
Gly Ala Glu Leu Val Pro Ser Lys Asn Asn Arg Asn Thr Val Ala Phe
115 120 125
Asn Leu Gly Ser Ser Val Tyr Pro Val Glu Glu Ile Leu Ala Met Ser
130 135 140
Leu Asp Asp Ile Lys Ser Arg Ala Glu Asp His Leu Lys His Ala Val
145 150 155 160
Pro Gly Ser Tyr Ser Val Ile Asn Asp Ala Val Ile Thr Val Pro Thr
165 170 175
Phe Phe Thr Gln Ser Gln Arg Leu Ala Leu Lys Asp Ala Ala Glu Ile
180 185 190
Ser Gly Leu Lys Val Val Gly Leu Val Asp Asp Gly Ile Ser Val Ala
195 200 205
Val Asn Tyr Ala Ser Ser Arg Gln Phe Asp Gly Asn Lys Gln Tyr His
210 215 220
Met Ile Tyr Asp Met Gly Ala Gly Ser Leu Gln Ala Thr Leu Val Ser
225 230 235 240
Ile Ser Ser Asn Glu Asp Gly Gly Ile Phe Ile Asp Val Glu Ala Ile
245 250 255
Ala Tyr Asp Asn Ser Leu Gly Gly Gln Leu Phe Thr Gln Ser Val Tyr
260 265 270
Asp Ile Leu Leu Gln Lys Phe Leu Ser Glu His Pro Ser Phe Ser Glu
275 280 285
Ser Asp Phe Asn Lys Asn Ser Lys Ser Met Ser Lys Leu Trp Gln Ser
290 295 300
Ala Glu Lys Ala Lys Thr Ile Leu Ser Ala Asn Thr Asp Thr Arg Val
305 310 315 320
Ser Val Glu Ser Leu Tyr Asn Asp Ile Asp Phe Arg Thr Thr Ile Thr
325 330 335
Arg Asp Glu Phe Glu Asp Tyr Asn Ala Glu His Val His Arg Ile Thr
340 345 350
Ala Pro Ile Ile Glu Ala Leu Ser His Pro Leu Asn Glu Asn Leu Thr
355 360 365
Ser Pro Phe Pro Leu Thr Ser Leu Ser Ser Val Ile Leu Thr Gly Gly
370 375 380
Ser Thr Arg Val Pro Met Val Lys Lys His Leu Glu Ser Leu Leu Gly
385 390 395 400
Ser Glu Leu Ile Ala Lys Asn Val Asn Ala Asp Glu Ser Ala Val Phe
405 410 415
Gly Ser Thr Leu Arg Gly Val Thr Leu Ser Gln Met Phe Lys Ala Arg
420 425 430
Gln Met Thr Val Asn Glu Arg Ser Val Tyr Asp Tyr Cys Val Lys Val
435 440 445
Gly Ser Ser Glu Ile Asn Val Phe Pro Val Gly Thr Pro Leu Asp Thr
450 455 460
Lys Lys Val Val Glu Leu Glu Asn Val Asp Asn Gly Asn Gln Leu Thr
465 470 475 480
Val Gly Leu Tyr Glu Asn Gly His Leu Phe Ala Asn Gln Glu Val Ser
485 490 495
Asp Leu Lys Lys Ser Ile Lys Ser Leu Thr Gln Glu Gly Lys Glu Cys
500 505 510
Ser Asn Ile Ile Tyr Glu Ala Thr Phe Glu Leu Ser Glu Ser Arg Leu
515 520 525
Phe Ser Leu Thr Arg Leu Gln Ala Lys Cys Ala Asp Lys Val Glu Ser
530 535 540
Leu Pro Pro Val Asp Thr Glu Ser Asp Asp Ala Lys Ser Glu Asn Ser
545 550 555 560
Thr Ser Ser Glu Asn Thr Glu Lys Ser Asn Lys Lys Leu Phe Tyr Pro
565 570 575
Val Thr Ile Pro Thr Gln Leu Lys Phe Val His Val Lys Pro Met Gly
580 585 590
Ser Ser Thr Lys Ile Ser Ser Ser Leu Lys Ile Lys Glu Leu Asn Lys
595 600 605
Lys Asp Ala Val Lys Arg Ser Ile Glu Glu Leu Lys Asn Gln Leu Glu
610 615 620
Ser Lys Leu Tyr Arg Val Arg Ser Tyr Leu Glu Asp Glu Gln Val Val
625 630 635 640
Gln Lys Gly Pro Ala Ser Gln Val Glu Ala Leu Ser Thr Gln Val Ala
645 650 655
Glu Asn Leu Glu Trp Leu Asp Tyr Asp Ser Asp Asp Ala Ser Ala Lys
660 665 670
Asp Ile Arg Asp Lys Leu Asn Phe Val Ser Glu Ser Val Ser Phe Ile
675 680 685
Lys Asn Tyr Ile Asp Leu Ser Asp Val Thr Leu Asp Asn Asn Leu Phe
690 695 700
Thr Met Ile Tyr Asn Thr Thr Ser Asn Ser Met Gln Asn Val Gln Glu
705 710 715 720
Leu Met Leu Asn Met Ser Glu Asp Ala Leu Ser Leu Met Gln Gln Tyr
725 730 735
Glu Lys Glu Gly Leu Asp Phe Ala Lys Glu Ser Gln Lys Ile Lys Ile
740 745 750
Lys Ser Pro Pro Leu Ser Asp Lys Glu Leu Asp Gly Leu Phe Asn Val
755 760 765
Val Thr Glu Lys Leu Glu Tyr Val Arg Thr Leu Thr Glu Glu Asp Gly
770 775 780
Ile Val Gly Leu Pro Arg Glu Glu Leu Phe Lys Leu Tyr Gln Glu Leu
785 790 795 800
Gln Asn Tyr Ser Ser Arg Phe Glu Glu Ile Met Thr Ser Leu Lys Asp
805 810 815
Val His Ser Gln Arg Ile Asn Arg Leu Thr Asp Lys Leu Asn Lys His
820 825 830
Ile Glu Arg Val Asn Asn Glu Ala Leu Lys Ala Ala Leu Lys Glu Ala
835 840 845
Lys Arg Gln Gln Glu Glu Glu Lys Ser His Glu Gln Asn Asp Glu Glu
850 855 860
Glu Gln Gly Ser Ser Ser Thr Ser His Thr Lys Ala Glu Thr Glu Glu
865 870 875 880
<210> 39
<211> 1007
<212> PRT
<213> 解脂耶氏酵母
<400> 39
Met Lys Val Ala His Ile Ile Gln Leu Ala Ala Met Val Ala Thr Ala
1 5 10 15
Leu Ala Ala Val Leu Ala Ile Asp Tyr Gly Gln Glu Tyr Thr Lys Ala
20 25 30
Ala Leu Leu Ser Pro Gly Ile Asn Phe Glu Ile Val Leu Thr Gln Asp
35 40 45
Ser Lys Arg Lys Gln Pro Ser Ala Ile Gly Phe Lys Gly Lys Ala Asp
50 55 60
Ser Lys Phe Gly Leu Glu Arg Val Tyr Gly Ser Pro Ala Val Leu Met
65 70 75 80
Glu Pro Arg Phe Pro Ser Asp Val Val Leu Tyr His Lys Arg Leu Leu
85 90 95
Gly Gly Arg Pro Lys Leu Asp Asn Pro Asn Tyr Lys Glu Tyr Thr Gln
100 105 110
Met Arg Pro Ala Cys Met Ala Val Pro Ser Asn Ser Ser Arg Ser Ala
115 120 125
Ile Ala Phe Gln Val Lys Asp Ser Glu Trp Ser Ala Glu Glu Leu Leu
130 135 140
Ala Met Gln Ile Ser Asp Ile Lys Ser Arg Ala Asp Asp Met Leu Lys
145 150 155 160
Thr Gln Ser Lys Ser Asn Thr Asp Thr Val Lys Asp Val Val Met Thr
165 170 175
Val Pro Pro His Phe Thr His Ser Gln Arg Leu Ala Leu Ala Asp Ala
180 185 190
Val Asp Leu Ala Gly Leu Lys Leu Ile Ala Leu Val Ser Asp Gly Thr
195 200 205
Ala Thr Ala Val Asn Tyr Val Ser Thr Arg Lys Phe Thr Asp Glu Lys
210 215 220
Glu Tyr His Val Val Tyr Asp Met Gly Ala Gly Ser Ala Ser Ala Thr
225 230 235 240
Leu Phe Ser Val Gln Asp Val Asn Gly Thr Pro Val Ile Asp Ile Glu
245 250 255
Gly Val Gly Tyr Asp Glu Ala Leu Ala Gly Gln Asp Met Thr Asn Met
260 265 270
Met Val Lys Ile Leu Ala Ala Ser Phe Met Glu Gln Asn Lys Asp Lys
275 280 285
Val Gln Leu Gln Thr Phe Ile Arg Asp Val Lys Ala Ala Ala Lys Leu
290 295 300
Trp Lys Glu Ala Glu Arg Ala Lys Ala Ile Leu Ser Ala Asn Gln Glu
305 310 315 320
Val Ser Val Ser Ile Glu Ala Val His Asn Gly Ile Asp Phe Lys Thr
325 330 335
Thr Val Thr Arg Asp Asp Tyr Val Arg Ser Ile Glu Lys Ile Ser Thr
340 345 350
Arg Leu Asn Gly Pro Leu Glu Lys Ala Leu Ala Gly Phe Ala Asp Ser
355 360 365
Pro Val Ala Leu Lys Asp Val Lys Ser Val Ile Leu Thr Gly Gly Val
370 375 380
Thr Arg Thr Pro Val Ile Gln Glu Lys Leu Lys Glu Leu Leu Gly Asp
385 390 395 400
Val Pro Ile Ser Lys Asn Val Asn Thr Asp Glu Ser Ile Val Leu Gly
405 410 415
Ser Leu Leu Arg Gly Val Gly Ile Ser Ser Ile Phe Lys Ser Arg Asp
420 425 430
Ile Lys Val Ile Asp Arg Thr Pro His Glu Phe Asp Leu Arg Leu Asp
435 440 445
Val Leu Gly Ala Lys Asp Glu Ile Leu Arg Ser Glu Lys Ala Asn Val
450 455 460
Phe Ser Lys Gly Ala Ala Gln Gly Glu Ser Val Val Ser Lys Leu Asp
465 470 475 480
Ile Ser Glu Ile Gly Asn Ala Asn Leu Tyr Leu Leu Glu Asp Gly Asp
485 490 495
Ser Phe Val Arg Leu Asp Val Arg Asp Met Asp Ala Ile Lys Lys Glu
500 505 510
Leu Asn Cys Glu Lys Ser Ala Glu Leu His Val Pro Phe Asp Leu Thr
515 520 525
Leu Ser Gly Thr Ile Lys Val Gly Lys Ala Lys Val Val Cys Lys Gly
530 535 540
Gly Asp Ala Glu Ala Asp Ala Glu Val Thr Val Asp Asp Pro Val Glu
545 550 555 560
Asp Val Val Val Glu Glu Glu Val Val Glu Gly Glu Thr Val Glu Gly
565 570 575
Asp Ala Lys Ala Ala Lys Asp Ser Lys Asp Ser Lys Asp Ser Lys Lys
580 585 590
Ala Ser Lys Lys Val Asp Thr Ser Arg Tyr Val Pro His Lys Thr Arg
595 600 605
Phe Val Gly Thr Lys Pro Leu Thr Ser Ala Ala Lys Leu Lys Ile Ser
610 615 620
Gly His Leu Arg Ser Leu Ala Arg Lys Asp Ala Glu Arg Leu Ala Thr
625 630 635 640
Ser Asp Ala Ala Asn Lys Leu Glu Ser Thr Ile Tyr His Ile Lys His
645 650 655
Leu Ile Glu Asp Ala Val Asp Gln Asp Lys Val Ala Asp Ile Lys Lys
660 665 670
Lys Ile Glu Asp Ala Ala Ala Trp Phe Glu Glu Asp Gly Leu Thr Ala
675 680 685
Gly Ile Gln Glu Leu Thr Glu Lys Leu Ser Val Val Gln Pro Leu Glu
690 695 700
Asp Phe Phe Lys Thr Ala Gly Glu Ala Ile Ala Asp Lys Ala Thr Ala
705 710 715 720
Ala Ala Ser Ala Ala Gly Glu Phe Val Asp Gln Ala Ala Ala Ala Ala
725 730 735
Gly Val Lys Ala Gly Glu Ala Ala Asp Ala Ala Lys Gly Ala Ala Asp
740 745 750
Ala Ala Gly Lys Lys Ala Lys Lys Ala Lys Lys Ala Ala Gly Lys Ala
755 760 765
Ala Ser Gln Ala Glu Glu Asp Val Leu Asp Gln Leu Lys Asp Ala Asn
770 775 780
Asp Leu Ile Lys Asn Ile Ala Gln Leu Ala Arg Glu Ser Gly Asn Asp
785 790 795 800
Val Pro Ser Glu Glu Asp Ile Glu Arg Glu Met Lys Arg Ala Ala Glu
805 810 815
Gly Gly Asp Ser Ser Asp Ser Ala Asp Leu Ser Gly His Leu Glu Thr
820 825 830
Leu Met Gly Leu Gln Asp Met Leu Asn Glu Leu Asn Gly Gly Glu Ala
835 840 845
Pro Ser Ala Pro Gly Leu Asp Val Thr Ala Ile Ala Gly Ile Thr Arg
850 855 860
Thr Ile Gln Arg Leu Ser Asp Lys Leu Thr Glu Leu Gly Thr Pro Pro
865 870 875 880
Lys Asp Glu Asp Asp Met Phe Arg Met Leu Gly Ile Asp Pro Gln Thr
885 890 895
Phe His Lys Phe Ser Glu Glu Ala Phe Glu Asp Gln Ala Ser Pro Ala
900 905 910
Asp Gln Leu Met Asp Ser Ile Gly Phe Leu Gln Gln Val Leu Ala Gln
915 920 925
Asp Glu Ser Pro Asp Pro Ala Ala Leu Glu Lys Met Arg Ala Asn Ile
930 935 940
Ala Glu Arg Gln Glu Arg Ile Ala Lys Val Ala Glu Val Ala Glu Arg
945 950 955 960
Asn Gln Lys Arg Gln Ile Ala Ala Leu Glu Asn Met Leu Lys Asn Ala
965 970 975
Glu Lys Thr Ile Asp Ile Ser Ile Tyr Asn Leu Lys Gln Gln Ala Pro
980 985 990
Lys Thr Ala Ser Val Glu Asp Lys Lys Ala Glu His Asp Glu Leu
995 1000 1005
<210> 40
<211> 985
<212> PRT
<213> 里氏木霉
<400> 40
Arg Lys Ser Pro Leu Leu Lys Leu Leu Gly Ala Ala Phe Leu Phe Ser
1 5 10 15
Thr Asn Val Leu Ala Ile Ser Ala Val Leu Gly Val Asp Leu Gly Thr
20 25 30
Glu Tyr Ile Lys Ala Ala Leu Val Lys Pro Gly Ile Pro Leu Glu Ile
35 40 45
Val Leu Thr Lys Asp Ser Arg Arg Lys Glu Thr Ser Ala Val Ala Phe
50 55 60
Lys Pro Ala Lys Gly Ala Leu Pro Glu Gly Gln Tyr Pro Glu Arg Ser
65 70 75 80
Tyr Gly Ala Asp Ala Met Ala Leu Ala Ala Arg Phe Pro Gly Glu Val
85 90 95
Tyr Pro Asn Leu Lys Pro Leu Leu Gly Leu Pro Val Gly Asp Ala Ile
100 105 110
Val Gln Glu Tyr Ala Ala Arg His Pro Ala Leu Lys Leu Gln Ala His
115 120 125
Pro Thr Arg Gly Thr Ala Ala Phe Lys Thr Glu Thr Leu Ser Pro Glu
130 135 140
Glu Glu Ala Trp Met Val Glu Glu Leu Leu Ala Met Glu Leu Gln Ser
145 150 155 160
Ile Gln Lys Asn Ala Glu Val Thr Ala Gly Gly Asp Ser Ser Ile Arg
165 170 175
Ser Ile Val Leu Thr Val Pro Pro Phe Tyr Thr Ile Glu Glu Lys Arg
180 185 190
Ala Leu Gln Met Ala Ala Glu Leu Ala Gly Phe Lys Val Leu Ser Leu
195 200 205
Val Ser Asp Gly Leu Ala Val Gly Leu Asn Tyr Ala Thr Ser Arg Gln
210 215 220
Phe Pro Asn Ile Asn Glu Gly Ala Lys Pro Glu Tyr His Leu Val Phe
225 230 235 240
Asp Met Gly Ala Gly Ser Thr Thr Ala Thr Val Met Arg Phe Gln Ser
245 250 255
Arg Thr Val Lys Asp Val Gly Lys Phe Asn Lys Thr Val Gln Glu Ile
260 265 270
Gln Val Leu Gly Ser Gly Trp Asp Arg Thr Leu Gly Gly Asp Ser Leu
275 280 285
Asn Ser Leu Ile Ile Asp Asp Met Ile Ala Gln Phe Val Glu Ser Lys
290 295 300
Gly Ala Gln Lys Ile Ser Ala Thr Ala Glu Gln Val Gln Ser His Gly
305 310 315 320
Arg Ala Val Ala Lys Leu Ser Lys Glu Ala Glu Arg Leu Arg His Val
325 330 335
Leu Ser Ala Asn Gln Asn Thr Gln Ala Ser Phe Glu Gly Leu Tyr Glu
340 345 350
Asp Val Asp Phe Lys Tyr Lys Ile Ser Arg Ala Asp Phe Glu Thr Met
355 360 365
Ala Lys Ala His Val Glu Arg Val Asn Ala Ala Ile Lys Asp Ala Leu
370 375 380
Lys Ala Ala Asn Leu Glu Ile Gly Asp Leu Thr Ser Val Ile Leu His
385 390 395 400
Gly Gly Ala Thr Arg Thr Pro Phe Val Arg Glu Ala Ile Glu Lys Ala
405 410 415
Leu Gly Ser Gly Asp Lys Ile Arg Thr Asn Val Asn Ser Asp Glu Ala
420 425 430
Ala Val Phe Gly Ala Ala Phe Arg Ala Ala Glu Leu Ser Pro Ser Phe
435 440 445
Arg Val Lys Glu Ile Arg Ile Ser Glu Gly Ala Asn Tyr Ala Ala Gly
450 455 460
Ile Thr Trp Lys Ala Ala Asn Gly Lys Val His Arg Gln Arg Leu Trp
465 470 475 480
Thr Ala Pro Ser Pro Leu Gly Gly Pro Ala Lys Glu Ile Thr Phe Thr
485 490 495
Glu Gln Glu Asp Phe Thr Gly Leu Phe Tyr Gln Gln Val Asp Thr Glu
500 505 510
Asp Lys Pro Val Lys Ser Phe Ser Thr Lys Asn Leu Thr Ala Ser Val
515 520 525
Ala Ala Leu Lys Glu Lys Tyr Pro Thr Cys Ala Asp Thr Gly Val Gln
530 535 540
Phe Lys Ala Ala Ala Lys Leu Arg Thr Glu Asn Gly Glu Val Ala Ile
545 550 555 560
Val Lys Ala Phe Val Glu Cys Glu Ala Glu Val Val Glu Lys Glu Gly
565 570 575
Phe Val Asp Gly Val Lys Asn Leu Phe Gly Phe Gly Lys Lys Asp Gln
580 585 590
Lys Pro Leu Ala Glu Gly Gly Asp Lys Asp Ser Ala Asp Ala Ser Ala
595 600 605
Asp Ser Glu Ala Glu Thr Glu Glu Ala Ser Ser Ala Thr Lys Ser Ser
610 615 620
Ser Ser Thr Ser Thr Thr Lys Ser Gly Asp Ala Ala Glu Ser Thr Glu
625 630 635 640
Ala Ala Lys Glu Val Lys Lys Lys Gln Leu Val Ser Ile Pro Val Glu
645 650 655
Val Thr Leu Glu Lys Ala Gly Ile Pro Gln Leu Thr Lys Ala Glu Trp
660 665 670
Thr Lys Ala Lys Asp Arg Leu Lys Ala Phe Ala Ala Ser Asp Lys Ala
675 680 685
Arg Leu Gln Arg Glu Glu Ala Leu Asn Gln Leu Glu Ala Phe Thr Tyr
690 695 700
Lys Val Arg Asp Leu Val Asp Asn Glu Ala Phe Ile Ser Ala Ser Thr
705 710 715 720
Glu Ala Glu Arg Gln Thr Leu Ser Glu Lys Ala Ser Glu Ala Ser Asp
725 730 735
Trp Leu Tyr Glu Glu Gly Asp Ser Ala Thr Lys Asp Asp Phe Val Ala
740 745 750
Lys Leu Lys Ala Leu Gln Asp Leu Val Ala Pro Ile Gln Asn Arg Leu
755 760 765
Asp Glu Ala Glu Lys Arg Pro Gly Leu Ile Ser Asp Leu Arg Asn Ile
770 775 780
Leu Asn Thr Thr Asn Val Phe Ile Asp Thr Val Arg Gly Gln Ile Ala
785 790 795 800
Ala Tyr Asp Glu Trp Lys Ser Thr Ala Ser Ala Lys Ser Ala Glu Ser
805 810 815
Ala Thr Ser Ser Ala Ala Ala Glu Ala Thr Thr Asn Asp Phe Glu Gly
820 825 830
Leu Glu Asp Glu Asp Asp Ser Pro Lys Glu Ala Glu Glu Lys Pro Val
835 840 845
Pro Glu Lys Val Val Pro Pro Leu His Asn Ser Glu Glu Ile Asp Thr
850 855 860
Leu Glu Val Leu Tyr Lys Glu Thr Leu Glu Trp Leu Asn Lys Leu Glu
865 870 875 880
Arg Gln Gln Ala Asp Val Pro Leu Thr Glu Glu Pro Val Leu Val Val
885 890 895
Ser Glu Leu Val Ala Arg Arg Asp Ala Leu Asp Lys Ala Ser Leu Asp
900 905 910
Leu Ala Leu Lys Ser Tyr Thr Gln Tyr Gln Lys Asn Lys Pro Lys Lys
915 920 925
Pro Thr Lys Ser Lys Lys Ala Lys Lys Gln Asp Lys Thr Lys Ser Ala
930 935 940
Asp Lys Ala Gly Pro Thr Phe Glu Phe Pro Glu Gly Ser Val Pro Leu
945 950 955 960
Ser Gly Glu Glu Leu Glu Glu Leu Val Lys Lys Tyr Met Lys Glu Glu
965 970 975
Glu Glu Thr Arg Arg Gln Ala Glu Gly
980 985
<210> 41
<211> 848
<212> PRT
<213> 粟酒裂殖酵母
<400> 41
Met Lys Arg Ser Val Leu Thr Ile Ile Leu Phe Phe Ser Cys Gln Phe
1 5 10 15
Trp His Ala Phe Ala Ser Ser Val Leu Ala Ile Asp Tyr Gly Thr Glu
20 25 30
Trp Thr Lys Ala Ala Leu Ile Lys Pro Gly Ile Pro Leu Glu Ile Val
35 40 45
Leu Thr Lys Asp Thr Arg Arg Lys Glu Gln Ser Ala Val Ala Phe Lys
50 55 60
Gly Asn Glu Arg Ile Phe Gly Val Asp Ala Ser Asn Leu Ala Thr Arg
65 70 75 80
Phe Pro Ala His Ser Ile Arg Asn Val Lys Glu Leu Leu Asp Thr Ala
85 90 95
Gly Leu Glu Ser Val Leu Val Gln Lys Tyr Gln Ser Ser Tyr Pro Ala
100 105 110
Ile Gln Leu Val Glu Asn Glu Glu Thr Thr Ser Gly Ile Ser Phe Val
115 120 125
Ile Ser Asp Glu Glu Asn Tyr Ser Leu Glu Glu Ile Ile Ala Met Thr
130 135 140
Met Glu His Tyr Ile Ser Leu Ala Glu Glu Met Ala His Glu Lys Ile
145 150 155 160
Thr Asp Leu Val Leu Thr Val Pro Pro His Phe Asn Glu Leu Gln Arg
165 170 175
Ser Ile Leu Leu Glu Ala Ala Arg Ile Leu Asn Lys His Val Leu Ala
180 185 190
Leu Ile Asp Asp Asn Val Ala Val Ala Ile Glu Tyr Ser Leu Ser Arg
195 200 205
Ser Phe Ser Thr Asp Pro Thr Tyr Asn Ile Ile Tyr Asp Ser Gly Ser
210 215 220
Gly Ser Thr Ser Ala Thr Val Ile Ser Phe Asp Thr Val Glu Gly Ser
225 230 235 240
Ser Leu Gly Lys Lys Gln Asn Ile Thr Arg Ile Arg Ala Leu Ala Ser
245 250 255
Gly Phe Thr Leu Lys Leu Ser Gly Asn Glu Ile Asn Arg Lys Leu Ile
260 265 270
Gly Phe Met Lys Asn Ser Phe Tyr Gln Lys His Gly Ile Asp Leu Ser
275 280 285
His Asn His Arg Ala Leu Ala Arg Leu Glu Lys Glu Ala Leu Arg Val
290 295 300
Lys His Ile Leu Ser Ala Asn Ser Glu Ala Ile Ala Ser Ile Glu Glu
305 310 315 320
Leu Ala Asp Gly Ile Asp Phe Arg Leu Lys Ile Thr Arg Ser Val Leu
325 330 335
Glu Ser Leu Cys Lys Asp Met Glu Asp Ala Ala Val Glu Pro Ile Asn
340 345 350
Lys Ala Leu Lys Lys Ala Asn Leu Thr Phe Ser Glu Ile Asn Ser Ile
355 360 365
Ile Leu Phe Gly Gly Ala Ser Arg Ile Pro Phe Ile Gln Ser Thr Leu
370 375 380
Ala Asp Tyr Val Ser Ser Asp Lys Ile Ser Lys Asn Val Asn Ala Asp
385 390 395 400
Glu Ala Ser Val Lys Gly Ala Ala Phe Tyr Gly Ala Ser Leu Thr Lys
405 410 415
Ser Phe Arg Val Lys Pro Leu Ile Val Gln Asp Ile Ile Asn Tyr Pro
420 425 430
Tyr Leu Leu Ser Leu Gly Thr Ser Glu Tyr Ile Val Ala Leu Pro Asp
435 440 445
Ser Thr Pro Tyr Gly Met Gln His Asn Val Thr Ile His Asn Val Ser
450 455 460
Thr Ile Gly Lys His Pro Ser Phe Pro Leu Ser Asn Asn Gly Glu Leu
465 470 475 480
Ile Gly Glu Phe Thr Leu Ser Asn Ile Thr Asp Val Glu Lys Val Cys
485 490 495
Ala Cys Ser Asn Lys Asn Ile Gln Ile Ser Phe Ser Ser Asp Arg Thr
500 505 510
Lys Gly Ile Leu Val Pro Leu Ser Ala Ile Met Thr Cys Glu His Gly
515 520 525
Glu Leu Ser Ser Lys His Lys Leu Gly Asp Arg Val Lys Ser Leu Phe
530 535 540
Gly Ser His Asp Glu Ser Gly Leu Arg Asn Asn Glu Ser Tyr Pro Ile
545 550 555 560
Gly Phe Thr Tyr Lys Lys Tyr Gly Glu Met Ser Asp Asn Ala Leu Arg
565 570 575
Leu Ala Ser Ala Lys Leu Glu Arg Arg Leu Gln Ile Asp Lys Ser Lys
580 585 590
Ala Ala His Asp Asn Ala Leu Asn Glu Leu Glu Thr Leu Leu Tyr Arg
595 600 605
Ala Gln Ala Met Val Asp Asp Asp Glu Phe Leu Glu Phe Ala Asn Pro
610 615 620
Glu Glu Thr Lys Ile Leu Lys Asn Asp Ser Val Glu Ser Tyr Asp Trp
625 630 635 640
Leu Ile Glu Tyr Gly Ser Gln Ser Pro Thr Ser Glu Val Thr Asp Arg
645 650 655
Tyr Lys Lys Leu Asp Asp Thr Leu Lys Ser Ile Ser Phe Arg Phe Asp
660 665 670
Gln Ala Lys Gln Phe Asn Thr Ser Leu Glu Asn Phe Lys Asn Ala Leu
675 680 685
Glu Arg Ala Glu Ser Leu Leu Thr Asn Phe Asp Val Pro Asp Tyr Pro
690 695 700
Leu Asn Val Tyr Asp Glu Lys Asp Val Lys Arg Val Asn Ser Leu Arg
705 710 715 720
Gly Thr Ser Tyr Lys Lys Leu Gly Asn Gln Tyr Tyr Asn Asp Thr Gln
725 730 735
Trp Leu Lys Asp Asn Leu Asp Ser His Leu Ser His Thr Leu Ser Glu
740 745 750
Asp Pro Leu Ile Lys Val Glu Glu Leu Glu Glu Lys Ala Lys Arg Leu
755 760 765
Gln Glu Leu Thr Tyr Glu Tyr Leu Arg Arg Ser Leu Gln Gln Pro Lys
770 775 780
Leu Lys Ala Lys Lys Gly Ala Ser Ser Ser Ser Thr Ala Glu Ser Lys
785 790 795 800
Val Glu Asp Glu Thr Phe Thr Asn Asp Ile Glu Pro Thr Thr Ala Leu
805 810 815
Asn Ser Thr Ser Thr Gln Glu Thr Glu Lys Ser Arg Ala Ser Val Thr
820 825 830
Gln Arg Pro Ser Ser Leu Gln Gln Glu Ile Asp Asp Ser Asp Glu Leu
835 840 845
<210> 42
<211> 881
<212> PRT
<213> 酿酒酵母
<400> 42
Met Arg Asn Val Leu Arg Leu Leu Phe Leu Thr Ala Phe Val Ala Ile
1 5 10 15
Gly Ser Leu Ala Ala Val Leu Gly Val Asp Tyr Gly Gln Gln Asn Ile
20 25 30
Lys Ala Ile Val Val Ser Pro Gln Ala Pro Leu Glu Leu Val Leu Thr
35 40 45
Pro Glu Ala Lys Arg Lys Glu Ile Ser Gly Leu Ser Ile Lys Arg Leu
50 55 60
Pro Gly Tyr Gly Lys Asp Asp Pro Asn Gly Ile Glu Arg Ile Tyr Gly
65 70 75 80
Ser Ala Val Gly Ser Leu Ala Thr Arg Phe Pro Gln Asn Thr Leu Leu
85 90 95
His Leu Lys Pro Leu Leu Gly Lys Ser Leu Glu Asp Glu Thr Thr Val
100 105 110
Thr Leu Tyr Ser Lys Gln His Pro Gly Leu Glu Met Val Ser Thr Asn
115 120 125
Arg Ser Thr Ile Ala Phe Leu Val Asp Asn Val Glu Tyr Pro Leu Glu
130 135 140
Glu Leu Val Ala Met Asn Val Gln Glu Ile Ala Asn Arg Ala Asn Ser
145 150 155 160
Leu Leu Lys Asp Arg Asp Ala Arg Thr Glu Asp Phe Val Asn Lys Met
165 170 175
Ser Phe Thr Ile Pro Asp Phe Phe Asp Gln His Gln Arg Lys Ala Leu
180 185 190
Leu Asp Ala Ser Ser Ile Thr Thr Gly Ile Glu Glu Thr Tyr Leu Val
195 200 205
Ser Glu Gly Met Ser Val Ala Val Asn Phe Val Leu Lys Gln Arg Gln
210 215 220
Phe Pro Pro Gly Glu Gln Gln His Tyr Ile Val Tyr Asp Met Gly Ser
225 230 235 240
Gly Ser Ile Lys Ala Ser Met Phe Ser Ile Leu Gln Pro Glu Asp Thr
245 250 255
Thr Gln Pro Val Thr Ile Glu Phe Glu Gly Tyr Gly Tyr Asn Pro His
260 265 270
Leu Gly Gly Ala Lys Phe Thr Met Asp Ile Gly Ser Leu Ile Glu Asn
275 280 285
Lys Phe Leu Glu Thr His Pro Ala Ile Arg Thr Asp Glu Leu His Ala
290 295 300
Asn Pro Lys Ala Leu Ala Lys Ile Asn Gln Ala Ala Glu Lys Ala Lys
305 310 315 320
Leu Ile Leu Ser Ala Asn Ser Glu Ala Ser Ile Asn Ile Glu Ser Leu
325 330 335
Ile Asn Asp Ile Asp Phe Arg Thr Ser Ile Thr Arg Gln Glu Phe Glu
340 345 350
Glu Phe Ile Ala Asp Ser Leu Leu Asp Ile Val Lys Pro Ile Asn Asp
355 360 365
Ala Val Thr Lys Gln Phe Gly Gly Tyr Gly Thr Asn Leu Pro Glu Ile
370 375 380
Asn Gly Val Ile Leu Ala Gly Gly Ser Ser Arg Ile Pro Ile Val Gln
385 390 395 400
Asp Gln Leu Ile Lys Leu Val Ser Glu Glu Lys Val Leu Arg Asn Val
405 410 415
Asn Ala Asp Glu Ser Ala Val Asn Gly Val Val Met Arg Gly Ile Lys
420 425 430
Leu Ser Asn Ser Phe Lys Thr Lys Pro Leu Asn Val Val Asp Arg Ser
435 440 445
Val Asn Thr Tyr Ser Phe Lys Leu Ser Asn Glu Ser Glu Leu Tyr Asp
450 455 460
Val Phe Thr Arg Gly Ser Ala Tyr Pro Asn Lys Thr Ser Ile Leu Thr
465 470 475 480
Asn Thr Thr Asp Ser Ile Pro Asn Asn Phe Thr Ile Asp Leu Phe Glu
485 490 495
Asn Gly Lys Leu Phe Glu Thr Ile Thr Val Asn Ser Gly Ala Ile Lys
500 505 510
Asn Ser Tyr Ser Ser Asp Lys Cys Ser Ser Gly Val Ala Tyr Asn Ile
515 520 525
Thr Phe Asp Leu Ser Ser Asp Arg Leu Phe Ser Ile Gln Glu Val Asn
530 535 540
Cys Ile Cys Gln Ser Glu Asn Asp Ile Gly Asn Ser Lys Gln Ile Lys
545 550 555 560
Asn Lys Gly Ser Arg Leu Ala Phe Thr Ser Glu Asp Val Glu Ile Lys
565 570 575
Arg Leu Ser Pro Ser Glu Arg Ser Arg Leu His Glu His Ile Lys Leu
580 585 590
Leu Asp Lys Gln Asp Lys Glu Arg Phe Gln Phe Gln Glu Asn Leu Asn
595 600 605
Val Leu Glu Ser Asn Leu Tyr Asp Ala Arg Asn Leu Leu Met Asp Asp
610 615 620
Glu Val Met Gln Asn Gly Pro Lys Ser Gln Val Glu Glu Leu Ser Glu
625 630 635 640
Met Val Lys Val Tyr Leu Asp Trp Leu Glu Asp Ala Ser Phe Asp Thr
645 650 655
Asp Pro Glu Asp Ile Val Ser Arg Ile Arg Glu Ile Gly Ile Leu Lys
660 665 670
Lys Lys Ile Glu Leu Tyr Met Asp Ser Ala Lys Glu Pro Leu Asn Ser
675 680 685
Gln Gln Phe Lys Gly Met Leu Glu Glu Gly His Lys Leu Leu Gln Ala
690 695 700
Ile Glu Thr His Lys Asn Thr Val Glu Glu Phe Leu Ser Gln Phe Glu
705 710 715 720
Thr Glu Phe Ala Asp Thr Ile Asp Asn Val Arg Glu Glu Phe Lys Lys
725 730 735
Ile Lys Gln Pro Ala Tyr Val Ser Lys Ala Leu Ser Thr Trp Glu Glu
740 745 750
Thr Leu Thr Ser Phe Lys Asn Ser Ile Ser Glu Ile Glu Lys Phe Leu
755 760 765
Ala Lys Asn Leu Phe Gly Glu Asp Leu Arg Glu His Leu Phe Glu Ile
770 775 780
Lys Leu Gln Phe Asp Met Tyr Arg Thr Lys Leu Glu Glu Lys Leu Arg
785 790 795 800
Leu Ile Lys Ser Gly Asp Glu Ser Arg Leu Asn Glu Ile Lys Lys Leu
805 810 815
His Leu Arg Asn Phe Arg Leu Gln Lys Arg Lys Glu Glu Lys Leu Lys
820 825 830
Arg Lys Leu Glu Gln Glu Lys Ser Arg Asn Asn Asn Glu Thr Glu Ser
835 840 845
Thr Val Ile Asn Ser Ala Asp Asp Lys Thr Thr Ile Val Asn Asp Lys
850 855 860
Thr Thr Glu Ser Asn Pro Ser Ser Glu Glu Asp Ile Leu His Asp Glu
865 870 875 880
Leu
<210> 43
<211> 863
<212> PRT
<213> 乳酸克鲁维酵母
<400> 43
Met Arg Ile Val Phe Trp Phe Leu Leu Ala Ile Gln Ser Leu Thr Thr
1 5 10 15
Cys Phe Ala Ala Val Val Gly Leu Asp Phe Gly Thr His Tyr Val Lys
20 25 30
Glu Met Val Val Ser Leu Lys Ala Pro Leu Glu Ile Val Leu Asn Pro
35 40 45
Glu Ser Lys Arg Lys Asp Ala Ser Ala Leu Ala Ile Arg Ser Trp Asp
50 55 60
Ser Gln Asn Tyr Leu Glu Arg Phe Tyr Gly Ser Ser Ala Val Ala Leu
65 70 75 80
Ala Thr Arg Phe Pro Ser Thr Thr Phe Met His Leu Lys Ser Leu Leu
85 90 95
Gly Lys His Tyr Glu Asp Asn Leu Phe Tyr Tyr His Arg Glu His Pro
100 105 110
Gly Leu Glu Phe Val Asn Asp Ala Ser Arg Asn Ala Ile Ala Phe Glu
115 120 125
Ile Asp Thr Asn Thr Thr Leu Ser Val Glu Glu Leu Val Ser Met Asn
130 135 140
Leu Lys Gln Tyr Met Glu Arg Ala Asn Gln Leu Leu Lys Glu Ser Asp
145 150 155 160
Asp Ser Asp Asn Val Lys Ser Val Ala Ile Ala Ile Pro Glu Tyr Phe
165 170 175
Ser Gln Glu Gln Arg Ala Ala Leu Leu Asp Ala Thr Tyr Leu Ala Gly
180 185 190
Ile Gly Gln Thr Tyr Leu Cys Asn Asp Ala Ile Ala Val Ala Ile Asp
195 200 205
Tyr Ala Ser Lys Gln Lys Ser Phe Pro Ala Gly Lys Pro Asn Tyr His
210 215 220
Val Ile Tyr Asp Met Gly Ala Gly Ser Thr Thr Ala Ser Leu Ile Ser
225 230 235 240
Ile Leu Gln Pro Glu Asn Ile Thr Leu Pro Leu Arg Ile Glu Phe Leu
245 250 255
Gly Tyr Gly His Thr Glu Ser Leu Ser Gly Ser Val Leu Ser Leu Ala
260 265 270
Ile Val Asp Leu Leu Glu Asn Asp Phe Leu Glu Ser Asn Pro Asn Ile
275 280 285
Arg Thr Glu Gln Phe Glu Ser Asp Ala Ser Ala Lys Ala Lys Leu Val
290 295 300
Gln Ala Ala Glu Lys Ala Lys Leu Val Leu Ser Ala Asn Ser Asp Ala
305 310 315 320
Ser Ile Ser Ile Glu Ser Leu Tyr His Asp Leu Asp Phe Lys Thr Thr
325 330 335
Ile Thr Arg Ala Lys Phe Glu Glu Phe Val Ala Glu Leu Gln Ser Val
340 345 350
Val Ile Glu Pro Ile Leu Ser Thr Leu Glu Ser Pro Leu Asn Gly Lys
355 360 365
Ala Leu Asn Val Lys Asp Leu Asp Ser Val Ile Leu Thr Gly Gly Ser
370 375 380
Thr Arg Val Pro Phe Val Lys Lys Gln Leu Glu Asn His Leu Gly Ala
385 390 395 400
Ser Leu Ile Ser Lys Asn Val Asn Ser Asp Glu Ser Ala Val Asn Gly
405 410 415
Ala Ala Ile Arg Gly Val Gln Leu Ser Lys Glu Phe Lys Thr Arg Pro
420 425 430
Met Lys Val Ile Asp Arg Thr Thr His Ser Phe Gly Phe Ser Ile Gln
435 440 445
Asn Thr Asn Ile Ser Lys Leu Val Phe Asp Ala Gly Ser Glu Tyr Pro
450 455 460
Lys Glu Ile Asn Leu Gln Leu Pro Gly Met Glu Leu Lys Asp Thr Val
465 470 475 480
Leu Lys Ile Asp Leu Thr Glu Asp Glu Arg Val Phe Lys Thr Ile Phe
485 490 495
Ala Asp Val Asp Ser Lys Leu Gln Ser Ser Ser Leu Ser Asn Cys Ser
500 505 510
Thr Ala Val Thr Tyr Asn Val Thr Leu Ser Leu Asn Thr Asp Gln Val
515 520 525
Phe Asp Val Gln Ser Val Val Ala Ser Cys Leu Thr His Glu Glu Val
530 535 540
Pro Thr Gly Thr Glu Lys Glu His Lys Arg Thr Val Ser Glu His Ile
545 550 555 560
Gln Lys His Pro Ile Pro His Thr Val Glu Phe Thr Cys Val Lys Pro
565 570 575
Leu Ser Asn Thr Glu Lys Lys Glu Arg Phe Asn Lys Leu His Lys Trp
580 585 590
Asp Gln Lys Asp Lys Leu Leu Leu Glu Arg Gln Arg Leu Leu Asn Asp
595 600 605
Leu Glu Ala Ser Leu Tyr Ala Ala Arg Glu Leu Val Glu Asp Ala Lys
610 615 620
Glu Leu Glu Thr Pro Pro Thr Ser Tyr Ile Gln Gln Leu Glu Asn Met
625 630 635 640
Ile Thr Gln Tyr Leu Glu Phe Val Asp Asp Pro Ser Ser Leu Arg Thr
645 650 655
Lys Asn Ile Lys Thr Met Lys Ser Asn Leu Ala Glu Leu Gln Gln Arg
660 665 670
Leu Glu Ile Tyr Met Asp Arg Asp Asn Lys Gln Leu Asp Val Glu Gly
675 680 685
Phe Arg Ala Leu Phe Asp Lys Gly Glu Lys Tyr Leu Glu Leu Leu Ser
690 695 700
Lys Ile Gln Gln Lys Ser Leu Ser Glu Leu Ser Pro Leu Asn Lys Asn
705 710 715 720
Phe Glu Ser Leu Gly Leu Asn Val Ser Glu Glu Tyr Thr Lys Val Lys
725 730 735
Pro Pro Lys Ser Lys Thr Val Pro Phe Glu Ile Leu Asn Gly Thr Ile
740 745 750
Asp Leu Leu His Ser Gln Leu Lys His Ile Arg Asp Ile Ile Glu Asp
755 760 765
Asn Asn Ser Thr Tyr Ala Ile Glu Asp Leu Phe Glu Gln Lys Leu Glu
770 775 780
Val Asp Ser Leu Tyr Glu Lys Ile Glu Leu Leu Val Lys Lys Ile Arg
785 790 795 800
Ala Glu His Lys Tyr Arg Leu Lys Leu Leu Gln Ser Val Tyr Asp Arg
805 810 815
Arg Leu Thr Ala Gln Lys Arg Glu Gln Glu Ile Ala Lys Glu Ala Gln
820 825 830
Gln Ala Asp Gly Glu Asn Asn Asp Ser Ile Lys Thr Met Glu Glu Glu
835 840 845
Ser Ile Glu Glu His Glu Asp Ala Asn Phe Glu Gln Asp Glu Leu
850 855 860
<210> 44
<211> 903
<212> PRT
<213> 博伊丁假丝酵母
<400> 44
Met Lys Leu Phe Asn Gln Ile Ile Cys Ile Leu Ala Ile Ile Ser Pro
1 5 10 15
Ile Leu Ala Ser Ile Leu Gly Ile Asp Phe Gly Gln Gln Phe Thr Lys
20 25 30
Ser Ala Leu Leu Gly Pro Gly Val Asn Phe Glu Ile Leu Leu Thr Val
35 40 45
Asp Ser Lys Arg Lys Asp Ile Ser Gly Leu Ala Met Ala Ile Ala Pro
50 55 60
Asn Ser Asn Asn Glu Ile Gln Arg Ser Phe Gly Ser Ser Ser Leu Ser
65 70 75 80
Thr Cys Val Lys Asn Pro Gln Ala Cys Phe Thr Ser Phe Lys Ser Leu
85 90 95
Leu Gly Lys Ala Ile Asp Asp Glu Ser Thr Thr Gln Leu Tyr Leu Lys
100 105 110
Ser His Pro Gly Ile Glu Leu Ala Pro Ala Asn Tyr Ser Arg Asn Thr
115 120 125
Ile Asp Phe Lys Tyr Asn His Asp Ser Tyr Pro Val Glu Glu Ile Leu
130 135 140
Ala Met Tyr Phe Arg Asp Ile Lys Ser Arg Ala Asp Asp Tyr Leu Gly
145 150 155 160
Asp His Ala Ser Pro Gly Tyr Thr Lys Val Gln Lys Thr Ala Ile Thr
165 170 175
Val Pro Gly Phe Phe Asn Gln Ala Gln Arg Arg Ala Ile Leu Asp Ala
180 185 190
Ala Glu Ile Ala Gly Leu Asp Val Val Ser Leu Val Asp Asp Gly Ile
195 200 205
Ala Ile Ala Ala Glu Tyr Ala Ser Ser Arg Ala Phe Glu Ile Glu Lys
210 215 220
Glu Tyr His Leu Ile Tyr Asp Met Gly Ala Gly Ser Thr Lys Ala Thr
225 230 235 240
Leu Val Ser Phe Ser Gln Asn Asn Ser Asp Ile Ser Ile Val Asn Glu
245 250 255
Gly Tyr Gly Phe Asp Glu Thr Leu Gly Gly Glu Leu Leu Thr Asn Ser
260 265 270
Ile Lys Glu Leu Leu Ile Ser Lys Phe Leu Ala Ala Asn Pro Lys Val
275 280 285
Lys Ile Ser Asp Phe Leu Ser Asn Ser Arg Ala Ile Thr Arg Leu Leu
290 295 300
Gln Ser Ala Glu Lys Ala Lys Ser Val Leu Ser Ala Asn Thr Glu Thr
305 310 315 320
Arg Val Ser Ile Glu Asn Ile Tyr Asn Glu Ile Asp Phe Lys Thr Thr
325 330 335
Ile Thr Arg Ala Glu Tyr Glu Glu Ile Asn Ser Pro Ile Met Glu Arg
340 345 350
Ile Thr Ala Pro Ile Leu Lys Ala Ile Gln Ser Asn Ser Glu Arg Arg
355 360 365
Asp Ser Glu Asp Glu Asp Gln Pro Glu Ile Thr Leu Lys Asp Ile Lys
370 375 380
Ser Val Ile Leu Ala Gly Gly Ser Thr Arg Val Pro Phe Val Gln Arg
385 390 395 400
His Leu Ile Ser Leu Val Gly Glu Asp Val Ile Ser Lys Asn Val Asn
405 410 415
Ala Asp Glu Ala Ala Val Leu Gly Thr Thr Leu Arg Gly Val Gln Ile
420 425 430
Ser Gly Leu Phe Arg Ser Lys Arg Met Thr Val Val Glu Ser Thr Thr
435 440 445
Asn Asp Phe Cys Tyr Lys Ile Val Ser Asn Glu Leu Asp Glu Lys Asp
450 455 460
Ser Asn Leu Val Thr Val Phe Pro Val Asn Ala Lys Ile Asn Ser Lys
465 470 475 480
Lys Ser Val Lys Leu Asn Gln Leu Lys Asp Thr Phe Ser Asp Phe Glu
485 490 495
Leu Asp Phe Tyr Ser Asn Gly Glu Phe Ile Ser Gln Ala Asn Ile Ser
500 505 510
Pro Ser Glu Lys Phe Asp Asn Lys Leu Cys Thr Asn Gly Thr Ser Tyr
515 520 525
Ile Ala Arg Leu Glu Leu Asp Asn Ser Gly Leu Ala Ser Leu Thr Ser
530 535 540
Val Asp Gln Phe Cys Tyr Phe Glu Lys Ile Thr Lys Leu Ala Asn Asn
545 550 555 560
Ser Thr Glu Thr Asp Glu Thr Asp Lys Thr Ser Ser Lys Thr Ser Glu
565 570 575
Glu Glu Ala Ala Thr Thr Ser Ile Ala Ser Lys Lys Glu Lys Leu Glu
580 585 590
Pro Lys Ile Lys Tyr Pro Tyr Ile Arg Pro Met Gly Val Ser Thr Lys
595 600 605
Lys Ile Cys Lys Asn Arg Ile Ser Lys Leu Asp Thr Lys Asp Ala Val
610 615 620
Arg Ile Glu Lys Ala Thr Thr Val Asn Lys Leu Glu Ala Ile Leu Tyr
625 630 635 640
Ser Leu Arg Ser His Leu Asp Glu Asp Glu Ile Ala Glu Phe Val Asn
645 650 655
Ser Lys Ser Thr Phe Ile Asp Asp Ile Ser Thr Phe Val Lys Glu Asn
660 665 670
Leu Glu Trp Leu Glu Glu Thr Tyr Gln Leu Pro Asp Leu Glu Val Ile
675 680 685
Gln Ser Lys Leu Glu Ala Ala Thr Lys Lys Val Ser Asp Ile Lys Glu
690 695 700
Phe Thr Arg Val His Lys Ser Leu Arg Asp Ser Glu Phe Tyr Lys Asn
705 710 715 720
Met Thr Thr Ile Ser Asn Glu Ala Met Phe Gly Ile Gln Asp Phe Leu
725 730 735
Leu Thr Met Ser Glu Asp Leu Thr Ser Ile His Thr Asn Tyr Thr Met
740 745 750
Ala Gly Val Asp Ile Asn Glu Ala Asn Lys Lys Ile Glu Val Met Thr
755 760 765
Asn Pro Phe Asp Glu Ala Thr Ile Lys Glu His Phe Asp Ala Leu Gly
770 775 780
Glu Leu Leu Asp Lys Ile Lys Thr Leu Thr Glu Asp Glu Asp Val Leu
785 790 795 800
Ala Glu Lys Ser Ile Asp Tyr Leu Phe Gln Leu Phe Lys Asp Val Val
805 810 815
Lys Glu Leu Glu Val Leu Thr Lys Ile Lys Asn Val Leu Val Arg Ile
820 825 830
His Thr Lys Arg Ile Thr Lys Leu Gln Glu Tyr Leu Val Lys Gln Leu
835 840 845
Lys Lys Lys Leu Lys Ala Glu Arg Lys Ser Lys Ser Lys Ala Ser Ser
850 855 860
Lys Ser Ala Lys Ser Glu Glu Glu Val Thr Thr Thr Ser Ile Ala Pro
865 870 875 880
Glu Asn Thr Asp Ser Ser Asn Ala Ser Asp Ser Ser Ser Asp Ser Ser
885 890 895
Thr Val Gln Lys Asp Glu Leu
900
<210> 45
<211> 1000
<212> PRT
<213> 黑曲霉
<400> 45
Met Ala Pro Gly Ser Gln Arg Arg Pro Tyr Ala Ser Leu Thr Ser Leu
1 5 10 15
Pro Val Leu Ser Leu Ile Leu Pro Phe Leu Leu Phe Val Leu Ser Phe
20 25 30
Pro Ala Pro Ala Ala Ala Ala Gly Ser Ala Val Leu Gly Ile Asp Val
35 40 45
Gly Thr Glu Tyr Leu Lys Ala Thr Leu Val Lys Pro Gly Ile Pro Leu
50 55 60
Glu Ile Val Leu Thr Lys Asp Ser Lys Arg Lys Glu Ser Ala Ala Val
65 70 75 80
Ala Phe Lys Pro Thr Arg Glu Ala Asp Ala Ser Phe Pro Glu Arg Phe
85 90 95
Tyr Gly Gly Asp Ala Leu Ala Leu Ala Ala Arg Tyr Pro Asp Asp Val
100 105 110
Tyr Ser Asn Leu Lys Thr Leu Leu Gly Leu Pro Phe Asp Ala Asp Asn
115 120 125
Glu Leu Ile Lys Ser Phe His Ser Arg Tyr Pro Ala Leu Arg Leu Glu
130 135 140
Glu Ala Pro Gly Asp Arg Gly Thr Val Gly Leu Arg Ser Asn Arg Leu
145 150 155 160
Gly Glu Ala Glu Arg Lys Asp Ala Phe Leu Ile Glu Glu Ile Leu Ala
165 170 175
Met Gln Leu Lys Gln Ile Lys Ala Asn Ala Asp Thr Leu Ala Gly Lys
180 185 190
Gly Ser Asp Ile Thr Asp Ala Val Ile Thr Tyr Pro Ser Phe Tyr Thr
195 200 205
Ala Ala Glu Lys Arg Ser Leu Glu Leu Ala Ala Glu Leu Ala Gly Leu
210 215 220
Asn Val Asp Ala Phe Ile Ser Asp Asn Leu Ala Val Gly Leu Asn Tyr
225 230 235 240
Ala Thr Ser Arg Thr Phe Pro Ser Val Ser Asp Gly Gln Arg Pro Glu
245 250 255
Tyr His Ile Val Tyr Asp Met Gly Ala Gly Ser Thr Thr Ala Ser Val
260 265 270
Leu Arg Phe Gln Ser Arg Ser Val Lys Asp Val Gly Arg Phe Asn Lys
275 280 285
Thr Val Gln Glu Val Gln Val Leu Gly Thr Gly Trp Asp Lys Thr Leu
290 295 300
Gly Gly Asp Ala Leu Asn Asp Leu Ile Val Gln Asp Met Ile Ala Ser
305 310 315 320
Leu Val Glu Glu Lys Lys Leu Lys Asp Arg Val Ser Pro Ala Asp Val
325 330 335
Gln Ala His Gly Lys Thr Met Ala Arg Leu Trp Lys Asp Ala Glu Lys
340 345 350
Ala Arg Gln Val Leu Ser Ala Asn Thr Glu Thr Gly Ala Ser Phe Glu
355 360 365
Ser Leu Tyr Glu Glu Asp Leu Asn Phe Lys Tyr Arg Val Thr Arg Ala
370 375 380
Lys Phe Glu Glu Leu Ala Glu Gln His Ile Ala Arg Val Gly Lys Pro
385 390 395 400
Leu Glu Gln Ala Leu Glu Ala Ala Gly Leu Gln Leu Ser Asp Ile Asp
405 410 415
Ser Val Ile Leu His Gly Gly Ala Ile Arg Thr Pro Phe Val Gln Lys
420 425 430
Glu Leu Glu Arg Val Cys Gly Ser Ala Asn Lys Ile Arg Thr Ser Val
435 440 445
Asn Ala Asp Glu Ala Ala Val Phe Gly Ala Ala Phe Lys Gly Ala Ala
450 455 460
Leu Ser Pro Ser Phe Arg Val Lys Asp Ile Arg Ala Ser Asp Ala Ser
465 470 475 480
Ser Tyr Ala Val Val Leu Lys Trp Asp Ser Glu Ser Lys Glu Arg Lys
485 490 495
Gln Lys Leu Phe Thr Pro Thr Ser Gln Val Gly Pro Glu Lys Gln Val
500 505 510
Thr Val Lys Asn Leu Asp Asp Phe Glu Phe Ser Phe Tyr His Gln Ile
515 520 525
Pro Val Asp Gly Asn Val Val Glu Ser Pro Ile Leu Gly Val Lys Thr
530 535 540
Gln Asn Leu Thr Ala Ser Val Ala Lys Leu Lys Glu Asp Phe Gly Cys
545 550 555 560
Thr Ala Ala Asn Ile Thr Thr Lys Phe Ala Ile Arg Leu Ser Pro Val
565 570 575
Asp Gly Leu Pro Glu Val Ala Ser Gly Thr Val Ser Cys Glu Val Glu
580 585 590
Ser Ala Lys Lys Gly Ser Val Val Glu Gly Val Lys Gly Phe Phe Gly
595 600 605
Leu Gly Asn Lys Asp Glu Gln Val Pro Leu Gly Glu Glu Gly Glu Pro
610 615 620
Ser Glu Ser Ile Thr Leu Glu Pro Glu Glu Pro Gln Ala Ala Thr Thr
625 630 635 640
Ser Ser Ala Asp Asp Ala Thr Ser Thr Thr Ser Ala Lys Glu Ser Lys
645 650 655
Lys Ser Thr Pro Ala Thr Lys Leu Glu Ser Ile Ser Ile Ser Phe Thr
660 665 670
Ser Ser Pro Leu Gly Ile Pro Ala Pro Thr Glu Ala Glu Leu Ala Arg
675 680 685
Ile Lys Ser Arg Leu Ala Ala Phe Asp Ala Ser Asp Arg Glu Arg Ala
690 695 700
Leu Arg Glu Glu Ala Leu Asn Glu Leu Glu Ser Phe Ile Tyr Arg Ser
705 710 715 720
Arg Asp Leu Val Asp Asp Glu Glu Phe Ala Lys Val Val Lys Pro Glu
725 730 735
Gln Leu Thr Thr Leu Gln Glu Arg Ala Ser Glu Ala Ser Asp Trp Leu
740 745 750
Tyr Gly Asp Gly Asp Asp Ala Lys Thr Ala Asp Phe Arg Ala Lys Leu
755 760 765
Lys Ser Leu Arg Glu Ile Val Asp Pro Ala Leu Lys Arg Lys Lys Glu
770 775 780
Asn Ala Glu Arg Pro Ala Arg Val Glu Leu Leu Gln Gln Val Leu Lys
785 790 795 800
Asn Ala Lys Ser Val Ile Asp Val Met Glu Gln Gln Ile Gln Gln Asp
805 810 815
Glu Asp Leu Tyr Ser Ser Val Thr Ala Ser Ser Ser Ser Ser Ser Thr
820 825 830
Ala Thr Glu Ser Ser Thr Ser Ser Ser Thr Thr Thr Gly Ser Ser Ser
835 840 845
Ser Val Asp Leu Asp Glu Asp Pro Tyr Ala Thr Thr Ser Thr Ser Ser
850 855 860
Thr Thr Lys Thr Ala Ser Ala Thr Thr Thr Pro Lys Pro Ser Gly Pro
865 870 875 880
Lys Tyr Ser Ile Phe Gln Pro Tyr Asp Leu Thr Ser Leu Ser Lys Thr
885 890 895
Tyr Glu Ser Thr Asn Thr Trp Phe Glu Thr Gln Leu Ala Leu Gln Glu
900 905 910
Gln Leu Thr Met Thr Asp Asp Pro Ala Leu Pro Val Ala Glu Leu Asp
915 920 925
Thr Arg Leu Lys Glu Leu Glu Arg Val Leu Asn Arg Ile Tyr Asp Lys
930 935 940
Met Gly Ala Ala Ala Ala Lys Ser Gly Lys Glu Gln Ser Lys Lys Asn
945 950 955 960
Asn Asn Asn Asn Gly Lys Ser Ser Lys Lys Glu Lys Ala Lys Ala Gln
965 970 975
Glu Glu Gln Lys Lys Pro Ala Lys Glu Glu Glu Gln Lys Asp Asp Lys
980 985 990
Lys Ala Asn Arg Lys Asp Glu Leu
995 1000
<210> 46
<211> 798
<212> PRT
<213> Ogataea polymorpha
<400> 46
Met Lys Val Leu Gly Leu Val Ala Leu Ile Phe Ile Ile Val Gln Gly
1 5 10 15
Trp Ala Ser Leu Leu Ala Ile Asp Phe Gly Gln Asp Tyr Ser Lys Ala
20 25 30
Ala Leu Val Ala Pro Gly Val Ala Phe Asp Leu Val Leu Thr Asp Glu
35 40 45
Ala Lys Arg Lys His Gln Ser Gly Val Ala Ile Ser Ala Lys Asp Gly
50 55 60
Glu Ile Glu Arg Lys Phe Asn Ser His Ala Leu Ser Ala Cys Thr Arg
65 70 75 80
Ser Pro Gln Ser Cys Phe Phe Glu Leu Lys Ser Leu Ile Gly Arg Gln
85 90 95
Ile Asp Glu Pro Gln Val Thr Arg Phe Glu Lys Lys Tyr Arg Gly Val
100 105 110
Lys Ile Val Pro Ala Ser Ser Gln Arg Arg Thr Val Ala Phe Asp Val
115 120 125
Asp Gly Gln Val Tyr Leu Leu Glu Glu Val Leu Gly Met Val Leu Glu
130 135 140
Glu Ile Lys Lys Arg Ala Glu Leu His Trp Asp Gln Thr Leu Gly Gly
145 150 155 160
Gly Ser Ser Asn Thr Ile Ser Asp Val Val Leu Ser Val Pro Asp Phe
165 170 175
Leu Asp Gln Ala Gln Arg Thr Ala Leu Val Asp Ala Ala Glu Ile Ala
180 185 190
Gly Leu Asn Val Val Ala Leu Ile Asp Asp Gly Ile Ala Val Ala Leu
195 200 205
Asn Tyr Ala Ser Thr Arg Asp Phe Glu Gln Lys Gln Tyr His Val Ile
210 215 220
Tyr Asp Val Gly Ala Gly Ser Thr Lys Ala Thr Leu Val Ser Phe Ser
225 230 235 240
Lys Asp Asn Glu Thr Leu Arg Val Glu Asn Glu Gly Tyr Gly Tyr Asp
245 250 255
Glu Thr Phe Gly Gly Asn Leu Phe Thr Glu Ser Leu Gln Ala Ile Ile
260 265 270
Glu Asp Lys Phe Leu Ala Gln Thr Lys Ile Lys Pro Glu Thr Leu Trp
275 280 285
Ser Asp Ala Arg Ala Met Asn Arg Leu Trp Gln Ser Ala Glu Lys Ala
290 295 300
Lys Leu Val Leu Ser Ala Asn Ser Glu Thr Lys Val Ser Val Glu Ser
305 310 315 320
Leu Ile Asn Asp Ile Asp Leu Lys Val Val Val Ser Arg Asp Glu Phe
325 330 335
Glu Glu Tyr Met Thr Glu His Met Asp Arg Ile Val Ala Pro Leu Ala
340 345 350
Ala Ala Met Gly Asp Arg Lys Val Glu Ser Val Ile Leu Ala Gly Gly
355 360 365
Ser Thr Arg Val Pro Phe Val Gln Lys His Leu Val Lys Tyr Leu Gly
370 375 380
Gly Asp Glu Leu Leu Ser Lys Asn Val Asn Ala Asp Glu Ala Ala Val
385 390 395 400
Phe Gly Thr Leu Leu Gly Gly Ile Ser Val Ser Gly Lys Phe Arg Thr
405 410 415
Arg Pro Ile Glu Leu Val Gln His Ala Ser Arg Asn Phe Glu Leu Ala
420 425 430
Ala Gly Gly His Met Thr Val Val Phe Asn Glu Thr Thr Ala Ser Arg
435 440 445
Glu Ala Val Val Ala Leu Pro Gly Leu Lys Asp Thr Phe Gly Glu Val
450 455 460
Gln Val Asp Leu Phe Glu Ala Gly Gln Leu Phe Ala Gln Tyr Lys Phe
465 470 475 480
Lys Asn Glu Leu Asn Ser Thr Val Cys Pro Asn Gly Val Glu Tyr Leu
485 490 495
Ala Asn Cys Thr Leu Asp Pro Arg Lys Leu Phe Leu Leu His Ser Leu
500 505 510
Glu Ala Val Cys Ala Gly Asp Gly Ala Val Arg Ser Ser Leu Thr Ala
515 520 525
Lys Pro Leu His Pro Gly Tyr Lys Pro Leu Gly Ser Leu Ala Lys Tyr
530 535 540
Gln Ser Ala Ser Lys Leu Arg Ser Leu Thr Asn Gln Asp Lys Gln Arg
545 550 555 560
Gln Gln Arg Asp Ala Leu Ile Asn Ser Leu Glu Ala Ser Leu Tyr Asp
565 570 575
Leu Arg Ser Tyr Thr Glu Asp Glu Asn Val Val Ala Asn Gly Pro Ser
580 585 590
Ser Met Val Arg Ala Ala Arg Glu Met Val Ser Glu Leu Leu Glu Trp
595 600 605
Leu Glu Asp Val Pro Ala Lys Ala Thr Val Lys Asp Ile Gln Glu Lys
610 615 620
Tyr Asp Asp Val Arg Val Met Arg Ile Lys Leu Glu Thr Leu Val Asn
625 630 635 640
His Gly Asp Arg Leu Leu Ser Leu Ala Glu Phe Thr Arg Leu Lys Glu
645 650 655
Lys Ala Leu Glu Thr Met Tyr Lys Leu Gln Asp Phe Met Val Val Met
660 665 670
Ser Gln Asp Ala Leu Ser Leu Lys Ala Asn Phe Thr Glu Leu Gly Leu
675 680 685
Asp Phe Glu Glu Ala Asn Arg Arg Val Lys Val Lys Val Pro Glu Val
690 695 700
Asp Glu Gln Glu Leu Glu Gln Arg Met Lys Arg Ile Ser Asp Phe Val
705 710 715 720
Gly Val Val Asp His Phe Glu Thr His Lys Asp Glu Ile Glu Thr Lys
725 730 735
Asp Arg Glu Thr Leu Phe Glu Leu Arg Glu Thr Val Leu Glu Glu Leu
740 745 750
Lys Gln Val Gln Ser Thr Tyr Arg Ala Leu Lys Gln Ala His Glu Lys
755 760 765
Arg Val Arg Gly Leu Lys Glu Gln Leu Lys Lys Ala Asp Lys Lys Ala
770 775 780
Asp Lys Thr Gln Glu Ala Glu Pro Ser Gly His Asp Glu Leu
785 790 795
<210> 47
<211> 372
<212> PRT
<213> Komagataella phaffii
<400> 47
Met Lys Val Thr Leu Ser Val Leu Ala Ile Ala Ser Gln Leu Val Arg
1 5 10 15
Ile Val Cys Ser Glu Gly Glu Asn Ile Cys Ile Gly Asp Gln Cys Tyr
20 25 30
Pro Lys Asn Phe Glu Pro Asp Lys Glu Trp Lys Pro Val Gln Glu Gly
35 40 45
Gln Ile Ile Pro Pro Gly Ser His Val Arg Met Asp Phe Asn Thr His
50 55 60
Gln Arg Glu Ala Lys Leu Val Glu Glu Asn Glu Asp Ile Asp Pro Ser
65 70 75 80
Ser Leu Gly Val Ala Val Val Asp Ser Thr Gly Ser Phe Ala Asp Asp
85 90 95
Gln Ser Leu Glu Lys Ile Glu Gly Leu Ser Met Glu Gln Leu Asp Glu
100 105 110
Lys Leu Glu Glu Leu Ile Glu Leu Ser His Asp Tyr Glu Tyr Gly Ser
115 120 125
Asp Ile Ile Leu Ser Asp Gln Tyr Ile Phe Gly Val Ala Gly Leu Val
130 135 140
Pro Thr Lys Thr Lys Phe Thr Ser Glu Leu Lys Glu Lys Ala Leu Arg
145 150 155 160
Ile Val Gly Ser Cys Leu Arg Asn Asn Ala Asp Ala Val Glu Lys Leu
165 170 175
Leu Gly Thr Val Pro Asn Thr Ile Thr Ile Gln Phe Met Ser Asn Leu
180 185 190
Val Gly Lys Val Asn Ser Thr Gly Glu Asn Val Asp Ser Val Glu Gln
195 200 205
Lys Arg Ile Leu Ser Ile Ile Gly Ala Val Ile Pro Phe Lys Ile Gly
210 215 220
Lys Val Leu Phe Glu Ala Cys Ser Gly Thr Gln Lys Leu Leu Leu Ser
225 230 235 240
Leu Asp Lys Leu Glu Ser Ser Val Gln Leu Arg Gly Tyr Gln Met Leu
245 250 255
Asp Asp Phe Ile His His Pro Glu Glu Glu Leu Leu Ser Ser Leu Thr
260 265 270
Ala Lys Glu Arg Leu Val Lys His Ile Glu Leu Ile Gln Ser Phe Phe
275 280 285
Ala Ser Gly Lys His Ser Leu Asp Ile Ala Ile Asn Arg Glu Leu Phe
290 295 300
Thr Arg Leu Ile Ala Leu Arg Thr Asn Leu Glu Ser Ala Asn Pro Asn
305 310 315 320
Leu Cys Lys Pro Ser Thr Asp Phe Leu Asn Trp Leu Ile Asp Glu Ile
325 330 335
Glu Ala Thr Lys Asp Thr Asp Pro His Phe Ser Lys Glu Leu Lys His
340 345 350
Leu Arg Phe Glu Leu Phe Gly Asn Pro Leu Ala Ser Arg Lys Gly Phe
355 360 365
Ser Asp Glu Leu
370
<210> 48
<211> 379
<212> PRT
<213> Komagataella pastoris
<400> 48
Met Pro Lys Thr Leu Ser Ser Met Lys Val Ser Leu Ser Val Leu Ala
1 5 10 15
Ile Ala Thr Gln Leu Val Arg Ile Val Cys Ser Glu Glu Glu Asn Ile
20 25 30
Cys Ile Gly Asp Gln Cys Tyr Pro Lys Asn Phe Glu Pro Asp Lys Glu
35 40 45
Trp Lys Pro Val Gln Glu Gly Gln Ile Ile Pro Pro Gly Ser His Val
50 55 60
Arg Met Asp Phe Asn Thr His Gln Arg Glu Ala Lys Leu Val Asp Glu
65 70 75 80
Asn Asp Asp Ile Asp Ser Ser Leu Met Gly Val Ala Val Val Asp Ala
85 90 95
Thr Asp Thr Phe Ala Asp Asp His Ser Leu Glu Lys Ile Ile Gly Leu
100 105 110
Ser Val Ser Gln Leu Asp Glu Lys Leu Glu Glu Leu Val Glu Leu Ser
115 120 125
His Asp Tyr Glu Tyr Gly Ser Asp Ile Ile Leu Asn Asp Gln Tyr Ile
130 135 140
Ile Gly Val Ala Gly Leu Val Pro Thr Lys Thr Gln Phe Ala Ser Glu
145 150 155 160
Leu Lys Glu Lys Ala Leu Arg Ile Val Gly Ser Cys Leu Arg Asn Asn
165 170 175
Ala Asp Ala Val Glu Lys Leu Leu Gly Thr Val Pro Asn Thr Ile Thr
180 185 190
Ile Glu Phe Ile Ser Asn Leu Val Gly Lys Val Asn Thr Thr Glu Glu
195 200 205
Asn Val Asp Pro Val Glu Gln Lys Arg Ile Leu Ser Ile Ile Gly Ala
210 215 220
Ile Ile Pro Phe Asn Ile Gly Lys Val Leu Phe Glu Ala Cys Phe Gly
225 230 235 240
Thr Gln Lys Leu Leu Leu Ser Leu Asp Lys Leu Asp Asp Ser Val Gln
245 250 255
Leu Lys Ala Tyr Gln Val Leu Asp Asp Phe Ile His His Pro Gln Glu
260 265 270
Glu Leu Leu Ser Ser Leu Thr Glu Lys Glu Arg Leu Val Lys His Ile
275 280 285
Glu Leu Ile Gln Ser Phe Phe Ala Ser Gly Lys His Ser Leu His Glu
290 295 300
Ala Ile Asn Arg Glu Leu Phe Ser Arg Leu Val Ala Leu Arg Ser Asp
305 310 315 320
Leu Glu Ser Thr Ser Thr Asn Leu Cys Thr Pro Ser Thr Asp Phe Leu
325 330 335
Asn Trp Leu Ile Asp Glu Ile Glu Ala Thr Lys Glu Val Asn Pro His
340 345 350
Phe Ser Gln Glu Leu Lys His Leu Arg Phe Glu Phe Phe Gly Asn Pro
355 360 365
Leu Ala Ser Arg Lys Gly Phe Ser Asp Glu Leu
370 375
<210> 49
<211> 426
<212> PRT
<213> 解脂耶氏酵母
<400> 49
Met Lys Phe Ser Lys Thr Leu Leu Leu Ala Leu Val Ala Gly Ala Leu
1 5 10 15
Ala Lys Gly Glu Asp Glu Ile Cys Arg Val Glu Lys Asn Ser Gly Lys
20 25 30
Glu Ile Cys Tyr Pro Lys Val Phe Val Pro Thr Glu Glu Trp Gln Val
35 40 45
Val Trp Pro Asp Gln Val Ile Pro Ala Gly Leu His Val Arg Met Asp
50 55 60
Tyr Glu Asn Gly Val Lys Glu Ala Lys Ile Asn Asp Pro Asn Glu Glu
65 70 75 80
Val Glu Gly Val Ala Val Ala Val Gly Glu Glu Val Pro Glu Gly Glu
85 90 95
Val Val Ile Glu Asp Leu Thr Glu Glu Asn Gly Asp Glu Gly Ile Ser
100 105 110
Ala Asn Glu Lys Val Gln Arg Ala Ile Glu Lys Ala Ile Lys Glu Lys
115 120 125
Arg Ile Lys Glu Gly His Lys Pro Asn Pro Asn Ile Pro Glu Ser Asp
130 135 140
His Gln Thr Phe Ser Asp Ala Val Ala Ala Leu Arg Asp Tyr Lys Val
145 150 155 160
Asn Gly Gln Ala Ala Met Leu Pro Ile Ala Leu Ser Gln Leu Glu Glu
165 170 175
Leu Ser His Glu Ile Asp Phe Gly Ile Ala Leu Ser Asp Val Asp Pro
180 185 190
Leu Asn Ala Leu Leu Gln Ile Leu Glu Asp Ala Lys Val Asp Val Glu
195 200 205
Ser Lys Ile Met Ala Ala Arg Thr Ile Gly Ala Ser Leu Arg Asn Asn
210 215 220
Pro His Ala Leu Asp Lys Val Ile Asn Ser Lys Val Asp Leu Val Lys
225 230 235 240
Ser Leu Leu Asp Asp Leu Ala Gln Ser Ser Lys Glu Lys Ala Asp Lys
245 250 255
Leu Ser Ser Ser Leu Val Tyr Ala Leu Ser Ala Val Leu Lys Thr Pro
260 265 270
Glu Thr Val Thr Arg Phe Val Asp Leu His Gly Gly Asp Thr Leu Arg
275 280 285
Gln Leu Tyr Glu Thr Gly Ser Asp Asp Val Lys Gly Arg Val Ser Thr
290 295 300
Leu Ile Glu Asp Val Leu Ala Thr Pro Asp Leu His Asn Asp Phe Ser
305 310 315 320
Ser Ile Thr Gly Ala Val Lys Lys Arg Ser Ala Asn Trp Trp Glu Asp
325 330 335
Glu Leu Lys Glu Trp Ser Gly Val Phe Gln Arg Ser Leu Pro Ser Lys
340 345 350
Leu Ser Ser Lys Val Lys Ser Lys Val Tyr Thr Ser Leu Ala Ala Ile
355 360 365
Arg Arg Asn Phe Arg Glu Ser Val Asp Val Ser Glu Glu Phe Leu Glu
370 375 380
Trp Leu Asp His Pro Lys Lys Ala Ala Ala Glu Ile Gly Asp Asp Leu
385 390 395 400
Val Lys Leu Ile Lys Gln Asp Arg Gly Glu Leu Trp Gly Asn Ala Lys
405 410 415
Ala Arg Lys Tyr Asp Ala Arg Asp Glu Leu
420 425
<210> 50
<211> 406
<212> PRT
<213> 里氏木霉
<400> 50
Met Arg Pro Leu Ala Leu Ile Phe Ala Leu Ile Leu Gly Leu Leu Leu
1 5 10 15
Cys Leu Ala Ala Pro Ala Thr Ala Ser Ser Ser Ser Ser Gln His Ser
20 25 30
Pro Gln Ala Ala Ser Asp Glu Ser Asp Leu Ile Cys His Thr Ser Asn
35 40 45
Pro Asp Glu Cys Tyr Pro Arg Val Phe Val Pro Thr His Glu Phe Gln
50 55 60
Pro Val His Asp Asp Gln Gln Leu Pro Asn Gly Leu His Val Arg Leu
65 70 75 80
Asn Ile Trp Thr Gly Gln Lys Glu Ala Lys Ile Asn Val Pro Asp Glu
85 90 95
Ala Asn Pro Asp Leu Asp Gly Leu Pro Val Asp Gln Ala Val Val Leu
100 105 110
Val Asp Gln Glu Gln Pro Glu Ile Ile Gln Ile Pro Lys Gly Ala Pro
115 120 125
Lys Tyr Asp Asn Val Gly Lys Ile Lys Glu Pro Ala Gln Glu Gly Asp
130 135 140
Ala Gln Thr Glu Ala Ile Ala Phe Ala Glu Thr Phe Asn Met Leu Lys
145 150 155 160
Thr Gly Lys Ser Pro Ser Ala Glu Glu Phe Asp Asn Gly Leu Glu Gly
165 170 175
Leu Glu Glu Leu Ser His Asp Ile Tyr Tyr Gly Leu Lys Ile Thr Glu
180 185 190
Asp Ala Asp Val Val Lys Ala Leu Phe Cys Leu Met Gly Ala Arg Asp
195 200 205
Gly Asp Ala Ser Glu Gly Ala Thr Pro Arg Asp Gln Gln Ala Ala Ala
210 215 220
Ile Leu Ala Gly Ala Leu Ser Asn Asn Pro Ser Ala Leu Ala Glu Ile
225 230 235 240
Ala Lys Ile Trp Pro Glu Leu Leu Asp Ser Ser Cys Pro Arg Asp Gly
245 250 255
Ala Thr Ile Ser Asp Arg Phe Tyr Gln Asp Thr Val Ser Val Ala Asp
260 265 270
Ser Pro Ala Lys Val Lys Ala Ala Val Ser Ala Ile Asn Gly Leu Ile
275 280 285
Lys Asp Gly Ala Ile Arg Lys Gln Phe Leu Glu Asn Ser Gly Met Lys
290 295 300
Gln Leu Leu Ser Val Leu Cys Gln Glu Lys Pro Glu Trp Ala Gly Ala
305 310 315 320
Gln Arg Lys Val Ala Gln Leu Val Leu Asp Thr Phe Leu Asp Glu Asp
325 330 335
Met Gly Ala Gln Leu Gly Gln Trp Pro Arg Gly Lys Ala Ser Asn Asn
340 345 350
Gly Val Cys Ala Ala Pro Glu Thr Ala Leu Asp Asp Gly Cys Trp Asp
355 360 365
Tyr His Ala Asp Arg Met Val Lys Leu His Gly Thr Pro Trp Ser Lys
370 375 380
Glu Leu Lys Gln Arg Leu Gly Asp Ala Arg Lys Ala Asn Ser Lys Leu
385 390 395 400
Pro Asp His Gly Glu Leu
405
<210> 51
<211> 421
<212> PRT
<213> 酿酒酵母
<400> 51
Met Val Arg Ile Leu Pro Ile Ile Leu Ser Ala Leu Ser Ser Lys Leu
1 5 10 15
Val Ala Ser Thr Ile Leu His Ser Ser Ile His Ser Val Pro Ser Gly
20 25 30
Gly Glu Ile Ile Ser Ala Glu Asp Leu Lys Glu Leu Glu Ile Ser Gly
35 40 45
Asn Ser Ile Cys Val Asp Asn Arg Cys Tyr Pro Lys Ile Phe Glu Pro
50 55 60
Arg His Asp Trp Gln Pro Ile Leu Pro Gly Gln Glu Leu Pro Gly Gly
65 70 75 80
Leu Asp Ile Arg Ile Asn Met Asp Thr Gly Leu Lys Glu Ala Lys Leu
85 90 95
Asn Asp Glu Lys Asn Val Gly Asp Asn Gly Ser His Glu Leu Ile Val
100 105 110
Ser Ser Glu Asp Met Lys Ala Ser Pro Gly Asp Tyr Glu Phe Ser Ser
115 120 125
Asp Phe Lys Glu Met Arg Asn Ile Ile Asp Ser Asn Pro Thr Leu Ser
130 135 140
Ser Gln Asp Ile Ala Arg Leu Glu Asp Ser Phe Asp Arg Ile Met Glu
145 150 155 160
Phe Ala His Asp Tyr Lys His Gly Tyr Lys Ile Ile Thr His Glu Phe
165 170 175
Ala Leu Leu Ala Asn Leu Ser Leu Asn Glu Asn Leu Pro Leu Thr Leu
180 185 190
Arg Glu Leu Ser Thr Arg Val Ile Thr Ser Cys Leu Arg Asn Asn Pro
195 200 205
Pro Val Val Glu Phe Ile Asn Glu Ser Phe Pro Asn Phe Lys Ser Lys
210 215 220
Ile Met Ala Ala Leu Ser Asn Leu Asn Asp Ser Asn His Arg Ser Ser
225 230 235 240
Asn Ile Leu Ile Lys Arg Tyr Leu Ser Ile Leu Asn Glu Leu Pro Val
245 250 255
Thr Ser Glu Asp Leu Pro Ile Tyr Ser Thr Val Val Leu Gln Asn Val
260 265 270
Tyr Glu Arg Asn Asn Lys Asp Lys Gln Leu Gln Ile Lys Val Leu Glu
275 280 285
Leu Ile Ser Lys Ile Leu Lys Ala Asp Met Tyr Glu Asn Asp Asp Thr
290 295 300
Asn Leu Ile Leu Phe Lys Arg Asn Ala Glu Asn Trp Ser Ser Asn Leu
305 310 315 320
Gln Glu Trp Ala Asn Glu Phe Gln Glu Met Val Gln Asn Lys Ser Ile
325 330 335
Asp Glu Leu His Thr Arg Thr Phe Phe Asp Thr Leu Tyr Asn Leu Lys
340 345 350
Lys Ile Phe Lys Ser Asp Ile Thr Ile Asn Lys Gly Phe Leu Asn Trp
355 360 365
Leu Ala Gln Gln Cys Lys Ala Arg Gln Ser Asn Leu Asp Asn Gly Leu
370 375 380
Gln Glu Arg Asp Thr Glu Gln Asp Ser Phe Asp Lys Lys Leu Ile Asp
385 390 395 400
Ser Arg His Leu Ile Phe Gly Asn Pro Met Ala His Arg Ile Lys Asn
405 410 415
Phe Arg Asp Glu Leu
420
<210> 52
<211> 490
<212> PRT
<213> 乳酸克鲁维酵母
<400> 52
Met Arg Val Lys Cys Val Asn Arg Ala Ile Tyr Val Leu Thr Val Leu
1 5 10 15
Leu Phe Ser Arg Leu Val Val Ser Gln Val Val Leu Thr Pro Ser Asn
20 25 30
Ser Asn Ala Asp Pro Lys Gln Lys Asp Thr Ala Asn Thr Val Ala Ala
35 40 45
Val Glu Ala Asn Asn Asp Ala Asn Ile Ala Lys Lys Asp Ala Glu Ser
50 55 60
Asp Leu Val Ile Gly Asp His Leu Val Cys Asn Thr Lys Glu Cys Tyr
65 70 75 80
Pro Ile Gly Phe Val Pro Ser Thr Glu Trp Lys Glu Ile Arg Pro Gly
85 90 95
Gln Arg Leu Pro Pro Gly Leu Asp Ile Arg Val Ser Leu Glu Lys Gly
100 105 110
Val Arg Glu Ala Lys Leu Pro Glu Pro Gly Ser Glu Asn Ile Gly Asn
115 120 125
Glu Glu Glu Asp Val Lys Gly Leu Val Leu Gly Ala Glu Gly Ser Thr
130 135 140
Leu Ser Glu Ser Glu Leu Lys Glu Thr Ser Glu Asp Leu Glu Asn Glu
145 150 155 160
Gln Ser Gly Phe Lys Leu Asn Asn Ala Glu Lys Glu Ser Asp Ile Leu
165 170 175
Gln Gln Glu Thr Asp Leu Lys Ile Ala Val Ser Asp Asn Ala Glu Ala
180 185 190
Thr Ser Asn Glu Pro Ala Gly His Glu Phe Ser Glu Asp Phe Ala Lys
195 200 205
Ile Lys Ser Leu Met Gln Ser Pro Asp Glu Lys Thr Trp Glu Glu Val
210 215 220
Glu Thr Leu Leu Asp Asp Leu Val Glu Phe Ala His Asp Tyr Lys Lys
225 230 235 240
Gly Phe Lys Ile Leu Ser Asn Glu Phe Glu Leu Leu Glu Tyr Leu Ser
245 250 255
Phe Asn Asp Thr Leu Ser Ile Gln Ile Arg Glu Leu Ala Ala Arg Ile
260 265 270
Ile Val Ser Ser Leu Arg Asn Asn Pro Pro Ser Ile Asp Phe Val Asn
275 280 285
Glu Lys Tyr Pro Gln Thr Thr Phe Lys Leu Cys Glu His Leu Ser Glu
290 295 300
Leu Gln Ala Ser Gln Gly Ser Lys Leu Leu Ile Lys Arg Phe Leu Ser
305 310 315 320
Ile Leu Asp Val Leu Leu Ser Arg Thr Glu Tyr Val Ser Ile Lys Asp
325 330 335
Asp Val Leu Trp Arg Leu Tyr Gln Ile Glu Asp Pro Ser Ser Lys Ile
340 345 350
Lys Ile Leu Glu Ile Ile Ala Lys Phe Tyr Asn Glu Lys Asn Glu Gln
355 360 365
Val Ile Asp Thr Val Gln Gln Asp Met Lys Thr Val Gln Lys Trp Val
370 375 380
Asn Glu Leu Thr Thr Ile Ile Gln Thr Pro Glu Leu Asp Glu Leu His
385 390 395 400
Leu Arg Ser Phe Phe His Cys Ile Ser Phe Ile Lys Thr Arg Phe Lys
405 410 415
Asn Arg Val Lys Ile Asp Ser Asp Phe Leu Asn Trp Leu Ile Asp Glu
420 425 430
Ile Glu Val Arg Asn Glu Lys Ser Lys Asp Asp Ile Tyr Lys Arg Asp
435 440 445
Val Asp Gln Leu Glu Phe Asp Asn Gln Leu Ala Lys Ser Arg His Ala
450 455 460
Val Phe Gly Asn Pro Asn Ala Ala Arg Leu Lys Glu Arg Leu Phe Asp
465 470 475 480
Asp Asp Asp Thr Leu Ile Ala Asp Glu Leu
485 490
<210> 53
<211> 505
<212> PRT
<213> 博伊丁假丝酵母
<400> 53
Met Lys Phe Glu Phe Ser Leu Leu Val Leu Ile Phe Ser Lys Leu Leu
1 5 10 15
Val Ala Ala Asn Thr Ala Gly Gly Asp Met Val Cys Pro Asp Asp Asn
20 25 30
Pro Asp Asn Cys Tyr Pro Lys Ile Phe Val Pro Thr Asn Glu Trp Gln
35 40 45
Glu Ile Lys Pro Glu Gln His Ile Pro Ala Gly Leu His Val Arg Met
50 55 60
Asn Ile Glu Asn Met Gly Arg Glu Ala Lys Leu Pro Glu Lys Ser Ser
65 70 75 80
Asn Ser Gln Ile Asn Lys Asp Ile Gln Ala Val Ala Val Asp Leu Gly
85 90 95
Gly Asp Ala Ala Asp Asn Gly Gly Asp Val Asn Asn Ala Val Val Ala
100 105 110
Val Gly Glu Val His Asp Ala Glu Glu Asn Ile Lys Val Glu Asn Gly
115 120 125
Asn Gly Gln Gly Asn Lys Lys Ser Asn Gly Ser Arg Gly Lys Pro Ala
130 135 140
Pro Gly Glu Leu Leu Asn Ala Leu Lys Gly Val Glu Glu Phe Leu Asn
145 150 155 160
Asn Asp Arg Thr Asp Asn Val Glu Gly Leu Met Gly Tyr Leu Glu Ile
165 170 175
Leu Asp Asp Leu Ser His Asp Ile Asp Tyr Gly Val Asp Ile Ser Lys
180 185 190
Asn Pro Met Ser Leu Ile Gln Leu Thr Gly Ile Tyr Thr Phe Glu Gln
195 200 205
Pro Asp Ile Tyr Glu Thr Lys Leu Lys Gly Lys Thr Thr Asp Ser Leu
210 215 220
Lys Ile Gln Asp Met Ser Met Arg Val Leu Ser Ser Thr Ile Arg Asn
225 230 235 240
Asn Asp Glu Ala Leu Asp Asn Ile Val Glu Leu Phe Asn Gly Ser Lys
245 250 255
Asp Lys Leu Tyr Lys Val Ile Met Glu Lys Leu Glu Lys Leu Asn Asn
260 265 270
Asn Ser Phe Glu Asn Ile Ile Gln Arg Arg Arg Leu Gly Leu Leu Asn
275 280 285
Ser Ile Leu Gly His Glu Glu Ile Ala Ser Ser Phe Cys Cys Leu Ser
290 295 300
Asn Asp Leu Thr Leu Leu His Leu Tyr Ser Lys Ile Thr Asp Lys Glu
305 310 315 320
Ser Lys Ala Lys Ile Ile Asn Ile Leu His Asp Leu Arg Ile Ala Pro
325 330 335
Asp Tyr Cys His Ser Glu Asn Ile Val Asn Leu Ser Pro Gln Asp Ile
340 345 350
Gln Asp Ser Leu Gln Leu Lys Lys Arg Tyr Gln Asp Asp Asn Leu Asn
355 360 365
Ile Ser Glu Ser Val Ile Val Asp Glu Glu Asp Glu Glu Ala Phe Gly
370 375 380
Asp Ile Thr Asp Val Asp Leu Lys Tyr Ser Ile Val Ala Gln Arg Met
385 390 395 400
Leu Arg Lys Tyr Gly Leu Ile Ser Asn Tyr Lys Ala Arg Glu Ile Leu
405 410 415
Gln Asp Leu Ile Asp Leu Lys Asn Asn Lys Lys Asn Ser Leu Lys Ile
420 425 430
Ser Ser Arg Phe Leu Asn Trp Met Glu Tyr Gln Ile Asp Gln Val Lys
435 440 445
Gln Leu Asn Asn Asn Leu Ser Gly Ser Asn Asn Gln Asp Asp Asp Asn
450 455 460
Gln Gln Arg Phe Thr Ile Glu Ser Arg Asp Gly Glu Arg Asp Tyr Leu
465 470 475 480
Asp Tyr Leu Ile Val Ala Arg His Glu Val Phe Gly Asn Ser His Ala
485 490 495
Gly Arg Lys Ala Ser Ala Asp Glu Leu
500 505
<210> 54
<211> 356
<212> PRT
<213> Ogataea parapolymorpha
<400> 54
Met Leu Cys Leu Leu Leu Phe Gly Gly Val Ser Leu Ala Lys Leu Ile
1 5 10 15
Cys Pro Asp Pro Asn Pro Leu Asn Cys Tyr Pro Glu Leu Phe Glu Pro
20 25 30
Ser Thr Asp Trp Lys Pro Val Lys Glu Gly Gln Ile Ile Pro Gly Gly
35 40 45
Leu Asp Ile Arg Leu Asn Ile Asp Thr Leu Glu Arg Glu Ala Lys Leu
50 55 60
Thr Gly Asn Ser Gln Pro Asn Glu Asn Gly Ala Val Ile Val Pro Glu
65 70 75 80
Asp Ile Met Glu Leu Asp Glu Glu Gln Asn Leu Ser Glu Ala Leu Arg
85 90 95
Tyr Leu Ser Lys Phe Val Asp His Gly Val Gly Asp Ser Ala Thr Leu
100 105 110
Leu Arg Lys Leu Glu Phe Ile Ser Glu Met Ser Ser Asp Ser Asp Tyr
115 120 125
Gly Val Asp Thr Met Gln Tyr Ile Gln Pro Leu Ile Arg Leu Ser Gly
130 135 140
Leu Tyr Gly Glu Glu Gly Leu Lys Gln Ile Asp Asp Glu Asn Arg Asp
145 150 155 160
Glu Ile Arg Glu Leu Ala Thr Ile Ile Leu Ala Ser Ser Leu Arg Asn
165 170 175
Asn Pro Glu Ala Gln Arg Lys Phe Leu Gln Tyr Phe Ser Asp Pro Met
180 185 190
Asp Phe Val Asp His Leu Thr Ala Lys Ile Gln Asn Asp Val Leu Leu
195 200 205
Arg Arg Arg Leu Gly Ile Leu Gly Ser Leu Leu Asn Ser Gly Ser Leu
210 215 220
Ile Asp Gly Phe Glu Ser Ile Lys Lys Lys Leu Leu Ile Leu Tyr Pro
225 230 235 240
Gln Leu Glu Asn Gln Ala Thr Lys Gln Arg Leu Met His Ile Ile Ser
245 250 255
Asp Ile Thr Gly Asp Val Glu Asp Glu Asp Met Asp Arg Gln Phe Ala
260 265 270
Asn Ile Ala Gln Asp Thr Leu Ile Asp Gln Lys Ala Leu Asp Asp Gly
275 280 285
Thr Leu Thr Leu Leu Asp Glu Leu Lys Lys Leu Lys Leu Asn Asn Arg
290 295 300
Asn Leu Phe Lys Ala Lys Ser Glu Phe Leu Glu Trp Leu Asn Val Arg
305 310 315 320
Met Glu Ala Leu Lys Ala Ala Lys Asp Pro Lys Leu Glu Glu Phe Arg
325 330 335
Ser Leu Arg His Glu Ile Phe Gly Asn Pro Lys Ala Met Arg Lys Ser
340 345 350
Tyr Asp Glu Leu
355
<210> 55
<211> 299
<212> PRT
<213> Komagataella phaffii
<400> 55
Met Lys Leu His Leu Val Ile Leu Cys Leu Ile Thr Ala Val Tyr Cys
1 5 10 15
Phe Ser Ala Val Asp Arg Glu Ile Phe Gln Leu Asn His Glu Leu Arg
20 25 30
Gln Glu Tyr Gly Asp Asn Phe Asn Phe Tyr Glu Trp Leu Lys Leu Pro
35 40 45
Lys Gly Pro Ser Ser Thr Phe Glu Asp Ile Asp Asn Ala Tyr Lys Lys
50 55 60
Leu Ser Arg Lys Leu His Pro Asp Lys Ile Arg Gln Lys Lys Leu Ser
65 70 75 80
Gln Glu Gln Phe Glu Gln Leu Lys Lys Lys Ala Thr Glu Arg Tyr Gln
85 90 95
Gln Leu Ser Ala Val Gly Ser Ile Leu Arg Ser Glu Ser Lys Glu Arg
100 105 110
Tyr Asp Tyr Phe Val Lys His Gly Phe Pro Val Tyr Lys Gly Asn Asp
115 120 125
Tyr Thr Tyr Ala Lys Phe Arg Pro Ser Val Leu Leu Thr Ile Phe Ile
130 135 140
Leu Phe Ala Leu Ala Thr Leu Thr His Phe Val Phe Ile Arg Leu Ser
145 150 155 160
Ala Val Gln Ser Arg Lys Arg Leu Ser Ser Leu Ile Glu Glu Asn Lys
165 170 175
Gln Leu Ala Trp Pro Gln Gly Val Gln Asp Val Thr Gln Val Lys Asp
180 185 190
Val Lys Val Tyr Asn Glu His Leu Arg Lys Trp Phe Leu Val Cys Phe
195 200 205
Asp Gly Ser Val His Tyr Val Glu Asn Asp Lys Thr Phe His Val Asp
210 215 220
Pro Glu Glu Val Glu Leu Pro Ser Trp Gln Asp Thr Leu Pro Gly Lys
225 230 235 240
Leu Ile Val Lys Leu Ile Pro Gln Leu Ala Arg Lys Pro Arg Ser Pro
245 250 255
Lys Glu Ile Lys Lys Glu Asn Leu Asp Asp Lys Thr Arg Lys Thr Lys
260 265 270
Lys Pro Thr Gly Asp Ser Lys Thr Leu Pro Asn Gly Lys Thr Ile Tyr
275 280 285
Lys Ala Thr Lys Ser Gly Gly Arg Arg Arg Lys
290 295
<210> 56
<211> 299
<212> PRT
<213> Komagataella pastoris
<400> 56
Met Lys Leu His Leu Val Ile Leu Cys Leu Ile Thr Ala Val Tyr Cys
1 5 10 15
Phe Ser Ala Val Asp Arg Glu Ile Phe Gln Leu Asn His Glu Leu Arg
20 25 30
Gln Glu Phe Gly Asp Asn Phe Asn Phe Tyr Glu Trp Leu Lys Leu Pro
35 40 45
Lys Gly Pro Ser Ser Thr Phe Glu Asp Ile Asp Asn Ala Tyr Lys Lys
50 55 60
Leu Ser Arg Lys Leu His Pro Asp Lys Val Arg Gln Lys Lys Leu Ser
65 70 75 80
Gln Gln Gln Phe Gln Gln Leu Lys Lys Lys Ala Thr Glu Arg Tyr Gln
85 90 95
Gln Leu Ser Ala Val Gly Ser Ile Leu Arg Ser Glu Ser Lys Glu Arg
100 105 110
Tyr Asp Tyr Phe Leu Lys His Gly Phe Pro Val Tyr Lys Gly Asn Asp
115 120 125
Tyr Thr Tyr Ala Lys Phe Arg Pro Ser Val Leu Ile Thr Val Phe Ile
130 135 140
Leu Phe Ala Leu Ala Thr Leu Thr His Phe Val Phe Ile Arg Leu Ser
145 150 155 160
Ala Val Gln Ser Arg Lys Arg Leu Ser Ser Leu Ile Glu Glu Asn Lys
165 170 175
Gln Leu Ala Trp Pro Gln Gly Val Gln Asp Val Thr Lys Val Lys Asp
180 185 190
Val Lys Val Tyr Asn Glu His Leu Arg Lys Trp Phe Leu Val Cys Phe
195 200 205
Asp Gly Ser Val His Tyr Val Glu Asn Asp Lys Thr Tyr His Val Asp
210 215 220
Pro Glu Glu Val Glu Leu Pro Ser Trp Gln Asp Ser Leu Pro Gly Lys
225 230 235 240
Val Ile Val Arg Leu Ile Pro Gln Leu Ala Lys Lys Pro Arg Pro Pro
245 250 255
Lys Glu Thr Lys Lys Glu Asp Leu Asp Glu Lys Ser Lys Lys Thr Lys
260 265 270
Lys Pro Thr Gly Asp Ser Lys Thr Leu Pro Asn Gly Lys Thr Ile Tyr
275 280 285
Lys Ala Thr Lys Ser Gly Gly Arg Arg Arg Lys
290 295
<210> 57
<211> 287
<212> PRT
<213> 解脂耶氏酵母
<400> 57
Met Lys Phe Ser Ile Ile Phe Leu Val Thr Leu Phe Ala Leu Val Phe
1 5 10 15
Ala Gln Gly Gly Asn Gln Trp Ser Lys Glu Asp Arg Glu Ile Phe Asp
20 25 30
Leu Asn Leu Ala Val Gln Lys Asp Leu Asn Pro Asp Asn Ser Lys Pro
35 40 45
Val Ser Phe Tyr Gln Trp Leu Asp Thr Glu Arg Lys Ala Ser Val Asp
50 55 60
Glu Val Thr Lys Ser Tyr Arg Lys Leu Ser Arg Gln Leu His Pro Asp
65 70 75 80
Lys Asn Arg Lys Val Pro Gly Ala Thr Asp Arg Phe Thr Arg Leu Gly
85 90 95
Leu Val Tyr Lys Ile Leu Ile Asn Lys Asp Leu Arg Lys Arg Tyr Asp
100 105 110
Phe Tyr Leu Lys Asn Gly Phe Pro Arg Glu Gly Glu Asn Gly Glu Phe
115 120 125
Val Phe Lys Arg Phe Lys Pro Gly Val Gly Phe Ala Leu Phe Val Leu
130 135 140
Tyr Phe Leu Ile Gly Leu Gly Ser Tyr Val Val Lys Tyr Leu Asn Ala
145 150 155 160
Lys Lys Ile Lys Ser Thr Ile Glu Arg Val Glu Arg Glu Val Arg Lys
165 170 175
Glu Ala Ser Arg Lys Asn Gly Val Arg Leu Pro Ala Thr Thr Asp Val
180 185 190
Ile Val Asp Gly Arg Gln Tyr Cys Tyr Tyr Asn Thr Gly Glu Ile His
195 200 205
Leu Val Asp Thr Asp Asn Asn Ile Glu His Pro Ile Ser Ser Gln Gly
210 215 220
Val Glu Met Pro Gly Ile Lys Asp Ser Leu Trp Val Thr Leu Pro Val
225 230 235 240
Ala Leu Phe Asn Leu Val Lys Pro Lys Ser Ala Ala Glu Lys Ala Glu
245 250 255
Glu Ala Lys Ile Gln Gln Glu Lys Glu Ala Lys Glu Glu Arg Glu Arg
260 265 270
Pro Lys Pro Lys Ala Ala Thr Lys Val Gly Gly Arg Arg Arg Lys
275 280 285
<210> 58
<211> 414
<212> PRT
<213> 里氏木霉
<400> 58
Met Lys Ile Glu Tyr Leu Val Val Gly Val Leu Ser Leu Leu Thr Pro
1 5 10 15
Leu Ala Ala Ala Trp Ser Lys Glu Asp Arg Glu Ile Phe Arg Ile Arg
20 25 30
Asp Glu Ile Ala Ala His Glu Ser Asp Pro Ala Ala Ser Phe Tyr Asp
35 40 45
Ile Leu Gly Val Thr Pro Ser Ala Ser Gln Asp Asp Ile Asn Lys Ala
50 55 60
Tyr Arg Lys Lys Ser Arg Ser Leu His Pro Asp Lys Val Lys Gln Gln
65 70 75 80
Leu Arg Ala Glu Lys Ala Gln Ala Asp Lys Lys Lys Gly Ala Gly Gly
85 90 95
Gly Ser Ala Ala Ser Ser Ser Lys Gly Pro Thr Gln Ala Glu Ile Arg
100 105 110
Lys Ala Val Lys Glu Ala Ser Glu Arg Gln Ala Arg Leu Ser Leu Ile
115 120 125
Ala Asn Ile Leu Arg Gly Pro Ala Arg Asp Arg Tyr Asp His Phe Leu
130 135 140
Ala Asn Gly Phe Pro Leu Trp Lys Gly Thr Asp Tyr Tyr Tyr Asn Arg
145 150 155 160
Tyr Arg Pro Gly Leu Gly Thr Val Leu Val Gly Val Phe Met Met Gly
165 170 175
Gly Gly Ala Ile His Tyr Leu Ala Leu Tyr Met Ser Trp Lys Arg Gln
180 185 190
Arg Glu Phe Val Glu Arg Tyr Val Thr Phe Ala Arg Asn Ala Ala Trp
195 200 205
Gly Asn Asp Ala Gly Ile Pro Gly Val Asp Ala Met Pro Ala Pro Ala
210 215 220
Pro Ala Pro Ala Pro Glu Glu Asp Glu Ala Ala Ala Pro Ala Gln Pro
225 230 235 240
Arg Asn Arg Arg Glu Arg Arg Met Gln Glu Lys Glu Thr Arg Lys Asp
245 250 255
Asp Gly Lys Ser Ser Lys Lys Ala Arg Lys Ala Val Thr Ser Lys Ser
260 265 270
Ser Ser Ser Ala Pro Thr Pro Thr Gly Ala Arg Lys Arg Val Val Ala
275 280 285
Glu Asn Gly Lys Ile Leu Val Val Asp Ser Gln Gly Asp Val Phe Leu
290 295 300
Glu Glu Glu Asp Glu Glu Gly Asn Val Asn Glu Phe Leu Leu Asp Pro
305 310 315 320
Asn Glu Leu Leu Gln Pro Thr Phe Lys Asp Thr Ala Val Val Arg Val
325 330 335
Pro Val Trp Val Phe Arg Ser Thr Val Gly Arg Phe Leu Pro Lys Gly
340 345 350
Ala Ala Gln Ala Glu Ala Glu Glu Thr His Glu Glu Asp Ser Asp Ala
355 360 365
Ala Gln Asn Thr Pro Pro Ser Ser Glu Ser Ala Gly Asp Asp Phe Glu
370 375 380
Ile Leu Asp Lys Ser Thr Asp Ser Leu Ser Lys Val Lys Thr Ser Gly
385 390 395 400
Ala Gln Gln Gly Lys Ala Thr Lys Arg Lys Thr Thr Lys Lys
405 410
<210> 59
<211> 303
<212> PRT
<213> 粟酒裂殖酵母
<400> 59
Met Ser Arg Ile Phe Ile Leu Leu Leu Leu Phe Gly Val Cys Leu Ala
1 5 10 15
Trp Thr Ser Ser Asp Leu Glu Ile Phe Arg Val Val Asp Ser Leu Lys
20 25 30
Ser Ile Leu Lys Asn Lys Ala Thr Phe Tyr Glu Leu Leu Glu Val Pro
35 40 45
Thr Lys Ala Ser Ile Lys Glu Ile Asn Arg Ala Tyr Arg Lys Lys Ser
50 55 60
Ile Leu Tyr His Pro Asp Lys Asn Pro Lys Ser Lys Glu Leu Tyr Thr
65 70 75 80
Leu Leu Gly Leu Ile Val Asn Ile Leu Arg Asn Thr Glu Thr Arg Lys
85 90 95
Arg Tyr Asp Tyr Phe Leu Lys Asn Gly Phe Pro Arg Trp Lys Gly Thr
100 105 110
Gly Tyr Leu Tyr Ser Arg Tyr Arg Pro Gly Leu Gly Ala Val Leu Val
115 120 125
Leu Leu Phe Leu Leu Ile Ser Ile Ala His Phe Val Met Leu Val Ile
130 135 140
Ser Ser Lys Arg Gln Lys Lys Ile Met Gln Asp His Ile Asp Ile Ala
145 150 155 160
Arg Gln His Glu Ser Tyr Ala Thr Ser Ala Arg Gly Ser Lys Arg Ile
165 170 175
Val Gln Val Pro Gly Gly Arg Arg Ile Tyr Thr Val Asp Ser Ile Thr
180 185 190
Gly Gln Val Cys Ile Leu Asp Pro Ser Ser Asn Ile Glu Tyr Leu Val
195 200 205
Ser Pro Asp Ser Val Ala Ser Val Lys Ile Ser Asp Thr Phe Phe Tyr
210 215 220
Arg Leu Pro Arg Phe Ile Val Trp Asn Ala Phe Gly Arg Trp Phe Ala
225 230 235 240
Arg Ala Pro Ala Ser Ser Glu Asp Thr Asp Ser Asp Gly Gln Met Glu
245 250 255
Asp Glu Glu Lys Ser Asp Ser Val His Lys Ser Ser Phe Ser Ser Pro
260 265 270
Ser Lys Lys Glu Ala Ser Ile Lys Ala Gly Lys Arg Arg Met Lys Arg
275 280 285
Arg Ala Asn Arg Ile Pro Leu Ser Lys Asn Thr Asn Arg Glu Asn
290 295 300
<210> 60
<211> 295
<212> PRT
<213> 酿酒酵母
<400> 60
Met Asn Gly Tyr Trp Lys Pro Ala Leu Val Val Leu Gly Leu Val Ser
1 5 10 15
Leu Ser Tyr Ala Phe Thr Thr Ile Glu Thr Glu Ile Phe Gln Leu Gln
20 25 30
Asn Glu Ile Ser Thr Lys Tyr Gly Pro Asp Met Asn Phe Tyr Lys Phe
35 40 45
Leu Lys Leu Pro Lys Leu Gln Asn Ser Ser Thr Lys Glu Ile Thr Lys
50 55 60
Asn Leu Arg Lys Leu Ser Lys Lys Tyr His Pro Asp Lys Asn Pro Lys
65 70 75 80
Tyr Arg Lys Leu Tyr Glu Arg Leu Asn Leu Ala Thr Gln Ile Leu Ser
85 90 95
Asn Ser Ser Asn Arg Lys Ile Tyr Asp Tyr Tyr Leu Gln Asn Gly Phe
100 105 110
Pro Asn Tyr Asp Phe His Lys Gly Gly Phe Tyr Phe Ser Arg Met Lys
115 120 125
Pro Lys Thr Trp Phe Leu Leu Ala Phe Ile Trp Ile Val Val Asn Ile
130 135 140
Gly Gln Tyr Ile Ile Ser Ile Ile Gln Tyr Arg Ser Gln Arg Ser Arg
145 150 155 160
Ile Glu Asn Phe Ile Ser Gln Cys Lys Gln Gln Asp Asp Thr Asn Gly
165 170 175
Leu Gly Val Lys Gln Leu Thr Phe Lys Gln His Glu Lys Asp Glu Gly
180 185 190
Lys Ser Leu Val Val Arg Phe Ser Asp Val Tyr Val Val Glu Pro Asp
195 200 205
Gly Ser Glu Thr Leu Ile Ser Pro Asp Thr Leu Asp Lys Pro Ser Val
210 215 220
Lys Asn Cys Leu Phe Trp Arg Ile Pro Ala Ser Val Trp Asn Met Thr
225 230 235 240
Phe Gly Lys Ser Val Gly Ser Ala Gly Lys Glu Glu Ile Ile Thr Asp
245 250 255
Ser Lys Lys Tyr Asp Gly Asn Gln Thr Lys Lys Gly Asn Lys Val Lys
260 265 270
Lys Gly Ser Ala Lys Lys Gly Gln Lys Lys Met Glu Leu Pro Asn Gly
275 280 285
Lys Val Ile Tyr Ser Arg Lys
290 295
<210> 61
<211> 277
<212> PRT
<213> 乳酸克鲁维酵母
<400> 61
Met Leu Ser Ser Ser Arg Pro Val Thr Tyr Ala Leu Phe Leu Ser Leu
1 5 10 15
Phe Ala Ala Val Ala Tyr Cys Phe Thr Arg Asp Glu Ile Glu Ile Phe
20 25 30
Gln Leu Gln Gln Glu Leu His Thr Lys Tyr Gly Ser Asn Met Asp Phe
35 40 45
Tyr Gln Phe Leu Lys Leu Pro Lys Leu Lys Gln Ser Thr Ser Ala Glu
50 55 60
Ile Thr Lys Asn Phe Lys Lys Leu Ala Lys Lys Tyr His Pro Asp Lys
65 70 75 80
Asn Pro Lys Tyr Arg Lys Leu Tyr Glu Arg Ile Asn Leu Ile Thr Lys
85 90 95
Leu Leu Ser Asp Glu Gly His Arg Lys Thr Tyr Asp Tyr Tyr Leu Lys
100 105 110
Asn Gly Phe Pro Lys Tyr Asp Tyr Lys Lys Gly Gly Phe Phe Phe Asn
115 120 125
Arg Val Thr Pro Ser Val Trp Phe Thr Phe Phe Phe Leu Tyr Val Leu
130 135 140
Ala Gly Val Ile His Leu Val Leu Leu Lys Leu His Asn Asn Ala Asn
145 150 155 160
Lys Lys Arg Ile Glu Asn Phe Val Ala Lys Val Arg Glu Gln Asp Thr
165 170 175
Thr Asn Ser Leu Gly Glu Ser Lys Leu Val Phe Lys Glu Ser Glu Asp
180 185 190
Ser Glu Asp Lys Gln Leu Leu Val Arg Phe Gly Glu Val Phe Val Ile
195 200 205
Gln Pro Asp Glu Ser Leu Ala Lys Ile Ser Thr Asp Asp Ile Ile Asp
210 215 220
Pro Gly Ile Asn Asp Thr Leu Leu Val Lys Leu Pro Lys Trp Ile Trp
225 230 235 240
Asn Lys Thr Leu Gly Lys Phe Ile Asn Ile Gly Thr Ser Lys Ser Gln
245 250 255
Gln Pro Asn Lys Gly Ser Pro Asn Lys Asn Lys Arg Asn Ser Lys Ile
260 265 270
Asn Ser Lys Ala Gln
275
<210> 62
<211> 404
<212> PRT
<213> 博伊丁假丝酵母
<400> 62
Met Arg Ser Phe Lys Ile Ile Phe Phe Val Leu Ala Phe Phe Thr Ala
1 5 10 15
Ile Ala Leu Cys Trp Thr His Glu Asp Ile Glu Ile Phe Glu Ile Asn
20 25 30
Glu Ser Leu Lys Lys Glu Thr Lys Asp Pro Glu Met Asn Phe Tyr Lys
35 40 45
Tyr Leu Asn Leu Pro Ser Gly Pro Lys Ser Ser Tyr Asp Gln Ile Ser
50 55 60
Arg Ala Phe Lys Lys Leu Ser Arg Lys Tyr His Pro Asp Lys Tyr Lys
65 70 75 80
Pro Asp Phe Asn Asn Asp Glu Lys Thr Ile Asn Lys Gln Lys Lys Asn
85 90 95
Trp Glu Lys Arg Phe Gln Asn Ile Gly Ala Ile Ala Glu Ile Leu Arg
100 105 110
Ser Glu Asn Lys Asp Arg Tyr Asp Phe Phe Tyr Lys Asn Gly Phe Pro
115 120 125
Thr Ile Asn Asp Glu Asn Glu Tyr Val Tyr Asn Lys Tyr Arg Pro Ser
130 135 140
Phe Leu Ile Thr Leu Ala Val Ile Phe Val Ile Ile Ser Val Leu His
145 150 155 160
Phe Ile Val Ile Lys Ser Asn Asn Thr Gln Gln Arg Gln Arg Ile Glu
165 170 175
Ser Leu Ile Asn Glu Ile Lys Thr Arg Ala Phe Gly Asn Gly Thr Pro
180 185 190
Thr Asp Phe Lys Asp Arg Lys Val Tyr His Asp Gly Leu Asp Lys Tyr
195 200 205
Phe Val Ala Lys Phe Asp Gly Ser Val Tyr Leu Leu Asp Glu Ser His
210 215 220
Leu Ser Ser Gly Thr Pro Ile Glu Glu Leu Ser Pro Glu Glu Ile Asp
225 230 235 240
Lys Ile Glu Met Gln Arg His Gly Tyr Asn Gly Pro Lys Leu Ala Lys
245 250 255
Gly Val Phe Tyr Tyr Lys Asp Asp Thr Tyr Lys Asn Arg Arg Thr Arg
260 265 270
Arg Ser Glu Leu Lys His Gly Ser Asp Glu Asp Glu Asp Val Leu Leu
275 280 285
Gln Met Ser Val Asp Glu Val Pro Leu Val Thr Leu Lys Asp Met Leu
290 295 300
Phe Ile Arg Phe Leu Ser Ser Ile Tyr Asn Thr Thr Leu Glu Arg Leu
305 310 315 320
Ile Pro Lys Ser Gln Pro Glu Thr Glu Thr Ser Gly Ser Lys Lys Lys
325 330 335
Thr Ile Pro Thr Thr Lys Ser Lys Asp Ser Thr Thr Glu Glu Asp Phe
340 345 350
Glu Ile Leu Asn Leu Glu Asp Ala Asn Pro Asp Ser Asn Glu Thr Ser
355 360 365
Lys Ser Ser Lys Glu Ala Asn Thr Val Leu Gly Ser Lys Thr Lys Lys
370 375 380
Thr Ser Ser Gly Glu Lys Lys Val Leu Pro Asn Gly Gln Val Ile Tyr
385 390 395 400
Ser Arg Lys Lys
<210> 63
<211> 397
<212> PRT
<213> 黑曲霉
<400> 63
Met Lys Ser Ile Ala Leu Arg Leu Phe Val Phe Val Ala Leu Ile Val
1 5 10 15
Leu Ala Ala Ala Trp Thr Lys Glu Asp Tyr Glu Ile Phe Arg Leu Asn
20 25 30
Asp Glu Leu Ala Ala Ala Glu Gly Pro Asn Val Thr Phe Tyr Asp Phe
35 40 45
Leu Gly Ala Lys Pro Asn Ala Asn Gln Asp Glu Leu Ser Lys Ala Tyr
50 55 60
Arg Gln Lys Ser Arg Leu Leu His Pro Asp Lys Val Lys Arg Ser Phe
65 70 75 80
Ile Ala Asn Ser Ser Lys Asp Lys Ser Arg Ser Lys Ser Ser Lys Ser
85 90 95
Gly Val His Val Asn Gln Gly Pro Ser Lys Arg Glu Ile Ala Ala Ala
100 105 110
Val Lys Glu Ala His Glu Arg Ser Ala Arg Leu Asn Thr Val Ala Asn
115 120 125
Ile Leu Arg Gly Pro Gly Arg Glu Arg Tyr Asp His Phe Leu Lys Asn
130 135 140
Gly Phe Pro Lys Trp Lys Gly Thr Gly Tyr Tyr Tyr Ser Arg Phe Arg
145 150 155 160
Pro Gly Leu Gly Ser Val Leu Ile Gly Leu Phe Leu Val Phe Gly Gly
165 170 175
Gly Ala His Tyr Ala Ala Leu Val Leu Gly Trp Lys Arg Gln Arg Glu
180 185 190
Phe Val Asp Arg Tyr Ile Arg Gln Ala Arg Arg Ala Ala Trp Gly Asp
195 200 205
Glu Ser Gly Val Arg Gly Ile Pro Gly Leu Asp Gly Ala Ser Ala Pro
210 215 220
Ala Pro Thr Pro Ala Pro Ala Pro Glu Pro Glu Gln Ser Ala Met Pro
225 230 235 240
Met Asn Arg Arg Gln Lys Arg Met Met Asp Arg Glu Asn Arg Lys Glu
245 250 255
Gly Lys Lys Gly Gly Arg Ala Ala Ser Arg Asn Ser Gly Thr Ala Thr
260 265 270
Pro Thr Ser Glu Pro Gln Met Glu Pro Ser Gly Glu Arg Lys Lys Val
275 280 285
Ile Ala Glu Asn Gly Lys Val Leu Ile Val Asp Ser Leu Gly Asn Val
290 295 300
Phe Leu Glu Glu Glu Thr Glu Asp Gly Glu Arg Gln Glu Phe Leu Leu
305 310 315 320
Asp Val Asp Glu Ile Gln Arg Pro Thr Ile Arg Asp Thr Leu Val Phe
325 330 335
Arg Leu Pro Gly Trp Val Tyr Ser Lys Thr Val Gly Arg Leu Leu Gly
340 345 350
Ser Ser Asn Ala Val Asn Ser Gly Ala Glu Ser Glu Glu Glu Pro Ser
355 360 365
Glu Ile Val Glu Glu Ser Thr Glu Gly Ala Ala Ser Ser Ala Arg Ser
370 375 380
Ser Lys Ala Arg Arg Arg Gly Lys Arg Ser Gln Arg Ser
385 390 395
<210> 64
<211> 323
<212> PRT
<213> Ogataea parapolymorpha
<400> 64
Met Arg Leu Leu Phe Trp Leu Ala Ile Phe Ser Ala Thr Val Phe Ala
1 5 10 15
Ala Trp Ser Ala Glu Asp Leu Glu Ile Phe Lys Leu Gln His Glu Leu
20 25 30
Val Lys Asp Thr Lys Lys Glu Thr Asn Phe Tyr Glu Tyr Leu Gly Leu
35 40 45
Ser Asn Gly Pro Lys Ala Ser Tyr Asp Glu Ile Asn Lys Ala Tyr Lys
50 55 60
Lys Met Ser Arg Lys Leu His Pro Asp Lys Val Arg Arg Lys Glu Gly
65 70 75 80
Met Ser Gln Lys Ala Phe Glu Arg Arg Lys Lys Ala Ala Glu Gln Arg
85 90 95
Phe Gln Arg Leu Ser Leu Ile Gly Thr Ile Leu Arg Gly Glu Arg Lys
100 105 110
Glu Arg Tyr Asp Tyr Tyr Leu Lys His Gly Phe Pro Ala Tyr Thr Gly
115 120 125
Thr Gly Phe Ala Leu Ser Lys Phe Arg Pro Gly Pro Val Leu Ala Leu
130 135 140
Val Val Val Val Val Leu Phe Ser Ala Val His Tyr Ile Met Leu Lys
145 150 155 160
Leu Asn Thr Gln Gln Lys Arg Lys Arg Val Glu Ser Leu Ile Asn Asp
165 170 175
Leu Lys Ala Lys Ala Phe Gly Pro Ser Met Leu Pro Gly Thr Asn Phe
180 185 190
Ser Asp Gln Arg Val Ala His Met Asp Lys Leu Phe Val Val Lys Phe
195 200 205
Asp Gly Ser Val Trp Leu Val Asp Lys Glu Leu Lys Glu Gly Glu Asp
210 215 220
Tyr Ile Val Asp Glu Asp Gly Arg Gln Ile Phe Arg Val Glu Ala Glu
225 230 235 240
Pro Lys Asn Arg Lys Gln Arg Arg Ala Lys Lys Asp Lys Asp Glu Val
245 250 255
Leu Leu Pro Val Thr Pro Asp Asp Val Glu Glu Val Thr Trp Arg Asp
260 265 270
Thr Leu Val Val Arg Phe Val Leu Trp Ala Ile Ser Lys Leu Glu Lys
275 280 285
Lys Pro Lys Thr His Asp Lys Ala Asp Lys Gly Thr Ile Arg Arg Leu
290 295 300
Pro Asn Gly Lys Val Lys Lys Val Arg Pro Thr Gly Glu Asn Gly Glu
305 310 315 320
Lys Asn Lys
<210> 65
<211> 53
<212> PRT
<213> Komagataella phaffii
<400> 65
Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser
1 5 10 15
Arg Glu Lys Lys Arg Arg His Val Glu Phe Leu Glu Asn His Val Val
20 25 30
Asp Leu Glu Ser Ala Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu
35 40 45
Lys Glu Ile Gln Asp
50
<210> 66
<211> 53
<212> PRT
<213> Komagataella pastoris
<400> 66
Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser
1 5 10 15
Arg Glu Lys Lys Arg Arg His Val Glu Phe Leu Glu Asn His Val Val
20 25 30
Asp Leu Glu Ser Ala Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu
35 40 45
Lys Gln Ile Gln Asp
50
<210> 67
<211> 45
<212> PRT
<213> 解脂耶氏酵母
<400> 67
Arg Arg Ile Glu Arg Ile Met Arg Asn Arg Gln Ala Ala His Ala Ser
1 5 10 15
Arg Glu Lys Lys Arg Arg His Leu Glu Asp Leu Glu Lys Lys Cys Ser
20 25 30
Glu Leu Ser Ser Glu Asn Asn Asp Leu His His Gln Val
35 40 45
<210> 68
<211> 53
<212> PRT
<213> 里氏木霉
<400> 68
Arg Arg Val Glu Arg Val Leu Arg Asn Arg Arg Ala Ala Gln Ser Ser
1 5 10 15
Arg Glu Arg Lys Arg Leu Glu Val Glu Ala Leu Glu Lys Arg Asn Lys
20 25 30
Glu Leu Glu Thr Leu Leu Ile Asn Val Gln Lys Thr Asn Leu Ile Leu
35 40 45
Val Glu Glu Leu Asn
50
<210> 69
<211> 51
<212> PRT
<213> 酿酒酵母
<400> 69
Arg Arg Ile Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Gln Ser
1 5 10 15
Arg Glu Lys Lys Arg Leu His Leu Gln Tyr Leu Glu Arg Lys Cys Ser
20 25 30
Leu Leu Glu Asn Leu Leu Asn Ser Val Asn Leu Glu Lys Leu Ala Asp
35 40 45
His Glu Asp
50
<210> 70
<211> 46
<212> PRT
<213> 乳酸克鲁维酵母
<400> 70
Arg Arg Ile Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Gln Ser
1 5 10 15
Arg Glu Lys Lys Arg Leu His Val Gln Arg Leu Glu Glu Lys Cys His
20 25 30
Leu Leu Glu Gly Ile Leu Lys Met Val Asp Leu Asp Ile Leu
35 40 45
<210> 71
<211> 48
<212> PRT
<213> 博伊丁假丝酵母
<400> 71
Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser
1 5 10 15
Arg Glu Lys Lys Arg Lys His Val Glu Tyr Leu Glu Leu Tyr Val Asn
20 25 30
Asn Leu Glu Asn Gly Ile Lys Asn Tyr Ile Ser Asn Gln Glu Lys Leu
35 40 45
<210> 72
<211> 53
<212> PRT
<213> 黑曲霉
<400> 72
Arg Arg Ile Glu Arg Val Leu Arg Asn Arg Ala Ala Ala Gln Thr Ser
1 5 10 15
Arg Glu Arg Lys Arg Leu Glu Met Glu Lys Leu Glu Asn Glu Lys Ile
20 25 30
Gln Met Glu Gln Gln Asn Gln Phe Leu Leu Gln Arg Leu Ser Gln Met
35 40 45
Glu Ala Glu Asn Asn
50
<210> 73
<211> 39
<212> PRT
<213> Ogataea angusta
<400> 73
Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser
1 5 10 15
Arg Glu Lys Lys Arg Arg His Val Glu Tyr Leu Glu Asn Tyr Val Thr
20 25 30
Asp Leu Glu Ser Ala Leu Ala
35
<210> 74
<211> 331
<212> PRT
<213> Komagataella phaffii
<400> 74
Met Pro Val Asp Ser Ser His Lys Thr Ala Ser Pro Leu Pro Pro Arg
1 5 10 15
Lys Arg Ala Lys Thr Glu Glu Glu Lys Glu Gln Arg Arg Val Glu Arg
20 25 30
Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg
35 40 45
Arg His Val Glu Phe Leu Glu Asn His Val Val Asp Leu Glu Ser Ala
50 55 60
Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu Lys Glu Ile Gln Asp
65 70 75 80
Ile Ile Val Ser Arg Leu Glu Ala Leu Gly Gly Thr Val Ser Asp Leu
85 90 95
Asp Leu Thr Val Pro Glu Val Asp Phe Pro Lys Ser Ser Asp Leu Glu
100 105 110
Pro Met Ser Asp Leu Ser Thr Ser Ser Lys Ser Glu Lys Ala Ser Thr
115 120 125
Ser Thr Arg Arg Ser Leu Thr Glu Asp Leu Asp Glu Asp Asp Val Ala
130 135 140
Glu Tyr Asp Asp Glu Glu Glu Asp Glu Glu Leu Pro Arg Lys Met Lys
145 150 155 160
Val Leu Asn Asp Lys Asn Lys Ser Thr Ser Ile Lys Gln Glu Lys Leu
165 170 175
Asn Glu Leu Pro Ser Pro Leu Ser Ser Asp Phe Ser Asp Val Asp Glu
180 185 190
Glu Lys Ser Thr Leu Thr His Leu Lys Leu Gln Gln Gln Gln Gln Gln
195 200 205
Pro Val Asp Asn Tyr Val Ser Thr Pro Leu Ser Leu Pro Glu Asp Ser
210 215 220
Val Asp Phe Ile Asn Pro Gly Asn Leu Lys Ile Glu Ser Asp Glu Asn
225 230 235 240
Phe Leu Leu Ser Ser Asn Thr Leu Gln Ile Lys His Glu Asn Asp Thr
245 250 255
Asp Tyr Ile Thr Thr Ala Pro Ser Gly Ser Ile Asn Asp Phe Phe Asn
260 265 270
Ser Tyr Asp Ile Ser Glu Ser Asn Arg Leu His His Pro Ala Val Met
275 280 285
Thr Asp Ser Ser Leu His Ile Thr Ala Gly Ser Ile Gly Phe Phe Ser
290 295 300
Leu Ile Gly Gly Gly Glu Ser Ser Val Ala Gly Arg Arg Ser Ser Val
305 310 315 320
Gly Thr Tyr Gln Leu Thr Cys Ile Ala Ile Arg
325 330
<210> 75
<211> 330
<212> PRT
<213> Komagataella pastoris
<400> 75
Met Pro Val Asp Ser Ser His Lys Ile Ala Ser Pro Leu Pro Pro Arg
1 5 10 15
Lys Arg Ala Lys Thr Glu Glu Glu Lys Glu Gln Arg Arg Val Glu Arg
20 25 30
Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg
35 40 45
Arg His Val Glu Phe Leu Glu Asn His Val Val Asp Leu Glu Ser Ala
50 55 60
Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu Lys Gln Ile Gln Asp
65 70 75 80
Ile Ile Val Ser Arg Leu Glu Ala Leu Gly Gly Thr Val Ser Asp Leu
85 90 95
Asp Leu Ala Val Pro Glu Val Asp Phe Pro Lys Phe Ser Asp Leu Glu
100 105 110
Leu Ser Thr Asp Leu Ser Ser Ser Thr Lys Ser Glu Lys Ala Ser Thr
115 120 125
Ser Thr Cys Arg Ser Ser Thr Glu Asp Leu Asp Glu Asp Gly Val Ala
130 135 140
Glu Tyr Asp Asp Glu Glu Asp Glu Glu Leu Pro Arg Lys Lys Asn Val
145 150 155 160
Leu Asn Asp Lys Ser Lys Asn Arg Thr Ile Lys Gln Glu Lys Leu Asn
165 170 175
Glu Leu Pro Ser Pro Leu Ser Ser Asp Phe Ser Asp Val Asp Glu Glu
180 185 190
Lys Ser Thr Leu Thr His Phe Gln Leu Gln Gln Gln Gln Gln Gln Gln
195 200 205
Pro Val Asp Asn Tyr Val Ser Thr Pro Leu Ser Leu Pro Glu Asp Ser
210 215 220
Ile Asp Phe Ile Asn Pro Gly Ser Leu Lys Ile Glu Ser Asp Glu Asn
225 230 235 240
Phe Leu Leu Gly Ser Ser Thr Leu Gln Ile Lys His Glu Asn Asp Thr
245 250 255
Glu Tyr Ile Pro Thr Ala Pro Ser Gly Ser Ile Asn Asp Phe Phe Asn
260 265 270
Ser Tyr Asp Ile Ser Glu Ser Asn Arg Leu His His Pro Ala Val Met
275 280 285
Thr Asp Ser Ser Leu His Thr Thr Ala Gly Ser Ile Gly Phe Phe Ser
290 295 300
Leu Ile Arg Gly Lys Ser Phe Val Val Gly Arg Arg Ser Ser Val Gly
305 310 315 320
Val Tyr Gln Leu Thr Cys Ile Ala Ile Arg
325 330
<210> 76
<211> 299
<212> PRT
<213> 解脂耶氏酵母
<400> 76
Met Ser Ile Lys Arg Glu Glu Ser Phe Thr Pro Thr Pro Glu Asp Leu
1 5 10 15
Gly Ser Pro Leu Thr Ala Asp Ser Pro Gly Ser Pro Glu Ser Gly Asp
20 25 30
Lys Arg Lys Lys Asp Leu Thr Leu Pro Leu Pro Ala Gly Ala Leu Pro
35 40 45
Pro Arg Lys Arg Ala Lys Thr Glu Asn Glu Lys Glu Gln Arg Arg Ile
50 55 60
Glu Arg Ile Met Arg Asn Arg Gln Ala Ala His Ala Ser Arg Glu Lys
65 70 75 80
Lys Arg Arg His Leu Glu Asp Leu Glu Lys Lys Cys Ser Glu Leu Ser
85 90 95
Ser Glu Asn Asn Asp Leu His His Gln Val Thr Glu Ser Lys Lys Thr
100 105 110
Asn Met His Leu Met Glu Gln His Tyr Ser Leu Val Ala Lys Leu Gln
115 120 125
Gln Leu Ser Ser Leu Val Asn Met Ala Lys Ser Ser Gly Ala Leu Ala
130 135 140
Gly Val Asp Val Pro Asp Met Ser Asp Val Ser Met Ala Pro Lys Leu
145 150 155 160
Glu Met Pro Thr Ala Ala Pro Ser Gln Pro Met Gly Leu Ala Ser Ala
165 170 175
Pro Thr Leu Phe Asn His Asp Asn Glu Thr Val Val Pro Asp Ser Pro
180 185 190
Ile Val Lys Thr Glu Glu Val Asp Ser Thr Asn Phe Leu Leu His Thr
195 200 205
Glu Ser Ser Ser Pro Pro Glu Leu Ala Glu Ser Thr Gly Ser Gly Ser
210 215 220
Pro Ser Ser Thr Leu Ser Cys Asp Glu Thr Asp Tyr Leu Val Asp Arg
225 230 235 240
Ala Arg His Pro Ala Val Met Thr Val Ala Thr Thr Asp Gln Gln Arg
245 250 255
Arg His Lys Ile Ser Phe Ser Ser Arg Thr Ser Pro Leu Thr Thr Ser
260 265 270
Leu Asp Cys Met Asp Cys Arg Met Thr Ser Pro Cys Leu Lys Thr Thr
275 280 285
Ser Ser Leu Pro Ser Thr Thr Leu Leu Leu Ile
290 295
<210> 77
<211> 451
<212> PRT
<213> 里氏木霉
<400> 77
Met Ala Phe Gln Gln Ser Ser Pro Leu Val Lys Phe Glu Ala Ser Pro
1 5 10 15
Ala Glu Ser Phe Leu Ser Ala Pro Gly Asp Asn Phe Thr Ser Leu Phe
20 25 30
Ala Asp Ser Thr Pro Ser Thr Leu Asn Pro Arg Asp Met Met Thr Pro
35 40 45
Asp Ser Val Ala Asp Ile Asp Ser Arg Leu Ser Val Ile Pro Glu Ser
50 55 60
Gln Asp Ala Glu Asp Asp Glu Ser His Ser Thr Ser Ala Thr Ala Pro
65 70 75 80
Ser Thr Ser Glu Lys Lys Pro Val Lys Lys Arg Lys Ser Trp Gly Gln
85 90 95
Val Leu Pro Glu Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys
100 105 110
Thr Glu Asp Glu Lys Glu Gln Arg Arg Val Glu Arg Val Leu Arg Asn
115 120 125
Arg Arg Ala Ala Gln Ser Ser Arg Glu Arg Lys Arg Leu Glu Val Glu
130 135 140
Ala Leu Glu Lys Arg Asn Lys Glu Leu Glu Thr Leu Leu Ile Asn Val
145 150 155 160
Gln Lys Thr Asn Leu Ile Leu Val Glu Glu Leu Asn Arg Phe Arg Arg
165 170 175
Ser Ser Gly Val Val Thr Arg Ser Ser Ser Pro Leu Asp Ser Leu Gln
180 185 190
Asp Ser Ile Thr Leu Ser Gln Gln Leu Phe Gly Ser Arg Asp Gly Gln
195 200 205
Thr Met Ser Asn Pro Glu Gln Ser Leu Met Asp Gln Ile Met Arg Ser
210 215 220
Ala Ala Asn Pro Thr Val Asn Pro Ala Ser Leu Ser Pro Ser Leu Pro
225 230 235 240
Pro Ile Ser Asp Lys Glu Phe Gln Thr Lys Glu Glu Asp Glu Glu Gln
245 250 255
Ala Asp Glu Asp Glu Glu Met Glu Gln Thr Trp His Glu Thr Lys Glu
260 265 270
Ala Ala Ala Ala Lys Glu Lys Asn Ser Lys Gln Ser Arg Val Ser Thr
275 280 285
Asp Ser Thr Gln Arg Pro Ala Val Ser Ile Gly Gly Asp Ala Ala Val
290 295 300
Pro Val Phe Ser Asp Asp Ala Gly Ala Asn Cys Leu Gly Leu Asp Pro
305 310 315 320
Val His Gln Asp Asp Gly Pro Phe Ser Ile Gly His Ser Phe Gly Leu
325 330 335
Ser Ala Ala Leu Asp Ala Asp Arg Tyr Leu Leu Glu Ser Gln Leu Leu
340 345 350
Ala Ser Pro Asn Ala Ser Thr Val Asp Asp Asp Tyr Leu Ala Gly Asp
355 360 365
Ser Ala Ala Cys Phe Thr Asn Pro Leu Pro Ser Asp Tyr Asp Phe Asp
370 375 380
Ile Asn Asp Phe Leu Thr Asp Asp Ala Asn His Ala Ala Tyr Asp Ile
385 390 395 400
Val Ala Ala Ser Asn Tyr Ala Ala Ala Asp Arg Glu Leu Asp Leu Glu
405 410 415
Ile His Asp Pro Glu Asn Gln Ile Pro Ser Arg His Ser Ile Gln Gln
420 425 430
Pro Gln Ser Gly Ala Ser Ser His Gly Cys Asp Asp Gly Gly Ile Ala
435 440 445
Val Gly Val
450
<210> 78
<211> 238
<212> PRT
<213> 酿酒酵母
<400> 78
Met Glu Met Thr Asp Phe Glu Leu Thr Ser Asn Ser Gln Ser Asn Leu
1 5 10 15
Ala Ile Pro Thr Asn Phe Lys Ser Thr Leu Pro Pro Arg Lys Arg Ala
20 25 30
Lys Thr Lys Glu Glu Lys Glu Gln Arg Arg Ile Glu Arg Ile Leu Arg
35 40 45
Asn Arg Arg Ala Ala His Gln Ser Arg Glu Lys Lys Arg Leu His Leu
50 55 60
Gln Tyr Leu Glu Arg Lys Cys Ser Leu Leu Glu Asn Leu Leu Asn Ser
65 70 75 80
Val Asn Leu Glu Lys Leu Ala Asp His Glu Asp Ala Leu Thr Cys Ser
85 90 95
His Asp Ala Phe Val Ala Ser Leu Asp Glu Tyr Arg Asp Phe Gln Ser
100 105 110
Thr Arg Gly Ala Ser Leu Asp Thr Arg Ala Ser Ser His Ser Ser Ser
115 120 125
Asp Thr Phe Thr Pro Ser Pro Leu Asn Cys Thr Met Glu Pro Ala Thr
130 135 140
Leu Ser Pro Lys Ser Met Arg Asp Ser Ala Ser Asp Gln Glu Thr Ser
145 150 155 160
Trp Glu Leu Gln Met Phe Lys Thr Glu Asn Val Pro Glu Ser Thr Thr
165 170 175
Leu Pro Ala Val Asp Asn Asn Asn Leu Phe Asp Ala Val Ala Ser Pro
180 185 190
Leu Ala Asp Pro Leu Cys Asp Asp Ile Ala Gly Asn Ser Leu Pro Phe
195 200 205
Asp Asn Ser Ile Asp Leu Asp Asn Trp Arg Asn Pro Glu Ala Gln Ser
210 215 220
Gly Leu Asn Ser Phe Glu Leu Asn Asp Phe Phe Ile Thr Ser
225 230 235
<210> 79
<211> 273
<212> PRT
<213> 乳酸克鲁维酵母
<400> 79
Met Thr Gly Lys Asn Ser Val Ser Asp Ile Pro Val Asn Phe Lys Pro
1 5 10 15
Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Gln Glu Glu Lys Glu Gln
20 25 30
Arg Arg Ile Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Gln Ser
35 40 45
Arg Glu Lys Lys Arg Leu His Val Gln Arg Leu Glu Glu Lys Cys His
50 55 60
Leu Leu Glu Gly Ile Leu Lys Met Val Asp Leu Asp Ile Leu Ser Glu
65 70 75 80
Asn Asn Ala Lys Leu Ser Gly Met Val Glu Gln Trp Arg Glu Met Gln
85 90 95
Val Ser Asp Ser Gly Ser Ile Ser Ser His Asp Ser Asn Thr Gly Met
100 105 110
Leu Asp Ser Pro Glu Ser Leu Thr Ser Ser Pro Asp Lys Lys Asp His
115 120 125
Tyr Ser His Ser Ser His Ser Thr Ser Ile Ser Ser Ser Ser Ser Ser
130 135 140
Ser Ser Pro Ser Asn Leu Pro His Gly Met Val Thr Asp Asn Gly Met
145 150 155 160
Leu Asp Glu Asp Asn Asn Ser Leu Asn Tyr Ile Leu Gly Gln Gln Asn
165 170 175
Tyr Gln Leu Ser Ser Thr Pro Val Val Lys Leu Glu Glu Asp His Ser
180 185 190
Met Leu Leu Glu Asn Asn Gly Asp Ala Asp Leu Asn Asp Val Gly Ile
195 200 205
Ser Phe Ile Ala Glu Asp Gly Thr Asn Ser Asp Asn Lys Asn Ile Asp
210 215 220
Met Arg Asn Gln Glu Thr Gly Glu Gly Trp Asn Leu Leu Leu Thr Val
225 230 235 240
Pro Pro Glu Leu Asn Ser Asp Leu Ser Glu Leu Glu Pro Ser Asp Ile
245 250 255
Ile Ser Pro Ile Gly Leu Asp Thr Trp Arg Asn Pro Ala Val Ile Val
260 265 270
Thr
<210> 80
<211> 351
<212> PRT
<213> 博伊丁假丝酵母
<400> 80
Met Ser Leu Ser Asn Thr Pro Ser Ser Pro Asp Asn Ile Ser Asn Val
1 5 10 15
Ser Ala Ser Leu Ile Ser Ser Asn Leu Lys Gly Lys Thr Asp Glu Leu
20 25 30
Leu Lys Ser Ala Ser Ala Ile Gly Leu Leu Pro Pro Arg Lys Arg Ala
35 40 45
Lys Thr Ala Glu Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg
50 55 60
Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg Lys His Val
65 70 75 80
Glu Tyr Leu Glu Leu Tyr Val Asn Asn Leu Glu Asn Gly Ile Lys Asn
85 90 95
Tyr Ile Ser Asn Gln Glu Lys Leu Ile Asn Phe Gln Ser Leu Leu Ile
100 105 110
Ala Lys Leu Lys Val Ala Asn Val Asp Ile Ser Asp Ile Asp Leu Ser
115 120 125
Thr Cys Thr Asn Ile Asp Ile Val Ser Ile Glu Lys Pro Glu Cys Leu
130 135 140
Asn Tyr Ser Pro Asn Ser Ser Ser Lys Lys Asn Lys Lys Ser Ser Ser
145 150 155 160
Asp Asp Glu Glu Glu Glu Asp Asp Asp Asp Asp Asp Glu Asp Asp Glu
165 170 175
Asp Asp Asn Val Glu Leu Lys His Lys Ser Asn Ser Gln Lys Gln Gln
180 185 190
Gln Gln Gln Gln Lys Glu Tyr Lys Glu Val Glu Gln Ser Thr Lys Gln
195 200 205
Asp Glu Ser Lys Thr Ser Asn Gln Gln Gln Glu Gln Glu Gln Glu Gln
210 215 220
Glu Gln Val Ser Thr Pro Lys Ala Glu Leu Thr Gln Gln Leu Ser Asp
225 230 235 240
Pro Thr Met Asp Met Lys Phe Lys Ser Ala Val Lys Leu Glu Asp Val
245 250 255
Asn Gln Leu Pro Gln Asp Gln Tyr Leu Met Ser Pro Pro Asn Thr Glu
260 265 270
Ser Pro Arg Lys Phe Ile Leu Asp Ser Ser Asn Ile Asn Lys Asp Tyr
275 280 285
Thr His Ile Phe Val Gly Asp Asp Leu Leu Phe Asn Asn Asp Leu Gln
290 295 300
Leu Cys Ser Asp Ser Leu Lys Gln Gln Glu Leu Asn Val Pro Asn Ile
305 310 315 320
Glu Asn Ile Ile Ser Asp Tyr Ser Leu Asp Ser Met Asn Asp Leu Asn
325 330 335
Ala Tyr Asn Arg Leu His His Pro Ala Ala Met Val Gln Arg Tyr
340 345 350
<210> 81
<211> 342
<212> PRT
<213> 黑曲霉
<400> 81
Met Met Glu Glu Ala Phe Ser Pro Val Asp Ser Leu Ala Gly Ser Pro
1 5 10 15
Thr Pro Glu Leu Pro Leu Leu Thr Val Ser Pro Ala Asp Thr Ser Leu
20 25 30
Asp Asp Ser Ser Val Gln Ala Gly Glu Thr Lys Ala Glu Glu Lys Lys
35 40 45
Pro Val Lys Lys Arg Lys Ser Trp Gly Gln Glu Leu Pro Val Pro Lys
50 55 60
Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys Thr Glu Asp Glu Lys Glu
65 70 75 80
Gln Arg Arg Ile Glu Arg Val Leu Arg Asn Arg Ala Ala Ala Gln Thr
85 90 95
Ser Arg Glu Arg Lys Arg Leu Glu Met Glu Lys Leu Glu Asn Glu Lys
100 105 110
Ile Gln Met Glu Gln Gln Asn Gln Phe Leu Leu Gln Arg Leu Ser Gln
115 120 125
Met Glu Ala Glu Asn Asn Arg Leu Asn Gln Gln Val Ala Gln Leu Ser
130 135 140
Ala Glu Val Arg Gly Ser Arg Gly Asn Thr Pro Lys Pro Gly Ser Pro
145 150 155 160
Val Ser Ala Ser Pro Thr Leu Thr Pro Thr Leu Phe Lys Gln Glu Arg
165 170 175
Asp Glu Ile Pro Leu Glu Arg Ile Pro Phe Pro Thr Pro Ser Ile Thr
180 185 190
Asp Tyr Ser Pro Thr Leu Arg Pro Ser Thr Leu Ala Glu Ser Ser Asp
195 200 205
Val Thr Gln His Pro Ala Val Ser Val Ala Gly Leu Glu Gly Glu Gly
210 215 220
Ser Ala Leu Ser Leu Phe Asp Val Gly Ser Asn Pro Glu Pro His Ala
225 230 235 240
Ala Asp Asp Leu Ala Ala Pro Leu Ser Asp Asp Asp Phe His Arg Leu
245 250 255
Phe Asn Val Asp Ser Pro Val Gly Ser Asp Ser Ser Val Leu Glu Asp
260 265 270
Gly Phe Ala Phe Asp Val Leu Asp Gly Gly Asp Leu Ser Ala Phe Pro
275 280 285
Phe Asp Ser Met Val Asp Phe Asp Pro Glu Ser Val Gly Phe Glu Gly
290 295 300
Ile Glu Pro Pro His Gly Leu Pro Asp Glu Thr Ser Arg Gln Thr Ser
305 310 315 320
Ser Val Gln Pro Ser Leu Gly Ala Ser Thr Ser Arg Cys Asp Gly Gln
325 330 335
Gly Ile Ala Ala Gly Cys
340
<210> 82
<211> 325
<212> PRT
<213> Ogataea angusta
<400> 82
Met Thr Ala Leu Asn Ser Ser Val Gln His Gln Glu Val Ser Ser Asp
1 5 10 15
Leu Pro Phe Gly Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Glu Glu
20 25 30
Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala
35 40 45
Ala His Ala Ser Arg Glu Lys Lys Arg Arg His Val Glu Tyr Leu Glu
50 55 60
Asn Tyr Val Thr Asp Leu Glu Ser Ala Leu Ala Thr His Glu Gly Asn
65 70 75 80
Tyr Arg Lys Met Ala Lys Ile Gln Ser Ser Leu Ile Ser Leu Leu Ser
85 90 95
Glu His Gly Ile Asp Tyr Ser Ser Val Asp Leu Ala Val Glu Pro Cys
100 105 110
Pro Lys Val Glu Arg Pro Glu Gly Leu Glu Leu Thr Gly Ser Ile Pro
115 120 125
Val Lys Lys Gln Lys Ile Ala Ser Ala Lys Ser Pro Lys Ser Leu Ser
130 135 140
Arg Lys Ser Lys Ser Glu Ile Pro Ser Pro Ser Phe Asp Glu Asn Ile
145 150 155 160
Phe Ser Glu Glu Glu Asn Glu His Asp Asp Gly Ile Glu Glu Tyr Gly
165 170 175
Lys Ala Gly Gln Glu Ala Thr Glu Ala Pro Ser Leu Ser His Asn Arg
180 185 190
Lys Arg Lys Ala Gln Asp Ala Tyr Ile Ser Pro Pro Gly Ser Thr Ser
195 200 205
Pro Ser Lys Leu Lys Leu Glu Glu Asp Glu Arg Ile Ser Lys His Glu
210 215 220
Tyr Ser Asn Leu Phe Asp Asp Thr Asp Asp Ile Phe Pro Ser Glu Lys
225 230 235 240
Ser Ser Ser Leu Glu Leu Tyr Lys Gln Asp Asp Leu Thr Met Ala Ser
245 250 255
Phe Val Lys Gln Glu Glu Glu Glu Met Val Pro Phe Val Lys Gln Glu
260 265 270
Asp Glu Phe Lys Phe Pro Asp Ser Gly Phe Asn Ala Asp Asp Cys His
275 280 285
Leu Ile Gln Val Glu Asp Leu Cys Ser Phe Asn Ser Val His His Pro
290 295 300
Ala Ala Ala Pro Leu Thr Ala Glu Ser Ile Asp Asn His Phe Glu Phe
305 310 315 320
Asp Asp Tyr Leu Ser
325
<210> 83
<211> 223
<212> PRT
<213> 巴斯德毕赤酵母
<400> 83
Met Ser Thr Thr Lys Pro Met Gln Val Leu Ala Pro Asp Leu Thr Glu
1 5 10 15
Thr Pro Lys Thr Tyr Ser Leu Gly Val His Leu Gly Lys Gly Lys Asp
20 25 30
Lys Leu Gln Asp Pro Thr Glu Leu Tyr Ser Met Ile Leu Asp Gly Met
35 40 45
Asp His Ser Gln Leu Asn Ser Phe Ile Asn Asp Gln Leu Asn Leu Gly
50 55 60
Ser Leu Arg Leu Pro Ala Asn Pro Pro Ala Ala Ser Gly Ala Lys Arg
65 70 75 80
Gly Ala Asn Val Ser Ser Ile Asn Met Asp Asp Leu Gln Thr Phe Asp
85 90 95
Phe Asn Phe Asp Tyr Glu Arg Asp Ser Ser Pro Leu Glu Leu Asn Met
100 105 110
Asp Ser Gln Ser Leu Met Phe Ser Ser Pro Glu Lys Ala Pro Cys Gly
115 120 125
Ser Leu Pro Ser Gln His Gln Pro His Ser Gln Val Ala Ala Ala Gln
130 135 140
Gly Thr Thr Ile Asn Pro Arg Gln Leu Ser Thr Ser Ser Ala Ser Ser
145 150 155 160
Phe Val Ser Ser Asp Phe Asp Val Asp Ser Leu Leu Ala Asp Glu Tyr
165 170 175
Ala Glu Lys Leu Glu Tyr Gly Ala Ile Ser Ser Ala Ser Ser Ser Ile
180 185 190
Cys Ser Asn Ser Val Leu Pro Ser Gln Gly Val Thr Ser Gln His Ser
195 200 205
Ser Pro Ile Glu Gln Arg Pro Arg Val Gly Asn Ser Lys Arg Leu
210 215 220
<210> 84
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> synthetic transcription activator domain (VP64)
<400> 84
Gly Gly Gly Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1 5 10 15
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp
20 25 30
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
35 40
<210> 85
<211> 14
<212> PRT
<213> 巴斯德毕赤酵母
<400> 85
Glu Pro Arg Lys Lys Glu Thr Lys Gln Arg Lys Arg Ala Lys
1 5 10
<210> 86
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> nuclear localization signal of synMSN4
<400> 86
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 87
<211> 54
<212> PRT
<213> 人工序列
<220>
<223> 共有序列
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> 位置10处的K可以与R互换
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> 位置11处的R可以与K互换
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa可以是Q或S
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> 位置19处的K可以与R互换
<220>
<221> misc_feature
<222> (22)..(22)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (25)..(25)
<223> Xaa可是是V或L
<220>
<221> MISC_FEATURE
<222> (27)..(27)
<223> 位置27处的S可以与T互换
<220>
<221> misc_feature
<222> (28)..(28)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (30)..(30)
<223> 位置30处的K可以与R互换
<220>
<221> misc_feature
<222> (33)..(33)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (35)..(36)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (38)..(38)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (40)..(40)
<223> 位置40处的K可以与R互换
<220>
<221> MISC_FEATURE
<222> (44)..(44)
<223> 位置44处的S可以与T互换
<220>
<221> misc_feature
<222> (48)..(48)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (52)..(52)
<223> 位置52处的R可以与K互换
<400> 87
Lys Pro Phe Val Cys Thr Leu Cys Ser Lys Arg Phe Arg Arg Xaa Glu
1 5 10 15
His Leu Lys Arg His Xaa Arg Ser Xaa His Ser Xaa Glu Lys Pro Phe
20 25 30
Xaa Cys Xaa Xaa Cys Xaa Lys Lys Phe Ser Arg Ser Asp Asn Leu Xaa
35 40 45
Gln His Leu Arg Thr His
50
<210> 88
<211> 1098
<212> DNA
<213> 巴斯德毕赤酵母
<400> 88
gataggtctc tcatgtctac aacaaaacca atgcaggtgt tagccccgga ccttactgag 60
acaccaaaga catattcgtt aggtgtccat ttggggaaag gcaaggacaa actccaggat 120
ccgacagaac tctactcgat gatcctagat ggaatggatc actcacagct caattctttt 180
attaacgatc agttgaactt gggatcattg cgcttgccgg cgaatcctcc tgctgcaagt 240
ggtgctaaac ggggtgcaaa tgtcagttct atcaacatgg atgatttaca aacgtttgat 300
ttcaactttg attacgaacg ggattcatcg ccgctagaat tgaacatgga ttctcaatct 360
ttgatgtttt cctctccaga gaaagctccc tgtggctcct tgccgtctca gcatcagcct 420
cactctcagg tcgcagccgc acagggaact accatcaatc caaggcagtt atccacatct 480
tctgccagta gctttgtatc ttcggatttt gatgttgatt cactcctggc agacgagtac 540
gctgagaaac tagaatatgg agccatatca tctgcctcat cttccatctg ttcgaattct 600
gttcttccta gccagggcgt aacttcgcaa catagctctc ctatagaaca aagacctcgt 660
gtgggaaatt ccaaacgctt gagtgatttt tggatgcagg acgaagctgt cactgccatt 720
tccacctggc tcaaagctga aataccttcc tccttggcta cgccggctcc tacagtcaca 780
caaataagta gtcccagcct tagcacccca gagccaagga agaaagaaac aaaacaaaga 840
aagagggcaa agtccataga cacgaatgag cgatctgaac aagtagcagc ttctaattca 900
gatgatgaaa agcaattccg ctgcacggat tgcagtagac gcttccgcag atcagaacac 960
ctgaaacgac atcataggtc tgttcattct aacgaaaggc cgttccattg tgctcactgt 1020
gataaacggt tctcaagaag cgacaacttg tcgcagcatc tacgtactca ccgtaagcag 1080
tgagcttaga gacctatc 1098
<210> 89
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr2-0555
<400> 89
gataggtctc tcatgtctac aacaaaacca atgcag 36
<210> 90
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr2-0555反向
<400> 90
gataggtctc taagctcact gcttacggtg agtac 35
<210> 91
<211> 469
<212> DNA
<213> 人工序列
<220>
<223> synMSN4
<400> 91
gatctaggtc tcacatgggt aagccaattc ctaacccatt gttgggtttg gattctactc 60
caaaaaagaa gagaaaggtt ggtggaggtg gatctgatgc ccttgacgat tttgacttgg 120
acatgttggg ttctgacgct ttggatgact ttgatcttga tatgcttggt tccgacgctc 180
tagatgattt cgacttggat atgctgggat ccgatgcctt ggacgatttc gacttggata 240
tgttgggtgg aggtggatct aattcagatg atgaaaagca attccgctgc acggattgca 300
gtagacgctt ccgcagatca gaacacctga aacgacatca taggtctgtt cattctaacg 360
aaaggccgtt ccattgtgct cactgtgata aacggttctc aagaagcgac aacttgtcgc 420
agcatctacg tactcaccgt aagcagtgat aggcttcgag accaatgac 469
<210> 92
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物syMSN4
<400> 92
gatctaggtc tcacatgggt aagccaattc ctaacc 36
<210> 93
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物synMSN4反向
<400> 93
gtcattggtc tcgaagccta tcactgctta cggtgag 37
<210> 94
<211> 2142
<212> DNA
<213> 酿酒酵母
<400> 94
gataggtctc gcatgacggt cgaccatgat ttcaatagcg aagatatttt attccccata 60
gaaagcatga gtagtataca atacgtggag aataataacc caaataatat taacaacgat 120
gttatcccgt attctctaga tatcaaaaac actgtcttag atagtgcgga tctcaatgac 180
attcaaaatc aagaaacttc actgaatttg gggcttcctc cactatcttt cgactctcca 240
ctgcccgtaa cggaaacgat accatccact accgataaca gcttgcattt gaaagctgat 300
agcaacaaaa atcgcgatgc aagaactatt gaaaatgata gtgaaattaa gagtactaat 360
aatgctagtg gctctggggc aaatcaatac acaactctta cttcacctta tcctatgaac 420
gacattttgt acaacatgaa caatccgtta caatcaccgt caccttcatc ggtacctcaa 480
aatccgacta taaatcctcc cataaataca gcaagtaacg aaactaattt atcgcctcaa 540
acttcaaatg gtaatgaaac tcttatatct cctcgagccc aacaacatac gtccattaaa 600
gataatcgtc tgtccttacc taatggtgct aattcgaatc ttttcattga cactaaccca 660
aacaatttga acgaaaaact aagaaatcaa ttgaactcag atacaaattc atattctaac 720
tccatttcta attcaaactc caattctacg ggtaatttaa attccagtta ttttaattca 780
ctgaacatag actccatgct agatgattac gtttctagtg atctcttatt gaatgatgat 840
gatgatgaca ctaatttatc acgccgaaga tttagcgacg ttataacaaa ccaatttccg 900
tcaatgacaa attcgaggaa ttctatttct cactctttgg acctttggaa ccatccgaaa 960
attaatccaa gcaatagaaa tacaaatctc aatatcacta ctaattctac ctcaagttcc 1020
aatgcaagtc cgaataccac tactatgaac gcaaatgcag actcaaatat tgctggcaac 1080
ccgaaaaaca atgacgctac catagacaat gagttgacac agattcttaa cgaatataat 1140
atgaacttca acgataattt gggcacatcc acttctggca agaacaaatc tgcttgccca 1200
agttcttttg atgccaatgc tatgacaaag ataaatccaa gtcagcaatt acagcaacag 1260
ctaaaccgag ttcaacacaa gcagctcacc tcgtcacata ataacagtag cactaacatg 1320
aaatccttca acagcgatct ttattcaaga aggcaaagag cttctttacc cataatcgat 1380
gattcactaa gctacgacct ggttaataag caggatgaag atcccaagaa cgatatgctg 1440
ccgaattcaa atttgagttc atctcaacaa tttatcaaac cgtctatgat tctttcagac 1500
aatgcgtccg ttattgcgaa agtggcgact acaggcttga gtaatgatat gccatttttg 1560
acagaggaag gtgaacaaaa tgctaattct actccaaatt tcgatctttc catcactcaa 1620
atgaatatgg ctccattatc gcctgcatca tcatcctcca cgtctcttgc aacaaatcat 1680
ttctatcacc atttcccaca gcagggtcac cataccatga actctaaaat cggttcttcc 1740
cttcggaggc ggaagtctgc tgtgcctttg atgggtacgg tgccgcttac aaatcaacaa 1800
aataatataa gcagtagtag tgtcaactca actggcaatg gtgctggggt tacgaaggaa 1860
agaaggccaa gttacaggag aaaatcaatg acaccgtcca gaagatcaag tgtcgtaata 1920
gaatcaacaa aggaactcga ggagaaaccg ttccactgtc acatttgtcc caagagcttt 1980
aagcgcagcg aacatttgaa aaggcatgtg agatctgttc actctaacga acgaccattt 2040
gcttgtcaca tatgcgataa gaaatttagt agaagcgata atttgtcgca acacatcaag 2100
actcataaaa aacatggaga catttaagct tggagaccta tc 2142
<210> 95
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物YMR037C
<400> 95
gataggtctc gcatgacggt cgaccatg 28
<210> 96
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物YMR037C反向
<400> 96
gataggtctc caagcttaaa tgtctccatg ttttttatga gt 42
<210> 97
<211> 1920
<212> DNA
<213> 酿酒酵母
<400> 97
gactggtctc acatgctagt ctttggacct aatagtagtt tcgttcgtca cgcaaacaag 60
aaacaagaag attcgtctat aatgaacgag ccaaacggat tgatggaccc ggtattgagc 120
acaaccaacg tttctgctac ttcttctaat gacaattctg cgaacaatag catatcttcg 180
ccggaatata cctttggtca attctcaatg gattctccgc atagaacgga cgccactaat 240
actccaattt taacagcgac aactaatacg actgctaata atagtttaat gaatttaaag 300
gataccgcca gtttagctac caactggaag tggaaaaatt ccaataacgc acagttcgtg 360
aatgacggtg agaaacaaag cagtaatgct aatggtaaga aaaatggtgg tgataagata 420
tatagttcag tagccacccc tcaagcttta aatgacgaat tgaaaaactt ggagcaacta 480
gaaaaggtat tttctccaat gaatcctatc aatgacagtc attttaatga aaatatagaa 540
ttatcgccac accaacatgc aacttctccc aagacaaacc ttcttgaggc agaaccttca 600
atatattcca atttgtttct agatgctagg ttaccaaaca acgccaacag tacaacagga 660
ttgaacgaca atgattataa tctagacgat accaataatg ataatactaa tagcatgcaa 720
tcaatcttag aggattttgt atcttcagaa gaagcattga agttcatgcc ggacgctggt 780
cgcgacgcaa gaagatacag cgaggtggtt acctcttcct ttccttctat gacggattct 840
agaaattcga tctctcattc gatagagttt tggaatctca atcacaaaaa tagtagcaac 900
agtaaaccca ctcaacaaat tatccctgaa ggtactgcca ctactgagag gcgtggatca 960
accatttcac ctactaccac tataaacaac tctaatccaa acttcaaatt attagatcat 1020
gacgtttctc aagctctgag cggttatagt atggattttt ctaaggactc tggtataaca 1080
aagccaaaaa gcatttcctc ttctttaaat cgcatctccc atagcagtag caccacaagg 1140
caacagcgtg cctctttgcc cttaattcat gatattgaat cttttgcaaa tgattcggtg 1200
atggcaaatc ctctgtctga ttccgcatca tttctttcag aagaaaatga agatgatgct 1260
tttggtgcgc taaattacaa tagcttagat gcaaccacaa tgtcggcatt cgacaataac 1320
gtagacccct tcaacattct caagtcatct ccggctcagg atcaacagtt tatcaaaccc 1380
tctatgatgt tgtcggataa tgcctctgct gccgctaaat tggcgacttc tggtgttgat 1440
aatatcacac ctacaccagc tttccaaaga agaagctatg atatctcgat gaactcttcg 1500
ttcaaaatac ttcctactag tcaagctcac catgcagctc aacatcatca acaacaacct 1560
actaaacagg caacggtaag cccaaacaca agaagaagaa agtcgtcaag tgttacttta 1620
agtccaacta tttctcataa caacaacaat ggtaaggttc ctgtccaacc tcggaaaagg 1680
aaatctatta ctaccattga ccccaacaac tacgataaaa ataaaccttt caagtgtaaa 1740
gactgtgaga aggcattcag acgcagtgag cacttgaaaa ggcatataag atccgttcat 1800
tcaacggaac gcccttttgc ttgtatgttc tgtgagaaaa aattcagtag aagtgacaat 1860
ttatcacaac atctaaaaac tcacaaaaag cacggtgatt tttgagcttg gagacctatc 1920
<210> 98
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物YKL062W
<400> 98
gactggtctc acatgctagt ctttggacct aatagtag 38
<210> 99
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物YKL062W反向
<400> 99
gataggtctc caagctcaaa aatcaccgtg ctt 33
<210> 100
<211> 885
<212> DNA
<213> 解脂耶氏酵母
<400> 100
gataggtctc acatggacct cgaattggaa attcccgtct tgcattccat ggactcgcac 60
caccaggtgg tggactccca cagactggca cagcaacagt tccagtacca gcagatccac 120
atgctgcagc agacgctgtc acagcagtac ccccacaccc catccaccac accccccatt 180
tacatgctgt cgcctgcgga ctacgagaag gacgccgttt ccatctcacc ggtaatgctg 240
tggcccccct cggcccactc ccaggcctct taccattacg agatgccctc cgttatctcg 300
ccatctcctt ctcccactag atccttctgt aatccgagag agctggaggt tcaggacgag 360
ctcgagcagc ttgaacagca gcccgccgct ctctccgtcg aacatctgtt tgacattgag 420
aactcatcga tcgagtatgc acacgacgag ctgcatgaca cctcttcgtg ctccgactcg 480
cagtcgagct tttcccctca gcagtcccct gcctccccgg cctccactta ctcgcctctc 540
gaggacgagt ttctcaactt ggctggatcc gagttgaaga gcgagcccag cgcggacgac 600
gagaaggatg atgtggacac ggagcttccc cagcagcccg agatcatcat ccctgtgtcg 660
tgccgaggcc gaaagccgtc catcgacgac tccaaaaaga cttttgtctg cacccactgc 720
cagcgtcggt tccggcgcca ggagcatctc aagcgacatt tccgatccct acacactcga 780
gagaagcctt tcaactgcga cacgtgcggc aagaagtttt ctcggtcgga caatctcgcc 840
cagcatatgc gtacgcatcc tcgggactag gctttgagac cagtc 885
<210> 101
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物YALI0B21582
<400> 101
gataggtctc acatggacct cgaattgga 29
<210> 102
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物YALI0B21582反向
<400> 102
gactggtctc aaagcctagt cccgaggatg c 31
<210> 103
<211> 2001
<212> DNA
<213> 黑曲霉
<400> 103
gataggtctc acatggacgg aacatacacc atggcaccta cttcggtgca aggtcaacca 60
tcatttgcat actacgctga ttcgcagcaa agacaacatt tcaccagcca cccctcagat 120
atgcagtcat actatggcca agtgcaggcc ttccagcaac aaccacagca ctgcatgccg 180
gagcagcaga cactctacac tgcccctctc atgaacatgc accagatggc taccaccaat 240
gccttccgtg gtgccatgaa catgactccc attgcctctc ctcagccgtc acacctcaag 300
cccacaattg ttgtgcagca gggctctccc gccctgatgc ctctggacac gaggttcgtc 360
ggtaacgact actacgcatt cccctccacc ccaccactct ccacagctgg aagctctatc 420
agcagcccgc cttctaccag cggcaccctt cacaccccga tcaatgacag cttcttcgct 480
ttcgagaagg tggaaggtgt caaggaggga tgcgagggag acgtccatgc agagattctg 540
gccaatgctg actgggcccg gtctgactcg ccgcctctta cacctggtaa gtcattatct 600
aacccgatgt ccctttttta catggttgca agataggctg cagggagtgg gtgcagccaa 660
cggaaaaggc acggggccgg gcatctaggg ttgtacaggg agactaactc gacttgttct 720
agtgttcatc catccgcctt ccctcaccgc cagccaaaca tccgagcttc tgtcagcgca 780
cagctcttgc ccatcccttt ccccatcgcc atctcccgtg gtccccacat tcgttgccca 840
gcctcaaggt ctgccgaccg agcagtccag ctccgacttc tgtgaccccc gtcagctgac 900
ggttgagtcc tccatcaatg ccacccctgc tgagctgccg cctctgccca cgctctcctg 960
cgatgacgag gagcctcggg tggttctggg cagcgaggcc gtgacccttc ctgtccatga 1020
aaccctctct cccgccttca cctgctcctc ttcggaggac cctctcagca gcctgccgac 1080
ctttgacagc ttctcggacc tggactcgga agatgaattc gtcaaccgcc tggtcgactt 1140
cccccctagt ggcaatgcct actacttggg tgagaagagg cagcgcgtgg gaacgacata 1200
cccccttgag gaagaggaat tcttcagtga gcagagcttc gacgagtctg acgagcaaga 1260
tctctctcag tccagtctcc cttacctggg aagccacgac ttcactggcg tccagacgaa 1320
catcaatgaa gcttcggaag agatgggcaa caagaagagg aacaaccgca agtcgctgaa 1380
gcgggctagt acctcggaca gcgaaacgga ttcgattagc aagaagtcgc agccttcgat 1440
caacagccgt gccaccagca ctgagacaaa cgcctcgaca ccccagactg tccaggcccg 1500
ccacaactcc gatgcgcatt cgtcgtgcgc ttctgaggct cctgctgccc ccgtctcggt 1560
caaccgacgc ggtcgtaagc agtccctgac ggatgacccc tccaagacct tcgtgtgcac 1620
cctctgctcc cgtcgcttcc gtcgccaaga gcacctcaag cgtcactacc gctctctcca 1680
cactcaggac aagcctttcg agtgcaatga gtgcggtaag aagttctcgc ggagcgataa 1740
ccttgcgcag cacgctcgca ctcatgcggg tggctctgtc gtgatgggcg tcatcgacac 1800
cggcaatgcg accccgccaa ccccctatga agaacgagat cccagtacgc tgggaaatgt 1860
tctctacgag gccgccaacg ccgccgctac caagtccaca accagtgagt cggatgagag 1920
ttcctctgac tcgccggttg ccgaccgacg ggcgcccaag aagcgcaagc gcgacagcga 1980
tgcctaggct tggagaccat c 2001
<210> 104
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物An04g03980
<400> 104
gataggtctc acatggacgg aacatacacc 30
<210> 105
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物An04g03980反向
<400> 105
gatggtctcc aagcctaggc atcgctgtc 29
<210> 106
<211> 2068
<212> DNA
<213> 巴斯德毕赤酵母
<400> 106
gatctaggtc tcccatgctg tcgttaaaac catcttggct gactttggcg gcattaatgt 60
atgccatgct attggtcgta gtgccatttg ctaaacctgt tagagctgac gatgtcgaat 120
cttatggaac agtgattggt atcgatttgg gtaccacgta ctcttgtgtc ggtgtgatga 180
agtcgggtcg tgtagaaatt cttgctaatg accaaggtaa cagaatcact ccttcctacg 240
ttagtttcac tgaagatgag agactggttg gtgatgctgc taagaactta gctgcttcta 300
acccaaaaaa caccatcttt gatattaaga gattgatcgg tatgaagtat gatgccccag 360
aggtccaaag agacttgaag cgtctgcctt acactgtcaa gagcaagaac ggccaacctg 420
tcgtttctgt cgagtacaag ggtgaggaga agtctttcac tcctgaggag atttccgcca 480
tggtcttggg taagatgaag ttgatcgctg aggactactt aggaaagaaa gtcactcatg 540
ctgtcgttac cgttccagcc tacttcaacg acgctcaacg tcaagccact aaggatgccg 600
gtctaatcgc cggtttgact gttctgagaa ttgtgaacga gcctaccgcc gctgcccttg 660
cttacggttt ggacaagact ggtgaggaaa gacagatcat cgtctacgac ttgggtggag 720
gaaccttcga tgtttctctg ctttctattg agggtggtgc tttcgaggtt cttgctaccg 780
ccggtgacac ccacttgggt ggtgaggact ttgactacag agttgttcgc cacttcgtta 840
agattttcaa gaagaagcat aacattgaca tcagcaacaa tgataaggct ttaggtaagc 900
tgaagagaga ggtcgaaaag gccaagcgta ctttgtcctc ccagatgact accagaattg 960
agattgactc tttcgtcgac ggtatcgact tctctgagca actgtctaga gctaagtttg 1020
aggagatcaa cattgaatta ttcaagaaaa cactgaaacc agttgaacaa gtcctcaaag 1080
acgctggtgt caagaaatct gaaattgatg acattgtctt ggttggtggt tctaccagaa 1140
ttccaaaggt tcaacaatta ttggaggatt actttgacgg aaagaaggct tctaagggaa 1200
ttaacccaga tgaagctgtc gcatacggtg ctgctgttca ggctggtgtt ttgtctggtg 1260
aggaaggtgt cgatgacatc gtcttgcttg atgtgaaccc cctaactctg ggtatcgaga 1320
ctactggtgg cgttatgact accttaatca acagaaacac tgctatccca actaagaaat 1380
ctcaaatttt ctccactgct gctgacaacc agccaactgt gttgattcaa gtttatgagg 1440
gtgagagagc cttggctaag gacaacaact tgcttggtaa attcgagctg actggtattc 1500
caccagctcc aagaggtact cctcaagttg aggttacttt tgttttagac gctaacggaa 1560
ttttgaaggt gtctgccacc gataagggaa ctggaaaatc cgagtccatc accatcaaca 1620
atgatcgtgg tagattgtcc aaggaggagg ttgaccgtat ggttgaagag gccgagaagt 1680
acgccgctga ggatgctgca ctaagagaaa agattgaggc tagaaacgct ctggagaact 1740
acgctcattc ccttaggaac caagttactg atgactctga aaccgggctt ggttctaaat 1800
tggacgagga cgacaaagag acattgacag atgccatcaa agatacccta gagttcttgg 1860
aagataactt cgacaccgca accaaggaag aattagacga acaaagagaa aagctttcca 1920
agattgctta cccaatcact tctaagctat acggtgctcc agagggtggt actccacctg 1980
gtggtcaagg ttttgacgat gatgatggag actttgacta cgactatgac tatgatcatg 2040
atgagttgta agcttggaga ccaatgac 2068
<210> 107
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr2-1167
<400> 107
gatctaggtc tcccatgctg tcgttaaaac catct 35
<210> 108
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr2-1167反向
<400> 108
gtcattggtc tccaagctta caactcatca tgatcatagt catag 45
<210> 109
<211> 949
<212> DNA
<213> 巴斯德毕赤酵母
<400> 109
gatctaggtc tcacatgccc gtagattctt ctcataagac agctagccca cttccacctc 60
gtaaaagagc aaagacggaa gaagaaaagg agcagcgtcg agtggaacgt atcctacgta 120
ataggagagc ggcccatgct tccagagaga agaaacgtag acacgttgaa tttctggaaa 180
accacgtcgt cgacctggaa tctgcacttc aagaatcagc caaagccact aacaagttga 240
aagaaataca agatatcatt gtttcaaggt tggaagcctt aggtggtacc gtctcagatt 300
tggatttaac agttccggaa gtcgattttc ccaaatcttc tgatttggaa cccatgtctg 360
atctctcaac ttcttcgaaa tcggagaaag catctacatc cactcgcaga tctttgactg 420
aggatctgga cgaagatgac gtcgctgaat atgacgacga agaagaggac gaagagttac 480
ccaggaaaat gaaagtctta aacgacaaaa acaagagcac atctatcaag caggagaagt 540
tgaatgaact tccatctcct ttgtcatccg atttttcaga cgtagatgaa gaaaagtcaa 600
ctctcacaca tttaaagttg caacagcaac aacaacaacc agtagacaat tatgtttcta 660
ctcctttgag tctgccggag gattcagttg attttattaa cccaggtaac ttaaaaatag 720
agtccgatga gaacttcttg ttgagttcaa atactttaca aataaaacac gaaaatgaca 780
ccgactacat tactacagct ccatcaggtt ccatcaatga tttttttaat tcttatgaca 840
ttagcgagtc gaatcggttg catcatccag cagcaccatt taccgctaat gcatttgatt 900
taaatgactt tgtattcttc caggaatagt aggcttcgag accaatgac 949
<210> 110
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr1-0700
<400> 110
gatctaggtc tcacatgccc gtagattctt ctc 33
<210> 111
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr1-0700反向
<400> 111
gtcattggtc tcgaagccta ctattcctgg aagaatacaa ag 42
<210> 112
<211> 918
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的HAC1
<400> 112
atgccagttg atagttcgca caagactgct tctccactgc cacctagaaa gagagctaag 60
actgaggagg aaaaggagca acgtagagtc gagagaatcc tgagaaaccg tagagccgct 120
cacgcctcta gagagaaaaa gagaaggcat gttgaatttc ttgaaaacca cgtcgtcgat 180
ctcgaatctg cccttcaaga gtcagctaaa gctaccaaca agctaaagga aattcaagac 240
attatcgtat ctagactgga ggcacttggt ggtactgttt ctgacctgga tcttacagtt 300
ccagaagttg acttcccaaa atccagtgat ctagaaccta tgtctgatct atctacctca 360
agcaagtctg agaaggcaag cacgtcaacc agacgttccc taactgagga cctggacgaa 420
gatgatgtcg ctgaatacga tgacgaggag gaggatgagg aactgcctag aaaaatgaag 480
gttcttaacg acaaaaacaa gtctacctct atcaaacagg aaaagctcaa cgaactccca 540
tcccctctct cttccgactt ctccgacgtg gacgaggaaa agtctacttt gacccacctg 600
aagttgcaac aacaacagca acaacctgtt gacaactatg tctccactcc tctctcactc 660
ccagaggact cggttgactt catcaacccc ggtaacctta agattgaatc tgacgagaac 720
ttccttctat cctctaatac cttacagatt aagcatgaaa atgatactga ctacattact 780
accgctccat ccggatctat caatgacttc ttcaattctt acgacatttc tgagtccaac 840
agattgcacc acccagctgc accttttaca gccaacgctt ttgacctaaa cgacttcgtg 900
tttttccagg agtaatag 918
<210> 113
<211> 2716
<212> DNA
<213> 巴斯德毕赤酵母
<400> 113
gatctaggtc tcccatgaga acacaaaaga tagtaacagt actttgtttg ctactaaata 60
ctgtgcttgg agctctgttg ggcatcgatt atggtcaaga gtttactaag gctgtcctag 120
tggctcctgg tgtccctttt gaagttatct tgactccaga ctccaaacgt aaagataatt 180
caatgatggc catcaaggaa aattccaaag gtgaaattga gagatattat ggatcctcag 240
ctagttctgt ttgtatcaga aaccctgaaa cttgcttgaa tcatctgaag tcattgatag 300
gtgtttcaat tgatgacgtt tcaactatag attacaagaa gtaccattca ggtgctgaga 360
tggttccatc caaaaataac aggaacacgg ttgcctttaa gttgggctct tctgtatatc 420
ctgtagaaga gatacttgct atgagtttag atgacattaa atctagagct gaagatcatt 480
taaaacacgc ggtgccaggt tcctattcag ttatcagtga tgctgtcatc acagtaccca 540
ctttttttac ccaatcgcaa agactggcct tgaaagatgc tgccgaaatt agtggcttaa 600
aagtcgttgg cttggttgat gacggtatat ctgtggccgt taactatgcc tcttcaaggc 660
agttcaatgg agacaaacaa tatcatatga tctatgacat gggggctggt tctttacagg 720
cgactttggt ttctatatct tccagtgatg atggtggaat tgttattgat gtagaggcta 780
ttgcctatga caagtcgctg ggaggccagt tgttcacaca atctgtttat gacatccttt 840
tgcagaagtt cttgtctgag catccttcct ttagcgagtc cgacttcaac aagaatagta 900
aatctatgtc aaaactttgg caagcggctg aaaaggcaaa gacaattttg agtgcaaaca 960
ctgacacaag agtttccgtt gaatccttat acaatgacat tgactttaga gccacaatag 1020
caagagacga attcgaagat tacaatgcag agcatgttca taggatcact gctcctatca 1080
tcgaggcctt aagtcatcca ttgaatggga atctgacgtc accttttcca ctgaccagtt 1140
taagttcagt aattctcaca ggcgggtcaa caagagtgcc gatggtgaaa aagcacctag 1200
aatctttgct aggatctgaa ttgattgcaa agaatgttaa cgctgatgag tcagccgttt 1260
ttggttctac tctccgtggt gtaactttat cgcaaatgtt caaagcgaaa cagatgaccg 1320
taaatgaaag aagtgtatat gactattgcc taaaagttgg ttcttcagag ataaacgtgt 1380
tcccagttgg cacccctctt gctactaaga aagtggtcga gctggaaaat gtagacagtg 1440
agaaccagct cacgattggg ctctacgaga acggacaatt gtttgccagt catgaggtta 1500
cagacctcaa gaagagtatc aaatctctaa ctcaagaagg taaagagtgt tctaatatta 1560
attacgaggc tacagtcgag ttatctgaga gcagattgct ttctttaact cgtctgcagg 1620
ccaaatgtgc tgacgaggct gaatatttac ctcctgtgga cacagagtct gaggatacta 1680
aatctgaaaa ctcaactact agtgagacta ttgaaaaacc aaacaagaag ctattctatc 1740
ctgtgactat acctactcaa ctgaaatccg ttcacgtgaa accaatgggg tcctctacca 1800
aggtatcttc atctttgaaa atcaaggagt tgaacaagaa ggatgctgta aagagatcga 1860
tcgaagaatt gaagaatcag ctggaatcga aattataccg cgtgcgctcg tatttagagg 1920
atgaggaagt ggttgaaaaa gggccagcat cacaagttga ggctttgtca acactggttg 1980
ctgagaatct tgagtggttg gactatgata gcgacgatgc atcagcaaaa gatatcaggg 2040
aaaaactaaa ttctgtgtca gatagtgttg ccttcatcaa gagctacatt gatctgaacg 2100
atgtcacttt tgataataat cttttcacta cgatttacaa cactacttta aactccatgc 2160
aaaatgttca agaactaatg ttaaacatga gtgaggatgc tctgagttta atgcagcagt 2220
atgagaagga aggtttagac ttcgccaaag aaagtcaaaa gatcaaaata aaatctcctc 2280
ctttatcaga caaagagctt gataatctct ttaacactgt taccgaaaag ttagagcatg 2340
tcagaatgtt gactgaaaag gacactataa gtgatttgcc tagagaggag ctttttaagc 2400
tgtatcaaga attgcagaac tactcttccc gatttgaagc aatcatggcc agtttggaag 2460
atgtacactc tcaaagaatc aaccgtttga cagacaagtt acgcaaacat attgaaaggg 2520
tgagcaatga agcattgaag gcagctctca aggaagctaa acgtcaacaa gaggaggaaa 2580
aaagccacga gcagaatgag ggagaagagc aaagttctgc ttccacttct cacactaatg 2640
aagatataga ggaaccatca gaatcgccta aggttcaaac atcccatgat gagttgtaag 2700
cttggagacc aatgac 2716
<210> 114
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr1-0059
<400> 114
gatctaggtc tcccatgaga acacaaaaga tagtaacagt ac 42
<210> 115
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr1-0059反向
<400> 115
gtcattggtc tccaagctta caactcatca tgggatgttt 40
<210> 116
<211> 1150
<212> DNA
<213> 巴斯德毕赤酵母
<400> 116
gatctaggtc tcccatgaaa gtgacattat ctgtgttagc tattgcctcc caattggtta 60
gaatcgtttg ttcggaagga gaaaatatct gcataggtga ccagtgctat ccgaagaatt 120
ttgaacctga caaggagtgg aaacctgttc aggaaggcca gattatccct ccaggatcac 180
acgtaagaat ggactttaat acacaccaga gagaggcaaa actggtggaa gagaatgagg 240
atatagaccc ctcatcattg ggagtggctg tagtggattc caccggttcg tttgctgatg 300
atcaatcttt ggaaaagatt gagggacttt ccatggaaca actagatgag aagttagaag 360
aactgattga gctttcccat gactacgagt acggatcaga cataatcttg agtgatcagt 420
atatttttgg agtagccggg ctagttccta ctaagacaaa gtttacttct gagttgaagg 480
aaaaggcctt gagaattgtc ggatcatgct tgagaaacaa tgccgatgcg gtagagaaac 540
tactgggaac tgttccaaat actataacca tacaattcat gtcaaaccta gtgggtaaag 600
taaattccac tggagagaat gttgactctg ttgaacagaa acgaatcctt tcaattattg 660
gagctgttat tcctttcaaa attggaaagg tattgtttga agcttgttcg ggaacgcaga 720
agctattact atccttggat aaactggaaa gttcagttca actgagagga taccaaatgt 780
tggacgactt cattcatcac cctgaagagg aacttctctc ttcattgaca gcaaaggaac 840
gattagtaaa gcatattgag ttgattcaat cattttttgc atcaggaaag cattctcttg 900
atatagcaat aaatcgtgag ttattcacta ggctgattgc cttacgaacc aatttagaat 960
ctgccaatcc aaatctatgt aaaccatcaa ctgacttttt gaactggctg atcgacgaaa 1020
ttgaagctac gaaagatacc gatccacact tttcaaaaga gcttaaacat ttacgttttg 1080
aactttttgg gaacccattg gcatctagga aaggtttctc cgatgagtta taagcttgga 1140
gaccaatgac 1150
<210> 117
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr1-0550
<400> 117
gatctaggtc tcccatgaaa gtgacattat ctgtgttagc 40
<210> 118
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr1-0550反向
<400> 118
gtcattggtc tccaagctta taactcatcg gagaaacctt tc 42
<210> 119
<211> 931
<212> DNA
<213> 巴斯德毕赤酵母
<400> 119
gatctaggtc tcccatgaaa ctacaccttg tgattctctg tttgatcact gctgtctact 60
gtttcagtgc tgttgacaga gaaatctttc agctcaacca tgaattacgc caggaatacg 120
gagataattt taatttctat gaatggttga agcttccaaa aggtccctcg tccacgtttg 180
aagatatcga caacgcgtac aagaaactat cccgtaagtt acaccccgat aagataagac 240
agaagaaact atcccaggaa caatttgagc aattgaagaa aaaggctacc gaaagatacc 300
aacaattgag tgctgtggga tccatcttaa gatccgagag caaagagcgt tacgattatt 360
ttgtcaaaca tggattccca gtctataaag gtaacgatta cacctatgcc aagtttagac 420
catccgtttt gctcacaatt ttcatccttt ttgcgttagc tacgttaacc cactttgtct 480
ttatcagatt gtcggccgtg caatctagaa aaagactgag ttcgttgata gaggagaaca 540
aacagctggc ttggccacaa ggtgttcaag atgtcactca agtgaaggac gtcaaagtct 600
ataacgaaca tctacgtaaa tggtttttgg tatgtttcga cggatccgtt cattatgtgg 660
agaacgataa aaccttccat gttgatccgg aagaagttga actcccatct tggcaggaca 720
ctcttccagg taaattaata gtcaagctga taccccagct tgctagaaag ccacgatctc 780
caaaggagat caagaaggaa aatttagatg ataaaaccag aaagacaaaa aaacctacag 840
gggattccaa aactttacct aacggtaaaa ccatttataa agctaccaaa tccggtggac 900
gtagaaggaa ataagcttgg agaccaatga c 931
<210> 120
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr1-0136
<400> 120
gatctaggtc tcccatgaaa ctacaccttg tgattctc 38
<210> 121
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸引物PP7435_Chr1-0136反向
<400> 121
gtcattggtc tccaagctta tttccttcta cgtccacc 38

Claims (45)

1.一种增加真核宿主细胞中重组目标蛋白的产量的方法,所述方法包括在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加,其中所述转录因子至少包含:
a)DNA结合结构域,其包含:
i)SEQ ID NO:1所示的氨基酸序列,或
ii)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和
b)激活结构域。
2.根据权利要求1所述的方法,所述方法包括:
i)将所述宿主细胞工程化以过表达编码至少一种转录因子的至少一种多核苷酸,所述转录因子至少包含:
a)DNA结合结构域,其包含:
a1)SEQ ID NO:1所示的氨基酸序列,或
a2)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和
b)激活结构域,
ii)将所述宿主细胞工程化以包含编码所述目标蛋白的多核苷酸,
iii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白,可选地
iv)从细胞培养物中分离所述目标蛋白,和可选地
v)纯化所述目标蛋白。
3.一种通过真核宿主细胞制备重组目标蛋白的方法,所述方法包括:
i)提供被工程化以过表达编码至少一种转录因子的至少一种多核苷酸的宿主细胞,其中所述宿主细胞进一步包含编码目标蛋白的多核苷酸,其中所述转录因子至少包含:
a)DNA结合结构域,其包含:
a1)SEQ ID NO:1所示的氨基酸序列,或
a2)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,
b)激活结构域,
ii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白,可选地
iii)从细胞培养物中分离所述目标蛋白,和可选地
iv)纯化所述目标蛋白,和可选地
v)修饰所述目标蛋白,和可选地
vi)配制所述目标蛋白。
4.根据权利要求1至3中任一项所述的方法,其中与工程化之前的所述宿主细胞相比,所述转录因子的过表达使模型蛋白scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)的产量增加。
5.根据权利要求1至4中任一项所述的方法,其中将所述编码至少一种转录因子的多核苷酸整合在所述宿主细胞的基因组中或包含在未整合至所述宿主细胞的基因组中的载体或质粒中。
6.根据权利要求1至5中任一项所述的方法,其中所述编码至少一种转录因子的多核苷酸编码异源或同源转录因子。
7.根据权利要求6所述的方法,其中编码异源转录因子的多核苷酸的过表达通过如下实现:
i)交换或修饰与所述编码异源转录因子的多核苷酸可操作地连接的调控序列,或
ii)将处于启动子控制下的一个或多个拷贝的所述编码异源转录因子的多核苷酸引入所述宿主细胞。
8.根据权利要求6所述的方法,其中编码同源转录因子的多核苷酸的过表达通过如下实现:
i)使用启动子,所述启动子驱动所述编码同源转录因子的多核苷酸的表达,
ii)交换或修饰与所述编码同源转录因子的多核苷酸可操作地连接的调控序列,或
iii)将处于启动子控制下的一个或多个拷贝的所述编码同源转录因子的多核苷酸引入所述宿主细胞。
9.根据权利要求1至8中任一项所述的方法,其中所述多核苷酸的过表达通过如下实现:
i)用与所述编码同源转录因子的多核苷酸可操作地连接的不同启动子交换所述同源转录因子的天然启动子,
ii)用更有效的终止子序列交换所述异源和/或同源转录因子的天然终止子序列,
iii)用密码子优化的编码序列交换所述异源和/或同源转录因子的编码序列,所述密码子优化根据所述宿主细胞的密码子选择进行,
iv)用更有效的调控元件交换所述同源转录因子的天然正调控元件,
v)引入另一正调控元件,所述正调控元件不存在于所述同源转录因子的天然表达盒中,
vi)使负调控元件缺失,所述负调控元件通常存在于所述同源转录因子的天然表达盒中,或
vii)引入一个或多个拷贝的所述编码异源和/或同源转录因子的多核苷酸,或其组合。
10.根据权利要求1至9中任一项所述的方法,其中所述转录因子包含SEQ ID NOs:15-27所示的氨基酸序列。
11.根据权利要求1至10中任一项所述的方法,其中所述转录因子另外包含核定位信号。
12.根据权利要求11所述的方法,其中所述核定位信号为同源或异源核定位信号。
13.根据权利要求1至12中任一项所述的方法,其中所述转录因子不刺激用于表达所述目的蛋白的启动子。
14.根据前述权利要求中任一项所述的方法,其中所述真核宿主细胞为真菌宿主细胞,优选地为选自巴斯德毕赤酵母(Pichia pastoris)、多形汉森酵母(Hansenulapolymorpha)、里氏木霉(Trichoderma reesei)、黑曲霉(Aspergillus niger)、酿酒酵母(Saccharomyces cerevisiae)、乳酸克鲁维酵母(Kluyveromyces lactis)、解脂耶氏酵母(Yarrowia lipolytica)、甲醇毕赤酵母(Pichia methanolica)、博伊丁假丝酵母(Candidaboidinii)、孔玛氏酵母属种(Komagataella spp.)和粟酒裂殖酵母(Schizosaccharomycespombe)的酵母宿主细胞。
15.根据前述权利要求中任一项所述的方法,其中所述重组目标蛋白为酶、治疗性蛋白、食品添加剂或饲料添加剂。
16.根据权利要求15所述的方法,其中所述治疗性蛋白为抗原结合蛋白。
17.根据权利要求1至16中任一项所述的方法,其进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少一种ER辅助蛋白的至少一种多核苷酸。
18.根据权利要求17所述的方法,其中所述ER辅助蛋白具有SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性。
19.根据权利要求1至16中任一项所述的方法,其进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少两种ER辅助蛋白的至少两种多核苷酸。
20.根据权利要求19所述的方法,其中:
a)第一ER辅助蛋白具有SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性,和
b)第二ER辅助蛋白具有:
i)SEQ ID NO:37所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:37所示的氨基酸序列具有至少25%的序列同一性,或
ii)SEQ ID NO:47所示的氨基酸序列或其功能同系物,其中所述功能同系物与SEQ IDNO:47所示的氨基酸序列具有至少20%的序列同一性,和可选地
c)第三ER辅助蛋白具有:
i)SEQ ID NO:55所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:55所示的氨基酸序列具有至少25%的序列同一性。
21.根据权利要求1至16中任一项所述的方法,其进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码一种另外的转录因子的至少一种多核苷酸。
22.根据权利要求21所述的方法,其中所述另外的转录因子至少包含:
a)DNA结合结构域,其包含:
a1)SEQ ID NO:65所示的氨基酸序列,或
a2)SEQ ID NO:65所示的氨基酸序列的功能同系物,其与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性,和
b)激活结构域。
23.根据权利要求22所述的方法,其中所述另外的转录因子包含SEQ ID NOs:74-82所示的氨基酸序列。
24.根据权利要求21至23中任一项所述的方法,其中所述另外的转录因子不刺激用于表达目标蛋白的启动子。
25.一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,其中所述转录因子至少包含:
a)DNA结合结构域,其包含:
i)SEQ ID NO:1所示的氨基酸序列,或
ii)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和
b)激活结构域。
26.根据权利要求25所述的重组真核宿主细胞,其中与工程化之前的所述宿主细胞相比,所述转录因子的过表达使模型蛋白scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)的产量增加。
27.根据权利要求25或26所述的重组真核宿主细胞,其中将所述编码至少一种转录因子的多核苷酸整合在所述宿主细胞的基因组中或包含在未整合至所述宿主细胞的基因组中的载体或质粒中。
28.根据权利要求25至27中任一项所述的重组真核宿主细胞,其中所述编码至少一种转录因子的多核苷酸编码异源或同源转录因子。
29.根据权利要求28所述的重组真核宿主细胞,其中编码异源转录因子的多核苷酸的过表达通过如下实现:
i)交换或修饰与所述编码异源转录因子的多核苷酸可操作地连接的调控序列,或
ii)将处于启动子控制下的一个或多个拷贝的所述编码异源转录因子的多核苷酸引入所述宿主细胞。
30.根据权利要求28所述的重组真核宿主细胞,其中编码同源转录因子的多核苷酸的过表达通过如下实现:
i)使用启动子,所述启动子驱动所述编码同源转录因子的多核苷酸的表达,
ii)交换或修饰与所述编码同源转录因子的多核苷酸可操作地连接的调控序列,或
iii)将处于启动子控制下的一个或多个拷贝的所述编码同源转录因子的多核苷酸引入所述宿主细胞。
31.根据权利要求25至30中任一项所述的重组真核宿主细胞,其中所述多核苷酸的过表达通过如下实现:
i)用与所述编码同源转录因子的多核苷酸可操作地连接的不同启动子交换所述异源和/或同源转录因子的天然启动子,
ii)用更有效的终止子序列交换所述异源和/或同源转录因子的天然终止子序列,
iii)用密码子优化的编码序列交换所述异源和/或同源转录因子的编码序列,所述密码子优化根据所述宿主细胞的密码子选择进行,
iv)用更有效的调控元件交换所述异源和/或同源转录因子的天然正调控元件,
v)引入另一正调控元件,所述正调控元件不存在于所述异源和/或同源转录因子的天然表达盒中,
vi)使负调控元件缺失,所述负调控元件通常存在于所述异源和/或同源转录因子的天然表达盒中,或
vii)引入一个或多个拷贝的所述编码异源和/或同源转录因子的多核苷酸,或其组合。
32.根据权利要求25至31中任一项所述的重组真核宿主细胞,其中所述转录因子包含SEQ ID NOs:15-27所示的氨基酸序列。
33.根据权利要求25至32中任一项所述的重组真核宿主细胞,其中所述转录因子另外包含核定位信号。
34.根据权利要求33所述的重组真核宿主细胞,其中所述核定位信号为同源或异源核定位信号。
35.根据权利要求25至34中任一项所述的重组真核宿主细胞,其中所述真核宿主细胞为真菌宿主细胞,优选地为真菌宿主细胞,更优选地为选自巴斯德毕赤酵母(Pichiapastoris)、多形汉森酵母(Hansenula polymorpha)、里氏木霉(Trichoderma reesei)、黑曲霉(Aspergillus niger)、酿酒酵母(Saccharomyces cerevisiae)、乳酸克鲁维酵母(Kluyveromyces lactis)、解脂耶氏酵母(Yarrowia lipolytica)、甲醇毕赤酵母(Pichiamethanolica)、博伊丁假丝酵母(Candida boidinii)、孔玛氏酵母属种(Komagataellaspp.)和粟酒裂殖酵母(Schizosaccharomyces pombe)的酵母宿主细胞。
36.根据权利要求25至35中任一项所述的重组真核宿主细胞,其中所述重组目标蛋白为酶、治疗性蛋白、食品添加剂或饲料添加剂。
37.根据权利要求36所述的重组真核宿主细胞,其中所述治疗性蛋白为抗原结合蛋白。
38.根据权利要求25至37中任一项所述的重组真核宿主细胞,其中将所述宿主细胞另外工程化以过表达编码至少一种ER辅助蛋白的至少一种多核苷酸。
39.根据权利要求38所述的重组真核宿主细胞,其中所述辅助蛋白具有SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性。
40.根据权利要求25至37中任一项所述的重组真核宿主细胞,其中将所述宿主细胞另外工程化以过表达编码至少两种ER辅助蛋白的至少两种多核苷酸。
41.根据权利要求40所述的重组真核宿主细胞,其中:
a)第一ER辅助蛋白具有SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性,和
b)第二ER辅助蛋白具有:
i)SEQ ID NO:37所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:37所示的氨基酸序列具有至少25%的序列同一性,或
ii)SEQ ID NO:47所示的氨基酸序列或其功能同系物,其中所述功能同系物与SEQ IDNO:47所示的氨基酸序列具有至少20%的序列同一性,和/或
c)第三ER辅助蛋白具有:
i)SEQ ID NO:55所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:55所示的氨基酸序列具有至少25%的序列同一性。
42.根据权利要求25至37中任一项所述的重组真核宿主细胞,其中将所述宿主细胞另外工程化以过表达编码一种另外的转录因子的至少一种多核苷酸。
43.根据权利要求42所述的重组真核宿主细胞,其中所述另外的转录因子至少包含:
a)DNA结合结构域,其包含:
a1)SEQ ID NO:65所示的氨基酸序列,或
a2)SEQ ID NO:65所示的氨基酸序列的功能同系物,其与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性,和
b)激活结构域。
44.根据权利要求42至43中任一项所述的重组真核宿主细胞,其中所述另外的转录因子包含SEQ ID NOs:74-82所示的氨基酸序列。
45.权利要求25至44中任一项所述的重组真核宿主细胞用于制备重组目标蛋白的用途。
CN201980056449.0A 2018-06-27 2019-06-27 通过使用转录因子来增加蛋白质表达的手段和方法 Pending CN112955547A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18180164.8 2018-06-27
EP18180164 2018-06-27
PCT/EP2019/067133 WO2020002494A1 (en) 2018-06-27 2019-06-27 Means and methods for increased protein expression by use of transcription factors

Publications (1)

Publication Number Publication Date
CN112955547A true CN112955547A (zh) 2021-06-11

Family

ID=62916411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980056449.0A Pending CN112955547A (zh) 2018-06-27 2019-06-27 通过使用转录因子来增加蛋白质表达的手段和方法

Country Status (9)

Country Link
US (1) US20210269811A1 (zh)
EP (1) EP3814491A1 (zh)
JP (1) JP2021528985A (zh)
KR (1) KR20210032972A (zh)
CN (1) CN112955547A (zh)
AU (1) AU2019294515A1 (zh)
CA (1) CA3103988A1 (zh)
SG (1) SG11202012529VA (zh)
WO (1) WO2020002494A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114657190A (zh) * 2022-04-06 2022-06-24 暨南大学 Msn2p作为负调控因子在提高宿主细胞中蛋白表达中的应用
CN114836461A (zh) * 2022-05-31 2022-08-02 华南理工大学 表达胶原蛋白酶的重组质粒、酵母菌株及其发酵培养基和发酵培养方法
CN117777275A (zh) * 2024-02-23 2024-03-29 北京国科星联科技有限公司 一种促进人乳铁蛋白在马克斯克鲁维酵母中分泌表达的方法
CN117777275B (zh) * 2024-02-23 2024-05-31 北京国科星联科技有限公司 一种促进人乳铁蛋白在马克斯克鲁维酵母中分泌表达的方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021198431A1 (en) 2020-04-01 2021-10-07 Lonza Ltd Helper factors for expressing proteins in yeast
CA3175683A1 (en) * 2020-04-29 2021-11-04 Xueyang FENG Compositions and methods for enhancing recombinant biosynthesis of cannabinoids
CN115725632B (zh) * 2022-07-26 2023-12-22 深圳技术大学 一种Aomsn2过表达米曲霉工程菌及其构建方法与应用

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050130306A1 (en) * 2003-12-10 2005-06-16 Richard Voellmy Viral vectors whose replication and, optionally, passenger gene are controlled by a gene switch activated by heat in the presence or absence of a small molecule regulator
US20060100416A1 (en) * 2001-02-20 2006-05-11 Palli Subba R Novel substitution mutant receptors and their use in an nuclear receptor-based inducible gene expression system
CN101679992A (zh) * 2007-04-20 2010-03-24 波利门科学生物免疫研究有限公司 酵母菌表达系统
US20130244243A1 (en) * 2012-03-15 2013-09-19 Takashi Matsuyama Method for producing expression product of exogenous gene in yeast, regulator of expression in yeast, and use thereof
CN104031854A (zh) * 2014-06-20 2014-09-10 广西科学院 一株提高对乙醇耐受性的酿酒酵母基因工程菌株及其构建方法
WO2017025586A1 (en) * 2015-08-13 2017-02-16 Glykos Finland Oy Regulatory protein deficient trichoderma cells and methods of use thereof
CN106604986A (zh) * 2014-04-17 2017-04-26 贝林格尔·英格海姆Rcv两合公司 用于表达目标蛋白的重组宿主细胞
CN106661541A (zh) * 2014-04-17 2017-05-10 贝林格尔·英格海姆Rcv两合公司 被工程化为过表达辅助蛋白的重组宿主细胞
CN107267529A (zh) * 2017-07-20 2017-10-20 昆明理工大学 一种锌指蛋白转录因子基因RkMSN4及其应用

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4601893A (en) 1984-02-08 1986-07-22 Pfizer Inc. Laminate device for controlled and prolonged release of substances to an ambient environment and method of use
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
DE4027453A1 (de) 1990-08-30 1992-03-05 Degussa Neue plasmide aus corynebacterium glutamicum und davon abgeleitete plasmidvektoren
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
DE4440118C1 (de) 1994-11-11 1995-11-09 Forschungszentrum Juelich Gmbh Die Genexpression in coryneformen Bakterien regulierende DNA
JPH10229891A (ja) 1997-02-20 1998-09-02 Mitsubishi Rayon Co Ltd マロン酸誘導体の製造法
GB9704162D0 (en) * 1997-02-28 1997-04-16 Medical Res Council Assay methods and means
US6949356B1 (en) * 1999-10-20 2005-09-27 Microbia, Inc. Methods for improving secondary metabolite production in fungi
JP2003000240A (ja) * 2001-06-22 2003-01-07 National Research Inst Of Brewing 麹菌の固体培養発現遺伝子を制御する転写因子をコードするdna
ATE375388T1 (de) 2001-07-27 2007-10-15 Us Gov Health & Human Serv Systeme zur stellengerichteten in-vivo-mutagenese mit oligonukleotiden
WO2005040212A2 (en) * 2003-10-24 2005-05-06 Istituto Di Ricerche Di Biologia Molecolare P Angeletti Spa Orthogonal gene switches
SI22056A (sl) * 2005-05-05 2006-12-31 Kemijski Institut Visoko-produkcijski rekombinantni sevi kvasovk s spremenjeno galaktozno regulacijo transkripcije
AU2007299219A1 (en) * 2006-04-05 2008-03-27 Metanomics Gmbh Process for the production of a fine chemical
EP2258854A1 (en) * 2009-05-20 2010-12-08 FH Campus Wien Eukaryotic host cell comprising an expression enhancer
JP5585952B2 (ja) * 2009-12-08 2014-09-10 独立行政法人酒類総合研究所 エタノールの製造方法
CN102643852B (zh) * 2011-02-28 2015-04-08 华东理工大学 光可控的基因表达系统
US20220025001A1 (en) * 2016-04-28 2022-01-27 The Trustees Of Dartmouth College Nucleic acid constructs for co-expression of chimeric antigen receptor and transcription factor, cells containing and therapeutic use thereof

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060100416A1 (en) * 2001-02-20 2006-05-11 Palli Subba R Novel substitution mutant receptors and their use in an nuclear receptor-based inducible gene expression system
US20050130306A1 (en) * 2003-12-10 2005-06-16 Richard Voellmy Viral vectors whose replication and, optionally, passenger gene are controlled by a gene switch activated by heat in the presence or absence of a small molecule regulator
CN101679992A (zh) * 2007-04-20 2010-03-24 波利门科学生物免疫研究有限公司 酵母菌表达系统
US20130244243A1 (en) * 2012-03-15 2013-09-19 Takashi Matsuyama Method for producing expression product of exogenous gene in yeast, regulator of expression in yeast, and use thereof
CN106604986A (zh) * 2014-04-17 2017-04-26 贝林格尔·英格海姆Rcv两合公司 用于表达目标蛋白的重组宿主细胞
CN106661541A (zh) * 2014-04-17 2017-05-10 贝林格尔·英格海姆Rcv两合公司 被工程化为过表达辅助蛋白的重组宿主细胞
CN104031854A (zh) * 2014-06-20 2014-09-10 广西科学院 一株提高对乙醇耐受性的酿酒酵母基因工程菌株及其构建方法
WO2017025586A1 (en) * 2015-08-13 2017-02-16 Glykos Finland Oy Regulatory protein deficient trichoderma cells and methods of use thereof
CN107267529A (zh) * 2017-07-20 2017-10-20 昆明理工大学 一种锌指蛋白转录因子基因RkMSN4及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CARISSA L. YOUNG 等: "Protein folding and secretion: mechanistic insights advancing recombinant protein production in S. cerevisiae", 《CURR OPIN BIOTECHNOL.》, pages 2 *
LOVE,K.R. 等: "ACCESSION No. ANZ75234.1 BA75_02431T0 [Komagataella pastoris]", 《GENBANK数据库》 *
秦艳 等: "乙醇耐受性提高的酿酒酵母基因工程菌株的构建", 《可再生能源》, vol. 34, no. 7, pages 1096 - 1100 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114657190A (zh) * 2022-04-06 2022-06-24 暨南大学 Msn2p作为负调控因子在提高宿主细胞中蛋白表达中的应用
CN114657190B (zh) * 2022-04-06 2023-08-29 暨南大学 Msn2p作为负调控因子在提高宿主细胞中蛋白表达中的应用
CN114836461A (zh) * 2022-05-31 2022-08-02 华南理工大学 表达胶原蛋白酶的重组质粒、酵母菌株及其发酵培养基和发酵培养方法
CN114836461B (zh) * 2022-05-31 2024-03-29 华南理工大学 表达胶原蛋白酶的重组质粒、酵母菌株及其发酵培养基和发酵培养方法
CN117777275A (zh) * 2024-02-23 2024-03-29 北京国科星联科技有限公司 一种促进人乳铁蛋白在马克斯克鲁维酵母中分泌表达的方法
CN117777275B (zh) * 2024-02-23 2024-05-31 北京国科星联科技有限公司 一种促进人乳铁蛋白在马克斯克鲁维酵母中分泌表达的方法

Also Published As

Publication number Publication date
EP3814491A1 (en) 2021-05-05
SG11202012529VA (en) 2021-01-28
AU2019294515A1 (en) 2021-01-14
CA3103988A1 (en) 2020-01-02
KR20210032972A (ko) 2021-03-25
WO2020002494A1 (en) 2020-01-02
JP2021528985A (ja) 2021-10-28
US20210269811A1 (en) 2021-09-02

Similar Documents

Publication Publication Date Title
US11359223B2 (en) Expression sequences
CN112955547A (zh) 通过使用转录因子来增加蛋白质表达的手段和方法
KR102373954B1 (ko) 보조 단백질을 과발현하도록 조작된 재조합 숙주세포
KR102291978B1 (ko) 목적 단백질의 발현을 위한 재조합 숙주세포
KR102495283B1 (ko) 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산
JP5662363B2 (ja) 難発現性タンパク質の分泌のためのタンパク質融合因子(tfp)を明らかにする方法、タンパク質融合因子(tfp)ライブラリーを製造する方法、及び難発現性タンパク質の組み換え的生産方法
US20240141363A1 (en) Signal peptides for increased protein secretion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination