CN117467020A

CN117467020A - 一种嵌合型转录激活因子及其应用

Info

Publication number: CN117467020A
Application number: CN202310940429.8A
Authority: CN
Inventors: 林洁; 白挨玺; 郑斐
Original assignee: Nanjing Bestzyme Bio Engineering Co ltd
Current assignee: Nanjing Bestzyme Bio Engineering Co ltd
Priority date: 2022-07-29
Filing date: 2023-07-28
Publication date: 2024-01-30
Also published as: WO2024022474A1

Abstract

本文提供了用于甲醇诱导型启动子的嵌合型转录激活因子，其至少包括第一部分和第二部分，其中：1)所述第一部分包括：i)DNA结合结构域；或ii)DNA结合结构域和第一转录激活结构域；以及2)所述第二部分包括至少一个第二转录激活结构域。本文还提供了所述嵌合型转录激活因子在宿主细胞中增强外源蛋白的表达量的应用。

Description

一种嵌合型转录激活因子及其应用

相关申请的交叉引用

本申请要求2022年7月29日提交的中国专利申请CN202210910746.0的优先权，在此通过引用将其全文并入本文。

技术领域

本文涉及嵌合型转录激活因子，尤其是能够促进毕赤酵母AOX1启动子转录的嵌合型转录激活因子。本文还涉及该嵌合型转录激活因子在毕赤酵母中增强目的蛋白(如血红蛋白)表达的应用。

背景技术

血红蛋白是一类存在于原核和真核细胞中的以血红素为辅基的含铁金属蛋白，在生物体内具有运输和储存氧、调节胞内pH值、调控生理代谢等诸多重要功能。近年来，血红蛋白已经被应用于急诊医学(作为无细胞氧载体)、医疗保健(作为铁补给剂)以及食品加工(人造肉的食品级着色和调味剂)等领域。但血红蛋白的获取依然需要依靠从血液或植物组织中提取，提取法不仅费时低效、并且所用化学试剂还易造成环境污染。因此，以微生物细胞工厂为平台来合成不同来源的血红蛋白已经成为近年来的研究热点。

毕赤酵母(Pichia pastoris)是常用的高效蛋白表达系统，具有表达量高、低蛋白糖基化和高密度培养等优势，被广泛应用于食品和制药领域。毕赤酵母能够利用甲醇作为唯一碳源进行生长，其甲醇利用途径中的醇氧化酶AOX1，占毕赤酵母表达总蛋白的30％，因此AOX1启动子是非常强的甲醇诱导型启动子，常被用来实现异源蛋白的高效表达。已有报道毕赤酵母甲醇代谢途径中重要的转录激活因子有3个，分别是Mxr1、Mit1和Prm1。这3个转录因子结合在AOX1启动子的不同基序上，协同调控转录激活。

已有专利US10273492报道在毕赤酵母中通过AOX1启动子与Mxr1编码序列连接以表达Mxr1，能够提高豆血红蛋白表达。但为了降低成本，需要进一步提高表达量。

发明内容

在一方面，本文提供了嵌合型转录激活因子，其至少包括第一部分和第二部分，其中：

1)所述第一部分包括：

i)DNA结合结构域；或

ii)DNA结合结构域和第一转录激活结构域；以及

2)所述第二部分包括至少一个第二转录激活结构域。

在一些实施方案中，所述第一部分的C末端直接或通过连接分子间接与所述第二部分的N末端连接。

在一些实施方案中，所述DNA结合结构域和所述第二转录激活结构域来自不同的转录激活因子。

在一些实施方案中，所述DNA结合结构域和所述第一转录激活结构域来自相同的转录激活因子。

在一些实施方案中，所述DNA结合结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体，优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。

在一些实施方案中，所述第一转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体，优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。

在一些实施方案中，所述转录激活因子Mxr1包括SEQ ID NO：10所示序列；所述转录激活因子Mit1包括SEQ ID NO：11所示序列；所述转录激活因子Prm1包括SEQ ID NO：12所示序列。

在一些实施方案中，所述DNA结合结构域包括所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1的第1-104位氨基酸或所述转录激活因子Prm1的第1-89位氨基酸。

在一些实施方案中，所述DNA结合结构域与所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1的第1-104位氨基酸或所述转录激活因子Prm1的第1-89位氨基酸具有至少50％、60％、70％、80％、90％、92％、95％、98％、或99％序列一致性。

在一些实施方案中，所述第一转录激活结构域包括所述转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。

在一些实施方案中，所述第一转录激活结构域与所述转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸具有至少50％、60％、70％、80％、90％、92％、95％、98％、或99％序列一致性。

在一些实施方案中，所述第一部分包括所述转录激活因子Mxr1、所述转录激活因子Mxr1的第1-400位氨基酸、所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1、所述转录激活因子Mit1的第1-104位氨基酸、所述转录激活因子Prm1或所述转录激活因子Prm1的第1-89位氨基酸。

在一些实施方案中，所述第二转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体，优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。

在一些实施方案中，所述第二转录激活结构域包括转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。

在一些实施方案中，所述第二转录激活结构域与所述转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸具有至少50％、60％、70％、80％、90％、92％、95％、98％、或99％序列一致性。

在一些实施方案中，所述第二部分包括转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。

在一些实施方案中，所述嵌合型转录激活因子包括SEQ ID NO：14-25任一项所示序列。

另一方面，本文提供了分离的核酸分子，其包括上述嵌合型转录激活因子的编码核酸序列。

另一方面，本文提供了表达载体，其包括上述核酸分子。

在一些实施方案中，所述表达载体在所述表达载体中所述编码核酸序列与甲醇诱导型启动子可操作地连接。

在一些实施方案中，所述甲醇诱导型启动子包括AOX1、DAS1、DAS2、CAT1、PMP20启动子或它们的突变体，优选AOX1启动子。

另一方面，本文提供了宿主细胞，其包括上述核酸分子或表达载体。

另一方面，本文提供了宿主细胞，其表达上述嵌合型转录激活因子。

在一些实施方案中，所述宿主细胞还包括编码与甲醇诱导型启动子可操作地连接的异源多肽的核酸序列。

在一些实施方案中，所述异源多肽来自PF00042球蛋白家族。

在一些实施方案中，所述异源多肽为血红蛋白，优选大豆血红蛋白LegH或牛肌红蛋白。

在一些实施方案中，所述异源多肽包括SEQ ID NO：9或SEQ ID NO：26所示序列。

在一些实施方案中，所述宿主细胞还包括编码可与所述甲醇诱导型启动子可操作地连接的参与血红素生物合成途径的至少一种多肽。

在一些实施方案中，所述宿主细胞为酵母细胞，优选毕赤酵母，更优选毕赤酵母X-33菌株。

另一方面，本文提供了制备目的蛋白的方法，包括培养上述宿主细胞并分离所述目的蛋白。

在一些实施方案中，所述宿主细胞为毕赤酵母，在培养所述宿主细胞过程中包括向培养液中添加甲醇。

在一些实施方案中，所述目的蛋白为来自PF00042球蛋白家族的蛋白。

在一些实施方案中，所述目的蛋白为血红蛋白，优选大豆血红蛋白LegH或牛肌红蛋白。

附图说明

图1为血红素生物合成途径示意图。

图2为构建大豆血红蛋白表达菌株的质粒示意图。

图3为各菌株摇瓶发酵的SDS-PAGE凝胶图。M：Marker；1-2:TF624；3-5：TF625；6：TF626；7：TF627；8：TF628；9-10：TF629；11-12：M202；13：TF720；14：TF721；15-16：TF722；17-18：TF723；19-20：TF724；21-22：TF725；23：TF726；24：TF727；25：TF728；26：TF729；27-28：TF730；29：TF731；30-31：L528。

图4为显示各菌株摇瓶发酵后发酵液颜色的照片。

图5为pUC57-pAOX1-Mxr1-hph表达质粒示意图。

具体实施方式

除非另有说明，本文使用的所有技术和科学术语具有本领域普通技术人员所通常理解的含义。

术语“或”是指列举的可选择要素中的单个要素，除非上下文明确地另外指出。术语“和/或”是指所列举的可选择要素中的任意一个、任意两个、任意三个、任意更多个或其全部。

本文所用术语“约”表示给定数值的±10％范围内的值。

本文所用术语“包括”、“含有”、“具有”以及类似的表述表示不排除未列举的要素。这些术语也包括仅由所列举的要素组成的情形。

“启动子(promoter)”是RNA聚合酶识别、结合和开始转录的一段DNA序列，它含有RNA聚合酶特异性结合和转录起始所需的保守序列，多数位于结构基因转录起始点的上游，启动子本身不被转录。常见启动子的实例包括但不限于CMV、EF1A、CAG、CBh、SFFV、T7启动子等。启动子可包括核心启动子和调控序列。核心启动子意指起始转录所需的最低限度序列，例如称为TATA盒的序列，该TATA盒是编码蛋白质的基因中的大多数启动子所共有的；调控序列可包括转录激活因子或阻遏物可识别和结合的DNA片段，在它们与调控序列部分结合后可影响启动子的转录起始速率。

“诱导型启动子”，也称为“调控型启动子”，指细胞或组织响应内源或外源刺激的存在例如通过化合物(化学诱导剂)处理，或响应环境(营养物质或碳源变化)、激素或发育信号等，选择性表达编码序列或功能RNA的启动子。换言之，诱导型启动子在特定条件下才启动(或增强)与其可操作地连接的编码序列的转录。诱导型启动子的一个实例为毕赤酵母的醇氧化酶AOX1，其在培养基中存在甲醇时才激活该启动子。在本文中，将由于甲醇的存在才启动相关基因表达的启动子称为甲醇诱导型启动子。甲醇诱导型启动子的实例包括AOX1、DAS1、DAS2、CAT1或PMP20启动子，尤其是AOX1启动子。与诱导型启动子相对应的是“组成型启动子”，其相对稳定地进行相关基因的表达。

“可操作地连接”指调控序列与其调控对象的连接方式使得调控序列能够对其调控对象发挥作用。例如，启动子与目的基因“可操作地连接”指启动子可驱动目的基因从准确起始位点的开始转录；调控序列与核心启动子“可操作地连接”指调控序列可控制核心启动子的转录起始速率。

“连接分子”是指一段短肽序列，能够将两个或多个蛋白质结构域连接起来，并保持蛋白质结构域之间某种最小距离或其他空间关系，此外一般没有特定的生物活性。常见的连接分子根据结构可以分为三类：柔性连接分子、刚性连接分子和可被切割的连接分子。本发明中不可以使用可被切割的连接分子。本发明中使用的是通常胞内不可被切割的连接分子。柔性连接分子通常包含非极性氨基酸如甘氨酸或极性氨基酸如丝氨酸或苏氨酸。常见的柔性连接分子包括：(GGGGS)_n(SEQ ID NO：27)、(G)_n、(G)₈、GSAGSAAGSGEF(SEQ ID NO：28)、KESGSVSSEQLAQFRSLD(SEQ ID NO：29)或EGKSSGSGSESKST(SEQ ID NO：30)，其中n代表前面括号中氨基酸重复的个数。刚性连接分子通常含有α-螺旋结构或者含有多个脯氨酸，以形成相对刚性的结构。常见的刚性连接分子包括：(EAAAK)_n(SEQ ID NO：31)或(XP)_n，其中n代表前面括号中氨基酸重复的个数，X代表任何氨基酸，优选丙氨酸、赖氨酸或谷氨酸。

“转录激活因子识别结合位点”指DNA分子上的一段核苷酸序列，转录因子可识别并与其结合。转录激活因子与其结合后，有助于与其他蛋白(如RNA聚合酶)一起形成转录起始复合物，启动转录过程。“转录激活因子识别结合位点”可认为是启动子的调控序列的一部分。

“结构域(domain)”指蛋白或多肽中介于二级和三级结构之间的一种结构层次，为可区分开的紧密球状结构区域。对于较小的蛋白或蛋白亚基来说，结构域和它的三级结构往往是一个意思，也就是说这些蛋白或亚基是单结构域。对于较大的蛋白结构域，可能或包括两个或更多个结构域。结构域自身可以是紧密装配的，但结构域与结构域之间关系相对松懈。结构域与结构域之间常常有一段长短不等的肽链相连，形成所谓铰链区。不同蛋白中结构域的数目不同，同一蛋白质分子中的几个结构域彼此相似或很不相同。常见结构域的氨基酸残基数在100-400个之间，最小的结构域只有40-50个氨基酸残基，大的结构域可超过400个氨基酸残基。

“转录激活因子”在本文中指可以与启动子上的部分DNA序列结合并由此激活或增强启动子的转录活性的蛋白(包括融合蛋白)或多肽。转录激活因子可以单独地或者与其他蛋白或多肽结合后激活或增强启动子的转录活性。在一些实例中，转录激活因子可包括至少两个结构域：DNA结合结构域，用于与启动子上的调控序列结合；转录激活结构域，用于激活或增强启动子的转录起始速率。酵母细胞中的转录激活因子例如可包括Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1等。在一些实施例中，转录激活因子可与甲醇诱导型启动子可操作性地连接，甲醇诱导型启动子包括AOX1、DAS1、DAS2、CAT1或PMP20启动子，尤其是AOX1启动子。

“嵌合型转录激活因子”在本文中指这样的转录激活因子，其包括DNA结合结构域和一个或更多个转录激活结构域，其中至少一个结构域与另外的结构域并非天然存在于同一转录激活因子中。例如，转录激活因子X包括DNA结合结构域A1和转录激活B1，转录激活因子Y包括DNA结合结构域A2和转录激活B2，则包括A1结构域和B2结构域的转录激活因子、包括A1结构域、B1结构域和B2结构域的转录激活因子、包括A2结构域和B1结构域的转录激活因子、包括A2结构域、B1结构域和B2结构域的转录激活因子都可以认为是嵌合型转录激活因子。在本文的一些实施方案中，嵌合型转录激活因子所包括的DNA结合结构域和转录激活结构域是来自毕赤酵母的转录激活因子。可以设想，转录因子可以在广泛存在于不同的宿主细胞中。因此，这些DNA结合结构域和转录激活结构域有可能取自或衍生自其它原核生物或真核生物，而不是采用特定种或属的天然序列。优选地，这些转录激活因子序列可以取自或衍生自真菌宿主细胞，更优选地取自或衍生自比如巴斯德毕赤酵母、多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种和粟酒裂殖酵母的酵母宿主细胞等。在一些实施方案中，嵌合型转录激活因子的DNA结合结构域和转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2或Mpp1。优选地，嵌合型转录激活因子的DNA结合结构域包括转录激活因子Mxr1的第1-91位氨基酸、转录激活因子Mit1的第1-104位氨基酸或转录激活因子Prm1的第1-89位氨基酸，或为它们的功能性变体。优选地，转录激活结构域包括转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、转录激活因子Mit1的第105-888位氨基酸、转录激活因子Prm1的第90-989位氨基酸，或为它们的功能性变体。

“功能性变体”和“突变体”在本文中可互换使用，指在原始序列(例如天然序列)或本文提供的序列基础上包括了少许改动(例如氨基酸或核苷酸删除、添加或替换)后获得的蛋白或核苷酸变体，其仍然保留了亲本序列的全部或至少部分功能。例如，功能性变体可以与亲本序列具有至少约50％、60％、70％、80％、90％、92％、95％、98％、或99％序列一致性，并且可保留亲本序列某种活性的约50％、60％、70％、80％、90％、100％或甚至具有高于亲本序列的活性。“功能性变体”或“突变体”可以是人工产生的(如通过基因操作)，或者是自然界自然产生的(如群体中的蛋白多态性或不同物种中存在的同源蛋白)。另外，“功能性变体”或“突变体”还可以是原始序列的功能性片段，例如保留了所关注的功能的最小片段，例如具有DNA结合能力的DNA结合结构域。在本文中，当提及特定的氨基酸或核苷酸序列时，应意识到其可涵盖这些氨基酸或核苷酸序列功能性变体或突变体，除非上下文另有说明或暗示。

当提及氨基酸或核苷酸序列时，术语“序列一致性(sequence identity)”(也称为“序列同一性”)指两氨基酸或核苷酸序列(例如查询序列和参照序列)之间一致性程度的量，一般以百分比表示。通常，在计算两氨基酸或核苷酸序列之间的一致性百分比之前，先进行序列比对(alignment)并引入缺口(gap)(如果有的话)。如果在某个比对位置，两序列中的氨基酸残基或碱基相同，则认为两序列在该位置一致或匹配；两序列中的氨基酸残基或碱基不同，则认为在该位置不一致或错配。在一些算法中，用匹配位置数除以比对窗口中的位置总数以获得序列一致性。在另一些算法中，还将缺口数量和/或缺口长度考虑在内。常用的序列对比算法或软件包括DANMAN、CLUSTALW、MAFFT、BLAST、MUSCLE等。出于本发明的目的，可以采用公开的比对软件BLAST(可从https://www.ncbi.nlm.nih.gov/获得)，通过使用缺省设置来获得最佳序列比对并计算出两氨基酸或核苷酸序列之间的序列一致性。

“核酸分子”、“核酸”和“多核苷酸”在本文中可互换使用，指核苷酸聚合物。此类核苷酸聚合物可含有天然和/或非天然核苷酸且包括(但不限于)DNA、RNA和PNA。“核酸序列”指包含于核酸分子或多核苷酸中的核苷酸线性序列。对于DNA分子来说，由于双链互补，在本文提及其中一条链的序列时，本领域技术人员应意识到已同时提及其互补链或包括其互补链的双链DNA分子。

在本文中，“分离的核酸分子”指经过提取或纯化的核酸分子，也包括人工合成的核酸分子。例如，其可以是通过以下方法产生或合成的：(i)在体外扩增的，例如通过聚合酶链式反应(PCR)扩增产生的，(ii)通过克隆重组产生的，(iii)纯化的，例如通过酶切和凝胶电泳分级分离，或者(iv)合成的，例如通过化学合成。在某些实施方式中，所述分离的核酸分子是通过重组DNA技术制备的核酸分子。

“载体”指可经工程改造以含有目的多核苷酸(例如目的多肽的编码序列)的核酸分子或可在宿主细胞中复制的核酸分子(例如，核酸、质粒、或病毒等)。载体可包括以下组件中的一个或更多个：复制起点、一或更多个调控目的多核苷酸的表达的调控序列、增强子、启动子和/或一个或更多个可选择标记物基因(诸如抗生素抗性基因和可用于比色分析中的基因，例如β-半乳糖)。术语“表达载体”指用于在宿主细胞中表达目基因的载体。

“宿主细胞”指可为或已为载体或经分离多核苷酸的接受体的细胞。宿主细胞可为原核细胞或真核细胞。示例性真核细胞包括哺乳动物细胞，诸如灵长类动物或非灵长类动物细胞；真菌细胞，诸如酵母；植物细胞；以及昆虫细胞。宿主细胞包括单个宿主细胞的后代，且后代可能由于自然、偶然或故意突变而不一定与原始母细胞完全一致(在形态或基因组DNA互补方面)。宿主细胞也包括在活体内经本文提供的核酸分子或表达载体转染的细胞。

“目的基因”是指编码RNA或蛋白质产物的多核苷酸序列，所述多核苷酸序列可以根据所需目的引入到细胞或个体中，并且能够在适合条件下表达。目的基因可以编码感兴趣的产物，例如感兴趣的治疗性或诊断性产物。目的基因编码的蛋白产物称为目的蛋白。目的蛋白通常是异源多肽或外源多肽，即宿主细胞中通常并不表达该异源多肽或外源多肽，而是经人工工程化该宿主细胞后使得该异源多肽或外源多肽能够在其中表达。

“异源多肽”指相对于基因组或生物基因组不是天然的任何核酸序列编码的多肽。在本发明中，所述异源多肽可以来自PF00042(Pfam数据库蛋白家族ID号)球蛋白家族成员。在本发明的一些实施方案中，宿主细胞可存在编码大豆(Glycine max)豆血红蛋白LegH的多肽或编码牛(Bos taurus)肌红蛋白的多肽序列。所述异源多肽可以在甲基营养型酵母菌株中表达，并可以与甲醇诱导型或组成型的启动子或其元件结合以进一步增强异源核酸的表达。

“外源多肽”或“外源蛋白”是指从外部来源引入到细胞基因组的任何核酸序列编码的多肽，其中所述外部来源可以是相同或不同的生物体或合成产生的多肽。例如外源多肽可以是来自一种微生物(例如甲基营养型酵母的一个属或一种)的多肽，其被引入到不同的属或种的甲基营养型酵母中，然而，外源多肽也可以是来自甲基营养型酵母的多肽，尽管存在相应的天然核酸序列，但其作为额外拷贝被重组导入到甲基营养型酵母中。本发明中参与血红素辅因子生物合成途径的8个酶的编码核酸序列是巴斯德毕赤酵母的内源基因，包括5-氨基酮戊酸合成酶,胆色素原合成酶,胆色素原脱氨酶,尿卟啉原III合成酶,尿卟啉原脱羧酶，粪卟啉原氧化酶,原卟啉原氧化酶,和亚铁螯合酶，通过重组外源表达这8个酶基因并整合到毕赤酵母中进一步增强核酸的表达被认为是外源的。

毕赤酵母嵌合型转录因子报道较少，本发明设计了多种人造嵌合型转录因子，测试不同嵌合型转录因子是否具有活性，并筛选出了最有利于蛋白表达的人造转录因子，对于进一步提高异源蛋白的表达具有重要意义。

本发明设计了多组嵌合型转录激活因子，转化到含有血红素合成途径的血红蛋白表达菌株中，与pAOX1-Mxr1比较，筛选得到的嵌合型转录激活因子Mxr1D-Mit1AD、Mxr1D-Prm1AD等能够进一步提高血红蛋白的表达。

本发明部分地基于这一惊人发现，即发现在宿主细胞(如毕赤酵母)中本文所述的至少一种嵌合型转录因子的表达(或过表达)使重组目标蛋白(外源蛋白，如大豆血红蛋白或牛肌红蛋白)的产量增加。因此，在一方面，本文提供了新的嵌合型转录激活因子；另一方面，本文提供了增加宿主细胞中外源蛋白的产量的方法，包括在该宿主细胞中表达这些嵌合型转录激活因子中的一种或更多种。与不表达编码这些嵌合型转录激活因子的多核苷酸的宿主细胞相比，表达编码这些嵌合型转录激活因子的多核苷酸的宿主细胞使外源蛋白的产量增加。另外，本发明人还发现，在宿主细胞中过表达血红素有助于诸如大豆血红蛋白或牛肌红蛋白的外源蛋白更好地在新生蛋白中结合血红素。

实施例1将血红素途径导入毕赤酵母基因组

血红素由卟啉环和铁离子组成。血红素作为血红蛋白的重要组成部分，与珠蛋白通过共价连接组成完整的血红蛋白。为了得到高产的血红蛋白，细胞内需要有足够的血红素，用于合成血红蛋白。酿酒酵母S.cerevisiae血红素生物合成途径已有报道(如图1)，包含8个酶，5-氨基酮戊酸合成酶(ALA synthase,ALAS),胆色素原合成酶(porphobilinogensynthase，PBGS),胆色素原脱氨酶(porphobilinogen deaminase，PBGD),尿卟啉原III合成酶(uroporphyrinogen III synthase，UROS),尿卟啉原脱羧酶(uroporphyrinogen IIIdecarboxylase，UROD)，粪卟啉原氧化酶(coproporphyrinogen III oxidase，CPO),原卟啉原氧化酶(protoporphyrinogen oxidase，PPO),和亚铁螯合酶(ferrochelatase，FECH)。ALA synthase将前体物质L-甘氨酸和琥珀酰辅酶A合成关键前体5-氨基酮戊酸(5-aminolevulinate，ALA)之后经过上述多个酶催化作用合成血红素。在NCBI中搜索毕赤酵母基因组中血红素生物合成途径的8个酶基因，序列见SEQ ID NO：1-8。

将血红素生物合成途径的8个酶基因整合到毕赤酵母基因组中。以毕赤酵母X-33基因组为模板分别扩增血红素生物合成途径8个酶相关基因，通过酶切连接将上述基因分别与AOX1启动子和FDHI终止子或者actin终止子连接组成表达盒，将上述8个基因分为4组，ALAS和PBGD、PPO和FECH、UROS和PBGS、UROD和CPO，将每两个表达盒串联后，分别与上下游同源臂、正向筛选标记Zeocin抗性基因和反向筛选标记mazF基因连接，组装到pUC57质粒上，得到血红素合成途径表达质粒。通过酵母同源重组，分4次将血红素合成途径8个基因整合到毕赤酵母X-33菌株基因组上，得到血红素生物合成途径加强的毕赤酵母菌株HEM201。

实施例2构建毕赤酵母大豆血红蛋白表达菌株

大豆血红蛋白基因LegH(SEQ ID NO：9)连接至pPIZa表达载体中(如图2)，SacI线性化后转入实施例1中的毕赤酵母菌株HEM201，得到大豆血红蛋白表达菌株L528。

毕赤酵母重组菌株L528摇瓶发酵(50mL/250mL)验证血红蛋白表达情况：

将构建好的菌株进行划线培养，培养2～3天至长出单菌落。挑取单菌落，接种至YPD培养基(50mL/250mL)中，30℃、100～600rpm摇至OD600＝2～6；4℃、1500～3000g离心5～10min，生理盐水洗涤细胞两次，去除培养基中的葡萄糖。离心后的全部菌体用50mL BMMY培养基重悬，在30℃、250rpm下发酵(发酵初在培养基中添加终浓度为20mg/L的血红素)，每24h添加至发酵液终浓度为1％甲醇+0.1mM柠檬酸铁铵以继续诱导，120h取发酵液进行分析。

摇瓶发酵结果显示大豆血红蛋白有表达，SDS-PAGE胶中有显著条带(如图3)，发酵液呈粉红色(如图4)。

实施例3在毕赤酵母大豆血红蛋白表达菌株中导入已知酵母转录因子

构建毕赤酵母甲醇代谢途径转录激活因子Mxr1(SEQ ID NO：10)的表达载体pMxr1。以毕赤酵母X-33基因组为模板扩增Mxr1基因，并通过overlap PCR，将Mxr1基因连接到AOX1启动子和FDH终止子之间，组成Mxr1表达盒。将Mxr1表达盒与HIS基因上游位置的上下游同源臂以及潮霉素hph基因连接到pUC57质粒上，得到Mxr1表达载体pUC57-pAOX1-Mxr1-hph(如图5)。

用限制性内切酶NheI线性化质粒pUC57-pAOX1-Mxr1-hph，转化大豆血红蛋白表达菌株L528，将AOX1启动子调控的Mxr1基因插入到毕赤酵母基因组HIS基因位置的上游，得到Mxr1基因加强的大豆血红蛋白表达菌株M202。

摇瓶发酵结果SDS-PAGE胶图显示M202菌株大豆血红蛋白表达量比L528菌株提高(如图3)，发酵液呈红色(如图4)。

除了转录因子Mxr1，其他的甲醇代谢途径转录激活因子也可能有利于提高大豆血红蛋白表达和发酵液变红。分别选取毕赤酵母甲醇代谢途径中另外2个重要转录因子Mit1和Prm1，以及H.polymorpha的转录因子Mpp1进行表达(SEQ ID NO：11-13)。菌株构建方法与菌株M202相同。分别用AOX1启动子和GAP启动子调控转录因子的表达，构建表达盒。将不同转录因子的表达盒与HIS基因上游位置上下游同源臂以及潮霉素hph基因连接到pUC57质粒上，得到不同转录因子表达载体pTF624-pTF629(如表1所示)。

载体用限制性内切酶NheI线性化后转化大豆血红蛋白表达菌株L528，将AOX1启动子调控的不同转录因子基因插入到毕赤酵母基因组HIS基因位置上游，得到转录因子基因加强的大豆血红蛋白表达菌株TF624-TF629。

按照实施例2中摇瓶发酵方法验证血红蛋白表达情况，摇瓶发酵结果SDS-PAGE胶图显示大豆血红蛋白TF624-TF629的菌株表达量没有M202菌株高(如图3)，除了TF624和TF625发酵液红色与M202接近，其他菌株发酵液呈浅红色和浅黄色(如图4)。

实施例4在毕赤酵母大豆血红蛋白表达菌株中导入嵌合型酵母转录因子

根据文献报道和NCBI BLAST分析得到毕赤酵母3个重要转录因子Mxr1，Mit1，Prm1的DNA结合结构域DBD和转录激活结构域TAD氨基酸序列，并将其重新组合，其中有报道Mxr1的1-400位氨基酸(mMxr1)能够保留Mxr1的完整功能，Mxr1的DNA结合结构域Mxr1D为第1-91位氨基酸，转录激活结构域mMxr1AD为第92-400位氨基酸；Mit1的DNA结合结构域Mit1D为第1-104位氨基酸，转录激活结构域Mit1AD为第105-888位氨基酸；Prm1的DNA结合结构域Prm1D为第1-89位氨基酸，转录激活结构域Prm1AD为第90-989位氨基酸；

将不同的DNA结合结构域和转录激活结构域重新组合，得到多个新的嵌合型转录因子序列。嵌合型转录因子构建如下：

将截短的mMxr1与截短的Mxr1转录激活结构域mMxr1AD用GGGGS linker连接，进一步提高转录激活效果，得到嵌合型转录因子mMxr1-mMxr1AD(SEQ ID NO：14)；

将Mxr1与Prm1转录激活结构域Prm1AD用GGGGS linker连接，进一步提高转录激活效果，得到嵌合型转录因子Mxr1-Prm1AD(SEQ ID NO：15)；

将Mxr1的DNA结合结构域Mxr1D与Mit1的转录激活结构域Mit1AD用GGGGS linker连接，得到嵌合型转录因子Mxr1D-Mit1AD(SEQ ID NO：16)；

将Mxr1的DNA结合结构域Mxr1D与Prm1的转录激活结构域Prm1AD用GGGGS linker连接，得到嵌合型转录因子Mxr1D-Prm1AD(SEQ ID NO：17)；

将Mit1与截短的mMxr1转录激活结构域mMxr1AD用GGGGS linker连接，进一步提高转录激活效果，得到嵌合型转录因子Mit1-mMxr1AD(SEQ ID NO：18)；

将Mit1的DNA结合结构域Mit1D与截短的mMxr1转录激活结构域mMxr1AD用GGGGSlinker连接，进一步提高转录激活效果，得到嵌合型转录因子Mit1D-mMxr1AD(SEQ ID NO：19)；

将Mit1的DNA结合结构域Mit1D与Mxr1的转录激活结构域Mxr1AD用GGGGS linker连接，得到嵌合型转录因子Mit1D-Mxr1AD(SEQ ID NO：20)；

将Mit1的DNA结合结构域Mit1D与Prm1的转录激活结构域Prm1AD用GGGGS linker连接，得到嵌合型转录因子Mit1D-Prm1AD(SEQ ID NO：21)；

将Prm1与截短的mMxr1转录激活结构域mMxr1AD用GGGGS linker连接，进一步提高转录激活效果，得到嵌合型转录因子Prm1-mMxr1AD(SEQ ID NO：22)；

将Prm1的DNA结合结构域Prm1D与截短的mMxr1转录激活结构域mMxr1AD用GGGGSlinker连接，进一步提高转录激活效果，得到嵌合型转录因子Prm1D-mMxr1AD(SEQ ID NO：23)；

将Prm1的DNA结合结构域Prm1D与Mxr1的转录激活结构域Mxr1AD用GGGGS linker连接，得到嵌合型转录因子Prm1D-Mxr1AD(SEQ ID NO：24)；

将Prm1的DNA结合结构域Prm1D与Mit1的转录激活结构域Mit1AD用GGGGS linker连接，得到嵌合型转录因子Prm1D-Mit1AD(SEQ ID NO：25)；

将上述转录因子替换pUC57-pAOX1-Mxr1-hph中的Mxr1基因，得到含有不同嵌合型转录因子的载体质粒pTF720-pTF731(如表1所示)。上述载体质粒用限制性内切酶NheI线性化后转化大豆血红蛋白表达菌株L528，将AOX1启动子调控的不同嵌合型转录因子基因插入到毕赤酵母基因组HIS基因位置上游，得到对应含有嵌合型转录因子的大豆血红蛋白表达菌株TF720-TF731。

按照实施例2中摇瓶发酵方法验证血红蛋白的表达情况，与M202菌株相比，TF722-TF723菌株的表达量有所提高，而且发酵液的颜色比M202菌株颜色更红。TF730-TF731菌株的表达量与M202菌株表达量相当，但发酵液的颜色不如M202的颜色，而含有其他嵌合型的转录因子的菌株的表达量和发酵液颜色均没有M202的效果好(如图3和图4)。实验结果表明Mxr1D-Mit1AD、Mxr1D-Prm1AD嵌合型转录因子的表达效果优于Mxr1的表达，更优于其他嵌合型转录因子的表达效果。

表1含有不同嵌合型转录因子质粒

/>

各菌株的摇瓶发酵结果蛋白表达量和发酵液颜色的强弱如表2所示，“+”号越多代表蛋白表达量越高，发酵液颜色越红。

表2摇瓶发酵结果

本文中提到的一些氨基酸序列如下：

>1ALAS

MEFVARQSMNACPFVRSTSTHHLKKLAANSSLAATASHCPVVGPALQQQRYYSQPSKPAQAQTSDIATGIKKDVSPIRMDSNETAFDYNGMYESDLANKRKDNSYRYFNNINRLAKEFPKAHRQTEDDKVTVWCSNDYLGMGRHPEIIKTMKATMDKYGSGAGGTRNIAGHNHAAINLESELACLNKKEAALVFSSCFIANDAIISLLGQKIKNLVIFSDQSNHASMILGVRNSKAKKHIFKHNNLKDLESQLAQYPKSTPKLIAFESVYSMCGSVAPIEKICDLAKRYGALTFLDEVHAVGMYGPHGQGVAEHLDFDLHLQSGIASPSVVDKRTILDRVDMITGTCGKSFGTVGGYVAGSANLIDWLRSYAPGFIFTTTLPPAIMAGTATSVRIVRADIEARIKQQLNTRYVKDSFENLGIPVIPNPSHIVPVLVGNAADAKKASDMLMNKHRIYVQAINYPTVPVGEERLRITPTPGHGKEICDQLISAVDDVFTELNLPRINKWQSQGGHCGVGDANYVPEPNLWTQDQLSLTNQDLHSNVHNPVIEQIETSSGVRL*(SEQ ID NO：1)

>2PBGS

MVHKAEYLDDHPTQISSILSGGYNHPLLREWQHERQLNKNMFIFPLFVTDRPDEEELIPSLPNIKRFGVNKLIPYVGGLVSKGLRAVILFGVPLKPGVKDEEGTAADDPEGPVIQAIKHLRKNFPDLYIITDVCLCEYTSHGHCGILYEDGTINRELSVRRIAAVAVKYAQAGANSVAPSDMTDGRIRDIKEGLLSAGLAHKTFVMSYAAKFSGNLYGPFRDAAGSCPSQGDRKCYQLPSGGKGLAHRALIRDMNEGTDGIIVKPSTFYLDIVADAYQLCKDYPICCYQVSGEYAMLHAAAEKNIVDLKSIAFEAHQGFLRAGARLIISYFTPEFLEWLSE*(SEQ ID NO：2)

>3PBGD

MNQIEQSGPIDCSSLKLGSRKSALAIIQAEIVRQLILKEYPELETKLVSVSTLGDQVQNKALFTFGGKSLWTKELEMLLLESVGGFDQIDMIVHSLKDMPTHLPDEFELGCIIEREDPRDALVVQDGLSYKSLADLPEGAVVGTSSVRRSAQLLKNFPHLKFKSVRGNLQTRLRKLDDPDSEYCCLLLAAAGLIRTGLQHRISMYLNDDVMYHSVGQGALGVEIRKGDQFMKNICEKIGHRTTTLRCLAERALLRYLEGGCSVPIGVSTIYSEDTKELTMNSLVVSCNGRDSVTESMTEVVTTEEQAEDFGERLAQKLIDQGAKRILDEINFNKIKEIKEEGLH*(SEQ ID NO：3)

>4UROS

MPKAILLKNKTTPKDPYLENFVSSGYSTDFVPLLDHIHMEKSEIIAFLKTDYFLHKTLAFIITSQRAVEMLNECMQILRRTDPEITQIIYSKPVYTVGPATYRILADAGFVDLRGGDKAGNGSILAQIILNDDIYTGIEDSDKHITFFTGETRRDIIPKCLLSNNFQLYEKIVYKTLPRDDIVTRFKSAVDSIDQSQRSSSWVVFFSPQGTEDIVTYLQHTKDQFNIASIGPTTEKYLLSKNLKPKVVAPKPEPISLLLSIQKVH*(SEQ ID NO：4)

>5UROD

MSRFPELKNDLILRAARGEKVERPPIWIMRQAGRYLPEYHEVKGGRDFFETCRDAEIASEITIQPITHFDGLIDAAIIFSDILVIPQAMGMEVKMVDKVGPQFPNPLRKPSDLDHLKKDVDVLKELDWAFKAISLTRKKLNGRVPLLGFCGAPWTLLVYMTEGGGTKMFRFAKEWIYKFTKESHQLLQQITDVAVEFLAQQVVAGAQMLQVFESWGGELGPDEFDEFSLPYLRQISSKLPLRLKELGITENVPITVFAKGSWYALEQLCDSGYDVVSLDWLFRPSDAVQIANGRIALQGNLDPGTMYGSKETISKKVDKMIKGFGGGKQNYIINFGHGTHPFMDPEQIRWFLQECHRIGSQ*(SEQ ID NO：5)

>6 CPO

MAIDSDINLSSPNDSIRQRMFELIQRKQLEIVAALEAIEGNDTKFRSDSWERGAEGGGGRSMLIQDGRVFEKAGVNISKVHGVLPPQAVSQMRNDHSKLDLPAGTSLKFFACGLSLVIHPHNPHAPTTHLNYRYFETWDETGKPHTWWFGGGADLTPSYLYPEDAKQFHQAHKDALDKHDVSLYPRFKKWCDEYFLIKHRNETRGIGGIFFDDFDEFDAERSLKLVEDCFNAFLESYPAITRKRMDTPSTDAEKNWQQIRRGRYVEFNLVLDRGTQFGLRTPGSRVESILMSLPRTAGWVYDHHPEPGSREEELLQVLQNPIEWV*(SEQ ID NO：6)

>7 PPO

MLKSLAPNSSIAVLGSGISGLTFSFFLNRLRPDVKIHIFEKSKQVGGWIRSEEHETFHFEKGPRTLRGTNTGTLMLLDLLTKIGANDKVLGLHKDSLANKKYLLSPFSDVHGNNAKLLQVPQDFSSFVKFMFDPLSKDLILGLLKEPWQPKLKYSDESVDHFFNRRFATKLSENIVSAIVHGIYAGDVKKLSVKAIFPRLPEMEQESGSIIRYMIAQYRTKKNVKQKVDPFLADYEKLIGTSLSFKNISLFLKNFPMLSFQGGLQKLPISLKNHLSQIENIKFHFDSKIKNIALESGKVALTDHDQVYLVDHVRSTINTNELAKIISPVVPSSTKKKSVFKSKANGPGLVKCLSWLHYTNILMCNIYIPKHVSKSITGFGYLVPRSMSSQASKLLGVIFDSDIETAMTPNFTEANITAINSNSASPKQLQKFSDQFVNNDLPKYTKLTLMLGGHYLKSEADMPGSAESKHAVKAILSNHLNIDLDEFASLPDFKMEITKIPNCIPQYEVGYLDLKRKVQNAASKEFNDQISFGGMAFGDGVGIPDCVQNAFKDSATLSGI*(SEQ ID NO：7)

>8 FECH

MLNRRFQSTVSSSLNKGTGIVFMNMGGPSTVKETYDFLFRLFSDGDLIPFGRFQNILARFIASRRTPKIESYYKAIGGGSPIRKWSEYQSSKLCEKLDIISPQSAPHKPYVAFRYANPLTEDTLQKMKNDGITKAIAFSQYPQFSYSTTGSSINELYRQSKILDPDQSIKWTVIDRWPDHPALVKTFAAHIKDTLNRFKTENGLTDTKDVVLQFSAHSLPMDIVNKGDSYPAEVAASVFAIMKELNFSNPYKLTWQSQVGPKPWLGAQTEKITKQLASSDVPGVVLVPIAFTSDHIETLHELDIELIQELPNPSKVKRVESLNGDQTFIDSLAELVKSHIDSKVVFSNQLPLDSMLGVVSDNSLTDPKEFFRAH*(SEQ ID NO：8)

>9 LegH

MGAFTEKQEALVSSSFEAFKANIPQYSVVFYTSILEKAPAAKDLFSFLSNGVDPSNPKLTGHAEKLFGLVRDSAGQLKANGTVVADAALGSIHAQKAITDPQFVVVKEALLKTIKEAVGDKWSDELSSAWEVAYDELAAAIKKAF*(SEQ ID NO：9)

>10 Mxr1

MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCTSSNATISPILLDNSINNNSTSDVRPEFRTQSVTSEMSQAPPPPQKNNSKYSTEVLFTSNMRSFIHYALSKYPFIGVPTPTLPENERLNEYADSFTNRFLNHYPFIHVTILKEYSLFKAILDENESTKNWENNQFYLENQRISIVCLPLLVATIGAVLSNNKKDASNLYEASRRCIHVYLDSRKKIPTSLSANNNDSPLWLIQSLTLSVMYGLFADNDISLNVVIRQVNALNSLVKTSGLNRTSIIDLFNINKPLDNELWNQFVKIESTVRTIHTIFQISSNLSALYNIIPSLKIDDLMITLPVPTTLWQADSFVKFKSLSYGNQIPFQYTRVLQNLIDYNQPLSDGKFLYENHVSEFGLICLQNGLHQYSYFQKLTAVNNREDALFTKVVNSLHSWDRMISNSDLFPKKIYQQSCLILDSKLLNNFLIVKSSLKVSTGDVSSLNKLKENVWLKNWNQVCAIYYNSFMNIPAPSIQKKYNDIEFVDDMINLSLIIIKIMKLIFYNNVKDNYEDENDFKLQELNLTFDNFDEKISLNLTILFDIFLMIYKIITNYEKFMKIKHKFNYYNSNSNISFLHHFELSSVINNTQMNQNDYMKTDIDEKLDQLFHIYQTFFRLYLDLEKFMKFKFNYHDFETEFSSLSISNILNTHAASNNDTNAADAMNAKDEKISPTTLNSVLLADEGNENSGRNNDSDRLFMLNELINFEVGLKFLKIGESFFDFLYENNYKFIHFKNLNDGMFHIRIYLENRLDGGV*(SEQ ID NO：10)

>11 Mit1

MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFVNNSMKDFLGKKTVDGADSLNLAVNLQQQQSSNTIANQSLSSIGLESFGYGSGIKNEFNFQDLIGSNSGSSDPTFSVDADEAQKLDISNKNSRKRQKLGLLPVSNATSHLNGFNGMSNGKSHSFSSPSGTNDDELSGLMFNSPSFNPLTVNDSTNNSNHNIGLSPMSCLFSTVQEASQKKHGNSSRHFSYPSGPEDLWFNEFQKQALTANGENAVQQGDDASKNNTAIPKDQSSNSSIFSSRSSAASSNSGDDIGRMGPFSKGPEIEFNYDSFLESLKAESPSSSKYNLPETLKEYMTLSSSHLNSQHSDTLANGTNGNYSSTVSNNLSLSLNSFSFSDKFSLSPPTITDAEKFSLMRNFIDNISPWFDTFDNTKQFGTKIPVLAKKCSSLYYAILAISSRQRERIKKEHNEKTLQCYQYSLQQLIPTVQSSNNIEYIITCILLSVFHIMSSEPSTQRDIIVSLAKYIQACNINGFTSNDKLEKSIFWNYVNLDLATCAIGEESMVIPFSYWVKETTDYKTIQDVKPFFTKKTSTTTDDDLDDMYAIYMLYISGRIINLLNCRDAKLNFEPKWEFLWNELNEWELNKPLTFQSIVQFKANDESQGGSTFPTVLFSNSRSCYSNQLYHMSYIILVQNKPRLYKIPFTTVSASMSSPSDNKAGMSASSTPASDHHASGDHLSPRSVEPSLSTTLSPPPNANGAGNKFRSTLWHAKQICGISINNNHNSNLAAKVNSLQPLWHAGKLISSKSEHTQLLKLLNNLECATGWPMNWKGKELIDYWNVEE*(SEQ ID NO：11)

>12 Prm1

MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKKVKCDGQQPCIHCTVYSYECTYSQPSSKKRQGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDS*(SEQ ID NO：12)

>13 Mpp1

MSISRDDDHPRPKRARSGKPKKETPPAKRRVRTGCLTCRRKHKKCDENRPKCDFCTAKGLECVWPEEVKKNVFVNNSFKDFCFSQSKHRDRFRKPTDFDLSSSLSPLDYHLGPDDPRTRKKAYSLDVADHYLSAFDGYSRKNEYLDAPLTTAYPLLETSESPLSGLFNAPQELPSQLTRTPSFGASSLSYFDTLQSYSMNPSLSSGSNDKISTASSVSSDMSLAKKDADFEHRYSFAEPQKKSKFGLDYYDLPNTLNDLMCLFIATKDSTSGSKLPNNETIFEIFTDKSTMEAPSIDDHEMMLLMETYIDQIAHFLNKSDETQCNIFMTKIPELAHRFPSLKYAILGLASRHLEKVRSDYSGEKTLQYYTYSLQQLSMCLNSDKNTLEVVATCVLLCYFEILSTNPDSWHSRLENCGSMLKVCHINARSETELEKALFWSFAALDIGCCAVGDRKTVVRPEDWFGTDAPSSPTETGTALQSMLYLSCQIFQLVSSNDDQSEFDSCWKSLWKQLGDWERARSSNMRGFCFKRDNSFPETLFSSSTALCANQLFHTCCILMLQTKPRLVKLHEPEKQERTPDTLFQSAIKTEQGESVSTSSLMSRSQIWHAKQIIGINVCNMKSASSRSLGCQILSLQAIWIAGKLISSAHEHSIILQLLQRLESWSSMSMDWREKQLTEFWKREC*(SEQ ID NO：13)

>14 mMxr1-mMxr1AD

MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCGGGGSTSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ ID NO：14)

>15 Mxr1-Prm1AD

MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCTSSNATISPILLDNSINNNSTSDVRPEFRTQSVTSEMSQAPPPPQKNNSKYSTEVLFTSNMRSFIHYALSKYPFIGVPTPTLPENERLNEYADSFTNRFLNHYPFIHVTILKEYSLFKAILDENESTKNWENNQFYLENQRISIVCLPLLVATIGAVLSNNKKDASNLYEASRRCIHVYLDSRKKIPTSLSANNNDSPLWLIQSLTLSVMYGLFADNDISLNVVIRQVNALNSLVKTSGLNRTSIIDLFNINKPLDNELWNQFVKIESTVRTIHTIFQISSNLSALYNIIPSLKIDDLMITLPVPTTLWQADSFVKFKSLSYGNQIPFQYTRVLQNLIDYNQPLSDGKFLYENHVSEFGLICLQNGLHQYSYFQKLTAVNNREDALFTKVVNSLHSWDRMISNSDLFPKKIYQQSCLILDSKLLNNFLIVKSSLKVSTGDVSSLNKLKENVWLKNWNQVCAIYYNSFMNIPAPSIQKKYNDIEFVDDMINLSLIIIKIMKLIFYNNVKDNYEDENDFKLQELNLTFDNFDEKISLNLTILFDIFLMIYKIITNYEKFMKIKHKFNYYNSNSNISFLHHFELSSVINNTQMNQNDYMKTDIDEKLDQLFHIYQTFFRLYLDLEKFMKFKFNYHDFETEFSSLSISNILNTHAASNNDTNAADAMNAKDEKISPTTLNSVLLADEGNENSGRNNDSDRLFMLNELINFEVGLKFLKIGESFFDFLYENNYKFIHFKNLNDGMFHIRIYLENRLDGGVGGGGSGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDS*(SEQ ID NO：15)

>16 Mxr1D-Mit1AD

MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSGGGGSVNNSMKDFLGKKTVDGADSLNLAVNLQQQQSSNTIANQSLSSIGLESFGYGSGIKNEFNFQDLIGSNSGSSDPTFSVDADEAQKLDISNKNSRKRQKLGLLPVSNATSHLNGFNGMSNGKSHSFSSPSGTNDDELSGLMFNSPSFNPLTVNDSTNNSNHNIGLSPMSCLFSTVQEASQKKHGNSSRHFSYPSGPEDLWFNEFQKQALTANGENAVQQGDDASKNNTAIPKDQSSNSSIFSSRSSAASSNSGDDIGRMGPFSKGPEIEFNYDSFLESLKAESPSSSKYNLPETLKEYMTLSSSHLNSQHSDTLANGTNGNYSSTVSNNLSLSLNSFSFSDKFSLSPPTITDAEKFSLMRNFIDNISPWFDTFDNTKQFGTKIPVLAKKCSSLYYAILAISSRQRERIKKEHNEKTLQCYQYSLQQLIPTVQSSNNIEYIITCILLSVFHIMSSEPSTQRDIIVSLAKYIQACNINGFTSNDKLEKSIFWNYVNLDLATCAIGEESMVIPFSYWVKETTDYKTIQDVKPFFTKKTSTTTDDDLDDMYAIYMLYISGRIINLLNCRDAKLNFEPKWEFLWNELNEWELNKPLTFQSIVQFKANDESQGGSTFPTVLFSNSRSCYSNQLYHMSYIILVQNKPRLYKIPFTTVSASMSSPSDNKAGMSASSTPASDHHASGDHLSPRSVEPSLSTTLSPPPNANGAGNKFRSTLWHAKQICGISINNNHNSNLAAKVNSLQPLWHAGKLISSKSEHTQLLKLLNNLECATGWPMNWKGKELIDYWNVEE*(SEQ ID NO：16)

>17 Mxr1D-Prm1AD

MSNLPPTFGSTRQSPEDQSPPVPKELSFNGTTPSGKLRLFVCQTCTRAFARQEHLKRHERSHTKEKPFSCGICSRKFSRRDLLLRHAQKLHSNCSGGGGSGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDS*(SEQ ID NO：17)

>18 Mit1-mMxr1AD

MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFVNNSMKDFLGKKTVDGADSLNLAVNLQQQQSSNTIANQSLSSIGLESFGYGSGIKNEFNFQDLIGSNSGSSDPTFSVDADEAQKLDISNKNSRKRQKLGLLPVSNATSHLNGFNGMSNGKSHSFSSPSGTNDDELSGLMFNSPSFNPLTVNDSTNNSNHNIGLSPMSCLFSTVQEASQKKHGNSSRHFSYPSGPEDLWFNEFQKQALTANGENAVQQGDDASKNNTAIPKDQSSNSSIFSSRSSAASSNSGDDIGRMGPFSKGPEIEFNYDSFLESLKAESPSSSKYNLPETLKEYMTLSSSHLNSQHSDTLANGTNGNYSSTVSNNLSLSLNSFSFSDKFSLSPPTITDAEKFSLMRNFIDNISPWFDTFDNTKQFGTKIPVLAKKCSSLYYAILAISSRQRERIKKEHNEKTLQCYQYSLQQLIPTVQSSNNIEYIITCILLSVFHIMSSEPSTQRDIIVSLAKYIQACNINGFTSNDKLEKSIFWNYVNLDLATCAIGEESMVIPFSYWVKETTDYKTIQDVKPFFTKKTSTTTDDDLDDMYAIYMLYISGRIINLLNCRDAKLNFEPKWEFLWNELNEWELNKPLTFQSIVQFKANDESQGGSTFPTVLFSNSRSCYSNQLYHMSYIILVQNKPRLYKIPFTTVSASMSSPSDNKAGMSASSTPASDHHASGDHLSPRSVEPSLSTTLSPPPNANGAGNKFRSTLWHAKQICGISINNNHNSNLAAKVNSLQPLWHAGKLISSKSEHTQLLKLLNNLECATGWPMNWKGKELIDYWNVEEGGGGSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ IDNO：18)

>19 Mit1D-mMxr1AD

MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFGGGGSSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ ID NO：19)

>20 Mit1D-Mxr1AD

MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFGGGGSSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCTSSNATISPILLDNSINNNSTSDVRPEFRTQSVTSEMSQAPPPPQKNNSKYSTEVLFTSNMRSFIHYALSKYPFIGVPTPTLPENERLNEYADSFTNRFLNHYPFIHVTILKEYSLFKAILDENESTKNWENNQFYLENQRISIVCLPLLVATIGAVLSNNKKDASNLYEASRRCIHVYLDSRKKIPTSLSANNNDSPLWLIQSLTLSVMYGLFADNDISLNVVIRQVNALNSLVKTSGLNRTSIIDLFNINKPLDNELWNQFVKIESTVRTIHTIFQISSNLSALYNIIPSLKIDDLMITLPVPTTLWQADSFVKFKSLSYGNQIPFQYTRVLQNLIDYNQPLSDGKFLYENHVSEFGLICLQNGLHQYSYFQKLTAVNNREDALFTKVVNSLHSWDRMISNSDLFPKKIYQQSCLILDSKLLNNFLIVKSSLKVSTGDVSSLNKLKENVWLKNWNQVCAIYYNSFMNIPAPSIQKKYNDIEFVDDMINLSLIIIKIMKLIFYNNVKDNYEDENDFKLQELNLTFDNFDEKISLNLTILFDIFLMIYKIITNYEKFMKIKHKFNYYNSNSNISFLHHFELSSVINNTQMNQNDYMKTDIDEKLDQLFHIYQTFFRLYLDLEKFMKFKFNYHDFETEFSSLSISNILNTHAASNNDTNAADAMNAKDEKISPTTLNSVLLADEGNENSGRNNDSDRLFMLNELINFEVGLKFLKIGESFFDFLYENNYKFIHFKNLNDGMFHIRIYLENRLDGGV*(SEQ ID NO：20)

>21 Mit1D-Prm1AD

MSTAAPIKEESQFAHLTLMNKDIPSNAKQAKSKVSAAPAKTGSKSAGGSGNNNAAPVKKRVRTGCLTCRKKHKKCDENRNPKCDFCTLKGLECVWPENNKKNIFGGGGSGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDS*(SEQ ID NO：21)

>22 Prm1-mMxr1AD

MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKKVKCDGQQPCIHCTVYSYECTYSQPSSKKRQGQSLSLSAPSNINATSSVQKSVKPPEIDFQRMRDALKYYEDLLNQLIYPNSAPTVRVNPIRLASILKQLRADKSSDELISVKALSDNYIEMLHKTMQQPVQQPAPPSLGQGGSFSNHSPNHNNASIDGSIESNLGREIRIILPPRDIALKLIYKTWDNACVLFRFYHRPAFIEDLNELYETDLANYTNKQQRFLPLVYSVMACGALFCKTDGINHGQKSSKPKDSSDESLIDDEGYKYFIAARKLIDITDTRDTYGIQTIVMLIIFLQCSARLSTCYSYIGIALRAALREGLHRQLNYPFNPIELETRKRLFWTIYKMDIYVNTMLGLPRTISEEDFDQEMPIELDDENISETGYRFDLQGTKLSSSGIANAHTRLIFIMKKIVKKLYPVKLQKPTSNSGDTPLENNDLLAHEIVHELEMDLQNWVNSLPAELKPGIEPPTEYFKANRLLHLAYLHVKIILYRPFIHYISEKDKVGNSSIPPSPEEITSIEKAKNCVNVARIVVKLAEDMINRKMLSGSYWFSIYTIFFSVACLVYYVHFAPPKKDNGELDPQYMEIKKDTESGREVLNILKDSSMAARRTYNILNSLFEQLNRRTAKVNLAKAQQPPSGLNNPAATQYQKQGEHRQLQPSNYSGTVKSVDPENIDYSSFGSQFENTNIEDGSSNTKIDQKVNGVNYIDGVFTGINLNMPNLSETSNTQGIDNPAFQSINNSNLNNNFVQTKYIPGMMDQLDMKIFGRFLPPYMLNSNKVEQGQNERNLSGQPSSSNTPDGSQPVTVLDGLYPLQNDNNNNHDPGNSKSVVNNSNSVENLLQNFTMVPSGLSSTVQNPEAAQKFNNHMSNISNMNDPRRASVATSDGSNDMDHHSQGPINKDLKPLSNYEFDDLFFNDWTTAPDTINFDSGGGGSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ ID NO：22)

>23 Prm1D-mMxr1AD

MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKKVKCDGQQPCIHCTVYSYECTYSQPSSKKRQGGGGSSNCSDAAITRLRRKATRRSSNAAGSISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSLKQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNFQQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSFTDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPDTVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSC*(SEQ ID NO：23)

>24 Prm1D-Mxr1AD

MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKK

VKCDGQQPCIHCTVYSYECTYSQPSSKKRQGGGGSSNCSDAAITRLRRKATRRSSNAAG

SISGSTPVTTPNTMGTPEDGEKRKVQKLAGRRDSNEQKLQLQQQHLQQQPQLQYQQSL

KQHENQVQQPDQDPLISPRMQLFNDSNHHVNNLFDLGLRRASFSAVSGNNYAHYVNNF

QQDASSTNPNQDSNNAEFENIEFSTPQMMPVEDAETWMNNMGPIPNFSLDVNRNIGDSF

TDIQHKNSEPIISEPPKDTAPNDKKLNGYSFYEAPIKPLESLFSVRNTKRNKYKTNDDSPD

TVDNNSAPAANTIQELESSLNASKNFCLPTGYSFYGNLDQQTFSNTLSCTSSNATISPILL

DNSINNNSTSDVRPEFRTQSVTSEMSQAPPPPQKNNSKYSTEVLFTSNMRSFIHYALSKY

PFIGVPTPTLPENERLNEYADSFTNRFLNHYPFIHVTILKEYSLFKAILDENESTKNWENN

QFYLENQRISIVCLPLLVATIGAVLSNNKKDASNLYEASRRCIHVYLDSRKKIPTSLSANN

NDSPLWLIQSLTLSVMYGLFADNDISLNVVIRQVNALNSLVKTSGLNRTSIIDLFNINKPL

DNELWNQFVKIESTVRTIHTIFQISSNLSALYNIIPSLKIDDLMITLPVPTTLWQADSFVKF

KSLSYGNQIPFQYTRVLQNLIDYNQPLSDGKFLYENHVSEFGLICLQNGLHQYSYFQKLT

AVNNREDALFTKVVNSLHSWDRMISNSDLFPKKIYQQSCLILDSKLLNNFLIVKSSLKVS

TGDVSSLNKLKENVWLKNWNQVCAIYYNSFMNIPAPSIQKKYNDIEFVDDMINLSLIIIKI

MKLIFYNNVKDNYEDENDFKLQELNLTFDNFDEKISLNLTILFDIFLMIYKIITNYEKFMK

IKHKFNYYNSNSNISFLHHFELSSVINNTQMNQNDYMKTDIDEKLDQLFHIYQTFFRLYL

DLEKFMKFKFNYHDFETEFSSLSISNILNTHAASNNDTNAADAMNAKDEKISPTTLNSVL

LADEGNENSGRNNDSDRLFMLNELINFEVGLKFLKIGESFFDFLYENNYKFIHFKNLNDGMFHIRIYLENRLDGGV*(SEQ ID NO：24)

>25 Prm1D-Mit1AD

MPPKHRLEQSIQPMASQQIVPGNKVILPNPKVDAKSTPNISVQKRRRVTRACDECRKKK

VKCDGQQPCIHCTVYSYECTYSQPSSKKRQGGGGSVNNSMKDFLGKKTVDGADSLNLA

VNLQQQQSSNTIANQSLSSIGLESFGYGSGIKNEFNFQDLIGSNSGSSDPTFSVDADEAQK

LDISNKNSRKRQKLGLLPVSNATSHLNGFNGMSNGKSHSFSSPSGTNDDELSGLMFNSPS

FNPLTVNDSTNNSNHNIGLSPMSCLFSTVQEASQKKHGNSSRHFSYPSGPEDLWFNEFQK

QALTANGENAVQQGDDASKNNTAIPKDQSSNSSIFSSRSSAASSNSGDDIGRMGPFSKGP

EIEFNYDSFLESLKAESPSSSKYNLPETLKEYMTLSSSHLNSQHSDTLANGTNGNYSSTVS

NNLSLSLNSFSFSDKFSLSPPTITDAEKFSLMRNFIDNISPWFDTFDNTKQFGTKIPVLAKK

CSSLYYAILAISSRQRERIKKEHNEKTLQCYQYSLQQLIPTVQSSNNIEYIITCILLSVFHIM

SSEPSTQRDIIVSLAKYIQACNINGFTSNDKLEKSIFWNYVNLDLATCAIGEESMVIPFSY

WVKETTDYKTIQDVKPFFTKKTSTTTDDDLDDMYAIYMLYISGRIINLLNCRDAKLNFEP

KWEFLWNELNEWELNKPLTFQSIVQFKANDESQGGSTFPTVLFSNSRSCYSNQLYHMSY

IILVQNKPRLYKIPFTTVSASMSSPSDNKAGMSASSTPASDHHASGDHLSPRSVEPSLSTT

LSPPPNANGAGNKFRSTLWHAKQICGISINNNHNSNLAAKVNSLQPLWHAGKLISSKSEHTQLLKLLNNLECATGWPMNWKGKELIDYWNVEE*(SEQ ID NO：25)

>26 BtMb

MGLSDGEWQLVLNAWGKVEADVAGHGQEVLIRLFTGHPETLEKFDKFKHLKTEAEMK

ASEDLKKHGNTVLTALGGILKKKGHHEAEVKHLAESHANKHKIPVKYLEFISDAIIHVLHAKHPSDFGADAQAAMSKALELFRNDMAAQYKVLGFHG*(SEQ ID NO：26)

>27

(GGGGS)_n(SEQ ID NO：27)

>28

GSAGSAAGSGEF(SEQ ID NO：28)

>29

KESGSVSSEQLAQFRSLD(SEQ ID NO：29)

>30

EGKSSGSGSESKST(SEQ ID NO：30)

>31

(EAAAK)_n(SEQ ID NO：31)

Claims

1.嵌合型转录激活因子，其至少包括第一部分和第二部分，其中：

1)所述第一部分包括：

i)DNA结合结构域；或

ii)DNA结合结构域和第一转录激活结构域；以及

2)所述第二部分包括至少一个第二转录激活结构域。

2.如权利要求1所述的嵌合型转录激活因子，其中所述第一部分的C末端直接或通过连接分子间接与所述第二部分的N末端连接。

3.如权利要求1或2所述的嵌合型转录激活因子，其中所述DNA结合结构域和所述第二转录激活结构域来自不同的转录激活因子。

4.如权利要求1-3任一项所述的嵌合型转录激活因子，其中所述DNA结合结构域和所述第一转录激活结构域来自相同的转录激活因子。

5.如权利要求1-4任一项所述的嵌合型转录激活因子，其中所述DNA结合结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体，优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。

6.如权利要求1-5任一项所述的嵌合型转录激活因子，其中所述第一转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体，优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。

7.如权利要求1-6任一项所述的嵌合型转录激活因子，其中所述转录激活因子Mxr1包括SEQ ID NO：10所示序列；所述转录激活因子Mit1包括SEQ ID NO：11所示序列；所述转录激活因子Prm1包括SEQ ID NO：12所示序列。

8.如权利要求1-7任一项所述的嵌合型转录激活因子，其中所述DNA结合结构域包括所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1的第1-104位氨基酸或所述转录激活因子Prm1的第1-89位氨基酸。

9.如权利要求1-8任一项所述的嵌合型转录激活因子，其中所述DNA结合结构域与所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1的第1-104位氨基酸或所述转录激活因子Prm1的第1-89位氨基酸具有至少50％、60％、70％、80％、90％、92％、95％、98％、或99％序列一致性。

10.如权利要求1-9任一项所述的嵌合型转录激活因子，其中所述第一转录激活结构域包括所述转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。

11.如权利要求1-10任一项所述的嵌合型转录激活因子，其中所述第一转录激活结构域与所述转录激活因子Mxr1的第92-1155位氨基酸、转录激活因子Mxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸具有至少50％、60％、70％、80％、90％、92％、95％、98％、或99％序列一致性。

12.如权利要求1-11任一项所述的嵌合型转录激活因子，其中所述第一部分包括所述转录激活因子Mxr1、所述转录激活因子Mxr1的第1-400位氨基酸、所述转录激活因子Mxr1的第1-91位氨基酸、所述转录激活因子Mit1、所述转录激活因子Mit1的第1-104位氨基酸、所述转录激活因子Prm1或所述转录激活因子Prm1的第1-89位氨基酸。

13.如权利要求1-12任一项所述的嵌合型转录激活因子，其中所述第二转录激活结构域来自转录激活因子Mxr1、Mit1、Prm1、Adr1、Trm1、Trm2、Mpp1或其片段或突变体，优选来自转录激活因子Mxr1、Mit1、Prm1或其片段或突变体。

14.如权利要求1-13任一项所述的嵌合型转录激活因子，其中所述第二转录激活结构域包括转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。

15.如权利要求1-14任一项所述的嵌合型转录激活因子，其中所述第二转录激活结构域与所述转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸具有至少50％、60％、70％、80％、90％、92％、95％、98％、或99％序列一致性。

16.如权利要求1-15任一项所述的嵌合型转录激活因子，其中所述第二部分包括转录激活因子Mxr1的第92-1155位氨基酸、截短的转录激活因子mMxr1的第92-400位氨基酸、所述转录激活因子Mit1的第105-888位氨基酸或所述转录激活因子Prm1的第90-989位氨基酸。

17.如权利要求1-16任一项所述的嵌合型转录激活因子，其包括SEQ ID NO：14-25任一项所示序列。

18.分离的核酸分子，其包括权利要求1-17任一项所述的嵌合型转录激活因子的编码核酸序列。

19.表达载体，其包括权利要求18所述的核酸分子。

20.如权利要求19所述的表达载体，其中在所述表达载体中所述编码核酸序列与甲醇诱导型启动子可操作地连接。

21.如权利要求20所述的表达载体，其中所述甲醇诱导型启动子包括AOX1、DAS1、DAS2、CAT1、PMP20启动子或它们的突变体，优选AOX1启动子。

22.宿主细胞，其包括权利要求18所述的核酸分子或权利要求19-21任一项所述的表达载体。

23.宿主细胞，其表达权利要求1-17任一项所述的嵌合型转录激活因子。

24.如权利要求22或23所述的宿主细胞，其还包括编码与甲醇诱导型启动子可操作地连接的异源多肽的核酸序列。

25.如权利要求24所述的宿主细胞，其中所述异源多肽来自PF00042球蛋白家族。

26.如权利要求25所述的宿主细胞，其中所述异源多肽为血红蛋白，优选大豆血红蛋白LegH或牛肌红蛋白。

27.如权利要求所述22-26任一项的宿主细胞，其中所述异源多肽包括SEQ ID NO：9或SEQ ID NO：26所示序列。

28.如权利要求22-27任一项所述的宿主细胞，其还包括编码可与所述甲醇诱导型启动子可操作地连接的参与血红素生物合成途径的至少一种多肽。

29.如权利要求22-28任一项所述的宿主细胞，其为酵母细胞，优选毕赤酵母，更优选毕赤酵母X-33菌株。

30.制备目的蛋白的方法，包括培养权利要求24-29任一项所述的宿主细胞并分离所述目的蛋白。

31.如权利要求30所述的方法，其中所述宿主细胞为毕赤酵母，在培养所述宿主细胞过程中包括向培养液中添加甲醇。

32.如权利要求30或31所述的方法，其中所述目的蛋白为来自PF00042球蛋白家族的蛋白。

33.如权利要求30-32任一项所述的方法，其中所述目的蛋白为血红蛋白，优选大豆血红蛋白LegH或牛肌红蛋白。